مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

423
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

647
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

بررسی پیکره-بنیاد هم نگاره های اسمی و صفتی فارسی جهت کمک به برچسب گذاری صحیح اجزای کلام

صفحات

 صفحه شروع 897 | صفحه پایان 922

چکیده

 در تهیه سامانه های برچسب گذاری اجزای کلام در زبان فارسی, بررسی ساخت واژی اسم ها و صفت ها از دو نظر حائز اهمیت است: 1-اگر کلمه ای قبلاً در پیکره آموزشی ظاهر نشده باشد, نمی توان از پیکره آموزشی اطلاعات دقیقی راجع به آن کلمه به دست آورد. بنابراین, اگر در یک پیکره متنی فارسی, کلمه ای در واژگان حضور نداشته باشد (کلمه خارج از واژگان), نمی توان برچسب های مربوط به کلمه را بازیابی کرد. در این صورت, برچسب کلمه را تنها می توان با توجه به شکل کلمه (انواع پیشوندها و پسوندهایی که به کلمات متصل می شوند) یا بافتی که کلمه در آن ظاهر می شود, یا هر دو, حدس زد. 2-زبان فارسی ظرفیت بالایی برای ساخت هم نگاره های جدید که از ساخت واژه فارسی نشأت می گیرند, را نیز دارد بنابراین, بررسی ساخت واژی اسم ها و صفت ها, به منظور تفکیک آن ها از هم ضروری به نظر می رسد, زیرا اکثر صفت ها در بافت های گوناگون, با صورت نوشتاری یکسان, می توانند برچسب «اسم» بگیرند. در تحقیق حاضرساخت واژه اسم ها و صفت ها در فارسی بررسی شده است. نظام نوشتاری زبان فارسی نیز مورد بررسی قرار گرفته است تا از این رهگذر بتوان به شناسایی انواع هم نگاره ها در زبان فارسی پرداخت. سپس, انواع هم نگاره ها در زبان فارسی مورد مطالعه قرار گرفته است و در نهایت از طریق جستجو به دو روش ماشینی و دستی, فهرست مبسوطی از هم نگاره ها از پیکره های "پیکره متنی زبان فارسی", "پایگاه دادگان زبان فارسی" و "پیکره وابستگی نحوی زبان فارسی" تهیه شده است. بررسی کلی هم نگاره ها در پیکره های مورد مطالعه نشان می دهد که بیشتر هم نگاره ها, فراوانی بالایی در پیکره های متنی فارسی دارند و اکثر آن ها در اثر یکسان بودن نمود نوشتاری تکواژ یاء نکره, یاء اسم ساز, شناسه دوم شخص مفرد, یاء صفت ساز و یاء متصل به گروه اسمی, ایجاد شده اند.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    علایی ابوذر، الهام. (1397). بررسی پیکره-بنیاد هم نگاره های اسمی و صفتی فارسی جهت کمک به برچسب گذاری صحیح اجزای کلام. پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)، 34(2 )، 897-922. SID. https://sid.ir/paper/383126/fa

    Vancouver: کپی

    علایی ابوذر الهام. بررسی پیکره-بنیاد هم نگاره های اسمی و صفتی فارسی جهت کمک به برچسب گذاری صحیح اجزای کلام. پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)[Internet]. 1397؛34(2 ):897-922. Available from: https://sid.ir/paper/383126/fa

    IEEE: کپی

    الهام علایی ابوذر، “بررسی پیکره-بنیاد هم نگاره های اسمی و صفتی فارسی جهت کمک به برچسب گذاری صحیح اجزای کلام،” پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)، vol. 34، no. 2 ، pp. 897–922، 1397، [Online]. Available: https://sid.ir/paper/383126/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button