مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

1,386
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

667
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

تعیین مرز و نوع عبارات نحوی در متون فارسی

صفحات

 صفحه شروع 69 | صفحه پایان 86

چکیده

 واحدسازی, از مهم ترین مسائل در پردازش زبان های طبیعی است که عبارت از فرآیند تقسیم متن به واحدهای معنادار نظیر واژه, عبارت نحوی, جمله و غیره است. واحدسازی گروه های نحوی یک متن, از جمله وظایف واحدسازی متن محسوب می شود که در بسیاری از کارهای پردازش زبان طبیعی, نظیر سامانه های ترجمه ماشینی, استخراج اطلاعات, پرسش و پاسخ و سامانه های تبدیل متن به گفتار, به عنوان پیش پردازشی مهم, می تواند حضور داشته باشد. واحدسازی عبارات نحوی, در هر زبان, متناسب با ویژگی های نوشتاری آن زبان مشکلات و پیچیدگی هایی دارد. زبان فارسی به دلیل وجود رسم الخط های مختلف, جملات بدون ترتیب, افعال مرکب, ابهامات معنایی و عدم نمایش مصوت ها مشکلاتی دارد. در این مقاله روشی مبتنی بر روش های آماری و یادگیری و اطلاعات و ویژگی های دستور زبانی جهت تشخیص مرز و نوع گروه های نحوی در متون فارسی فاقد علایم سجاوندی, ارائه شده است که در آن از روش های یادگیری ماشین بردار پشتیبان و میدان تصادفی شرطی استفاده شده است. در روش ارائه شده ویژگی های مختلف زبانی مرتبط با زبان فارسی استخراج و برای نخستین بار مورد بررسی و استفاده قرار گرفته اند. بهترین دقت به دست آمده توسط این سامانه, 84.02% بر اساس معیار F و 87.45%, بر اساس تعداد برچسب های صحیح به کل در تعیین مرز, و 78.04%, در تعیین مرز و نوع به صورت توام, بوده است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    همایون پور، محمدمهدی، و سلیمی بدر، آرمین. (1392). تعیین مرز و نوع عبارات نحوی در متون فارسی. پردازش علایم و داده ها، -(2 (پیاپی 20))، 69-86. SID. https://sid.ir/paper/160821/fa

    Vancouver: کپی

    همایون پور محمدمهدی، سلیمی بدر آرمین. تعیین مرز و نوع عبارات نحوی در متون فارسی. پردازش علایم و داده ها[Internet]. 1392؛-(2 (پیاپی 20)):69-86. Available from: https://sid.ir/paper/160821/fa

    IEEE: کپی

    محمدمهدی همایون پور، و آرمین سلیمی بدر، “تعیین مرز و نوع عبارات نحوی در متون فارسی،” پردازش علایم و داده ها، vol. -، no. 2 (پیاپی 20)، pp. 69–86، 1392، [Online]. Available: https://sid.ir/paper/160821/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button