مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله مقاله نشریه

مشخصات مقاله

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

180
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

104
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

استخراج کلیدواژگان پایان نامه فارسی با استفاده از ویژگی آماری و دسته بند بیز

صفحات

 صفحه شروع 339 | صفحه پایان 367

چکیده

 هدف اصلی استخراج کلمات کلیدی انتخاب مجموعه ای از لغات در متن است که می تواند موضوع اصلی متن را بازگو کند. استخراج کلیدواژگان در بازیابی اطلاعات, سیستم های پیشنهاددهنده متنی و دسته بندی متون, نقش مهم را ایفا می کند. در زبان فارسی باتوجه به پیچیدگی ذاتی زبان فارسی استخراج کلیدواژگان به مراتب دشوارتر شده است. در این پژوهش سعی شده است با رویکرد نوین ترکیبی آماری و یادگیری ماشین به استخراج کلیدواژگان پرداخته شود. ابتدا باتوجه به ساختار زبان فارسی پیش پردازهای لازم برای حذف کلمات و علایم نگارشی صورت می گیرد. سپس با استفاده از سه نوع ویژگی آماری و دسته بند بیز سیستم به صورت خودکار الگوی کلمات کلیدی با کلمات عادی را آموزش می بیند. همچنین پس پردازش کارا برای کم کردن کلمات مثبت کاذب در چارچوب پیشنهادی طراحی شده است. گفتنی است که مدل ساخته شده قادر به شناسایی تعداد حداکثر 20 کلیدواژه در هر پایان نامه است و این کلمات با کلیدواژگان نوشته شده در هر متن مقایسه و ارزیابی می شوند. نتایج ارزیابی های متنوع نشان می دهد روش پیشنهادی با دقت مناسبی توانسته است کلمات کلیدی نوشتارهای فارسی علمی (پایان نامه و رساله) را استخراج کند.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    حجازی، بهزاد، و نصیری، جلال الدین. (1400). استخراج کلیدواژگان پایان نامه فارسی با استفاده از ویژگی آماری و دسته بند بیز. جستارهای زبانی، 12(6 (پیاپی 66) )، 339-367. SID. https://sid.ir/paper/959351/fa

    Vancouver: کپی

    حجازی بهزاد، نصیری جلال الدین. استخراج کلیدواژگان پایان نامه فارسی با استفاده از ویژگی آماری و دسته بند بیز. جستارهای زبانی[Internet]. 1400؛12(6 (پیاپی 66) ):339-367. Available from: https://sid.ir/paper/959351/fa

    IEEE: کپی

    بهزاد حجازی، و جلال الدین نصیری، “استخراج کلیدواژگان پایان نامه فارسی با استفاده از ویژگی آماری و دسته بند بیز،” جستارهای زبانی، vol. 12، no. 6 (پیاپی 66) ، pp. 339–367، 1400، [Online]. Available: https://sid.ir/paper/959351/fa

    مقالات مرتبط نشریه ای

  • ثبت نشده است.
  • مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button