مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

2,547
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

701
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

ارائه روشی برای استخراج کلمات کلیدی و وزن دهی کلمات برای بهبود طبقه بندی متون فارسی

صفحات

 صفحه شروع 55 | صفحه پایان 78

چکیده

 با توجه به گسترش روزافزون اطلاعات و وجود حجم انبوه متون غیرساخت یافته, استفاده از کلمات کلیدی نقش مهمی در بازیابی اطلاعات دارد. این درحالی است که استخراج کلمات کلیدی به صورت دستی مشکلات زیادی دارد. بنابرین استخراج کلمات کلیدی به صورت خودکار از نیازهای ضروری فناوری امروزه است. در این پژوهش سعی شده با استفاده از اصطلاح نامه که از نظامی ساختارمند برخوردار است, کلمات کلیدی بامعناتری از متون استخراج کرد و با آن ها طبقه بندی متون فارسی را بهبود بخشید. مراحلی که برای افزایش جامعیت جستجو باید سپری شود به این صورت است که در مرحله نخست کلمات زائد حذف و باقی کلمات ریشه یابی می شود؛ سپس به کمک اصطلاح نامه کلمات هم معنی, اعم ها و اخص ها و همچنین وابسته ها پیدا و در ادامه برای مشخص شدن اهمیت نسبی کلمات یک وزن عددی به هر کلمه منسوب می شود که بیان گر میزان تاثیر کلمه در ارتباط با موضوع متن و درمقایسه با سایر کلمات به کار رفته در متن است. با توجه به مراحل بالا و به کمک اصطلاح نامه, طبقه بندی متون دقیق تر انجام می گیرد. در این روش از الگوریتم نزدیکترین همسایه (KNN) برای طبقه بندی استفاده می شود. الگوریتم KNN به خاطر سادگی و موثر بودن آن در طبقه بندی متون بسیار به کار برده می شود. مبنای کار این الگوریتم, مقایسه متن آزمایش داده شده با متون آموزشی داده شده و به دست آوردن میزان شباهت بین آن ها است. نتایج آزمایش ها برروی چندین متن در موضوع های مختلف, نشان دهنده دقت و توانایی روش پیشنهادی در استخراج کلمات کلیدی منطبق با خواست کاربر و در نتیجه طبقه بندی دقیق تر متون است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    رضایی، وحیده، محمدپور، مجید، پروین، حمید، و نجاتیان، صمد. (1396). ارائه روشی برای استخراج کلمات کلیدی و وزن دهی کلمات برای بهبود طبقه بندی متون فارسی. پردازش علایم و داده ها، 14(4 (پیاپی 34) )، 55-78. SID. https://sid.ir/paper/160830/fa

    Vancouver: کپی

    رضایی وحیده، محمدپور مجید، پروین حمید، نجاتیان صمد. ارائه روشی برای استخراج کلمات کلیدی و وزن دهی کلمات برای بهبود طبقه بندی متون فارسی. پردازش علایم و داده ها[Internet]. 1396؛14(4 (پیاپی 34) ):55-78. Available from: https://sid.ir/paper/160830/fa

    IEEE: کپی

    وحیده رضایی، مجید محمدپور، حمید پروین، و صمد نجاتیان، “ارائه روشی برای استخراج کلمات کلیدی و وزن دهی کلمات برای بهبود طبقه بندی متون فارسی،” پردازش علایم و داده ها، vol. 14، no. 4 (پیاپی 34) ، pp. 55–78، 1396، [Online]. Available: https://sid.ir/paper/160830/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button