مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

54
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

10
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

بهینه سازی سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی

صفحات

 صفحه شروع 981 | صفحه پایان 1010

چکیده

 پژوهش حاضر با هدف ارائة روشی برای سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی انجام شد. مجموعه داده های مربوط به پایان نامه ها و رساله ها شامل 2943 تحقیق به عنوان جامعة آماری در نظر گرفته شد. جمع آوری داده ها از مجموعه داده های مربوط به تحقیقات علمی که شامل 5000 پژوهش در قالب فایل اکسل بود, انجام شد. در این پژوهش پس از تبدیل داده ها به قالب ساخت یافته, عملیات پردازش با استفاده از اعمال پیش پردازش صورت گرفت. در مرحلة پردازش از تکنیک خوشه بندی برای ارائة الگوریتم پیشنهادی در راستای سازماندهی اسناد متنی فارسی بهره گرفته شد. این الگوریتم با بهبود الگوریتم K-means در جهت خوشه بندی اسناد ارائه شد. نتایج حاصل از ارزیابی نشان داد که الگوریتم پیشنهادی بر اساس معیارهای خارجی نسبت به دو الگوریتم K-means و K-means++ در کیفیت خوشه بندی اسناد تأثیر مثبتی داشت؛ به طوری که تحقیقات هر ردة تعیین شده در خوشة موضوعی مرتبط دارای توزیع یکنواختی شد, و به حصول هدف پژوهش حاضر منجر گردید. در جداول رده/ خوشة حاصل از دو الگوریتم K-means و K-means++ توزیع غیریکنواخت تحقیقات در خوشه ها مشاهده شد. بنابراین, ارزیابی بر اساس معیار های داخلی متأثر از تراکم متفاوت خوشه ها و شباهت بین خوشه ای بود. حجم دیتاسِت نیز متأثر از راهکارهای پیشنهادی برای انتخاب دیتاسِت نهایی و فرایند پژوهش نبود. بنابراین, الگوریتم پیشنهادی برای ابعاد بالای ویژگی نیز مناسب عمل می کند.

چندرسانه ای

  • ثبت نشده است.
  • استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    مقالات مرتبط نشریه ای

  • ثبت نشده است.
  • مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button