مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

558
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

558
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

روشی جدید برای خوشه بندی اسناد HTML با استفاده از الگوریتم های تلفیقی

صفحات

 صفحه شروع 37 | صفحه پایان 61

چکیده

 با عنایت به حجم بالای اطلاعات کنونی وب توجه به سیستم های خودکار استخراج اطلاعات بیشتر شده است. از مهم ترین روش های خودکار استخراج اطلاعات, خوشه بندی می باشد. روش های خوشه بندی زیادی تابه حال ارائه شده است که اکثراً مبتنی بر مدل برداری می باشند. در این مدل با هر سند مانند مجموعه ای از کلمات برخورد می گردد و توالی کلمات در جمله, نادیده گرفته می شود. ازآنجایی که معانی در زبان طبیعی به طور کامل وابسته به توالی کلمات می باشند نقیصه بزرگی در این روش ها احساس می گردد. برای رفع این نقیصه در این مقاله روشی جدید در خوشه بندی اسناد Html ارائه گردیده است که در آن الگوریتم Stc برای خوشه بندی Snippet ها لحاظ شده است. این روش که با عنوان خوشه بندی بر اساس جملات کلیدی Ks_Stc مطرح شده برای هر سند بردار وزن داری تهیه می کند و با استفاده از این بردار, جملات کلیدی هر متن از سند استخراج می گردد و نهایتاً این جملات کلیدی برای خوشه بندی به الگوریتم Stc داده می شود.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    شعار، مریم، و سالارنژاد، علی اصغر. (1397). روشی جدید برای خوشه بندی اسناد HTML با استفاده از الگوریتم های تلفیقی. مطالعات مدیریت کسب و کار هوشمند، 6(24 )، 37-61. SID. https://sid.ir/paper/268121/fa

    Vancouver: کپی

    شعار مریم، سالارنژاد علی اصغر. روشی جدید برای خوشه بندی اسناد HTML با استفاده از الگوریتم های تلفیقی. مطالعات مدیریت کسب و کار هوشمند[Internet]. 1397؛6(24 ):37-61. Available from: https://sid.ir/paper/268121/fa

    IEEE: کپی

    مریم شعار، و علی اصغر سالارنژاد، “روشی جدید برای خوشه بندی اسناد HTML با استفاده از الگوریتم های تلفیقی،” مطالعات مدیریت کسب و کار هوشمند، vol. 6، no. 24 ، pp. 37–61، 1397، [Online]. Available: https://sid.ir/paper/268121/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button