Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله مقاله همایش

مشخصات مقاله

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

510
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

218
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله همایش

عنوان

تشخیص متون توهین آمیز در موتورهای جستجو با استفاده از یادگیری ماشین

صفحات

 صفحه شروع | صفحه پایان

چکیده

 با توجه به گسترش محتوا در بسترهای رسانه ای و ارتباطی مختلف و همچنین دسترسی کاربران به این امکانات, لزوم بررسی محتوای به اشتراک گذاشته شده به ویژه در ابعاد فرهنگی و اجتماعی به منظور ارائه داده های با کیفیت به افراد حاضر در این عرصه ها همواره احساس می شود. یکی از مسائلی که در محتوای متنی, به خصوص محتوای ویژه کودکان, فرهنگی, دانشگاهی و. . . بسیار پر اهمیت است تشخیص متون توهین آمیز به کار برده شده است که در این مقاله به آن پرداخته می شود. با استفاده از یادگیری ماشین (SVM, Naï ve Bayes و KNN) داده های پیش پردازش شده را به مدل مورد نظر آموزش می دهیم و انتظار داریم که خروجی مدلی باشد که با دریافت متن احتمال رکیک بودن محتوا را تشخیص دهد. داده های مورد نظر مجموعه ای از جستجو های انجام شده در یک موتور جستجوی فارسی هستند که به منظور افزایش محتوا, دوباره این عبارات را در گوگل جستجو کرده و صفحه اول نتیجه را به داده ها اضافه می کنیم. سپس تشخیص می دهیم که داده مورد نظر رکیک می باشد یا خیر (برچسب گذاری). مدل مورد نظر این داده ها را یادگیری کرده و پس از آن مدلی داریم که می تواند احتمال رکیک بودن داده ورودی را تشخیص دهد. نتایج بدست آمده نشان می دهد که معیار اندازه گیری صحت (Precision) در مدل های Naï ve Bayes, SVM و KNN به ترتیب برابر با ٪ 94. 05, ٪ 97. 28 و ٪ 86. 48 خواهد بود.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    سیفی، نیما، و امینیان، مهدی. (1400). تشخیص متون توهین آمیز در موتورهای جستجو با استفاده از یادگیری ماشین. کنفرانس بین المللی وب پژوهی. SID. https://sid.ir/paper/900448/fa

    Vancouver: کپی

    سیفی نیما، امینیان مهدی. تشخیص متون توهین آمیز در موتورهای جستجو با استفاده از یادگیری ماشین. 1400. Available from: https://sid.ir/paper/900448/fa

    IEEE: کپی

    نیما سیفی، و مهدی امینیان، “تشخیص متون توهین آمیز در موتورهای جستجو با استفاده از یادگیری ماشین،” presented at the کنفرانس بین المللی وب پژوهی. 1400، [Online]. Available: https://sid.ir/paper/900448/fa

    مقالات مرتبط نشریه ای

  • ثبت نشده است.
  • مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا