مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

2,675
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

1,740
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

قطعه بندی عبارات متون فارسی با استفاده از شبکه های عصبی

صفحات

 صفحه شروع 76 | صفحه پایان 84

چکیده

 قطعه بندی کلمات و عبارات متن, یکی از فعالیت های اصلی در حوزه پردازش زبان های طبیعی است. اکثر برنامه های پردازش زبان های طبیعی به یک پیش پردازش برای استخراج کلمات متن و تشخیص عبارات احتیاج دارند. هدف اصلی و نهایی قطعه بندی عبارات, به دست آوردن کلمات معنی دار همراه با پیشوندها و پسوندهایشان است و این فعالیت متناسب با زبان های طبیعی مختلف می تواند سخت یا آسان باشد. در زبان فارسی به علت وجود فاصله و نیم فاصله, عدم توجه کاربران به فاصله گذاری ها و نبود قواعد دقیق در نوشتن کلمات چندقسمتی, تشخیص و قطعه بندی کلمات چندقسمتی و مرکب با مشکلات و پیچیدگی های خاص خود رو به رو است.در این مقاله برآنیم تا با استفاده از شبکه های عصبی, یک روش آماری برای قطعه بندی عبارات متون فارسی جهت استفاده در موتورهای جستجو ارائه کنیم. الگوریتم پیشنهادی شامل 4 فاز است که با استفاده از احتمال رخداد تک کلمات و دوکلمه ای های موجود در پیکره و با دقت 89.6% عمل قطعه بندی را انجام می دهد. نتایج آزمایشات نشان دادند این روش می تواند با قطعه بندی بهتر عبارات, بهبود نسبی در کارایی روش های معمول به وجود آورد.

استنادها

  • ثبت نشده است.
  • ارجاعات

    استناددهی

    APA: کپی

    میردامادی، محمدمهدی، زارع بیدکی، علی محمد، و رضائیان، مهدی. (1392). قطعه بندی عبارات متون فارسی با استفاده از شبکه های عصبی. مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر، 11(2)، 76-84. SID. https://sid.ir/paper/228477/fa

    Vancouver: کپی

    میردامادی محمدمهدی، زارع بیدکی علی محمد، رضائیان مهدی. قطعه بندی عبارات متون فارسی با استفاده از شبکه های عصبی. مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر[Internet]. 1392؛11(2):76-84. Available from: https://sid.ir/paper/228477/fa

    IEEE: کپی

    محمدمهدی میردامادی، علی محمد زارع بیدکی، و مهدی رضائیان، “قطعه بندی عبارات متون فارسی با استفاده از شبکه های عصبی،” مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر، vol. 11، no. 2، pp. 76–84، 1392، [Online]. Available: https://sid.ir/paper/228477/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا