مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

956
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

531
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون

صفحات

 صفحه شروع 1813 | صفحه پایان 1832

چکیده

 گسترش روزافزون داده های متنی فارسی در فضای اینترنت و پیچیدگی جستجو در میان انبوه این اسناد, خلاصه سازی خودکار متون فارسی را به یکی از زمینه های تحقیقاتی مورد توجه تبدیل کرده است. در این مقاله روشی کارا برای خلاصه سازی خودکار متون فارسی ارائه شده است. روش پیشنهادی که به صورت انتخابی و تک سندی است, خلاصه سازی را بر اساس رتبه بندی جملات و انتخاب مهم ترین آنها انجام می دهد. اهمیت هر جمله از متن با ترکیب خطی مقادیر هفت ویژگی زبان شناختی مستخرج از سند برای هر جمله بدست می آید. وزن بهینه هر ویژگی در این ترکیب از روش رگرسیون خطی و با استفاده از پیکره آموزشی پاسخ محاسبه شده است. پس از محاسبه اهمیت جملات متن, در هر مرحله از الگوریتم, یک جمله با اهمیت بیشتر تا رسیدن به نرخ فشرده سازی مورد نظر انتخاب می شود. این جمله علاوه بر اینکه دارای بیشترین اهمیت است, دارای کمترین میزان شباهت با جملات انتخاب شده در مراحل قبلی نیز است. نتایج بدست آمده از مقایسه الگوریتم پیشنهادی با دو سیستم خلاصه ساز ایجاز و فارسی سام با استفاده از پیکره پاسخ, نشان می دهد در بیشتر معیارهای ارزیابی پیشرفت قابل توجهی حاصل شده است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    سلطانی، محمود، نصیری، جلال الدین، و عسکریان، احسان. (1397). ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون. پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)، 33(4 )، 1813-1832. SID. https://sid.ir/paper/374448/fa

    Vancouver: کپی

    سلطانی محمود، نصیری جلال الدین، عسکریان احسان. ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون. پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)[Internet]. 1397؛33(4 ):1813-1832. Available from: https://sid.ir/paper/374448/fa

    IEEE: کپی

    محمود سلطانی، جلال الدین نصیری، و احسان عسکریان، “ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون،” پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)، vol. 33، no. 4 ، pp. 1813–1832، 1397، [Online]. Available: https://sid.ir/paper/374448/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا