مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

364
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

473
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

بازشناسی مقاوم به نویز ارقام مشابه فارسی مبتنی بر شبکه LSTM و ویژگی های طیفی گفتار

صفحات

 صفحه شروع 1 | صفحه پایان 17

چکیده

 یکی از چالش های بازشناسی ارقام مجزای فارسی, مشابهت تلفظ برخی از ارقام مانند "صفر و سه", "نه و دو" و "پنج, هفت و هشت" می باشد. این چالش منجر به بازشناسی یک رقم به جای رقم مشابه شده و دقت بازشناسی را کاهش می دهد. در این مقاله, یک راهکار ترکیبی مبتنی بر حافظه کوتاه مدت ماندگار (LSTM) و مدل مخفی مارکف (HMM) برای رفع چالش مذکور ارائه شده که نرخ بازشناسی ارقام فارسی مبتنی بر HMM را به طور متوسط 2% و در بهترین حالت 8% بهبود داده است. با توجه به تشدید چالش بازشناسی ارقام مشابه فارسی در شرایط نویزی, در ادامه کار مقاوم سازی بازشناسی ارقام مشابه فارسی مورد توجه قرار گرفت. به منظور افزایش مقاومت بازشناس مبتنی بر LSTM, از ویژگی های مقاوم به نویز مستخرج از طیف گفتار مانند آنتروپی طیفی, درجه از هم پاشی, فرکانس نیمساز, همواری طیفی, فرمانت اول و نرخ گذار از صفر مبتنی بر تابع همبستگی استفاده گردید. استفاده از این ویژگی ها, ضمن کاهش تعداد ویژگی ها برای بازشناسی ارقام مشابه فارسی از 39 ضریب به حداکثر 4 و حداقل 1 ضریب, به طور متوسط به ترتیب بهبود 10, 13, 15 و 13 درصدی مقاومت بازشناس ارقام مشابه را در شرایط متنوع نویزی (30 حالت مختلف حاصل از پنج نوع نویز سفید, صورتی, همهمه, کارخانه و ماشین و شش نسبت سیگنال به نویز 5-, 0, 5, 10, 15 و 20 دسی بل) در مقایسه با بازشناس های مبتنی بر HMM, LSTM, شبکه باور عمیق با ویژگی های مل کپستروم و شبکه عصبی کانولوشنی با ویژگی های مل اسپکتوگرام به همراه دارد.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    طبیبیان، شیما. (1400). بازشناسی مقاوم به نویز ارقام مشابه فارسی مبتنی بر شبکه LSTM و ویژگی های طیفی گفتار. مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر، 19(1 )، 1-17. SID. https://sid.ir/paper/392725/fa

    Vancouver: کپی

    طبیبیان شیما. بازشناسی مقاوم به نویز ارقام مشابه فارسی مبتنی بر شبکه LSTM و ویژگی های طیفی گفتار. مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر[Internet]. 1400؛19(1 ):1-17. Available from: https://sid.ir/paper/392725/fa

    IEEE: کپی

    شیما طبیبیان، “بازشناسی مقاوم به نویز ارقام مشابه فارسی مبتنی بر شبکه LSTM و ویژگی های طیفی گفتار،” مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر، vol. 19، no. 1 ، pp. 1–17، 1400، [Online]. Available: https://sid.ir/paper/392725/fa

    مقالات مرتبط نشریه ای

  • ثبت نشده است.
  • مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا