مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

709
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

667
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

شبکه عصبی پیچشی با پنجره های قابل تطبیق برای بازشناسی گفتار

صفحات

 صفحه شروع 13 | صفحه پایان 29

چکیده

 در حالی که سامانه های بازشناسی گفتار به طور پیوسته در حال ارتقا می باشند و شاهد استفاده گسترده از آن ها می باشیم, اما دقت این سامانه ها فاصله زیادی نسبت به توان بازشناسی انسان دارد و در شرایط ناسازگار این فاصله افزایش مییابد. یکی از علل اصلی این مسئله تغییرات زیاد سیگنال گفتار است. در سال های اخیر, استفاده از شبکه های عصبی عمیق در ترکیب با مدل مخفی مارکف, موفقیت های قابل توجهی در حوزه پردازش گفتار داشته است. این مقاله به دنبال مدل کردن بهتر گفتار با استفاده از تغییر ساختار در شبکه عصبی پیچشی عمیق است؛ به نحوی که با تنوعاتِ بیان گویندگان در سیگنال گفتار منطبق تر شود. در این راه, مدل های موجود و انجام استنتاج بر روی آن ها را بهبود و گسترش خواهیم داد. در این مقاله با ارائه شبکه پیچشی عمیق با پنجره های قابل تطبیق سامانه بازشناسی گفتار را نسبت به تفاوت بیان در بین گویندگان و تفاوت در بیان های یک گوینده مقاوم خواهیم کرد. تحلیل ها و نتایج آزمایش های صورت گرفته بر روی دادگان گفتار فارس دات و TIMIT نشان داد که روش پیشنهادی خطای مطلق بازشناسی واج را نسبت به شبکه پیچشی عمیق به ترتیب به میزان 2/1 و 1/1 درصد کاهش میدهد که این مقدار در مسئله بازشناسی گفتار مقدار قابل توجهی است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    ذوقی، تکتم، و همایون پور، محمدمهدی. (1397). شبکه عصبی پیچشی با پنجره های قابل تطبیق برای بازشناسی گفتار. پردازش علایم و داده ها، 15(3 ( پیاپی 37) )، 13-29. SID. https://sid.ir/paper/160864/fa

    Vancouver: کپی

    ذوقی تکتم، همایون پور محمدمهدی. شبکه عصبی پیچشی با پنجره های قابل تطبیق برای بازشناسی گفتار. پردازش علایم و داده ها[Internet]. 1397؛15(3 ( پیاپی 37) ):13-29. Available from: https://sid.ir/paper/160864/fa

    IEEE: کپی

    تکتم ذوقی، و محمدمهدی همایون پور، “شبکه عصبی پیچشی با پنجره های قابل تطبیق برای بازشناسی گفتار،” پردازش علایم و داده ها، vol. 15، no. 3 ( پیاپی 37) ، pp. 13–29، 1397، [Online]. Available: https://sid.ir/paper/160864/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button