مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

846
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

553
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

بازشناسی مقاوم و توام گفتار مستقیم و تلفنی با استخراج مناسب بردارهای بازنمایی و اصلاح آنها توسط معکوس سازی شبکه های عصبی

صفحات

 صفحه شروع 21 | صفحه پایان 29

چکیده

 در حال حاضر تلاش فراگیری برای طراحی سیستم های بازشناسی گفتار مقاوم نسبت به تنوعات گفتار صورت می گیرد. یکی از این تنوعات, گفتار تلفنی نسبت به گفتار مستقیم (تهیه شده در شرایط عاری از هر گونه نویز محیط) می باشد. در مقاله حاضر با بهره گیری از پارامترهای طیفی LHCB و طراحی یک سری آزمایشهای عملی مشخص می گردد که این نوع بازنمایی برای طراحی سیستم های بازشناسی گفتار تلفنی و سیستم های بازشناسی توام گفتار مستقیم و تلفنی که مبتنی بر شبکه های عصبی باشد نسبت به روش متداول MFCC مناسب تر است. سپس با استخراج بردارهای بازنمایی LHCB از گفتار مستقیم و تلفنی و طراحی مدل بازشناسی گفتار مبتنی بر شبکه عصبیMLP, یک سیستم بازشناسی توام گفتار مستقیم و تلفنی ساخته می شود. آنگاه با استفاده از معکوس سازی شبکه‎های عصبی به روش گرادیان بردارهای بازنمایی گفتار تلفنی به سمت بردارهای بازنمایی گفتار مستقیم اصلاح می گردد و با تعلیم شبکه دیگری روی دادگان اصلاح شده تلفنی و دادگان مستقیم دست نخورده, افزایش 4/1% در صحت بازشناسی گفتار تلفنی حاصل شده است. در مرحله بعد با استفاده از معکوس سازی عمومی شبکه های عصبی هر دو دسته بردارهای بازنمایی گفتار مستقیم و تلفنی به گونه ای اصلاح می شوند که بیشتر حاوی اطلاعات آوایی گفتار باشند و سایر تنوعات تا جای ممکن حذف شوند. با تعلیم شبکه دیگری روی این دادگان اصلاح شده افزایش 98/2% در صحت بازشناسی گفتار تلفنی و 68/1% در صحت بازشناسی گفتار مستقیم بدست آمده است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    ولی، منصور، و سیدصالحی، سیدعلی. (1385). بازشناسی مقاوم و توام گفتار مستقیم و تلفنی با استخراج مناسب بردارهای بازنمایی و اصلاح آنها توسط معکوس ‌سازی شبکه‌ های عصبی. مهندسی برق و مهندسی کامپیوتر ایران، 4(1)، 21-29. SID. https://sid.ir/paper/53747/fa

    Vancouver: کپی

    ولی منصور، سیدصالحی سیدعلی. بازشناسی مقاوم و توام گفتار مستقیم و تلفنی با استخراج مناسب بردارهای بازنمایی و اصلاح آنها توسط معکوس ‌سازی شبکه‌ های عصبی. مهندسی برق و مهندسی کامپیوتر ایران[Internet]. 1385؛4(1):21-29. Available from: https://sid.ir/paper/53747/fa

    IEEE: کپی

    منصور ولی، و سیدعلی سیدصالحی، “بازشناسی مقاوم و توام گفتار مستقیم و تلفنی با استخراج مناسب بردارهای بازنمایی و اصلاح آنها توسط معکوس ‌سازی شبکه‌ های عصبی،” مهندسی برق و مهندسی کامپیوتر ایران، vol. 4، no. 1، pp. 21–29، 1385، [Online]. Available: https://sid.ir/paper/53747/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button