Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله مقاله نشریه

مشخصات مقاله

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

1,818
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

762
Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

مدل سازی غیرخطی قطع پوانکاره سیگنال گفتار در ترکیب با تحلیل حوزه فرکانس به منظور افزایش صحت عملکرد سیستمهای بازشناسی گفتار

صفحات

 صفحه شروع 55 | صفحه پایان 70

چکیده

 در این مقاله روشی جدید برای افزایش صحت سیستمهای بازشناسی گفتار, با استفاده از ترکیب بردارهای ویژگی به دست آمده از مدل سازی غیرخطی فضای فاز بازسازی شده سیگنال گفتار با ویژگیهای معمول به دست آمده از تحلیل حوزه فرکانس ارایه می شود. بر اساس نظریه پذیرفته شده کنونی, در صورت انتخاب تعداد بعد کافی برای بازسازی فضای فاز سیگنال, این فضا به صورت کامل دینامیک سیستم تولید کننده آن را نشان می دهد و بنابراین می تواند شامل اطلاعات مفیدی باشد که در تحلیل فرکانسی معمول - مانند استخراج ضرایب کپسترال مل -MFCC در دسترس نیست. همچنین از آنجا که سیستمهای پیچیده ای مانند سیستم تولید گفتار, رفتارهایی نوسانی و تناوبی نشان می دهند, قطع پوانکاره می تواند به عنوان ابزاری موثر در تحلیل این رفتارها به کار رود. در این مقاله نوعی مدل سازی غیرخطی با استفاده از مدل مخلوط گوسی (GMM) بر روی نقاط قطع پوانکاره سیگنال گفتار انجام می شود. بردار ویژگی نهایی از یک مرحله انتخاب ویژگی بر روی پارامترهای مدل مخلوط گوسی و بردار ویژگی های فرکانسی معمول MFCC حاصل می شود. از یک سیستم بازشناسی مبتنی بر مدل مخفی مارکوف(HMM)  و پایگاه داده تیمیت به منظور ارزیابی سیستم ارایه شده استفاده شده است. نتایج آزمایشها بهبودی در حدود 5.7 درصد در صحت بازشناسی گفتار واج گسسته را نسبت به حالت استفاده از ویژگیهای معمول MFCC نشان می دهد. این روش جدید می تواند به عنوان روشی موثر و جایگزین در روشهای استخراج ویژگی به ویژه برای سیستمهای با ماهیت غیرخطی شدید استفاده شود.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    جعفری، ایوب، الماس گنج، فرشاد، و نبی بیدهندی، مریم. (1389). مدل سازی غیرخطی قطع پوانکاره سیگنال گفتار در ترکیب با تحلیل حوزه فرکانس به منظور افزایش صحت عملکرد سیستمهای بازشناسی گفتار. مهندسی برق مدرس (فنی و مهندسی مدرس) (MODARES JOURNAL OF ELECTRICAL ENGINEERING(، 10(3)، 55-70. SID. https://sid.ir/paper/177660/fa

    Vancouver: کپی

    جعفری ایوب، الماس گنج فرشاد، نبی بیدهندی مریم. مدل سازی غیرخطی قطع پوانکاره سیگنال گفتار در ترکیب با تحلیل حوزه فرکانس به منظور افزایش صحت عملکرد سیستمهای بازشناسی گفتار. مهندسی برق مدرس (فنی و مهندسی مدرس) (MODARES JOURNAL OF ELECTRICAL ENGINEERING([Internet]. 1389؛10(3):55-70. Available from: https://sid.ir/paper/177660/fa

    IEEE: کپی

    ایوب جعفری، فرشاد الماس گنج، و مریم نبی بیدهندی، “مدل سازی غیرخطی قطع پوانکاره سیگنال گفتار در ترکیب با تحلیل حوزه فرکانس به منظور افزایش صحت عملکرد سیستمهای بازشناسی گفتار،” مهندسی برق مدرس (فنی و مهندسی مدرس) (MODARES JOURNAL OF ELECTRICAL ENGINEERING(، vol. 10، no. 3، pp. 55–70، 1389، [Online]. Available: https://sid.ir/paper/177660/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا