مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله مقاله نشریه

مشخصات مقاله

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

93
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

19
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

بازشناسی احساسات از روی گفتار بر پایه بهره گیری از شبکه های عصبی پیچشی و تکنیک افزایش دادگان

صفحات

 صفحه شروع 85 | صفحه پایان 98

چکیده

 هدف از سیستم­های بازشناسی احساس از روی گفتار ایجاد ارتباط عاطفی بین انسان و ماشین است. چراکه بازشناسی احساس و اهداف انسان از روی گفتار, به بهبود تعاملات بین انسان و ماشین کمک می­کند. بازشناسی احساس از روی گفتار برای محققان در دهه گذشته یک مسأله چالش برانگیز بوده است. اما با پیشرفت در حوزه هوش مصنوعی این چالش­ها کم رنگ­تر شدند. هدف از این پژوهش, استفاده از روش­های یادگیری عمیق در جهت بهتر کردن کارایی این سیستم­ها است. کار انجام شده از چندین مرحله تشکیل شده است. در مرحله اول از شبکه­های عصبی پیچشی سه بعدی برای یادگیری ویژگی­های طیفی زمانی گفتار استفاده شده است. در مرحله دوم برای قدرتمند کردن مدل پیشنهادی از ساختار هرمی جدید شبکه­های عصبی پیچشی سه بعدی اتصال داده شده؛ که یک معماری چند مقیاسه از شبکه­های عصبی پیچشی سه بعدی روی ابعاد ورودی است, بهره گرفته شد. در نهایت برای یادگیری ویژگی­های طیفی زمانی استخراج شده از ساختار جدید (ساختار جدید هرمی شبکه­های عصبی پیچشی سه بعدی) با درنظر گرفتن رابطه مکانی و زمانی اطلاعات به صورت کامل, از شبکه کپسول زمانی استفاده شد. در نهایت بر ساختار پیشنهادی که یک ساختار قدرتمند برای ویژگی­های طیفی زمانی است نام  MSID 3DCNN + Temporal Capsule   نهاده شد. پژوهش انجام شده و مدل نهایی بر روی ترکیب دو پایگاه داده گفتار معمولی و گفتار آوازی از پایگاه داده راودیس که یک پایگاه داده چند حالته است انجام شد. نتایجی که با استفاده از مدل پیشنهادی به دست آمد؛ نسبت به مدل­های مرسوم, قابل توجه است. در این پژوهش برای شش کلاس احساسی به تفکیک جنسیت, دقت 77/81 درصد به دست آمد.

چندرسانه ای

  • ثبت نشده است.
  • استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    مقالات مرتبط نشریه ای

  • ثبت نشده است.
  • مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button