مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

1,410
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

630
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

مدلی مبتنی بر آنتروپی و اتوماتاهای یادگیر برای حل بازی های تصادفی

صفحات

 صفحه شروع 97 | صفحه پایان 106

چکیده

 بازی های غیر قطعی (تصادفی) به عنوان توسعه ای از فرآیندهای تصادفی مارکوف با چندین عامل در سیستم های چندعامله و مدل سازی آنها حایز اهمیت بوده و به عنوان چارچوبی مناسب در تحقیقات یادگیری تقویتی چندعامله به کار رفته اند. در حال حاضر اتوماتاهای یادگیر به عنوان ابزاری ارزشمند در طراحی الگوریتم های یادگیری چندعامله به کار رفته اند. در این مقاله مدلی مبتنی بر اتوماتای یادگیر و مفهوم آنتروپی برای حل بازی های غیر قطعی و پیداکردن سیاست بهینه در این بازی ها ارایه شده است. در مدل پیشنهادی به ازای هر عامل در هر حالت از محیط بازی یک اتوماتای یادگیر با ساختار متغیر از نوع S قرار داده شده است که اعمال بهینه را در هر حالت یاد می گیرند. تعداد اعمال هر اتوماتا با توجه به همسایگان مجاور هر حالت تعیین شده و ترکیب اعمال اتوماتاها حالت بعدی محیط را انتخاب می کند. در مدل پیشنهادی از آنتروپی بردار احتمالات اتوماتای یادگیر حالت جدید برای کمک به پاداش دهی اتوماتاها و بهبود یادگیری استفاده شده است. برای بررسی و تحلیل رفتار الگوریتم یادگیری پارامتری به نام آنتروپی کلی تعریف گردیده که میزان همگرایی را در الگوریتم یادگیری بیان می کند. در نهایت الگوریتمی اصلاح یافته با ایجاد تعادل بین جستجو و استناد بر تجربیات پیشنهاد شده است. نتایج آزمایش ها نشان می دهد الگوریتم ارایه شده از کارایی مناسبی از هر دو جنبه هزینه و سرعت رسیدن به راه حل بهینه برخوردار است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    معصومی، بهروز، و میبدی، محمدرضا. (1389). مدلی مبتنی بر آنتروپی و اتوماتاهای یادگیر برای حل بازی های تصادفی. مهندسی برق و مهندسی کامپیوتر ایران، 8(2)، 97-106. SID. https://sid.ir/paper/53820/fa

    Vancouver: کپی

    معصومی بهروز، میبدی محمدرضا. مدلی مبتنی بر آنتروپی و اتوماتاهای یادگیر برای حل بازی های تصادفی. مهندسی برق و مهندسی کامپیوتر ایران[Internet]. 1389؛8(2):97-106. Available from: https://sid.ir/paper/53820/fa

    IEEE: کپی

    بهروز معصومی، و محمدرضا میبدی، “مدلی مبتنی بر آنتروپی و اتوماتاهای یادگیر برای حل بازی های تصادفی،” مهندسی برق و مهندسی کامپیوتر ایران، vol. 8، no. 2، pp. 97–106، 1389، [Online]. Available: https://sid.ir/paper/53820/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button