مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

1,094
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

390
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

نقش یادگیری تفاوت زمانی تخلیص شده با تقریب زننده های تابع برای کاهش زمان و هزینه های محاسباتی یادگیری تقویتی

صفحات

 صفحه شروع 4 | صفحه پایان 18

چکیده

 ترکیب الگوریتم یادگیری تقویتی با تقریب زننده های تابعی برای تعمیم فضای حالت اخیرا از توجه ویژه ای برخوردار شده و به صورت گسترده ای این اعتقاد وجود دارد که یکی از موارد تعیین کننده برای سنجش میزان یادگیری تقویتی به قلمروهای جالب عملی, است. این مقاله ترکیب دستورالعمل TTD, یک پیاده سازی تقریبی موثر محاسباتی از روش های TD(λ) با CMAC, یک تقریب گر تابع به ویژه مناسب برای یادگیری تقویتی درخور کارآیی محاسباتی آن و توانایی یادگیری پیوسته را مورد بررسی قرار می دهد. اکثر مطالعات قبلی ترکیب CMAC با الگوریتم های بر اساس TD(0) که معمولا برای λ>0 یادگیری بسیار آهسته تر صورت می گیرد, یا با پیاده سازی مرسوم TD(λ) که بر اساس آثار صلاحیت است به همراه هزنیه های محاسباتی بالا مورد بررسی قرار داده اند. مطالعه فعلی, سعی دارد علاوه بر معرفی کامل روش TTD برای کاهش هزنیه های محاسباتی, با ترکیب CMAC و TTD یادگیری سریع با کارآیی محاسباتی و توانمندی های تعمیمی را بیان کند. نتایج تجربی ارایه شده, عملکرد موفقیت آمیز الگوریتم یادگیری Q را که با استفاده از دستورالعمل TTD و CMAC در دو کار با فضاهای حالت پیوسته پیاده سازی شده اند, را نشان می دهد.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    عبدی، جواد، فامیل خلیلی، اعظم، لوکس، کارو، و خاکی صدیق، علی. (1383). نقش یادگیری تفاوت زمانی تخلیص شده با تقریب زننده های تابع برای کاهش زمان و هزینه های محاسباتی یادگیری تقویتی. نشریه مهندسی برق و الکترونیک ایران (انجمن مهندسین برق و الکترونیک ایران)، 1(1)، 4-18. SID. https://sid.ir/paper/443149/fa

    Vancouver: کپی

    عبدی جواد، فامیل خلیلی اعظم، لوکس کارو، خاکی صدیق علی. نقش یادگیری تفاوت زمانی تخلیص شده با تقریب زننده های تابع برای کاهش زمان و هزینه های محاسباتی یادگیری تقویتی. نشریه مهندسی برق و الکترونیک ایران (انجمن مهندسین برق و الکترونیک ایران)[Internet]. 1383؛1(1):4-18. Available from: https://sid.ir/paper/443149/fa

    IEEE: کپی

    جواد عبدی، اعظم فامیل خلیلی، کارو لوکس، و علی خاکی صدیق، “نقش یادگیری تفاوت زمانی تخلیص شده با تقریب زننده های تابع برای کاهش زمان و هزینه های محاسباتی یادگیری تقویتی،” نشریه مهندسی برق و الکترونیک ایران (انجمن مهندسین برق و الکترونیک ایران)، vol. 1، no. 1، pp. 4–18، 1383، [Online]. Available: https://sid.ir/paper/443149/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button