مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

یادگیری تقویتی چیست؟


وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی

یادگیری تقویتی یا reinforcement learning، زیر شاخه‌ای از یادگیری ماشین است. یادگیری تقویتی، آموزش مدل‌های یادگیری ماشین برای تصمیم گیری متوالی است. در یادگیری تقویتی، عامل یاد می‌گیرد تا در محیط نامشخص و پیچیده بالقوه به یک هدف دست یابد. در یادگیری تقویتی، یادگیرنده و تصمیم گیرنده را عامل و چیزی را که با عامل تعامل دارد، که شامل هر چیز خارج از عامل را محیط می نامند. یادگیری تقویتی، بر پایه هوش مصنوعی با موقعیتی شبیه به بازی است. کامپیوتر از آزمون و خطا برای پیدا کردن راه حلی برای مشکل استفاده می‌کند. برای اینکه ماشین بتواند کاری را که برنامه نویس می‌خواهد را انجام دهد، هوش مصنوعی برای اقدامی که انجام می‌دهد پاداش یا جریمه در نظر می‌گیرد. هدف سیستم طراحی شده به حداکثر رساندن پاداش است.

طراح، سیاست پاداش را تعیین می‌کند، و هیچ پیشنهاد یا راهنمایی را برای نحوه حل بازی به مدل ارائه نمی‌کند. این مدل تلاش می‌کند تا بفهمد در چه صورت بالاترین پاداش را دریافت کند، مدل از آزمایش های خیلی تصادفی شروع می‌شود و با تکنیک های پیچیده و مهارت های مافوق بشری تمام می‌شود.  اخیرا یادگیری تقویتی، با استفاده از قدرت جستجو و انجام آزمایش‌های زیاد به یکی از تاثیرگذارترین راه‌ها برای اشاره به خلاقیت ماشین تبدیل شده است. اگر یک الگوریتم یادگیری تقویتی، روی زیر ساخت رایانه‌ای قدرتمند اجرا شود، هوش مصنوعی می‌تواند تجربیات هزاران بازی موازی را جمع آوری کند.

 

برای دریافت آخرین‌های بلاگ در خبرنامه عضو شوید.

یادگیری تقویتی

نمونه هایی از یادگیری تقویتی

در گذشته، کاربردهای یادگیری تقویتی به دلیل ضعف زیرساخت های کامپیوتر محدود بود. با وجود ضعف کامپیوتر، بازی Gerard Tesauro’s backgammon در سال 1990 توسعه یافت. این پیشرفت اولیه با فناوری‌های محاسباتی قدرتمندتر به سرعت در حال تغییر است.

مدل‌هایی که خودروهای خودران را کنترل می‌کنند نمونه‌ای عالی از کاربردهای بالقوه یادگیری تقویتی است. در شرایط ایده‌آل، کامپیوترها نباید هیچ دستوری برای راندن ماشین از راننده بگیرند. برنامه نویس از نوشتن کد هرچیزی که با کار مرتبط است اجتناب می‌کند و به سیستم اجازه می‌دهد تا از اشتباهات خود درس بگیرد.

وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی

وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی[1]، توسط پروفسور Vaneet Aggarwal از دانشگاه پوردو برگزار شد. Vaneet Aggarwal با داشتن 5457 استناد و شاخص هرش 37 در گوگل اسکالر از محققان به نام در حوزه موضوعی یادگیری تقویتی است. وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی روز چهارشنبه 23 شهریور 1401، ساعت 14و 30 دقیقه توسط دانشگاه صنعتی شریف برگزار شد. 

یادگیری تقویتی

 

 

[1] Multi-Objective Reinforcement Learning with Non-Linear Utilities and Constraints

لینک کوتاه

لینک کوتاه

بازگشت به بالا

پست های مرتبط

ابزار هوش مصنوعی برای دانشجویان

تاریخ: 1403/09/14

بازدید: 917

1403

زمان مطالعه: 3 دقیقه

در دو سال گذشته با ظهور چت جی پی تی ، ابزارهای هوش مصنوعی زیادی ساخته شد .

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

ششمین دوره لیگ اینترنت اشیا ایران

تاریخ: 1402/02/18

بازدید: 699

1402

زمان مطالعه: 2 دقیقه

اینترنت اشیاء چیست؟

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

هوش مصنوعی برای محققان

تاریخ: 1403/11/01

بازدید: 151

1403

زمان مطالعه: 2 دقیقه

با پیشرفت هوش مصنوعی در سال های گذشته ، رفته رفته ابزارهای جدید تری ساخته شده و در دسترس قرار می گیرند.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

ساخت موسیقی با هوش مصنوعی

تاریخ: 1403/01/28

بازدید: 99738

1403

زمان مطالعه: 2 دقیقه

هوش مصنوعی (AI) چیست ؟

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

فراخوان حمایت از به کارگیری هوش مصنوعی در صنایع کشور

تاریخ: 1402/08/22

بازدید: 424

1402

زمان مطالعه: 1 دقیقه

به دلیل اهمیت هوش مصنوعی در عصر حاضر و نقش انکار پذیر آن در صنایع، از هوش مصنوعی در صنایع کشور حمایت می شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

روز تحقیقاتی داده‏ کاوی و هوش مصنوعی امیر کبیر

تاریخ: 1402/09/29

بازدید: 304

1402

زمان مطالعه: 1 دقیقه

دعوت از ایده پردازان، علاقمندان و حامیان برای شرکت در روز تحقیقاتی داده‏ کاوی و هوش مصنوعی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

چت جی پی تی چه کارهایی را نمی تواند انجام دهد ؟

تاریخ: 1402/08/15

بازدید: 1265

1402

زمان مطالعه: 7 دقیقه

پیشرفت های اخیر هوش مصنوعی و تولد چت جی پی تی، ابزارهای تحت اختیار انسان متحول شد. اما سوال اصلی این است که آیا که چت جی پی تی می تواند در پژوهش جانشین انسان شود؟

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

روان درمانی به کمک هوش مصنوعی

تاریخ: 1402/08/02

بازدید: 52434

1402

زمان مطالعه: 2 دقیقه

روانشناسی یکی از حوزه هایی است که هوش مصنوعی با ورود به آن توانسته تا عملکرد بهتری را در اختیار افراد قرار دهد.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

متون ساخته شده توسط ChatGPT را با GPTKit شناسایی کنید

تاریخ: 1401/12/06

بازدید: 1476

1401

زمان مطالعه: 2 دقیقه

با توسعه یادگیری ماشین و هوش مصنوعی در سال های اخیر، ابزارهای زیادی تولید شده و در اختیار عموم قرار گرفته است.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

یادگیری ماشین چیست ؟

تاریخ: 1401/08/14

بازدید: 1270

1401

زمان مطالعه: 2 دقیقه

یادگیری ماشین، به فرآیندی گفته می‌شود که کامپیوتر بر اساس شواهد یا داده ها یاد می‌گیرد تا در برخی از وظایف مبتنی بر داده کمک کند.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button