مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

یادگیری تقویتی چیست؟


وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی

یادگیری تقویتی یا reinforcement learning، زیر شاخه‌ای از یادگیری ماشین است. یادگیری تقویتی، آموزش مدل‌های یادگیری ماشین برای تصمیم گیری متوالی است. در یادگیری تقویتی، عامل یاد می‌گیرد تا در محیط نامشخص و پیچیده بالقوه به یک هدف دست یابد. در یادگیری تقویتی، یادگیرنده و تصمیم گیرنده را عامل و چیزی را که با عامل تعامل دارد، که شامل هر چیز خارج از عامل را محیط می نامند. یادگیری تقویتی، بر پایه هوش مصنوعی با موقعیتی شبیه به بازی است. کامپیوتر از آزمون و خطا برای پیدا کردن راه حلی برای مشکل استفاده می‌کند. برای اینکه ماشین بتواند کاری را که برنامه نویس می‌خواهد را انجام دهد، هوش مصنوعی برای اقدامی که انجام می‌دهد پاداش یا جریمه در نظر می‌گیرد. هدف سیستم طراحی شده به حداکثر رساندن پاداش است.

طراح، سیاست پاداش را تعیین می‌کند، و هیچ پیشنهاد یا راهنمایی را برای نحوه حل بازی به مدل ارائه نمی‌کند. این مدل تلاش می‌کند تا بفهمد در چه صورت بالاترین پاداش را دریافت کند، مدل از آزمایش های خیلی تصادفی شروع می‌شود و با تکنیک های پیچیده و مهارت های مافوق بشری تمام می‌شود.  اخیرا یادگیری تقویتی، با استفاده از قدرت جستجو و انجام آزمایش‌های زیاد به یکی از تاثیرگذارترین راه‌ها برای اشاره به خلاقیت ماشین تبدیل شده است. اگر یک الگوریتم یادگیری تقویتی، روی زیر ساخت رایانه‌ای قدرتمند اجرا شود، هوش مصنوعی می‌تواند تجربیات هزاران بازی موازی را جمع آوری کند.

 

برای دریافت آخرین‌های بلاگ در خبرنامه عضو شوید.

یادگیری تقویتی

نمونه هایی از یادگیری تقویتی

در گذشته، کاربردهای یادگیری تقویتی به دلیل ضعف زیرساخت های کامپیوتر محدود بود. با وجود ضعف کامپیوتر، بازی Gerard Tesauro’s backgammon در سال 1990 توسعه یافت. این پیشرفت اولیه با فناوری‌های محاسباتی قدرتمندتر به سرعت در حال تغییر است.

مدل‌هایی که خودروهای خودران را کنترل می‌کنند نمونه‌ای عالی از کاربردهای بالقوه یادگیری تقویتی است. در شرایط ایده‌آل، کامپیوترها نباید هیچ دستوری برای راندن ماشین از راننده بگیرند. برنامه نویس از نوشتن کد هرچیزی که با کار مرتبط است اجتناب می‌کند و به سیستم اجازه می‌دهد تا از اشتباهات خود درس بگیرد.

وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی

وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی[1]، توسط پروفسور Vaneet Aggarwal از دانشگاه پوردو برگزار شد. Vaneet Aggarwal با داشتن 5457 استناد و شاخص هرش 37 در گوگل اسکالر از محققان به نام در حوزه موضوعی یادگیری تقویتی است. وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی روز چهارشنبه 23 شهریور 1401، ساعت 14و 30 دقیقه توسط دانشگاه صنعتی شریف برگزار شد. 

یادگیری تقویتی

 

 

[1] Multi-Objective Reinforcement Learning with Non-Linear Utilities and Constraints

لینک کوتاه

لینک کوتاه

بازگشت به بالا

پست های مرتبط

روان درمانی به کمک هوش مصنوعی

تاریخ: 1402/08/02

بازدید: 55547

1402

زمان مطالعه: 2 دقیقه

روانشناسی یکی از حوزه هایی است که هوش مصنوعی با ورود به آن توانسته تا عملکرد بهتری را در اختیار افراد قرار دهد.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

متون ساخته شده توسط ChatGPT را با GPTKit شناسایی کنید

تاریخ: 1401/12/06

بازدید: 1519

1401

زمان مطالعه: 2 دقیقه

با توسعه یادگیری ماشین و هوش مصنوعی در سال های اخیر، ابزارهای زیادی تولید شده و در اختیار عموم قرار گرفته است.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

فراخوان حمایت از به کارگیری هوش مصنوعی در صنایع کشور

تاریخ: 1402/08/22

بازدید: 432

1402

زمان مطالعه: 1 دقیقه

به دلیل اهمیت هوش مصنوعی در عصر حاضر و نقش انکار پذیر آن در صنایع، از هوش مصنوعی در صنایع کشور حمایت می شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

یادگیری ماشین چیست ؟

تاریخ: 1401/08/14

بازدید: 1284

1401

زمان مطالعه: 2 دقیقه

یادگیری ماشین، به فرآیندی گفته می‌شود که کامپیوتر بر اساس شواهد یا داده ها یاد می‌گیرد تا در برخی از وظایف مبتنی بر داده کمک کند.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

با هوش مصنوعی به کار رفته در Perplexity متن تولید کنید

تاریخ: 1402/02/30

بازدید: 5596

1402

زمان مطالعه: 2 دقیقه

Perplexity چیست؟

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

با استفاده از هوش مصنوعی زبان انگلیسی خود را تقویت کنید

تاریخ: 1402/02/16

بازدید: 38045

1402

زمان مطالعه: 3 دقیقه

هوش مصنوعی در سل های اخیر توجه های زیادی را به خود جلب کرده است. با رونمایی از ابزار Chat Gpt  تحول شگرفی در هوش مصنوعی رخ داد

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

روز تحقیقاتی داده‏ کاوی و هوش مصنوعی امیر کبیر

تاریخ: 1402/09/29

بازدید: 317

1402

زمان مطالعه: 1 دقیقه

دعوت از ایده پردازان، علاقمندان و حامیان برای شرکت در روز تحقیقاتی داده‏ کاوی و هوش مصنوعی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

ساخت موسیقی با هوش مصنوعی

تاریخ: 1403/01/28

بازدید: 105811

1403

زمان مطالعه: 2 دقیقه

هوش مصنوعی (AI) چیست ؟

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

یادگیری گروهی Ensemble learning چیست ؟

تاریخ: 1402/11/08

بازدید: 1262

1402

زمان مطالعه: 2 دقیقه

ایده اصلی یادگیری ماشین (ML) این بود که رفتار یک کامپیوتر یا یک ماشین، نباید توسط برنامه نویس، به طور کامل، تعریف شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

پارتنر زبان انگلیسی هوش مصنوعی

تاریخ: 1402/08/08

بازدید: 7807

1402

زمان مطالعه: 3 دقیقه

یادگیری زبان دوم عامل مهمی است. یادگیری زبان دوم باعث موفقیت ، افزایش ارتباطات و خود بیانگری می شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button