مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

یادگیری تقویتی چیست؟


وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی

یادگیری تقویتی یا reinforcement learning، زیر شاخه‌ای از یادگیری ماشین است. یادگیری تقویتی، آموزش مدل‌های یادگیری ماشین برای تصمیم گیری متوالی است. در یادگیری تقویتی، عامل یاد می‌گیرد تا در محیط نامشخص و پیچیده بالقوه به یک هدف دست یابد. در یادگیری تقویتی، یادگیرنده و تصمیم گیرنده را عامل و چیزی را که با عامل تعامل دارد، که شامل هر چیز خارج از عامل را محیط می نامند. یادگیری تقویتی، بر پایه هوش مصنوعی با موقعیتی شبیه به بازی است. کامپیوتر از آزمون و خطا برای پیدا کردن راه حلی برای مشکل استفاده می‌کند. برای اینکه ماشین بتواند کاری را که برنامه نویس می‌خواهد را انجام دهد، هوش مصنوعی برای اقدامی که انجام می‌دهد پاداش یا جریمه در نظر می‌گیرد. هدف سیستم طراحی شده به حداکثر رساندن پاداش است.

طراح، سیاست پاداش را تعیین می‌کند، و هیچ پیشنهاد یا راهنمایی را برای نحوه حل بازی به مدل ارائه نمی‌کند. این مدل تلاش می‌کند تا بفهمد در چه صورت بالاترین پاداش را دریافت کند، مدل از آزمایش های خیلی تصادفی شروع می‌شود و با تکنیک های پیچیده و مهارت های مافوق بشری تمام می‌شود.  اخیرا یادگیری تقویتی، با استفاده از قدرت جستجو و انجام آزمایش‌های زیاد به یکی از تاثیرگذارترین راه‌ها برای اشاره به خلاقیت ماشین تبدیل شده است. اگر یک الگوریتم یادگیری تقویتی، روی زیر ساخت رایانه‌ای قدرتمند اجرا شود، هوش مصنوعی می‌تواند تجربیات هزاران بازی موازی را جمع آوری کند.

 

برای دریافت آخرین‌های بلاگ در خبرنامه عضو شوید.

یادگیری تقویتی

نمونه هایی از یادگیری تقویتی

در گذشته، کاربردهای یادگیری تقویتی به دلیل ضعف زیرساخت های کامپیوتر محدود بود. با وجود ضعف کامپیوتر، بازی Gerard Tesauro’s backgammon در سال 1990 توسعه یافت. این پیشرفت اولیه با فناوری‌های محاسباتی قدرتمندتر به سرعت در حال تغییر است.

مدل‌هایی که خودروهای خودران را کنترل می‌کنند نمونه‌ای عالی از کاربردهای بالقوه یادگیری تقویتی است. در شرایط ایده‌آل، کامپیوترها نباید هیچ دستوری برای راندن ماشین از راننده بگیرند. برنامه نویس از نوشتن کد هرچیزی که با کار مرتبط است اجتناب می‌کند و به سیستم اجازه می‌دهد تا از اشتباهات خود درس بگیرد.

وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی

وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی[1]، توسط پروفسور Vaneet Aggarwal از دانشگاه پوردو برگزار شد. Vaneet Aggarwal با داشتن 5457 استناد و شاخص هرش 37 در گوگل اسکالر از محققان به نام در حوزه موضوعی یادگیری تقویتی است. وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیت‌های غیر خطی روز چهارشنبه 23 شهریور 1401، ساعت 14و 30 دقیقه توسط دانشگاه صنعتی شریف برگزار شد. 

یادگیری تقویتی

 

 

[1] Multi-Objective Reinforcement Learning with Non-Linear Utilities and Constraints

لینک کوتاه

لینک کوتاه

بازگشت به بالا

پست های مرتبط

هوش مصنوعی گراک

تاریخ: 1403/12/04

بازدید: 397

1403

زمان مطالعه: 3 دقیقه

مقایسه ی هوش مصنوعی گراک با چت جی پی تی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

یادگیری گروهی Ensemble learning چیست ؟

تاریخ: 1402/11/08

بازدید: 1262

1402

زمان مطالعه: 2 دقیقه

ایده اصلی یادگیری ماشین (ML) این بود که رفتار یک کامپیوتر یا یک ماشین، نباید توسط برنامه نویس، به طور کامل، تعریف شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

سفر در زمان با هوش مصنوعی

تاریخ: 1401/09/05

بازدید: 4997

1401

زمان مطالعه: 2 دقیقه

سفر در زمان با هوش مصنوعی، یکی از امکانات سایت MyHeritage است.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

ساخت موسیقی با هوش مصنوعی

تاریخ: 1403/01/28

بازدید: 105827

1403

زمان مطالعه: 2 دقیقه

هوش مصنوعی (AI) چیست ؟

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

ساخت عکس با هوش مصنوعی

تاریخ: 1403/02/09

بازدید: 2179

1403

زمان مطالعه: 4 دقیقه

به هر هنر تصویری که با استفاده از برنامه های هوش مصنوعی ساخته می شود ، هنر هوش مصنوعی گفته می شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

پارتنر زبان انگلیسی هوش مصنوعی

تاریخ: 1402/08/08

بازدید: 7810

1402

زمان مطالعه: 3 دقیقه

یادگیری زبان دوم عامل مهمی است. یادگیری زبان دوم باعث موفقیت ، افزایش ارتباطات و خود بیانگری می شود.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

copilot چیست

تاریخ: 1403/03/16

بازدید: 11977

1403

زمان مطالعه: 3 دقیقه

انسان به عنوان موجودی دارای خرد می تواند بنویسد، بسازد و نوآوری کند .

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

هوش مصنوعی رایگان دیپ سیک DeepSeek

تاریخ: 1403/11/08

بازدید: 2597

1403

زمان مطالعه: 3 دقیقه

دیپ سیک DeepSeek، استارت آپ ناشناخته مبتنی بر هوش مصنوعی در چین بود که با انتشار نسخه ی رایگان هوش مصنوعی ، دریچه ی جدیدی به این دنیا باز کرد.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

روز تحقیقاتی داده‏ کاوی و هوش مصنوعی امیر کبیر

تاریخ: 1402/09/29

بازدید: 317

1402

زمان مطالعه: 1 دقیقه

دعوت از ایده پردازان، علاقمندان و حامیان برای شرکت در روز تحقیقاتی داده‏ کاوی و هوش مصنوعی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

هوش مصنوعی برای محققان

تاریخ: 1403/11/01

بازدید: 297

1403

زمان مطالعه: 2 دقیقه

با پیشرفت هوش مصنوعی در سال های گذشته ، رفته رفته ابزارهای جدید تری ساخته شده و در دسترس قرار می گیرند.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button