در این کارگاه مباحثی همچون با آشنایی پایگاه های معتبر بین المللی ، آشنایی با ISI , SCOPUS، آشنایی با شناسایی نشریات معتبر، آشنایی با نحوه جستجو، آشنایی با ترفندهای جستجو مطرح میگردد
پایگـاه اطلاعات علمی جهاد دانشگاهی
تاریخ: 1401/06/22
بازدید: 2248
زمان مطالعه: 3 دقیقه / لینک کوتاه:
کلیدواژگان: هوش مصنوعی | یادگیری ماشین
وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیتهای غیر خطی
یادگیری تقویتی یا reinforcement learning، زیر شاخهای از یادگیری ماشین است. یادگیری تقویتی، آموزش مدلهای یادگیری ماشین برای تصمیم گیری متوالی است. در یادگیری تقویتی، عامل یاد میگیرد تا در محیط نامشخص و پیچیده بالقوه به یک هدف دست یابد. در یادگیری تقویتی، یادگیرنده و تصمیم گیرنده را عامل و چیزی را که با عامل تعامل دارد، که شامل هر چیز خارج از عامل را محیط می نامند. یادگیری تقویتی، بر پایه هوش مصنوعی با موقعیتی شبیه به بازی است. کامپیوتر از آزمون و خطا برای پیدا کردن راه حلی برای مشکل استفاده میکند. برای اینکه ماشین بتواند کاری را که برنامه نویس میخواهد را انجام دهد، هوش مصنوعی برای اقدامی که انجام میدهد پاداش یا جریمه در نظر میگیرد. هدف سیستم طراحی شده به حداکثر رساندن پاداش است.
طراح، سیاست پاداش را تعیین میکند، و هیچ پیشنهاد یا راهنمایی را برای نحوه حل بازی به مدل ارائه نمیکند. این مدل تلاش میکند تا بفهمد در چه صورت بالاترین پاداش را دریافت کند، مدل از آزمایش های خیلی تصادفی شروع میشود و با تکنیک های پیچیده و مهارت های مافوق بشری تمام میشود. اخیرا یادگیری تقویتی، با استفاده از قدرت جستجو و انجام آزمایشهای زیاد به یکی از تاثیرگذارترین راهها برای اشاره به خلاقیت ماشین تبدیل شده است. اگر یک الگوریتم یادگیری تقویتی، روی زیر ساخت رایانهای قدرتمند اجرا شود، هوش مصنوعی میتواند تجربیات هزاران بازی موازی را جمع آوری کند.
برای دریافت آخرینهای بلاگ در خبرنامه عضو شوید.
در گذشته، کاربردهای یادگیری تقویتی به دلیل ضعف زیرساخت های کامپیوتر محدود بود. با وجود ضعف کامپیوتر، بازی Gerard Tesauro’s backgammon در سال 1990 توسعه یافت. این پیشرفت اولیه با فناوریهای محاسباتی قدرتمندتر به سرعت در حال تغییر است.
مدلهایی که خودروهای خودران را کنترل میکنند نمونهای عالی از کاربردهای بالقوه یادگیری تقویتی است. در شرایط ایدهآل، کامپیوترها نباید هیچ دستوری برای راندن ماشین از راننده بگیرند. برنامه نویس از نوشتن کد هرچیزی که با کار مرتبط است اجتناب میکند و به سیستم اجازه میدهد تا از اشتباهات خود درس بگیرد.
وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیتهای غیر خطی[1]، توسط پروفسور Vaneet Aggarwal از دانشگاه پوردو برگزار شد. Vaneet Aggarwal با داشتن 5457 استناد و شاخص هرش 37 در گوگل اسکالر از محققان به نام در حوزه موضوعی یادگیری تقویتی است. وبینار یادگیری تقویتی چند هدفه با ابزارها و محدودیتهای غیر خطی روز چهارشنبه 23 شهریور 1401، ساعت 14و 30 دقیقه توسط دانشگاه صنعتی شریف برگزار شد.
[1] Multi-Objective Reinforcement Learning with Non-Linear Utilities and Constraints
پست های مرتبط
تاریخ: 1402/02/18
بازدید: 677
1402
زمان مطالعه: 2 دقیقه
اینترنت اشیاء چیست؟
@ins
تاریخ: 1402/02/30
بازدید: 5278
Perplexity چیست؟
تاریخ: 1402/03/22
بازدید: 3664
زمان مطالعه: 3 دقیقه
هوش مصنوعی یک فناوری انقلابی نو ظهور است که توانایی یادگیری از داده ها و انجام وظایفی را که معمولاً به هوش انسانی نیاز دارند، دارد.
تاریخ: 1403/03/16
بازدید: 10302
1403
انسان به عنوان موجودی دارای خرد می تواند بنویسد، بسازد و نوآوری کند .
تاریخ: 1403/05/01
بازدید: 354
برنامه نویسان از محیط های مختلفی برای نوشتن کدهای زبان های برنامه نویسی ، استفاده می کنند .
تاریخ: 1403/01/28
بازدید: 86572
هوش مصنوعی (AI) چیست ؟
تاریخ: 1403/07/25
بازدید: 1426
اسکوپوس به عنوان بزرگ ترین پایگاه استنادی دنیا ، سرویسی به نام Scopus AI را در اختیار مخاطبان قرار داه است.
تاریخ: 1402/08/15
بازدید: 1155
زمان مطالعه: 7 دقیقه
پیشرفت های اخیر هوش مصنوعی و تولد چت جی پی تی، ابزارهای تحت اختیار انسان متحول شد. اما سوال اصلی این است که آیا که چت جی پی تی می تواند در پژوهش جانشین انسان شود؟
تاریخ: 1402/10/18
بازدید: 916
ابزار هوش مصنوعی چیست ؟
تاریخ: 1402/12/16
بازدید: 6899
هر تغییری در تکنولوژی شانس جدیدی را برای شناسایی و پیشبرد علم پیش روی جهان قرار می دهد، زندگی انسان را آسان می کند و منجر به بهبود زندگی انسان ها می شود.