ایده اصلی یادگیری ماشین (ML) این بود که رفتار یک کامپیوتر یا یک ماشین، نباید توسط برنامه نویس، به طور کامل، تعریف شود. بر این اساس، کامپیوتر باید از مشاهدات دادههای موجود با استفاده از الگوریتمها یاد بگیرد و بر اساس یادگیری از داده های قبلی، دادههای ناشناخته را مدیریت کند (مثلاً طبقهبندی کند). این رفتار ماشین، شبیه رفتار انسان است که موقعیت های ناشناخته و جدید را با استفاده از تجربیات قبلی مدیریت کند. دیدگاه اولیه در مورد یادگیری ماشین را Frank Rosenblatt از دانشگاه کرنل مطرح کرد.
با توجه به مطالب گفته شده در مورد یادگیری ماشین ،در این پست به معرفی مهم ترین الگوریتم یادگیری ماشین که توجه زیادی را به خود جلب کرده، خواهیم پرداخت.
در سال های اخیر توجه به الگوریتم یادگیری گروهی افزایش داشته، به طوری که تعداد مدارک علمی مربوط به این الگوریتم بیشتر شده است. شکل 1، روند مدارک علمی مرتبط با الگوریتم های یادگیری ماشین را نشان می دهد. بر این اساس، یادگیری گروهی یا Ensemble learning محبوب ترین الگوریتم یادگیری ماشین است.
شکل 1. روند مدارک علمی مرتبط با الگوریتم های یادگیری ماشین
یادگیری گروهی Ensemble learning چیست؟
ممکن است در الگوریتم های یادگیری ماشین Ensemble learning ، استفاده از یک الگوریتم نتواند به خوبی پیش بینی درستی از مجموعه داده نشان دهد. الگوریتم های یادگیری ماشین با محدودیت هایی مواجه هستند و تولید مدل با دقت بالا چالش برانگیز و وقت گیر است. اگر مدل های مختلف ، بر اساس الگوریتم های مختلف ساخته شود ، شانس بالا بردن دقت افزایش می یابد . سپس، ترکیب مدل ها با تجمیع خروجی هر مدل ، با دو هدف پیاده سازی می شود:
- کاهش خطای مدل
- حفظ تعمیم مدل
به بیان ساده تر، در یادگیری ماشین ، روش یادگیری گروهی ، از الگوریتم های چندگانه ای استفاده می کند که عملکرد بهتری را نسبت به هریک از الگوریتم های یادگیری ماشین به تنهایی به دست آورد. گروه های داده زمانی که در بین مدل ها تنوع دارند ، تمایل دارند تا نتایج بهتری را بدست آورند. بسیاری از روش های گروهی، به دنبال بالا بردن ارتقای مدل های خود هستند. اگرچه، ممکن است غیر شهودی باشد اما الگوریتم تصادفی بیشتری مانند درخت تصمیم گیری تصادفی می توانند به تولید مجموعه ای از الگوریتم ها کمک کنند.
با استفاده از یادگیری گروهی ، پیاده سازی بر اساس تکنیک های مختلف انجام می شود که در مواقعی به آن متا الگوریتم meta-algorithms می گویند.
شکل 2. الگوریتم یادگیری گروهی
با استفاده از مدل های یادگیری گروهی، فقط از یک الگوریتم برای پیاده سازی استفاده نمی شود. به عنوان مثال ، می توان چندین مدلC45 ساخت که در آن هر مدل در حال یادگیری یک الگوی خاص را برای پیش بینی انجام می دهد. مدل ها می توانند برای به دست آوردن یک متا مدل استفاده شوند که به آن یادگیری ضعیف می گویند .
در معماری یادگیری گروهی ، ورودی ها به یک یاد گیرنده ضعیف منتقل می شوند و پیش بینی ها را جمع آوری می کنند. از پیش بینی ترکیبی برای ساخت یک مدل نهایی ، که بهترین عملکرد را در میان الگوریتم ها داشته ، استفاده می شود. یکی از مهم ترین چیزها در مورد راه های مختلف برای ترسیم ویژگی این است که باید مرزهای تصمیم گیری متفاوتی داشته باشند.
تکنیک های مختلف در یادگیری گروهی
- Bagging
- Boosting
- Stacking
- Blending
منبع:
Lundberg, L., Boldt, M., Borg, A., & Grahn, H. (2024). Bibliometric Mining of Research Trends in Machine Learning. AI, 5(1), 208-236. https://www.mdpi.com/2673-2688/5/1/12