در این مقاله به بررسی یک معیار جدید مقایسه ای برای تولید پاسخ محیط در حل مسایل بهینه سازی روی گراف های تصادفی به عنوان مدلی از شبکه های کامپیوتری توسط شبکه ای از آتاماتاهای یادگیر می پردازیم. این روش جدید به دلیل لحاظ کردن تقریبی از واریانس پاسخ های تولیدشده توسط شبکه آتاماتاهای یادگیر، قادر به انطباق بیشتری با محیط بوده و در نتیجه پاسخ های مناسب تری به اقدام های انجام شده توسط آتاماتاها در شبکه ای از آتاماتاهای یادگیر می دهد. روش جدید از طریق واردکردن یک مقدار نویز محاسبه شده، از ایستایی فرایند یادگیری و گیرافتادن آن در نقاط کمینه محلی جلوگیری کرده و باعث تسریع در فرایند یادگیری می شود. به کمک شبیه سازی ها نشان می دهیم این روش جدید در مقایسه با روش های فعلی که تا کنون مورد استفاده بوده است، هم به لحاظ سرعت همگرایی به جواب بهینه و هم به لحاظ قابلیت گریز از اثر واریانس وزن یال های گراف تصادفی- که باعث میل جواب نهایی به سمت کوچک ترین مقدار و نه مقدار میانگین می شود- عملکرد بهتری دارد.