ترکیب الگوریتم یادگیری تقویتی با تقریب زننده های تابعی برای تعمیم فضای حالت اخیرا از توجه ویژه ای برخوردار شده و به صورت گسترده ای این اعتقاد وجود دارد که یکی از موارد تعیین کننده برای سنجش میزان یادگیری تقویتی به قلمروهای جالب عملی، است. این مقاله ترکیب دستورالعمل TTD، یک پیاده سازی تقریبی موثر محاسباتی از روش های TD(λ) با CMAC، یک تقریب گر تابع به ویژه مناسب برای یادگیری تقویتی درخور کارآیی محاسباتی آن و توانایی یادگیری پیوسته را مورد بررسی قرار می دهد. اکثر مطالعات قبلی ترکیب CMAC با الگوریتم های بر اساس TD(0) که معمولا برای λ>0 یادگیری بسیار آهسته تر صورت می گیرد، یا با پیاده سازی مرسوم TD(λ) که بر اساس آثار صلاحیت است به همراه هزنیه های محاسباتی بالا مورد بررسی قرار داده اند. مطالعه فعلی، سعی دارد علاوه بر معرفی کامل روش TTD برای کاهش هزنیه های محاسباتی، با ترکیب CMAC و TTD یادگیری سریع با کارآیی محاسباتی و توانمندی های تعمیمی را بیان کند. نتایج تجربی ارایه شده، عملکرد موفقیت آمیز الگوریتم یادگیری Q را که با استفاده از دستورالعمل TTD و CMAC در دو کار با فضاهای حالت پیوسته پیاده سازی شده اند، را نشان می دهد.