زمینه و هدف: دیابت بیماری مزمنی است که شایع ترین بیماری اختلالات متابولیسم و یکی از عمده ترین مسایل بهداشتی-درمانی در سرتاسر دنیا است. امروزه تکنیک های داده کاوی (Data mining techniques) با توجه به توانمندی آن ها، در حوزه های مختلف به کار برده می شوند. بنابراین در این پژوهش به مقایسه کارایی روش های داده کاوی در پیش بینی ابتلا به بیماری دیابت نوع 2 پرداخته شد. روش بررسی: در این مطالعه تحلیلی-مقطعی، از مجموع 7000 نفر شرکت کننده در طرح غربالگری دیابت سال 1395 در منطقه ثامن مشهد که شامل بررسی میزان قند خون، چشم ها، آسیب کلیوی و سلامت پاها بود، تعداد 540 نفر مبتلا به بیماری دیابت (درمان نشده) بودند و برای حفظ توازن 600 فرد سالم به صورت نمونه گیری متناسب با حجم انتخاب شدند (حجم کل نمونه 1140 نفر). در این مطالعه مبتلایان به دیابت بالای 30 سال وارد مطالعه گردیدند و افرادی که از پیش سابقه ی دیابت نوع 2 داشتند و اکنون به سبب استفاده از دارو و یا رعایت سایر نکات مقدار قند خون طبیعی داشتند از مطالعه حذف گردیدند. یافته ها صحت هر سه مدل برابر بود (86%) اما از نظر سطح زیرمنحنی راک (Receiver operating characteristic, ROC)، مدل های رگرسیون لجستیک (Logistic regression model) و بیزین ساده (Simple Bayesian model) با90% سطح زیرمنحنی راک عملکرد بهتری داشتند. در مدل بیزین ساده و رگرسیون لجستیک به ترتیب متغیرهای شاخص توده بدنی و سن دارای بیشترین میزان اهمیت بودند، در حالی که در مدل ماشین بردار پشتیبان (Support vector machine, SVM)، متغیرهای شاخص توده بدنی و فشارخون دارای بیشترین اهمیت بودند. نتیجه گیری صحت هر سه مدل برابر بود. از نظر سطح زیرمنحنی راک، مدل های رگرسیون لجستیک و بیزین ساده مناسب تر بودند. در مجموع هر سه مدل عملکرد مشابهی داشتند. در هر سه مدل شاخص توده بدنی دارای بیشترین اهمیت بود.