زمینه و هدف: این پژوهش بر آن است تا با بهره گیری از الگوریتم های داده کاوی به تحلیل داده های ثبت شده در بانک اطلاعاتی پلیس مربوط به دستگیرشدگان توسط گشت های انتظامی تهران بزرگ در سه ماهه اول سال 1389 بپردازد و با استفاده از آنها، الگویی طراحی شود که به شناسایی مجرمان واقعی از بین انبوه متهمان دستگیر شده اقدام کند. این الگو می تواند به عنوان یک سامانه تصمیم یار در اختیار کارشناسان انتظامی قرار گیرد تا فرآیند شناسایی و دستگیری مجرمان واقعی با سرعت و دقت بیشتری انجام شود.روش شناسی: این پژوهش از نوع پژوهش های داده محور بوده و بر اساس یک فرایند استاندارد داده کاوی CRISP-DM، داده های دستگیرشدگان که شامل متغیرهای جمعیت شناختی متهمان و کلانتری محل دستگیری است، پس از یکپارچه سازی و پالایش، با استفاده از الگوریتم های CHAID, CRT C5.0 و شبکه عصبی MLP مدل سازی شدند.یافته ها: الگوریتم C5.0 در فن درخت تصمیم نتایج بهتری را به لحاظ دقت شناسایی مجرمان واقعی نسبت به سایر الگوریتم های درخت تصمیم، مانند CHAID, CRT دارد، اما نسبت به الگوی طراحی شده توسط شبکه عصبی MLP دقت کمتری دارد.نتایج: با استفاده از الگوریتم های درخت تصمیم، در مجموع 19 قانون کشف و ارائه شد. برای بررسی این قوانین، نشست خبرگان تشکیل شد و در نهایت از 19 قانون استخراج شده، 3 قانون مرتبط با موضوع مورد پژوهش شناخته شده و مورد تایید قرار گرفت.