مقدمه: در این مطالعه، با استفاده از ترکیبی از روش های کاهش بعد داده و طبقه بندی، ویژگی های مواد دارویی مورد بررسی قرار گرفت. تعریف و آماده سازی مولکول های «غیر فعال» برای توسعه مدل های تفکیکی دوتایی (Two-class classifier) یکی از مشکلات عمده در مسیر استفاده از مدل های تفکیکی بر پایه لیگاند در روند طراحی سیستماتیک دارو می باشد. از این رو، با استفاده از مولکول های «فعال» موجود در پایگاه Binding-DB، به توسعه مدل های تفکیکی چند متغیره چند منظوره پرداخته شد.روش ها: به این منظور، در حدود 160372 ریز مولکول برای 45 هدف دارویی مختلف از پایگاه مولکولی Binding-DB دانلود شد و پس از بهینه سازی ساختار، 1497 ویژگی فیزیکی و شیمیایی برای هر مولکول استخراج گردید. با استفاده از الگوریتم Apriori و ترکیب آن با روش طبقه بندی تفکیکی خطی (Linear discriminant analysis)، ویژگی های مولکولی برای هر هدف دارویی به منظور تفکیک مولکول های فعال استخراج شد.یافته ها: در نهایت، با استفاده از غربالگری مجازی در پایگاه داده های مولکولی Zinc و Binding-DB و محاسبه سطح زیر نمودار Receiver operating characteristic( ROC) صحت و حساسیت طبقه بندی مورد بررسی قرار گرفت. میزان سطح زیر نمودار ROC برای هر بهینه سازی پایگاه Zinc به طور میانگین برابر با 0.8341±0.1495 و در پایگاه Binding-DB به طور میانگین برابر با 0.8615±0.1502 بود.نتیجه گیری: می توان با استفاده از الگوریتم ارایه شده، ویژگی هایی برای هر دسته از ریز مولکول های مرتبط با هر هدف دارویی استخراج کرد و پایگاه های مولکولی مختلف را برای هر هدف دارویی بهینه سازی کرد. سطح زیر نمودار ROC برای دو پایگاه مولکولی مورد بررسی نشان می دهد که روش ارایه شده، روش مفیدی برای طبقه بندی پایگاه های بزرگ مولکولی بدون استفاده از ریز مولکول های غیر فعال می باشد.