آگاهی از کیفیت آب یکی از نیازهای مهم در برنامه ریزی، توسعه و حفاظت از منابع آب به شمار می رود. تعیین کیفیت آب برای مصارف مختلف از جمله آبیاری و شرب در مناطق مختلف ضروری است. استفاده از روش های مدرن داده کاوی، می توانند رویکرد مناسبی برای پیش بینی و طبقه بندی کیفیت آب ارائه دهند. در پژوهش حاضر کیفیت آب رودخانة قزل اوزن در ایستگاه قره گونئی روستایی از توابع بخش حلب شهرستان ایجرود در استان زنجان مورد ارزیابی قرار گرفت. در این راستا شاخص کیفی آب شرب (WQI) با استفاده از پارامترهای شیمیایی سختی کل، قلیائیت (pH)، هدایت الکتریکی، کل مواد جامد محلول، کلسیم، سدیم، منیزیم، پتاسیم، کلر، کربنات، بی کربنات و سولفات در دورة آماری 21ساله (1398-1378) محاسبه شد. با توجه به تعداد نسبتاً زیاد پارامترها از روش های تحلیل مؤلفه های اصلی و تحلیل مؤلفه های مستقل برای کاهش ابعاد استفاده شد. سپس از الگوریتم های مختلف یادگیری ماشین شامل درخت تصمیم، رگرسیون لجستیک و شبکة عصبی مصنوعی پرسپترون چندلایه برای مدل سازی شاخص کیفی آب استفاده شد. با استفاده از این روش ها تعداد پارامترهای مورد نیاز برای محاسبة شاخص کیفی از 12 به دو کاهش یافت. کاهش ابعاد داده ها باعث صرفه جویی در زمان نمونه برداری، پایش نمونه ها و تعیین کیفیت آب شده و هزینه های مورد نیاز برای مدل سازی را به مقدار قابل توجهی کاهش می دهد. نتایج نشان داد از بین روش های کاهش بعد روش تحلیل مؤلفه های اصلی نسبت به روش تحلیل مؤلفه های مستقل کارایی بهتری می تواند داشته باشد. هم چنین، نتایج نشان داد که از بین روش های مورد استفاده در مدل سازی، روش شبکة عصبی پرسپترون چندلایه با استفاده از تحلیل مؤلفه های اصلی با ضریب تبیین 99/0، جذر میانگین مربعات خطا برابر 79/44 و ضریب ویلموت اصلاح شده برابر 99/0 بهترین عملکرد را داشته است. با توجه به این که ابعاد زیاد داده در بررسی و مدل سازی کیفیت آب باعث پیچیدگی و زمان بر بودن فرآیند مدل سازی می شود، لذا توصیه می شود از روش های کاهش بعد مانند تحلیل مولفه های اصلی برای کاهش ابعاد داده استفاده شود. نتایج حاصل از بررسی ها برتری روش تحلیل مؤلفه های اصلی نسبت به روش تحلیل مؤلفه های مستقل را نشان می دهد.