خوشه بندی به صورت گسترده جهت بهبود کارایی سیستمهای سنتی بازیابی اسناد که خروجی آنها به صورت یک لیست می باشد مورد استفاده قرار گرفته است. اساس این روش بر فرضیه خوشه بندی استوار است. طبق این فرضیه، اسناد مرتبط با یک پرسش شباهت بیشتری نسبت به اسناد نامرتبط دارند و احتمالا در یک خوشه قرار می گیرند. بدین ترتیب یک جفت سند دارای یک شباهت عمومی (بدون در نظر گرفتن پرسش) ویک شباهت خاص (با در نظر گرفتن پرسش) می باشند. معیارهای شباهت حساس به پرسش مکانیزمهایی جهت اندازه گیری شباهت دو سند تحت یک پرسش خاص می باشند. در این مقاله به منظور معرفی یک معیار جدید از این نوع، در قدم اول منابع اطلاعاتی که می تواند بدین منظور مورد استفاده قرار گیرد شناسایی می شوند. در قدم دوم با استفاده از تلفیق منابع شناسایی شده معیار پیشنهادی عرضه می شود. در انتها، یک معیار پارامتری نیز با استفاده از جمع وزنی منابع شناسایی شده معرفی می شود. الگوریتم ژنتیک به منظور یادگیری مقادیر بهینه پارامترها برای یک مجموعه سند خاص مورد استفاده قرار می گیرد. انگیزه استفاده از این مکانیزم پیدا کردن معیاری است که برای یک مجموعه سند خاص از معیار پیشنهادی این مقاله بهتر عمل کند. ارزیابی معیارهای پیشنهادی با استفاده از چند مجموعه اسناد استاندارد صورت می گیرد و نتایج با معیارهای مطرح شده توسط سایر محققان مقایسه می شود.