این مقاله، یک روش آماری ترکیبی، برای استخراج کلمات کلیدی 1 اسناد فارسی، پیشنهاد کرده است. روش پیشنهادی مبتنی بر پیکره متنی 2 می باشد. ابتدا عمل ریشه یابی و حذف کلمات عمومی 3 انجام می گیرد. سپس ویژگی های آماری برای کلمات مختلف محاسبه شده و با استفاده از فازی سازی و اعمال قواعد فازی، کلمات کلیدی محتمل، انتخاب می شوند. گام بعدی محاسبه رخداد همزمان 4 پیشین و پسین کلمات کلیدی محتمل، با کلمات تکرار شونده، 5 در جملات سند است. با اعمال یک آستانه وفقی 6 روی رخداد همزمان کلمات، کلمات کلیدی دو کلمهای را مشخص می کنیم. بر خلاف اکثر روش های آماری که فقط کلمات کلیدی یک کلمه ای را استخراج می کنند، استفاده از این روش کلمات کلیدی دو کلمه ای نیز استخراج می شوند. استفاده از ترکیب روش فازی و رخداد همزمان کلمات بهبود خوبی را نشان می دهد و کلمات کلیدی بامعنی تری پیشنهاد می کند.