این طرح در پی به دست آوردن آمارهایی در زبان فارسی است که هر یک به نحوی طراحی یک سیستم ارتباطی مطمئن، در سیستم های رمزکننده فراهم می سازند و امکان ارائه روشی برای فشرده سازی اطلاعات را به وجود می آورند. نظر به اینکه روش های معمول در طراحی سیستم های ارتباطی (بخش نمایه سازی) مبتنی بر تحقیقات زبان شناسی بر روی زبان های خارجی است و با توجه به این که معیارهای زبان فارسی از برخی جهات متفاوت با این زبان ها می باشد، لذا باید در ابتدا با استفاده از مدل های ریاضی مناسب بر روی زبان فارسی تحقیقات لازم انجام گیرد و سپس اطلاعات مورد نیاز، استنتاج شوند. خلاصه ای از فعالیت های انجام شده و نتایج حاصل عبارتند از: - مطالعات کلی در مورد مساله زبان شناسی - مطالعه مدل های ریاضی مربوط و جمع آوری مقالات نوشته شده در این زمینه (از جمله مقالات شانون) - فراگیری زبان «SNOBOL» به منظور نوشتن برنامه های کامپیوتری مربوط بر روی کامپیوتر «CDC» که در این قسمت تهیه و نگارش دستورالعمل این زبان برای استفاده سایر پژوهشگران انجام شده است. - نوشتن برنامه های مورد نیاز - تهیه دستورالعمل وارد کردن اطلاعات بر روی دیسک (با توجه به اصول نمونه گیری در آمار).