گویش شناسی به مطالعۀ علمی یک گویش و توزیع جغرافیایی آن می پردازد. هر گویش یک زبان است و مطالعۀ یک گویش به تحلیلهای بسیار زیادی نیاز دارد که همین امر به طولانیشدن مدت انجام مطالعات مربوط به یک گویش میانجامد. گردآوری دادههای گویشی بسیار پرزحمت و زمان بر است. از اینرو، نیاز است این داده بهگونهای تهیه شود تا قابلیت استفادۀ مجدد در بررسیهای آتی را داشته باشد. دادۀ خام کارایی چندانی در مطالعات گویش شناسی ندارد و نیاز است در چارچوب روش تحلیل زبانشناسی ساختگرایی، تحلیلهای زبانشناختی به آن اضافه گردد. باتوجهبه حجم زیاد داده گویشی در طرحهایی مانند تهیه اطلس گویش های یک کشور و تحلیلهای زبان شناختی اضافهشده به آن، به ساماندهی دادۀ گویشی نیاز است. استفاده از رایانه بهعنوان یک ابزار موجب میشود داده براساس ساختار مشخصی انتظام یابد. هدف اصلی این پژوهش، معرفی یک استاندار برای سازماندهی داده ها و اطلاعات گویشی است. این استاندارد حاوی دادۀ گویشی، فرادادههای مربوط به آن گویش و همچنین اطلاعات زبانشناختی حاصل از تحلیل دادۀ گویشی است. این اطلاعات براساس ساختار دادۀ درختی و زبان نشانه گذاری گسترش پذیر سازماندهی میگردد. این ساختار داده، قابلیت جابهجایی داشته و میتواند بهسادگی به درون یک پایگاه داده خوانده شود.