مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله مقاله نشریه

مشخصات مقاله

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

661
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

473
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

پیوند احتمالاتی رکوردهای فارسی با داده های گم شده

صفحات

 صفحه شروع 91 | صفحه پایان 107

چکیده

 پیوند رکوردها برای شناسایی واحدهای یکسان در یک یا چند مجموعه داده لاتین در مقالات متعدد مورد بررسی قرار گرفته و روش های مناسبی ارایه شده است. اما پیوند رکوردهایی که اطلاعات آن ها به زبان فارسی ثبت شده است, به دلیل ویژگی های خاص نوشتارهای فارسی و نبود استاندارد ثبت اطلاعات, با مسایل خاصی مواجه می باشد. در این مقاله ضمن معرفی پیوند رکوردها بر اساس یک مدل احتمالاتی, روش هایی برای آماده سازی فایل ها به روش استانداردسازی و بلوک بندی و انتخاب متغیرهای شناساگر ارایه می شوند, که پیوند احتمالاتی رکوردهای فارسی را میسر سازند. برای مقابله با داده های گم شده که از جمله مسایل مهم کاربردی در پیوند رکوردها محسوب می شوند, روش جدیدی پیشنهاد شده است, که احتمال وجود داده های گم شده را نیز در مدل پیوند رکوردها لحاظ می کند. سپس نحوه برآورد پارامترهای این مدل با الگوریتم EM ارایه شده است. برای افزایش تعداد فیلدهای قابل مقایسه نیز الگوریتمی مبتنی بر افراز فیلدهای مرکب ارایه گردیده است. سپس نحوه کاربست روش های ارایه شده برای پیوند احتمالاتی رکوردهای حاصل از سرشماری های کارگاهی در یک منطقه جغرافیایی ایران, نشان داده شده است.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button