مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

1,176
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

917
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

خوشه یابی تصویر زیرکلمات در متون قدیمی و حجیم چاپی با استفاده از معیار مقایسه تصویری

صفحات

 صفحه شروع 85 | صفحه پایان 93

چکیده

 حجم زیاد تصاویر متنی روز به روز مساله دیجیتالی شدن متن تصاویر و همچنین مساله جستجو در این منابع را اهمیت می بخشد. در بازشناسی متن های حجیم می توان از ویژگی هایی مانند محدودبودن تعداد و اندازه قلم, یکسان بودن صفحه آرایی در کل صفحه ها, محدودبودن مجموعه واژه ها و حوزه معنایی آنها و یکسان بودن سبک نگارشی در کل متن استفاده کرد. در این مقاله الگوریتمی ارائه شده که از یکسان بودن نوع و اندازه قلم برای خوشه یابی زیرکلمات یک کتاب قدیمی با کیفیت پایین چاپ استفاده شده است. این کتاب 233 صفحه دارد و کل زیرکلمات آن که در حدود 111000 زیرکلمه است جداسازی و برچسب زنی شده است. در این تحقیق از یک روش ساده افزایشی برای خوشه یابی زیرکلمات استفاده شده است. ابتدا برای هر زیرکلمه چهار ویژگی ساده استخراج می شود, در صورتی که تفاوت این ویژگی ها از ویژگی های نماینده یک خوشه کمتر از مقدار آستانه باشد, مقایسه تصویری بین آن دو انجام می شود. به علت زیادبودن تعداد زیرکلمات سعی شده تا از ساده ترین روش های ممکن استفاده شود تا سرعت اجرا افزایش یابد. نتایج آزمایش ها نشان می دهد می توان زیرکلمات را با دقتی در حدود99.7  درصد خوشه یابی کرد. نتایج این خوشه یابی در مرحله بازشناسی زیرکلمات کمک بسیار زیادی خواهد کرد.

استنادها

  • ثبت نشده است.
  • ارجاعات

    استناددهی

    APA: کپی

    سهیلی، محمدرضا، و کبیر، احسان اله. (1392). خوشه یابی تصویر زیرکلمات در متون قدیمی و حجیم چاپی با استفاده از معیار مقایسه تصویری. مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر، 11(2)، 85-93. SID. https://sid.ir/paper/228474/fa

    Vancouver: کپی

    سهیلی محمدرضا، کبیر احسان اله. خوشه یابی تصویر زیرکلمات در متون قدیمی و حجیم چاپی با استفاده از معیار مقایسه تصویری. مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر[Internet]. 1392؛11(2):85-93. Available from: https://sid.ir/paper/228474/fa

    IEEE: کپی

    محمدرضا سهیلی، و احسان اله کبیر، “خوشه یابی تصویر زیرکلمات در متون قدیمی و حجیم چاپی با استفاده از معیار مقایسه تصویری،” مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر، vol. 11، no. 2، pp. 85–93، 1392، [Online]. Available: https://sid.ir/paper/228474/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button