مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

video

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

sound

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

نسخه انگلیسی

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید:

472
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

دانلود:

743
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد:

اطلاعات مقاله نشریه

عنوان

ارائه روشی ساختار محور برای ایجاد پایگاه داده از تصاویر مستخرج از اسناد علمی: مورد مطالعه پایگاه اطلاعات علمی ایران (گنج)

صفحات

 صفحه شروع 729 | صفحه پایان 754

چکیده

 تصاویر موجود در مدارک علمی غالبا حاوی اطلاعات مهمی هستند. اولین قدم برای بازیابی اطلاعات از این تصاویر ایجاد یک پایگاه داده معتبر از آن ها است. برای این منظور در این مقاله سیستمی خودکار برای ایجاد پایگاه داده از تصاویر موجود در مدارک علمی فارسی در مقیاس بزرگ ارایه می شود. این سیستم پیشنهادی در نتیجه مطالعات اسنادی طراحی شده و بخش های مختلفی دارد. در مرحله اول باید تصاویر و توضیح متنی آن ها استخراج گردد. به طور کلی دو رویکرد برای استخراج تصاویر و توضیح متنی آن ها از فایل وجود دارد. در رویکرد اول فایل به تصویر تبدیل می شود و از تکنیک های پردازش تصویر برای استخراج اطلاعات گرافیکی استفاده می شود. رویکرد دوم بر اساس پردازش ساختار و آرایش خود فایل است. از آنجایی که روش دوم از لحاظ سرعت و قابلیت مقیاس پذیری برای استفاده در موتورهای جستجو مناسب تر است, تمرکز این مقاله بر روی روش دوم است. بدین ترتیب برای استخراج تصاویر و توضیح متنی آن ها از یک روش ساختار محور استفاده می شود که مبتنی بر چیدمان و آرایش فایل ورد سند است. در نتیجه, مجموعه ای از تصاویر به همراه توضیحات و اطلاعات مربوط به آن ها به دست می آید که باید در یک پایگاه داده تصاویر با ساختاری مشخص ذخیره گردند. سپس این اطلاعات برای بازیابی و استفاده های آتی در یک موتور جستجو نمایه خواهند شد. روش پیشنهادی در زبان برنامه نویسی پایتون پیاده سازی شد و برای ارزیابی کارایی آن از روش مرسوم پردازش فایل پی دی اف اسناد کمک گرفته شد. سپس روش پیشنهادی در یک مطالعه موردی در پایگاه اطلاعات علمی ایران (گنج) به کار گرفته شد. تعداد 150 مدرک علمی به تصادف از پایگاه گنج انتخاب شده و با کمک این دو روش مورد تجزیه و تحلیل قرار گرفت. بنا به یافته های پژوهش دیده می شود که استخراج اطلاعات متنی از فایل پی دی اف در زبان فارسی با چالش های زیادی روبرو است و نمی تواند خروجی مناسبی در این زمینه حاصل کند. از طرف دیگر میزان تصاویر نامطلوب تولید شده از فایل پی دی اف بسیار زیاد است که از کاربست پذیری آن در شرایط واقعی می کاهد. از این رو روش پیشنهادی به عنوان گزینه ای مناسب برای استخراج تصویر و توضیحات آن ها از اسناد علمی در زبان فارسی و ایجاد پایگاه داده از آن ها پیشنهاد می شود. روش پیشنهادی قادر است حدود 40 درصد تصاویر را همراه با زیرنویس مربوطه بدون خطا استخراج کند؛ که نسبت به روش پایه که قادر به استخراج 30 درصد از تصاویر است, کارآیی بهتری دارد.

استنادها

  • ثبت نشده است.
  • ارجاعات

  • ثبت نشده است.
  • استناددهی

    APA: کپی

    فخرزاده، آزاده، و صدیقی، امیرحسین. (1399). ارائه روشی ساختار محور برای ایجاد پایگاه داده از تصاویر مستخرج از اسناد علمی: مورد مطالعه پایگاه اطلاعات علمی ایران (گنج). پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)، 35(3 )، 729-754. SID. https://sid.ir/paper/131117/fa

    Vancouver: کپی

    فخرزاده آزاده، صدیقی امیرحسین. ارائه روشی ساختار محور برای ایجاد پایگاه داده از تصاویر مستخرج از اسناد علمی: مورد مطالعه پایگاه اطلاعات علمی ایران (گنج). پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)[Internet]. 1399؛35(3 ):729-754. Available from: https://sid.ir/paper/131117/fa

    IEEE: کپی

    آزاده فخرزاده، و امیرحسین صدیقی، “ارائه روشی ساختار محور برای ایجاد پایگاه داده از تصاویر مستخرج از اسناد علمی: مورد مطالعه پایگاه اطلاعات علمی ایران (گنج)،” پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات)، vol. 35، no. 3 ، pp. 729–754، 1399، [Online]. Available: https://sid.ir/paper/131117/fa

    مقالات مرتبط نشریه ای

    مقالات مرتبط همایشی

  • ثبت نشده است.
  • طرح های مرتبط

  • ثبت نشده است.
  • کارگاه های پیشنهادی






    بازگشت به بالا
    telegram sharing button
    whatsapp sharing button
    linkedin sharing button
    twitter sharing button
    email sharing button
    email sharing button
    email sharing button
    sharethis sharing button