یکی از چالشها در مورد تولید علم ایران این است که آیا صرف چاپ مقاله مشکلی از مشکلات کشور را حل میکند. به همین دلیل پژوهشی توسط رفیعی خشنود و کرامت فر انجام شده که کاربردی بودن تحقیقات را در یک حوزه موضوعی بررسی کند. متن کاوی یکی از حوزههای موضوعی است که میتوان این چالش را در آن اندازه گرفت. متن کاوی یا کشف دانش از متن، اشاره به فرآیندی دارد که باعث به دست آوردن الگوهای غیر بدیهی، جالب و با کیفیت بالا و همچنین استخراج اطلاعات از متن گفته میشود. در این پژوهش، که در مجله علم سنجی کاسپین در حال انتشار است، کاربردی بودن مقاله را تمرکز بر حل مسائل در زبان فارسی تعریف شده و حل چالشهای این زبان به عنوان کاربردی بودن در این مقاله در نظر گرفته شده است. منظور از غیر کاربردی بودن مقاله، در اینجا مقالاتی هستند که بر زبان انگلیسی و یا بر سایر زبانها متمرکز هستند.
دستهبندی مقالات علمی بر اساس نوع مجله و تمرکز زبانی
به این منظور از پایگاه استنادی اسکوپوس برای مقالات بین المللی و مقالات مجلات داخلی از پایگاه مرکز اطلاعات علمی استفاده شد.
در پایگاه استنادی اسکوپوس، نویسندگان ایرانی که بیشترین تعداد مدارک علمی این حوزه موضوعی را منتشر کردهاند به ترتیب هشام فیلی دانشیار دانشکده مهندسی برق و کامپیوتر دانشگاه تهران، مهرنوش شمس فرد دانشیار دانشکده مهندسی و علوم کامپیوتر دانشگاه شهید بهشتی و مصطفی فخراحمد استادیار بخش مهندسی و علوم کامپیوتر دانشکده برق و کامپیوتر دانشگاه شیراز با انتشار 15، 13 و 10 مدرک علمی هستند. دانشگاههای تهران، صنعتی شریف و آزاد اسلامی، با انتشار 113، 47 و 44 مدرک علمی، دانشگاههایی هستند که بیشترین تعداد مدارک علمی در حوزه متن کاوی را منتشر کردهاند.
بر اساس دادههای مرکز اطلاعات علمی نیز دکتر حبیب زارع احمدآبادی با انتشار 3 مدرک علمی استادیار و عضو هیئت علمی دانشکده اقتصاد، مدیریت و حسابداری دانشگاه یزد، بیشترین تعداد مدارک علمی مرتبط با متن کاوی را نگارش کرده است.
جدول زیر تعداد مدارک علمی ایران در حوزه موضوعی متن کاوی را در پایگاه اسکوپوس و مرکز اطلاعات علمی نشان میدهد.
این پژوهش به دنبال پاسخگویی به این سوال بود که آیا مقالاتی که در مجلات بینالمللی نگارش میشوند، بر چالشهای داخلی تمرکز دارند؟ بر اساس یافتهها، مقالاتی که در مجلات بینالمللی نمایه میشوند، بیشتر از مجموعه دادههای انگلیسی استفاده کردهاند و توجه کمی به زبان فارسی دارند. در مقابل مدارک علمی منتشر شده در مجلات داخلی، بیشتر بر زبان فارسی و چالشهای آن تمرکز دارند. این مورد اهمیت توجه به مجلات داخلی و توسعه آنها را گوشزد میکند. باید توجه داشت که سوگیری محققین ایرانی به مجموعه دادههای انگلیسی مختص ایشان نیست و در سایر زبان ها نیز گزارش شده است. با این وجود مطالعه انجام شده در حوزه تحلیل احساس، نشان میدهد که این سوگیری در حوزه تحلیل احساس در میان محققین ایرانی بیشتر است. از دلایل دیگر این سوگیری میتوان به گستردگی مجموعه دادهها در زبان انگلیسی و فقدان آن در زبان فارسی اشاره کرد. در این زمینه توسعه مجموعه دادههای مختلف زبان فارسی میتواند حائز اهمیت باشد. از جمله دیگر علل میتواند ذهنیت جامعه علمی در زمینه پذیرش مقالات علمی باشد. به عبارت دیگر ممکن است محققین ایرانی تصور کنند که اگر مقاله آنها با استفاده از مجموعه دادههای فارسی نگارش شود، احتمال پذیرش مقاله در مجلات معتبر بین المللی کاهش یابد. بر اساس آمار ارائه شده در این مقاله مشخص میشود که مقالات متمرکز بر زبان انگلیسی بیشتر از مقالات متمرکز بر زبان فارسی در مجلات بینالمللی منتشر شده، اما اینکه آیا این مقادیر نشان دهنده احتمال پذیرش مقالات است محل سوال است چرا که نسبت مذکور در مورد ارسال مقالات برای ما روشن نیست. بنابراین صحت یا عدم صحت این مورد نیاز به پژوهشهای آتی دارد. همچنین یافتههای مقاله حاضر نشان میدهد که مقالات بینالمللی متمرکز بر زبان انگلیسی استناد بیشتری نسبت به مقالات بینالمللی متمرکز بر زبان فارسی دریافت میکنند. این مورد خود دلیل دیگری بر توجه جامعه علمی به مجموعه دادههای انگلیسی است، چرا که نشان میدهد جامعه علمی بینالمللی پذیرش بهتری نسبت به مقالات مبتنی بر مجموعه دادههای انگلیسی دارد. همچنین مقایسه تعداد کلی مقالات منتشر شده در مجلات بینالمللی در مقایسه با مجلات داخلی میتواند نشاندهنده رجحان انتشار در مجلات بینالمللی در مقایسه با مجلات داخلی برای محققین ایرانی باشد. بر اساس نتایج پژوهش آزادی از آنجا که محققان ایرانی به شدت در انتشار مجلات علمی (خارجی) انگیزه دارند (به دلیل ارتقاء علمی و غیره)، اغلب توجه کم یا ناچیزی به نیازهای فکری و فنی کشور می شود. آنها تقریبا فقط بر قابل انتشار بودن آثار خود تمرکز میکنند (چنانچه پیشتر ذکر شد). همچنین، تعداد کمی از مقالات (در برخی از رشتهها) هیچ تحلیل جامع و دارای چشم انداز از برخی بحران های شدید کشور را ارائه نمی دهند. در نهایت میتوان چنین گفت، صرف چاپ مقالات در نمایههای بینالمللی اگرچه سبب ارتقا دانش و مهارت محققین خواهد شد، نمیتواند به صورت مستقیم مشکلات کشور را بر طرف کند. یکی دیگر از دلایل عدم توجه به مجموعه دادههای فارسی میتواند شکاف میان جامعه علمی و بخش صنعت باشد. بار اصلی تولید علم را دانشگاههای کشور به دوش میکشند و همانند بسیاری از کشورهای در حال توسعه تعامل بین پژوهشگران دانشگاهها و سازمانهای صنعتی ایران ضعیف و ناپایدار است.
رفیعی خشنود محدثه، کرامتفر عبدالصمد. مقایسه تحلیلی مدارک علمی ایران در حوزه موضوعی متنکاوی. مجله علم سنجی کاسپین. 1401; 9 (1) :116-104
منابع:
Keramatfar A, Nourmohammadi H. Applied Bibliometrics. Tehran: Ketabdar; 1394 [In Persian].
Keramatfar A, Amirkhani H. Bibliometrics of sentiment analysis literature. Journal of Information Science. 2019;45(1):3-15.
RUDER S. Why You Should Do NLP Beyond English 2020 [Available from: https://ruder.io/nlp-beyond-english/.
Keramatfar, A., Rafiee, M., & Amirkhani, H. (2022). Graph Neural Networks: a bibliometrics overview. arXiv preprint arXiv:2201.01188.