فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی






متن کامل


اطلاعات دوره: 
  • سال: 

    1399
  • دوره: 

    8
  • شماره: 

    2 (پیاپی 30)
  • صفحات: 

    105-114
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1073
  • دانلود: 

    269
چکیده: 

با رشد روز افزون اسناد و متون الکترونیکی به زبان فارسی، به کارگیری روش هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می یابد. برای رسیدن به این هدف، استخراج کلمات کلیدی که بیانگر مضمون اصلی متن باشند، روشی بسیار موثر است. تعداد تکرار یک کلمه در متن نمی تواند نشان دهنده اهمیت یک کلمه و کلیدی بودن آن باشد. همچنین در اکثر روش های استخراج کلمات کلیدی مفهوم و معنای متن نادیده گرفته می شوند. از طرفی دیگر بدون ساختار بودن متون جدید در اخبار و اسناد الکترونیکی، استخراج این کلمات را مشکل می سازد. در این مقاله روشی بدون نظارت و خودکار برای استخراج این کلمات در زبان فارسی که دارای ساختار مناسبی نمی باشد، پیشنهاد شده است که نه تنها احتمال رخ دادن کلمه در متن و تعداد تکرار آن را در نظر می گیرد، بلکه با آموزش مدل Word2vec روی متن، مفهوم و معنای متن را نیز درک می کند. در روش پیشنهادی که روشی ترکیبی از دو مدل آماری و یادگیری ماشین می باشد، پس از آموزش Word2vec روی متن، کلماتی که با سایر کلمات دارای فاصله کمی بوده استخراج شده و سپس با استفاده از هم رخدادی و فرکانس رابطه ای آماری برای محاسبه امتیاز پیشنهاد شده است. درنهایت با استفاده از حدآستانه کلمات با امتیاز بالاتر به عنوان کلمه کلیدی در نظر گرفته می شوند. ارزیابی ها بیانگر کارایی روش با معیار F برابر 53. 92% و با 11% افزایش نسبت به دیگر روش های استخراج کلمات کلیدی می باشد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1073

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 269 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

Abdolahi Mohammad | ZAHEDI MORTEZA

اطلاعات دوره: 
  • سال: 

    2019
  • دوره: 

    10
  • شماره: 

    2
  • صفحات: 

    87-96
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    142
  • دانلود: 

    0
چکیده: 

Word embeddings (WE) have received much attention recently as word to numeric vectors architec-ture for all text processing approaches and has been a great asset for a large variety of NLP tasks. Most of text processing task tried to convert text components like sentences to numeric matrix to apply their processing algorithms. But the most important problems in all word vector-based text processing approaches are di erent sentences size and as a result, di erent dimension of sentences matrices. In this paper, we suggest an e cient but simple statistical method to convert text sen-tences into equal dimension and normalized matrices Proposed method aims to combines three most e cient methods (averaging based, most likely n-grams, and words mover distance) to use their advantages and reduce their constraints. The unique size resulting matrix does not depend on lan-guage, Subject and scope of the text and words semantic concepts. Our results demonstrate that normalized matrices capture complementary aspects of most text processing tasks such as coherence evaluation, text summarization, text classi cation, automatic essay scoring, and question answering.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 142

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1400
  • دوره: 

    18
  • شماره: 

    1 (پیاپی 47)
  • صفحات: 

    51-60
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    245
  • دانلود: 

    90
چکیده: 

واژگان کلیدی لغات مهمی از سند هستند که بیان گر توصیفی از متن هستند و نقش بسیار مهمی در فهم دقیق و سریع از محتوا دارند. شناسایی واژگان کلیدی از متن با روش های معمول کاری زمان بر و پرهزینه است. در این مقاله ابتدا با استفاده از شبکه عصبی پیشرو و از طریق الگوریتم Word2vec ماتریس همبستگی واژگان را به ازای یک سند محاسبه و سپس با استفاده از ماتریس همبستگی و یک فهرست اولیه محدود از واژگان کلیدی، نزدیک ترین واژگان را از نظر شباهت در قالب فهرست نزدیک ترین همسایگی ­ ها استخراج می کنیم. فهرست به دست آمده را به صورت نزولی مرتب و از ابتدای فهرست، درصدهای مختلفی از واژگان را انتخاب و به ازای هر درصد، ده مرتبه فرایند آموزش شبکه عصبی و ساخت ماتریس همبستگی و استخراج فهرست نزدیک ترین ­ همسایگی ­ ها را تکرار و در نهایت میانگین دقت، فراخوانی و معیارF را محاسبه می کنیم. این کار را تا جایی ادامه می ­ دهیم که به بهترین نتایج در ارزیابی دست یابیم؛ نتایج نشان می­ دهند که به ازای انتخاب حداکثر چهل درصدِ واژگان از ابتدای فهرستِ نزدیک ترین همسایگی­ ها، نتایج مورد قبولی به دست می ­ آید. الگوریتم بر روی پیکره ای با هشتصد خبر که به صورت دستی واژگان کلیدی آن ها را استخراج کرده ایم، آزمایش شده است و نتایج آزمایش ها نشان می دهد که دقت روش پیشنهادی 78 درصد خواهد بود.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 245

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 90 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
نویسندگان: 

نشریه: 

BEHAVIOR RESEARCH METHODS

اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    53
  • شماره: 

    5
  • صفحات: 

    2214-2225
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    18
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 18

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسنده: 

Hosseini Moghadam Emami Zahra Sadat | Tabatabayi seifi Shohreh | IZADI MOHAMMAD | Tavakoli Mohammad

اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    7
تعامل: 
  • بازدید: 

    294
  • دانلود: 

    0
چکیده: 

Text processing, as one of the main issues in the field of artificial intelligence, has received a lot of attention in recent decades. Numerous methods and algorithms are proposed to address the task of semantic textual similarity which is one of the sub-branches of text processing. Due to the special features of the Persian language and its non-standard writing system, finding semantic similarity is an even more challenging task in Persian. On the other hand, producing a proper corpus that can be used for training a model for finding semantic similarities, is of great importance. In this study, the main purpose is to propose a method for measuring the semantic similarity between short Persian texts. To do so, first, we try to build an appropriate corpus, and then propose an efficient approach based on neural networks. The proposed method involves three steps. The first step is data collection and building a parallel corpus. In the next step, namely the pre-processing step, the data is normalized. Finally, Semantic similarity recognition is done by the neural network using vector representations of the words. The suggested model is built upon the produced corpus made of movie and tv show subtitles containing 35266 sentence pairs. The F-measure of the proposed approach on PAN2016 is 75. 98% with 4 tags and 98. 87% with 2 tags. We also achieved an F-measure of 98. 86% for our model tested on the parallel corpus with 2 tags.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 294

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    19
  • شماره: 

    1
  • صفحات: 

    115-124
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    68
  • دانلود: 

    8
چکیده: 

برای انجام مطالعات داده کاوی، تاحدودی به دلیل پیچیده بودن فرآیند انتخاب ویژگی در کار مورد نظر، نیاز داریم تا بخشی از برچسب زنی را به کارگران در فعالیت جمع ­سپاری واگذار کنیم. فرآیند واگذاری کارهای داده کاوی به کاربران، اغلب به وسیله سامانه های نرم افزاری و بدون اطلاع دقیق از موقعیت سنی یا جغرافیای محل سکونت کاربران صورت می گیرد. عدم اطمینان از عملکرد کاربران مجازی در جمع­ سپاری، میزان صحت اطلاعات دریافتی را کاهش می دهد. در این مقاله پیشنهاد داده ایم تا با استفاده از روش های ایجاد انگیزش، تعدادی از مردم را در محلی جمع و از آنها در جهت وظایف جمع­ سپاری استفاده کنیم. افزایش دقت در اعلام نتایج به دلیل حضور فیزیکی، سرعت بالا در گرفتن نتایج با دقت بالا در زمان تعیین شده، تحصیلات مناسب شرکت کنندگان در فعالیت و بومی بودن طرح اجرایی از ویژگی­ های این پژوهش هستند. در این پژوهش یک کار یادگیری ماشین انجام شد تا بتوانیم در ضمن آن فعالیت­ های جمع سپاری را با الگوریتم ­های شبکه عصبی عمیق ترکیب نماییم. وظیفه کلاس بندی برای تعبیه لغات به صورت الگوریتمی و تلفیقی با کمک جمع سپاری انجام می ­شود. روش پیشنهادی با افزودن داده های جمع سپار به داده های قبلی و تغییرات در مدل تعبیه لغات ترکیبی گلاو و وردتووک توانست نتایج مناسبی را در استخراج ویژگی به دست بیاورد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 68

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 8 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    2022
  • دوره: 

    11
  • شماره: 

    3
  • صفحات: 

    25-33
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    48
  • دانلود: 

    0
چکیده: 

Heusler alloys are intermetallic that offer a unique and broad array of properties. These properties are both scientifically intriguing and valuable for a variety of beneficial practical applications. One of these applications is magnetic cooling, taking advantage of the giant magnetocaloric effect (GMCE) in some Heusler alloys. Since the late 1990s, numerous scientific papers were published, attempting to harness Heusler alloys for green refrigeration. Manufacturing the alloys by additive manufacturing further offers control and enables tuning of their properties by controlling their microstructure. Although the scientific literature contains extensive information on these alloys’,chemistry and performance, it is the massive volume of scientific papers that makes it difficult, if not impossible, to keep up to date with relevant discoveries. To enable predicting the composition of excellent performing giant magnetocaloric Heusler alloys, manufactured by laser powder bed fusion (LPBF), we employed artificial intelligence, specifically unsupervised learning in the current work. We trained an unsupervised learning model using word embedding and the Word2vec algorithm on different data sets in the literature to extract hidden knowledge, relations, and interactions based on words that appear in similar contexts in the text while often having similar meanings. Properties inherent to giant magnetocaloric materials were addressed in the model. The outcome was the prediction of Heusler alloys, manufactured by LPBF, with an excellent giant magnetocaloric effect.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 48

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1398
  • دوره: 

    49
  • شماره: 

    3 (پیاپی 89)
  • صفحات: 

    1345-1357
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    528
  • دانلود: 

    151
چکیده: 

بازیابی تصویر مبتنی بر محتوا استفاده از روش های بینایی ماشین برای بازیابی تصاویری از یک مجموعه است که به تصویر پرس وجو شبیه باشند. چالش اصلی این سیستم ها کاهش شکاف معنایی بین ویژگی های سطح پایین مستخرج از پیکسل و قطعه تصویر و مفاهیم سطح بالای موجود در آن است. یکی از روش های کاهش این فاصله استفاده از ویژگی های سطح بالای مستخرج از نواحی و اشیا برای بازیابی است. از طرفی ویژگی های سطح پایین نیز تمایز خوبی بین خود تصاویر اعمال می کنند. بر این اساس انتظار می رود استفاده از هر دو دسته ویژگی به نتایج بهتری منجر شود. در این پژوهش بازیابی تصویر در چهار سطح پیکسل، ناحیه، شیء و مفهوم انجام شده است و از همجوشی نتایج این سطوح به منظور کاهش شکاف معنایی استفاده شده است. در سطح پیکسل، از ویژگی های SIFT و LBP استفاده شده است. در سطح ناحیه، ابتدا تصویر به چند ناحیه افراز و سپس ویژگی های رنگ و بافت با استفاده از توصیفگر Hue و فیلتر گابور از هر یک از نواحی تصویر استخراج شده است. در سطح شیء از شبکه عصبی کانولوشنی AlexNet برای بازشناسی اشیاء و صحنه های درون تصویر و در سطح مفهوم از شبکه عصبی Word2vec برای سنجش شباهت معنایی تصاویر استفاده شده است. نتایج بازیابی روی دو پایگاه داده Wang و GHIM نشان دهنده بهبود دقت و فراخوانی در بازیابی تصویر است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 528

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 151 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسنده: 

Tanzifi Reza | MAHDAVI IRAJ

اطلاعات دوره: 
  • سال: 

    2017
  • دوره: 

    13
تعامل: 
  • بازدید: 

    179
  • دانلود: 

    0
چکیده: 

SOCIAL MEDIA WEBSITES CAPTURED WEB SPACE. THE MEMBERS OF THESE MEDIA'S INCREASING DAILY. WITH THE DATA SHARED BY PEOPLE, RESEARCHERS TRY TO USE THEM IN A PROPER WAY TO HELP RECOMMENDER SYSTEMS. ONE OF THE HOT RESEARCH AREAS IS USER INTEREST DETECTION. INTELLIGENT WEB SYSTEMS TRY TO EXTRACT USER PRIMITIVE INTEREST FROM CONTENTS WHICH ARE SHARED BY USERS. WHILE MOST OF THE WORKS CONCENTRATE ON EXTRACTING USER INITIAL INTEREST, LESS ATTEMPT DEDICATED TO UNDERSTANDING LATENT ONES. IN THIS PAPER, WE DEMONSTRATE HOW WORD EMBEDDING METHODS COULD HELP US TO ENRICH USER INTERESTS PROFILE. WE GENERATING STATE-OF-ART USER INTEREST MODELING WHICH DEPLOYS Word2vec METHOD FOR ENRICHING USER INITIAL INTERESTS THAT EXTRACTED FROM USER'S TWITTER ACCOUNT. OUR EXPERIMENTAL RESULTS DEMONSTRATE THAT USING SEMANTIC SIMILARITY MEASURES, ESPECIALLY WHEN USING WORD EMBEDDING METHODS, OUTPERFORM TRADITIONAL METHODS. EMPIRICAL RESULTS SHOW THAT ENRICHING USER INTEREST PROFILE LEADS TO BETTER PERSONALIZED CONTENT BASED RECOMMENDATION.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 179

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
نویسندگان: 

چاوش نرجس | عمادی سیما

اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    1
  • شماره: 

    1
  • صفحات: 

    108-115
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    40
  • دانلود: 

    0
چکیده: 

امروزه به دلیل وجود حجم انبوه نظرات منتشرشده توسط افراد در فضای مجازی، تحلیل احساسات نقش اساسی را در استخراج اطلاعات بازی می-کند. یکی از تکنیکهای نوین براساس مطالعات انجام شده به منظور تعیین دقیق تر قطبیت جمله در تحلیل احساسات مبتنی بر الگوریتم های یادگیری عمیق است. در این تحقیق به منظور تعیین قطبیت نظرات متنی از الگوریتم یادگیری عمیق LSTM و RNN استفاده شده است تا با بررسی و مقایسه این دو الگوریتم بتوان الگوریتم مناسب برای تحلیل احساسات را انتخاب نمود. همچنین در روش پیشنهادی برای تعیین روابط معنایی بین کلمات از روش تعبیه گذاری کلمات از پیش آموزش داده شده ی Wordtovec استفاده شد تا دقت روش پیشنهادی افزایش یابد. روش پیشنهادی بر روی دو مجموعه داده airline-tweet و IMDB ارزیابی شد. نتایج ارزیابی نشان می دهد که روش پیشنهادی بر روی مجموعه داده airline-tweet در صورت استفاده از تعبیه گذاری Wordtovec دقت 78/0 دارد. همچنین روش پیشنهادی بر روی مجموعه داده IMDB در صورت استفاده از تعبیه گذاری Wordtovec دقت 84/0 دارد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 40

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button