فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی








متن کامل


اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    22
  • شماره: 

    1
  • صفحات: 

    21-29
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    81
  • دانلود: 

    14
چکیده: 

رتبه بندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستم های بازیابی اطلاعات ایفا می کند. این مقاله یک رویکرد جدید برای رتبه بندی اسناد با استفاده از مدل های درون سازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبه بندی ارائه می کند. رویکرد پیشنهادی از روش های درون سازی واژگان برای به تصویرکشیدن نمایش های معنایی پرس وجوهای کاربر و محتوای سند استفاده می کند. با تبدیل داده های متنی به بردارهای معنایی، ارتباط و شباهت بین پرس و جوها و اسناد تحت روابط رتبه بندی پیشنهادی با هزینه کمتر مورد ارزیابی قرار می گیرد. روابط رتبه بندی پیشنهادی عوامل مختلفی را برای بهبود دقت در نظر می گیرند که این عوامل شامل بردارهای درون سازی واژگان، مکان واژگان کلیدی و تأثیر واژگان باارزش در رتبه بندی بر مبنای بردارهای معنایی است. آزمایش ها و تحلیل های مقایسه ای برای ارزیابی اثربخشی روابط پیشنهادی اعمال گردیده است. نتایج تجربی، اثربخشی رویکرد پیشنهادی را با دستیابی به دقت بالاتر در مقایسه با روش های رتبه بندی رایج نشان می دهند. این نتایج بیانگر آن مسئله است که استفاده از مدل های درون سازی و ترکیب آن در روابط رتبه بندی پیشنهادی به طور قابل توجهی دقت رتبه بندی را تا 87/0 در بهترین حالت بهبود می بخشد. این بررسی به بهبود رتبه بندی اسناد کمک می کند و پتانسیل مدل درون سازی BERT را در بهبود عملکرد رتبه بندی نشان می دهد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 81

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 14 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    8
  • شماره: 

    2
  • صفحات: 

    1-18
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    39
  • دانلود: 

    0
چکیده: 

In recent years, Question Answering systems have become more popular and widely used by users. Despite the increasing popularity of these systems, their performance is not even sufficient for textual data and requires further research. These systems consist of several parts that one of them is the Answer Selection component. This component detects the most relevant answer from a list of candidate answers. The methods presented in previous researches have attempted to provide an independent model to undertake the answer-selection task. An independent model cannot comprehend the syntactic and semantic features of questions and answers with a small training dataset. To fill this gap, language models can be employed in implementing the answer selection part. This action enables the model to have a better understanding of the language in order to understand questions and answers better than previous works. In this research, we will present the 'BAS' stands for BERT Answer Selection that uses the BERT language model to comprehend language. The empirical results of applying the model on the TrecQA Raw, TrecQA Clean, and WikiQA datasets demonstrate that using a robust language model such as BERT can enhance the performance. Using a more robust classifier also enhances the effect of the language model on the answer selection component. The results demonstrate that language comprehension is an essential requirement in natural language processing tasks such as answer selection.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 39

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

DAS A. | GANTAIT S. | MANDAL N.

اطلاعات دوره: 
  • سال: 

    2011
  • دوره: 

    6
  • شماره: 

    -
  • صفحات: 

    40-48
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    169
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 169

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    21
  • شماره: 

    2
  • صفحات: 

    89-100
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    233
  • دانلود: 

    36
چکیده: 

استفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که می تواند به فهم بهتر آن عبارت منجر گردد. در سال های اخیر، مدل های زبانی از پیش آموزش یافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آوده اند. در این راستا مدل های مبتنی بر ترنسفورمر مانند الگوریتم BERT از محبوبیت فزاینده ای برخوردار گردیده اند. این مسئله در زبان فارسی کمتر مورد بررسی قرار گرفته و به عنوان یک چالش در حوزه وب فارسی مطرح می گردد. بنابراین در این مقاله، درون سازی واژگان فارسی با استفاده از این الگوریتم مورد بررسی قرار می گیرد که به درک معنایی هر واژه بر مبنای بافت متن می پردازد. در رویکرد پیشنهادی، مدل ایجادشده بر روی مجموعه دادگان وب فارسی مورد پیش آموزش قرار می گیرد و پس از طی دو مرحله تنظیم دقیق با معماری های متفاوت، مدل نهایی تولید می شود. در نهایت ویژگی های مدل استخراج می گردد و در رتبه بندی اسناد وب فارسی مورد ارزیابی قرار می گیرد. نتایج حاصل از این مدل، بهبود خوبی نسبت به سایر مدل های مورد بررسی دارد و دقت را نسبت به مدل برت چندزبانه تا حداقل یک درصد افزایش می دهد. همچنین اعمال فرایند تنظیم دقیق با ساختار پیشنهادی بر روی سایر مدل های موجود توانسته به بهبود مدل و دقت درون سازی بعد از هر فرایند تنظیم دقیق منجر گردد. نتایج رتبه بندی بر مبنای مدل های نهایی، بیانگر بهبود دقت رتبه بندی وب فارسی نسبت به مدل های پایه مورد ارزیابی با افزایش حدود 5 درصدی دقت در بهترین حالت است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 233

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 36 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    2024
  • دوره: 

    10
تعامل: 
  • بازدید: 

    77
  • دانلود: 

    0
چکیده: 

The fake news story refers to information falsified or made up to manipulate or deceive the public. It is a serious issue that undermines the credibility of information sources and influences public opinion, discourse, and important decisions and outcomes. The content and source of news articles and stories must be considered when identifying and classifying fake news. Detecting fake news is an important and active research area with many potential applications and implications for society. Many challenges are involved in determining whether a news article is authentic. Several deep learning models that employ natural language processing (NLP) have shown excellent results in detecting fake news. To assess the truthfulness of news articles, our methodology is based on state-of-the-art language models based on transformers. Bidirectional Encoder Representation from Transformers (BERT) and Robustly Optimized BERT Technique (RoBERTa) is one of the most advanced models. Our findings reveal that the BERT model achieved an accuracy of 64%, while the RoBERTa model slightly outperformed it with an accuracy of 66%. These results are particularly significant when compared to similar research in this domain, which reported a maximum accuracy of 62% for both models on Liar dataset.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 77

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
نویسنده: 

Kaviani Mohadeseh | RAHMANI HOSSEIN

اطلاعات دوره: 
  • سال: 

    2020
  • دوره: 

    6
تعامل: 
  • بازدید: 

    155
  • دانلود: 

    0
چکیده: 

Social media like Twitter have become very popular in recent decades. Hashtags are new kind of metadata which make non-structured tweets into searchable semistructured content. There are varied previous methods which recommend hashtags for new tweets. However, to the best of our knowledge, there is no previous word that uses BERT embedding for this purpose. In this paper, we propose a new method called EmHash that uses neural network based on BERT embedding to recommend new hashtags for each tweet. Unlike other word embeddings, BERT embedding constructs different vectors for the same word in different contexts. Emhash succeeded in outperforming three methods LDA, SVM, and TTM with respect to recall measure.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 155

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    2020
  • دوره: 

    6
تعامل: 
  • بازدید: 

    114
  • دانلود: 

    0
چکیده: 

Community Question-Answering websites, such as StackOverflow and Quora, expect users to follow specific guidelines in order to maintain content quality. These systems mainly rely on community reports for assessing contents, which has serious problems, such as the slow handling of violations, the loss of normal and experienced users' time, the low quality of some reports, and discouraging feedback to new users. Therefore, with the overall goal of providing solutions for automating moderation actions in Q&A websites, we aim to provide a model to predict 20 quality or subjective aspects of questions in QA websites. To this end, we used data gathered by the CrowdSource team at Google Research in 2019 and fine-tuned pre-trained BERT model on our problem. Based on our evaluation, model achieved value of 0. 046 for Mean-Squared-Error (MSE) after 2 epochs of training, which did not improve substantially in the next ones. Results confirm that by simple fine-tuning, we can achieve accurate models in little time and on less amount of data.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 114

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
نویسنده: 

Kanani Mohammad Amin | AMINIAN MAHDI

اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    7
تعامل: 
  • بازدید: 

    183
  • دانلود: 

    0
چکیده: 

Intent classification is one of the important tasks in natural language understanding which aims to classify queries based on their intent, goal, or purpose which is implied in the content. However, the problem in this task is the lack of data labeled by a human agent. This problem leads to weakness in the generalization of models, especially when the models face rare words. Using pre-trained models can be useful in the generalization of language representation. BERT pre-trained language model which has been currently published has made a major impact in the natural language processing field. This model which is trained on unlabeled large-scale corpora, with fine-tuning could achieve state-of-art results in various natural language processing tasks e. g. question answering and sentiment analysis. In this paper, we compared the BERT model with conventional machine learning models and shown that the BERT model has a better performance than conventional machine learning models in few-shot learning.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 183

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
نشریه: 

کارافن

اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    20
  • شماره: 

    1
  • صفحات: 

    341-362
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    112
  • دانلود: 

    36
چکیده: 

مدل های زبانی آموزش دیده، به دلیل کاربرد آن ها در مسائل مرتبط با حوزه پردازش زبان های طبیعی دارای اهمیت فراوانی هستند. مدل های زبانی مانند BERT از محبوبیت بیشتری میان محققان برخوردار شده است. به دلیل توجه این مدل های زبانی به زبان انگلیسی، دیگر زبان ها به برخی از مدل های چند زبانه محدود می شوند. در این مقاله، مدل زبانی VarzeshiBERT به منظور تحلیل محتوای ورزشی فارسی در مسائل مرتبط با این حوزه زبانی ارائه شده است. این مدل زبانی بر پایه مدل زبانی BERT و با استفاده از مجموعه داده جمع آوری شده آموزش دیده است. سه مساله برای ارزیابی مدل زبانی جدید استفاده شده است: تحلیل احساسات، تشخیص نهاد های نامگذاری شده و پرکردن جای خالی. برای آموزش این مدل زبانی با توجه به عدم وجود مجموعه داده ای مناسب، یک مجموعه داده گسترده از رویداد ها و اخبار ورزشی زبان فارسی از چندین مرجع برخط تهیه شده است. با توجه به تخصصی بودن حوزه این مدل و در مقایسه با مدل های زبانی ارائه شده برای زبان فارسی، این مدل در هر سه مساله، نتایج بهتری را ارائه داده است. این مدل با 71.7% و 95.2% بهترین عملکرد را به ترتیب در بخش های پرکردن جای خالی و برچسب زنی اجزای کلام داشته است. در تحلیل احساسات نیز مدل ورزشی، نتایج بهتری را به همراه داشته است. این نتایج نشان می دهد، بکارگیری مدل زبانی مرتبط با هر حوزه تخصصی، نتایج بهتری در مقایسه با مدل های زبانی مرتبط اما با حوزه عمومی متون، خواهد داشت.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 112

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 36 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

Naseri J. | Hasanpour H. | Ghanbari Sorkhi A.

اطلاعات دوره: 
  • سال: 

    2024
  • دوره: 

    37
  • شماره: 

    6
  • صفحات: 

    1050-1058
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    4
  • دانلود: 

    0
چکیده: 

Countries are managed based on accurate and precise laws. Enacting appropriate and timely laws can cause national progress. Each law is a textual term that is added to the set of existing laws after passing a process with the approval of the assembly. In the review of each new law, the relevant laws are extracted and analyzed among the set of existing laws. This paper presents a new solution for extracting the relevant rules for a term from an existing set of rules using semantic similarity and deep learning techniques based on the BERT model. The proposed method encodes sentences or paragraphs of text in a fixed-length vector (dense vector space). Thereafter, the vectors are utilized to evaluate and score the semantic similarity of the sentences with the cosine distance measurement scale. In the proposed method, the machine can understand the meaning and concept of the sentences by using the BERT model coding method. The BERT model considers the position of the entities in the sentences. Then the semantic similarities of documents, calculating the degree of similarity between their documents with a subject, and detecting their semantic similarity are done. The results obtained from the test dataset indicated the precision and accuracy of the method in detecting semantic similarities of legal documents related to the Islamic Consultative Assembly of Iran, as well as the precision and accuracy of performance above 90%.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 4

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button