فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی





متن کامل


نویسندگان: 

CHUNG T. | GILDEA D.

اطلاعات دوره: 
  • سال: 

    2009
  • دوره: 

    2
  • شماره: 

    -
  • صفحات: 

    718-726
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    150
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 150

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

GRANA J. | GRANA M.A.

اطلاعات دوره: 
  • سال: 

    2002
  • دوره: 

    -
  • شماره: 

    5
  • صفحات: 

    3-11
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    104
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 104

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

FRUNZA O.

اطلاعات دوره: 
  • سال: 

    2008
  • دوره: 

    -
  • شماره: 

    6
  • صفحات: 

    0-0
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    105
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 105

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
نشریه: 

زبان پژوهی

اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    16
  • شماره: 

    52
  • صفحات: 

    219-246
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    33
  • دانلود: 

    10
چکیده: 

پیکره ­ها براساس زبان به کاررفته در متن های تشکیل ­دهندة آن­ها به پیکره­های تک­ زبانه، دوزبانه و چندزبانه گروه بندی می­شوند. پیکرة مقایسه ­ای، پیکره­ای است دوزبانه یا چندزبانه که شامل متن هایی است مشابه در حوزه­های موضوعی یکسان. با وجود کاربرد فراوان این نوع پیکره ها در پژوهش های گوناگون همچون پژوهش­های زبانی، ترجمة ماشینی و سامانه های خودکار بازیابی اطلاعات بینازبانی، پژوهشگران همواره با کمبود پیکره های مقایسه­ ای مواجه بوده اند. در این مقاله، به معرفی مراحل ساخت یک پیکرة مقایسه ای تخصصی به نام «پارسا» پرداخته شده است. این پیکره از چکیده­های فارسی و انگلیسی پایان­ نامه ­ها و رساله ­های ثبت شده در پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک) ساخته شده است و شامل بیش از 89 میلیون واژه فارسی و 79 میلیون واژه انگلیسی است. محتوای این پیکره عمومی نیست و مشتمل بر متن های بسیار تخصصی در حوزه­های موضوعی کلان مانند علوم اجتماعی، علوم انسانی و هنر، فنی­ ومهندسی و رشته ­های مربوط به این حوزه­ها است و ازاین جنبه، برای پردازش­های زبانی که نیازمند بهره ­گرفتن از متن های تخصصی است، بسیار ارزشمند است. برای ساخت این پیکره، پس از نمونه ­گیری، داده­های فارسی وارد فرایند پیش ­پردازش (هنجارسازی و واحدسازی) شدند. برای ارزیابی این مرحله دقت (P)، فراخوان (R) و F1 سنجیده شد. دقت، 5614035088. 0، فراخوان،   0531561462. 0 و در پایان، F1 09711684370257966. 0 محاسبه شده است. سپس، داده­ها برچسب گذاری شدند (برچسب ­گذاری اجزای کلام) و برچسب­های متون فارسی کنترل شدند. داده­های انگلیسی نیز به صورت ماشینی برچسب گذاری شدند. شمار واژه های محتوایی (فعل، اسم، صفت، قید) داده­های فارسی این پیکره 57653813 و شمار واژه­های دستوری به همراه اعداد و علائم سجاوندی 31350125  است و بن­ واژه­های فارسی استخراج ­شده نیز شامل 41064 بن­ واژه است. شمار واژه­های محتوایی متون انگلیسی 45606686 و شمار واژه­های دستوری به همراه اعداد و علائم سجاوندی شامل 33662304 و بن واژه­های انگلیسی استخراج ­شده نیز شامل 12937 بن ­واژه است. پیکرۀ ساخته ‎شده قابلیت بسیار بالایی برای داده کاوی، پژوهش­های مربوط به ترجمه ماشینی و به کارگیری در تمام پژوهش هایی که بر روی متون علمی انجام می شود را دارا است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 33

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 10 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    3
تعامل: 
  • بازدید: 

    598
  • دانلود: 

    511
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (PDF) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 598

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 511
اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    19
  • شماره: 

    3
  • صفحات: 

    175-188
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    104
  • دانلود: 

    28
چکیده: 

متون نگاشته شده فارسی به طورمعمول دو مشکل ساده، ولی مهم دارند. مشکل نخست واژه های چندواحدی هستند که از اتصال یک واژه به واژه­ های بعدی حاصل می­شوند. مشکل دیگر واحدهای چندواژه­ای هستند که از جداشدگی واژه ­هایی که با هم یک واحد واژگانی را تشکیل می ­دهند، حاصل می شوند. ابزار واحدساز در زبان فارسی که به عنوان یکی از ابزارهای پیش ­پردازش زبان است، کاربرد فراوانی در تجزیه و تحلیل متون داشته و باید بتواند واحدهای واژگانی را تشخیص دهد. به عبارتی، این ابزار، مرکز کلمات را در متون تشخیص داده و آن را به دنباله­ ای از کلمات به منظور تحلیل­ های بعدی تبدیل می ­کند. تنوع در رسم‎ الخط فارسی و عدم رعایت قوانین جدانویسی و پیوسته نویسی کلمات از یک سو و پیچیدگی های واژگانی زبان فارسی از سویی دیگر فرایندهای مختلف پردازشی زبان از جمله واحدسازی را با چالش های بسیاری روبه رو می کند؛ لذا برای عملکرد بهینه این ابزار، لازم است ابتدا ملاحظات زبان شناسی رایانشی واحدسازی در زبان فارسی مشخص و سپس بر اساس این ملاحظات مجموعه داده­ای برای آموزش و آزمایش آن فراهم شد. در این مقاله سعی شد ضمن تبیین ملاحظات یاد شده، به تهیه پیکره­ای در این خصوص بپردازیم. پیکره تهیه شده شامل 183/21 کلمه و متوسط طول جملات 28/40 است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 104

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 28 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    13
  • شماره: 

    1
  • صفحات: 

    119-141
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    111
  • دانلود: 

    0
چکیده: 

World of technology provides everyone with a great outlet to give their opinion, using social media like Twitter and other platforms. This paper employs machine learning methods for text analysis to obtain sentiments of reviews by the people on twitter. Sentiment analysis of the text uses Natural language processing, a machine learning technique to tell the orientation of opinion of a piece of text. This system extracts attributes from the piece of writing such as a) The polarity of text, whether the speaker is criticizing or appreciating, b) The topic of discussion, subject of the text. A comparison of the work done so far on sentiment analysis on tweets has been shown. A detailed discussion on feature extraction and feature representation is provided. Comparison of six classifiers: Naï ve Bayes, Decision Tree, Logistic Regression, Support Vector Machine, XGBoost and Random Forest, based on their accuracy depending upon type of feature, is shown. Moreover, this paper also provides sentiment analysis of political views and public opinion on lockdown in India. Tweets with ‘ #lockdown’ are analysed for their sentiment categorically and a schematic analysis is shown.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 111

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1392
  • دوره: 

    -
  • شماره: 

    2 (پیاپی 20)
  • صفحات: 

    69-86
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1439
  • دانلود: 

    269
چکیده: 

واحدسازی، از مهم ترین مسائل در پردازش زبان های طبیعی است که عبارت از فرآیند تقسیم متن به واحدهای معنادار نظیر واژه، عبارت نحوی، جمله و غیره است. واحدسازی گروه های نحوی یک متن، از جمله وظایف واحدسازی متن محسوب می شود که در بسیاری از کارهای پردازش زبان طبیعی، نظیر سامانه های ترجمه ماشینی، استخراج اطلاعات، پرسش و پاسخ و سامانه های تبدیل متن به گفتار، به عنوان پیش پردازشی مهم، می تواند حضور داشته باشد. واحدسازی عبارات نحوی، در هر زبان، متناسب با ویژگی های نوشتاری آن زبان مشکلات و پیچیدگی هایی دارد. زبان فارسی به دلیل وجود رسم الخط های مختلف، جملات بدون ترتیب، افعال مرکب، ابهامات معنایی و عدم نمایش مصوت ها مشکلاتی دارد. در این مقاله روشی مبتنی بر روش های آماری و یادگیری و اطلاعات و ویژگی های دستور زبانی جهت تشخیص مرز و نوع گروه های نحوی در متون فارسی فاقد علایم سجاوندی، ارائه شده است که در آن از روش های یادگیری ماشین بردار پشتیبان و میدان تصادفی شرطی استفاده شده است. در روش ارائه شده ویژگی های مختلف زبانی مرتبط با زبان فارسی استخراج و برای نخستین بار مورد بررسی و استفاده قرار گرفته اند. بهترین دقت به دست آمده توسط این سامانه، 84.02% بر اساس معیار F و 87.45%، بر اساس تعداد برچسب های صحیح به کل در تعیین مرز، و 78.04%، در تعیین مرز و نوع به صورت توام، بوده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1439

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 269 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    14
  • شماره: 

    2
  • صفحات: 

    89-110
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    71
  • دانلود: 

    4
چکیده: 

با آنکه بیش از 14 سال از زمان ایجاد اولین رمزدارایی ها می گذرد، هنوز کشور ها در نحوه مواجهه با آنها به وحدت رویه نرسیده اند. در این مقاله با استفاده از روش تحلیلی به تبیین چارچوب سیاست گذاری در زیست بوم رمزدارایی ها براساس روش فقه نظام های اجتماعی پرداختیم. براساس یافته های پژوهش، سیاست گذاری رمزارزها براساس روش فقه نظام باید با توجه به اهداف و اصولی همچون مردمی سازی اقتصاد، تحقق اهداف نظام اقتصادی اسلام، قاعده نفی سبیل و محدود شدن حکمرانی پولی فقیه در دو سطح سیاست گذاری رمزدارایی های موجود و طراحی رمزدارایی های جدید صورت گیرد. برای رمزدارایی های موجود، اعمال محدودیت بر رمزدارایی های پرمخاطره، رصد و کنترل معاملات، احراز هویت و طراحی قواعد تنظیمی و مالیاتی را پیشنهاد کردیم. در طراحی رمزدارایی های جدید، پیشنهاد ما شامل دو بخش توکن سازی از دارایی ها و ایجاد رمزدارایی های بدون پشتوانه است. در بخش اول، توکن سازی از مواد خام، تعیین استانداردهای محیط آزمون تنظیم گری، ایجاد بسترهای تنظیم گری و مالیات ستانی اولویت دارد. در بخش دوم، تأسیس بلاکچین های عمومی در محیط آزمون تنظیم گری، طراحی سازوکارهای اخذ مالیات، الزام کیف پول ها و سکوها به رعایت مقررات ضد پول شویی، تعریف اعتبار خلق شده به عنوان رمزدارایی جهانی یا منطقه ای و در داخل در قالب پول مکمل و تأسیس نهادهای تأمین مالی این زیست بوم پیشنهاد شده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 71

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 4 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1388
  • دوره: 

    25
  • شماره: 

    1 (پیاپی 59)
  • صفحات: 

    0-0
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1307
  • دانلود: 

    0
چکیده: 

در این پژوهش میزان تاثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت های جستجو به کار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخاب همه برابر نهاده ها موجب کارآمدی بیشتر در بازیابی می گردد. آزمون فرضیه دوم نشان داد که اگرچه تحلیل مورفولوژیک واژه هایی که به وسیله واژه نامه ترجمه نشدند باعث افزایش ضریب دقت بازیافت می گردد، اما تفاوت معناداری با عدم انجام این تحلیل ایجاد نمی نماید. بررسی فرضیه سوم نیز نشان داد که ترجمه عبارتی در مقایسه با ترجمه واژه به واژه باعث کارآمدی بیش تر می گردد. یافته های دیگر این پژوهش نیز نشان داد که دگرنویسی واژه های فارسی ترجمه ناپذیر با حروف انگلیسی و قرار دادن آن ها در عبارت جستجوی نهایی در مقایسه با حذف آن ها از عبارت های جستجو، می تواند منجر به افزایش کارآمدی گردد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1307

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button