در دنیای امروز، انبوهی از دادهها وجود دارد. دولتهای محلی و ملی در سراسر جهان دادههای خود را در هزاران مخزن داده در وب منتشر میکنند. برای دسترسی آسان به داده، جستجو در مجموعه داده توسط گوگل راهاندازی شد، تا محققان و سایر افرادی که نیاز به جمع آوری داده در کارشان دارند به آسانی به آن دست پیدا کنند.
مزایا و ابزارهای گوگل اسکالر
شبیه به عملکرد گوگل اسکالر[1]، جستجو در مجموعه داده به شما کمک میکند تا آن را در هرجایی از وب حتی در سایت ناشر، یک کتابخانه دیجیتال و یا در صفحه شخصی نویسنده آن، پیدا کنید. جستجو در مجموعه داده[2]، به شما این امکان را میدهد تا مجموعه داده موجود در وب را با چند کلمه کلیدی پیدا کنید. این ابزار اطلاعاتی دادههای موجود در هزاران مخزن در سراسر وب، را در سراسر جهان پوشش میدهد.
این موتور جستجو برای افراد زیر مفید است:
- برای ناشران: با ایجاد یک اکوسیستم به اشتراک گذاری داده ناشران را ترغیب میکند بهترین روشها را برای ذخیره سازی و انتشار داده دنبال کنند.
- برای نویسندگان: ارائه راهی به محققان تا تاثیر کارشان را نشان دهند و استناد دریافت کنند.
برای دریافت آخرینهای بلاگ و کارگاههای مرکز اطلاعات علمی در خبرنامه عضو شوید.
آدرس https://datasetsearch.research.google.com/ را در مرورگر خود وارد کنید. عبارت مورد نظر خود را در جعبه جستجو وارد کنید. همچنین میتوانید عبارات فارسی را وارد کنید. لازم به ذکر است که به دلیل عدم مشارکت افراد و سازمانهای ایرانی در به اشتراک گذاری داده، مجموعه داده در این زبان کم است.
میتوانید از گزینههای فیلتر برای محدود کردن جستجوی خود استفاده کنید. روی صفحه مورد نظر خود کلیک کنید.
با انتخاب گزینه Download، داده مورد نظر خود را دانلود نمایید.
یک نمونه از مجموعه داده فارسی
متاسفانه این داده به صورت رایگان در دسترس نیست، برای دسترسی به شیوه API به آدرس https://docs.tradingeconomics.com/#introduction مراجعه کنید.
بررسی مدارک علمی ایران در حوزه موضوعی متن کاوی
برای یافتن مجموعه داده در مورد ویروس کرونا، COVID-19 را در جعبه جستجو وارد میکنیم. میتوان داده را در سازمان بهداشت جهانی یا کگل (انگلیسی: Kaggle) دانلود کرد.