مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

آینده دیتا ساینس؛ علم داده یا Data Science چیست؟


دیتا ساینس (Data Science) یا علم داده، علمی است که محوریت اصلی آن، پردازش و مطالعه داده برای استخراج اطلاعات و بینش‌های ارزشمند برای کسب و کار است.

در عصر امروز، با وجود اینترنت و استفاده گسترده از آن، همه ما در حال تولید روزانه هزاران داده مختلف هستیم؛ از فعالیت‌هایی که در شبکه‌های اجتماعی داریم، تا تراکنش‌های بانکی و حتی چک کردن صفحه یک فروشگاه آنلاین. همه این فعالیت‌ها داده‌هایی را ایجاد می‌کنند که می‌توانند برای کسب و کارها بسیار کارآمد باشند. کسب و کارها برای ارائه خدمات به مشتریان خود به بهترین شکل، نیاز دارند تا این داده‌ها را جمع‌آوری کنند و با پاکسازی داده‌ها و جدا کردن داده‌های پرت از داده‌های مفید، به اطلاعات و بینش درباره مشتریان خود برسند. اینجا نقطه‌ای است که دیتا ساینس وارد میدان می‌شود.

دیتا ساینس (Data Science) یا علم داده، همانطور که از اسم آن مشخص است، علمی است که محوریت اصلی آن، پردازش و مطالعه داده برای استخراج اطلاعات و بینش‌های ارزشمند برای کسب و کار است. هر کسب و کار برای استفاده از این علم، به فردی نیاز دارد که وظیفه جمع‌آوری، تجزیه و تحلیل و تجسم داده را دارد. این فرد دانشمند داده یا دیتا ساینتیست (Data Scientist) است.

Data Science

در این مقاله قصد داریم ابتدا با این مفهوم آشنا شویم و سپس با بررسی تأثیر آن روی زندگی امروزی، آینده دیتا ساینس را بررسی کنیم. همچنین در انتها نگاهی به شغل دانشمند داده یا دیتاساینتیست می‌اندازیم و یکی از شرکت‌های حوزه فین تک (Fintech) را که نقش دانشمندان داده در آن پررنگ است، معرفی می‌کنیم.

دیتا ساینس یا علم داده چیست؟

دیتا ساینس (Data Science) یا علم داده، یک حوزه شغلی و آکادمیک بین‌رشته‌ای است که از ترکیب ریاضیات، آمار و احتمال، محاسبات علمی، برنامه ‌نویسی، تحلیل، هوش مصنوعی، الگوریتم‌ها و سیستم‌ها و … تشکیل شده است. این حوزه در دنیا، به عنوان یکی از حوزه‌های پرطرفدار و آینده‌دار برای متخصصان شناخته شده است.

در سال 1962، زیربنای علم داده با عنوان تحلیل داده (Data Analysis) به جامعه مهندسی و تحلیل معرفی شد؛ اما تا اواخر دهه 90 میلادی، رسما نام‌ دیتا ساینس را به خود نگرفته بود. هدف اصلی دیتا ساینس، تجزیه و تحلیل داده‌های کسب و کار و استخراج اطلاعات مفید و بینش‌های مخفی در داده‌ها، برای کمک به تصمیم‌گیری و برنامه‌ریزی‌های کلان سازمان است.

این حوزه از داده و روش‌های مختلف پردازش داده استفاده می‌کند تا به دانش عمیق در یک موضوع برسد. Data Science یک حوزه بسیار جامع است که شامل بسیاری از حوزه‌های علمی و شغلی دیگر هم می‌شود؛ مانند هوش مصنوعی (AI)، یادگیری ماشین (Machine Learning)، داده کاوی (دیتا ماینینگ)، هوش تجاری (BI) و ….

دیتا ساینس در دنیای امروز

حجم فزاینده منابع داده، و به طبع آن حجم خود داده، دیتا ساینس را به یکی از حوزه‌های جذاب، با سرعت رشد بالا تبدیل کرده است. به گفته (HBR (Harvard Business Review دیتا ساینس «جذاب‌ترین شغل قرن 21» است. هرچه می‌گذرد، شرکت‌ها بیشتر و بیشتر به این علم متکی می‌شوند و برای تحلیل داده و رسیدن به روش‌های نوین بهبود کسب و کار، از این علم استفاده می‌کنند.

با استفاده از داده‌های کسب و کار، می‌توانید چندین قدم فراتر بروید؛ می‌توانید از داده‌های گذشته الگو استخراج کنید، با داده‌های فعلی خود استراتژی‌های مختلف را تست کنید و آینده کسب و کار خود را پیش‌بینی کنید. علم داده با ترکیب چندین حوزه مختلف، چنان تاثیر عظیمی در ساخت دنیای امروز و آینده دارد، که تبدیل به یکی از پرتقاضاترین رشته‌های تحصیلی و عناوین شغلی شده است.

آینده دیتا ساینس

در دنیای امروز، تعداد کسب و کارهایی که بدون استفاده از داده بتواند موفق شود، کم است. همین موضوع هم زمینه‌ساز شکل‌گیری کسب و کارهای جدید در حوزه خدمات داده، و عناوین شغلی جدید شده است. امروز می‌توانید هرکاری را با داده و تحلیل داده ترکیب کنید؛ مثلا بازاریابی داده-محور، طراحی داده-محور، تجزیه و تحلیل داده-محور و … داده تا جایی اهمیت دارد که شما در هر زمینه‌ای هم که فعالیت کنید، آرام آرام به سمت یادگیری این حوزه وسیع و عمیق، سوق داده می‌شوید.

طبق بررسی‌های انجام شده در سطح بین‌المللی، تا چند سال آینده همه چیز بر مبنای داده پیش خواهد رفت. به گفته هال واریان (Hal Varian)، استاد اقتصاد، کسب و کار و علوم ارتباطات دانشگاه برکلی:

«توانایی جمع‌آوری، درک، پردازش، استخراج ارزش، تصویرسازی و انتقال داده، یکی از مهارت‌های بسیار مهم در دهه‌های آینده خواهد بود.»

بنابراین می‌توانیم بگوییم که علم داده، یک حوزه پرتقاضا در آینده خواهد بود که لازمه ورود به بازار کار و موفقیت در این رشته، داشتن مهارت‌های کامل در زمینه جمع‌آوری، پردازش، تصویرسازی و به طور کلی استفاده مؤثر از داده است.

دیتاساینتیست یا دانشمند داده

مفهوم دیتا ساینتیست (Data Scientist) در سال 2008 مطرح شد؛ زمانی که شرکت‌ها با نیاز خود به متخصص‌های حوزه داده، که مهارت مدیریت و تحلیل داده‌های کلان را داشتند، روبه‌رو شدند. در دهه گذشته، دانشمندان داده به یک ارزش افزوده مهم برای شرکت‌ها تبدیل شده‌اند و تقریباً در هر شرکتی که لزوم استفاده از داده را درک کرده باشد، حضور دارند.

متخصص‌های داده افراد توانمند و داده-محوری هستند، که سطح بالایی از مهارت‌های فنی دارند و می‌توانند با استفاده از الگوریتم‌ها پیچیده کمّی، اطلاعات به دست آمده از داده را برای پاسخ به سؤالات و تدوین استراتژی کسب و کار، مدیریت و ترکیب کنند. این توانایی‌ها در کنار توانایی ارتباط و رهبری، برای انتقال موضوعات مختلف به ذی‌نفعان کسب و کار، به کمک دانشمندان داده می‌آید.

یک دانشمند داده باید مهارت‌های فنی زیر را در خود داشته باشد و تقویت کند:

  • برنامه‌نویسی با زبان‌های R, Python, Apache و …
  • تسلط به پایگاه‌داده (Database)
  • تسلط به رایانش ابری (Cloud Computing)
  • تسلط به ابزارهای Tableau, GitHub و …
  • تسلط به کتابخانه‌های زبان‌های مختلف
  • آشنایی با هوش مصنوعی، یادگیری ماشین، داده کاوی و …

علاوه‌بر مهارت‌های بالا، مهارت‌های فردی شامل ارتباط مؤثر، توانایی مدیریت و رهبری، توانایی تجزیه و تحلیل و … هم از مهارت‌های اساسی یک دیتا ساینتیست هستند.

کلام آخر

دیتا ساینس یک حوزه گسترده با عمق زیاد است. ورود به این حوزه هم مستلزم داشتن مهارت‌های فنی و ارتباطی مختلف است که در مراحل مختلف به کمک فرد می‌آیند. با توجه به افزایش روزافزون حجم داده در دنیا، نیاز به افراد خبره در زمینه علم داده و هوش مصنوعی، به طور فزاینده‌ای افزایش می‌یابد.

در ایران هم شرکت‌های مختلفی هستند که نیاز به این متخصصان را به خوبی درک کرده‌اند. شرکت ویستا سامانه آسا یکی از شرکت‌های فعال در حوزه فناوری‌های مالی، پول و بازار سرمایه است. این شرکت که زیر مجموعه گروه مالی آگاه است، یک مثال مناسب از درک نیاز به دیتا ساینس در کسب و کار است. در ویستا سامانه آسا، بخش‌های فنی مختلفی وجود دارند، اما یکی از پررنگ‌ترین این بخش‌ها، بخش هوش تجاری است. هوش تجاری یکی از حوزه‌هایی است که ارتباط تنگاتنگی با داده و دیتا ساینس دارد و به‌عبارتی، تجسم عینی دیتا ساینس در کسب و کار است.

 

*مسئولیت صحت و سُقم محتوای این پست برعهده‌ی سفارش‌دهنده است.*

لینک کوتاه

بازگشت به بالا

پست های مرتبط

راه‌اندازی سرویس استخراج و برچسب‌گذاری داده از پایگاه‌های اطلاعات علمی و شبکه‌های اجتماعی توسط SID

تاریخ: 1399/05/31

بازدید: 2820

1399

زمان مطالعه: 5 دقیقه دقیقه

مرکز اطلاعات علمی جهاددانشگاهی از راه‌اندازی سرویس Extract and Labeling برای استخراج و برچسب‌گذاری داده از پایگاه‌های اطلاعات علمی و شبکه‌های اجتماعی خبر داد.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

وبینار کاربرد دیتا ساینس در دیوار

تاریخ: 1400/11/17

بازدید: 2070

1400

زمان مطالعه: 5 دقیقه دقیقه

حجم داده با پیشرفت فناوری سرعت گرفته است . با حجم روزافزون داده ، نیاز به بستری که بتوان این داده ها را ذخیره کرد وجود دارد . به این حجم از داده که نیاز به بستر دارد کلان داده گفته می شود .

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

راه‌اندازی سرویس استخراج و برچسب‌گذاری داده از پایگاه‌های اطلاعات علمی و شبکه‌های اجتماعی توسط SID

تاریخ: 1399/05/31

بازدید: 2820

1399

زمان مطالعه: 5 دقیقه دقیقه

مرکز اطلاعات علمی جهاددانشگاهی از راه‌اندازی سرویس Extract and Labeling برای استخراج و برچسب‌گذاری داده از پایگاه‌های اطلاعات علمی و شبکه‌های اجتماعی خبر داد.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

وبینار کاربرد دیتا ساینس در دیوار

تاریخ: 1400/11/17

بازدید: 2070

1400

زمان مطالعه: 5 دقیقه دقیقه

حجم داده با پیشرفت فناوری سرعت گرفته است . با حجم روزافزون داده ، نیاز به بستری که بتوان این داده ها را ذخیره کرد وجود دارد . به این حجم از داده که نیاز به بستر دارد کلان داده گفته می شود .

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button