دیتا ساینس یا علم داده چیست؟
این نوشته در تاریخ 12 دیماه 1401 بروزرسانی شده است.
یکی از واژهها و مشاغل پُر جستجو در این روزها در آمریکا، واژهی علم داده یا دیتا ساینس و متخصص علم داده است. این حرفه یا تخصص، امسال، برای چهارمین سال متوالی، جزوه مشاغل پُر درخواست و پُر از موقعیت شغلی در آمریکا و سایر کشورهای صنعتی محسوب میشد و گمان میکنم به این زودیها، نیاز این کشورها به متخصص علم داده برآورده نشود. پس ورود به این رشته میتواند، ضامن داشتن یک شغل خوب با درآمد بالا در آینده، برای دانشجو یا محقق باشد.
اما اینکه دیتا ساینس چیست و دقیقاً قرار است چه کاری بکند، گمان میکنم هنوز کاملاً مشخص نیست، چون با توجه به نیازها و موردهای مختلف، ابزار متفاوتی باید بکار گرفته شود. ولی چیزی که واضح است، یک متخصص علم داده یا دیتا ساینس، در سه رشتهی:
1- ریاضیات،
2- آمار،
3- علوم کامپیوتر،
اطلاعات نسبتاً خوب و جامعی دارد و میتواند بوسیلهی این سه شاخه، با ورود به شرکتهای بزرگ و کارخانجات و با مطالعه و آنالیز دادهها، در تصمیمگیریها و درآمدزایی بیشتر، نقش بسزایی داشته باشد. اصلیترین ابزار هم در این بین، علم آمار است که بزودی همگان خواهند فهمید، این علم، یکی از بزرگترین دستاوردهای بشر تا به امروز بوده، است و خواهد بود، البته نه آماری که در دانشگاهها صرفاً تدریس میشود تا بتواند چند داده محدود را مطالعه و آنالیز نماید، شخص باید از ابزارهای آماری، جهت سر و کله زدن با حجم بسیار بزرگی از دادهها، استفاده نماید. سپس از ریاضی و برنامهنویسی کامپیوتری، مخصوصاً زبان پایتون (Python)، کمک بگیرد تا بتواند دادهها را در مسیر درست مطالعه و بهرهبرداری و اخذ الگوهای مناسب، رده بندی کند و نتیجه مطلوبش را اخذ نماید.
آیا در این رشته کتاب به زبان فارسی وجود دارد؟
اخیراً یک کتاب فارسی با عنوان “علم داده: مفاهیم و مهارتها” به قلم یکی از اعضای هیات علمی دانشگاه تهران همراه با یکی از دانشآموختگان کارشناسی ارشد ایشان، خواندم. البته در این کتاب نیز مطلب تخصصی خاصی از این رشته دستگیرم نشد. اما تقریباً اطلاعات عمومی زیادی در خصوص آن کسب کردم. مثلاً اینکه، در آمریکا، اخیراً گرایش خاصی به سمت رشتهی آمار، در بین دانشجویان ایجاد شده و اینکه تعداد دانشگاههایی که در حال ایجاد رشتهی علم داده یا دیتا ساینس هستند، هر روز رو به افزایش است. تعاریف مختلف از این رشته، بیان شده و … . ولی متاسفانه هیچ بحث عملی، با جزئیات بیشتر برای فهم خواننده از این رشته، عنوان نشده است.
بهرحال باید بدانید که در رشتهی علم داده یا دیتا ساینس، در حال حاضر کتاب به زبان فارسی، تقریباً، وجود ندارد. البته چند جلد کتاب در این حوزه دیدهام که دوستان در رشتههای مدیریت یا اقتصاد به رشتهی تحریر در آوردهاند که خیلی مباحث، آماری، ریاضی و کامپیوتری در آنها وجود ندارد. پس اگر بخواهید به عمق تعاریف و تکنیکها در این گرایش پیببرید و تصمیم بگیرید که وارد آن بشوید یا نه، باید چند کتاب به زبان انگلیسی بخوانید. مثلاً من کتاب (The Mathematics of Data) را به تازگی از انتشارات انجمن ریاضی آمریکا (AMS) خریدهام که حاوی مباحث بسیار جالب و تخصصی در این زمینه است.
پینوشت در خصوص این سؤال: در این پست تعدادی کتاب تالیفی به زبان فارسی را قرار دادهایم. یکی از بهترین کتابها در علم داده توسط آقای کلهر به رشتهی تحریر درآمده است که در این آدرس در مورد آنها نوشتهایم.
آیا رفتن دانشجویان ریاضی به این سمت، مفید است؟
با توجه به اینکه در حال حاضر، دانشجویان بخاطر سیستم غلط آموزشی، از لحاظ فهم ریاضی، افت بسیار شدیدی داشتهاند، خواندن ریاضی برایشان سخت شده است. پس ورود به رشتهایی که هم نزدیک به آن است، هم کاربردی باشد و هم موقعیت شغلی بهتری داشته باشد، صد در صد توصیه میشود. اما در ایران، در حال حاضر چنین رشتهایی بهصورت رسمی وجود ندارد (تنها دانشگاه شهید بهشتی در مقطع کارشناسی ارشد در این رشته پذیرش دارد) و متقاضی باید به آمریکا یا سایر کشورهایی که این رشته را دارند، برود.
اما اشتباهی که دانشجویان انجام میدهند این است که آنها گمان میکنند، برای اینکه وارد مقطع دکتری، بعنوان مثال رشتهی علم داده بشوند، همانند ایران اول باید یک مدرک کارشناسی ارشد داشته باشند تا بعد بتوانند در دورهی دکتری پذیرش بگیرند. اما سیستم آموزشی آمریکا اینگونه است که برای پذیرش در مقطع دکتری، فقط از شما یک لیسانس میخواهند. دورهی دکتری در آنجا پنج الی شش سال بطول میانجامد و در این دوره، تا دو سال واحدهایی را برای شما پیشبینی میکنند که هم دروس کارشناسی ارشد را پوشش دهد و هم دروس دورهی دکتری را. از سال سوم به بعد هم معمولاً وارد پژوهش میشوند تا وقتی که کارشان به نتیجه برسد.
پس، بعد از اخذ لیسانس، اصلاٌ نیازی به این ندارید که بلافاصله وارد مقطع ارشد بشوید. به عقیدهی بنده، همین دوسالی را که وقتتان را برای گرفتن ارشد، تلف میکنید، وقت بگذارید و آزمونهای تافل (TOEFL) و جی.آر.ایی. (GRE) را که مهمترین مدارک برای ورود به بهترین و بزرگترین دانشگاههای آمریکا است، بگیرید. نگران رزومه قوی هم نباشید. اگر انگیزه قوی و هدف خوبی داشته باشد، و بتوانید یک هدف نامه (Statement of Purpose) خوب بنویسید، قطعاً از یک دانشگاه بسیار بزرگ و به اصطلاح با پرستیز، پذیرش (Admission) خواهید گرفت و کاملاً خرج تحصیلاتتان را (با توجه به شرایطی) تا پنج سال تمام میدهند. حتی ورود به دانشگاههای پزشکی در آمریکا هم به همین شکل است. شخص اول باید در یکی از رشتههای علوم پایه یک مدرک کارشناسی بگیرد، سپس مجاز است که وارد دانشکدهی پزشکی بشود. در غیر اینصورت محال است، مگر اینکه از نوع دانشگاههایی باشد که فقط پول میگیرند و مدرک چاپ میکنند.
البته تنها این رشته مد نظر نیست. لزومی ندارد، کسی که لیسانس ریاضی دارد، تا آخر عمر ریاضی بخواند. میتواند وارد رشتهی علوم کامپیوتر بشود. یا آمار یا هر رشتهی دیگری که به آن علاقمند است و در آن مستعد میباشد. ولی بدانید که رشتههایی نظیر علم داده، آمار و یا علوم کامپیوتر، در کشورهای صنعتی، تقریباً جزو مشاغل خیلی خوب و با درآمد بالا محسوب میشوند. البته به عقیدهی بنده، تغییر رشتهی دانشجویان ریاضی به رشتههای دیگر، مثل همین رشتههایی که در بالا قید نمودم، مزایای دیگری هم دارد.
بعنوان مثال شما در ایران، در حال حاضر بعید است که حتی با داشتن دکتری در رشتهی ریاضی، بتوانید عضو هیات علمی دانشگاهها بشوید چون تعداد افراد و مدارک در این رشته، در حال حاضر زیاد است، (مگر گرایشهای جدیدی مثل ریاضی مالی، رمز و کد و …) البته امکانش هست که در سالهای آتی، این تعداد به شدت کاهش یابد و مجدد همان قصهها تکرار شوند. ولی بعنوان مثال در رشتهای مثل علوم کامپیوتر، چون اکثر افراد میتوانند خارج دانشگاه، کار کنند و درآمدهای خوبی داشته باشند، معمولاً به هیات علمی شدن، تن نمیدهند و تعداد افراد هیات علمی در این رشته، کم است و این بدیهی است که جذب راحت میشود، حتی اگر از لحاظ علمی ضعیف باشید. پس فقط باید کسانی این رشته را ادامه دهند که واقعاً ریاضی در خونشان باشد و بتوانند کارهای پژوهشی بسیار خوبی انجام دهند تا به این وسیله وارد دانشگاهها شوند، بعنوان یک هیات علمی. در غیر اینصورت باید تغییر رشته بدهید.
این نکته را نیز در ذهن داشته باشید، که دانشجویان ریاضی، چون منطقِ ریاضیِ ذهنشان خوب است، نسبت به دانشجویان کامپیوتر و یا حتی آمار، بعد از ورود به این رشتهها، موفقتر میشوند. مثلاً بدانید که بزرگترین برنامهنویسان کامپیوتری در دنیا، افرادی بودهاند که از ریاضی به سمت این رشته رفتند و هم چنین در رشتهی علم داده و یا حتی آمار. در پست «چگونه وارد حوزهی علم داده شویم؟» نحوهی ورود به این رشته را بصورت گام به گام شرح دادهایم.
آینده این رشته در ایران چطور خواهد بود؟
قطعاً چون تعداد افرادی که در دیتا ساینس متخصص هستند در کشور بسیار کم است، داشتن دانش و مدرک در این زمینه، در آینده، شخص را در ایران بیکار نخواهد گذاشت. اما همهی اینها بستگی به سواد و روابط فرد دارد. در خیلی از کتابهای علم داده یا دیتا ساینس، توصیه میشود که شخص باید بتواند قدرت مجاب کردن دیگران را داشته باشد که این مستلزم داشتن روابط اجتماعی بالاست. مثالی هم میزنند که فرض کنید شما مسئول یک تیم تحقیقاتی در خصوص خط تولید یک کارخانه هستید. بعد از اینکه اطلاعات را کاملاً آنالیز کردید و نتیجهگیری نمودید، باید بیائید و یافتههایتان را برای هیات مدیرهی آن مجموعه ارائه نمائید و آنها را متقاعد کنید که این دادهها و اطلاعات ما را به سمت انجام چنین کاری سوق میدهند، باید به آنها ثابت نمائید که انجام اینکار باعث منفعتهای مادی فراوانی برای مجموعه است، در غیر اینصورت کار شما بیفایده است.
با تمام این تفاسیر، داشتنِ دانشِ تخصصی در این رشته در ایران، در سالهای پیش رو، بسیار مورد نیاز خواهد بود و کسانی که در این زمینه حرفی برای گفتن داشته باشند، هم جایگاه خوبی را کسب خواهند کرد و هم درآمد بالایی خواهند داشت. در حال حاضر در ایران، دانشگاه شهید بهشتی، بعنوان یکی از زیرشاخههای رشتهی ریاضی کاربردی، این رشته، یعنی دیتا ساینس را راهاندازی کردهاند. احتمالاً بزودی، سایر دانشکدهها، در دانشگاههای بزرگ کشور، چنین گرایشی را تعریف و راهاندازی نمایند. ولی در حال حاضر، مقطع دکتری این رشته در ایران وجود ندارد.
بنابراین، اگر شما قرار است که از ایران بروید و یک رشتهایی را بخوانید و بعدها برگردید تا به میهن و وطنتان خدمت کنید، بهتر است بدنبال رشتههایی باشید که در کشور وجود ندارند یا افراد متخصص در آنها بسیار کم هستند، یکی از این رشتهها علم داده است.
برای ورود به علم داده اگر مبتدی هستید پیشنهاد ما بشما گذراندن دورهی متنی و بسیار سادهی «علم داده به زبان ساده و با مثال» هست. همچنین، یک دورهی ویدیویی بسیار کامل، با ارزش و رایگان از علم داده توسط تیم ما گردآوری و منتشر شده است. در صورت تمایل از طریق لینک زیر آنرا مشاهده نمائید.
آموزش رایگان علم داده یا دیتا ساینس
وبینار علم داده از شروع تا گرفتن پروژه (محصول ویدیویی جدید)
اگر دیدگاه، نظر و یا سؤالی در خصوص دیتا ساینس دارید حتماً در قسمت نظرات منعکس کنید. ما پاسخ شما را میدهیم. همچنین، اگر نیاز به راهنمایی و مشاورهی تخصصیتری دارید، حتمن از طریق صفحهی مشاوره اقدام به اخذ وقت مشاوره نمائید تا به بهترین شکل ممکن، راه را بشما نشان دهیم.
پینوشت۱: دانشگاههای خواجه نصیر، تربیت مدرس و شاهد، در دورهی کارشناسی ارشد، برای ورودی مهر 1399 در رشته علم داده اقدام به پذیرش دانشجو کردند. از مهرماه 1400 دانشگاه خلیج فارس در گروه آمار اقدام به پذیرش دانشجو در این رشته نموده است. البته تعداد دانشگاههای در حال پذیرش، در حال حاضر بیشتر از این لیست میباشد که نگارنده تمامی آنها را ننوشته است. براحتی به مراجعه به دفترچه انتخاب رشته کنکور کارشناسی ارشد، میتوانید از تمامی محلها مطلع شوید.
پینوشت۲: در حال حاضر در ایران تعداد دانشگاههایی که در رشتهی علم داده و در دو گروه ریاضی و آمار اقدام به پذیرش دانشجو میکنند بسیار زیاد شده است و مشاهده شده که دانشجویان با رتبههای بسیار پائین نیز پذیرش گرفتهاند. بعنوان مثال دانشجویی با رتبهی ۱۲۰۰ در یکی از دانشگاههای تهران در این رشته در گروه ریاضی قبول شده است.