در دههی گذشت شاهد حضور بینظیر هوش مصنوعی و مباحث تحلیل داده در سازمانهای مختلف بودیم. اما گذشت زمان به همگان ثابت نمود که بدون بستر دیتایی مناسب انجام پروژههایی که وابسته به دیتا میباشد، غیر ممکن است. در نتیجه مهندسی داده (Data Engineering) متولد شد تا پاسخی باشد به این نیاز؛ یعنی حوزه و رشتهای که بستر و زیر ساخت دیتایی را برای کسبوکارها تهیه و تدارک میبیند. اما دنیای هوش مصنوعی که بسرعت باد در حال توسعه و تکامل است، اخیرن برگ دیگری را برای ما رو کرده و آن هم نیاز به متخصصین امالآپس میباشد که به خواستههای تخصصی سازمانها پاسخ مناسبتر و سریعتری بدهند. در ادامه سعی میکنیم به این سوال که «امالآپس چیست و چگونه وارد این حوزه بشویم؟» پاسخ بدهیم.
اما ابتدا باید یک تعریف کلی از این حوزه داشته باشیم:
امالآپس (MLOps = Machine Learning Operations) یا عملیات یادگیری ماشین به مجموعهای از فرآیندها، ابزارها و بهترین شیوهها (Best Practices) اشاره دارد که به تیمهای داده کاوی و یادگیری ماشین کمک میکند تا مدلهای یادگیری ماشین را از مرحله توسعه تا تولید و نگهداری به طور مؤثر مدیریت نمایند.
اجزای اصلی امالآپس چیست؟
بطور کلی امالآپس ترکیب سه حوزهی یادگیری ماشین، مهندسی داده و دواپس است. یعنی از یک متخصص امالآپس انتظار میرود که بتواند ابتدا با تکیه بر تواناییهای مهندسی دادهی خود، دیتاهای مختلف را جمعآوری و پردازش نموده و در دیتابیسها مستقر نماید. سپس به کمک تواناییهای یادگیری ماشینی که در چنته دارد، و با توجه به نیاز سازمان به توسعهی یک یا چند مدل یادگیری ماشین بپردازد. در نهایت، با توجه به اینکه تسلط خوب و کاملی روی ابزارهای دواپس و تکنیکهای این حوزه دارد، مدل را روی سرورهای سازمان مستقر نماید.
البته میتوان موارد فوق را بصورت تیتروار زیر نیز بیان نمود:
- مدیریت دادهها: جمعآوری، پاکسازی و پیشپردازش دادهها برای آموزش مدل.
- مدلسازی: انتخاب الگوریتمهای مناسب، آموزش مدل و ارزیابی آن.
- استقرار: پیادهسازی مدلهای آموزشدیده در محیطهای تولید یا تست.
- نظارت: مانیتور کردن عملکرد مدلها و بررسی خطاهای احتمالی.
- بهروزرسانی: بهروزرسانی مدلها بر اساس دادههای جدید و تغییرات محیط.
مزایای امالآپس:
امالآپس به سازمانها کمک میکند تا مدلهای یادگیری ماشین خود را به شکل مؤثرتری، بسازند، مدیریت کنند و در نهایت پیادهسازی نمایند. بدون امالآپس هم سازمانها کماکان میتوانند کارهای پیشین خود را ادامه دهند. اما تکنولوژی، هر روز درگیر چالشهایی میشود که باید خودمان را همواره با بهترین روشها، ابزارها و تکنیکها همگام نمائیم تا کار با سهولت بیشتری ادامه یابد. در غیر اینصورت ممکن است که با توجه به رقابتی شدن بازار، بسرعت جایگاه خودمان را در بین رقبا از دست بدهیم.
اما بصورت تیتروار نیز میتوان چند مزیت امالآپس را بیان کرد:
- کارایی بیشتر: کاهش زمان و هزینهها از طریق خودکارسازی فرآیندها.
- کیفیت بالاتر: بهبود کیفیت مدلها از طریق نظارت و بهروزرسانی مستمر.
- تعاون بهتر: تسهیل همکاری بین تیمهای داده و توسعهدهندگان.
در تصویر زیر یک چرخه از زندگی مدل یادگیری ماشین، در دنیای امالآپس را میبینیم.
برای ورود به دنیای امالآپس چه چیزهایی را باید بیاموزیم؟
برای ورود به حوزهی امالآپس، آشنایی با ابزارها و تکنولوژیهای مختلف ضروری است. در ادامه به برخی از مهمترین (دقت کنید که این لیست کامل نیست) آنها اشاره مینمائیم.
۱. زبانهای برنامهنویسی
- پایتون: محبوبترین زبان برای یادگیری ماشین و دادهکاوی.
- R: برای تحلیلهای آماری و مدلسازی.
- جاوا: برای کدنویسی نرمافزارهای اساسی و بنیادی در مجموعه و یا نوشتن کانکتورهای مختلف.
۲. ابزارهای یادگیری ماشین
- Scikit-learn: کتابخانهای برای یادگیری ماشین در پایتون.
- TensorFlow و PyTorch: فریمورکهای قدرتمند برای یادگیری عمیق.
۳. مدیریت دادهها
- Pandas: برای تحلیل و پردازش دادهها.
- SQL: برای کار با پایگاههای داده.
۴. استقرار مدلها
- Docker: برای ایجاد محیطهای مجازی و کپسوله کردن برنامهها.
- Kubernetes: برای مدیریت و مقیاسدهی کانتینرها.
۵. سیستمهای CI/CD
- Jenkins، GitLab CI یا GitHub Actions: برای خودکارسازی فرآیندهای ادغام و استقرار.
۶. نظارت و مانیتورینگ
- Prometheus و Grafana: برای مانیتورینگ و بصریسازی دادهها.
- Seldon یا MLflow: برای نظارت بر مدلها.
۷. مدیریت مدل
- MLflow: برای ردیابی و مدیریت چرخه عمر مدل.
- DVC (Data Version Control): برای مدیریت نسخههای داده و مدل.
- AWS، Google Cloud Platform، یا Azure و یا ابرآروان: برای استقرار و مقیاسدهی مدلها.
۹. ابزارهای همکاری
- Git: برای کنترل نسخه و همکاری تیمی.
- Jupyter Notebook: برای مستندسازی و به اشتراکگذاری کد.
۱۰. بهترین شیوهها
- آشنایی با اصول DevOps و Agile.
باز هم تکرار مینمائیم که اینها تنها بخشی از ابزارهایی هستند که از یک متخصص امالآپس انتظار میرود که به آنها مسلط باشند. بطور حتم برخی از شرکتها و سازمانها برای خودشان ابزراهای تخصصی خاصی نیز دارند. بعد از جذب شدن در این مجموعهها، تیم آموزشی آنها موارد لازم را بما آموزش خواهند داد. پس جای نگرانی نیست که ما همهچیزدان نیستیم. توجه کنید که، ما باید کلیت کار را در این وادی خوب بدانیم و تسلط بر تمام این ابزارها لازم نیست.
آیا بطور آکادمیک میتوان وارد امالآپس شد؟
ورود به حوزهی امالآپس به طور آکادمیک ممکن است و میتواند به شما در درک عمیقتری از مفاهیم و تکنیکهای مرتبط با یادگیری ماشین و عملیات آن کمک کند. اما این رشته چون بسیار نوظهور و جوان است در بسیاری از کشورها هنوز رشتهای دانشگاهی با این عنوان وجود ندارد. اما در ادامه به چند راهکار برای ورود آکادمیک یا آموزشگاهی به این حوزه اشاره مینمائیم:
۱. تحصیلات دانشگاهی
- مدرک کارشناسی: رشتههایی مانند علوم کامپیوتر، مهندسی نرمافزار، آمار یا ریاضی میتوانند پایه خوبی برای ورود به امالآپس باشند.
- مدرک کارشناسی ارشد یا دکترا: تحصیلات تکمیلی در زمینه یادگیری ماشین، دادهکاوی یا هوش مصنوعی میتواند درک عمیقتری از مباحث پیشرفته و پژوهشهای روز را فراهم کند.
- دورههای کوتاه مدت دانشگاهی: در برخی از دانشگاهها در سطح جهان در مواردی مشاهده میشود که دورههای یکساله تحت عنوان ارشد یا مستر کامپیوتر با تاکید بر امالآپس برگزار میگردد. میتوانید از این طریق اقدام نمائید.
۲. دورههای تخصصی
- شرکت در دورههای آنلاین یا کارگاههای آموزشی که به موضوعات امالآپس، یادگیری ماشین و دادهکاوی میپردازند.
- پلتفرمهایی مانند Coursera، Udemy و Udacity دورههای مرتبط با امالآپس را ارائه میدهند.
- متاسفانه در ایران در حال حاضر کورسی در این وادی به زبان فارسی وجود ندارد و فراگیر مجبو است که ابتدا برای هر سه حوزه یادگیری ماشین، مهندسی داده و دواپس کلاس جداگانه برود و در نهایت با توجه به مطالعه مقالات انگلیسی و کتب مرجع به یک جمع بندی در خصوص مهارتهای خود برسد تا بتواند به بهترین شکل ممکن از آنها استفاده کند.
۳. تحقیق و پروژههای عملی
- مشارکت در پروژههای تحقیقاتی در دانشگاهها یا مؤسسات تحقیقاتی در کنار اساتید راهنمای خود.
- انجام پروژههای عملی که شامل استقرار و مدیریت مدلهای یادگیری ماشین باشد.
۴. انتشار مقالات علمی
- نوشتن و انتشار مقالات در کنفرانسها و مجلات علمی مرتبط با امالآپس و یادگیری ماشین فرصتهای جدیدی را برای شما به ارمغان خواهد آورد.
۵. شبکهسازی و همکاری
- شرکت در کنفرانسها، سمینارها و کارگاههای تخصصی برای ایجاد ارتباط با پژوهشگران و متخصصان حوزه.
۶. گواهینامههای حرفهای
- اخذ گواهینامههای تخصصی در زمینه یادگیری ماشین و امالآپس از مؤسسات معتبر. توجه نمائید که مدرک به تنهایی کاری برای ما نخواهد کرد و اولین و مهمترین مورد کسب مهارتهای تخصصی عمیق در این وادی میباشد.
بازار کار امالآپس چگونه است؟
بازار کار امالآپس در حال رشد و توسعه میباشد و نیاز به متخصصان در این حوزه به طور چشمگیری افزایش یافته است. با توجه به گسترش استفاده از یادگیری ماشین در صنایع مختلف، از جمله فناوری، بهداشت، مالی و تولید، و هر آنچه که به دیتا وابسته است، شرکتها به دنبال افراد با مهارتهای ترکیبی در یادگیری ماشین و عملیات فنی هستند. این شرایط منجر به فرصتهای شغلی متنوع و حقوقهای رقابتی برای متخصصان امالآپس شده است. چون کسبوکارها ترجیح میدهند که بجای استخدام سه نفر، یک آچار فرانسه را بکار بگیرند تا تمامی کارهای خودشان را در این حوزه به انجام برساند، قطعن آن یکنفر دریافتی بسیار بالایی خواهد داشت.
کتابی در این حوزه وجود دارد؟
در این دوره دو کتاب خوب وجود دارد که به ترتیب تصویر آنها را برای شما قرار میدهیم. هر دوی این کتابها براحتی از طریق سایت Libgen در دسترس هستند. دو عنوان انتهایی را بنده بطور کامل خواندهام و بسیار از قلم این دو نویسنده لذت بردم (کتاب اول در 2022 به چاپ رسیده و عنوان دومی دقیقن از همین دو نویسنده در 2024 وارد بازار نشر شده است).
جمع بندی:
امالآپس نیز همانند بسیاری از حوزههای تخصصی دیگر در دنیای هوش مصنوعی بسرعت در حال رشد و گسترش میباشد و دلیل اصلی ترند (گرایه) شدن این فیلد به عقیدهی بنده این میباشد که سازمانها تمایل به بزرگ کردن تیمهای آیتی خود نداشته و علاقمند هستند نیروهای کمتر اما با تخصص بیشتری را بکار بگیرند. به همین دلیل اینروزها میشنویم که در مصاحبههای تخصصی، بعنوان مثال در حوزه دیتاساینس، مهندسی داده و یا یادگیری ماشین، اغلب سوالاتی مطرح میگردد که کامل متوجه خواهیم شد نیاز به افرادی دارند که سطح وسیعی از ابزارها و تکنولوژیها را بدانند. هر چند که به شخصه با این روند مخالف هستم، اما در مقابل ترندهای جهانی و در این نابسامانیهای اقتصاد جهانی، آنقدر قدرت نداریم تا نظرات خودمان را تحمیل کسبوکارها کنیم.
بطور خلاصه یک مهندس یا متخصص امالآپس کسی است که بتواند بطور همزمان کار سه حوزهی تخصصی را انجام بدهد؛
1- یادگیری ماشین 2- مهندسی داده و 3- دواپس
و یاگیری همیشه تداوم دارد ✌
پینوشت:
شخصی که از دنیای دیتا هیچ نمیداند، اگر بدون هیچ آموزشی و به یکباره وارد امالآپس شود، یک گناه کبیره و نابخشودنی در حق خود انجام داده؛ چون به عقیده بنده این فرد تبدیل به یک مهره سوخته خواهد شد. چنین حوزههای نیاز به پختگی و مهارتهای عمیق دارند که اگر متقاضی نداشته باشد، نمیتواند در محیط کاری آنگونه که باید و شاید، عمل کند و این باعث سرخوردگی ایشان خواهد شد.
از طرفی، شخصی که در وادی دیتا و هوش مصنوعی، حداقل دو سال کار کرده، یکی از بهترین انتخابها برای ایشان در حال حاضر امالآپس هست. در واقع شخص بعد از کسب برخی از تجربیات، دانش خود را بسمتی هدایت میکند که بتواند صفر تا صد یک محصول مبتنی بر دیتا و یادگیری ماشین را توسعه داده و در سرورهای سازمان مستقر کند؛ و در حال حاضر چنین نیروهایی حکم الماس را برای کمپانیها پیدا کردهاند. بسیار نادر ولی قیمتی.
3 پاسخ
با سلام،
برای ورود به حوزه MLOps، آیا ضروری است که DevOps بلد باشیم؟ متن وبلاگ را مطالعه کردم اما متوجه نشدم که DevOps به عنوان پیشینه، مزیت هست یا ضروری. فقط برخی مفاهیم یا تکنولوژیهای بکار رفته که در DevOps و MLOps همپوشانی دارند، لازم است بدانیم؟
سایت libgen.is را در virustotal.com بررسی کردم و نشان داد که سایت libgen.is ویروسی است.
با تشکر
سلام بر جناب تجلی عزیز. کاشکی اسمت رو مینوشتی و من میتونستم به اسم شما رو صدا بزنم. بهرحال
اول عرض کنم که سایت لیبجن رو آنلینک کردم، که خدایی نکرده ضرری به کسی نرسد، هر چند که خودم تمام کتب رو از اینجا میگیرم.
دوم باید بگم خدمت شما که دواپس هم برای خودش اقیانوسی هست. اما در دنیای امالآپس چون در نهایت شخص باید مدلی که ساخته رو در سرورها دیپلوی کند، هر چقدر به مباحث دواپس تسلط بیشتری داشته باشد، کار با سهولت و نرمی بیشتری انجام خواهد شد. در محیطهای کاری درست است که شرح وظایف افراد گاهن کاملن مشخص است، اما همه ماها میدونیم که این فقط روی کاغذ اعمال میشه و همیشه مهرههایی وجود دارند که 80 درصد کار روی دوش اونهاست.
پس نیاز به دانش دواپس برای یک متخصص امالآپس یک ضرورت است تا مزیت.
سپاس از پاسخ و راهنمایی شما.
نام من، بابک هست.