دوره جامع ام ال آپس

Machine Learning Operations

کل فرایند، از توسعه‌ی مدل‌های یادگیری ماشین تا استقرار آن در سرورهای عملیاتی سازمان را بیاموزید

مدرس: دکتر محمد فزونی

زمان تا آغاز دوره

روز
ساعت
دقیقه
ثانیه

ویژگی‌های دوره

با ساده‌ترین و اصولی‌ترین روش بیاموزید

یکی از بارزترین ویژگی‌های تدریس آقای دکتر فزونی در این کورس، زبان ساده و روان و صد البته شیوه‌ی اصولی انتقال مطالب ایشان می‌باشد. تمامی موارد بصورت عملی به فراگیر نشان داده خواهد شد و از بروزترین منابع آموزشی بهره خواهیم برد. تلاش خواهیم نمود که از ذکر جزئیات و مفاهیم تئوری که همه‌جا می‌توان آنها را یافت، اجتناب کنیم و به اصل مطلب بپردازیم.  

چرا ام‌ال‌آپس بیاموزیم؟

در سال‌های اخیر، صاحبان کسب‌وکار در سراسر دنیا، ترجیح می‌دهند که بجای بکارگیری و استخدام سه تیم مختلف یادگیری ماشین، مهندسی داده و مهندسی دواپس، تعدادی متخصص ام‌ال‌آپس را بکار بگیرند که به هر سه موضوع فوق مشرف هستند. بدین طریق آنها می‌توانند هزینه‌های جاری خود را تا حد امکان کنترل نموده و بهره‌وری تیم‌های خود را تا حد بسیار زیادی ارتقاء دهند. بنابراین نیاز بازار به متخصصین ام‌ال‌آپس هر روز در حال ازدیاد هست. دیگر مثل سابق تنها توسعه‌ی یک مدل یادگیری ماشین اهمیت ندارد. همه بدنبال توسعه تا استقرار مدل‌های یادگیری ماشین روی سرورهای مجموعه می‌باشند.

کاملن عملی و مناسب بازار کار

سرفصل‌های این دوره

در این قسمت از دوره، سعی می‌کنیم که در کوتاه‌ترین مدت ممکن به ذکر مفاهیم بنیادی از دنیای یادگیری ماشین بپردازیم. البته تلاش خواهیم نمود که تا حد ممکن از ذکر مفاهیم تئوری پرهیز نموده و بیشتر روی انجام کارها بصورت عملی متمرکز شویم.

در این بخش به ذکر اصلی‌ترین مفاهیم موجود در دنیای مهندسی داده می‌پردازیم. نکات مطرح شده در این بخش از کتاب مطرح و پرآوازه‌ی «Fundamentals of Data Engineering» اخذ خواهد شد.

در حال حاضر، بهترین زبان برنامه‌نویسی در دنیای دیتا، پایتون می‌باشد. بنابراین در این کورس تا حد ممکن به بیان مهم‌ترین نکات کار با این زبان برنامه‌نویسی خواهیم پرداخت. 

در این بخش، به نصب WSL در ویندوز پرداخته و سپس اصلی‌ترین دستورات این سیستم عامل را در دنیای مهندسی داده بررسی خواهیم نمود. اگر کامپیوتر شما MacOS است نیازی به این کار نخواهید داشت.

برای اینکه مدل یادگیری ماشین خود را از محیط تست و توسعه به محیط پروداکشن منتقل کنیم، نیاز داریم که ابتدا مدل یادگیری ماشینی که توسعه داده‌ایم را پکیج نموده و آنرا با تمام وابستگی‌های خود به سرورها منتقل نمائیم. در این بخش سعی می‌نمائیم که با انجام یک کار عملی، کل این فرایند را بشما نشان دهیم.

ام‌ال فلو (MLflow) یک پلتفرم متن‌باز برای مدیریت چرخه‌ی عمر (lifecycle) مدل‌های یادگیری ماشین است. این پلت‌فرم شامل چهار مؤلفه‌ی اصلی است:

1. ردیابی مدل‌ها: امکان ردیابی و مستندسازی آزمایشات و نتایج مدل‌ها را فراهم می‌کند.
2. مدیریت مدل: امکان ذخیره، بارگذاری و به اشتراک‌گذاری مدل‌ها را فراهم می‌آورد.
3. اجرای مدل: امکان اجرای مدل‌ها در محیط‌های مختلف را می‌دهد.
4. مدیریت پروژه: به کاربران اجازه می‌دهد پروژه‌های یادگیری ماشین را سازماندهی کنند.

با استفاده از MLflow، تیم‌ها می‌توانند همکاری بهتری داشته باشند و روند توسعه مدل‌ها را بهینه کنند. در این کورس با این ابزار قدرتمند در دنیای ام‌ال‌آپس آشنا شده و اقدام به انجام کار عملی با آن می‌نمائیم. 

FastAPI و Streamlit دو فریم‌ورک مختلف در زبان برنامه‌نویسی پایتون هستند که هر کدام برای اهداف خاص خود طراحی شده‌اند. اما یک مقایسه‌ی بسیار کلی به این دو بشرح ذیل است:

– FastAPI: بیشتر برای ساخت API و سرورهای وب استفاده می‌شود.
– Streamlit: برای ایجاد اپلیکیشن‌های تحلیلی و نمایشی از داده‌ها طراحی شده است.

در این کورس به کمک این دو فریم‌ورک محبوب، اقدام به ساخت اپلیکیشن‌های یادگیری ماشین می‌نمائیم. 

امروزه تمامی مجموعه‌ها در حوزه‌ی تکنولوژی در صورتی که بخواهند یک کار تیمی در حوزه‌ی نرم‌افزار و یا دیتا انجام بدهند، قطعن یک سیستم مدیریت ورژن کد را برای خود انتخاب نموده و طبق آن پیش خواهند رفت. در این کورس آموزشی ما شما را با گیت و گیت‌هاب که جزو بهترین سیستم‌های کنترل ورژن کدها می‌باشد آشنا خواهیم نمود. مفاهیم ابتدایی را بطور کامل مطرح می‌کنیم و به انجام کار عملی در این حوزه خواهیم پرداخت تا شما بطور کامل و دقیق با روند آشنا بشوید.

گیت‌هاب اکشنز یک ویژگی CI/CD (ادغام مداوم/انتشار مداوم) است که توسط گیت‌هاب ارائه می‌شود و به توسعه‌دهندگان امکان می‌دهد که جریان‌های کاری یا پایپ‌لاین‌های خود را به طور خودکار در مخزن‌های گیت‌هاب تنظیم کنند. این کار با استفاده از فایل‌های YAML برای تعریف جریان‌های کاری که می‌توانند با رخدادهای مختلفی مانند ارسال کد (code pushes)، درخواست‌های کشش (Pull request) یا مشکلات (issues) فعال شوند، انجام می‌شود. در حال حاضر در اکثر کمپانی‌های مطرح دنیا، اکثر توسعه‌دهندگان و مهندسان داده از این عملیات‌ها برای محیط پروداکشن مجموعه استفاده می‌نمایند.

تعداد جلسات: 2 جلسه

گیت‌هاب اکشنز یک ویژگی CI/CD (ادغام مداوم/انتشار مداوم) است که توسط گیت‌هاب ارائه می‌شود و به توسعه‌دهندگان امکان می‌دهد که جریان‌های کاری یا پایپ‌لاین‌های خود را به طور خودکار در مخزن‌های گیت‌هاب تنظیم کنند. این کار با استفاده از فایل‌های YAML برای تعریف جریان‌های کاری که می‌توانند با رخدادهای مختلفی مانند ارسال کد (code pushes)، درخواست‌های کشش (Pull request) یا مشکلات (issues) فعال شوند، انجام می‌شود. در حال حاضر در اکثر کمپانی‌های مطرح دنیا، اکثر توسعه‌دهندگان و مهندسان داده از این عملیات‌ها برای محیط پروداکشن مجموعه استفاده می‌نمایند.

تعداد جلسات: 2 جلسه

بعد از استقرار مدل‌های یادگیری ماشین، مانیتور کردن رفتار مدل یک امر حیاتی و اساسی می‌باشد که اگر صورت نگیرد، مدل ما بسرعت کیفیت کار خود را از دست خواهد داد. به همین منظور باید بطور مداوم رفتار آنرا بررسی کرده و اگر در نقطه‌ای از کار، مشکلی وجود دارد آنرا به اصطلاح دیباگ یا رفع نمائیم و یا اینکه مدل خود را مجدد آموزش دهیم. در این کورس با این دو مفهوم آشنا شده و با ابزارهای اساسی در این حوزه اقدام به کار عملی خواهیم نمود. 

همانگونه که در بخش مانیتوریگ شرح داده شد، بعد از دیپلوی نمودن مدل یادگیری ماشین ما ملزم به انجام یکسری اقدامات و امورات هستیم که تا حد ممکن، کیفیت پیش‌بینی (یا هر آنچه مدل ما قصد آنرا دارد) بالا و در حد مطلوبی نگهداریم. در این کورس اقدامایت از جمله امنیت، محرمانگی دیتا بعد از استقرار، و مواردی اینچنینی را بحث و بررسی می‌نمائیم و با ابزارهای مطرح در این راستا کار عملی خواهیم نمود.

آشنایی با پایگاه‌های داده، جزو مهم‌ترین دانسته‌های یک مهندس داده قلمداد می‌گردد. در سال‌های اخیر پوستگرس بعنوان یکی از پیشرفته‌ترین دیتابیس‌ها در دنیای متن‌باز، جایگاه ویژه‌ای را بین صاحبان کسب‌وکارها یافته است. از این روی، آشنایی و کار بصورت حرفه‌ای با این پایگاه داده از اهمیت بسیار زیادی برای مهندسین داده برخوردار می‌باشد. در این کورس، با ابزارهای گرافیکی و خط‌فرمان این پایگاه داده آشنا شده و در این محیط اقدام به آموزش زبان SQL خواهیم نمود. همچنین، برای کامل‌ نمودن معلومات شرکت‌کنندگان، دوره‌ آموزشی «دیتابیس و سی‌کو‌ال برای علم داده» نیز بصورت رایگان در اختیار شما قرار خواهد گرفت.

در این‌روزها که حرف از معماری میکروسرویس همه‌جا هست و فراگیر شده، غیرممکن است که بدون داکر بتوانیم کاری از پیش ببریم. پس با داکر بعنوان یکی از ابزارهای اساسی در دنیای مهندسی داده کار خواهیم نمود.

در دنیای مهندسی داده ETL یکی از کارهای روزمره و اساسی هر مهندس داده است. آپاچی ایرفلو که یکی از اساسی‌ترین ابزارهای مدیریت جریان داده است، به این افراد کمک می‌کند که دیتاپایپ‌لاین‌های مجموعه را براحتی رصد کرده و مدیریت نمایند. از این طریق، بسادگی می‌توانیم نقاطی که دارای مشکل و خطا هستند را ببینیم و در اولین فرصت ممکن به رفع مشکلات بپردازیم.

سال‌ها بود که سیستم‌های یکپارچه از پایگاه‌های داده بعنوان محلی برای تجمیع داده‌ها و ارسال به مصرف‌کنندگان دیتا استفاده می‌کردند. اما معماری میکروسرویس این را برنمی‌تابد. در این معماری باید تولیدکنندگان و مصرف‌کنندگان داده تا حد ممکن از یکدیگر مجزا شوند. اینجا بود که آپاچی کافکا بعنوان یک مکان خاص برای دریافت و ارسال داده‌ها وارد کار شد. آپاچی کافکا در حال حاضر یکی از مهم‌ترین ابزارهای ممکن در دنیای پردازش داده‌های استریم و در لحظه است. میزان تاخیر ارسال داده‌ها در این سیستم در پایین‌ترین حد ممکن قرار دارد. از این رو، آپاچی کافکا توسط 80 درصد شرکت‌های مختلف در حوزه‌ی تکنولوژی دنیا بکار گرفته خواهد شد. در این دوره یکی از مباحث اصلی کار، کافکا می‌باشد که تا حد بسیار عمیقی با آن آشنا خواهیم شد و کارهای عملی عمیقی در آن انجام می‌دهیم.

زمانی هدوپ حرف اول و آخر دنیای پردازش داده‌ها را می‌زد. مهندسین در این حوزه بالاترین دستمزد ممکن را داشتند. تا اینکه آپاچی اسپارک متولد شد و با سرعت وحشتناک خود و اینکه یک سیستم پردازش داده‌ی توزیع‌شده بود، همگان را شگفت‌زده کرد. در این کورس، سعی خواهیم نمود که علاوه بر کافکا، اسپارک را نیز در حد بسیار حرفه‌ای بشما آموزش دهیم. مشابه با کافکا، در این حوزه نیز با دو زبان پایتون و جاوا با هسته‌ی اسپارک ارتباط برقرار خواهیم نمود. با اسپارک تقریبن هر کاری که یک مهندس داده و یک متخصص ام‌ال‌آپس نیاز به آن دارد را می‌توانیم انجام دهیم. از کوئری‌نویسی‌ها در زبان SQL گرفته تا انجام و پیاده‌سازی الگوریتم‌های یادگیری ماشین.

بعد از ظهور دیتابیس‌های رابطه‌ای و عملکرد فوق‌العاده‌ی آنها بتدریج وارد عصری شدیم که دیگر این نوع از دیتابیس‌ها پاسخگوی نیازهای سازمان‌ها نبودند. در این زمان بود که دیتاورهوزها پا به عرضه‌ی وجود گذاشتند. ام بعد از مدت کوتاهی بخاطر حجم بالای داده، این ساختار نیز با مشکلاتی مواجه شد. عصر هوش مصنوعی مفهوم و ساختاری با عنوان دیتالیک را برای ما به ارمغان آورد. اما باز هم گذشت زمان بما ثابت کرد که باز هم زیرساخت‌هایی دیتایی مجموعه خالی از نقص نیست. تا اینکه رسیدیم به ساختار Data Lake House که به کمک ابزارهایی همانند Delta Lake که توسط تیم اسپارک توسعه داده شده بود، اجرا می‌گردید. 
در این دوره یک جلسه را به طراحی و ساخت یک دیتالیک‌هوز با کمک دلتالیک اختصاص داده‌ایم. 

در این قسمت با مفاهیم کلیدی کلاد کامپیوتینگ یا همان محاسبات ابری و سرویس‌های مختلف در پنل ابری ابرآروان آشنا خواهیم شد. تلاش خواهیم نمود که بخش زیادی از تسک‌های دوره را روی این سرویس دهنده‌ی خدمات ابری پیاده‌سازی نمائیم تا شما بصورت عملی با محیط پروداکشن یا تولید بطور کامل آشنا شوید.

یکی از ضعف‌های آپاچی اسپارک این است که سیستمی برای مدیریت کلاستر و نودها ندارد. در دنیای ام‌ال‌آپس به کمک کوبرنتیز که یک ابزار فوق‌العاده قدرتمند است، سعی خواهیم نمود که یک یک کلاستر اسپارک را پیاده‌سازی کرده و مدیریت آنرا به کوبرنتیز بسپاریم. کوبرنتیز، در ابتدا توسط گوگل توسعه داده شد. اما مدتی بعد تبدیل گردید به یک پروژه‌ی متن‌باز. در حال حاضر این ابزار تبدیل شده است به حالت پیش‌فرض در دنیای مدیریت کانتینرها. 

در این کورس ابتدا مقدمات و مفاهیم اساسی این ابزار را خواهیم آموخت. سپس، به انجام کارهای عملی ممکن که یک مهندس داده به آن معلومات و دانسته‌ها نیاز دارد، می‌پردازیم.

در آخرین بخش از این دوره، با تمامی ابزارهایی که کار عملی کردیم، اقدام به ساخت یک مدل یادگیری ماشین نموده و آنرا در سرورهای ابری دیپلوی می‌نمائیم. سپس عملیات پایانی یعنی مانیتورینگ و امورات امنیتی برای محافظت از مدل خود را انجام خواهیم داد. این پروژه تا حد بسیار زیادی بما کمک خواهد نمود که بتوانیم مفاهیم تئوری ذهنی خود را بصورت عملیاتی در آورده و آنها را بسازیم. 

ثبت‌نام و ورود به دنیای ام ال آپس

در صورت تمایل همین امروز ثبت‌نام نمائید. ممکن است بخاطر عدم ثبات در شرایط اقتصادی کشور، قیمت دوره افزایش پیدا کند!

فراگیران هدف

این دوره مناسب چه افرادی هست؟

یک دوره کاملن جامع و کاربردی

نیاز به هیچ دانش ابتدایی ندارید

در این دوره ما فرض می‌کنیم که شما دانش بسیار محدودی از دنیای کامپیوتر و ام‌ال‌آپس دارید. تلاش می‌کنیم که تمامی موارد و مفاهیم را بصورت کاملن عملی و کاربردی بشما منتقل نمائیم. در پایان دوره متوجه حجم عظیم دانشی که کسب نموده‌اید خواهید شد.

سلام

من محمد فزونی هستم

عضو هئیت علمی دانشگاه گنبدکاووس و دانشیار گروه ریاضی و آمار در این دانشگاه (مشاهده‌ی صفحه‌ی دانشگاهی بنده). از سال 1393 بطور رسمی وارد حرفه‌ی تدریس شدم و تا امروز و با افتخار بیش از هزاران دانشجو را در ایران و خارج از کشور تربیت نمودم.

10+

کورس مختلف

15+

سال تجربه

200 K+

بازدید در یوتیوب

10 K+

دانشجو

معرفی سرفصل‌های دوره

ام‌ال‌آپس چیست؟

در دهه‌ی گذشت شاهد حضور بی‌نظیر هوش مصنوعی و مباحث تحلیل داده در سازمان‌های مختلف بودیم. اما گذشت زمان به همگان ثابت نمود که بدون بستر دیتایی مناسب انجام پروژه‌هایی که وابسته به دیتا می‌باشد، غیر ممکن است. در نتیجه مهندسی داده (Data Engineering) متولد شد تا پاسخی باشد به این نیاز؛ یعنی حوزه و رشته‌ای که بستر و زیر ساخت دیتایی را برای کسب‌وکارها تهیه و تدارک می‌بیند. اما دنیای هوش مصنوعی که بسرعت باد در حال توسعه و تکامل است، اخیرن برگ دیگری را برای ما رو کرده و آن هم نیاز به متخصصین ام‌ال‌آپس می‌باشد که به خواسته‌های تخصصی سازمان‌ها پاسخ مناسب‌تر و سریع‌تری بدهند. در ادامه سعی می‌کنیم به این سوال که «ام‌ال‌آپس چیست و چگونه وارد این حوزه بشویم؟» پاسخ بدهیم.

اما ابتدا باید یک تعریف کلی از این حوزه داشته باشیم:

ام‌ال‌آپس (MLOps = Machine Learning Operations) یا عملیات یادگیری ماشین به مجموعه‌ای از فرآیندها، ابزارها و بهترین شیوه‌ها (Best Practices) اشاره دارد که به تیم‌های داده‌ کاوی و یادگیری ماشین کمک می‌کند تا مدل‌های یادگیری ماشین را از مرحله توسعه تا تولید و نگهداری به طور مؤثر مدیریت نمایند (ادامه این نوشتار را در این لینک و مقاله مطالعه نمائید).

در این دوره مفاهیم تئوری را از کتاب زیر خواهیم گفت که توسط متخصصان گوگل در سال 2024 به چاپ رسیده و در حال حاضر یکی از بهترین کتاب‌ها در دنیای MlOps و یا صنعتی‌سازی مدل‌های یادگیری ماشین محسوب می‌شود:

چه می‌گویند؟

برخی از نظرات فراگیران قبلی

جلسه اول دوره را در یوتیوب و در این آدرس ببینید. 

برخی از مشتریان ما

سوالی در ذهن دارید؟

سوالات متداول

بله. از طریق نرم‌افزار اسپات‌پلیر دسترسی به تمامی ویدیوها خواهید داشت. برای هر شخص یک لایسنس صادر خواهد شد. در صورتی که لایسنس شما به هر دلیلی از کار بیافتد باید برای دریافت لایسنس دوم مبلغی را پرداخت نمائید. در نتیجه در حفظ و نگهداری کد مربوط به خود نهایت دقت را مبذول فرمائید.

تمامی سوالات و ابهامات هنرجویان توسط مدرس، آقای دکتر فزونی، پاسخ داده خواهد شد. یک گروه تلگرامی داریم که بعد از ثبت‌نام در آنجا عضو خواهید شد. به تفکیک هر درس، یک تاپیک وجود دارد که در همان بخش سوالات را مطرح می‌نمائید.

روز مشخصی ندارد و زمان و روز کلاس‌های آنلاین توسط مدرس و با هماهنگی با هنرجویان تنظیم خواهد شد. در نظر داشته باشید که کلاس‌های آنلاین تنها جهت رفع اشکال و گفتگو با شرکت‌کنندگان است. تسک‌های (تمرین‌های) عملی دوره بصورت آفلاین ضبط و در پنل شما قرار خواهند گرفت.

بله. می‌توانید وجه ثبت‌نام را در دو قسط با مشخصات زیر واریز نمائید

  • 3 میلیون (پرداختی اول)
  • 2 میلیون و نهصد هزار تومان (قسط دوم، سی روز پس از ثبت‌نام)

به منظور ثبت‌نام قسطی به این صفحه مراجعه نمائید و در بخش توضیحات مرقوم بفرمائید که وجه پرداختی جهت ثبت‌نام در چه دوره‌ای هست.

  • توجه بفرمائید در حالتی که شما دوره را بصورت قسطی تهیه بفرمائید، تنها به اندازه میزان پرداختی، دسترسی شما به ویدیوها باز خواهد شد.
  • اگر در موعد مقرر، مبلغ قسط خود را پرداخت ننمائید، مجموعه می‌تواند دسترسی شما را قطع نماید.

بدانید که آرزوی تیم آموزشی ما این است که بتوانیم شما را در مسیر درست قرار دهیم. پس از موارد مطرح شده برداشت منفی نفرمائید. 

در حالت کلی خیر. بهترین مدرک، مهارت‌هایی است که کسب می‌نمائید. ولی در صورت نیاز و درخواست برای شما مدرک نیز صادر خواهیم نمود.

هیچ کورسی در دنیا (در دنیای تکنولوژی) بعد از اتمام شما را مستقیم به شغل و درآمد نخواهد رساند. تنها تداوم در یادگیری و شرکت در جلسات مصاحبه مسیر را برای شما باز می‌کند. پس درگیر عناوین تبلیغاتی مختلف نشوید. اما مطمئن باشید که این مهارت‌ها بسیار فراگیر بوده و نیاز به آنها در حال حاضر بسیار زیاد است. ولی در این دوره چون عمق مطالب را بیشتر نمودیم، قطعن شما توانمندی‌هایی بسیار خاص را کسب خواهید نمود که ضامن موفقیت در جلسات مصاحبه می‌باشد.

مدرس تمامی موارد را بشما خواهد گفت، اما شما باید سطح مطلوبی از اطلاعات را از دنیای کار با داده‌ها داشته باشید که بتوانید بهترین نتیجه ممکن از این دوره را بگیرید. 

تمامی آموزش‌ها برای سیستم عامل ویندوز که فراگیرتر است، تهیه می‌شوند. اما شما براحتی می‌توانید دروس را در لینوکس و یا مک نیز پیاده‌سازی نمائید. 

باز هم سوال دارید؟

ما با بیش از 12 سال سابقه آموزشی موفق، به افراد کمک می‌کنیم که در هر جای دنیا که باشند، از یک آموزش استاندارد و بروز
در زمینه‌های مختلف آکادمیک، از جمله مهندسی داده، علم داده و ام‌ال‌آپس بهره‌مند شوند