دوره جامع مهندسی داده

Data Engineering Course

(پنجمین دوره)

هر چیزی که برای ورود به دنیای مهندسی داده نیاز دارید را در این دوره خواهید آموخت!

مدرس: دکتر محمد فزونی

ویژگی‌های دوره

با ساده‌ترین و اصولی‌ترین روش بیاموزید

یکی از بارزترین ویژگی‌های تدریس آقای دکتر فزونی در این کورس، زبان ساده و روان و صد البته شیوه‌ی اصولی انتقال مطالب ایشان می‌باشد. تمامی موارد بصورت عملی به فراگیر نشان داده خواهد شد و از بروزترین منابع آموزشی بهره خواهیم برد. تلاش خواهیم نمود که از ذکر جزئیات و مفاهیم تئوری که همه‌جا می‌توان آنها را یافت، اجتناب کنیم و به اصل مطلب بپردازیم.  

کاملن عملی و مناسب بازار کار

سرفصل‌های این دوره

در این بخش به ذکر اصلی‌ترین مفاهیم موجود در دنیای مهندسی داده می‌پردازیم. نکات مطرح شده در این بخش از کتاب مطرح و پرآوازه‌ی «Fundamentals of Data Engineering» اخذ خواهد شد.

تعداد جلسات: 1 جلسه

🛑 هر جلسه بین 60 الی 90 دقیقه می‌باشد که ممکن است در قالب یک الی چند ویدیو منتشر گردد.

در این بخش، به نصب WSL در ویندوز پرداخته و سپس اصلی‌ترین دستورات این سیستم عامل را در دنیای مهندسی داده بررسی خواهیم نمود. اگر کامپیوتر شما MacOS است نیازی به این کار نخواهید داشت. 

تعداد جلسات: 1 جلسه

امروزه تمامی مجموعه‌ها در حوزه‌ی تکنولوژی در صورتی که بخواهند یک کار تیمی در حوزه‌ی نرم‌افزار و یا دیتا انجام بدهند، قطعن یک سیستم مدیریت ورژن کد را برای خود انتخاب نموده و طبق آن پیش خواهند رفت. در این کورس آموزشی ما شما را با گیت و گیت‌هاب که جزو بهترین سیستم‌های کنترل ورژن کدها می‌باشد آشنا خواهیم نمود. مفاهیم ابتدایی را بطور کامل مطرح می‌کنیم و به انجام کار عملی در این حوزه خواهیم پرداخت تا شما بطور کامل و دقیق با روند آشنا بشوید.

تعداد جلسات: 1 جلسه 

در حال حاضر، بهترین زبان برنامه‌نویسی در دنیای دیتا، پایتون می‌باشد. بنابراین در این کورس تا حد ممکن به بیان مهم‌ترین نکات کار با این زبان برنامه‌نویسی خواهیم پرداخت. همچنین توجه بفرمائید که اگر بخواهید (که قطعن قصد شما همین است) مهندسی داده را بصورت حرفه‌ای دنبال کنید و با ابزارهایی مثل کافکا و اسپارک کار نمائید، طبیعتن به جاوا و قدرت فوق‌العاده‌ی عملکردی آن نیاز پیدا خواهید نمود. پس شما را با جاوا و مهم‌ترین نکات کار با آن نیز آشنا خواهیم نمود.

تعداد جلسات: 1 جلسه

آشنایی با پایگاه‌های داده، جزو مهم‌ترین دانسته‌های یک مهندس داده قلمداد می‌گردد. در سال‌های اخیر پوستگرس بعنوان یکی از پیشرفته‌ترین دیتابیس‌ها در دنیای متن‌باز، جایگاه ویژه‌ای را بین صاحبان کسب‌وکارها یافته است. از این روی، آشنایی و کار بصورت حرفه‌ای با این پایگاه داده از اهمیت بسیار زیادی برای مهندسین داده برخوردار می‌باشد. در این کورس، با ابزارهای گرافیکی و خط‌فرمان این پایگاه داده آشنا شده و در این محیط اقدام به آموزش زبان SQL خواهیم نمود. همچنین، برای کامل‌ نمودن معلومات شرکت‌کنندگان، دوره‌ آموزشی «دیتابیس و سی‌کو‌ال برای علم داده» نیز بصورت رایگان در اختیار شما قرار خواهد گرفت. 

تعداد جلسات: 2 جلسه

در این‌روزها که حرف از معماری میکروسرویس همه‌جا هست و فراگیر شده، غیرممکن است که بدون داکر بتوانیم کاری از پیش ببریم. پس با داکر بعنوان یکی از ابزارهای اساسی در دنیای مهندسی داده کار خواهیم نمود.

تعداد جلسات: 2 جلسه

در دنیای مهندسی داده ETL یکی از کارهای روزمره و اساسی هر مهندس داده است. آپاچی ایرفلو که یکی از اساسی‌ترین ابزارهای مدیریت جریان داده است، به این افراد کمک می‌کند که دیتاپایپ‌لاین‌های مجموعه را براحتی رصد کرده و مدیریت نمایند. از این طریق، بسادگی می‌توانیم نقاطی که دارای مشکل و خطا هستند را ببینیم و در اولین فرصت ممکن به رفع مشکلات بپردازیم. 

تعداد جلسات: 4 جلسه

سال‌ها بود که سیستم‌های یکپارچه از پایگاه‌های داده بعنوان محلی برای تجمیع داده‌ها و ارسال به مصرف‌کنندگان دیتا استفاده می‌کردند. اما معماری میکروسرویس این را برنمی‌تابد. در این معماری باید تولیدکنندگان و مصرف‌کنندگان داده تا حد ممکن از یکدیگر مجزا شوند. اینجا بود که آپاچی کافکا بعنوان یک مکان خاص برای دریافت و ارسال داده‌ها وارد کار شد. آپاچی کافکا در حال حاضر یکی از مهم‌ترین ابزارهای ممکن در دنیای پردازش داده‌های استریم و در لحظه است. میزان تاخیر ارسال داده‌ها در این سیستم در پایین‌ترین حد ممکن قرار دارد. از این رو، آپاچی کافکا توسط 80 درصد شرکت‌های مختلف در حوزه‌ی تکنولوژی دنیا بکار گرفته خواهد شد.

در این دوره، با دو زبان پایتون و جاوا به آموزش این ابزار اساسی خواهیم پرداخت. تمرکز خود را روی Stream API خواهیم گذاشت تا بصورت کاملن حرفه‌ای این غولِ دنیای پردازش استریم را یاد بگیریم. 

تعداد جلسات: 8 جلسه

زمانی هدوپ حرف اول و آخر دنیای پردازش داده‌ها را می‌زد. مهندسین در این حوزه بالاترین دستمزد ممکن را داشتند. تا اینکه آپاچی اسپارک متولد شد و با سرعت وحشتناک خود و اینکه یک سیستم پردازش داده‌ی توزیع‌شده بود، همگان را شگفت‌زده کرد. در این کورس، سعی خواهیم نمود که علاوه بر کافکا، اسپارک را نیز در حد بسیار حرفه‌ای بشما آموزش دهیم. مشابه با کافکا، در این حوزه نیز با دو زبان پایتون و جاوا با هسته‌ی اسپارک ارتباط برقرار خواهیم نمود. با اسپارک تقریبن هر کاری که یک مهندس داده نیاز به آن دارد را می‌توانیم انجام دهیم. از کوئری‌نویسی‌ها در زبان SQL گرفته تا انجام و پیاده‌سازی الگوریتم‌های یادگیری ماشین. 

تعداد جلسات: 7 جلسه

در این قسمت با مفاهیم کلیدی کلاد کامپیوتینگ یا همان محاسبات ابری و سرویس‌های مختلف در پنل ابری ابرآروان آشنا خواهیم شد. تلاش خواعیم نمود که بخش زیادی از تسک‌هتی دوره را روی این سرویس دهنده‌ی خدمات ابری پیاده‌سازی نمائیم تا شما بصورت عملی با محیط پروداکشن یا تولید بطور کامل آشنا شوید.

تعداد جلسات: 2 جلسه

گیت‌هاب اکشنز یک ویژگی CI/CD (ادغام مداوم/انتشار مداوم) است که توسط گیت‌هاب ارائه می‌شود و به توسعه‌دهندگان امکان می‌دهد که جریان‌های کاری یا پایپ‌لاین‌های خود را به طور خودکار در مخزن‌های گیت‌هاب تنظیم کنند. این کار با استفاده از فایل‌های YAML برای تعریف جریان‌های کاری که می‌توانند با رخدادهای مختلفی مانند ارسال کد (code pushes)، درخواست‌های کشش (Pull request) یا مشکلات (issues) فعال شوند، انجام می‌شود. در حال حاضر در اکثر کمپانی‌های مطرح دنیا، اکثر توسعه‌دهندگان و مهندسان داده از این عملیات‌ها برای محیط پروداکشن مجموعه استفاده می‌نمایند.

تعداد جلسات: 2 جلسه

یکی از ضعف‌های آپاچی اسپارک این است که سیستمی برای مدیریت کلاستر و نودها ندارد. در دنیای مهندسی داده به کمک کوبرنتیز که یک ابزار فوق‌العاده قدرتمند است، سعی خواهیم نمود که یک یک کلاستر اسپارک را پیاده‌سازی کرده و مدیریت آنرا به کوبرنتیز بسپاریم. کوبرنتیز، در ابتدا توسط گوگل توسعه داده شد. اما مدتی بعد تبدیل گردید به یک پروژه‌ی متن‌باز. در حال حاضر این ابزار تبدیل شده است به حالت پیش‌فرض در دنیای مدیریت کانتینرها. 

در این کورس ابتدا مقدمات و مفاهیم اساسی این ابزار را خواهیم آموخت. سپس، به انجام کارهای عملی ممکن که یک مهندس داده به آن معلومات و دانسته‌ها نیاز دارد، می‌پردازیم. 

تعداد جلسات: 4 جلسه

در این بخش به پیاده‌سازی یک سیستم کشف تقلب برای یک مجموعه با تعدادی دفتر و دو دیتابیس خواهیم پرداخت. از ابزارهای زیر جهت پیاده‌سازی این پروژه استفاده خواهیم نمود:

1- آپاچی کافکا

2- آپاچی اسپارک

3- پوستگرس

4- مای اس‌کیوال

5- گرافانا

تعداد جلسات: 3 جلسه

اولین ویدیوی دوره را ببینید

ثبت‌نام و ورود به دنیای مهندسی داده

فراگیران هدف

این دوره مناسب چه افرادی هست؟

یک دوره کاملن جامع و کاربردی

نیاز به هیچ دانش ابتدایی ندارید

در این دوره ما فرض می‌کنیم که شما دانش بسیار محدودی از دنیای کامپیوتر و مهندسی داده دارید. تلاش می‌کنیم که تمامی موارد و مفاهیم را بصورت کاملن عملی و کاربردی بشما منتقل نمائیم. در پایان دوره متوجه حجم عظیم دانشی که کسب نموده‌اید خواهید شد.

سلام

من محمد فزونی هستم

عضو هئیت علمی دانشگاه گنبدکاووس و دانشیار گروه ریاضی و آمار در این دانشگاه (مشاهده‌ی صفحه‌ی دانشگاهی بنده). از سال 1393 بطور رسمی وارد حرفه‌ی تدریس شدم و تا امروز و با افتخار بیش از هزاران دانشجو را در ایران و خارج از کشور تربیت نمودم.

10+

کورس مختلف

15+

سال تجربه

200 K+

بازدید در یوتیوب

10 K+

دانشجو

معرفی سرفصل‌های دوره

مهندسی داده چیست؟

ویدیوی معرفی را می‌توانید بطور مستقیم در آپارات و یا یوتیوب علم داده مشاهده نمائید.

یک سخنرانی عمومی

می‌خواهید به اهمیت مهندسی داده و رایانش ابری پی ببرید؟

اگر ویدیوی زیر برای شما باز نشد، مستقیم از این لینک که در یوتیوب بارگذاری شده است استفاده کنید

چه می‌گویند؟

برخی از نظرات فراگیران قبلی

جلسه اول دوره را در یوتیوب و در این آدرس ببینید. 

برخی از مشتریان ما

سوالی در ذهن دارید؟

سوالات متداول

بله. از طریق نرم‌افزار اسپات‌پلیر دسترسی به تمامی ویدیوها خواهید داشت. برای هر شخص یک لایسنس صادر خواهد شد. در صورتی که لایسنس شما به هر دلیلی از کار بیافتد باید برای دریافت لایسنس دوم مبلغی را پرداخت نمائید. در نتیجه در حفظ و نگهداری کد مربوط به خود نهایت دقت را مبذول فرمائید.

تمامی سوالات و ابهامات هنرجویان توسط مدرس، آقای دکتر فزونی، پاسخ داده خواهد شد. یک گروه تلگرامی داریم که بعد از ثبت‌نام در آنجا عضو خواهید شد. به تفکیک هر درس، یک تاپیک وجود دارد که در همان بخش سوالات را مطرح می‌نمائید.

روز مشخصی ندارد و زمان و روز کلاس‌های آنلاین توسط مدرس و با هماهنگی با هنرجویان تنظیم خواهد شد. در نظر داشته باشید که کلاس‌های آنلاین تنها جهت رفع اشکال و گفتگو با شرکت‌کنندگان است. تسک‌های (تمرین‌های) عملی دوره بصورت آفلاین ضبط و در پنل شما قرار خواهند گرفت.

بله. می‌توانید وجه ثبت‌نام را در سه قسط با مشخصات زیر واریز نمائید

  • 2 میلیون (پرداختی اول)
  • 1 میلیون و هشتصد هزار تومان (قسط دوم، سه هفته پس از ثبت‌نام)
  • 1 میلیون تومان (قسط آخر، 6 هفته پس از ثبت‌نام)

به منظور ثبت‌نام قسطی به این صفحه مراجعه نمائید و در بخش توضیحات مرقوم بفرمائید که وجه پرداختی جهت ثبت‌نام در چه دوره‌ای هست.

  • توجه بفرمائید در حالتی که شما دوره را بصورت قسطی تهیه بفرمائید، تنها به اندازه میزان پرداختی، دسترسی شما به ویدیوها باز خواهد شد.
  • اگر در موعد مقرر، مبلغ قسط خود را پرداخت ننمائید، مجموعه می‌تواند دسترسی شما را قطع نماید.

بدانید که آرزوی تیم آموزشی ما این است که بتوانیم شما را در مسیر درست قرار دهیم. پس از موارد مطرح شده برداشت منفی نفرمائید. 

در حالت کلی خیر. بهترین مدرک، مهارت‌هایی است که کسب می‌نمائید. ولی در صورت نیاز و درخواست برای شما مدرک نیز صادر خواهیم نمود.

هیچ کورسی در دنیا (در دنیای تکنولوژی) بعد از اتمام شما را مستقیم به شغل و درآمد نخواهد رساند. تنها تداوم در یادگیری و شرکت در جلسات مصاحبه مسیر را برای شما باز می‌کند. پس درگیر عناوین تبلیغاتی مختلف نشوید. اما مطمئن باشید که این مهارت‌ها بسیار فراگیر بوده و نیاز به آنها در حال حاضر بسیار زیاد است. ولی در این دوره چون عمق مطالب را بیشتر نمودیم، قطعن شما توانمندی‌هایی بسیار خاص را کسب خواهید نمود که ضامن موفقیت در جلسات مصاحبه می‌باشد.

مدرس تمامی موارد را بشما خواهد گفت، اما شما باید سطح مطلوبی از اطلاعات را از دنیای کار با داده‌ها داشته باشید که بتوانید بهترین نتیجه ممکن از این دوره را بگیرید. 

تمامی آموزش‌ها برای سیستم عامل ویندوز که فراگیرتر است، تهیه می‌شوند. اما شما براحتی می‌توانید دروس را در لینوکس و یا مک نیز پیاده‌سازی نمائید.