پروژه‌ی تجزیه و تحلیل داده‌ها با پایتون

فهرست مطالب

مقدمه:

تجزیه و تحلیل داده‌ها زمینه‌ای است که ما با آنالیز و بررسی داده‌های خام می‌توانیم اطلاعات مفیدی بدست آوریم. حوزه‌ی تجزیه و تحلیل داده‌ها مدت‌های زیادی است که وجود داشته است و شرکت‌ها از داده‌هایی که از طریق نظرسنجی یا داده‌هایی که از تراکنش‌های مشتری‌ها بدست می‌آورند برای استراتژی‌های بازاریابی استفاده می‌کنند. در گذشته شرکت‌ها کارشناس آمار را استخدام می‌کردند تا از داده‌ها اطلاعات مفیدی بدست آورند و پتانسیل بازار را شناسایی کنند تا مدل‌هایی برای فروش بیشتر ارائه کنند.

تجزیه و تحلیل داده‌ها نسبت به سال‌های گذشته رشد گسترده‌ای داشته است. با افزایش قدرت محاسباتی، شرکت‌ها قادر به جمع آوری و ذخیره‌سازی و پردازش داده‌ها در مقیاس‌هایی هستند که در سال‌های گذشته غیرقابل تصور بود.

تحلیل‌گران با استفاده از مهارتی که دارند می‌توانند مقدار خیلی وسیعی از داده‌ها را جمع آوری و پردازش کنند و با استفاده از مهارت آماری خودشان قادر هستند اطلاعات مفیدی از داده‌ها استخراج کنند.

در این مقاله قصد دارم پروژه‌ای در خصوص تجزیه و تحلیل داده ها را ارائه دهم.

 گام 1:

ابتدا تحقیقاتی راجع به شرکت طراحی عینک با نام Warby Parker انجام دادم و به نتایجی درباره‌ی جایگاه برند این شرکت رسیدم.

Warby Parker اولین برندی بود که باعث مختل شدن برندهای دیگر عینک شد. چون عینک را برای همه  به صرفه تولید کرد و مشتریان برای خرید یک جفت عینک باید مبلغ 95 دلار بپردازند  که این شرکت با فروش یک جفت عینک، یک جفت رایگان برای کسانی که نیازمند هستند اهدا می‌کند.

گام 2:

تصمیم گرفتم نگاهی به تعداد مخاطبان این برند بیندازم و 10000 تا از دنبال کنندگان توییتر این برند را استخراج کردم و از پکیج پیش بینی جنسیت استفاده کردم تا بتواند جنسیت افراد را با استفاده از نام کاربری توییترشان پیش‌بینی کند. این تقسیم‌بندی جنسیت مخاطبان توییتر Warby Parker است که بصورت زیر می‌باشد:

واربی پارکر تفاوت جنسیتی زیادی دارد که تعداد دنبال کنندگان خانم آن خیلی بیشتر است و با توجه به جایگاهی که دارند می‌توانند یک برند فراگیر باشند. به همین دلیل این شرکت عینک‌هایی با فریم و رنگ‌های خاص برای خانم‌ها تهیه می‌کند. اکثر دنبال کنندگان این برند اهل نیویورک هستند که این می‌تواند نشان دهنده‌ی این باشد که وجود فروشگاه فیزیکی باعث افزایش علاقه‌ی این مناطق شده و با توجه به تقاضای زیاد، این شرکت می‌توانست این مناطق را برای افتتاح فروشگاه انتخاب کند.

 گام 3:

سپس علایق و حرفه‌ی کاربران این شرکت را تجزیه و تحلیل کردم. برای انجام این کار ابتدا دنبال کنندگان توییتر را جمع آوری و با استفاده از کتابخانه پایتون کلمات کلیدی را استخراج کردم. بعد از آن، عملیات  پاکسازی داده‌ها را انجام دادم و در نهایت توانستم بالاترین علایق و دنبال کنندگان با حرفه‌های برتر (و متفاوت) را پیدا کنم. نمودار ذیل نشان دهنده‌ی میزان درصد دنبال کنندگان برحسب حرفه‌‌ی آنها است.

با توجه به نمودار بالا می‌فهمیم که بیشتر دنبال کنندگان این شرکت علاقه‌مند به مسائل اجتماعی هستند و همچنین به موسیقی و طراحی و هنر هم علاقه دارند. بسیاری از آنها نویسنده و هنرمند می‌باشند که نشان می‌دهد آنها افراد خلاقی هستند. برخی از آنها مدیر عامل هستند و کسب و کار خود را اداره می‌کنند. همچنین بعضی از دنبال کنندگان در بیوی (زندگی‌نامه‌ی مختصر) خود نوشته بودند که برنامه‌نویس هستند و یا در علم داده فعالیت می‌کنند.

گام 4:

 شخصیت مشتری‌ها را براساس یافته‌های بالا ارزیابی کردم.

شخص1:  جسیکا (jessica)

بازه‌ی سنی: (25 – 34)

شغل: نویسنده فریلنسر

وضعیت تاهل: مجرد

مکان: نیویورک

خصوصیات: خلاق، دوست دارد کار را سریع انجام بدهد، شغلش تضمین کننده درآمد ثابت نیست

دنبال عینک طبی شیک و به صرفه

شخص 2: پاملا (Pamela)

بازه‌ی سنی: (25 – 34)

شغل: نویسنده فریلنسر

وضعیت تاهل: متاهل

مکان: نیویورک

خصوصیات: پاملا زندگی پر مشغله‌ای دارد، چون هم باید کار کند و هم مواظب کودکش باشد. علاقه دارد عینک را بصورت آنلاین و یا غیرحضوری تهیه کند. او می‌خواهد جهان را به مکانی بهتر برای فرزندانش تبدیل کند.

شخص 3: جیسون (Jason)

بازه‌ی سنی: (25 – 34)

شغل: مهندس نرم افزار

وضعیت تاهل: مجرد

مکان: نیویورک

خصوصیات: جیسون در حوزه‌ی برنامه‌نویسی کار می‌کند.  او فردی درونگرا است و سعی می‌کند تا جایی که امکان دارد ارتباط اجتماعی برقرار نکند. جیسون به یک عینک طبی نیاز دارد. او تولیدکننده‌ی حرفه‌ای است و دوست دارد همیشه در زمان صرفه جویی کند.

گام 5:

بعد از اینکه داده‌های توییتر را تجزیه و تحلیل کردیم و در گام چهارم شخصیت افراد را براساس علاقه آنها پیش بینی کردیم، اکنون استراتژی‌های بازاریابی را برای هر شخص در جدول زیر ارائه می‌دهیم:

گام 6:

بعد از اینکه اشخاص و علایق مخاطبان این شرکت را ارزیابی کردم، تصمیم گرفتم تجزیه و تحلیلی از رقیبان این شرکت را هم انجام دهم. رقبای برتر این شرکت (Warby Parker) را یافتم و اطلاعاتی مانند درآمد و اندازه شرکت را بدست آوردم که در جدول زیر آنها را می‌بینید:

همانطور که در شکل فوق مشاهده می‌کنیم میزان درآمد شرکت واربی پارکر نسبت به رقیبانش یعنی دو شرکت دیگر بیشتر است و همچنین میزان کارمندان بیشتری دارد که میزان کارمندان آن 2500 و میزان دنبال کنندگان توییتر آن 82k  است که خیلی بیشتر از دو شرکت رقیب آن می‌باشد.

واربی پارکر در رسانه‌های اجتماعی هم فعالیت بیشتری نسبت به رقیبانش دارد. رقبای اصلی واربی پارکر عبارتند از Zenni Optical ،Pair Eyewear  و MyOptique که جایگاهی مشابه دارند.

گام 7:

در گام آخر سعی کردم تحلیل احساسات بین واربی پارکر و رقبای این شرکت انجام دهم یعنی بین واربی پارکر و زِنی اوپتیکال. این شرکت (زِنی) یکی از بزرگترین رقیبان واربی پارکر است، پس آنرا برای مقایسه انتخاب کردم. سپس احساسات مشتریان را در چهار بخش مختلفِ قیمت، ویژگی‌ها، کیفیت و خدمات مشتری بررسی کردم.

داده‌ها را از سایت https://www.consumeraffairs.com/ استخراج کردم. ابتدا به رتبه‌بندی در سایت توجه کردم که بصورت زیر بود:

همانطور که در شکل مشاهده می‌کنید Zenni Optical تعداد امتیاز بیشتری نسبت به واربی پارکر دارد و وقتی که بررسی کردم متوجه شدم که تعداد بازدیدهای مثبت Zenni Optical بیشتر است. در شکل زیر هر دو شرکت را برحسب ویژگی، قیمت، کیفیت و خدمات مشتری تقسیم بندی کردیم.

از شکل های فوق فهمیدم که امتیاز شرکت Zenni Optical از لحاظ کیفیت و قیمت بیشتر از واربی پارکر است و تعدادی نظرات منفی درمورد شکسته بودن لنز عینک و کیفیت پایین محصولات واربی پارکر وجود داشت. همچنین عینک این شرکت قیمت کمتری نسبت به واربی پارکر دارد. از لحاظ خدمات به مشتریان، واربی پارکر امتیاز بیشتری را دریافت کرد و مشتریان از پاسخگویی و پشتیبانی آن بسیار راضی و خوشحال بودند. به نظر می‌رسد مشتریان به یک اندازه از ویژگی محصول هر دو برند راضی هستند.

 برای استخراج اطلاعات از وبسایت (وب اسکرپینگ) از کتابخانه‌های پایتون مانند BeautifulSoup و Selenium استفاده کردم و برای پردازش و تمیز کردن متن پکیج NLTK را بکار گرفتم. برای تجزیه وتحلیل داده‌ها پکیج پانداس را بکار بردم و همچنین برای مصورسازی داده‌ها از  Excel و Tableau کمک گرفتم.

امیدوارم از خواندن این مقاله لذت برده باشید و این آنالیزها به شما ایده‌های بهتری بدهند.

منبع:

https://medium.datadriveninvestor.com/a-complete-data-analytics-project-with-python-9befabe278c3

مترجم: 

علی محمدی

alimohammadi3536@gmail.com

تخصص:

آنالیز عددی، پایتون، پانداس

سایر مقالات مجموعه:

پست‌های مرتبط با این مقاله:

7 پاسخ

  1. خیلی عالی بود . دید خوبی به کسانی که مثل من در ابتدای مسیر هستند می دهد.
    ممنون بابت ترجمه از آقای محمدی و پیشنهاد مطالعه از شما
    ??

  2. سلام وقتتون بخیر
    ببخشید میخواستم بپرسم برنامه‌هایی مثل گوگل پلی یا بازار چجوری تحلیل می‌کنند که لیست هایی از برنامه‌هایی که در صفحه خود قرار دارند، کارایی خوبی داشته؟
    هم جای لیست و هم محتوای لیست. آیا آزمون خاصی وجود دارد؟ فرض کنیم داده هایی ازشون داریم، موقع کار چه معیاری تعریف کنیم که ببینیم کدام چینش در صفحه مناسب بوده؟

    یک سوال کلی هم دارم. اینکه کمی اطلاعات برای تحلیل کسب و کارهایی شبیه گوگل پلی و بازار می‌خواهم. ممنون می‌شوم راهنمایی بفرمایید.

    1. سلام دوست عزیز
      سؤال خوبی مطرح کردید، اما متاسفانه من در این حوزه اطلاعات خاصی ندارم. اما گمان میکنم میزان دانلودها و فیدبک‌های کاربران در این خصوص خیلی مهم باشند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *