در دههی گذشته و بخصوص سالهای اخیر، استفاده از دادهها (data) و علم داده در همهی ابعاد زندگیمان مطرح شده است. فوتبال نیز با توجه به پیشرفت تکنولوژی و در دسترس قرار گرفتن پایگاههای داده، دچار دگرگونی شده و البته هنوز موج تغییرها در این مورد را در سالهای پیش رو بیشتر خواهیم دید. اینروزها، علم داده در فوتبال یکی از شاخههای پژوهشی بسیار مورد توجه میباشد.
امروزه بحثهای مربوط به دادهها و یادگیری ماشین (machine learning) و همچنین یادگیری عمیق (deep learning) حسابی داغ است. برای خود من به عنوان یک هوادار فوتبال و علاقهمند به این حوزه، استفاده از دادهها در ورزش و از جمله فوتبال همواره بحث جالبی به شمار میآید. همانطور که گفته شد، در دههی گذشته بخش زیادی از مشاغل و حوزههای سلامت و بهداشت و رسانه و موارد بسیار دیگر تحت تاثیر نفوذ دادهها قرار گرفتند. اما در مورد فوتبال.
تصور بر این بود که فوتبال با توجه به ویژگیهای منحصر به فردش، از این همهگیری مصون باشد، موردی که با توجه به نمونههای موفق اخیر میتوان به نادرست بودن آن اذعان کرد. اکنون باشگاههای فوتبال با توجه به مزیتهای زیادی که سرمایه گذاری در تجزیه و تحلیل دادهها (data analysis) برایشان به همراه دارد، درحال ورود به این حوزهی بسیار مهم هستند. باشگاههایی که در این مورد تعلل کنند در خطر عقب ماندن از رقیبانشان قرار دارند.
خلاصهی مختصری از تجزیه و تحلیل دادهها در فوتبال
چارلز ریپ و مشکل تفسیر دادهها
آنالیز دادهها در فوتبال آنطور هم که فکر میکنیم موضوع جدیدی نیست. اولین طرفدار این کار یک حسابدار به نام «چارلز ریپ» (Charles Reep) بود که بعد از جنگ جهانی دوم، تنها با یک کاغذ و قلم، شروع به جمع آوری و تحلیل دادههای فوتبال کرد. ریپ با تحلیل دادههای خود به این نتیجه رسید که اکثر گلها با انجام 3 پاس پی در پی به ثمر رسیدند و بنابراین مهم بود که توپ به هر سرعتی که ممکن است به مهاجمان تیم برسد.
این نظریهی او به عنوان توپ بلند (long ball) شناخته شد و برای سالهای زیادی به ویژه در دههی هشتاد فوتبال انگلیس تاثیر زیادی داشت. ریپ در برنتفورد (Brentford) ولورهمپتون (Wolverhampton) و شفیلد ونزدی (Sheffield Wednesday) کار کرد و همچنین با ویمیلدون (Wimbledon)، واتفورد (Watford) و تیم ملی نروژ همکاری کرد. او همیشه طرفدار سبک بازی حملهی مستقیم (direct attacking) بود.
البته نادرستی نظریه ریپ به اثبات رسید. جاناتان ویلسون (Jonathan Wilson) (مولف ” Inverting the Pyramid”) اشاره کرده است که چگونه تجزیه و تحلیل ریپ نشان میدهد حدود 90% از حرکات بازیهایی که وی مطالعه کرده 3 پاس یا کمتر داشته است و به طور منطقی 91.5% از همهی گلها هم با سه پاس یا کمتر حاصل شوند (به عبارتی ریپ در برقراری توازن بین مطالعه و ثبت اطلاعات دچار اشتباه شده بود).
ریپ جمع آوری دادهها را درست انجام میداد و در مقابل چیزی که در آن اشتباه کرد نتیجهگیری بود که بعد از تحلیل دادههایی که با شوق و اشتیاق آن را ایجاد کرده به آن رسید. چون که در نهایت او یک حسابدار بود و نه یک دانشمند داده (data scientist).
این یک مثال واضح است که دادهها به تنهایی برای ایجاد برتری رقابتی کافی نیستند و آنچه به مراتب مهمتر است توانایی تفسیر آنهاست. امروزه با رشد پایگاههای داده، اهمیت دانشمندان داده روز به روز بیشتر آشکار میگردد.
ضرورت تجزیه و تحلیل دادهها؛ علم داده در فوتبال
داده به تنهایی کافی نیست: شما به تجزیه و تحلیل نیاز دارید!
مشکل توانایی تفسیر دادهها هنوز با ماست. برای مثال اگر باشگاهها حجم زیادی از اعداد را در اختیار داشته باشند اما فاقد دانش برای تفسیر و استخراج اطلاعات عملی آنها باشند، دادهها تقریباً بیمعنی میشوند. مانند این است که تمام قیمتها، نسبتها و شاخصهای موجود در سهام ارزها و کالاها را به شخصی که از بازار مالی اطلاع ندارد ارائه دهیم؛ دادهها به تنهایی آن شخص را به یک تاجر بیخطا تبدیل نمیکنند. برای تصمیمگیری خوب، تیمهای فوتبال به داده احتیاج دارند و البته آنها همچنین به تجزیه تحلیل برای درک متقابل آن نیز محتاج هستند. تصویر زیر نمای خوبی از این مفهوم توسط کالج امپریال لندن (Imperial College London) است:
- در ابتدا با دادههایی مواجهیم که در نگاه اول فاقد اطلاعاتخاص و معناداری برای ما هستند.
- با آنالیز کردن و سازماندهی دادهها، دیتاهای خود را به اطلاعات و دانش تبدیل میکنیم.
- در نهایت، دادههای اولیه برایمان به یک خِرد، بینش و مفهومی تبدیل میشوند که میتوان از آن در تصمیم گیریهای مختلف بهره برد.
افزایش تجزیه و تحلیل ورزشی بعد از فیلم مانی بال
مانی بال: هنر برنده شدن در یک بازی ناعادلانه [money ball: the art of winning an unfair games]، انتشارِ یک نمونهی واقعی از آنالیزهای ورزشی، برای طیف گستردهتر مخاطبان بود. بر طبق کتاب مانی بال قبل از آنکه “sabermetrics” به بیسبال معرفی شود، تیمها به مهارت استعدادیابان خود برای یافتن و ارزیابی بازیکنان وابسته بودند.
لوئیس استدلال میکند که Oakland AS برای پیدا کردن بازیکنان و ساختن تیمی که بتواند نسبت به رقبای ثروتمندتر در رقابتهای لیگ برتر بیسبال، بهتر از دیگران باشد و بهتر رقابت کند، از سنجش و آنالیز، بیشتر از عملکرد بازیکنان بهره گرفت.
این تیم به دلیل پیروزی در بیست بازی پیاپی بین آگوست تا سپتامبر ۲۰۰۲ شهرت یافت. بعد از اوکلند اتلتیک که پیش قدم در این راه شد سایر تیمهای لیگ برتر بیسبال [Major League Baseball] MLB از این روش الهام گرفتند و به سرعت این راه را دنبال کردند.
در طی چند سال دیگر، ورزشهای آمریکا مانند بسکتبال و فوتبال آمریکایی بیشتر و بیشتر مبتنی بر داده شدند. مربیان فوتبال در ابتدا همچنان تردید داشتند. بیشتر مردم تصور میکردند که برخلاف ورزشهای آمریکایی، تجزیه و تحلیل فوتبال با استفاده از دادهها غیر ممکن است. اما تنها عدهی کمی نظر دیگری داشتند. آنها شروع یه یک انقلاب داده در بازی فوتبال کردند. یکی از آنها خود بیلی بین بود که علاقه زیادی به فوتبال داشت و در سال ۲۰۱۵ مشاور باشگاه هلندی Az Alkmaar شد.
آخرین تحولات مطالعهی موردی لیورپول، آلکمار، میتهلند و برنتفورد نشان میدهد که نه تنها امکان تجزیه و تحلیل فوتبال وجود دارد بلکه کسانی که این کار را به درستی انجام میدهند از یک امتیاز مهم رقابتی برخوردار میشوند.
توضیح مختصر فیلم مانی بال
فیلم آمریکایی در ژانر زندگینامهی ورزشی و درام است که توسط بنت میلر (Bennett Miller) به رشتهی تحریر در آمده. فیلم در مورد مدیر یک تیم ورزشی بیسبال ( اوکلند اتلتیکس) به نام بیلی بین با بازی برد پیت میباشد. مانی بال یک روایت واقعی از بیلی بین مدیر ناموفق یک تیم بیسبال است.
بیلی بیین مدیر تیم بیسبال اوکلند اتلتیک میباشد و اتلیتیک در آستانهی فروپاشی قرار گرفته است. اما بیلی بین که در سن جوانی با یک اشتباه ورزشی بیسبال را انتخاب کرده است راه بازگشتی را نمیبیند و تصمیم میگیرد نهایت سعی و تلاش خود را به کار گیرد تا بتواند تیمش را از بحران نجات دهد.
او با فردی به نام پیتر براند دست به اقدام عجیبتر میزند. بر اساس یک سری معادلههای ریاضی برخی از بازیکنان را به خدمت میگیرد تا اینکه به خاطر همین تصمیم رفتهرفته تیم نتایج بهتری بدست میآورد و موفقیتی تاریخی را رقم میزند.
کاربرد تجزیه و تحلیل دادهها در فوتبال
پیشرفتهایی که در پنج سال گذشته در صنعت فوتبال شاهد بودیم در مقابل آنچه در پنج سال آینده رخ خواهد داد ناچیز خواهند بود. در چند سال اخیر، سرعتِ رشد تصاعدی پیشرفت در فناوریهای پشتیبانی از جمع آوری، ذخیرهسازی و تجزیه و تحلیل دادهها، همزمان با افزایش نمایی سرمایهگذاریها در تجزیه و تحلیلهای ورزشی، کمیت و کیفیت دادهها را منفجر کرده است.
با این حال به نظر میرسد پیشرفتهایی که در پنج سال گذشته شاهد بودیم در مقابل آنچه در پنج سال آینده رخ خواهد داد ناچیز خواهند بود. با بزرگتر شدن و بهبود مجموعهی دادهها (datasets) تعداد کاربردهای بالقوهی تجزیه و تحلیل دادهها در بازی چند برابر شده است. این امر «تجزیه و تحلیل فوتبال» را به یک مفهوم کاملاً عمومی تبدیل کرده است.
همانطور که کاملا مشخص است، اهمیت متخصصان علم داده بطور روز افزون در حال گسترش است و حوزههای مختلف را به مرور زمان تحت تاثیر قرار میدهد. به مرور زمان، میتوانید ردپای علم داده را به نحوی در حوزههای مختلف مشاهده نمائید، همانطور که کاربرد علم داده در فوتبال را دیدیم.
و در پایان اگر به مباحث علوم داده و ورزش علاقهمندید، پیشنهاد میکنیم که این مجموعه مقالات رو دنبال کنین. و اگر به فوتبال علاقمند هستین، یه سری به نوشتههای وبلاگم بزنین.
پینوشت: این مقاله اولین بار به زبان فارسی در این آدرس منتشر شده است. منبع اصلی برای انتشار، وبسایت انگلیسی زبان ساکرمنت بوده است. سایت ساکرمنت در خصوص استفاده از آنالیز دادهها در علوم ورزشی، خصوصاٌ فوتبال، تولید محتوا مینماید.
2 پاسخ
سلام آقای فزونی و آقای مهندس جلوگیر. مقاله خیلی خوب بود فقط من یه سوال دارم بنظر شما که در این زمینه کار میکنید و اتلاعاتتان خوبه می شود با استفاده از دیتاها یه اپلیکیشن درست کنیم و به باشگاه ها بفروشیم یا در این زمینه نمیشه کاری کرد؟ لطفاً راهنمایی کنید من رو. من چند سالی هست اومدم سوئد و ایران نیستم خیلی به فوتبال علاقمندم
سلام و ممنون از توجهتون
بله چرا که نه
همین الان پلتفرم هایی (مانند wyscout و ai-abacus) هستند که بصورت ثردپارتی با باشگاه ها برای موارد مختلف همکاری دارند.
ار طرفی خود باشگاه ها کمکم به سمت استخدام دیتاساینتیست حرکت میکنند که در ادامهی این سری مقالات این موارد رو بررسی خواهیم کرد.
و چون که این حوزه به نسبت نوپا بحساب میآید امکان فعالیت در سطوح های مختلف با توجه به علاقهو پشتکارتون وجود خواهد داشت.