دکتر محمد فزونی

علم‌ داده در فوتبال

در دهه‌ی گذشته و بخصوص سال‌های اخیر، استفاده از داده‌ها (data) و علم داده در همه‌ی ابعاد زندگیمان مطرح شده است. فوتبال نیز با توجه به پیشرفت تکنولوژی و در دسترس قرار‌ گرفتن پایگاه‌های داده، دچار دگرگونی شده و البته هنوز موج تغییرها در این مورد را در سال‌های پیش رو بیشتر خواهیم دید. این‌روزها، علم‌ داده در فوتبال یکی از شاخه‌های پژوهشی بسیار مورد توجه می‌باشد.

امروزه بحث‌های مربوط به داده‌ها و یادگیری‌ ماشین (machine learning) و همچنین یادگیری‌ عمیق (deep learning) حسابی داغ است. برای خود من به عنوان یک هوادار فوتبال و علاقه‌مند به این حوزه، استفاده از داده‌ها در ورزش و از‌ جمله فوتبال همواره بحث جالبی به شمار می‌آید. همانطور که گفته شد، در دهه‌ی گذشته بخش زیادی از مشاغل و حوزه‌های سلامت و بهداشت و رسانه و موارد بسیار دیگر تحت تاثیر نفوذ داده‌ها قرار گرفتند. اما در مورد فوتبال.

تصور بر این بود که فوتبال با توجه به ویژگی‌های منحصر به فردش، از این همه‌گیری مصون باشد، موردی که با توجه به نمونه‌های موفق اخیر می‌توان به نادرست بودن آن اذعان کرد. اکنون باشگاه‌های فوتبال با توجه به مزیت‌های زیادی که سرمایه گذاری در تجزیه و تحلیل داده‌ها (data analysis) برایشان به همراه دارد، درحال ورود به این حوزه‌ی بسیار مهم هستند. باشگاه‌هایی که در این مورد تعلل کنند در خطر عقب ماندن از رقیبانشان قرار دارند.

 

علم داده در فوتبال

 

خلاصه‌ی مختصری از تجزیه و تحلیل داده‌ها در فوتبال

چارلز‌ ریپ و مشکل تفسیر داده‌ها

آنالیز داده‌ها در فوتبال آنطور هم که فکر میکنیم موضوع جدیدی نیست. اولین طرفدار این کار یک حسابدار به نام «چارلز ریپ» (Charles Reep) بود که بعد از جنگ جهانی دوم، تنها با یک کاغذ و قلم، شروع به جمع آوری و تحلیل داده‌های فوتبال کرد. ریپ با تحلیل داده‌های خود به این نتیجه رسید که اکثر گل‌ها با انجام 3 پاس پی در پی به ثمر رسیدند و بنابراین مهم بود که توپ به هر سرعتی که ممکن است به مهاجمان تیم برسد.

این نظریه‌ی او به عنوان توپ بلند (long ball) شناخته شد و برای سال‌های زیادی به ویژه در دهه‌ی هشتاد فوتبال انگلیس تاثیر زیادی داشت. ریپ در برنتفورد (Brentford) ولورهمپتون (Wolverhampton) و  شفیلد ونزدی (Sheffield Wednesday) کار کرد و همچنین با ویمیلدون (Wimbledon)، واتفورد (Watford) و تیم ملی نروژ همکاری کرد. او همیشه طرفدار سبک بازی حمله‌ی مستقیم (direct attacking) بود.

البته نادرستی نظریه ریپ به اثبات رسید. جاناتان ویلسون (Jonathan Wilson) (مولف ” Inverting the Pyramid”) اشاره کرده است که چگونه تجزیه و تحلیل ریپ نشان می‌دهد حدود 90% از حرکات بازی‌هایی که وی مطالعه کرده 3 پاس یا کمتر داشته است و به طور منطقی 91.5% از همه‌ی گل‌ها هم با سه پاس یا کمتر حاصل شوند (به عبارتی ریپ در برقراری توازن بین مطالعه و ثبت اطلاعات دچار اشتباه شده بود).

ریپ جمع آوری داده‌ها را درست انجام می‌داد و در مقابل چیزی که در آن اشتباه کرد نتیجه‌گیری بود که بعد از تحلیل داده‌هایی که با شوق و اشتیاق آن را ایجاد کرده به آن رسید. چون که در نهایت او یک حسابدار بود و نه یک دانشمند داده (data scientist).

این یک مثال واضح است که داده‌ها به تنهایی برای ایجاد برتری رقابتی کافی نیستند و آنچه به مراتب مهم‌تر است توانایی تفسیر آنهاست. امروزه با رشد پایگاه‌های داده، اهمیت دانشمندان داده روز به روز بیشتر آشکار می‌گردد.

ضرورت تجزیه و تحلیل داده‌ها؛ علم داده در فوتبال

داده به تنهایی کافی نیست: شما به تجزیه و تحلیل نیاز دارید!

مشکل توانایی تفسیر داده‌ها هنوز با ماست. برای مثال اگر باشگاه‌ها حجم زیادی از اعداد را در اختیار داشته باشند اما فاقد دانش برای تفسیر و استخراج اطلاعات عملی آنها باشند، داده‌ها تقریباً بی‌معنی می‌شوند. مانند این است که تمام قیمت‌ها، نسبت‌ها و شاخص‌های موجود در سهام ارزها و کالاها را به شخصی که از بازار مالی اطلاع ندارد ارائه دهیم؛ داده‌ها به تنهایی آن شخص را به یک تاجر بی‌خطا تبدیل نمی‌کنند. برای تصمیم‌گیری خوب، تیم‌های فوتبال به داده احتیاج دارند و البته آنها همچنین به تجزیه تحلیل برای درک متقابل آن نیز محتاج هستند. تصویر زیر نمای خوبی از این مفهوم توسط کالج امپریال لندن (Imperial College London) است:

افزایش تجزیه و تحلیل ورزشی بعد از فیلم مانی‌ بال

مانی بال: هنر برنده شدن در یک بازی ناعادلانه [money ball: the art of winning an unfair games]، انتشارِ یک نمونه‌ی واقعی از آنالیزهای ورزشی، برای طیف گسترده‌تر مخاطبان بود. بر طبق کتاب مانی بال قبل از آنکه  “sabermetrics” به بیسبال معرفی شود، تیم‌ها به مهارت استعدادیابان خود برای یافتن و ارزیابی بازیکنان وابسته بودند.

لوئیس استدلال می‌کند که Oakland AS برای پیدا کردن بازیکنان و ساختن تیمی که بتواند نسبت به رقبای ثروتمندتر در رقابت‌های لیگ برتر بیسبال، بهتر از دیگران باشد و بهتر رقابت کند، از سنجش و آنالیز، بیشتر از عملکرد بازیکنان بهره گرفت.
این تیم به دلیل پیروزی در بیست بازی پیاپی بین آگوست تا سپتامبر ۲۰۰۲ شهرت یافت. بعد از اوکلند اتلتیک که پیش قدم در این راه شد سایر تیم‌های لیگ برتر بیسبال [Major League Baseball] MLB از این روش الهام گرفتند و به سرعت این راه را دنبال کردند.

در طی چند سال دیگر، ورزش‌های آمریکا مانند بسکتبال و فوتبال آمریکایی بیشتر و بیشتر مبتنی بر داده شدند. مربیان فوتبال در ابتدا همچنان تردید داشتند. بیشتر مردم تصور می‌کردند که برخلاف ورزش‌های آمریکایی، تجزیه و تحلیل فوتبال با استفاده از داده‌ها غیر ممکن است. اما تنها عده‌ی کمی نظر دیگری داشتند. آنها شروع یه یک انقلاب داده در بازی فوتبال کردند. یکی از آنها خود بیلی بین بود که علاقه زیادی به فوتبال داشت و در سال ۲۰۱۵  مشاور باشگاه هلندی Az Alkmaar شد.

آخرین تحولات مطالعه‌ی موردی لیورپول، آلکمار، میتهلند و برنتفورد نشان می‌دهد که نه تنها امکان تجزیه و تحلیل فوتبال وجود دارد بلکه کسانی که این کار را به درستی انجام می‌دهند از یک امتیاز مهم رقابتی برخوردار می‌شوند.

توضیح مختصر فیلم مانی بال

فیلم آمریکایی در ژانر زندگی‌نامه‌ی ورزشی و درام است که توسط بنت میلر (Bennett Miller) به رشته‌ی تحریر در آمده. فیلم در مورد مدیر یک تیم ورزشی بیسبال ( اوکلند اتلتیکس) به نام بیلی بین با بازی برد پیت می‌باشد. مانی بال یک روایت واقعی از بیلی بین مدیر ناموفق یک تیم بیس‌بال است.

بیلی بیین مدیر تیم بیسبال اوکلند اتلتیک می‌باشد و اتلیتیک در آستانه‌ی فروپاشی قرار گرفته است. اما بیلی بین که در سن جوانی با یک اشتباه ورزشی بیسبال را انتخاب کرده است راه بازگشتی را نمی‌بیند و تصمیم می‌گیرد نهایت سعی و تلاش خود را به کار گیرد تا بتواند تیمش را از بحران نجات دهد.

او با فردی به نام پیتر براند دست به اقدام عجیب‌تر می‌زند. بر اساس یک سری معادله‌های ریاضی برخی از بازیکنان را به خدمت می‌گیرد تا اینکه به خاطر همین تصمیم رفته‌رفته تیم نتایج بهتری بدست می‌آورد و موفقیتی تاریخی را رقم می‌زند.

کاربرد تجزیه و تحلیل داده‌ها در فوتبال

پیشرفت‌هایی که در پنج سال گذشته در صنعت فوتبال شاهد بودیم در مقابل آنچه در پنج سال آینده رخ خواهد داد ناچیز خواهند بود. در چند سال اخیر، سرعتِ رشد تصاعدی پیشرفت در فناوری‌های پشتیبانی از جمع آوری، ذخیره‌سازی و تجزیه و تحلیل داده‌ها، همزمان با افزایش نمایی سرمایه‌گذاری‌ها در تجزیه و تحلیل‌های ورزشی‌، کمیت و کیفیت داده‌ها را منفجر کرده است.

با این حال به نظر می‌رسد پیشرفت‌هایی که در پنج سال گذشته شاهد بودیم در مقابل آنچه در پنج سال آینده رخ خواهد داد ناچیز خواهند بود. با بزرگتر شدن و بهبود مجموعه‌ی داده‌ها (datasets) تعداد کاربردهای بالقوه‌ی تجزیه و تحلیل داده‌ها در بازی چند برابر شده است. این امر «تجزیه و تحلیل فوتبال»  را به یک مفهوم کاملاً عمومی تبدیل کرده است.

همانطور که کاملا مشخص است، اهمیت متخصصان علم داده بطور روز افزون در‌ حال گسترش است و حوزه‌های مختلف را به مرور زمان تحت تاثیر قرار می‌‌دهد. به مرور زمان، می‌توانید ردپای علم داده را به نحوی در حوزه‌های مختلف مشاهده نمائید، همان‌طور که کاربرد علم داده در فوتبال را دیدیم.

و در پایان اگر به مباحث علوم داده و ورزش علاقه‌مندید، پیشنهاد می‌کنیم که این مجموعه مقالات رو دنبال کنین. و اگر به فوتبال علاقمند هستین، یه سری به نوشته‌های وبلاگم بزنین.

پی‌نوشت: این مقاله اولین بار به زبان فارسی در این آدرس منتشر شده است. منبع اصلی برای انتشار، وبسایت انگلیسی زبان ساکرمنت بوده است. سایت ساکرمنت در خصوص استفاده از آنالیز داده‌ها در علوم ورزشی، خصوصاٌ فوتبال، تولید محتوا می‌نماید.

 

خروج از نسخه موبایل