里米尼中文网|里米尼足球新闻|中国球迷会|Riminicalcio.cn

 找回密码
 成为Biancorosso的一员!!
搜索
查看: 644|回复: 1
打印 上一主题 下一主题

专业版FM?探秘职业足球中的数据分析

[复制链接]
  • TA的每日心情
    开心
    2020-5-21 23:07
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    跳转到指定楼层
    1#
    发表于 2018-5-6 08:33:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    探秘足球中的数据分析:专访Global Soccer Network CEO达斯汀-伯特格
    By Outside of the Boot, 2015年9月24日

    Global Soccer Network(以下简称GSN)意在引领一场现代足球球员考察方式的革命。深受迈克尔-刘易斯畅销世界的《魔球》(译注1)一书影响,GSN斟酌了多种可能让职业足球的球员考察更为有效的途径,创立了他们的独家评分系统——GSN指数。感谢GSN CEO达斯汀-伯特格 (Dustin Bottger) 在百忙之中接受采访,为我们带来他的独到见解。

    Football Data Analysis

    从数据分析的角度看,你们在收集数据时遇到了哪些困难?

    最大的难题是保证所有相关赛事中收集的数据都有同等的质量。只有保证我们数据库中的每一个球员都有等量的数据,我们这样的评分系统才有意义。我们和众多数据企业和足球分析师都有合作,所以收集数据对我们来说不成问题。

    给我们具体说说GSN指数是个什么玩意儿吧。这个指数考虑了那些因素?有哪些独一无二之处?

    我们希望建立足球世界中最全面的球员评估系统,因此我们开发了GSN指数。GSN指数基于四大支柱系统。下面我简单说说是哪四大:

    足球相关属性:对超过70项球员必要属性的评估和打分构成了GSN指数的基础。为了最大限度地保证客观,每个球员都会由多位球探分别进行独立评估。评估的内容囊括了技术、战术、心理和身体属性。每项属性给出一个0-100的分值,不过满分100分是连梅西也达不到的。最终的总评分会权衡球员在场上的位置,通过一个复杂的系统计算得出。中后卫所需要的能力和前锋是不同的,我们的系统会自动考虑这方面的因素。我们遍布世界的球探网络会定期更新对数据库中所有球员的评估。
    发展潜力:球员能否继续涨球是购买球员时一个重要的考虑因素。当今世界,年轻球员和少年球王们烧掉了大把大把的钞票。因此,想要抄底价廉物美的小妖,能否在一个年轻球员生涯早期发现他未来的发展潜力就非常重要。在改进应用于经济金融领域的算法的基础上,GSN开发了一套系统,考虑到了诸如教练和接受足球教育的水平,学习能力,年龄等方方面面影响球员发展的因素。发展潜力部分的分值最低分为0.00分,意味着球员到此为止,毫无未来。得分不设上限,分值越高,表示球员的潜力越大。
    +/-值:+/-值是支撑GSN指数的第三大系统。根据比赛表现数据,球员在比赛中的积极行为(进球,助攻,扑点,成功传球等)获得正分,消极行为(乌龙球,红牌,传球失误等)获得负分。+/-值为100表示球员不功不过。如果高于100,说明球员功大于过;相反,如果低于100,则说明球员过大于功。当然,+/-值会考虑不同位置球员的区别。同样是一次进攻表现,防守球员和前锋的得分是不同的。
    比赛级别:最后,比赛级别也是GSN指数的重要一环。我们的系统可以用来评价和分析每个球员整个生涯中的每场比赛。每场比赛都会获得1至20分的评分。比方说,一场世界杯或者欧冠决赛可以得到20分,而接近1分的比赛可能大多是青年或者业余联赛。我们的系统还会区分球员年龄、上场时间等其他因素。比如,同样踢满一场90分钟的德甲,一个年方十八的小孩儿的得分就要高于一位30岁的老将。比赛级别越高,GSN指数也就越高。
    除此之外,我们还使用了夏普利值(译注2)来体现球员对比赛的影响力。把以上四大支柱系统产生的评分综合在一起,就得到了球员的GSN指数。

    之前已经提到,这是世界上最全面的足球球探数据库。有了我们的系统,比较不同联赛、不同国家、不同赛事、不同年龄段的球员成为可能。我们的系统可以列出被低估和被高估的球员,这为俱乐部的大佬们选择正确的转会提供了必要的依据。在我们的系统里,你可以找到全世界超过340,000名球员的评分。我们还可以算出球员的性价比,从而准确地判断球员是否物有所值。这是货真价实的足球版《魔球》。

    前锋的表现很容易用统计数据衡量,你们有没有想办法通过统计来更好地判断后防球员?

    时至今日,球场上发生一切都会被记录和保存下来,其中就包括防守相关的铲断,拦截,争顶等等。不仅如此,哪个球员造成了失球,或者犯了类似的大错也都有据可查。我们把这些行为换算成一个失球值。再结合传球成功数,犯规次数,或者其他进攻相关的进球、助攻等数据,我们能够对防守球员的整体水平有一个准确的把握。

    详细谈谈追踪一个球员的时候你们都记录那些参数?为什么不选择其他更显而易见的参数?有没有哪个参数特别好使?

    我们对每个球员的数据几乎来者不拒,照单全收(网上的,报纸上的,杂志上的,电视上的,等等)。还有赛后战报,伤病报告,技术统计,以及我们的球探报告。把所有这些东西提炼成一个GSN指数是一项浩大的工程。

    比赛数据对我们来说是最重要的。我们的算法在计算+/-值时用到了球场上的每分每秒。具体来说,关键表现指标(最直接的就是进球和助攻了)要比其他一些指标的权重更大。剩下的不能告诉你,都告诉你了,我们就只能去喝西北风了。

    大家都在数据分析上奋起直追,而跑在前面的人都说,指标 (metrics) 和技术统计 (stats) 完全是两回事。能给我们说说吗?

    指标包含了有用的信息,能够告诉我们事情正在起变化。GSN指数就是个指标。指标有明确的定义,(通常)有明确的计算方法,我们也尽可能地避免模棱两可的定义和计算方法。正因为同一指标的计算方法都是一致的,指标才可以用来观察趋势,进行比较。

    技术统计只是直接记录下来的原始数据,在计算指标的时候会用到。

    据你所知,世界上那些俱乐部在数据分析上做得最好?

    我觉得是丹超的中日德兰 (FC Midtjylland) 和英冠的布伦特福德 (Brentford FC)。马修-贝纳姆(Matthew Benham, 布伦特福德主席,中日德兰母公司控股股东)和拉斯姆斯-安克森 (Rasmus Ankersen, 中日德兰主席,布伦特福德足球联合主管) 都是数据分析的开山怪,给他们的球探部门搞了场彻底的大革命。

    荷甲的阿尔克马尔请了《魔球》中的主人公比利-比恩(Billy Beane)担任顾问,迈出了正确的一步。我也想提一提美国职业大联盟的几家俱乐部,比如新英格兰革命,堪萨斯城竞技和多伦多FC。他们的分析师大多曾为棒球、橄榄球、冰球这些数据为王的运动工作,从而带来了新观点和新方法。显然,小俱乐部们正致力于让数据分析成为他们的优势。

    有没有哪个球员默默无闻,但是按照你们的数据分析模型却屌炸天?

    有些球员被大大低估了,另一些球员却被吹得太过。中日德兰的皮奥内-西斯托 (Pione Sisto) 简直就是头“数据怪兽”。根据我们的GSN指数,他已经是一名世界级球员,但是出了丹麦谁也不知道他。像他这样的球员我们还能举出很多。

    我们知道你们一开始是受《魔球》的启发,不过相比棒球这种非连续性的运动,在连续性的足球运动中实现数据分析的常态化到底有多难?

    这种话我听得太多了,说实话,我完全不能理解。现在,场上发生的一切都被分析,被记录。也许和棒球相比,是更麻烦一些,但是如果你专注于关键表现指标,恰当地结合前因后果给出正确的评分,在足球里大规模地运用数据分析完全不是问题。数据分析的反对者们就知道搬出这套老生常谈,只愿意相信他们亲眼所见的东西。

    在全世界推广数据分析最大的挑战是什么?

    最大的挑战是俱乐部里相关人员的心态。他们很多都担心数字化意味着失业,但那完全是扯淡。我们离不开他们的经验和见识。要是没有遍布全球的优秀球探,我们根本不可能开发出如此细致的GSN指数。

    GSN指数这样的工具不会取代经理,教练,体育主管或者球探,它的作用应该是帮助他们更高效地工作。我们给俱乐部的建议非常简单:解放思想,实事求是,与时俱进,开拓创新。

    Squawka.com和WhoScored.com这类网站向懂球帝们免费提供数据。这些网站上的数据和俱乐部所使用的数据有什么不同?

    首先我想说,Squawka.com和WhoScored.com都很棒。至于他们的数据和俱乐部用的数据有什么区别,这个问题不好回答,因为每个俱乐部看重的数据都不一样。俱乐部自然拥有海量的数据,涵盖更多联赛,更多国家,更多赛事。Squawka和WhoScored上只有用户关心的联赛和球员。此外,俱乐部还有来自医疗团队和训练课的数据,那就更不是人人都拿得到的了。

    数据分析给体育运动提供了数字化的视角,但是传统的球员考察关注球员的身体和技术能力,这些在数据分析中却得不到体现。会不会在某种情况下,纯粹因为一个糟糕的统计数字,球员的身体或者技术能力就被忽视了?

    不!会!如果你拥有经验丰富的球探,再加上一张精细的数据表格,把身体和技术能力换算成数字是完全可行的。GSN数据库里的每个球员都会定期被不同的球探独立进行考察。他们的报告会被换算成数值。通过这种方式,我们最大限度地保证了客观,而且我们会经常进行这样的评估。球员各方面的属性也因此都有了精准的数值。

    最后,经典老问题,数据会撒谎吗?

    数据永远无法百分百地反映一个球员的能力,但是非常接近百分之百是可以做到的。哪怕能把对球员和球队的了解提升百分之一,那也是在成功的路上又迈进了一步。


    译注1:原书标题为Moneyball,曾改编为同名电影(译名《点球成金》)。《魔球》讲述了美国职棒大联盟小球队奥克兰运动家的经理比利-比恩开创性地应用统计分析运营球队与诸如纽约洋基等大球队分庭抗礼的故事以及背后的启示。

    译注2:Shapley value, 合作博弈理论中的概念,由Lloyd Shapley在1953年提出。夏普利值是一种分配方式,反映了合作参与者在合作中的贡献。
  • TA的每日心情
    开心
    2020-5-21 23:07
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    2#
     楼主| 发表于 2018-5-6 08:34:34 | 只看该作者

    某个程度上,深、广、全、善,难度是有的,例如,赞助商的重度干预管理层与教练团決策而纳入不合格的球员。
    前五问中,谁会告你,真正的Know-how,只能算是超浓缩"课程大纲"的一小部分。
    美国的职业运动发达,相关的科研与科普(例如,棒球在1910s算是朝系统化前进,数据化尚不成熟,直至1970s赛伯计量学登场,"一发不可收拾"。),深耕已久,魔球(点球成金)並非棒球最早的数据分析研究,但是卻是在某个程度上影响了全世界高端集体球类stakeholder正视数据分析的重要性。

    在此为这篇文章微補一下有的重要的stakeholder,也需要数据分析的辅助,例如,经纪这一行。

    译注2中,UCLA的Shapley教授是2012年诺贝尓经济学奖得主,博弈论算是这20年来的"显学"。

    回帖两度乱成一通,就算了,有看就一次改一个,沒看就当空气。

    原贴位置:

    https://bbs.hupu.com/13814733.html

    本版积分规则

    小黑屋|手机版|Archiver|里米尼中文网

    GMT+8, 2024-4-26 04:18 , Processed in 0.090987 second(s), 17 queries .

    Powered by Discuz! X3

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表