bet365

您现在的位置:365bet官方网站 > 体育在线 >  > 正文

足球大数据:统计和领会之间岂止一步之遥

2018-10-30 11:49bet365365bet

  咱们当然生气从这些单纯的描写性的统计数据背后不妨发掘出更众合于足球竞争性质的讯息。固然这方面依然发展了良众劳动,也有了少许进步,然则还只是正在萌芽阶段。

  编者注:比拟于其他体育运动,足球的数据统计和理解劳动发展得很晚,况且鉴于竞争的分外性也没有太众的经历可供参考。不外,跟着大数据时间的到来,这种趋向越来越分明,咱们必要做的不单是征求数据,况且必要更好的理解数据以办事于这项运动。依然看到,越来越众的先行者依然先河涌入足球数据理解范围,况且获得了不错的结果,不外同志们还需连续发愤啊!

  正在棒球理解范围有一个学派以为,假使没有这么众本事统计数据的话,棒球运动会开展的更好。之以是这么讲是由于他们声称这些目前被统计的数据不肯定便是可靠响应棒球竞争的决意性数据,他们只是最易于统计的数据罢了。不管你同不许诺这个见识,这确实直指棒球数据理解的把柄,如故是人们争持的重心。

  这不是说你相不自负这些数据,而是说新的数据是否真的能代替原有的统计结果。就算是不常看看棒球交代岁月的人也会更民风历来的统计结果,局部情由是这些数据依然正在棒球运动中存正在了很长岁月,原形上,人们老是民风于早已熟知的数据统计,而关于研习新的数据理解结果维持留意立场。

  关于足球来说,以前简直没有什么统计数据。原形上,关于这么一个畅通性的竞争来说,也很难不借助科技技巧去统计少许诸如传球次数等数据。人们先河编制性的纪录少许合于竞争的统计数据也便是近十年来的事务,由于现正在这个时间人们都乐于收罗和理解数据,同时可能从中得到收益。相像OPTA 和Prozone 等一心数据统计理解的公司依然先河展示,他们的盈余形式也是将这些数据卖给俱乐部或者媒体(原形上像ESPN,SKY Sports 等媒体的数据统计板块都是由OPTA 供应撑持的)。

  就像也曾正在棒球或其他少许数据导向的运动中摸索更新更优秀的评议目标那样,现正在人们也火急生气不妨正在足球范围找到少许新的统计目标,由于有开辟性的量度目标一定是数据理解的产品。不外这不是一挥而就的,由于现正在数据统计公司正在足球范围中做的数据收罗劳动仅仅是一百年前棒球范围就做完了的。

  现正在,足球终究有了豪爽的数据,下一步便是何如样更好的应用这些数据。差别于棒球等其他少许主流的运动(这些运动范围数据统计早已有之,数据理解只是近来振起),足球范围目前斗劲特有的景象是数据的统计和理解是正在同步张开的。

  让咱们回到起源谁人题目,假使没有本事统计数据,棒球是否会开展的更好?这个题目关于足球数据统计来说至合主要。

  近年来展示出一批诸如WhoScored、Squawka和FourFourTwos Stats Zone(均由OPTA 供应数据撑持)之类的网站,他们把竞争的数据统计结果更好的外示给了球迷。这些网站苛重供应局部和球队的竞争统计讯息,这听起来让人认为有点像棒球的本事统计数据,他们供应的讯息让你可能知晓哪个球员一场竞争以至一个赛季的各项统计数据,另有少许相像热门图和传球线途图等的图片格式更好的吐露这些数据。

  然则他们并没有进一步去供应奈何应用这些数据举办竞争理解的实质。某某后卫的场均拦截率很高对球队很主要吗?某某弓手的低得分率是否真的意味着他是一个浪射帝,今后该当众传球呢?抑或仅仅由于他运气太倒霉?一名传球告成率高达95%的防守球员要比一名传球告成率唯有78%的边锋更适合下底传中么?

  咱们具有这些数据,然则咱们并不行处置这些题目,由于咱们不显露究竟哪些数据关于竞争理解真正主要。

  这种情形可能让人闪回到棒球范围刚先河举办数据改善的时刻:假使你不知晓他们究竟有什么用的话,为什么要援用这些统计数据呢?这便是我不明确为什么正在过去50众年的棒球直播中总要提到相像RBI(Run battled in,棒球术语:打点) 这种无用的数据!

  毫无疑义,利用数据针对某些球员或球队的优异收效做出少许无法证据的假设绝对是误入邪途。然则,这并不料味着不行利用这些数据。

  假使阻难利用这些统计数据同时意味着阻难利用这些数据来描写竞争讯息,以及球队和球员的呈现。尽量棒球的传悉数计数据无法有用理解及预测将来的竞争,然则他们关于描写汗青讯息的描写是很有效的。试着无须任何统计数据讲一下巴尔的摩金莺队过去一周的呈现,或者疏解一下Clayton Kershaw 有何等棒。

  固然历来的统计数据无法疏解为什么球员和球队的呈现是好仍是坏,以及将来会奈何;然则利用这些数据来描写球员和球队的呈现仍是很直观的。

  十年前,或者没人知晓哈维每场竞争结局传了众少次球,告成率是众少。没有这些讯息,民众半人们也无从长远剖析哈维结局有何等伟大,或者他正在什么时刻状况先河有所下滑。同样的,你正在旁观洋基队巨星Derek Jeter 的竞争时,你只可说:“三年前,他的袭击率分外高,本年他的该项数据有所下滑。”

  即使是最原始的统计数据也会让咱们显露地剖析竞争中产生了什么。假使没有这一步的积淀,接下来咱们就很难疏解为什么这些景况会产生,或者接下来会产生什么。这些动作数据理解基石的原始统计数据正在美邦体育中通常存正在,然则正在足球范围却是一个全新的观点。

  咱们当然生气从这些单纯的描写性的统计数据背后不妨发掘出更众合于足球竞争性质的讯息。固然这方面依然发展了良众劳动,也有了少许进步,然则还只是正在萌芽阶段。

  总射门率(Total Shots Ratio,TSR)是高级足球统计数据的始祖,他最初是由James Grayson 从冰球范围引入到足球中的。这个目标策画的初志万分单纯:强队平常景况下射门次数都斗劲众,同时他们会让对方很少有起脚的机遇。

  这项统计数据的威力正在于它有很好的自合联性,而且可能更好的预测结果。实证理解显示球队过往的TSR 不妨预测该队将来的TSR,同时它关于将来竞争进球数和结果的预测要比基于球队过去的进球数和结果功效更佳。

  正在赛季初举办排名预测的时刻,TSR 是一个很好的先行目标(固然良众砖家会扔开这项数据,他们凭己方的直觉预测最终排名,这里有个梗,该目标预测的结果显示曼联最终排名不或者进入前三,然则所谓的砖家,本来便是作家己方认为曼联前三有戏,咱们只可留待赛季末再来挖坟了~),当然正在本质统制球队的时刻它就不睹得那么灵验了。

  然则正在冰球竞争中,可能随时调理球队阵容,况且射门次数很高,这使得不妨咱们不妨细化理解哪名球员正在球场上的时刻球队呈现最佳。而正在足球竞争中,唯有三次换人名额,同时射门次数也少的可怜,这就使得TSR 关于球员层面的评估功用很有限(起码目前没有很好的结果)。

  近来,愿望进球数(Expected Goals,ExG)又动作一个新的量度目标涌现。从预测的角度来看,ExG 与TSR 的呈现结果平起平坐(Grayson 比较了这两项目标,并给出了少许外面理解),然则ExG 的一个好处是它既可能预测球队的呈现,也能预测球员局部的呈现。换句话说,你可能通过球员的总进球数,而且基于他们的射门次数来预知他们将来的进球数。

  将射门数据举办理解有点相像于棒球中将场内安打率(BABIP)从均匀袭击率(AVG)平分解出来。结果证据,与球员平常难以有陆续高或低的BABIP 相像,球员们也很难历久的踢出高于或低于他自己ExG 的数据。然则不得不又一次指出的是,这些劳动仅仅只是足球数据理解的起步阶段。

  你或者防卫到的一个题目是目前豪爽的理解劳动都与射门相合,然则这并纷歧律对。譬喻Caley 提出的ExG 模子中就将导致射门的传球类型研讨正在内。StatsBomb 的Ted Knutson 创建了一个叫做球员雷达(player radars)的东西通过插手诸如球员竞争岁月、本方半场控球率等目标来更全盘更无误的描述球员的统计数据

  当然值得防卫的是,这些数据奈何举办归纳集成,从而变成球队的数据又是一个令人头大的题目。然则就目前来说,数据理解劳动中还未囊括将手头已有的统计数据以矩阵的样子归纳起来理解。

  这种景况的涌现有良众情由,局部情由是目前大家范围的专家仅仅参加了少量岁月来讨论这些讯息。况且,即使你念做豪爽的理解,目前的统计数据或者唯有五到十年,不像棒球那样有近百年的豪爽数据,这使得你无法得出更有用的结论。

  很有或者足球范围良众主要的数据咱们还没有征求到呢,与此同时,少许统计数据或者除了描写以外再无其他理解代价。合节是咱们奈何找到那些真正值得理解的数据。

  说究竟,咱们必要统计数据来辅助理解,而理解的宗旨则是为了找到足球范围各样题目的谜底。然则,假使棒球范围产生的事务对咱们有所发动的话,那便是利用统计数据既有或者助助咱们真正浮现有代价的讯息,也有或者让咱们误入邪途获得差错的结论。

  足球范围内的统计数据太少了,以致于任何目标都必要合成,然则足球数据统计方面掉队棒球一百年并不料味着足球就不会有己方特有的评议目标。况且足球范围确实有一点上风,那便是正在棒球运动中,那些基于统计数据的各样假设猜想依然流通了一百年之后才被数据理解所进攻,而足球范围,数据统计和数据理解是齐头并进的。





更多足球精彩赛事 ——365bet足球新闻