橡树村 发表于 2014-7-4 16:44:18

Castrol指数来分析八强

本帖最后由 橡树村 于 2014-7-4 18:05 编辑

看起来数字控很受欢迎么,那么咱也来凑个热闹,不能总写没几个人感兴趣的历史不是。

Castrol球员表现指数算是最近几年的新生事物。通过多个摄像机监视球员在球场上的一举一动,来分析球员在球场上等表现对于进球作出的贡献的大小。具体算法咱没查到,听起来挺复杂的,既要考虑球员的现场表现,也分析对手强弱等等。咱就直接把数据拿来用吧。

数据从08年欧洲杯开始,用到过09年联合会杯,10年世界杯,12年欧洲杯以及13年联合会杯上,基本上最近几年的重大国际赛事都用了。14年世界杯自然也不例外。使用这个指数有一个问题,就是这个指数是基于大赛的,所以小组赛阶段实际上是积累数据阶段,只能做事后分析。好在现在小组赛结束,还打过了一场八分之一决赛,进入八强的队伍每个都有四场的成绩,该表现得也应该表现得差不多了,应该有比较价值了。

首先是要收集数据,这个国际足联已经干了,公布在网站上,谁都可以查。地址是http://www.fifa.com/worldcup/statistics/castrol-index/ranking.html

现在一个一个队伍分析,很有些有趣的结论。

我选了各个队伍排名最靠前的四个后卫,四个中场,三个前锋,一个门将。我知道多了一个人,不过也要多少考虑一个替补么。另外,因为懒得查了,没考虑因为黄红牌缺席的情况。

总平均分最高的是德国队,8.69,第二名是法国8.64,第三名巴西,8.54,第四名比利时8.37,第五阿根廷,8.32,第六哥伦比亚8.08,第七荷兰7.97,最后哥斯达黎加7.76。荷兰怎么这么靠后了?印象里没这么糟糕呀?

按照这个顺序,四强就是德国,巴西,比利时,荷兰。不过德国对法国,比利时对阿根廷,荷兰对哥斯达黎加三场都会非常接近,也只有巴西那场优势明显一些。如果这个数据继续靠谱,最后冠亚军会是德国,比利时。比利时会进决赛?

只比较总分实在太简单了,咱稍微增加一点复杂程度。

目前后卫最强大的是巴西,平均9.23,然后是比利时8.99,德国8.85,阿根廷8.77,法国8.70,哥伦比亚和哥斯达黎加都是8.45,最差的是荷兰8.15。

不过如果把守门员和后卫平均到一起,顺序就不一样了,分数最高的是比利时9.00,然后是德国8.77,阿根廷8.73,巴西8.68,法国8.64,哥斯达黎加8.57,哥伦比亚8.51,荷兰仍然最差,8.14。

要是把守门员算得和整个后防同等重要,那么分数最高的还是比利时9.02,第二变成了哥斯达黎加8.75,然后阿根廷8.68,德国8.66,哥伦比亚8.60,法国8.57,荷兰8.14,最后一名成了巴西,7.85。我取这个数据当作防守能力。别问我为啥,反正我需要选一组数据。

中场的顺序,法国8.92,德国8.84,哥伦比亚8.44,比利时8.42,巴西8.15,阿根廷7.86,荷兰7.48,哥斯达黎加7.37。

前锋的顺序,巴西8.85,德国8.35,荷兰8.34,法国8.25,阿根廷8.23,比利时7.26,哥斯达黎加6.95,哥伦比亚6.91。这个当作进攻能力。咦?怎么觉得巴西前锋不大会破门呢?还是大家都不会破门了?但是这届世界杯有这么多进球。。。

如果按照攻守强弱来分析八强,就有趣了。

德国对法国,德国进攻8.35,防守8.66,法国进攻8.25,防守8.57,仍然是难分上下的局面,破门难度(直接用进攻除以对方防守),0.97vs0.95,非常接近,德国略占优。反正这一场应该是势均力敌的比赛,胜负其实很不好说。

巴西队哥伦比亚,巴西进攻8.85,防守7.85,哥伦比亚进攻6.91,防守8.60,一个进攻有优势一个防守有优势。破门难度1.03vs0.88,巴西的优势还是明显的。

阿根廷对比利时,阿根廷进攻8.23,防守8.68,比利时进攻7.26,防守9.02,都是防守重于攻击,破门难度0.91vs0.84,这一下阿根廷有优势了。中场弱在这个算法里面沾便宜呀。

荷兰对哥斯达黎加,荷兰进攻8.34,防守8.14,哥斯达黎加进攻6.95,防守8.75,看起来哥斯达黎加的攻击力还是不足,破门难度0.95vs0.85,荷兰的优势显出来了。

按照这个数字继续分析四强,德国对巴西, 1.06vs1.02,仍然非常接近,德国略占优。阿根廷对荷兰1.01vs0.96,阿根廷占优。那么决赛德国对阿根廷,0.96vs0.95,非常接近,德国略有优势。

咦?虽然进攻能力i的顺序完全不同,进程竟然和所长分析的一样?!!这是说明两个方法都是胡说八道么?

其实不同的算法结论肯定不大一样,有兴趣可以自己排列组合玩玩。

四强决出来之后,再看看距离实际情况相差多远。


顺便贴一下目前根据Castrol Index评出来的最佳阵容

守门员
C Bravo, 9.26 智利

后卫

Djourou, 9.50 瑞士
David Luiz 9.79 巴西
T Silva 9.56 巴西
Vertonghen 9.62 比利时

中场

Lahm 9.41 德国
Di Maria 9.43 阿根廷
James 9.74 哥伦比亚
Perisic 9.53 克罗地亚

前锋

Robben 9.66 荷兰
Benzema 9.70 法国

八强里面,只有巴西占到两个名额,德国,比利时,阿根廷,哥伦比亚,荷兰,法国都只有一个,哥斯达黎加没有。

所以我才打高球 发表于 2014-7-4 17:01:32

是的,你回帖后我就一直琢磨,开车时也在琢磨。

这个统计指数肯定是比较合理的,但就因为是合理,所以它所留下的余量很大,数字太小,偏差率不足以包含误差率,对比结果出来后其微弱的偏差会让人更难选择。

其实,这种微弱的偏差更符合现实情况,但是却很难动摇人们心中的悬念,所以我干脆放大了偏差率,造成数字上更直观的强弱,这样才有趣不是么。

另外我刚才研究了防守数据,我觉得防守数据也很有看点。

不懂中 发表于 2014-7-4 17:14:51

看了你们两位的数据分析,我觉得有没有那种考虑进去战术这个量?你像伊朗打阿根廷那场,弱队选择合适的战术完全能做掉强队?但现在看来,基本上大的局面应该就是跟两位数据分析的一样!

橡树村 发表于 2014-7-4 17:16:55

不懂中 发表于 2014-7-4 17:14 static/image/common/back.gif
看了你们两位的数据分析,我觉得有没有那种考虑进去战术这个量?你像伊朗打阿根廷那场,弱队选择合适的战术 ...

那就太复杂了,组合太多,随意性也更大,更不靠谱{:216:}

不懂中 发表于 2014-7-4 17:21:43

橡树村 发表于 2014-7-4 17:16 static/image/common/back.gif
那就太复杂了,组合太多,随意性也更大,更不靠谱

恩,是的。足球的魅力就在这些变量上。我上次还专门去查了下这32个队的最新排名,也还比较靠谱。所以单纯从实力上来判断,正确率还是比较高的。

橡树村 发表于 2014-7-4 17:25:05

本帖最后由 橡树村 于 2014-7-4 17:26 编辑

不懂中 发表于 2014-7-4 17:21 static/image/common/back.gif
恩,是的。足球的魅力就在这些变量上。我上次还专门去查了下这32个队的最新排名,也还比较靠谱。所以单纯 ...

排名的话,世界杯前第一是西班牙,第四是葡萄牙,还有瑞士第六,乌拉圭第七,意大利第九,英格兰第十,希腊12,美国13,智利14,排16的乌克兰决赛圈都没进。

现在八强的排名是:

德国 2
巴西 3
阿根廷 5
哥伦比亚 8
比利时 11
荷兰 15
法国 17
哥斯达黎加 28

单纯按这个排名,那么四强是德国,巴西,阿根廷,荷兰,冠亚军是德国,阿根廷。

怎么结果还是一样呢?

大卫 发表于 2014-7-4 17:25:45

本帖最后由 大卫 于 2014-7-4 17:27 编辑

统计数据采集是否只取自已经进行的四轮比赛?

那分组偶然性导致的数据差异可能影响会很大……

橡树村 发表于 2014-7-4 17:27:53

大卫 发表于 2014-7-4 17:25 static/image/common/back.gif
统计数据采集是否只取自已经进行四轮比赛?

那么分组的偶然性可能影响会很大…… ...

算法介绍里面说明考虑的对手强弱等等,如何考虑的就不知道了。经过几次大赛,这类算法应该是逐渐成熟的,数据也就越来越可靠。

但是足球本身就是一个不靠谱的运动么,历史数据拿来回顾过去还好,用来预测,就别太当真了。

橡树村 发表于 2014-7-6 12:25:31

四强蒙对喽{:189:}
页: [1]
查看完整版本: Castrol指数来分析八强