当我们打开数据的魔盒,或许能看到足球世界里不一样的烟火——靴室笑谈社
【前言】
我们常常会问,如果X走了,那Y能不能来替代他?
这不是一个只存在于球迷界的问题。球探常常需要为一名球员寻找替代品,或者更普遍地,根据主教练的“模板”挑选相近球员。球员并不是冷冰冰的数据,他们在球迷眼中可能有着各种各样的特点,但发达联赛中教练看到的优秀球员,足以多到让人难以抉择,这时就需要数据来提供一些支撑。
芬威有一套“魔球”理念下的系统,能筛选出各项指标接近的球员,其他俱乐部也自然有类似的分析单位,但这都是球迷很难接触到的(或许FM搜索功能也算?)。笑谈数据分析系统——XTScore为此再次建模,尝试为大家呈现一些简单而有趣的分析结果——谁最接近利物浦阵中的TA?(想直接看结果的朋友看第三部分即可)
【一、定义】
那么究竟该如何定义“数据接近的球员”中的“接近”?数学上存在n维欧式空间,我们可以理解一个球员的各项数据即是n维欧式空间上的n维向量,从而可以计算出两个球员之间的距离。简单来说,在数学上寻找与目标球员距离最短的球员(们)即是通俗意义上,寻找各类指标平均下来,最接近目标球员的对象。
我们这次实现的模型比较简单,受聚类分析的启发,我们在筛选处理过的数据基础上,通过加权欧氏距离分别得到了距离目标球员最近的15名球员(如果想要更多/其他球员可以联系笑谈)。没有直接选用聚类分析,一大原因是我们想保持权重的灵活性,这对于应用来说比较重要,同时也希望能够避免分组分析。
但同时模型最为明显的就是权重问题。通俗理解,球员的指标之间可能有相关性,例如他的指标有6项和传球相关,一项和射门相关,那么这样计算出来的距离可能并不是我们关心的结果。通常意义上的欧式距离可以视为权重为1的距离,但实际上球探或教练在应用模型时,应该根据更为看重球员的某些特质,来对欧氏距离做权重调整(加权欧式距离),从而得到更想要的结果。
本文作为试验,仅是尽量对各类指标做到等权重。
【二、模型介绍】
目前数据以五大联赛19/20数据为基础,预处理后的结果包括:
per90Min值,例如球员可以在进攻90分钟内完成多少次射门,这一项之前的文章有介绍过,主要是为了尽可能地抹平时间/球队实力对数据的影响;
19/20赛季的percent,包括传球成功率等。
首先将per90Min的各项指标与percent一起,计算出球员在各项指标的排名,这里计算排名是一种最简单的数据标准化方法,我们暂时没有假设各个维度上的分布。
随后将各项指标先分为进攻与防守,每名球员与目标球员返回的结果会有两个距离——进攻距离和防守距离。
在进攻和防守的指标内(可以重复)给定各自权重,例如进攻目前分为传球、射门、盘带、对抗4组,确保每组指标等权重。组内指标也进行筛选并等权处理。
给定目标球员,进行进攻距离和防守距离计算。以此为基础,再计算与目标球员的欧式距离,筛选与利物浦球员“接近”的靠前15名的球员制图。
【三、结果:最接近利物浦球员的他们】
提示:
1、横坐标为进攻距离,纵坐标为防守距离,横坐标接近代表进攻方面类似,纵坐标接近代表防守类似。
2、看图时需要注意坐标进行了适应性调整,因为大部分球员的距离都在20-50开外,进攻与防守又相对独立,这使得我们可以平移坐标0点来得到更好的图形效果。
如果需要不平移坐标的结果,可以联系笑谈。
1、Alisson
Alisson.jpg
门将的统计维度比较少,在不多的维度内,能看到防守端接近他的球员包括特拉普和库尔图瓦,还有勒沃库森门将赫拉德基,进攻端接近的球员出现了加扎尼加(??),比较熟悉的还有什琴斯尼、梅雷特、斯特拉福卡等球员。
门将的数据比较两级化,没有在进攻防守层面都比较接近阿里松的球员。
2、Trent Alexander-Arnold
Trent Alexander-Arnold.jpg
TAA跟罗伯逊是亲兄弟。
可以看到数据上接近他的球员很多都是中场球员,包括谢尔维、内维斯、皮亚尼奇、维罗索、布罗佐维奇等熟人,边后卫里面,范安霍尔特、马克斯、奥拉萨等人上榜,打过翼卫的伦特斯特朗也入选。
这给了我们一些提示,阿诺德的确数据上更像中场球员,但并不意味着他接近顶级中场,反而更像是边后卫当中很少有人接近他。运用目前的工具,也许按位置滤掉球员比较合适。
(别问了,剩下的人笔者也认不全)
3、Andrew Robertson
Andrew Robertson.jpg
除开亲兄弟以外,大致和亲兄弟也比较像(毕竟在空间上是靠近的)。另外边角位置出现了米尔纳。
4、Virgil van Dijk
Virgil van Dijk.jpg
来到我们的世界第一中卫,最接近他的是小老弟德里赫特,攻防两端都比较相似。出现在榜单上的有不少名将,包括吕迪格、马诺拉斯、瓦拉内、阿尔比奥尔、博努奇、林德洛夫等人,还有出场时间不多的奥塔门迪。迭戈卡洛斯、金特尔等熟人也上榜。边角发现了老将布鲁诺阿尔维斯。
5、Joseph Gomez
Joseph Gomez.jpg
戈麦斯这边发现了更多其他人选,塞维利亚的艾萨曼迪、切尔西的克里斯滕森和托莫里可能比较熟悉,也包括意甲名将穆萨基奥、费拉里等人。
6、Fabinho
Fabinho.jpg
又发现一对兄弟——亨德森。当然这和法比尼奥伤缺时亨德森代打此位置有关。这张图例包括聪明利、诺伍德、罗梅乌、格耶等熟人,进攻端接近的有德容,防守端还有布斯克茨。
不过总得来说,从横纵坐标起点看,接近他的球员都不是那么接近。
7、Jordan Henderson
Jordan Henderson.jpg
和法比尼奥比较接近,还出现了哲马伊利等球员。
8、Georginio Wijnaldum
Georginio Wijnaldum.jpg
维纳尔杜姆的风格就和上两位明显不同,阿里、西索科、凯西这些人的风格和他明显接近,和他比较像的还有乌迪内斯中场弗法纳,以及巴克利、齐林斯基、弗雷泽几位熟人。比较有意思的是格里兹曼、博纳文图拉、华金等常年在前场或边路活动的球员也入选,这说明维纳尔杜姆依然有一定边锋时期的能力。
9、Sadio Mané
Sadio Mané.jpg
出现了阿达玛-特拉奥雷的身影,但最接近他的是……镰田大地。我们熟悉的还有圣徒的雷蒙德、大伤归来的恩波罗,还有比托洛。欧冠大放异彩的伊利西奇和罗杰斯麾下的哈维巴恩斯也在进攻端比较接近马内。
(镰田大地)
10、Roberto Firmino
Roberto Firmino.jpg
最接近的球员是莫拉雷斯(西甲莱万特中锋),哈维巴恩斯攻防两端再次上榜,渣叔旧将因莫比莱、老熟人本耶德尔在防、攻方面接近,边角出现了绯闻人选迪莫维尔纳和桑乔。熟悉的人选包括凯文弗兰德、格列兹曼、内托、拉什福德等人。
11、Mohamed Salah
Mohamed Salah.jpg
最接近的两位都是熟人,一位是许久之前绯闻人选摩西-西蒙,另一位就是维尔纳了。哈维巴恩斯、桑乔再次入选(???),攻端接近的自然要有姆巴佩,还包括热鸟、埃坎比、穆萨迪亚比等人。
保存图片(摩西-西蒙)
12、Joel Matip
Joel Matip.jpg
马蒂普这边出现了绯闻人选迪亚卡特,铁锤中卫巴尔布埃纳、纽卡克拉克等人上榜,防守端边角出现了杰克罗宾逊。不过最接近的球员是柏林老将帕伦森,还有卡利亚里老将切皮泰利。
13、Dejan Lovren
Dejan Lovren.jpg
马竞中卫萨维奇是最接近的球员,也包括穆斯塔菲、斯通斯两位豪门轮换,科纳特这位绯闻人选也上榜。
14、James Milner
James Milner.jpg
罗伯逊上榜,这不奇怪。上榜的还有凯尔沃克、维纳尔杜姆、扎卡等人。这些人距离他的位置也比较远,说明他多变的位置确实比较难以替代。
15、Alex Oxlade-Chamberlain
Alex Oxlade-Chamberlain.jpg
图上出现的最大牌的球员是莫德里奇,最接近的球员是曾经的绯闻目标奥亚尔,还有因西涅、佩莱格里尼,狼队的内托、巴萨的比达尔等球星也纷纷上榜。
(里昂中场奥亚尔)
16、Naby Keita
Naby Keita.jpg
这张图里有不少老熟人,其中利物浦的绯闻目标就包括德拉克斯勒和达胡德,也包括上面出现过的哲马伊利、布斯克茨、格耶等人。不过最接近他的是里尔崭露头角的小将苏马雷。
17、Divock Origi
Divock Origi.jpg
总觉得在研究奥里吉的时候需要把球队进球数作为唯一权重(误)
进入榜单的球员多少有些不太熟悉,最接近他的球员是曾经的巴萨天才穆尼尔,比较熟悉的球员还有比托洛和阿尤,后者在水晶宫发挥不错。
18、Xherdan Shaqiri
Xherdan Shaqiri.jpg
进攻指标最接近的是登贝莱,不过他出场不多,这张图的价值并不太大。
19、Adam Lallana
Adam Lallana.jpg
他与沙奇里有同样的问题,但还是有不少熟面孔,例如姆希塔良、卢卡斯巴斯克斯以及阿兰。
【四、福利】
Thiago(蒂亚戈)
Thiago.jpg
如你所见,最接近的人是埃姆雷詹,其他类似的球员包括鲁本内维斯、格耶、弗法纳,进攻端接近的球员还有布罗佐维奇,防守端出现了拉比奥特和波利。综合来看接近的球员还有恩东贝莱和。。。桑德罗。
一众的旧将与绯闻球员。
以上就是XTScore模型下分析出的一些结果,希望大家看得过瘾。不过不同的人看了会有不同的感受和理解,也欢迎说出您的见解。另外如果未来这些名单中真有成为被接班、轮换甚至升级的人选,记得回来挖坟哦(手动狗头)。
主办:靴室笑谈足球
作者:KMalone