跳转至主要内容
团队绩效

建模板球局组成

作者:丹尼·丁斯代尔

关键的外卖

optpro数据科学团队开发了描述球员和球队在一局中得分率和可控投篮概率变化的方法.

——世界杯揭幕战击球手, 英格兰的乔尼·贝尔斯托和杰森·罗伊都在几场比赛后迅速提高了他们的得分率,只有克里斯·盖尔超过了他们的得分率.

-在最后10个回合, 英格兰队的巴特勒在世界杯上比任何人都更早加速, 在41-50的比赛中,得分率稳步上升.

2月20日th 2019年,在巴巴多斯布里奇敦举行的西印度群岛和英格兰之间的第一届单日国际比赛(ODI). 英格兰队刚刚达到了曾经令人生畏的361分的目标. 看一看记分卡,乔·鲁特(Joe Root)在96个球中打出了100个,克里斯·盖尔(Chris Gayle)在100个球中打出了100个.

他们的最终比分是乔·鲁特,97球102分. 克里斯·盖尔,129个球135个.

对一个观察记分卡的普通板球迷来说, 用来描述鲁特和盖尔的比赛的动词可能看起来有点奇怪. 在记分卡上测量一局的速度, 我们通常使用局好球率(每100个球的失分). 在这种情况下,两者的最终命中率都是105. 那么,为什么看过比赛的人会倾向于用不同的方式来描述他们的比赛呢? 让我们看看下面100分的局数,看看为什么.

 

 

在这里,我们可以更好地了解他们的投球是如何发展的. 以典型的方式, 鲁特是英格兰队追逐的粘合剂,并以稳定的跑球率进步到100. 然而,盖尔选择了不同的路线. 他的第一个50分是76个球,第二个50分只用了24个球. 虽然这对盖尔来说是个极端的例子, 对于他来说,在换挡前起步缓慢并以很少有其他球员可以匹敌的速度加速是很常见的. 然而, 在一天的演出结束时, 在得分卡上,每个球员的得分都非常相似.

建立对局序的理解

为了更好地理解特定击球手的表现,我们必须考虑在一局中不断变化的测量值. optpro的数据科学团队已经开发了一种方法,可以根据球员的指标在一局中的变化来比较和评估他们的表现.

在板球50人的情况下, 这可以是比较一个球员如何在他们的跑动率方面建立他们的局, 还要通过控制镜头比例等措施. 我们可以用它来比较球员和球队在构建一局时所采取的方法. 此外, 我们可以进一步扩展,不仅观察球员如何建立自己的局, 而是通过在比赛的特定阶段评估明星球员. 例如, 谁是一局最后10局最危险的球员,他们通常是如何攻击这些最后的传球的?

如何量化局数进展

在这篇博客中,我们将集中讨论两个指标, 我们用它来模拟一局中击球表现的演变:

-每次交货的预测运行量: 我们考虑的是每批货物的运力而不是击中率. 这是为了区分打击率, 通常考虑总局分率和每次投球的预测失分, 这纯粹是对某局特定投球得分率的预测.

预测可控投篮概率: 这个介于0和1之间的度量是击球手控制投球的预测概率. 我们将控制击球定义为击球者所期望的击球结果, 从一个适时的高射到一个判断正确的离树桩.

我们的目标是提供一个近似的这些措施在不同时期的一局.

来预测我们的指标, 我们考虑在每次交付中都有一个移动的窗口,它考虑了蝙蝠侠在ODI板球的这个窗口中所面临的所有交付. 例如,对于20th一局的交付, 我们可以考虑两个窗口,因此看看击球手在18岁之间的职业生涯中所面临的所有投球th 和22nd 一局的交付量. 然后,我们在一局的特定部分使用这些数据来拟合广义加法模型, 通过样条曲线实现平滑预测(更多细节可以在文章末尾找到).

英格兰队的首发组合

举个例子, 让我们考虑一下自2015年世界杯以来,所有在前15个回合中得分至少400分的开场球员. 我们考虑前15个球局来决定开局击球手如何利用第一次强力打(超过1-10个球), 只允许两名外野手出内圈, 在过渡到强力玩法2(超过11-15人)之前,允许四名玩家出圈.

下面我们展示了英格兰队的首场比赛组合Jonny Bairstow和Jason Roy(黄色)的每次预测跑动。, 还有西印度群岛的强力击球手克里斯·盖尔(蓝色). 所有其他行(红色)是剩余的ODI打开器.

 

 

这张图显示了英格兰的开局组合在前15个回合的战术非常相似. 他们倾向于从一个有点快的开始逐渐加速, 当第一次强力比赛结束,边界上的最大外野手人数增加到4人,直到刚好超过一个球的跑动为止. 克里斯·盖尔采取了稍微不同的方法. 与英格兰队的首场比赛相比,他的前两场比赛有些平静, 但是他每次投球跑动的增加和其他开场球员相比是显著的. 虽然三个开局者都没有最快的逃跑速度, 到第八名时,他们通常在每次投递的跑动次数上排名前三.

现在让我们看看相同击球手和局数时期的受控投篮概率测量. 在这里我们可以看到,乔尼·贝尔斯托的控制投篮率一直高于杰森·罗伊. 这种控制与高命中率相结合,说明了为什么贝尔斯托在这个位置上略显成功(平均打击率为50.每局41分)与杰森·罗伊(平均打击率40)相比.每局54). 相比之下,克里斯·盖尔在前10个回合中更容易受到攻击. 然而, 一旦我们进入15局,他的控球率就高于平均水平, 再加上他最高的持球率,这就说明了为什么如果他没有早早被淘汰,他会如此具有破坏性.

 

 

乔斯男管家

今年世界杯上最具破坏力的球员之一是何塞·巴特勒. 专家们看了一下2015年世界杯以来的数据就能推断出这一点. He hits at a strike rate of around 175 in the final 10 overs of an innings; few others at this World Cup compare.

让我们更深入地研究这些数字. 这最后的10个数字纯粹是通过持续的进攻吗? 或者巴特勒能像其他人一样换挡? 在这里,我们展示了自2015年世界杯以来,在这段时间内至少有400次跑动的球员在最后10回合的每传球率预测.

 

 

在最后10个回合中,没有人能接近巴特勒的每球跑动预测. 有趣的是巴特勒曲线是线性的. 他的加速已经在41洞开始了st 结束并且是令人难以置信的稳定,不像许多其他球员等到44/45场.

结论

本博客中的例子强调了如何利用一个球一个球的数据来开发识别各种击球手原型的模型, 从克里斯·盖尔(Chris Gayle)等大胆冒险的开场者, 到像乔斯·巴特勒这样在最后几局始终如一的进攻者. 通过更细致地分析玩家表现,我们可以获得更详细的玩家表现信息. 例如, 我们展示了巴特勒是如何持续的进攻,而不是最后一局的冲锋,贡献了他无与伦比的最后10个回合的好球率.

这些方法可以用于理解和可视化所有形式的板球击球手的表现,这只是使用Opta数据进行球员表现分析的可能的开始. 进一步的机会包括使用我们详细的赛事数据,如击球类型和保龄球趋势,以补充跑速和控制击球信息.

在下一篇博客中,我们将进一步介绍这些方法, 通过展示如何对相似的跑动率和控制率进行聚类分析,根据相似球员的局数组成对他们进行分组,以识别球员类型. 这使得我们的方法能够用于识别相似的玩家, 哪些可以用于团队组成和球员发掘.

*进一步的模型细节:

如本文所述, 来构造适合我们模型的数据, 我们使用移动窗口方法.

让我们以odi的最后10页为例. 查看本文中的数字, 我们在利息交付的两侧使用大小为2的窗口, 我们对交付241-300感兴趣吗. 因此, 每一次投球241到300, 我们取每局中5个传递窗口(双方最多2个+传递利益)的平均得分. 在许多情况下,在一个窗口中会有0个交付, 因此,在特定的一局中,将没有交付的数据. 这些数据点是针对击球手所打的每一局在分段中每次传送时收集的.

一旦我们有了这些数据点,我们就在整个局段拟合一个广义加法模型(GAM). 这需要一个平滑的函数,在交付中我们所有的运行值, 我们使用惩罚基样条来控制曲线的平滑度,以防止过拟合. 我们还可以构造置信区间,因为我们只在局内的5个交付窗口中求平均值, 不跨越局数. 为了防止一个常见的问题,样条的边缘有不稳定的预测, 我们包含了一个用于数据收集的5 over缓冲区(如果可能的话). 例如, 对于超过41-50,我们将模型拟合到超过36-50,但在预测分析中忽略超过36-40. 我们也忽略了最后一个窗口中的预测(交付40次).0-40.2和49.4-49.在本例中为6),以减少边缘效应的影响,因为我们不能在感兴趣的部分之外包括额外的范围.