跳转至主要内容
人工智能,团队表现

研究论文-从大量的大学篮球跟踪数据预测NBA人才

NBA球队的选秀决策能力有限,因为他们没有NCAA球员的详细跟踪数据. 为了避免这个问题, 我们利用最先进的计算机视觉技术,直接从广播视频中捕获了数千场NCAA D-I男子篮球比赛的跟踪数据.

作者:迈克·莫里森

In 2010, SportVU光学球员和球跟踪系统最初被部署在一些NBA赛场上,这些球队希望在球员和球队分析方面获得优势. 由于跟踪数据的价值, NBA随后在2013-14赛季之前在全联盟范围内采用了SportVU. 从那时起, NBA球队几乎所有的分析和决策都是数据驱动的, 不仅利用原始位置数据, 但是战术洞察力来自于机器学习算法自动检测到的标记(例如.g.、屏幕、隔离、驱动器等.).

然而, 当谈到分析即将到来的NCAA球员选秀时, NBA球队的决策能力受到严重限制,因为他们没有NCAA球员的详细跟踪数据. 场馆内硬件解决方案对NCAA来说是不切实际的, 除了众多不在NCAA场馆举行的展览/锦标赛和季后赛外,仅一级联赛就有300多所学校. 另外, NBA管理层可以模拟一名大学生球员未来的潜在产出, 他们将需要当前NBA球员的历史跟踪数据来建立一个建模训练集——这是现场解决方案无法实现的.

为了避免这个问题, 我们利用最先进的计算机视觉技术,从数千场NCAA D-I男子篮球比赛中直接从广播视频中捕获球员和球的跟踪数据. 这个数据量相当于650多个,超过3亿帧的广播视频. 从跟踪数据来看, 我们会自动检测诸如球屏之类的事件, 驱动器, 分解动作, 低位背打, 使用我们的动作注意神经网络系统进行无球掩护和防守对位,召回率和准确率为0.8和0.7分别.

尽管从广播中为大学篮球生成跟踪数据本身就是篮球分析领域的一个巨大突破,但这还不够. 为了展示生成的数据的价值,最好通过预测任务来衡量价值. 在这篇论文中,我们关注的任务是预测未来NBA球员的天赋. 我们通过直接从大学数据中预测球员进入NBA的概率来做到这一点. 我们表明,与当前数据源相比,使用跟踪数据使我们能够获得更准确的预测(跟踪日志损失:0.30 vs play-by - play log-loss: 0.40). 我们的方法的另一个好处是我们应用了“可解释的机器学习”技术(i.e., Shapley values)不仅能做出准确的预测,还能识别特定球员的优势和劣势.

查看完整的研究论文