跳转至主要内容
人工智能

体育报道的未来:第二部分

老款飞禽走兽游戏-apple app store-飞禽走兽官网排行榜的首席科学家, 帕特里克Lucey会谈ChatGPT, 体育领域的深度学习和人工智能技术.

作者:帕特里克Lucey

第一部分请参阅我们的故事 在这里.

ChatGPT背后的语言模型和变形金刚在体育中有什么作用?

除了聊天机器人, 语言模型和生成人工智能在体育运动中有一席之地吗?

答案是肯定的, 在我们看来, 这是体育分析领域的下一次革命, 为球队和球迷提供比以往更深刻的比赛理解, 尤其是在足球方面.

首先,我们必须指定运动语言. 对于文本,这是ChatGPT语言所需的输入 已经存在. 正如我们所看到的, ChatGPT语言模型利用原始文本数据, 它有自己固有的结构(想想字母, 单词, 句子, 段落). 转换器架构通过利用句子中的上下文预测缺失的单词来学习统计数据和相关性, 段落和整体故事叙述.

体育数据具有不同的固有语言结构. 以足球为例,比赛是11人对11人(或场上10人对场上10人). 每个玩家都有自己的角色,并在游戏过程中不断发展或改变.

在一个团队中,比赛中球员信息的表现是非常重要的.  我们可以说每个球员都是一个字母(而不是用名字或球衣号码), 我们利用他们的比赛位置和统计数据, 以及他们最近和长期的比赛数据), 每一场比赛都可以用一个词来形容, 这些字母的顺序必须正确,我们才能理解这个词.

每个游戏可以是一个句子,每个财产可以被视为一个段落.  篇章可以是比赛,赛季可以被视为一本书. 除了创建正确的结构(或语法), 体育数据的输入既是时空的(即时间的)输入.e.(x’s和o’s表示玩家位置)和基于事件的(i.e.,事件类型和财产的结果)——这需要大量的预处理. 所以我们可以把体育数据看作是一部电影, 而不是一本书-输入是多模态的,而不是单一的输入源.

既然已经定义了足球的输入语言, 我们可以开始学习一个“足球语言模型”,它可以使我们产生以前无法做到的输出. 现在考虑到人工智能聊天机器人在“幻觉”事实方面的固有问题, 而不是针对所问的任何问题产生结果, 我们可以使用“智能提示工程”来回答以前无法回答的问题.  有关智能提示工程的更多信息,请参阅本系列的第一篇文章.

下面我们给出了许多实际的例子.

球队的愿景

球队的愿景是一个丰富的人工智能数据提要,利用计算机视觉数据和我们的人类事件数据. 然后通过我们的图形神经网络进行处理,以提供对每个事件的预测,这些事件描述了球队和个人球员的决策和执行能力.

例如, 用我们的底层形式表示(或语言), 我们可以检测出一个球队的阵型是什么.g.4-4-2, 3-4-3, 4-3-3等等.),以及它在拥有和不拥有时的变化.

我们还可以在每一帧中分配玩家的角色, 这让我们能够看到玩家何时重叠, 或者在比赛中出现战术变化.

使用相同的底层表示, 我们还可以预测球员传球的可能性, 传球在接下来10秒内创造得分机会的概率, 或者评估这是否是正确的选择.

使用我们的足球语言模型, we predict all the possible options at the same time; in other 单词, 预测句子, 而不是分别预测每个字母. 我们通过使用位置来做到这一点, 所有玩家的动态和事件作为输入序列, 然后将其映射到对应于通过难度的输出序列, 可用性等.

以前, 我们独立分析了每个玩家的选择, 但是使用我们的大型足球语言建模方法, 现在我们可以同时分析所有玩家. 这对于理解每个玩家对于每个事件的决策能力是很有价值的, 但我们可以使用类似的方法来预测每个玩家在游戏结束时的统计数据.

基于变压器的玩家表现预测 

假设你是一名足球教练, 你想知道在比赛中哪位球员对改变结果的影响最大. 之前对球员表现的预测是独立于其他球员和对手的. 利用我们的变压器方法和庞大的足球数据数据库, 我们创建了一个模型,可以同时预测所有球员和球队的输出.

再次使用机器翻译的类比, 其理念是在游戏开始时(或游戏过程中)将玩家和团队信息的输入序列映射为输入序列. 然后我们使用变压器网络将其映射到最有可能的输出序列, 在这种情况下,哪个是最终的比赛统计数据. 使用变压器网络的强大之处在于,它可以迅速推广到未见的情况. 在足球界,这是司空见惯的, 因为球队在常规赛中有主客场之分, 而且他们的阵容往往是不同的(经理也是一样), 以及最近的形式.

这是一项新的创新,在2023年,我们将展示这项技术的力量.  训练这个模型, 我们利用了我们独特的深度Opta数据库,仅事件数据超过1.5TB大小(不包括我们相当大的跟踪数据存档).

重影

我们也可以利用类似的技术来增强我们做鬼影的能力.e.,模拟玩家在戏剧中的位置,这是我们之前共同撰写的作品 足球 而且 篮球).

之前的方法学习了一个有监督的策略网络,以确定性的方式预测团队的行为, 但是随着语言建模的进步, 更有创意的输出(有些可能以前没有见过), 可以生成. 但值得注意的是,有时教练/分析师更喜欢有确定性的预测.e.,发生了什么)vs本可以有哪些不同的演出方式.

数据收集

使用语言建模的另一个好处是,它可以用作体育数据收集过程中的辅助工具(类似于前面提到的编码助手)。, 它在我们的基于计算机视觉的球员和球跟踪系统中使用的位置, 或者突出一个潜在的错误数据点,供我们的人工操作或完整性团队评估.

结论

ChatGPT是一个雄心勃勃、执行良好的工具. 虽然它在体育或新闻报道中可能没有其他领域那么多的直接应用, 底层的生成式AI方法已经在老款飞禽走兽游戏-apple app store-飞禽走兽官网排行榜中使用, 使用我们自己专有的体育语言作为输入. 它们已经为团队表现领域的许多应用程序提供了动力,并且在未来一定会增强体育内容和分析的许多方面.

Dr. 帕特里克Lucey是体育数据巨头老款飞禽走兽游戏-apple app store-飞禽走兽官网排行榜的首席科学家, 领导人工智能团队,目标是最大化公司深厚的体育数据宝藏的价值. Patrick在过去的20年里一直在人工智能领域学习和工作, 他在迪士尼研究院和卡内基梅隆大学机器人研究所担任研究职位,并在IBM的T.J. 沃森研究中心攻读博士学位.D. Patrick来自澳大利亚,他在南昆士兰大学获得学士学位(EE),在昆士兰科技大学获得博士学位. 他撰写了100多篇同行评议论文,并一直是麻省理工学院斯隆管理学院最佳研究论文跟踪的合著者, 2016年获最佳论文奖,2017年和2018年获亚军.