国内外篮球比赛大数据对比研究

(整期优先)网络出版时间:2024-09-09
/ 3

国内外篮球比赛大数据对比研究

张飞[1]

杭州师范大学

摘要:本研究以大数据时代国内外篮球比赛大数据对比为研究对象,主要运用文献资料法、专家访谈法、专家问卷法、视频分析法、实地考察法等方法,对CBA及NBA联赛在比赛数据统计指标方面的发展进行全方位、多维度的梳理和分析,找出目前国内在比赛数据统计指标体系方面的不足,提出优化国内篮球比赛数据发展的启示。

关键词:比赛数据、篮球、大数据

Comparative study on big data of basketball matches at home and abroad

Abstract: This study takes the comparison of big data of basketball games at home and abroad in the era of big data as the research object, and mainly uses the methods of literature, expert interview, expert questionnaire, video analysis, field investigation and other methods to conduct a comprehensive and multi-dimensional combing and analysis of the development of CBA and NBA League in terms of game data statistical indicators. This paper finds out the deficiencies in the current domestic statistical index system of game data, and puts forward the enlightenment of optimizing the development of domestic basketball game data.

Key words: game data;basketball;big data

1.国内篮球比赛大数据的内容与特点

1.1 现阶段CBA官方比赛数据库中数据统计的内容与特点分析

现阶段联赛官方比赛数据库主要包括四个部分内容:球员数据、球队数据、完整排名榜及TUD统计。TUD统计是指技术犯规、违体犯规以及夺权犯规,由于CBA在竞赛规程中对这三类犯规有明确的处罚要求,因此将其进行单独统计,以便于相关人员进行数据查询。[2]

当前CBA官方比赛数据库中比赛数据统计有以下缺陷:在效率评价方面,量化数据相对较多,效率数据相对较少;在比赛技战术评价方面,有技术相关的数据统计指标,缺少战术相关的比赛数据指标;在对球员和教练员分析方面,有评价球员能力的数据,缺少评价教练员临场执教的数据;从进攻和防守的维度分析,进攻数据相对较多,防守数据相对较少。

1.2 国内主要篮球比赛数据库中数据统计的内容与特点分析

1.2.1 虎扑篮球比赛数据库中数据统计内容与特点分析

虎扑篮球是目前国内最具影响力的篮球信息数据来源地,是国内关于CBA比赛数据统计最全的数据库,也是CBA各球队获取球队及球员比赛数据的主要渠道,在球队、篮球研究者及球迷中具有广泛的影响力。其比赛数据库中数据统计内容主要包括三部分,即球员数据、球队数据以及数据排名。

1.2.2 搜狐、网易及新浪篮球比赛数据库中数据统计内容与特点分析

搜狐、网易及新浪篮球比赛数据库是国内最早建立,也是除CBA官方比赛数据库以外,获取联赛比赛数据统计的重要渠道,三者比赛数据库中数据统计内容有较多的相似之处,主要以传统基础数据为主,并对其进行单场、总计以及排名分析。在球员比赛数据统计指标体系中具体的量化数据指标与CBA官方比赛数据统计指标相同,以传统基础数据为主,并没有增加对攻防效率进行深度分析的高阶数据统计指标,仅增加了一些新的分析视角,较国内其他篮球比赛数据库中数据统计进行更细化的分类,如球员资料、球员职业生涯数据、个人比赛数据记录等,为比赛数据查询提供了快捷通道。

当前国内主要篮球比赛数据库中比赛数据统计能够在一定程度上为篮球比赛攻防分析提供一定程度的支撑,弥补职业联赛官方比赛数据库中数据统计指标维度和深度一些不足问题,但对球队比赛攻防分析与评价方面提供的帮助具有局限性。作为具有互联网背景的篮球比赛数据库并没有发挥其优势,即运用大数据及人工智能技术促进CBA比赛数据统计指标体系的优化,作为信息服务类的比赛数据库,并没有随着联赛的发展,利用比赛数据库平台优势扩大其市场价值。

2.国外篮球比赛大数据的内容与特点

2.1 现阶段NBA官方比赛数据库中数据统计的内容与特点分析

通过对现阶段NBA官方比赛数据库中数据统计内容的归纳与总结得出

第一、传统基础数据。与现场比赛数据统计指标相同,如得分、篮板、助攻等;第二、高阶数据。包括进攻和防守比率、助攻率、助攻失误比、进攻和防守篮板率、篮板率、失误率、有效投篮命中率、真实投篮命中率、使用率、节奏及球员影响能力;第三、投篮数据。包括不同距离的出手数与效率,如小于5英尺的投篮、5-9英尺、10-14英尺、15-19英尺、20-24英尺、25-29英尺;第四、防守数据。包括防守的频率,如两分球频率、三分球频率,防守时对手的出手数、命中数及命中率等;第五、积极性数据。包括掩护助攻、干扰传球、进攻地板球、防守地板球、制造进攻犯规、有对抗的二分球投篮、有对抗的三分球投篮、篮下卡位、进攻卡位、防守卡位、卡位情况下球队篮板球、卡位情况下队员篮板球;第六、追踪数据。包括突破(次数及突破后的得分、助攻、失误的效率)、防守影响力(对手在限制区内的投篮次数、投篮命中率、盖帽、抢断)、接球投篮、传球(成功次数、预助攻、潜在助攻、助攻创造得分、助攻比)、触球(次数、前场次数、限制区次数、肘区次数、低位次数、每次的平均时间、每次的运球次数、每次的得分、每次限制区得分、每次肘区得分、每次低位得分)、运球跳投(两分球和三分球得分与命中率)、篮板球(有对抗、无对抗、有对抗比率、篮板球机会、机会比率、平均距离)、防守篮板(有对抗、无对抗、有对抗比率、防守篮板球机会、机会比率、平均距离)、进攻篮板(有对抗、无对抗、有对抗的比率、进攻篮板球机会、机会比率、平均距离)、投篮效率(突破得分和命中率、接球投篮得分和命中率、运球投篮得分和命中率、限制区得分和命中率、低位得分和命中率、肘区得分和命中率)、速度与距离(防守距离、进攻距离、平均速度、平均进攻速度、平均防守速度)、肘区接球、低位与限制区三个不同区域的接球数据包括(接球次数、投篮次数、命中率、得分、得分率);第七、打法类型数据。主要为进攻类数据包括外线单打、转换、挡拆持球者、挡拆挡拆者、内线低位、定点投篮、手递手、传切、无球掩护、进攻篮板的二次进攻及其他,在不同打法类型的数据统计指标体系下又包含具体的量化指标,如得分、命中率、命中数、出手数、有效投篮命中率、罚球频率、失误频率、投篮犯规频率、二加一频率及得分频率。

2.2 国外主要篮球比赛数据库中数据统计内容与特点分析

SportVU比赛数据库中数据统计内容是追踪数据指标体系,与传统的比赛数据采集方式不同,其利用6台固定在场馆中的高速摄像机,对球员、裁判以及球进行轨迹追踪,最终利用数据算法软件自动生成大量的比赛数据,但最终的比赛数据报告依然需要人工进行筛选生成。

比赛数据统计的输出主要包括三个部分——原始追踪数据、与比赛事件关联、通过数据算法输出数据。第一部分,原始追踪数据是先通过对球场建立X、Y、Z三条坐标轴,并对球员进行身份编号及对比赛时间进行识别;第二部分,与比赛事件关联,为了最大化利用球员的追踪数据,因此必须与比赛事件(Play by Play)相关联,比赛事件是记录一场篮球比赛的日志,包括球员投篮、运球、跑动、篮板球、抢断等一系列在篮球运动中先前已经被界定过的概念,这样采集到的数据才是有效数据;第三部分,数据算法,即利用人工智能等先进计算机技术对关联的数据,进行数据整合与分类,最终能够在60—90秒钟之内即可更新一次数据报告。

SportVU实时数据统计报告主要包括四部分内容,分别为投篮、持球、篮板球以及移动。在投篮数据部分,包括投篮区域、投篮区域效率、有防守的投篮、接球投篮等,并对投篮时剩余的进攻时间进行追踪;持球的数据统计指标体系是其最大的特点之一,主要包括传球次数等,这部分数据很难通过传统的比赛数据采集方式实时获得;篮板球数据则包括篮板球位置、卡位篮板球等,丰富篮板球技术数据;移动数据部分也是其最大的特点,是主要包括平均速度、进入限制区次数及进入肘区次数等,对球员在比赛中的运动表现有了清晰地认识,改变以往通过经验对球员运动表现的评价。

SportVU比赛数据库中赛后数据统计内容丰富,数据统计指标更全面。赛后数据统计包括八个部分:投篮、传球、篮板球、防守、挡拆、运动表现、转换及其他。投篮、传球、篮板球及运动表现四个部分,在实时数据统计的基础上,又增加了一些比赛数据指标,如投篮部分的单打投篮、突破投篮;传球部分的每球权传球次数、球员传接球次数、挡拆传球;篮板球部分的冲抢进攻篮板球的冲抢距离、冲抢频率等;运动表现部分的进攻或防守移动距离、(走、慢跑、跑动、冲刺)时间比等。防守、挡拆、转换及其他四个部分,由于采集技术与人力成本的因素,对这部分数据指标在传统数据库中很难被收集,而SportVU比赛数据库则弥补了这部分数据的缺失。如防守形式(挤过、穿过等),防守效率(球员得分、助攻等效率);挡拆持球者频率和效率,挡拆挡拆者频率和效率,进攻形式(外弹、下顺、快拆),挡拆的区域等。

SportVU比赛数据库中数据统计内容最大的特点是运用先进的数据统计采集方式,完成人工所不易采集和获得的数据统计指标,且数据的存储量大和处理能力快,能够为决策者及时带来更多的依据和分析视角,辅助决策组织更好地获得竞争优势。

3对国内比赛数据优化的启示

3.1 NBA技战术水平的发展是促进比赛数据统计指标体系优化的内生动力

比赛技战术水平的提升对数据统计的发展提出更高的要求。近些年随着高水平外援和教练员的加入,CBA联赛技战术水平不断提升,传统比赛数据已满足不了对现阶段球员攻防技术能力、球队攻防战术能力分析以及科学组建球队的需要,需不断挖掘比赛数据统计指标体系的深度,如高阶数据对球员能力进行多维分析,战术数据对球队不同攻防战术的特点和效率进行量化分析,从而更好地掌握不同球员、球队的攻防特点和效率水平。

3.2 NBA庞大的市场需求是促进比赛数据统计指标体系优化的外部动因

职业联赛巨大的市场发展需求是比赛数据统计指标体系优化的外部动因。2017年CBA公司独立运营以来,转播收益不断提升,相关衍生产品不断丰富,媒体转播及联赛的衍生产品均与比赛数据存在密切的联系,比赛数据作为基础资源,需要不断发展和优化,从而满足上层建筑更好发展的需求。

3.3 现代信息科学技术的发展为比赛数据统计指标体系优化提供技术保障

当前我国信息科学技术的发展已能为CBA比赛数据采集方式多样化提供技术保障,满足比赛数据统计指标维度的拓展和数量的积累。CBA比赛攻防速度的加快对分析效率提出更高的要求,可视化成为数据处理和分析的最有效手段,能够借助图形化技术手段,清晰有效地传达与沟通信息,实现对于复杂数据集的深入洞察,直观地描述比赛攻防的技战术特点,提高联赛比赛数据的分析与应用效率。

3.4 多学科交叉人才的成长为比赛数据统计指标体系优化提供了人才支撑

比赛数据最大的作用就是由数字变成与比赛相关的信息,最终形成智慧,从而能够为科学决策给予支持。近几个赛季,数据分析师已开始在CBA球队中展露,这对联赛和球队的发展是一个新的开端。当前CBA球队数据分析师虽无法创造新的比赛数据指标,但可运用多维比赛数据统计指标体系为比赛攻防分析提供更多的视角,将枯燥的数据转化为智慧,最终为特点分析、能力评价及科学决策提供帮助。

3.5 全球化发展推动了比赛数据统计指标体系的交流、借鉴与完善

比赛数据统计是NBA官方比赛数据库的重要内容,丰富的比赛数据统计指标体系使其成为全球篮球职业联赛发展的标杆。通过比赛数据向全世界讲述联赛历史,吸引对联赛关注,向全世界展示最新的篮球技战术发展方向,将比赛信息、文化和媒体巧妙的融合在一起,致力于运用数字化方式获得更多球迷的认可,将篮球文化和赛事品牌推向国际舞台,实现联盟—球员—媒体—赞助商—球迷—城市品牌的多方共赢发展。

数据统计作为职业篮球比赛的通用“语言”,CBA联赛的全球化发展定位,需要与国际高水平联赛接轨,通过不断的交流和借鉴,从而弥补自身发展的不足。在大数据时代的背景下,推动联赛的数字化建设,可实现在球员挖掘、教练员决策、组建球队等方面的互通,最终促进联赛更好地发展。

4.参考文献

[1]陈健,姚颂平.关联分析在篮球技术统计数据分析中的运用[J].上海体育学院学报,2009,33(05):91-94

[2]邱雪. 2010-2011赛季CBA中外教练员临场指挥能力的对比与分析[D].西安:西安体育学院,2012

[3]杨振兴,杨军,白洁,刘林星.基于大数据技术对美国职业篮球联赛的研究[J].中国体育科技,2016,52(01):96-104

[4]杨振兴,白洁,姚健.NBA联赛大数据统计研究[J].体育文化导刊,2015(07):103-107.

[5]王峰.美国职业篮球联赛数据管理模式所引发的结构变异[J].中国体育科技,2015,51(01):20-27.

[6]姚卓凡.浅谈大数据对职业篮球联赛的影响[J].数字通信世界,2017(09):19+6.

[7]白银龙.核心队员对篮球比赛结果的决定作用研究[J].体育文化导刊,2012(08):56-59

[8]吴翔峰.14-16年NBA优秀控球后卫与得分后卫攻防能力的对比分析[D].北京:北京体育大学,2017


[1] 基金项目:杭州市哲学社会科学重点研究基地体育赛事与健康促进研究中心项目(2021JD21)

作者简介:张飞,博士,研究方向:体育大数据