“结束‘脑震荡是看不见的’? 仅用声音在数秒内判定的AI冲击”

“结束‘脑震荡是看不见的’? 仅用声音在数秒内判定的AI冲击”

“脑震荡是看不见的”。越是与体育运动相关的人,越能体会这句话的分量。跌倒、接触、碰撞——即使运动员在这些情况发生后能站起来,判断“是否真的没事”并不容易。CT等影像检查难以显示,现场往往依赖短时间的问诊或自我报告。


针对这种“判断的困难”,一种以“看不见就听”的想法切入的研究引起了关注。通过AI分析声音的细微变化,在几秒钟内显示脑震荡的可能性——这是一种基于声音的评估方法。


契机是“回到场上”的现场判断

文章以2022年NFL发生的事件为起点。塔戈瓦伊洛亚选手在头部受伤后重返比赛,但后来联盟承认应该将其视为脑震荡。这一过程中,现场判断为“背部受伤”,未作为神经学问题处理,这一点具有象征意义。


当然,即使之后规则有所修改,如果没有增加“那一刻”判断的可靠手段,同类的犹豫仍会重演。这正是研究的目标所在。


“声音指纹”而非“声音健康计”

研究团队关注的是“speech biosignatures(语音生物特征)”。直译为“发声的生物标志”。声音因个体差异大,常被比作“指纹”。但重要的是,声音并非固定的指纹,而是会因健康状况、损伤,甚至醉酒等情况而变化。


换句话说,如果比较“平时的声音”和“受伤后的声音”,可能会发现个人内部发生的变化。AI可以捕捉到人耳无法察觉的差异作为特征量。


如何收集,发生了什么变化

据文章介绍,研究小组从高中和大学水平的众多运动员中收集了赛季前(基线)和赛季中(必要时包括受伤后)的语音样本。涉及的运动项目包括拳击、橄榄球、长曲棍球、橄榄球、啦啦队等。


然后,将确认脑震荡的案例与对照组进行比较。结果显示,振幅、频率(音高)、振动等指标存在差异。即使是人耳认为“无关紧要”的变化,AI也能识别为模式。


此外,随着机器学习的进步,目前的工具可以“以超过90%的准确率”关联与脑损伤相关的声音变化。


实用化的关键在于“一句话即可”的机制

然而考虑到现场应用,检查越复杂,操作就越困难。因此,研究正在尝试将多词或短语、声音的传统程序简化为更少的元素——理想情况下是“一个单词或特定的声音”。


如果这一方向得以实现,可以在赛季前通过平板电脑等设备获取并保存所有运动员的基线数据,在事故或接触发生后立即进行相同的发声以进行即时比较。结果可以以“轻度、中度、重度”的形式显示,成为休养或复出过程的判断依据。


“通过声音了解”的意义——填补遗漏的空白

文章指出,美国估计有超过一半的脑震荡未被诊断,约70%的发生在体育环境中。


如果这接近事实,问题不是“没有诊断技术”,而是“现场捕捉机制薄弱”。


声音AI评估的价值就在于这一“捕捉”场景。它在短时间内,设备负担相对较轻,且不依赖于自我报告的模糊性。当然,它并不是要取代最终诊断,而是作为“加强/减弱怀疑”的筛查工具,也能改变现场的决策。


期望扩大的同时,也需要谨慎

研究方表示,应用范围包括帕金森病和阿尔茨海默病等,随着进展声音声学特性发生变化的神经疾病的评估。此外,还提到在警察、消防、军队、建筑等高身体风险职业中的应用可能性。


然而,社会实施中必然会出现的讨论点也存在。

  • 误判的成本:假阴性(漏诊)和假阳性(过度诊断)都会影响现场决策。

  • 操作设计:AI结果由“谁来处理”。复出判断的责任结构,与联盟或学校规定的一致性。

  • 隐私:声音是高度个人信息。基线的保存方法、第三方提供的限制、目的外使用的担忧。

  • 基线问题:无法事先录制的一般环境,或声音每天变化的情况(感冒、疲劳、噪音)的耐受性。


研究的核心在于“声音会变化”,但正因如此,如何处理“非伤害的变化”在技术和制度上都很重要。



社交媒体的反应(常见论点和表达方式的趋势)

※由于本事件公开不久,与其说是某个特定帖子大规模传播,不如说是整理相关话题(脑震荡、运动医学、AI语音分析)中常见的反应模式。


1)期待:“这样就能减少漏诊”

  • “倒下后立即有客观指标是很强的”

  • “可能对不愿自我报告的选手有效”

  • “如果能在学校社团和业余中使用,价值很大”

背景是,短时间的问诊和以目视为主的评估有其极限。

2)谨慎:“超过9成”的展示方式的质疑

  • “‘准确率90%’取决于条件。现场噪音和方言呢?”

  • “如果是阳性就立即换人?最终判断由谁来做?”

  • “比起准确率,操作(协议)的设计更重要”

医疗和安全领域的AI,由于数字的冲击力容易先行,因此对“前提条件”“可重复性”“引入后的责任”更为关注。

3)隐私:“语音数据是强烈的个人信息”

  • “谁拥有类似声纹的信息?”

  • “不会被保险或雇佣滥用吗?”

  • “竞技团体半强制获取很可怕”

正如文章中解释“声音的生物标志”这一概念,声音是高度个人化的数据。这方面容易引起敏感反应。

4)体育语境:“为了不重演那种情况”

  • “最终,现场的压力是问题所在”

  • “比起技术,更重要的是遵守应遵守的规则”

  • “需要防止‘随意解读’AI结果的机制”

技术越多,反而越能可视化“判断的政治性”,这种观点也存在。



出处