跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

「非人类对象」研究的增加日——跳过审查的诱惑:合成医疗数据加速的研究,动摇的信任

「非人类对象」研究的增加日——跳过审查的诱惑:合成医疗数据加速的研究,动摇的信任

2025年09月14日 12:53

大学跳过“合成医疗数据”的伦理审查?——在速度与信任之间摇摆的AI研究


前言

“如果是AI生成的‘合成医疗数据’,因为不涉及人类受试者,所以不需要伦理审查(IRB)。”——据Nature报道,加拿大、美国、意大利的多家医疗研究机构正以此为理由,跳过通常的伦理审查推进研究,这一消息在国内外的社交媒体上引发了热议。其背景是医疗AI面临的一个课题:如何在保护患者隐私的同时加快研究速度。Nature


WebProNews 也报道了这一动向,传达了研究加速的好处与对伦理标准形式化的担忧之间的对立。在本文中,我们将基于原始文章的要点,结合最新的研究见解、治理指导方针以及社交媒体上的反应,整理出企业、大学和媒体从业者需要关注的论点。WebProNews



发生了什么:合成数据与“非人类受试研究”论

根据Nature的报道,华盛顿大学医学院(美国)、渥太华儿童医院/渥太华医院(加拿大)、IRCCS Humanitas研究医院(意大利)等机构正在将使用AI生成的合成数据的研究视为“不属于人类受试研究”,因此不需要IRB审查。这一做法的依据是“未包含可识别的真实患者信息”。在美国,这一解释被认为符合1991年的Common Rule。不过,也有机构认为访问真实数据以生成合成数据的过程需要IRB的批准,因此界限并不统一。Nature


什么是合成数据

这是一种通过学习真实患者数据的生成模型,创建具有统计特性的虚构记录的方法。支持者认为,这种方法易于共享,有助于促进机构间的合作。然而,取决于生成方式,仍可能存在偏见和信息泄露的风险。Nature



隐私真的安全吗:再识别与成员推断

“匿名化或合成化=安全”并不总是成立。斯坦福HAI警告称,依赖于HIPAA风格的“18项删除”的匿名化无法完全消除再识别风险,因为通过与外部数据的匹配,个人仍可能被识别。Stanford HAI


此外,2024年的一项研究表明,即使使用匿名化的临床笔记或合成笔记进行训练的模型,也可能通过“成员推断攻击”推测出是否包含在训练数据中。这动摇了“没有真实患者参与”而省略审查的论据。Nature



伦理与法律的灰色地带:审查不是“零或全”的二选一

在IRB的世界中,支持AI研究审查的框架正在逐步建立。哈佛的MRCT Center计划在2025年发布AI研究的IRB审查框架,从研究与否的判断、人类参与的有无、AI的使用场景(干预、运营辅助)等初步问题,到公平性、透明性、同意、数据治理的实际检查清单。它鼓励根据风险进行**“轻量审查”**,而不是简单的跳过或全面审查。布莱根妇女医院临床试验中心



研究速度与社会信任:好处与副作用

支持者强调的好处显而易见。合成数据使得跨机构的数据共享变得容易,研究的速度和规模得以提升。这使得模拟罕见疾病或药物反应、重现长期追踪等仅靠现实数据难以实现的验证成为可能——Nature也在其文章中引用了相关人士的观点。Nature


然而,**如果优先考虑速度而普遍“跳过审查”,则会累积社会信任的磨损这一“隐形成本”**。近年,公众对使用合成或AI进行的“隐形实验”的反感情绪日益高涨,这一点不容忽视。The Washington Post



社交媒体的反应:赞成与反对的氛围

  • Nature 本体的帖子成为起点,被医疗图书馆、急诊医生的社区账号广泛分享。临床现场对此高度关注,对“可以跳过通常审查”的标题反应强烈。X (formerly Twitter)X (formerly Twitter)

  • 部分研究人员和教育者发出了**“极为可疑(deeply dubious)”**的批评性帖子。担心伦理审查的例外处理可能最终助长研究不当或算法的“失控”。X (formerly Twitter)

  • Retraction Watch也分享了文章。该媒体一直追踪AI研究的不当实施和撤回案例,其传播象征着“监督之眼”的增强。X (formerly Twitter)

综合社交媒体的氛围,临床和教育社区对“观望的期待”与“对程序轻视的不信任”并存。与一般的科技界相比,医疗和伦理群体显得更加谨慎,这种温差也可见一斑。



面向实务者:合成医疗数据的“7个自检点”

即使“跳过审查”,也有许多事情需要做。 这是Nature文章、MRCT的指导方针以及隐私研究所揭示的现实。在项目开始前,至少要检查以下7点。

  1. 生成过程的审计:文档化合成度(真实到合成关系、统计相似性)和“逆向识别”可能性的评估协议。Nature

  2. 隐私威胁模型:评估成员推断、再识别、链接可能性(必要时采用差分隐私等)。Nature

  3. 数据卡/模型卡:公开数据来源、过滤器、偏见、意外用途的注意事项(可内部公开)。布莱根妇女医院临床试验中心

  4. 公平性检测:检查代表性的差距(少数群体或罕见疾病的处理)。布莱根妇女医院临床试验中心

  5. 人类在环:在决策中涉及时,明确人类介入点和止损阀(停止条件)。布莱根妇女医院临床试验中心

  6. 透明性与披露:在论文和报告中明确合成数据的使用,并记录其局限性和预期风险。布莱根妇女医院临床试验中心

  7. “轻量审查”的常设:即使被定位为IRB的非对象,也应设立AI研究专门的审查窗口,并制度化年度审计和事后审查。布莱根妇女医院临床试验中心


常见误解(FAQ)

  • 问:因为是合成的,所以个人信息为零?
    答:如果生成材料中使用了真实数据,并且统计上“过于相似”,则可能存在成员推断或再识别的余地。处理过程中的风险评估是必需的。Nature

  • 问:IRB不需要就没问题?
    答:虽然在法律技术上可能被认为不需要,但从社会信任和研究可重复性的角度来看,通过轻量的第三方审查往往能降低长期成本。布莱根妇女医院临床试验中心

  • ##

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.