【美国】因AI撰写的“不存在的判例”导致审判中止,4名律师受到制裁 ─ 法庭上演的“ChatGPT代理战争”

【美国】因AI撰写的“不存在的判例”导致审判中止,4名律师受到制裁 ─ 法庭上演的“ChatGPT代理战争”

https://www.reuters.com/legal/litigation/judge-rules-both-sides-lawsuit-misused-ai-disqualifies-lawyers-2026-06-09/AI写的“不存在的判例”导致诉讼中止──律师未阅读文件的代价

在美国法庭上,发生了一起象征生成AI时代的异常事件。争议的焦点并不是使用AI本身。问题在于,AI输出的内容未经人类专家确认就提交给了法院。

在密西西比州北部地区联邦地方法院处理的是律师汤姆·威瑟斯与密西西比州阿伯丁市之间的合同纠纷。威瑟斯声称市政府拖欠律师费而提起诉讼。通常情况下,诉讼中会交换准备文件,整理事实和法律主张,然后进入审判。然而,在这个案件中,法院在这之前就发现了重大异常。

提交的文件中包含了法院无法找到的判例。

起初,这似乎只是引用错误或表述不一致。然而,问题的引用不止一个。在被告方的文件中,原告方的文件中,都有无法确认的判例。法院调查后发现,这些引用是不存在的,或者至少在提交的形式下无法确认,是“幻觉”引用。

幻觉是指生成AI在生成看似合理的文本或信息时,其内容并不基于事实的现象。在法律领域尤其危险。因为判例和法律引用不是装饰,而是主张的依据。引用不存在的判例与在食谱中写虚构的材料是不同的。浪费了法官、对方、委托人以及整个司法系统的时间和信任。

此次事件更为异常的是,AI引发的问题并非仅出现在一方阵营。原告方和被告方都在使用AI生成的文件中遇到了问题。仿佛是AI生成的主张对另一AI生成的主张进行反驳的构图。在社交媒体上,有人讽刺说“委托人支付高额律师费,实际上看到的是AI之间的争论”,这正是这种奇怪现象的原因。

根据制裁命令,原告方律师凯瑟琳·威尔逊使用生成AI制作文件,但未确认其中的法律依据。被告方律师凯瑟琳·威廉姆斯使用AI法律研究工具,并在未独立确认其输出的情况下将其纳入文件。此外,尽管双方的当地律师也在文件上签名,但未充分确认内容。

法院并未全面否定AI的使用。相反,法院承认AI如果适当使用是有用的工具。然而,法院明确划定了界限。签署文件的律师的责任不能转移给AI、共同代理人或软件公司。AI可以生成文本,但赋予其真实性和责任的是律师本人。

这一判断包含了对生成AI时代专业人士的沉重信息。AI可以成为便利的草稿助手。可以用于搜索的起点、论点整理、文案制作。然而,在最终提交、发布、索赔、诊断、判断的阶段,人类的确认是不可或缺的。特别是在法律这样一个字词直接关系到权利、义务、金钱、自由的领域,“因为AI这么说”并不是理由。

法官沙里恩·艾科克取消了预定的审判,停止了诉讼程序。此外,将涉及案件的四名律师全部从该案件中移除。对于直接参与使用AI制作问题文件和法律调查的两人,禁止其在两年内出庭于密西西比州北部地区联邦地方法院。罚款也被处以,威尔逊被罚款2500美元,威廉姆斯被罚款3500美元,两名当地律师各被罚款1000美元。威尔逊还被命令参加有关AI使用和伦理的持续法律教育。

这一处分不仅仅是罚款。法院表示将向相关律师团体发送命令。也就是说,这次的问题不仅仅是一个诉讼内的失败,还可能被视为职业伦理问题。

社交媒体的反应混合了愤怒、无奈和现实的讨论。

在法律社区中,“浪费了已经过载的司法系统的时间和金钱”的反应尤为突出。法院处理着大量案件。在此情况下,律师提交未经确认的AI生成文件,法官被迫进行本不必要的验证工作。这不仅仅是律师本人丢脸的问题。这也是消耗司法资源,拖延其他当事人审判的行为。

此外,也有很多人对委托人的立场表示同情。委托律师的人因为没有法律专业知识而委托给专家。然而,这些专家未阅读AI的输出就提交,结果导致审判停止,代理人也必须更换。对于委托人来说,本应依赖专家,最终却承担了“专家监督不足”的风险。在社交媒体上也有“如果我支付律师费却遭遇这种情况,我会愤怒”的帖子。

另一方面,也有人指出,认为“因为使用AI而受到惩罚”是误解。在技术社区中,有人认为仅看标题会误以为AI的使用本身被视为问题,但本质是“引用不存在的判例而未确认”的问题。实际上,法律AI工具和搜索支持工具是存在的,如果与适当的验证结合,可能有助于提高工作效率。问题不在于使用工具,而在于将工作完全交给工具。

这一点很重要。简单化为不要使用AI的讨论,会误解问题的本质。过去在法律事务中,已经引入了判例数据库、文档模板、合同制作软件、电子申请系统等。许多例行文件早已通过某种软件或模板组合制作。AI也可以作为此延伸的工具来使用。然而,传统工具与生成AI的区别在于,生成AI能够以自然的语言生成看似合理的谎言。

 

在社交媒体上也有人质疑“难道不能自动检查引用的判例是否存在吗”。确实,从技术上讲,与判例数据库的对照、引用格式的验证、URL或文献ID的确认等,某种程度的自动检查是可能的。实际上,在研究AI幻觉判例的研究者中,有人正在开发引用检查工具。然而,即便如此,最终负责的仍是提交者。检查工具也并非万能,只能辅助确认工作。

此次事件还有一个不可忽视的论点,那就是AI的错误并非“仅限于初学者的问题”。生成AI刚出现时,使用AI自行提起诉讼的普通人或经验不足的用户的错误往往受到关注。然而这次,参与的是正式出庭的律师。而且不仅是一方,而是双方阵营。即便是专家,如果忙碌、疏忽、自信过度、对工具期望过高,也会陷入同样的陷阱。

AI的幻觉在法庭上成为问题的案例,已不再是罕见的例外。在追踪AI生成虚假判例或错误引用的数据库中,记录了世界各地法院确认的相关案例。仅在美国就积累了许多案例,法院的耐心显然在减弱。

尤其是近年来,法院的应对也变得更加严格。以前可能仅以罚款或警告处理的事情,最近则增加了禁止出庭、从案件中移除、向律师协会通报、教育命令等更具实务痛苦的制裁。因为越来越多的人认为,仅靠少量罚款无法形成威慑力。在社交媒体上也有“仅罚款对有资金的人来说不痛不痒”“需要示众”的严厉意见。

不过,对处分的严厉程度也存在争议的余地。这次的律师们向法院道歉,至少部分承认了错误的原因。对于两名当地律师来说,问题在于未确认共同代理人的文件,而非直接使用AI。然而,法院仍然认为既然签了名就有责任。这一判断也将影响未来的共同受任和当地代理人的方式。“仅仅是借名”“不是主要负责人”在法庭上将难以通行。

这一事件提出的最大问题是,AI时代“专家的价值”是什么。

如果AI能写文章,律师该做什么。如果AI能寻找判例,那么人类法律家是否不再需要。此次事件反而给出了相反的答案。AI提供的信息越看似合理,人类专家就越需要更高的确认能力和责任感。AI能做草稿,因此专家必须识别、删减、对照,如果必要则舍弃。

这不仅限于法律行业。医疗、金融、教育、新闻、行政、广告制作、软件开发等,AI进入工作的各个领域都会发生同样的问题。AI制作的东西由谁确认。对哪个信息源进行了对照。如果出现错误,谁负责。如果没有这个基本设计就急于引入AI,不仅不会提高效率,反而会导致信任的崩溃。

生成AI如果使用不当,将成为“时间缩短的工具”而非“快速大量生产错误的工具”。而且,这些错误被包裹在自然的语言中,表面上看起来很体面。这次的律师们可能并非从白纸上恶意制造虚假判例。然而,没有恶意并不是免责符。提交给法院的文件伴随着最低限度的确认责任。

AI进入法庭的趋势可能无法阻止。法律研究、文件制作、证据整理、合同审查等,AI在这些场合确实有用。然而,AI的引入越多,职业伦理和验证程序就越需要严格。使用了哪个工具。谁确认了输出。引用来源是否存在。判例的内容是否真的支持主张。这些琐碎的确认正是AI时代专业职务的核心工作。

此次法院的判断不是对AI的拒绝,而是明确AI时代责任所在。生成AI可以生成文字。然而,责任是无法生成的。责任在于最后选择、签署、提交这些文字的人。



出处URL

Gizmodo:报道了事件概况、双方律师未确认AI生成文件的点、法官的应对。
https://gizmodo.com/judge-cancels-whole-case-after-lawyers-admit-they-didnt-read-ai-generated-filings-2000769668

404 Media:最早详细报道此事的文章。确认了法院的制裁命令、Rob Freund在社交媒体上的指摘、社交媒体上流传的“AI之间争斗的事件”这一背景。
https://www.404media.co/judge-learns-lawyers-on-both-sides-of-case-used-ai-cancels-trial-kicks-everyone-off-the-case/

美国密西西比州北部地区联邦地方法院的制裁命令PDF:事件编号、当事人、问题AI来源的虚构或无法确认的判例引用、对四名律师的制裁内容、罚款金额、两年出庭禁令等一次资料。
https://storage.courtlistener.com/recap/gov.uscourts.msnd.50181/gov.uscourts.msnd.50181.123.0.pdf

Reuters:确认了事件概况、被制裁的律师姓名、罚款金额、两年出庭禁令、通知律师团体等。
https://www.reuters.com/legal/litigation/judge-rules-both-sides-lawsuit-misused-ai-disqualifies-lawyers-2026-06-09/

Reddit r/law:确认法律社区的反应。司法资源的浪费、对委托人的影响、对律师未确认AI生成物的批评等。
https://www.reddit.com/r/law/comments/1u16wbc/judge_learns_lawyers_on_both_sides_of_case_used/

Reddit r/technology:确认技术社区的反应。指出问题不在于AI的使用,而是引用不存在的判例而未确认,讨论了AI工具和人类的验证责任。
https://www.reddit.com/r/technology/comments/1u18o6n/judge_learns_lawyers_on_both_sides_of_case_used/

Damien Charlotin “AI Hallucination Cases” database:用于确认法庭提交物中AI幻觉案例的扩展、全球及美国的记录数量、AI幻觉判例问题的背景。
https://www.damiencharlotin.com/hallucinations/