美国AI训练"合理使用"首迎上诉法院大考:Thomson Reuters 诉 ROSS Intelligence 案与中国AI企业的版权红线

2026年6月11日,美国第三巡回上诉法院Thomson Reuters Enterprise Centre GmbH 诉 ROSS Intelligence Inc.一案举行口头辩论(上诉案号 No. 25-2153)。这是美国联邦上诉法院首次正面审查"以受版权保护的作品训练人工智能模型是否构成合理使用(fair use)"这一核心问题。对于正在训练大模型、或在美国市场部署AI产品的中国企业而言,本案的走向可能重新划定全行业的数据合规红线。

案件背景

本案的原告 Thomson Reuters(Westlaw 法律数据库的母公司)指控法律科技初创公司 ROSS Intelligence 未经许可使用 Westlaw 的判例摘要(headnotes)训练其AI法律检索引擎。ROSS 委托第三方 LegalEase 制作了约2.5万份法律备忘录,其中大量问题直接改编自 Westlaw 判例摘要,作为"带标注的训练样本"输入模型。值得注意的是,这些摘要本身并不向 ROSS 的终端用户展示,而仅用于训练阶段——这正是双方争议的焦点。

审理本案的是第三巡回上诉法院法官 Stephanos Bibas(以指定法官身份在特拉华州联邦地区法院主持审理)。Bibas 法官曾在2023年的初步裁定中认为多项争议存在事实分歧、不宜即决;但在2025年2月,他推翻了自己此前的立场,作出有利于 Thomson Reuters 的部分即决判决,认定:Westlaw 判例摘要具备足够的独创性、受版权保护,ROSS 侵犯了其中 2,243 条摘要的版权,且 ROSS 的训练性使用不构成合理使用。鉴于争议的新颖性与难度,地区法院依据 28 U.S.C. § 1292(b) 将版权可保护性与合理使用两个问题一并批准中间上诉(interlocutory appeal),Bibas 法官坦言这两个问题"在现有判例下都很难"。

上诉焦点:两个"在现有判例下都很难"的问题

ROSS 在上诉中提出两个核心问题:第一,对司法裁判要旨的简短引用或改写是否享有版权?第二,合理使用原则是否保护 ROSS 将 Westlaw 判例摘要用于内部训练——而最终产品仅输出不侵权内容——的行为?

合理使用的判断依据 17 U.S.C. § 107 的四要素:使用的目的与性质、版权作品的性质、使用部分的数量与实质性、以及对原作品潜在市场的影响。Bibas 法官在地区法院阶段尤其看重第一要素与第四要素:他认为 ROSS 的使用具有商业性、且并非"转化性使用",因为 ROSS 旨在打造一款与 Westlaw 直接竞争的市场替代产品,对原告的潜在市场(包括AI训练数据授权市场)构成损害。第三巡回法院将如何在上诉层面权衡"转化性"与"市场替代",正是本案最受关注之处。

UpCodes 案带来的顺风

对 ROSS 而言,一个有利的信号是第三巡回上诉法院近期在 American Society for Testing and Materials 诉 UpCodes 一案中的立场。该案中,AI初创公司 UpCodes 未经许可在其平台发布已被各州采纳为法律的建筑规范(building codes),第三巡回法院认可了地区法院驳回初步禁令的裁定,认为 UpCodes 很可能凭借合理使用抗辩胜诉。与 ROSS 相似,UpCodes 同样主张其目的在于"增进公众对法律本身的获取"。ROSS 已在辩论前主动向法院提示这一新近判例。但两案在"是否构成市场替代"上的事实差异,仍可能导致不同结论。

更大的版图:Anthropic 与 Meta 的"分裂"判决

本案并非孤立事件。2025年,加州北区联邦法院在两起标志性案件中对AI训练合理使用作出了影响深远但彼此分歧的判决。在 Bartz 诉 Anthropic 案中,Alsup 法官认定以合法获得的图书训练模型属于"转化性"的合理使用,但对 Anthropic 下载并存储盗版书籍的行为不予豁免——Anthropic 其后以约15亿美元达成和解,折合每部作品约3,113美元,成为业界首个"按作品定价"的赔偿基准。在 Kadrey 诉 Meta 案中,Chhabria 法官同样在合理使用上倾向于AI公司,但其推理建立在原告未能充分证明市场损害之上,并警示未来原告若举证得当,结论可能不同。地区法院之间的这种分歧,使得第三巡回法院在 ROSS 案中的上诉裁决更具风向标意义。

对中国企业的启示

第一,训练数据的来源合法性是首要红线。Anthropic 案的教训表明,即使训练行为本身可能被认定为合理使用,使用盗版或来源不明的"影子数据库"仍可单独构成侵权并触发巨额赔偿。中国AI企业应建立训练数据的来源审查与留痕(provenance)机制,保留授权与采购证据。

第二,"市场替代"是合理使用抗辩的命门。ROSS 败诉的关键在于其产品与 Westlaw 直接竞争。中国企业在设计AI产品时,应评估其输出是否会替代被训练作品的原有市场,包括正在兴起的"AI训练数据授权市场"。

第三,美国诉讼成本本身即是风险。ROSS Intelligence 在诉讼压力下已停止运营。对中小型出海企业而言,即便最终可能胜诉,旷日持久的版权诉讼也足以拖垮业务。事前合规远比事后抗辩划算。

第四,善用合同分配风险。在采购第三方数据集、调用第三方模型或 API 时,应通过版权保证与赔偿(indemnification)条款将侵权风险向上游转移,并明确数据使用范围。

第五,关注美国法定赔偿的高额暴露。美国版权法对每件作品的法定赔偿最高可达15万美元,海量训练数据意味着赔偿可呈几何级数放大。企业应在进入美国市场前完成版权风险评估。

案件展望

第三巡回上诉法院的裁决预计将成为美国首个就AI训练合理使用问题作出的上诉法院判例,无论结果如何,都将深刻影响目前在审的几十起生成式AI版权诉讼。需要提示的是,ROSS 案涉及的是非生成式AI(法律检索引擎),其结论能否直接套用于生成式大模型仍存争议;但法院对"转化性使用"与"市场损害"的阐释,势必为整个行业提供关键指引。对于志在全球化的中国AI企业,现在正是审视训练数据合规体系、未雨绸缪的窗口期。本所将持续跟踪本案进展。

声明:本文仅供一般信息参考,不构成法律意见。具体事务请咨询专业律师。

Next
Next

美国《SECURE数据法案》(H.R. 8413)来袭:联邦统一隐私立法或终结"州法拼图",并要求企业披露流向中国的数据