近日,《芝加哥论坛报》正式向纽约联邦法院提起诉讼,将人工智能搜索引擎公司 Perplexity 推上被告席,指控其在未经授权的前提下大规模抓取新闻内容、规避付费墙机制,并在其生成式产品中直接输出与原文高度相似的文本内容。

据诉状披露,早在今年10月中旬,《芝加哥论坛报》的法律团队便已致函 Perplexity,质询其是否使用了该报受版权保护的内容。Perplexity 的代理律师当时回应称,公司并未将《论坛报》的文章用于大模型训练,仅“可能包含一些非逐字的事实性摘要”。然而,《论坛报》方面指出,实际测试显示,Perplexity 输出的内容远超一般意义上的摘要范畴,而是几乎复刻原文结构与措辞,严重侵犯其知识产权。
此次诉讼特别聚焦于 Perplexity 所采用的检索增强生成(RAG)技术架构。理论上,RAG 旨在通过引用权威信源提升回答准确性并降低幻觉风险。但《芝加哥论坛报》坚称,Perplexity 在未取得任何授权的情况下,擅自将其新闻报道纳入 RAG 系统的数据池中。更令报社不满的是,Perplexity 自研的 Comet 浏览器被指具备绕过主流新闻网站付费墙的能力,并能为用户生成完整文章摘要,实质上替代了原始阅读体验,直接冲击其订阅收入模式。
值得注意的是,《芝加哥论坛报》隶属于 MediaNews Group 与 Tribune Publishing 联合运营的媒体集团,旗下共涵盖17家区域性新闻机构。这些媒体在今年4月已联合对 OpenAI 与微软发起诉讼,指控其大模型非法使用新闻内容进行训练;其中9家更早在2023年11月就已采取类似法律行动。此次单独起诉 Perplexity,反映出传统新闻出版方对 AI 公司内容攫取行为的警觉正从模型训练阶段延伸至实时检索与生成环节。
截至目前,Perplexity 尚未就《芝加哥论坛报》的指控发表公开声明,也未回应科技媒体 TechCrunch 的置评请求。事实上,该公司近期已多次陷入版权争议漩涡——Reddit 与道琼斯公司相继对其提起诉讼,亚马逊亦曾发出正式通知,警告其基于 AI 的购物比价功能涉嫌侵犯平台数据权益。
随着越来越多内容创作者与新闻机构开始审视 AI 搜索引擎在信息抓取与再分发过程中的合法性边界,本案或将成为厘清 RAG 技术在现行版权法下责任归属的关键判例,进而影响整个生成式 AI 行业的内容合规路径。
