ChatGPT那股“AI味儿”到底是从哪来的?一位肯尼亚作家给出了出人意料的答案:不是我们写得像AI,而是AI偷偷学了我们的笔法。

近日,一篇来自肯尼亚作家Marcus Olang’的控诉帖在Hacker News上引发热议。他无奈地表示,自己精心打磨的文章屡屡被退稿,理由惊人一致:“太像ChatGPT写的了。”这让他哭笑不得——从小接受的写作训练,竟成了被误判为AI生成内容的“原罪”。
对那些热衷于识别AI痕迹的“数字侦探”们,我想说:欢迎来到肯尼亚一个普通的星期二。你们眼中所谓的机器指纹,其实是我们在教室、会议室甚至Teams聊天里日复一日锤炼出的语言习惯。
更令人深思的是,这种“巧合”并非偶然。长期以来,许多AI公司为了压缩成本,将基于人类反馈的强化学习(RLHF)任务外包给非洲英语国家,包括肯尼亚和尼日利亚。这些地区的语言工作者在标注、润色和优化AI输出时,自然会带入本地教育体系所推崇的正式、规范、逻辑严密的表达方式。久而久之,ChatGPT的“文风基因”便悄然染上了非洲英语写作的底色。
Olang’坦言,在反复对比自己与ChatGPT的文本后,他不得不承认:两者确有相似之处。“我们都偏好结构清晰的段落,善用‘此外’‘然而’‘因此’等过渡词,也常以分号或破折号连接复杂思想——这些曾是老师眼中的‘高分技巧’,如今却成了‘AI嫌疑’的铁证。”
讽刺的是,AI为了显得权威可信,最终模仿的恰恰是我们这一代人在全球南方严苛教育体系下锻造出的写作范式。它无意中复制了大英帝国留下的语言幽灵,而我们却被当成它的复制品。
在他看来,这种误判背后隐藏着更深的文化偏见:当AI检测工具将“逻辑严谨、用词考究、句式工整”自动归类为机器生成时,实际上是在否定非母语者通过努力习得的正式书面语能力。这种标准默认“人性”等于“随意”“口语化”甚至“不完美”,却忽视了不同文化背景下写作训练的多样性。
更荒诞的是,Olang’这篇充满个人情绪与文化反思的控诉文章,竟被知名AI检测平台Pangram判定为“100%由AI生成”。这一结果不仅令他苦笑,也让众多网友感慨:当算法开始定义“何为人类写作”,真正的写作者反而要自证清白。
类似的现象不止体现在文风上。有研究发现,ChatGPT对某些词汇如“delve”(深入探究)、“tapestry”(织锦,常喻复杂图景)、“leverage”(利用)等表现出异常偏爱。《卫报》曾报道,生物医学数据库PubMed中“delve”的使用频率近年暴增数十倍,极可能源于研究人员广泛使用AI辅助写作。就连YC创始人保罗·格雷厄姆都调侃:“收到一封含‘delve’的邮件,基本可以断定是AI代笔。”
而这些高频词的源头,或许正藏在那些为AI“调教”语言的非洲标注员日常用语中。对他们而言,“delve”不是炫技,而是商务英语里的常规表达。当数以万计这样的反馈注入模型,AI便自然而然继承了这套词汇偏好。

这场关于“谁模仿了谁”的争论,最终揭示了一个悖论:AI从人类最规范、最努力的文字中学习如何“像人”,却反过来让那些真正付出心血的人被贴上“非人”标签。当技术以效率之名重塑语言标准,或许我们该问的不是“如何识别AI”,而是“谁有权定义人类的声音”。

