韩国主权AI翻车了？国产大模型被扒用中美开源代码，自研咋就这么难？

1月14日，《华尔街日报》披露，韩国政府重金扶持的“本土大模型竞赛”正深陷一场关于技术自主性的舆论风暴：在进入决赛的五家企业中，至少有三家被曝在其人工智能模型开发过程中使用了来自中国和美国科技公司的开源代码，涉及智谱AI、阿里巴巴、OpenAI以及DeepSeek等企业，由此引发公众对“国产AI是否真正独立”的广泛质疑。

这项国家级AI战略自2024年6月启动，目标是在三年内培育出性能达到国际顶尖模型95%水平的纯韩国技术大模型，以降低对中美科技巨头的技术依赖，强化国家在数字经济与安全领域的自主权。优胜者将获得政府提供的高质量数据集、专项研发资金及稀缺AI芯片资源。然而，在全球AI生态高度协同、开源共享已成行业基石的当下，“完全从零开始”的技术路线正遭遇现实挑战。

争议最先聚焦于入围企业Upstage。其竞争对手Sionic AI的首席执行官高锡贤公开指责Upstage模型的部分模块与中国智谱AI的开源项目存在高度相似性，甚至保留了原始代码中的版权声明，直指其“披着国产外衣，实则套用中国模型，却申领纳税人资金”。面对舆论压力，Upstage迅速召开线上发布会，展示详尽的训练日志以证明其核心模型为自主研发，并澄清仅在推理框架——而非训练主干——中引用了智谱AI的开源组件，该组件在全球开发者社区中被广泛采用。高锡贤随后致歉，但事件已激起公众对“国产”定义的深层讨论。

风波并未就此平息。互联网巨头Naver与通信龙头SK电讯相继被卷入。有技术分析指出，Naver模型的视觉与音频编码器与阿里通义千问及OpenAI相关模块存在结构相似；SK电讯则被发现其推理逻辑部分与DeepSeek的开源库高度雷同。对此，两家公司均强调，其模型的核心训练引擎完全由内部团队从头构建，所涉外部代码仅用于标准化的输入输出处理环节，属于当前AI工程中的常规做法。

学术界对此看法分歧明显。哈佛大学教授魏裕炎表示：“在当今AI开发中，拒绝使用成熟的开源工具无异于自我设限。要求每一行代码都自研既不高效，也不符合技术演进规律。”首尔国立大学AI研究所所长李在武亦证实，经审查，涉事模型的核心参数训练过程确系从零启动，未直接加载或微调任何外国模型权重。

但批评声音依然强烈。部分安全专家警告，即便仅使用外围开源组件，也可能埋下供应链漏洞或隐性依赖风险，从而削弱“主权AI”战略的初衷。目前，韩国科学技术信息通信部尚未在竞赛规则中明确界定“是否允许使用外国开源代码”，部长裴庆勋则回应称，欢迎围绕技术路径展开公开辩论，并称“这种思辨正是韩国AI走向成熟的关键一步”。

在全球各国竞相打造“AI主权”的背景下，韩国此次争议折射出一个共性难题：在高度互联、协作紧密的人工智能生态中，“技术独立”的边界究竟应如何划定？是必须逐行自写代码，还是只要掌握核心算法与数据主权即可？这场风波或许难有标准答案，但它清晰地揭示了一个事实——实现真正意义上的AI自主，远非举办一场模型竞赛所能解决，而是一场融合技术伦理、产业政策与全球协作能力的系统性考验。

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复