北京时间 1 月 14 日,据《华尔街日报》报道,韩国一心想要发展本土 AI 大模型,但是被寄予厚望的国产大模型却被发现使用了中国公司的大模型代码。这件事表明,韩国想要摆脱对中美科技巨头的依赖是何其困难。
去年 6 月,韩国政府发起了一场竞赛,希望打造一个使用韩国技术开发的全新、独立的 AI 模型。在美国和中国主导 AI 领域的全球格局下,开发这样的本土工具对于确保韩国技术自主至关重要。但事实证明,说起来容易,做起来难。在这项为期三年的竞赛中,五家入围决赛的公司里有三家被发现至少使用了部分来自外国 AI 模型的开源代码,其中包括中国的模型。这些公司和 AI 专家辩称,刻意回避现有 AI 模型、试图从零开始构建一切并不明智。但反对者表示,任何对外国工具的使用都会带来潜在的安全风险,并削弱培育真正属于本国的 AI 模型的希望。哈佛大学电气工程教授魏裕炎 (Gu-Yeon Wei,音译) 表示,在推进 AI 模型开发时,要求每一行代码都完全自主编写并不现实。他熟悉这项韩国竞赛,但并未直接参与任何参赛公司。“若放弃开源软件,无异于将海量技术红利置于一旁。”他表示。眼下,全球各国越来越重视减少对外国技术的依赖,并提升自身在 AI 领域的能力。AI 可能深刻影响这些国家的经济竞争力与国家安全。韩国拥有众多芯片巨头、软件公司,而且发展 AI 也获得了政治支持,是所谓“主权 AI”的最积极推动者之一。上述竞赛旨在 2027 年前评选出两款本土胜出模型,其性能能达到或超过 OpenAI、谷歌等领先 AI 模型的 95%。获胜者将获得政府提供的数据和人才招聘资金支持,并有权使用政府采购的、对 AI 计算至关重要的芯片。近日,入围决赛企业之一的 Upstage 引发了争议。韩国本土竞争对手 Sionic AI 的 CEO 高锡贤 (Ko Suk-hyun,音译) 称,Upstage AI 模型的部分模块与中国智谱 AI 的开源模型存在相似之处。他声称,Upstage 的部分代码中甚至还留有智谱 AI 的版权标记.“一款被怀疑是根据中国模型微调的套壳模型,却提交到由纳税人资金资助的项目中,这令人深感遗憾。”高锡贤在领英上表示。Sionic 也曾参与韩国这一竞赛,但未能进入决赛名单。
对此,Upstage 举行了一场直播验证会,公开了其开发日志以证明其模型是从零开始,采用自有方法进行开发和训练的。但其用于运行模型的推理代码确实使用了源自智谱 AI 的开源元素,这些元素在全球范围内被广泛采用。高锡贤随后就此道歉。这场争议也促使韩国对其他入围决赛的模型进行更严格的审视。Naver 公司 AI 模型的视觉与音频编码器被指与中国阿里巴巴及美国 OpenAI 的产品存在相似之处。视觉与音频编码器负责将图像和声音转换为机器可理解的格式。韩国 SK 电讯也遭到批评,原因是其用于运行 AI 模型的推理代码被指与中国 DeepSeek 的代码存在相似之处。Naver 承认使用了外部编码器,但解释称这是采用标准化技术的战略决策,并强调决定模型如何学习和训练的核心引擎完全由该公司自主开发。SK 电讯也提出了类似观点,着重说明其模型核心的独立性。
该竞赛的规则并未明确说明是否允许使用外国企业的开源代码。自争议出现以来,负责监督此次竞赛的韩国科学部尚未发布任何新的指导方针。韩国科学部长裴庆勋 (Bae Kyung-hoon) 对此番激烈讨论表示欢迎。“当我看到搅动我国 AI 行业的技术辩论时,我实际上看到了韩国 AI 的光明未来。”裴庆勋本月早些时候在社交媒体上写道。韩国科学部拒绝就此置评,该部门计划按原定安排在本周从五家决赛入围企业中淘汰一家。首尔国立大学 AI 研究所所长李在武 (Jae W. Lee,音译) 称,AI 模型的开发是通过设定和微调内部数值以获得输出,而在受到质疑的入围决赛模型中,这些核心任务似乎并未依赖外国工具。“他们是从零开始训练的。”他表示。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。
