从 ChatGPT 到 DeepSeek,AI 正沿着“智能 +”的路径进入新一轮浪潮。正值大模型从“算力堆叠”走向“推理优先”的关键节点,清华大学智能产业研究院(AIR)创始院长、中国工程院外籍院士张亚勤提出:也就是说,在规模定律持续发挥作用的前提下,当参数规模、数据体量与算力资源跨过某个阈值,智能就不再只停留在模式识别,而是开始“涌现”—— 先是从鉴别式 AI 走向生成式 AI,再从生成式 AI 走向以智能体为代表的新范式。在本次量子位 MEET2026 智能未来大会上,他也将 ChatGPT 和 DeepSeek,视作这一轮演进中的两个重要里程碑:
至于未来 5~10 年的主战场,在他看来,将走向“智能体互联网”时代 —— 基础大模型像操作系统一样在全球范围内收敛到不超过 10 个;而智能体会取代今天的大部分 SaaS 和 App,成为企业和个人与世界交互的默认形态,同时这也是通往 AGI 的必经之路。为了完整体现张亚勤的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。MEET2026 智能未来大会是由量子位主办的行业峰会,近 30 位产业代表与会讨论。线下参会观众近 1500 人,线上直播观众 350 万 +,获得了主流媒体的广泛关注与报道。以下为张亚勤演讲全文:今天我谈的是人工智能 + 的趋势,这个题目我也思考了有将近十年的时间,我出了一本书叫《智能涌现》,也总结了人工智能这十年的发展,这里面也包括我当时在 10 年前写的“智能 +”和“人工智能 +”的文章。首先就是新一轮的人工智能,它是信息智能、物理智能和生物智能的融合,我们的信息世界、物理世界和生物世界都走向了数字化,所以它也是原子、分子和比特的融合。
人工智能已经有 70 年的历史了,过去的五年和十年发展尤其快,一个重要的里程碑就是 2022 年的 ChatGPT,距离现在正好三年。特别重要的就是 ChatGPT 所带来的从鉴别式的 AI 走向了生成式的 AI,过去更多的是模式识别,现在我们可以创造新的内容,这里面有三个特别重要的概念:首先它是一个统一的表征,即 tokenization,不管是文字、语音,图片、视频,或者是蛋白质、DNA、细胞,或者是三维的激光雷达的点云信号,都可以把它变成一个统一的 token。token 越多,数据越多,算力越强、算法越好,这个时候就越准确。规模定律(Scaling Law)到了一定的规模的话,就会出现智能涌现,这也是我这本书的题目。另外一个重要时刻就是咱们中国的 DeepSeek 时刻,DeepSeek 出来之后,首先就让整个模型从预训练走向推理。
另外一点当然很重要,它有很多的算法创新、架构创新、系统创新,可以说是高效率、高性能和低价格。同时它又是个新的商业模式,它是开源的,用的 MIT 的 license,这个本身是限制最少的开源架构,所以 DeepSeek 出来之后,在国内和全球范围内大幅度地加速了它的落地和应用,所以我把它叫做 DeepSeek Moment,也是中国的一个路径。AI 发展有五个趋势,首先就是生成式的 AI 正走向智能体的 AI。
智能体是这两年 AI 方面一个新的发展,是最重要的一个创新。过去七个月,Agent 的任务长度就增长了两倍,准确度大于 50%,其实也已经和人类对齐了。第二个趋势很重要,就是规模定律在预训练阶段已经放缓了,尽管这个智能还在往前走,更多的智能放到后训练、推理、智能体阶段。这里面很有意思的现象就是,推理的单位成本在过去一年下降了 10 倍,但是智能体本身的算力要求一年也是增长了 10 倍,所以一个乘 10、一个除 10 正好平衡。第三点就是,我们从信息智能走向物理智能和生物智能,大语言模型走向视觉语言动作模型(VLA,Vision-Language-Action)。这里面有两个很重要的节点,一个是无人驾驶,无人驾驶今年就已经到达 ChatGPT 时刻,2030 年就是 DeepSeek 时刻 —— 即 10% 左右的新车拥有 L4 级无人驾驶的能力。另外机器人一定是未来最大的赛道,尽管人形机器人还需要很多年,但是我认为在未来 10 年左右,我们机器人会比人的数目还要多。一个不好的消息是,AI 的风险正在快速上升,智能体出来之后我们的风险至少 double(翻倍)。如果看一下新产业格局的话,我们有基础大模型,像操作系统一样,上面有垂直模型,还有边缘模型。基础大模型,全球可能最后不会超过 10 个,一半中国的,一半美国的,可能说不定还有一两个是别的国家的,中美两个国家有不同的路径,但是是引领全球。这里面还包括开源和闭源,去年我记得我们还在争论到底以开源为主、还是闭源为主。现在我觉得比较清楚了 —— 开源会成为更多的、更大的平台和生态,可能 80% 是开源,20% 的是闭源。这个图就特别清楚,规模定律可以看到的 Pre-train 还在往上走,但是走的速率已经在平缓,Post-train 在 increase,智能体还是直线地往上走。
还有一点,智能体本身不仅仅是技术,它其实在形成网络,也形成新的经济形态。所以我们以后如果看企业的架构都会有完全不同的一种概念,以后企业需要 GPU、大模型、数据,然后包括我们的人力资源,有些可能是人,有些可能是智能体,所以这对于未来管理企业、开发产品都有很大的影响。
这张图是未来的技术架构,左边这张图是 ChatGPT 刚出来不久的时候我画的,如果看这个黄线的话,在左边可以看到基础大模型它是一个平台,上面有各种不同的领域垂直模型,而上面有 SaaS(软件作为一种服务),在边缘会蒸馏出一个相对比较小的模型,再上面有 APP,这是当时我想的架构。
10 月我把这个架构做了更新,最重要的一点就是我认为未来我们的 SaaS 和在设备端或边缘端的手机 APP 都会被 Agent 取代,也就是说智能体是未来的 SaaS 和 APP。我举个例子,所谓的智能体,你可以有各种各样的,有消费者的、各个不同行业的、机器人的、无人驾驶的。刘洋教授在清华做了一个医疗智能体,也是全球第一个智能体无人医院 —— 想用智能体网络、多智能体去模拟真正的三甲医院,这里面当然有病人、医生、护士、各种不同的科室。
在这个虚拟世界里面,多智能体会互相交互和学习,然后持续快速地进化,这样就是能在很短的时间,比如说两天它就可以完成一个三甲医院两到三年的这些病例,而且准确度还要高得很多。但我们并不是说让智能体来替代未来的医生,它更多的是作为助理,我们相信未来每个医生都会有 TA 的一个智能体。所以如果看一下产业机遇的话,我把基础大模型看作是我们人工智能时代的一个操作系统,它会彻底重写、重构和重塑我们产业的形态。就像在 PC 时代我们有 Windows,在移动时代有安卓和 iOS,同样在人工智能时代操作系统就是一个基础大模型。有了这个操作系统之后,它下面的芯片架构、上面的应用生态都会完全被重构。
也就是为什么现在芯片是以 GPU 为主的,上面的生态是以垂直模型加上边缘模型和智能体为主的,整个规模会比 PC 时代、移动时代大一个、两个甚至三个数量级。另外,我们从互联网发展的角度来看的话,我们最早是 PC 互联,后来到了移动互联,再之后我们到了物联网,现在我们正走向 Internet of Agents,也就是智能体互联网,我认为它是未来 5 到 10 年最大的发展方向。
智能体也是我们实现 AGI 通用人工智能的必经之路,这里面需要新的算法体系,比如说新的记忆体系、世界模型。我认为未来五年的话,现在的自回归架构、Transformer、Diffusion 可能就会被颠覆,有了这些东西之后我们就可以实现通用人工智能。到底需要多长时间呢?我认为可能需要 15~20 年。先是信息智能,再是物理智能,最后达到生物智能。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。
