昨天(3 月 6 日)的 AI 领域,可以说是分外热闹。在基础模型领域,我们有了能“四两拨千斤”的 QwQ-32B,性能直逼 DeepSeek-R1。而在更上层的应用领域,Manus 横空出世。接下来,IT之家小编基于当前的全网信息,为大家带来一波汇总。Manus 是一款国内团队开发的 AI Agent,其名字来源于拉丁语中“Mens et Manus”,也就是心和手中的“手”。
这里就要聊到“AI Agent”的概念了,目前还没有一个公认的中文翻译,比较多的说法是智能体。家友们大概可以将其理解为一个能够自主感知环境、分析信息、制定决策并执行动作的智能助手。在评估通用 AI 助手能力的 GAIA 测试中,Manus 取得了 SOTA(State-Of-The-Art)即目前最强的成绩。
根据创始人季逸超的说法,Manus 目前由多款模型驱动,官方也将在今年晚些时候开源他们对于部分模型的后训练成果。用官方的说法来讲,Manus 和我们熟悉的 ChatGPT 等聊天机器人不同,而是“首款通用的 AI 智能体”。
当然,这个说法可能有些夸张,我们还是先来看看官方的实际演示案例。向 Manus 中上传一份包含了简历的 zip 文件,它便会像“人”一样,解压文件开始查看简历的内容,并记录下重要的信息。
此外,在 Manus 正在“干活”的时候,你也能中途补充更多内容。
简历筛选的任务完成之后,Manus 便会给出关于候选人的评价、个人信息的总结及各项报告信息。
随后,你还可以指挥 Manus 将本次的评估结果生成一个表格,让它学会以后面对同样的任务时,都直接生成表格,就像一名真正的助手。
这个例子确实没有超出我们对于当前大模型能力边界的想象,不过现有的聊天机器人类产品确实没那么容易一键式完成全部任务。官方的第二项演示则是让 Manus 筛选一份符合特定条件的纽约房产。
对于这类复杂任务,Manus 首先会将任务分解,创建一个待办列表。
随后,Manus 便会开始在网络上搜索信息并进行筛选。
“网上冲浪”完毕之后,Manus 便会自动写出 Python 程序,来计算评估预算情况。根据预算情况,Manus 便会自动调整房产网站上的筛选条目,选取合适的范围。
最终,利用上述的所有信息,Manus 便会生成一份详细的报告。
官方提供的第三则演示则对三只股票近三年来的表现进行分析。
Manus 可以通过 AI 获取得到授权的专业信息,并编写代码,用于评估获取到的数据。
家友们可能已经注意到,Manus 可以说是“一言不合就编程”。对 Manus 来说,编程并不是“目标”,而是为了达成某项目的的一个通用工具。
如果觉得这样的可视化图表还不够“酷”的话,还可以让 Manus 根据上面的数据创建一个可以交互的网站。
其实,这次官方介绍视频的脚本,也是通过 Manus 来制作的。
我们可能注意到,Manus 执行一项任务时,依复杂度而定,通常需要几分钟、十几分钟甚至几十分钟的时间。Manus 的每一项任务,其实都要求他们在服务器端开一个独立的 Ubuntu 容器,相信在这一过程中,也要消耗不少的服务器资源。这也可能是他们目前采用邀请制的原因之一。
昨天(3 月 6 日),Manus 的邀请码在闲鱼上一度被炒到几万元,甚至发展到了乱标价格的地步。
这里,IT之家也要提醒大家谨防诈骗,官方从未开设任何付费获取邀请码的渠道。
类似的产品,小编还能想到荣耀的 YOYO 智能体,可以在用户自己的手机端自动化执行任务。
其实类似的产品,还有智谱的 AutoGLM,尽管它在各个品牌的安卓手机上均可用,但目前的能力还比较局限。
某种意义上,他们都是在现有大模型的能力基础上重新包装的一个“外壳”。对于获得一份调查报告类的需求,那么目前 ChatGPT 的 Deep Research 深入研究功能效果也不错。
马斯克 Grok 3 免费的 DeepSearch 功能,其实也能帮助我们完成不少工作。
有唱红脸的,自然也有唱白脸的,小编感觉这位家友的评价还算是比较中肯。
在不少 AI Agent 团队眼中,Manus 所实现的事情可能没那么颠覆性,于是在 Manus 上线当天,就已经有了几个开源的“复刻”项目。
你有 Manus,那我便有 OpenManus,来自 MetaGPT 的 5 名团队成员便在 3 个小时内“搓”出了一个开源方案。
此外,CAMEL-AI 团队也在其 CAMEL-AI Framework 的基础上开发了 OWL 项目,在 GAIA “跑分”取得了平均 58.18 分的成绩,位列开源框架之首。
不管大家的看法是什么,相信我们已经对 Manus,以及 AI Agent 有了一定基本的了解。距离 AI 助手自动化帮助我们完成繁杂任务的那一天,可能真的并不远了。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。