今日,字节图像生成模型 Seedream 5.0 在视频编辑应用剪映、剪映海外版 Capcut、字节 AI 创作平台小云雀均已上线,在即梦 AI 平台开启灰度测试,图片生成可限时免费体验。
Seedream 5.0 的图像支持 2K 和 4K 分辨率输出,2K 为图片生成直出,4K 为 AI 增强后的分辨率。根据 Capcut 官网,新模型 5.0 的升级点为首次支持检索生图,对提示词的理解准确性增强、支持更细节、精致纹理的图像生成,还允许用户精确调整图像。Seedream 4.5 于 2025 年 12 月 4 日上线。智东西实际体验并对比了 Seedream 5.0 与 Nano Banana Pro、Seedream 4.5,发现新模型可以理解“静谧科技感”等抽象提示词,但最后的生成效果相比 Seedream 4.5 很难说有跨越式提升,其联网搜索能力尚不稳定、生成效果升级点体现在更美观、多样化上。Capcut 的官宣推文里提到,Seedream 5.0 可与 Nano Banana Pro 对标,且更便宜,目前所有用户可免费使用 20 次,美国地区之后上线。有网友对比了 Nano Banana Pro、ChatGPT、Seedream 5.0、Grok Imagine Image 的生成效果,其提示词为:生成一张高质量的信息图,解释在特拉普修道院制作啤酒的过程,并配有丰富的插图。
相比于其他几个,Seedream 5.0 的步骤解释最为详细,每步都有详细的文字说明,但艺术设计感相比 Nano Banana Pro 稍弱。从社交平台 X 上的网友评论来看,此次 Seedream 5.0 预览版的升级优先考虑的是智能水平而非美观,可以应对复杂的知识驱动型任务。
有网友认为,Seedream 5.0 的智能水平、中文能力有提升,但都比不上 Nano Banana Pro。
还有网友调侃,新模型的进步程度仅 0.09,仅相当于加了网络搜索的 Seedream 4.5。
根据 Capcut 官网,此次 Seedream 5.0 的重要升级点包括准确性与智能水平增强、更快更具表现力的图像创建、支持联网知识整合。首先在智能水平方面,Seedream 5.0 能深入理解提示词,生成与用户意图相匹配、细节精准、布局清晰、文本渲染效果更佳的图像。第二点是增强风格化效果,其图像到图像功能增强了风格化效果,模型可以提供更清晰的细节、精致的纹理和平衡的照明。该模型还新增了编辑功能,用户可以控制笔刷精准选择并调整相应元素。最后是智能推理能力,其官网提到,新模型的多步逻辑、空间理解及特定领域知识增强。智东西体验了 Seedream 5.0 的图片生成能力。第一个提示词是“为《静夜思》生成古诗插图”,可以看到生成的结果中人物“举头望明月”这一关键元素都没有缺失,还附上了人物在月光下的影子等,但原诗中的“床前”等没有在图片中涉及到。
为了考验 Seedream 5.0 的联网搜索能力,智东西输入了提示词“最近有很多家机器人都要参加 2026 春晚,生成一张已官宣参加春晚的机器人海报”。Seedream 5.0 生成的视觉元素准确,在大段文字生成中也未出现乱码,表现稳定。但其并没有理解“已官宣参加春晚的机器人”,而是仅生成了机器人上春晚的海报。
还有抽象的提示词,智东西输入“生成一个静谧科技感且带有落日余晖氛围的闹钟图片”,新模型生成的图片中,从闹钟的设计到背景将落日、科技感融合在了一起。
关于更为细致的图像输出,提示词为“特写电影感肖像,一位有雀斑、深色卷发的年轻女性,被鲜艳的野花和藤蔓环绕,头上戴着花冠。在黄金时段拍摄,温暖的逆光在她的头发和皮肤上形成光晕,浅景深,前景花朵柔焦,照片级真实感”。可以看到,输出的图片中的逆光效果非常到位,发丝边缘的光晕、皮肤的光泽以及前景花朵的柔焦虚化,都营造出了自然的氛围感。
当智东西的提示词为“最新奥斯卡获奖者红毯风格”时,Seedream 5.0 可以直接生成有红毯、背景板、摄影师的完整图像,背景板还有不少奥斯卡的小金人。
根据参考图生成图片方面,智东西上传了最近热度超高的《闪灵》男主杰克,并让 Seedream 5.0“生成这个人的拜年图片,主人公要身有年味的服装,手拿灯笼和对联”。生成的效果中,主人公的面部与参考图一致,手拿灯笼、对联的元素也都具备。
智东西还比较了 Seedream 5.0 与 Nano Banana Pro 的生成效果。一个超难提示词为“生成一个用左手写字的人,背景有一个显示 5:25 的模拟时钟”,Seedream 5.0 与 Nano Banana 都失败了,要么是拿笔的手不对,要么是背景的钟表时间不对。Nano Banana Pro 生成的图片中,人物握笔的手为左手,可以从模糊的时钟看出其时间为 5:30 左右。
虽然 Seedream 5.0 有些图片生成的并不准确,但其一次性生成的图片更具多样性,从现代风、古风到卡通都有。
在比较 Seedream 4.5 和 Seedream 5.0 时,智东西上传的提示词是“帮我生成西红柿炒鸡蛋的菜谱,卡通风格”。相比之下,Seedream 5.0 的整体排版、架构设计会更为美观。
03. 结语:图像模型正朝,实用能力升级迭代当前头部图像模型的迭代路径,正朝着提升理解能力、可控生成、编辑精度等实用能力升级。从 Seedream 5.0 的升级来看,其选择在检索增强、细节纹理、精准调整、4K 增强上做优化,生成的结果并没有颠覆性效果,这或许更贴近用户的实际需求。但从实测与舆论反馈来看,用户对小版本迭代的感知正在变弱,尤其在抽象语义理解、文字渲染、复杂逻辑构图等方面仍存在技术瓶颈。本文来自微信公众号:智东西(ID:zhidxcom),作者:程茜
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。
