休闲区 蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0 LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,将 Diffusion 模型的参数规模首次扩展到了 100B 量级。#LLaDA2.0# #蚂蚁开源# 0 96 0 Share