休闲区 美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语 简单而言,美团把文字、图像、语音都变成同一种东西 —— 离散 Token。无论读文字、看图片还是听声音,对 AI 来说都是同一件事:预测下一个 Token 是什么。 0 6 0 Share