腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API

IT之家 12 月 30 日消息,腾讯混元今日宣布开源翻译模型 1.5 版本,共包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持 33 个语种互译以及 5 种民汉 / 方言,除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。目前两个模型均已在腾讯混元官网上线,在 Github 和 Huggingface 等开源社区也可直接下载使用。腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API休闲区蓝鸢梦想 - Www.slyday.coM在部分用户实际使用场景下,混元翻译 1.8B 和 7B 两个尺寸模型同时使用,可以实现端侧和云侧模型的协同部署,提升模型的效果的一致性和稳定性。在常用的中外互译和英外互译测试集 Flores200、WMT25 以及民汉语言的测试集中,Tencent-HY-MT1.5-1.8B 全面超越中等尺寸开源模型和主流商用翻译 API,达到 Gemini-3.0-Pro 这种超大尺寸闭源模型的 90 分位水平。在 WMT25 和民汉翻译测试集上,其效果仅略微差于 Gemini-3.0-Pro,远超其他模型。腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API休闲区蓝鸢梦想 - Www.slyday.coM腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API休闲区蓝鸢梦想 - Www.slyday.coMHY-MT1.5-1.8B 模型在 FLORES-200 质量评估中取得了约 78% 的分数,同时平均响应时间 0.18 秒,超越主流商用翻译 API,适用于即时通讯、智能客服、移动翻译应用等高吞吐、实时翻译场景。此外,针对各类场景,两个模型均实现了对术语库、长对话、带格式文本(例如网页)的翻译支持,更加全面:为了直观展示混元 Tencent-HY-MT1.5-1.8B 的翻译效果,官方展示了与苹果手机自带离线翻译的结果对比:腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API休闲区蓝鸢梦想 - Www.slyday.coM技术方面,HY-MT1.5-1.8B 能够用小尺寸实现大尺寸模型的效果,得益于 On-Policy Distillation(大尺寸模型蒸馏)策略的引入,让 HY-MT1.5-7B 作为 Teacher,实时引导 1.8B 的 Student 模型,让其避免死记硬背标准答案,通过纠正在预测序列分布时的偏移,让小模型从错误中学习,提升能力。腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API休闲区蓝鸢梦想 - Www.slyday.coM腾讯混元翻译模型此前不仅在国际机器翻译比赛拿下 30 个第 1 名,也在首次开源一周内便登上了 HuggingFace 模型趋势榜第一位。混元翻译模型已经在腾讯内部多个业务场景落地应用,包括腾讯会议、企业微信、QQ 浏览器、客服翻译等。为了便于开发者使用,本次开源的模型已经在 Github 和 Huggingface 等开源社区上线,Arm、高通、Intel、沐曦等多个平台均支持部署。IT之家附开源地址如下:
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。

相关推荐

  • 友情链接:
  • PHPCMSX
  • 智慧景区
  • 微信扫一扫

    微信扫一扫
    返回顶部

    显示

    忘记密码?

    显示

    显示

    获取验证码

    Close