Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能

IT之家 6 月 18 日消息,当地时间 6 月 17 日,Canonical 公布了一项名为 Project Myna 的新项目,旨在为 Ubuntu 桌面操作系统引入本地化的语音转文字功能。该项目得名于擅长模仿人类说话的鹩哥 / 八哥鸟,首个版本计划随 Ubuntu 26.10(Stonking Stingray)一同发布,并成为 Ubuntu 桌面体验的核心组成部分。Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能休闲区蓝鸢梦想 - Www.slyday.coMMyna 被定位为一款原生桌面听写工具,而非语音助手或语音控制系统。IT之家注意到,用户按下键盘快捷键后即可开始说话,转录后的文字会直接插入当前正在使用的应用程序中,听写过程中屏幕会显示明确的视觉反馈。Canonical 表示,首版功能范围将刻意收窄,不会涉及语音助手、语音命令、桌面控制、翻译工具或自动语言检测等功能,目标是把基础听写体验做扎实。在技术架构上,Myna 使用 AI 语音识别模型,所有识别任务均在用户本地机器上运行,下载安装必要的模型后无需任何互联网连接。首版以 Wayland 上的 Ubuntu 桌面为目标,GNOME 是主要验证环境,架构保持开放以便未来支持更多桌面环境。另外,麦克风仅在用户主动激活听写时才会被访问,音频数据在内存中处理后即被丢弃,不会上传至任何外部服务。整体架构采用模块化设计,语音识别、用户交互、听写管理和文本注入分别由独立组件处理,以便后续对各部分单独改进而不影响整体使用体验。Canonical 桌面团队成员 Jean Baptiste Lallement 表示,该团队希望“在过多的设计决策被固定下来之前”获得社区反馈,尤其欢迎依赖听写或辅助技术的用户、已在 Linux 上使用语音识别的用户、开发者、测试人员及文档编写者参与进来。项目源码和架构文档已在 GPLv3 协议下托管于 GitHub。在 Ubuntu 26.10 之后,Canonical 计划持续改善 Myna 与桌面的集成度,并探索让听写更自然、更准确的方法。后续功能的优先级将取决于早期用户的反馈和更多社区意见。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,蓝鸢梦想所有文章均包含本声明。

相关推荐

  • 友情链接:
  • 智慧景区
  • 微信扫一扫

    微信扫一扫
    返回顶部

    显示

    忘记密码?

    显示

    显示

    获取验证码

    Close