当前标签

AI

DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版

幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

国家网信办:截至 2024 年末共 302 款生成式人工智能服务完成备案

促进生成式人工智能服务创新发展和规范应用,2024 年,网信部门会同有关部门按照《生成式人工智能服务管理暂行办法》要求,持续开展生成式人工智能服务备案工作。截至 2024 年 12 月 31 日,共 302 款生成式人工智能服务在国家网信办完成备案,其中 2024 年新增 238 款备案;对于通过 API 接口或其他方式直接调用已备案模型能力的生成式人工智能应用或功能,2024 年共 105 款生成式人工智能应用或功能在地方网信办完成登记,现将相关信息予以公告。

Grammarly 收购 AI 公司 Coda,将为企业推出大模型 LLM 助手 / 语法检查工具

IT之家的小伙伴们可能有用过 Grammarly 工具提供的“语法检测”服务,这一工具对于英文书信等场合较为友好,而根据 Grammarly 官方新闻稿,该公司现已收购一家 AI 初创公司 Coda,将涉足 AI 生产力领域。Grammarly 表示,此次收购旨在整合双方的技术资源,该公司计划在内部通过结合 Coda 的 AI 工具和界面,转型为全面的“AI 生产力平台”,为企业提供生成式 AI 助手和各种生产力工具。

Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后,Meta 于 10 月 24 日发布了这两个模型的量化版本,量化后的模型大小平均减少了 56%,RAM 使用量平均减少了 41%,模型速度提高了 2 至 4 倍,同时降低了功耗,使这些模型能够部署到更多移动设备上。目前,Meta 已在一加 12、三星 S24+/S22 及苹果 iOS 设备(未公布具体型号)等移动平台测试这些经过量化后模型,测试“运行结果良好”,研究人员未来还计划通过神经处理单元(NPU)提升这些量化模型的性能。

微信扫一扫

微信扫一扫
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close