每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录
AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,推出“硬连线”(Hard-wiring)技术,直接将 AI 模型固化在硅片中。
AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,推出“硬连线”(Hard-wiring)技术,直接将 AI 模型固化在硅片中。
一道“50米洗车题”让DeepSeek、ChatGPT、Claude等主流AI模型集体“翻车”,它们都建议“走过去”,却忽略了洗车需要车到场。只有谷歌Gemini答对。腾讯张军实测指出,AI的“聪明”程度与人类引导方式密切相关。#AI翻车# #大模型短板#
AI 开源平台 Hugging Face 去年底拒绝了英伟达 5 亿美元投资,估值或达 70 亿美元。其坚持免费开放模式,与 OpenAI、谷歌等闭源巨头形成对抗,并助力 DeepSeek、阿里等中国 AI 产品出海。公司已盈利,但为投资数据集 Q1 出现亏损。#HuggingFace拒绝英伟达# #开源AI#
新的架构、下一代国产芯片,总共短短不到 20 个字,却蕴含了巨大信息量。国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近 14%,总市值跃居科创板头名。
今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。
西门子(Siemens)管理委员会委员、首席技术官兼首席战略官 Peter Koerte 在昨日的 2025 天津夏季达沃斯论坛上指出,过去 50 年,市场致力于人工智能算法的研究,而目前,AI 已经可以运行工厂,控制无需人工的系统,“工业界面对庞大的数据量和个性化的需求,需要人和 AI 一起工作。”
据IT之家网友反馈,OPPO 的小布助手已推出网页版,点击 xiaobu.coloros.com 即可体验,登录 OPPO 账号还可以同步手机端的历史对话记录。
斯坦福最新报告显示,中美顶级AI模型性能差距已缩小至0.3%,中国在AI领域快速崛起。2024年是小型AI模型的突破年,更小更高效的模型表现亮眼。#人工智能##AI前沿#
深蓝汽车今日发布 DEEPAL OS 3.0 系统 OTA 升级公告,新版本深度融合 DeepSeek,支持多轮对话与上下文理解、实时信息获取与更新等能力,官方称“全系车型陆续推送中”。
国产AI大模型DeepSeek成爆款,却出现大量仿冒App和网站,坑骗消费者钱财、窃取信息,构成商标侵权。律师提醒选官方渠道下载,遇假冒及时举报。 #AI大模型 #DeepSeek #仿冒侵权#
梁文峰告诉身边的人,他并不急于获得投资,因为担心外部投资者会干预 DeepSeek 的决策。最近几周,包括腾讯和阿里巴巴在内的中国科技公司高管曾与梁文峰会面,讨论潜在合作机会。
媒体智通财经援引“消息人士”,称 DeepSeek 下一代 AI 模型 DeepSeek-R2 将于 3 月 17 日发布。
据介绍,该方案基于北大自研 SCOW 算力平台系统、鹤思调度系统,并整合 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现华为昇腾上的 DeepSeek 高效推理,并支持大规模算力集群训推一体化部署。所有开发者均可获取源码并根据需求二次开发,性能接近闭源方案。
法国公司 Mistral AI 计划拥抱开源策略,发布超越 DeepSeek 的新模型。CEO Arthur Mensch 表示,开源模式有助于低成本开发强大 AI 技术,推动全球 AI 生态协作发展。#MistralAI #开源AI
OPPO ColorOS 15 系统新版本小布助手在使用 DeepSeek-R1 后,支持联网搜索、深度思考功能(目前该版本小布助手已在应用商店开始推送,用户可直接下载使用)。需要注意的是,ColorOS 14 系统版本机型不支持下载使用。
vivo 浏览器已上线 DeepSeek 模型满血版,支持深度思考和联网搜索功能。需要注意的是,该功能分批次生效,无法使用的用户需升级浏览器至最新版本后等待功能开放。
对了,这次给大家分享的 PDF 下载,是原汁原味的原版哦,网上有太多卖课者魔改的内置其广告版本。
据龙芯安徽公众号,龙芯中科成功发布基于 DeepSeek 大模型的软硬全栈推理一体机。产品基于龙芯自主指令系统架构(LoongArch)处理器,搭载太初元碁 T100 加速卡,支持 DeepSeek 全系大模型及其它主流大模型。
企业微信今日宣布接入 DeepSeek 模型,带来了「智能机器人」、「智能表格-客户跟进总结」等 AI 功能。
数据分析平台 QuestMobile 最新数据显示,从上线以来至 2 月 9 日,DeepSeek App 的累计下载量已超 1.1 亿次,周活跃用户规模最高近 9700 万。(每日经济新闻)
外媒 The Information 报道提到,由于其 AI 模型大受欢迎,因而要增加资源投放以满足明显增加的需求,所以促成内部讨论引入更多投资者。
网易云音乐18日宣布,其面向创作者研发的“音乐播客生成工具”与“对谈播客生成工具”已完成国产开源大模型DeepSeek-R1的全能力接入。
据界面新闻报道,腾讯内部正紧急协调部署,通过调用元宝来支持微信搜索功能,为用户提供更多入口和选择。
有道 SpaceOne 号称是“国内首款 AI 原生学习硬件”,内置 AI 家教“小 P 老师”,接入 DeepSeek-R1 深度推理,讲题更细致。
中外大厂、初创公司都头好秃,全被追着问:你们对 DeepSeek 怎么看?DeepSeek 出来你们怎么办?
深圳市腾讯计算机系统有限公司今日发文宣布,腾讯元宝继上周接入「满血版」DeepSeek-R1 后,又上线混元最新「深度思考模型」Thinker(T1)。用户进入对话界面,可自由切换模型,并免费使用。
华为小艺助手今日再获 11.2.10.341 版本升级,安装包大小约 100.3MB,该版本增强了小艺主对话场景(部分 DeepSeek)及跳转智能体相关体验。
服务器内置 Deepseek-R1 1.5B ~ 70B 蒸馏模型,支持零配置启动大模型的交互演示。开发者可快速调用预置模型接口。
福田区已上线 11 大类 70 名“数智员工”,覆盖公文处理、民生服务、应急管理、招商引资等多元场景。
网友 @赛博禅心 今日爆料称,微信正在内测接入 DeepSeek-R1 大模型。IT之家注意到,该路径位于微信页面-搜索-AI 搜索。
谈及 DeepSeek,欧阳明高表示,它在电池知识问答和电池文本挖掘任务上均表现优异,在电池设计任务上具备初步的总结能力,但尚欠缺科学分析能力,仍需要垂直领域大模型解决。
据多位微博用户分享,小米澎湃 HyperOS「超级小爱」已接入 DeepSeek-R1 模型,支持写代码、写文章、逻辑推理等功能。
中兴努比亚今日宣布率先实现全尺寸内嵌 DeepSeek,努比亚 Z70 Ultra 也将作为全球首款全尺寸内嵌 DeepSeek 的机型今日正式上线,更多机型陆续更新中。
其支持对用户的提问进行深度思考、逻辑推理和详细回答,同时也支持联网搜索信息,以提高推理和回答的时新性和权威性。
华为技术有限公司今日发文宣布,DeepSeek V3 / R1 671B 旗舰模型(满血版)已基于华为云昇腾云服务全栈优化适配,宣称满足业务商用部署需求。
蚂蚁集团今日宣布,支付宝百宝箱上线 DeepSeek R1 & V3,面向所有用户,支持思维链推理过程可视化、满血版 / 32B / 7B 全量级覆盖、零门槛免费使用、对话应用 & 工作流支持。
即日起至3月10日,DeepSeek 推理API免费开放。此外,讯飞开放平台还将提供从模型训练、部署调试到场景优化的99.97% SLA云服务。
北京市商汤科技开发有限公司昨日晚发文宣布,企业客户和开发者可在商汤大装置万象平台中,快速部署 DeepSeek-V3、DeepSeek-R1 等模型,可享受 3 个月内 1000 万 tokens 免费使用权益。
阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款全尺寸模型。DeepSeek-V3、DeepSeek-R1 满血版可享各 100 万免费 tokens,蒸馏版 1 元最高可享受 200 万 tokens,即日起,所有用户可直接使用。
OPPO ColorOS 设计总监陈希今日宣布,这个月底,ColorOS 将全面接入 DeepSeek。小布助手将是首个和 DeepSeek 深度融合的系统智能助理。
博主 @旺仔百事通 今日爆料称,荣耀笔记本荣耀 AI 部分后面也会接入 DeepSeek,Pro14 采用 OLED,Pro16 依旧采用 IPS。
DeepSeek 跟 ChatGPT 下了一把国际象棋,然后…… 通过忽悠的方式,竟让 ChatGPT 直接认输!
如果开发者只想快速接入大模型,腾讯云也提供了 DeepSeek-R1、V3 原版模型的 API 接口。目前腾讯云已提供 Cloud Studio、云原生构建、HAI、TI 平台、API 接口、知识引擎等多种接入方式。
Gitee AI 昨日宣布上线 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B 四个较小尺寸的 DeepSeek 模型。
OpenAI CEO 山姆・阿尔特曼在当地时间上周五(1 月 31 日)举行的 Reddit“Ask Me Anything”活动中表示, OpenAI 需要“弄清楚另一种开源战略”。
中国红客联盟今就 DeepSeek 事件再次发布声明,称该事件系互联网企业博主为营销宣传,以及某国内小企业借中国红客联盟之名进行的计划性营销牟利行为。
据路透社报道,日本经济产业省(METI)通过电子邮件回应了关于数据中心扩张可能增加电力需求的讨论。该部门表示,尽管数据中心的扩展确实可能推高电力需求,但随着类似 DeepSeek 等新技术的出现,未来电力需求的变化仍难以准确预测。
深圳市腾讯计算机系统有限公司今日发文宣布,DeepSeek-R1 大模型支持一键部署至腾讯云「HAI」上,开发者仅需 3 分钟就能接入调用。
硅基流动今日宣布,经过公司和华为云团队连日攻坚,为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,得到了 DeepSeek 与华为云的大力支持。
今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。
AMD 全球副总裁 David McAfee 在 X 平台公布了一张 AMD Radeon RX 7900 XTX 与英伟达 RTX 4090、RTX 4080 SUPER 在不同参数体量的 DeepSeek-R1 AI 模型中的性能对比图。相应图片中声称 AMD Radeon RX 7900 XTX 显卡在测试中完全超过 RTX 4080 SUPER,该显卡同时仅在运行 32B 体量的模型时中以 4% 差距落后 RTX 4090,而在其余三项较小体量的模型时性能均超过 RTX4090,号称最大领先幅度达了 13%。
DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。