
DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
研究显示,患有抑郁症的 CEO 往往面临更多职场挑战。具体而言,CEO 的心理健康问题与公司面临的风险相关,例如诉讼或股票回报波动。此外,有限的证据表明,患有抑郁症的 CEO 更可能获得更高的薪酬,且薪酬中基于绩效的部分比例更高。这些 CEO 多为年轻男性,女性比例较低。
香港大学携手快手科技,组建科研团队,提出名为 GameFactory 的创新框架,目标是解决游戏视频生成中的场景泛化难题。该框架利用在开放域视频数据上预训练的视频扩散模型,能够创造全新且多样化的游戏场景。
天风证券分析师郭明錤今天(1 月 15 日)发布博文,针对英伟达最新调整的 Blackwell 架构蓝图,认为英伟达至少在未来 1 年内,显著降低 CoWoS-S 封装需求。
英国首相斯塔默承诺,到 2030 年英国政府将采购多达 10 万块 GPU,这意味着英国主权 AI 算力将增加 20 倍,主要用于学术界和公共服务领域的 AI 应用。
X 平台博主 Andrei David 发文,宣布其成功在一台拥有 20 年历史的厚版 Xbox 360 游戏机上安装并运行了一款特制的 Llama2.c AI 模型。
促进生成式人工智能服务创新发展和规范应用,2024 年,网信部门会同有关部门按照《生成式人工智能服务管理暂行办法》要求,持续开展生成式人工智能服务备案工作。截至 2024 年 12 月 31 日,共 302 款生成式人工智能服务在国家网信办完成备案,其中 2024 年新增 238 款备案;对于通过 API 接口或其他方式直接调用已备案模型能力的生成式人工智能应用或功能,2024 年共 105 款生成式人工智能应用或功能在地方网信办完成登记,现将相关信息予以公告。
阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent,基于现有 Qwen 语言模型,支持智能体执行复杂任务,并提供多种高级功能,赋能开发者构建更强大的 AI 智能体。
Anthropic 公司与主要音乐出版商达成协议,通过禁止其 AI 助手 Claude 生成受版权保护的歌词,暂时解决了双方的纠纷,然而“使用受版权保护的歌词来训练 AI 模型”这一核心问题依然悬而未决。
Meta AI 的研究人员提出了一种名为 LIGER 的新型 AI 模型,巧妙地结合密集检索和生成检索的优势,显著提升了生成式推荐系统的性能。
华尔街日报昨日(12 月 26 日)发布博文,报道称微软正在大力推广其人工智能助手 Copilot,将其捆绑到 Microsoft 365 订阅服务中,并在澳大利亚和部分东南亚国家率先提价。
市场调查机构 Counterpoint Research 最新调查显示,生成式 AI(Gen AI)正在迅速改变智能手机市场格局。消费者对 AI 功能手机兴趣浓厚,美国市场尤为突出,这预示着 Gen AI 手机的普及浪潮即将到来。
IT之家的小伙伴们可能有用过 Grammarly 工具提供的“语法检测”服务,这一工具对于英文书信等场合较为友好,而根据 Grammarly 官方新闻稿,该公司现已收购一家 AI 初创公司 Coda,将涉足 AI 生产力领域。Grammarly 表示,此次收购旨在整合双方的技术资源,该公司计划在内部通过结合 Coda 的 AI 工具和界面,转型为全面的“AI 生产力平台”,为企业提供生成式 AI 助手和各种生产力工具。
“12 days of OpenAI”活动进入倒数第 2 天,OpenAI 公司主要演示了桌面版 ChatGPT 的功能改进,强调 ChatGPT 正从聊天机器人向 AI 智能体工具进化,让其在桌面环境中高效执行任务并实现无缝协作。
随着 iOS 18.2 的公开发布,Apple Intelligence 的诸多新功能上线,北美电力可靠性公司(NERC)发出警告,人工智能(AI)应用的爆炸式增长可能导致美国和加拿大最早于明年就面临大面积停电的风险。
LG Display 认为 AI 技术的引入能让员工有更多的时间和精力专注于高附加值的工作而不是用在可由 AI 代劳的数据收集与分析上。
据韩媒 ET News 报道,三星将在明年 1 月在全球范围内为其 Bixby 语音助理引入 AI 大模型支持。另参考消息源 @i 冰宇宙透露,Bixby 的这一升级据称将成为 Galaxy S25 的“最大卖点”。
微信珊瑚安全官方发布《关于打击利用 AI 仿冒知名人士进行营销宣传的公告》,将从速从严打击了一批利用 AI 仿冒知名人士进行不当营销、恶意博取流量的违规行为,并针对相关情况开展专项治理。
Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)于 3 天前在 Threads 上发布动态,表示在 Llama 3.3 模型的帮助下,目前 Meta AI 的月活用户数量逼近 6 亿。
训练 AI 模型的瓶颈,目前不再仅仅是架构设计,数据管理效率也至关重要。Meta AI 最新推出了开源可扩展且高性能的数据加载(SPDL)工具,通过提升数据加载效率,最终加快 AI 训练速度。
据经济观察报报道,2024 年,中国银行、工商银行、农业银行、邮储银行、交通银行、建设银行以及中原银行、杭州银行、浙商银行、上海银行等银行的分支机构采用了 AI 面试来优化招聘流程,以提高效率。
科技媒体 marktechpost 昨日(12 月 6 日)发布博文,报道称谷歌公司获批新专利,推出基于全原子表征扩散模型的尖端蛋白质设计系统,实现了前所未有的精度和效率,为生物技术和制药科学领域带来革命性突破。
为了迎战 OpenAI 推出的 Sora 文生视频模型,谷歌宣布其图片生成模型 Imagen 3 现已结束测试,在全球范围内正式上线。据介绍,Imagen 3 号称是谷歌最高级的文生图模型,该模型已于今年 8 月在美国向用户开放,而目前全球范围内订阅了 Google Cloud 的用户都可以体验这款模型。
微软于 12 月 2 日更新 Windows 11 Dev 日志,新增 1 个已知问题,承认用户在安装 11 月可选更新 KB5046740 后,加入 Dev 频道升级至 26120.2415,那么 Recall AI 功能无法保存任何快照。
微软宣布旗下人工智能开发工具包 Semantic Kernel 的 OpenAPI 扩展功能正式版现已上线,号称为.NET 和 Python 提供全面支持。
Claude AI 开发商 Anthropic 于 11 月 25 日宣布了一项名为 Model Context Protocol 的开源协议,该协议号称是为业界 AI 助理与模型数据库提供一套标准化接口,允许各大助理通过单一协议访问各种数据源,从而加速模型响应速度与生成质量。
TikTok 目前在海外上线了一款免费生成式 AI 视频制作平台“Symphony Creative Studio”,旨在为广告主和内容创作者(TikTok 商务用户)提供高效的广告短视频生成、编辑、翻译和语音合成功能。
该工具旨在通过 AI 智能简化编码、排查错误和自动化工作流程,为开发者和 IT 专业人员提供智能化的命令行体验,标志着微软在 AI 集成战略上的又一重大进展。
Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。
阿里通义千问昨日(11 月 18 日)发布博文,宣布在经过数月的优化和打磨后,针对社区中对更长上下文长度(Context Length)的要求,推出了 Qwen2.5-Turbo 开源 AI 模型。
“荣耀终端”官方微博从 11 月 15 日起至今天(11 月 18 日)12 点连续发送共计 1.4 万条短视频微博,同时配有“感谢小伙伴的倾情演唱,特此送上专属直拍一份,回味一下”文字,相应短视频主要展示员工工牌上人像图片“唱歌”,并带有“荣耀分之一”文字及编号。
据 TheGuardian 报道,英国国家医疗服务体系(NHS)即将试用一款名为“Aire”的“超人类”人工智能工具,该工具能够预测患者患病和早逝的风险。
AI 公司 DecartAI 联合 Etched 推出了名为 Oasis 的世界模型,可以在“没有游戏引擎、没有逻辑、没有代码”的情况下运行一个大致近似于《我的世界》的游戏。然而,这款 AI 生成的“游戏”却引发了广泛的批评和争议。
数据挖掘者在 Win11 Build 27729 的隐私策略 AppPrivacy.adml 文件中发现微软将其 Copilot AI 声明为“Windows Intelligence”。目前尚不知悉这是微软开发人员弄错了名称,还是微软“改名部”即将把 Copilot 改名为“Windows Intelligence”,但这一举动显然是跟随了“苹果牌 AI”Apple Intelligence 的命名策略。
科技媒体 The Decoder 昨日(10 月 30 日)发布博文,报道称谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在最新季度财报电话会议上,宣布 Gemini API 用量在过去 6 个月内飙升了 14 倍。
路透社于 10 月 24 日发布博文,报道称欧洲科学家开发了一种能够解读猪叫声的人工智能(AI)算法,从而帮助猪农了解猪的情绪和压力状态。
抖音官方表示,鼓励创作优质内容,包括采用 AI 技术进行辅助创作,但所创作内容必须遵循平台规范。
继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后,Meta 于 10 月 24 日发布了这两个模型的量化版本,量化后的模型大小平均减少了 56%,RAM 使用量平均减少了 41%,模型速度提高了 2 至 4 倍,同时降低了功耗,使这些模型能够部署到更多移动设备上。目前,Meta 已在一加 12、三星 S24+/S22 及苹果 iOS 设备(未公布具体型号)等移动平台测试这些经过量化后模型,测试“运行结果良好”,研究人员未来还计划通过神经处理单元(NPU)提升这些量化模型的性能。
科技媒体 The Decoder 昨日(10 月 24 日)发布博文,报道称谷歌 DeepMind 推出了新版 MusicFX DJ,让没有音乐专业知识的人借助 AI,也能实时创建专属的音乐曲目。
#骁龙峰会#高通公司在今天举办的骁龙峰会上,推出了骁龙 8 至尊版移动平台,这是迄今为止高通最强大且全球速度最快的移动端系统级芯片。峰会首日,高通公司宣布和智谱、腾讯混元合作,共同推动端侧 AI 模型部署和落地。
据华尔街日报报道,AI 初创公司 Perplexity 已开始进行融资谈判,希望将其估值增加一倍以上,达到 80 亿美元(IT之家备注:当前约 569.11 亿元人民币)或更高。
科技媒体 marktechpost 昨日(10 月 18 日)发布博文,报道称微软公司开源了 bitnet.cpp,这是一个能够直接在 CPU 上运行、超高效的 1-bit 大语言推理框架。
科技媒体 The Verge 今天(10 月 19 日)发布博文,报道称 Worldcoin 公司现已更名为 World,并推出了增强版研究扫描 Orb 设备。
在探索生命未知领域,诺奖级 AI——AlphaFold 再次获胜!这次,它竟揭秘了精子和卵子在分子层面上,「巧遇」的亲密细节。
科技媒体 techpowerup 昨日(10 月 16 日)发布博文,报道称谷歌云(Google Cloud)也展示部署英伟达的 Blackwell GB200 NVL 系统,从官方图片中可以看到和微软 Azure 不同的部署方案。
该团队通过使用单个 GPU 训练足够的 Dust II Deathmatch 素材来“教会”AI 模型怎么玩游戏,从而成功将《CS:GO》“移植”到 AI 世界中。
科技媒体 The Decoder 昨日(10 月 11 日)发布博文,报道称 OpenAI 公司推出 MLE-bench 新基准,旨在评估 AI 智能体在开发机器学习解决方案方面的能力。
科技媒体 NeoWin 昨日(10 月 10 日)发布博文,报道称微软公司针对 Copilot Studio 推出了全新的医疗智能体服务,应对当前医疗体系中的诸多挑战。
Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen,该工具能够生成带有声音的高清视频。几个月前,其竞争对手 OpenAI 也推出了其文本转视频模型 Sora。
谷歌致力于在 2030 年实现所有业务和价值链的净零排放,但 AI 的高能耗却给这一目标带来了挑战,例如其 2023 年温室气体总排放量按比 2019 年增加了 48%。