当前标签

推理

微软发布 Phi-4 系列小语言 AI 推理模型，AIME 2025 跑分超满血版 Deepseek R1

微软昨日（4 月 30 日）发布 Phi-4-reasoning 系列推理模型，通过监督微调 Phi-4，并利用 o3-mini 生成的高质量“可教导”提示数据集训练，专为复杂推理任务设计。

0 217 0

谷歌最强模型 Gemini 2.5 Pro 发布即屠榜，创下史上最大分数飞跃纪录

谷歌称，它是世界上最强大的模型，具备统一的推理能力，以及用户所喜爱的 Gemini 的所有功能（长上下文、工具等）。

0 318 0

DeepSeek 团队新作：把代码变成思维链，大模型推理各种能力全面提升

DeepSeek 团队最新研究，利用 300 多万个实例，将代码转换成思考过程，构建出数据集 CODEI/O，对 Qwen、Llama 等模型进行了训练。

0 196 0

DeepSeek 独立发现 o1 核心思路：OpenAI 首席研究官亲自证实，阿尔特曼被迫发声

阿尔特曼、OpenAI 首席研究官不得不发文承认 DeepSeek 的技术突破，预告未来会加快新模型的发布。与此同时，研究人员们也纷纷展开了对 DeepSeek 技术的深入分析。

0 284 0