
微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1
微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。
微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。
谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的 Gemini 的所有功能(长上下文、工具等)。
DeepSeek 团队最新研究,利用 300 多万个实例,将代码转换成思考过程,构建出数据集 CODEI/O,对 Qwen、Llama 等模型进行了训练。
阿尔特曼、OpenAI 首席研究官不得不发文承认 DeepSeek 的技术突破,预告未来会加快新模型的发布。与此同时,研究人员们也纷纷展开了对 DeepSeek 技术的深入分析。