Mistral 推出 Devstral 2 模型家族,宣称表现在开源编程智能体中一流
Mistral 表示 Devstral 2 (123B) 的参数规模远小于竞品,成本效益是 Claude Sonnet 的 7 倍以上。
Mistral 表示 Devstral 2 (123B) 的参数规模远小于竞品,成本效益是 Claude Sonnet 的 7 倍以上。
Anthropic发布最新AI模型Claude Opus 4.5,在编码、智能体及计算机操作方面表现领先,软件工程测试成绩超越人类。该模型已在Anthropic应用、API及三大云平台开放使用,定价5美元/百万tokens输入,25美元/百万tokens输出。 #AI #人工智能 #ClaudeOpus
沃尔夫指出当前聊天机器人存在两大问题:ChatGPT 及类似的产品往往会迎合提问者的观点,比如你提问后,机器人可能会称赞你的问题很有趣或很棒;这些聊天机器人的底层模型设计目标是“预测句子中最可能出现的下一个词”。
巴黎AI公司Giskard研究发现,要求AI聊天机器人简短回答问题时,其产生“幻觉”(输出虚假信息)的概率会显著增加。包括GPT-4o在内的主流模型均存在此现象,因简洁回答缺乏反驳错误的空间。#AI幻觉##ChatGPT#
斯坦福最新报告显示,中美顶级AI模型性能差距已缩小至0.3%,中国在AI领域快速崛起。2024年是小型AI模型的突破年,更小更高效的模型表现亮眼。#人工智能##AI前沿#