消息称英国监管机构紧急评估 Anthropic 新 AI 模型 Claude Mythos 的风险
英国金融监管机构正联合网络安全中心,与各大银行紧急磋商,评估 Anthropic 最新大模型“Claude Mythos Preview”可能带来的关键信息系统漏洞风险。该模型在受控的“玻璃翼计划”中,已发现数千个重大软件漏洞。未来两周将举行专项通报会。#AI 安全# #金融科技风险#
英国金融监管机构正联合网络安全中心,与各大银行紧急磋商,评估 Anthropic 最新大模型“Claude Mythos Preview”可能带来的关键信息系统漏洞风险。该模型在受控的“玻璃翼计划”中,已发现数千个重大软件漏洞。未来两周将举行专项通报会。#AI 安全# #金融科技风险#
通过 GEO 技术,商家可付费将产品信息“喂”给 AI 大模型,使其在用户搜索时排名前列,甚至推荐虚构商品。业内人士演示了如何用“力擎 GEO 优化系统”生成并发布软文,成功“污染”AI 推荐结果。此举暴露了 AI 内容生态的脆弱性与监管挑战。#AI 大模型投毒# #315 晚会#
这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。
简单来说,论文发现:更大且更遵循指令的大模型也变得更不可靠了,某些情况下 GPT-4 在回答可靠性上还不如 GPT-3。