微软发布 ASSERT 开源框架:让开发者更高效地评测 AI 智能体和应用行为
微软推出开源框架 ASSERT,可将产品需求、政策文件等自然语言规范,自动转换为测试场景和评估流程,对 AI 模型、应用或智能体进行系统化评测。该框架旨在让行为规范成为评估核心,而非背景参考。#AI 评测##微软 Build2026#
微软推出开源框架 ASSERT,可将产品需求、政策文件等自然语言规范,自动转换为测试场景和评估流程,对 AI 模型、应用或智能体进行系统化评测。该框架旨在让行为规范成为评估核心,而非背景参考。#AI 评测##微软 Build2026#
OpenClaw 因“主动自动化”能力受到用户追捧。据央视新闻今日报道,工信部网络安全威胁和漏洞信息共享平台监测发现该智能体部分实例在默认或不当配置情况下存在较高安全风险,极易引发网络攻击、信息泄露等安全问题。
Anthropic首份AI智能体行为实测报告显示,Claude Code自主工作时长显著增长,复杂任务成功率翻倍,人工干预减少。然而应用高度集中于软件工程,医疗、金融等垂直领域渗透率极低。报告建议投资监控、训练模型识别不确定性。#AI智能体##Anthropic##软件工程#
腾讯混元今日官宣推出 ETC 领域首款 AI 智能体。据介绍,基于混元大模型,腾讯云和安徽驿路微行科技有限公司联合推出 ETC「助手 Agent」,通过文本或语音发出指令,智能体即可精准理解并高效执行。
宝马集团今日宣布,宝马自研 AI 智能体平台“盖亚”(GAIA,Group Artificial Intelligence Assistant)正式投入运行。宝马成为国内首批自主研发并部署企业级 AI 智能体平台的汽车制造企业之一。