标签:执行轨迹

Agent 该怎么做真正的安全评测?

上海人工智能实验室等机构提出了一系列面向智能体安全评测与诊断的基准测试,包括ATBench及其扩展版本ATBench-Claw和ATBench-CodeX。这些研究将智能体安全评...