标签:工程落地
智能体的尽头是Harness基建!上海交大深度解读Harness
大模型接入真实业务流时常面临崩溃与失控,决定智能体落地成败的关键已从榨取模型内部算力转移到了构建强大的外部认知基础设施上。能力正从隐藏的权重、有限...
你敢把「龙虾」放在手机上跑吗?手机 Agent 离落地还差一道「隐私关」
香港中文大学深圳分校 Freedoms AI 团队联合腾讯混合大视觉大模型等多项合作研究推出了一个新的测评基准项目名为 My Phone Bench该系统专门用于系统化衡量手...
我们用「西游取经团」实测 MiniMax M2.7 ,发现 AI 已经进化成这样了?
本次测试聚焦于大模型在真实工作流中的“执行力”挑战,以MiniMax M2.7为对象,构建了一个包含五个角色的“西游取经团”多Agent协作系统,分别对应科研规划(唐僧...
从狂热到工程、组织实践,OpenClaw这阵风能刮多久?
近期开发者社区中,“养龙虾”已成为代表OpenClaw技术实践的流行语,其核心并非娱乐化表达,而是反映AI Agent从对话能力向实际执行能力的实质性跃迁。OpenClaw...



