百度智能云 DuMate 测评：办公 Agent 教我用 Claude Code，效果如何？

477 0 0

文章摘要

百度于三月中旬全量推出面向企业与个人日常办公场景的桌面级AI智能体DuMate，核心目标在于替代需要频繁操作软件、串联跨端文件与流转交付结果的重复性劳动。在当前大模型推理能力趋于同质化的市场环境下，真正的竞争壁垒在于能否将智能算法无缝嵌入原生工作流，并稳定输出可复用的业务成果。该产品摒弃了单一的问答模式，转而聚焦于可见可操作可留存的全链路执行。其底层逻辑依赖三级能力支撑：首层负责将自然语言意图映射为具体的操作序列；次层直接获取桌面环境控制权，真实调用读写接口、执行代码与触发应用程序；末层则专注于将处理完毕的数据转换为标准文档或代码页面。上线后的快速迭代已涵盖技能拓展、格式精修与跨渠道通讯，构建起从指令接收到归档交付的完整闭环。

针对真实复杂场景的评估环节，测试选取了专为AI编程工具设计的自动化工程系统项目，以此模拟多源信息交织的研发日常工作。考核机制要求智能体优先建立经过来源核实与冲突比对的结构化事实底稿，严禁跨输出载体出现逻辑矛盾。基于这一基准情报，系统必须独立完成四类形态的同步生成：包含完整层级与排版建议的专业说明书、适用于技术汇报的逐页演示文稿、支持本地渲染的静态展示页以及详尽归纳模块功能的分类统计表。测试流程全程追踪智能体在非结构化数据抓取、长期记忆保持、格式规范转换以及边界条件识别等方面的综合表现，以此客观衡量其脱离理想化预设后，在高压多任务并行环境中维持流程稳定与结果可靠的实际水准。