标签:智能体

端侧跑大模型,现在也太简单了

近期本地运行的AI模型在可行性和实用性方面实现了重要跨越,智力、智能体能力及工具链成熟度均有显著提升。过去本地模型常被认为运行缓慢且准确率不高,但随...

人类最后考试已不够用,Agent最后考试来了!

针对当前人工智能系统在问答类基准测试中表现优异,但在核心行业长流程真实工作流中经济效用有限的问题,研究团队推出了Agents' Last Exam(ALE)。该基准旨...

当我告诉 AI 把这事做完再下班,结果它真的通宵了

在Agent时代,生产力的所有权正从组织回归个人,用户愈发关注工具带来的杠杆效应、主权身份以及结果的确定性。智能体工具的核心价值在于将模型能力转化为实际...

Claude Code之父删了IDE!干掉提示词,只写循环

AI编程领域正经历一场深刻的范式迁移,开发者从亲自编写代码和提示词,转向设计自动化循环系统来指挥编程智能体。这种被称为“循环工程”的新模式,标志着传统...

本周 AI 项目推荐:UXBench、MemLens、RoadmapBench…下一代模型,需要下一代 Benchmark

当前大模型的发展正经历评测标准的深刻转变,下一代基准测试的核心目标已从单纯评估模型的答题能力,转向衡量系统在真实世界中稳定执行任务的综合表现。未来...

英伟达开始搞机器人自己研究机器人那套了…

英伟达、CMU和Berkeley联合推出了具身智能Autoresearch框架ENPIRE,旨在让AI智能体自主进行机器人研究。该框架允许多个编码智能体各自控制机器人,独立完成文...

Claude Cowork限时翻倍!Anthropic亏钱请所有打工人

Anthropic近期宣布将Claude Cowork所有付费用户的使用额度翻倍,并同步发布了详尽的产品操作指南。这一举措标志着其正加速向广大知识工作者推广AI智能体服务...

吴恩达戳破AI幻象:炒作过头了,未来公司是10人小队+Agent重做数据架构

吴恩达与Harrison Chase的对谈深入探讨了AI智能体对软件开发及企业转型的深远影响。随着编程智能体能力的快速跃升,软件构建速度大幅提升,这使得行业瓶颈从...

金融展上,海光给“可信智能体”划了三条红线

随着金融行业人工智能应用迈入智能体规模化落地阶段,算力与安全的关系被重新定义。在2026中国国际金融展上,海光信息展示了面向金融可信智能体的协同解决方...

金融展上,吴宗友给“可信智能体”划了三条红线

随着金融行业人工智能应用从辅助问答走向自主决策,AI智能体开始接管交易指令与风险判断,算力与安全的关系正在被重新定义。在2026中国国际金融展上,海光信...
1 2 3 46