标签:工具调用
智谱重磅三箭齐发:从看懂世界到操作手机,千亿模型上云、手机智能体入袋、语音输入重构
AutoGLM是首个具备真机操作能力的AI智能体,实现了让AI像人一样操作手机完成任务的愿景。经过32个月的探索,团队构建了Phone Use能力框架,模型学会了将自然...
开源视觉推理模型Top1,易主了。
编程支持成为另一亮点,结合Coding Plan服务展现出较高性价比。在复刻Linear官网案例时,模型通过视频输入实现了90%的页面还原度,但在Wispr Flow等复杂动效...
DeepSeek V3.2爆火,Agentic性能暴涨40%解密
交错思维链(Interleaved Thinking)技术正成为解决大模型在复杂任务中“状态漂移”问题的关键机制。当大模型处理长链条任务(如旅行规划)时,传统ReAct(推理...
DeepSeek V3.2 正式版发布,V4 还没来,但已经是开源模型里 Agent 能力最强了
DeepSeek近日发布了V3.2正式版模型,包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个版本。此次更新的核心在于推理能力和Agent工具调用能力的显著提升。其中...
登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
大语言模型与外部工具的结合已成为推动AI从“会说”走向“会做”的关键机制。这种结合在API调用、多轮任务规划、知识检索和代码执行等场景中尤为重要。然而,现有...
扒完全网最强 AI 团队的 Context Engineering 攻略,我们总结出了这 5 大方法
检索策略(Retrieve)发展出多元技术路线。传统RAG方案如Windsurf结合向量搜索、grep和知识图谱,而Anthropic的Claude Code则完全依赖生成式检索。Lance Mart...
AI编程终于“开箱即用”了?Qwen3-Coder或许是那个质变节点
阿里通义团队发布的Qwen3-Coder-480B-A35B-Instruct模型,标志着AI编程领域的一个重要里程碑。该模型采用480B总参数、35B激活的MoE架构,原生支持256K上下文...
选AI比选对象还难!起名黑洞OpenAI的新模型,到底怎么选?
OpenAI近期发布了多款新模型,包括o3、o4-mini和GPT-4.1,每款模型在复杂任务、日常应用和API开发中展现出不同的优势。o3作为OpenAI最新的旗舰模型,专为深度...
让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?
OpenAI 最新发布了 OpenAI o3 和 o4-mini 模型,标志着 ChatGPT 能力的一次飞跃。这些模型首次实现了自主调用并整合 ChatGPT 内的全量工具,包括网页搜索、Py...
实测文心X1:便宜大碗还能自主调用工具,引发硅谷反思?
百度近期发布的文心大模型X1和文心大模型4.5引发了广泛关注,尤其是在硅谷和全球AI领域。文心X1作为百度首个深度思考模型,主打极致性价比,其输入和输出成本...
1
2




