长上下文窗口、Agent崛起,RAG已死?

长上下文窗口、Agent崛起,RAG已死?

 

文章摘要


【关 键 词】 技术趋势RAG争议上下文工程智能体检索LLM发展

向量数据库Chroma创始人Jeff Huber近期提出”RAG已死,上下文工程当立”的论点,引发业界对检索增强生成技术未来走向的热议。作为解决大语言模型输入长度限制的主流方案,RAG技术通过文档分块、向量检索等机制为LLM提供外部知识支持,但其核心价值正面临长上下文窗口和智能体技术的双重挑战。

LlamaIndex团队从演进视角提出RAG正在进化为”智能体检索“架构。其分析显示现代RAG系统已超越基础的分块检索阶段,形成包含自动路由、复合检索API等功能的四层进阶体系。在最高级形态中,双层智能体架构能动态选择检索策略:顶层智能体负责跨知识库路由,子索引智能体则决定具体检索方式。这种分层架构使系统能精准响应复杂查询,将传统RAG升级为智能体的”知识骨干”

资深工程师Hamel Husain联合多位专家指出,RAG正演变为严谨的工程学科。研究显示,单纯扩展上下文窗口存在经济性和效率瓶颈,而新一代检索技术通过三大革新提升价值:评估体系转向覆盖率、多样性等新指标;检索模型具备指令理解和推理能力;系统架构采用多表征映射与智能路由设计。特别是”延迟交互”模型通过保留token级向量,使小模型性能超越大模型,而”上下文腐烂”现象则证明精准检索比简单填充长上下文更有效。

Fintool创始人Nicolas Bustamante则持颠覆性观点,认为RAG存在不可修复的”原罪”。文档切分导致信息割裂,向量检索难以捕捉专业语义,补丁式改进又带来系统复杂性飙升。其实验显示,采用智能体直接访问原始文件配合长上下文的新范式,在财报分析等场景实现数量级提升。这种”调查式”检索通过逻辑跳转构建完整理解,使RAG降级为智能体的备选工具而非核心架构。

技术演进呈现清晰路径:基础RAG形态确实面临淘汰,但其核心理念将在智能体生态中重生。未来架构将根据场景需求灵活组合技术——海量数据筛选依赖智能体驱动的增强型RAG,深度分析场景则采用长上下文与直接访问模式。这种分化标志着LLM应用进入更成熟的工程化阶段,开发者需要精准把握不同范式的适用边界与技术特性。

原文和模型


【原文链接】 阅读原文 [ 4132字 | 17分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...