标签:大语言模型
超实用提示词模板!AI科学家教你用协作提示词激发大模型潜力
当前主流大语言模型存在'短视'倾向,倾向于提供快速但肤浅的回应,而非深入探讨问题。这种现象源于训练过程中采用的人类反馈强化学习(RLHF)机制,该机制鼓励A...
登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
大语言模型与外部工具的结合已成为推动AI从“会说”走向“会做”的关键机制。这种结合在API调用、多轮任务规划、知识检索和代码执行等场景中尤为重要。然而,现有...
强化学习 AI 系统的设计实现及未来发展
强化学习作为推动大语言模型智能化的核心手段,其复杂程度体现在算法理论与工程实践的双重挑战中。阿里巴巴算法专家曹宇在AICon 2025的分享中,系统梳理了RLH...
3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化
阿里巴巴ROLL团队联合多所高校推出的「3A」协同优化框架,为强化学习在大语言模型(RL4LLM)中的应用带来了高效、精细与可解释的新范式。该框架由Async架构、...
产品上线 4 个月,估值超 1 亿美元,Agnes AI 即将完成新一轮融资
新加坡AI公司SAPIENS旗下产品Agnes AI即将完成数千万美元的新一轮融资,公司估值突破1亿美元。本轮资金将重点投入区域大语言模型训练和全球市场商业化加速,...
视觉生成的另一条路:Infinity 自回归架构的原理与实践
以ChatGPT、DeepSeek为代表的大语言模型取得了巨大成功,但在视觉生成领域,扩散模型仍是主流方法。视觉自回归方法因其更好的scaling特性和统一理解与生成任...
北大 & 作业帮团队提出 Text-to-SQL 新框架 Interactive-T2S,攻克宽表处理与低资源对齐难题
研究团队提出了一种名为Interactive-T2S的创新框架,旨在解决大语言模型(LLMs)在Text-to-SQL任务中的核心挑战。该框架将LLM视为一个能够与数据库进行多轮交...
西湖大学打造了一个AI科学家,突破人类SOTA,还能自己发论文
西湖大学开发的AI系统DeepScientist在两周内完成了人类需耗时三年的科研工作量,自主生成5000多个科学想法并验证1100个,最终在三个前沿AI任务上刷新了人类创...
征稿启事 | AAAI 2026“大语言模型中的深度逻辑推理”联合会议
AAAI 2026联合会议聚焦大语言模型中的深度逻辑推理问题。作为人工智能领域的顶级学术会议,第40届AAAI大会将于2026年1月在新加坡举行,其中为期两天的联合会...
大语言模型的新征程—— ACL 2025顶会见闻前沿论坛实录|GAIR Live
2025 年 ACL 年会中,大语言模型持续主导 NLP 领域,投稿量破 8000,中国作者占比达 51%。雷峰网等邀请三位学者就大模型多方面展开深度对话,探讨 NLP 未来趋...





