标签:大语言模型

斯坦福最火CS课:不让学生写代码,必须用AI

斯坦福大学近期推出的《现代软件开发者》(CS146S)课程引发广泛关注,这门课程的核心在于探索不编写代码的软件开发模式。课程主张通过AI工具(如Cursor和Cla...

LLM强化学习不稳定之谜,被Qwen团队从「一阶近似」视角解开

强化学习(RL)已成为提升大语言模型(LLM)复杂推理能力的关键技术范式,但其训练稳定性问题亟待解决。当前主流RL算法存在序列级奖励与token级优化的不匹配...

基于文本AI的终结?Agent协作可直接「复制思维」,Token效率暴涨

在Agentic AI时代,多智能体系统(MAS)的发展使得AI从独立运作转向协同合作。传统MAS依赖自然语言进行智能体间的交流,虽然可解释但效率低下且信息易丢失。...

念首诗,就能让AI教你造核弹!Gemini 100%中招

最新研究发现,将恶意指令改写为诗歌形式能够有效突破主流大语言模型的安全限制。这项由意大利罗马大学和DEXAI实验室进行的研究测试了25个顶尖模型,结果显示...

Meta超级智能实验室又发论文,模型混一混,性能直接SOTA

大语言模型(LLM)的训练通常依赖大量算力和时间资源,而模型Souping(Model Souping)作为一种轻量级方法,通过对同一架构的多个模型进行权重平均,能够融合...

超实用提示词模板!AI科学家教你用协作提示词激发大模型潜力

当前主流大语言模型存在'短视'倾向,倾向于提供快速但肤浅的回应,而非深入探讨问题。这种现象源于训练过程中采用的人类反馈强化学习(RLHF)机制,该机制鼓励A...

登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」

大语言模型与外部工具的结合已成为推动AI从“会说”走向“会做”的关键机制。这种结合在API调用、多轮任务规划、知识检索和代码执行等场景中尤为重要。然而,现有...

强化学习 AI 系统的设计实现及未来发展

强化学习作为推动大语言模型智能化的核心手段,其复杂程度体现在算法理论与工程实践的双重挑战中。阿里巴巴算法专家曹宇在AICon 2025的分享中,系统梳理了RLH...

3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化

阿里巴巴ROLL团队联合多所高校推出的「3A」协同优化框架,为强化学习在大语言模型(RL4LLM)中的应用带来了高效、精细与可解释的新范式。该框架由Async架构、...

产品上线 4 个月,估值超 1 亿美元,Agnes AI 即将完成新一轮融资

新加坡AI公司SAPIENS旗下产品Agnes AI即将完成数千万美元的新一轮融资,公司估值突破1亿美元。本轮资金将重点投入区域大语言模型训练和全球市场商业化加速,...
1 2 3 12