大语言模型 | 第 2 页

Meta超级智能实验室又发论文，模型混一混，性能直接SOTA

大语言模型（LLM）的训练通常依赖大量算力和时间资源，而模型Souping（Model Souping）作为一种轻量级方法，通过对同一架构的多个模型进行权重平均，能够融合...

AIGC动态

4个月前

超实用提示词模板！AI科学家教你用协作提示词激发大模型潜力

当前主流大语言模型存在'短视'倾向，倾向于提供快速但肤浅的回应，而非深入探讨问题。这种现象源于训练过程中采用的人类反馈强化学习(RLHF)机制，该机制鼓励A...

AIGC动态

4个月前

登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」

大语言模型与外部工具的结合已成为推动AI从“会说”走向“会做”的关键机制。这种结合在API调用、多轮任务规划、知识检索和代码执行等场景中尤为重要。然而，现有...

AIGC动态

5个月前

强化学习 AI 系统的设计实现及未来发展

强化学习作为推动大语言模型智能化的核心手段，其复杂程度体现在算法理论与工程实践的双重挑战中。阿里巴巴算法专家曹宇在AICon 2025的分享中，系统梳理了RLH...

AI-Agent

5个月前

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

阿里巴巴ROLL团队联合多所高校推出的「3A」协同优化框架，为强化学习在大语言模型（RL4LLM）中的应用带来了高效、精细与可解释的新范式。该框架由Async架构、...

AI-Agent

5个月前

产品上线 4 个月，估值超 1 亿美元，Agnes AI 即将完成新一轮融资

新加坡AI公司SAPIENS旗下产品Agnes AI即将完成数千万美元的新一轮融资，公司估值突破1亿美元。本轮资金将重点投入区域大语言模型训练和全球市场商业化加速，...

AI-Agent

5个月前

视觉生成的另一条路：Infinity 自回归架构的原理与实践

以ChatGPT、DeepSeek为代表的大语言模型取得了巨大成功，但在视觉生成领域，扩散模型仍是主流方法。视觉自回归方法因其更好的scaling特性和统一理解与生成任...

AIGC动态

5个月前

北大 & 作业帮团队提出 Text-to-SQL 新框架 Interactive-T2S，攻克宽表处理与低资源对齐难题

研究团队提出了一种名为Interactive-T2S的创新框架，旨在解决大语言模型（LLMs）在Text-to-SQL任务中的核心挑战。该框架将LLM视为一个能够与数据库进行多轮交...

AIGC动态

6个月前

西湖大学打造了一个AI科学家，突破人类SOTA，还能自己发论文

西湖大学开发的AI系统DeepScientist在两周内完成了人类需耗时三年的科研工作量，自主生成5000多个科学想法并验证1100个，最终在三个前沿AI任务上刷新了人类创...

AIGC动态

6个月前

征稿启事 | AAAI 2026“大语言模型中的深度逻辑推理”联合会议

AAAI 2026联合会议聚焦大语言模型中的深度逻辑推理问题。作为人工智能领域的顶级学术会议，第40届AAAI大会将于2026年1月在新加坡举行，其中为期两天的联合会...

AIGC动态

6个月前

标签：大语言模型

Meta超级智能实验室又发论文，模型混一混，性能直接SOTA

超实用提示词模板！AI科学家教你用协作提示词激发大模型潜力

登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」

强化学习 AI 系统的设计实现及未来发展

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

产品上线 4 个月，估值超 1 亿美元，Agnes AI 即将完成新一轮融资

视觉生成的另一条路：Infinity 自回归架构的原理与实践

北大 & 作业帮团队提出 Text-to-SQL 新框架 Interactive-T2S，攻克宽表处理与低资源对齐难题

西湖大学打造了一个AI科学家，突破人类SOTA，还能自己发论文

征稿启事 | AAAI 2026“大语言模型中的深度逻辑推理”联合会议

热门网址

标签：大语言模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址