大模型

LLM,VLM,模型

田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理

强化学习在提升大型语言模型(LLM)能力的同时,自身也在不断进化。现实世界中的复杂任务通常需要一系列决策,而直接优化多轮目标(如成功率)是提升智能体性...

「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

在当前的AI社区中,注意力机制的计算复杂度问题再次引发了广泛讨论。作者提出了一种全新的视角,认为Transformer中的注意力机制在计算复杂度上应被视为对数级...

苹果会成为第一家因为AI而掉队的巨头么?

苹果公司近年来在多个领域面临挑战,尤其是在人工智能(AI)和产品创新方面。2025年3月,苹果CEO Tim Cook对AI团队失去信心,并对领导层进行了调整。负责Siri...

海外Agent落地有哪些新趋势?听听OpenAI第5号员工创办的公司这么看

进入2025年,AI Agent领域迎来了快速发展的新阶段,OpenAI、Google DeepMind等巨头纷纷布局,开源社区也涌现出多个明星项目。Convergence AI作为一家专注于Ag...

成本不到五毛钱,这款 AI 设计工具想要「训服」家居电商审美

AI技术正在深刻改变家居电商行业的内容生产模式,尤其是在商品图片生成和设计领域。通过天猫的AI设计工具「家作」,商家能够在几分钟内生成高质量的商品图片...

Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业

加拿大AI初创公司Cohere发布了其最新生成式AI模型Command A,专为企业应用场景设计。该模型由transformer论文作者之一Aidan Gomez与多伦多大学校友Ivan Zhang...

实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

在今年的上海AWE展会上,老板电器展示了其全球首个烹饪大模型「食神」的升级版本,该模型不仅接入了DeepSeek,还拓展了多模态功能。这一创新技术不仅能够推荐...

许久没见过这么激进的腾讯了

腾讯在最新财报中展现了其净利润超过2200亿的强劲表现,但更引人注目的是其对人工智能(AI)的高度重视。马化腾在财报中明确表示,腾讯的业绩受益于AI的赋能...

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

DeepSeek-V3-Base 在强化学习调优之前已经展现出「顿悟时刻」,这一现象引发了研究人员对预训练特性如何影响强化学习性能的深入探讨。研究发现,DeepSeek-V3-...

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

普林斯顿大学与华沙理工的研究表明,将对比强化学习(CRL)扩展到1000层可以显著提升性能,在某些机器人任务中性能提升高达50倍。这一发现挑战了传统观点,即...
1 250 251 252 253 254 782