语言模型 | 学习AIGC

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

近年来，语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。自回归模型在训练阶段具有明显优势，但在推理阶段存在顺序执行...

AIGC动态

6天前

香港科技大学、Manycor开源空间大模型，超3000颗星

香港科技大学与Manycore联合开源了一种名为SpatialLM的空间大模型，专注于处理3D点云数据并生成结构化的三维场景理解输出。这一模型的目标是让机器能够像人类...

AIGC动态

1个月前

新鲜出炉！斯坦福2025 CS336课程全公开：从零开始搓大模型

斯坦福大学2025年春季的CS336课程「从头开始创造语言模型」现已全面发布，课程视频和材料均可在线获取。该课程由斯坦福大学计算机科学系助理教授Tatsunori Ha...

AIGC动态

1个月前

全球首次，Transformer「混血」速度狂飙65倍！英伟达已下注

扩散建模与自回归方法的融合在语言模型领域取得突破性进展。康奈尔大学、CMU等机构的研究团队提出新型混合框架Eso-LM，首次实现并行生成与KV缓存机制的兼容，...

AIGC动态

2个月前

“多模态方法无法实现AGI”

生成式人工智能模型的成功让一些人相信人工通用智能（AGI）即将到来，但这些模型并未真正捕捉到人类智能的本质。它们之所以出现，主要是因为它们能够有效地扩...

AIGC动态

2个月前

LLM已能自我更新权重，自适应、知识整合能力大幅提升，AI醒了？

近期，关于AI自我演进的研究和讨论逐渐增多，多个机构提出了不同的自我改进框架。例如，Sakana AI与不列颠哥伦比亚大学合作的「达尔文-哥德尔机（DGM）」、CM...

AIGC动态

2个月前

「Next-Token」范式改变！刚刚，强化学习预训练来了

在人工智能领域，强化学习（RL）长期以来被视为提升模型能力的辅助工具，而非核心方法。然而，近年来，强化学习在提升大语言模型（LLMs）能力方面的作用逐渐...

AIGC动态

2个月前

大模型是「躲在洞穴里」观察世界？强化学习大佬「吹哨」提醒LLM致命缺点

加州大学伯克利分校副教授Sergey Levine近期提出一个核心疑问：为何语言模型通过预测下一个token能获得强大认知能力，而视频模型通过下一帧预测却收效甚微。...

AIGC动态

2个月前

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

语言模型对强化学习中的奖励噪音表现出显著的鲁棒性，即使奖励信号被部分翻转，模型在下游任务中的表现也不会显著下降。研究者发现，强化学习对下游任务的提...

AIGC动态

2个月前

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

Sarvam AI作为印度“IndiaAI Mission”国家级项目的首批入选公司，近期发布了名为Sarvam-M的240亿参数混合语言模型，被视为印度本土AI研究的一项突破。该模型基...

AIGC动态

2个月前

标签：语言模型

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

香港科技大学、Manycor开源空间大模型，超3000颗星

新鲜出炉！斯坦福2025 CS336课程全公开：从零开始搓大模型

全球首次，Transformer「混血」速度狂飙65倍！英伟达已下注

“多模态方法无法实现AGI”

LLM已能自我更新权重，自适应、知识整合能力大幅提升，AI醒了？

「Next-Token」范式改变！刚刚，强化学习预训练来了

大模型是「躲在洞穴里」观察世界？强化学习大佬「吹哨」提醒LLM致命缺点

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

印度国家级大模型上线两天仅 300 余次下载，投资人直呼“尴尬”：韩国大学生模型都有20万！

热门网址

标签：语言模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址