大模型

科普向：一文解构大模型后训练，GRPO和它的继任者们的前世今生

大语言模型的发展迅速，后训练的强化学习算法不断演进。从 PPO 到 GRPO 再到后续改进算法，都在不断提升模型性能与稳定性。后训练与强化学习的重要性：大语言...

AIGC动态

8个月前

在人工智能领域，Meta AI 联合加州大学圣地亚哥分校推出的“DeepConf”新技术，为解决 AI 高难度推理难题带来了新突破。该技术解决了让 AI 在高难度推理中保持...

AIGC动态

8个月前

大语言模型（LLM）的记忆能力是其进一步发展和广泛应用的关键。近期，谷歌、Anthropic、OpenAI、xAI 等公司纷纷为旗下的模型赋予记忆功能，字节跳动等也发布...

AI-Agent

8个月前

众擎作为人形机器人本体厂商，与宇树常被比较，但实则有所不同。众擎创始人赵同阳有丰富商业经验，已坚持做人形机器人10年，他对行业有着独特见解。在产品矩...

AIGC动态

8个月前

马斯克自曝xAI整个代码库被偷走，xAI起诉离职员工Xuechen Li窃取商业机密，该员工已跳槽到OpenAI，但被告员工和OpenAI均未置评。值得注意的是，窃密事件发生...

AIGC动态

8个月前

AI在研发领域的应用日益广泛，引发了研发方式的变革，同时也带来了新的挑战和机遇。以下是本次直播讨论的主要内容：AI在研发中的角色演变AI在研发中的应用经...

AI-Agent

8个月前

AIGC领域聚焦大语言模型发展与应用落地，而在3D建模方面，基于前馈网络的方法受关注，但多数基于Transformer架构的模型处理多视图输入时存在可扩展性问题，计...

AIGC动态

8个月前

哥伦比亚大学与蒙特利尔理工学院的研究者 Olivia Long 和 Carter Teplica 通过研究项目，揭示了大型语言模型（LLM）在不同环境下的身份认知对其合作倾向的影...

AIGC动态

8个月前

GitHub拥有庞大的开源代码仓库，但开发者复用代码时面临诸多挑战。为解决这一问题，中科院、清华等机构与QuantaAlpha等团队联合推出了RepoMaster，旨在让AI智...

AI-Agent

8个月前

Claude Code 是一款实用且让人上瘾的 AI 编程助手，其好用的关键在于保持简单的设计理念，以下是从它学到的可应用于自己系统的主要经验：1. 极简主义： - ...

AI-Agent

8个月前