大模型

LLM,VLM,模型

科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生

大语言模型的发展迅速,后训练的强化学习算法不断演进。从 PPO 到 GRPO 再到后续改进算法,都在不断提升模型性能与稳定性。后训练与强化学习的重要性:大语言...

Meta联手UCSD发布DeepConf:计算成本暴降85%,99.9%准确率!

在人工智能领域,Meta AI 联合加州大学圣地亚哥分校推出的“DeepConf”新技术,为解决 AI 高难度推理难题带来了新突破。该技术解决了让 AI 在高难度推理中保持...

那天,AI大模型想起了,被「失忆」所束缚的枷锁

大语言模型(LLM)的记忆能力是其进一步发展和广泛应用的关键。近期,谷歌、Anthropic、OpenAI、xAI 等公司纷纷为旗下的模型赋予记忆功能,字节跳动等也发布...

对话众擎赵同阳:人形机器人公司账面没有50亿,就很危险了

众擎作为人形机器人本体厂商,与宇树常被比较,但实则有所不同。众擎创始人赵同阳有丰富商业经验,已坚持做人形机器人10年,他对行业有着独特见解。在产品矩...

马斯克亲口证实xAI代码库被盗!涉案前员工被起诉,已跳槽OpenAI

马斯克自曝xAI整个代码库被偷走,xAI起诉离职员工Xuechen Li窃取商业机密,该员工已跳槽到OpenAI,但被告员工和OpenAI均未置评。值得注意的是,窃密事件发生...

AI 研发提效进行到哪儿,谁来守住质量底线?

AI在研发领域的应用日益广泛,引发了研发方式的变革,同时也带来了新的挑战和机遇。以下是本次直播讨论的主要内容:AI在研发中的角色演变AI在研发中的应用经...

高效大规模创新3D重建模型iLRM

AIGC领域聚焦大语言模型发展与应用落地,而在3D建模方面,基于前馈网络的方法受关注,但多数基于Transformer架构的模型处理多视图输入时存在可扩展性问题,计...

LLM也具有身份认同?当LLM发现博弈对手是自己时,行为变化了

哥伦比亚大学与蒙特利尔理工学院的研究者 Olivia Long 和 Carter Teplica 通过研究项目,揭示了大型语言模型(LLM)在不同环境下的身份认知对其合作倾向的影...

从“造工具”到“用仓库”:RepoMaster,驾驭GitHub解决复杂任务的智能体大师!

GitHub拥有庞大的开源代码仓库,但开发者复用代码时面临诸多挑战。为解决这一问题,中科院、清华等机构与QuantaAlpha等团队联合推出了RepoMaster,旨在让AI智...

Claude Code 的设计哲学:Keep Things Simple

Claude Code 是一款实用且让人上瘾的 AI 编程助手,其好用的关键在于保持简单的设计理念,以下是从它学到的可应用于自己系统的主要经验:1. 极简主义: - ...
1 237 238 239 240 241 912