大模型
LLM,VLM,模型
逆天!Mata用13个参数26字节让模型正确率从76%飙升至91%
Meta FAIR等机构研究人员开发出一种名为TinyLoRA的极致微调技术,仅需调整13个参数(26字节)即可显著提升大语言模型的数学推理能力。该方法配合强化学习框架...
机器人GPT时刻!英伟达WAM赋予全机器人零样本操作能力
英伟达最新发布的世界动作模型DreamZero标志着机器人技术的重要突破。这款拥有14B参数的模型通过视频生成与动作预测的深度耦合,赋予机器人预测未来并指导动...
全网最详细的Codex入门教程,手把手教你玩转Vibe Coding。
作者通过亲身体验强烈推荐OpenAI的Codex编程工具,尤其是搭配GPT-5.3-codex模型的使用效果。整个周末沉浸于Vibe Coding(沉浸式编程)的体验中,通过多任务并...
2026开年关键词:Self-Distillation,大模型真正走向「持续学习」
2026年初,大模型领域的研究焦点集中在自蒸馏(Self-Distillation)技术上,这一方法被视为解决持续学习瓶颈的关键突破。传统监督微调(SFT)在模型吸收新知...
想让机器人春晚包饺子?阿里达摩院:别急,先把「大脑」优化一下
2026年春晚机器人表演包饺子的可能性较低,彩排信息显示机器人更可能承担托盘呈递等简单任务。包饺子涉及柔性物体操作和复杂动作序列,属于机器人领域的'图灵...
可灵3.0系列模型正式上线:属于每个人的导演时代来临
可灵AI 3.0系列模型的发布标志着AI视频创作进入影视级导演时代。该系列包含视频3.0、视频3.0 Omni及图片3.0、图片3.0 Omni模型,覆盖从生成到后期的全流程链...
清华刘知远团队论文:最小化结构改动,短文本到长文本丝滑升级 | ICLR 2026
InfLLM-V2通过最小结构扰动实现大模型从短上下文到长上下文的平滑升级。随着大语言模型应用场景的复杂化,传统4k或8k序列长度已无法满足长文档理解、跨轮对话...
数亿元!上交大AI学院副院长造机器人大脑,多家海外资本投了
穹彻智能近期宣布完成数亿元A轮融资,由C资本领投,Sea Limited、普华资本等多家机构跟投,老股东沙特阿美旗下Prosperity7 Ventures超额追加投资。该公司成立...
GitHub开源项目shannon星标飙升,漏洞发现成功率96.15%
GitHub开源社区近期涌现出一款名为shannon的AI驱动安全工具,该项目由KeygraphHQ团队开发,自2025年9月27日开源以来已获得超过1.6万星标,单日新增4195颗星标...
硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law
硅谷的算力竞争已从GPU数量转向电力资源的争夺,OpenAI和马斯克的xAI等巨头正投入万亿级资金建设超大规模算力集群。然而,Anthropic的研究揭示了一个关键问题...







