大模型

逆天！Mata用13个参数26字节让模型正确率从76%飙升至91%

Meta FAIR等机构研究人员开发出一种名为TinyLoRA的极致微调技术，仅需调整13个参数（26字节）即可显著提升大语言模型的数学推理能力。该方法配合强化学习框架...

AIGC动态

4周前

英伟达最新发布的世界动作模型DreamZero标志着机器人技术的重要突破。这款拥有14B参数的模型通过视频生成与动作预测的深度耦合，赋予机器人预测未来并指导动...

AIGC动态

4周前

作者通过亲身体验强烈推荐OpenAI的Codex编程工具，尤其是搭配GPT-5.3-codex模型的使用效果。整个周末沉浸于Vibe Coding（沉浸式编程）的体验中，通过多任务并...

AIGC动态

4周前

2026年初，大模型领域的研究焦点集中在自蒸馏（Self-Distillation）技术上，这一方法被视为解决持续学习瓶颈的关键突破。传统监督微调（SFT）在模型吸收新知...

AIGC动态

4周前

2026年春晚机器人表演包饺子的可能性较低，彩排信息显示机器人更可能承担托盘呈递等简单任务。包饺子涉及柔性物体操作和复杂动作序列，属于机器人领域的'图灵...

AIGC动态

4周前

可灵AI 3.0系列模型的发布标志着AI视频创作进入影视级导演时代。该系列包含视频3.0、视频3.0 Omni及图片3.0、图片3.0 Omni模型，覆盖从生成到后期的全流程链...

AIGC动态

4周前

InfLLM-V2通过最小结构扰动实现大模型从短上下文到长上下文的平滑升级。随着大语言模型应用场景的复杂化，传统4k或8k序列长度已无法满足长文档理解、跨轮对话...

AIGC动态

4周前

穹彻智能近期宣布完成数亿元A轮融资，由C资本领投，Sea Limited、普华资本等多家机构跟投，老股东沙特阿美旗下Prosperity7 Ventures超额追加投资。该公司成立...

AIGC动态

4周前

GitHub开源社区近期涌现出一款名为shannon的AI驱动安全工具，该项目由KeygraphHQ团队开发，自2025年9月27日开源以来已获得超过1.6万星标，单日新增4195颗星标...

AIGC动态

4周前

硅谷的算力竞争已从GPU数量转向电力资源的争夺，OpenAI和马斯克的xAI等巨头正投入万亿级资金建设超大规模算力集群。然而，Anthropic的研究揭示了一个关键问题...

AIGC动态

4周前