大模型
LLM,VLM,模型
斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出
Adam 及其改进版 AdamW 自 2014 年提出后,长期主导开放权重语言模型预训练。随着模型规模扩大,预训练计算开销增大,优化器设计对收敛速度与计算成本至关重...
长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman
随着内容创作智能化需求增长,长时长、高质量数字人视频生成成为行业痛点。字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型...
抱上Meta“大腿”后,自家公司要搞黄了?Scale AI狂丢大客户,又遭6年老员工“背刺”
9月3日,由Meta支持的人工智能数据标注公司Scale AI对前销售员工Eugene Ling及竞争对手Mercor提起诉讼。Scale AI以“盗用商业秘密”起诉Mercor,以“违反合同”起...
人形机器人终于学会洗碗了
Figure机器人技能不断升级,继展示物流场景包裹分拣、学会叠毛巾和衣服后,现在还能将餐具装入洗碗机。不过前提是需有一台洗碗机,且此次使用的仍是叠毛巾和...
美团也开源了大模型,但我觉得他们的野心是通用生活Agent。
美团发布并开源了560B参数的MoE模型LongCat - Flash - Chat,开源地址为https://github.com/meituan-longcat/LongCat-Flash-Chat ,还有线上体验地址https://...
极佳科技朱政:世界模型会进化成 VLA 的下一代|具身先锋十人谈
具身智能领域的数据问题一直是行业难题,真机数据成本高、效率低,仿真数据存在 Sim2Real 鸿沟,而世界模型成为解决这一问题的新探索方向。CV 研究者朱政从自...
Copilot强塞马斯克Grok新模型,遭开发者集体“抵抗”!GitHub内部工程师曝:我们是被“胁迫”的
微软旗下协作式编程平台 GitHub 深化与埃隆·马斯克旗下 xAI 公司的合作,将 xAI 的 Grok Code Fast 1 大型语言模型早期使用权整合到 GitHub Copilot 中,此举...
实测美团 LongCat:快到极致,但是别说追平 DeepSeek
近期美团的 LongCat-Flash-Chat 模型频频刷屏,有说法称其已追平 DeepSeek-V3.1。AI 科技评论实测后发现,两款模型风格差异明显,也引出了模型在真实应用中速...
他不懂代码,却用 AI 黑掉 17 家医院和机构,Vibe Hacking 让全世界变成缅北
AI网络犯罪已进入全自动时代,Vibe-Hacking(氛围黑客)作为新兴的犯罪形式,正带来前所未有的威胁。Vibe-Hacking 源于 Vibe-Coding(氛围编程)与「暗黑大模...
从复刻魔术开始,RoboMirage打开了机器人仿真的新世界
具身智能发展中,获取海量高质量数据是核心问题,现实中收集数据代价高,而仿真环境能让智能体低成本、高效率积累交互经验,过去几年仿真器成为具身智能发展...