训练AI,然后被裁?Uber AI项目突遭裁员,零工、博士都没留下来
Uber近期裁撤了其AI训练计划“Project Sandbox”的部分项目成员,即便承诺的工作期限尚未到期,雇员仍因“客户内部优先事项变化”被提前终止合同。值得注意的是,...
当推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新成果TagCF
推荐系统长期以来主要依赖对用户兴趣内容的统计建模,却忽略了用户角色这一关键因素。快手消费策略算法团队联合多方提出的TagCF框架,通过引入用户角色(user...
月之暗面公开强化学习训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
月之暗面联合清华大学提出的全新加速引擎Seer,通过创新技术显著提升大语言模型(LLM)的强化学习训练效率。该系统针对传统RL训练中生成阶段(rollout phase...
沐瞳再传「被出售」,字节游戏还有「新故事」可讲吗?
字节跳动正与沙特游戏基金Savvy Games Group重启谈判,计划出售旗下游戏子公司上海沐瞳科技。 Savvy Games Group由沙特公共投资基金全资控股,近期以550亿美...
腾讯开源 HunyuanOCR,用纯粹视觉语言模型架构,仅1B参数刷新多项高阶任务SOTA
腾讯HunyuanOCR通过创新的端到端视觉语言模型架构,仅用10亿参数便解决了传统OCR系统的级联误差与通用大模型效率低下的双重难题。该系统摒弃了传统多模块串联...
抱歉了Chrome,这次我选中国这款AI浏览器
夸克浏览器近日完成全面升级,深度融合阿里千问AI助手,推出具备操作系统级全局唤起能力的新一代AI浏览器。此次升级的核心在于将AI能力深度嵌入浏览器,用户...
Adam的稳+Muon的快?华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境
在LLM优化领域,传统方法如Adam和新兴方法Muon各有优劣。Adam凭借动量和自适应学习率成为深度学习的主流选择,但在处理十亿级参数的混合精度训练时存在数值不...
从代码补全到真实软件的生产级工具:Qoder 如何改写 AI 编程规则
2025年AI编程领域正经历从技术演示向生产级应用的关键转型。当前市场宣传多聚焦于生成简单Demo的能力,但实际开发中80%的价值来自对既有工程的迭代优化。专业...
从游戏工厂到空间智能仿真:混元 3D 为何是腾讯 AI 的“侧翼突围”
中国科技企业腾讯近期在3D生成领域取得显著进展,其混元3D创作引擎国际版正式发布,API同步上线腾讯云国际站。 与此同时,开源版混元3D的全球下载量突破300万...
单卡跑出集群效率!Hugging Face TRL 与 RapidFire AI 的超并行革命
Hugging Face的TRL库与RapidFire AI的集成标志着大模型开发进入超并行时代。单张GPU可同时运行多个微调实验,实验验证速度提升16至24倍,显著降低算力门槛。...