AI每日精选摘要

AI精选资讯6小时前更新 admin
317,996 5 5
AI每日精选摘要

❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️


◈ 11月28日 星期五 【 10 篇 】

华为放出「准万亿级MoE推理」大招,两大杀手级优化技术直接开源


2025年标志着大模型从单点工具向业务系统底层基础设施的转型,其中推理效率成为决定模型能否实际落地的关键因素。超大规模混合专家(MoE)模型面临计算、通信、访存等多维挑战,亟需系统性解决方案。华为推出的openPangu-Ultra-MoE-718B-V1.1模型及其配套技术栈,通过昇腾亲和加速技术将硬件算力利用率提升至86%,为行业提供了生产级部署的可行性路径。
推理效率的核心矛盾在于成本与性能的平衡。训练阶段关注模型能力扩展,而推理阶段需解决低延迟、高稳定性的运行需求。MoE模型在发挥芯片组网优势的同时,其复杂推理链路中的算子性能、通信掩盖、系统调度等环节均可能成为瓶颈。华为通过Omn…

来源:AI每日精选摘要  机器之心

微软Fara-7B计算机操作模型,开启端侧智能代理新时代


微软发布了专为计算机操作设计的70亿参数智能代理Fara-7B,该模型通过纯视觉感知和合成数据训练,在端侧实现了高效能与安全性。与传统聊天机器人不同,Fara-7B能够像人类一样操作鼠标和键盘,在复杂网页环境中完成任务。其轻量级设计不仅性能对标更大模型,还解决了云端模型的响应延迟、隐私泄露和高昂推理成本三大痛点,成为微软探索小语言模型潜力的重要里程碑。
Fara-7B的核心创新在于纯视觉感知的人机交互逻辑。模型完全依赖屏幕截图进行决策,摒弃了传统依赖网页代码结构的方式,实现了与人类视觉体验一致的操作模式。基于Qwen2.5-VL-7B构建的Fara-7B具备128k token上下文处理能…

来源:AI每日精选摘要  AIGC开放社区

亚马逊研究奖获奖名单出炉:王晋东等26位华人入选


亚马逊研究奖(ARA)2025年春季获奖名单公布,共有63位研究者获奖,其中26位为华人学者,覆盖8个国家的41所大学。该奖项设立于2015年,旨在支持多学科前沿研究,获奖者可获得资金支持、访问亚马逊700多个公共数据集、AWS AI/ML服务资源,以及与亚马逊专家合作的机会。
在AI信息安全领域,8位获奖者中有3位华人学者。加州大学欧文分校的李洲专注于利用大语言模型(LLM)实现精确的攻击溯源;弗吉尼亚大学的孟瑜研究弱监督强化学习中的偏好模糊性建模;东北大学的赵子铭探索大语言模型的可解释漏洞检测与修复。
亚马逊广告研究方向有两位华人获奖者:伊利诺伊大学的Xiaojing Lia…

来源:AI每日精选摘要  机器之心

夸克AI浏览器来了!深度融合千问,迎来“Chrome级”进化时刻


夸克浏览器宣布全面进化为新一代「AI浏览器」,深度融合阿里千问AI助手,并发布六大AI套件,目标直指Chrome。这一升级标志着中国浏览器首次真正进入全球AI浏览器竞争的主战场。夸克将Qwen最强模型接入浏览器底层,实现系统级全局AI能力,用户无需切换标签或应用即可随时唤起千问助手,完成对话、总结、翻译等任务,开创了“边浏览边对话、边看边总结、即问即答”的全新交互体验。
在全球浏览器向AI操作层迈进的趋势下,夸克以阿里Qwen大模型为技术底座,展现了国产浏览器的技术实力。Qwen模型家族在全球榜单、开源生态和多模态能力上表现突出,其复杂决策与多变量推理能力已通过真实投资比赛验证。夸克此次升…

来源:AI每日精选摘要  量子位

阿里夸克AI眼镜打破“续航焦虑”,南芯科技推动超长续航革命


近年来,AI技术的发展重心正从算力基础设施向终端侧转移,AI眼镜作为集视觉、听觉、语音等人体重要感知交互于一体的端侧硬件,已成为AI技术落地应用的最佳载体之一。随着行业加速从概念探索走向实用,以及资本的加速涌入,这条被视作“下一代主流计算终端”的赛道已集结Meta、苹果、华为、百度、小米等科技巨头。阿里近期强势入局,推出首款自研“夸克AI眼镜”,凭借双芯片架构和深度整合的阿里应用生态,聚焦“长续航”核心亮点,精准解决用户电量焦虑痛点。
夸克AI眼镜采用双电池架构搭配可拆卸镜腿设计,支持热插拔快速换电,配套换电仓、眼镜盒充电等多重补能方案,实现“24小时不间断使用”的承诺。这一创新设计既解决…

来源:AI每日精选摘要  半导体行业观察

谷歌AI封神五年!AlphaFold狂揽诺奖,2亿蛋白结构全预测


50年的蛋白质结构难题被AI技术AlphaFold彻底改变,将传统耗时数年的实验过程压缩至几分钟。这项突破性工具已被全球330万研究者使用,其中超过100万来自中低收入地区,显著降低了科研门槛。土耳其两名本科生借助这一免费工具完成了15篇膜蛋白结构研究,而传统方法需要顶尖实验室和数年时间。AlphaFold不仅解决了蛋白质折叠问题,还通过预测超过2亿个结构,将结构生物学从依赖实验验证的领域转变为探索性学科。
AlphaFold2在2020年CASP14竞赛中首次展示其能力,仅凭氨基酸序列就能准确预测蛋白质三维结构。其预测结果与传统实验方法获得的图像高度吻合,使科学家能够快速获取复杂蛋白如p…

来源:AI每日精选摘要  新智元

1.4nm争霸战,打响!


全球半导体产业正围绕2nm工艺节点展开一场资本与国家战略的激烈竞赛。台积电、英特尔、三星和日本Rapidus等企业纷纷加大投入,试图在这一关键制程上占据优势。2nm工艺被视为AI时代算力主权的门槛,其重要性不仅体现在技术层面,更涉及地缘政治和产业链安全。
台积电在台湾本土加速布局2nm产能,计划建设多达10座晶圆厂,总投资规模巨大。这些工厂将主要服务于AI GPU、高端CPU和手机SoC等头部客户,确保其在先进制程领域的领先地位。同时,台积电也在美国、日本和德国等地推进海外项目,以平衡地缘政治风险。其策略是将最先进的2nm和1.4nm技术保留在台湾本岛,海外工厂则主要用于满足当地客户需求。…

来源:AI每日精选摘要  半导体行业观察

AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金


2025年下半年,输入法赛道因大模型技术的爆发迎来新一轮竞争热潮。国内外厂商密集发布新产品:字节的豆包输入法结束内测正式上线,微信输入法持续迭代AI功能,智谱启动AI输入法内测;海外Wispr完成2500万美元A轮融资,Typeless在Product Hunt登顶。这些产品虽同属语音输入领域,但可分为三大阵营:桌面端SaaS派(Wispr、Typeless)专注办公场景,移动端大厂派(豆包、微信)覆盖社交生态,小成本极客派(闪电说等)走本地化路线。
主观体验测试显示,豆包输入法在移动端表现最佳,其中文语音识别速度和准确率碾压竞品,但功能相对简单;Typeless在桌面端输出质量最优,能自…

来源:AI每日精选摘要  Founder Park

MIT神经科学家发现,人类智能与人工智能在严酷的逻辑法则面前惊人地重合


MIT神经科学家的最新研究发现,新一代AI推理模型在解决复杂问题时的思维代价分布与人类大脑高度吻合。这一突破性成果发表在《美国国家科学院院刊》上,揭示了不同智能形态在面对逻辑挑战时可能遵循着同一套基于物理限制的最优解策略。研究团队通过七种不同认知维度的实验任务,发现人类和AI在任务难度与计算资源消耗之间呈现出惊人的同步性。
研究揭示了智能系统处理复杂问题的通用规律:基础算术对两种智能都构成最低负荷,而抽象推理测试(如ARC挑战)则都需要最高计算投入。这种一致性表明,问题本身的客观复杂度决定了不同智能系统必须付出相应量级的计算代价。值得注意的是,这种趋同现象并非人为设计的结果,而是系统在追求…

来源:AI每日精选摘要  AIGC开放社区

从游戏工厂到空间智能仿真:混元 3D 为何是腾讯 AI 的“侧翼突围”


中国科技企业腾讯近期在3D生成领域取得显著进展,其混元3D创作引擎国际版正式发布,API同步上线腾讯云国际站。 与此同时,开源版混元3D的全球下载量突破300万次,标志着腾讯在3D生成技术领域的全球影响力正在快速提升。这一进展不仅体现了腾讯在AI领域的战略布局,更揭示了3D生成技术正在从游戏行业向更广泛的商业领域渗透。
腾讯的独特优势在于其”业务—技术—生态”三位一体的能力结构。作为同时拥有需求端(游戏、地图导航、AR/VR等海量3D需求)、技术端(混元大模型的多模态能力)和生态端(微信、QQ、腾讯云构成的覆盖C端和B端的分发网络)的科技公司,腾讯在3D生成的商业化落地中展现出强大的场景穿…

来源:AI每日精选摘要  AI前线

◈ 11月25日 星期二 【 9 篇 】

单卡跑出集群效率!Hugging Face TRL 与 RapidFire AI 的超并行革命


Hugging Face的TRL库与RapidFire AI的集成标志着大模型开发进入超并行时代。单张GPU可同时运行多个微调实验,实验验证速度提升16至24倍,显著降低算力门槛。这一技术融合重构了后训练阶段的工作流,使个人开发者和中小团队能够用消费级显卡完成过去需要集群才能承担的超参数搜索任务。
当前大模型开发重心已从预训练转向后训练阶段,包括监督微调、直接偏好优化和群组相对策略优化等。这些任务对精细化操作要求极高,超参数选择直接影响模型性能。学习率设定、LoRA秩选择、批次大小与梯度累积步数组合等变量构成了巨大的搜索空间。传统串行试错模式反馈周期长,一天仅能验证3到4个想法,迫使开发者…

来源:AI每日精选摘要  AIGC开放社区

工作场景AI化,一个月花100美元订阅AI工具值吗?


大模型与智能体的崛起正在重塑生产力的底层逻辑,推动个体工作效率和组织协作模式的深度变革。多位行业专家在AICon全球人工智能开发与应用大会的讨论中,揭示了AI时代「10x个体」与「10x组织」的全新特征与发展路径。
「10x个体」的核心特征已从传统编码能力转向系统性解决问题能力。阿里巴巴汤威指出,真正的效率提升者善于突破角色边界,能清晰定义业务问题并协调多智能体达成目标。这类个体展现出三大特质:快速理解核心问题的洞察力、灵活运用各类工具的适应力,以及贯穿产品全生命周期的闭环思维。美团邹明远补充道,角色边界弱化使产品经理能独立完成小需求,后端工程师可编写前端代码,协作链条的简化带来超线性效率…

来源:AI每日精选摘要  AI前线

Gemini 3,是谢尔盖・布林「骂」出来的?


当ChatGPT在2022年底横空出世时,整个科技行业都受到巨大冲击,而谷歌却因反应迟缓而备受质疑。尽管拥有深厚的技术积累,谷歌最初未能及时推出匹配的产品,匆忙推出的Bard也因表现不佳引发新一轮批评。面对OpenAI接连推出爆款产品的竞争压力,谷歌创始人谢尔盖・布林以”创始人模式”回归,亲自参与技术工作,并推动内部重大变革,包括合并Google Brain与DeepMind为Google DeepMind。布林的回归被视作拯救谷歌的关键转折点。
布林在最近一次采访中透露,他曾因Gemini被禁止用于写代码而与公司内部官僚体系发生激烈冲突。这一事件暴露出谷歌内部流程僵化、规则冗余和定位不准…

来源:AI每日精选摘要  机器之心

谁按下了Usmile的暂停键?


Usmile作为电动牙刷行业的龙头企业,曾占据近30%的市场份额,营收规模超过30亿,利润率高达15%。然而,从2023年开始,其增长陷入瓶颈,核心团队分崩离析,资本相继离场。这一现象的背后,反映了小家电行业普遍面临的“第二增长曲线”难题。
组织力的缺失是Usmile发展的最大症结。创始人陈建群兄弟掌握绝对话语权,但认知局限导致顶尖人才难以引入。高管流动频繁,部门负责人更换周期短至半年。价值分配不合理进一步加剧了人才流失,创始人更倾向于控股而非股权激励,导致老员工对上市失去信心。此外,公司内部存在利益团体矛盾,早期员工掌握核心资源却能力不足,甚至影响上市进程。
在产品层面,Usm…

来源:AI每日精选摘要  雷峰网

历史性对决!硅基生命「上岗」大考,上海设下终极考场


2025年12月12日,上海将举办GDPS 2025全球开发者先锋大会暨国际具身智能技能大赛,标志着人工智能从虚拟交互迈向物理世界落地的关键转折。这场赛事首次在具身智能领域全方位对标「世界技能大赛」,通过六大赛道验证硅基智能体在真实场景中的能力。不同于传统技术竞赛,本次大赛创新性地引入「碳基匠心」评判体系——由AI科学家与世界技能大师组成混合裁判团,既考核算法的鲁棒性,也评估机器行为是否符合人类社会的细腻标准。
大赛设立工业制造、社会服务、居家服务、应急救援、医疗康养、演绎竞技六大核心赛道,对应具身智能未来可能渗透的完整社会分工。在精密装配、花艺创作、家庭护理、火灾救援等19个赛项中,参赛…

来源:AI每日精选摘要  新智元

卫星通信,这颗芯片很重要


近年来,全球范围内对空中发展的关注度显著提升,低空经济成为新兴焦点。低地球轨道(LEO)卫星技术的进步推动了卫星通信(SATCOM)行业的快速增长,尤其在偏远地区和移动场景中需求迫切。与此同时,电动垂直起降飞行器(eVTOL)技术的普及进一步加速了低空经济的发展。据赛迪研究院预测,中国低空经济市场规模将在2025年达到1.5万亿元,2035年有望突破3.5万亿元,展现出巨大的市场潜力。
实现低空经济的目标离不开全域、实时、可靠的通信连接。低空通信主要分为两类:低轨卫星通信和eVTOL飞行时的实时连接。前者通过轨道卫星中继信号,后者则需确保飞行器在低空保持稳定通信。这两种方式均要求通信系统具…

来源:AI每日精选摘要  半导体行业观察

Google又发布了一篇可能改变AI未来的论文,这次它教AI拥有了记忆。


Google Research近期发表的论文《Nested Learning: The Illusion of Deep Learning Architectures》提出了一种突破性框架,旨在解决当前大模型存在的“顺行性遗忘”问题。这一缺陷表现为模型无法将交互中获得的新知识转化为长期记忆,导致每次对话都像重启一个“出厂设置”的AI。
论文的核心观点是借鉴人脑的多层次记忆机制。人类记忆分为高频(短期反应)、中频(战术决策)和低频(战略巩固)系统,而现有Transformer架构却是单频的——训练后参数完全冻结,无法动态更新。作者提出的“嵌套学习”(Nested Learning)框架…

来源:AI每日精选摘要  数字生命卡兹克

BFM-Zero,让人形机器人不再依赖高质量动捕数据


CMU与Meta研究团队合作,清华姚班李忆唐作为第一作者提出的最新论文成果,为解决人形机器人从仿真环境到现实世界的跨域能力提供了创新方案。该研究通过无监督预训练构建统一潜在空间,使机器人能够在不依赖精细规则或昂贵数据的情况下,实现真实场景中的稳定、自然和可靠表现。核心方法是将奖励、姿态、动作序列等任务提示压缩到同一潜在空间中,机器人仅需生成合适的潜在向量即可零样本执行动作,并在面对扰动时快速恢复稳定。
实验分为仿真环境测试、真实机器人部署及快速适应三部分。在仿真阶段,模型在Isaac和Mujoco两种物理特性差异较大的环境中表现出色,动作跟踪误差控制在可接受范围,目标姿态到达任务尤为稳健,…

来源:AI每日精选摘要  AI科技评论

对话Articuler:做职业社交里的Tinder


Articuler创始人Jason将公司定义为“职业社交里的Tinder”,强调其核心是通过高效匹配技术重塑职场陌生人社交场景。与传统职场社交平台不同,Articuler专注于跳过N度人脉关系,直接连接“本该相遇”的陌生人,这种理念源自对用户底层需求的洞察——优秀的产品应隐藏技术痕迹,专注解决实际痛点。
该平台通过三大AI驱动模块构建闭环服务。人脉搜索系统覆盖全网公开数据,预估可触达9.8亿人才池,结合封闭式提问与自然语言处理技术精准定位目标。匹配环节采用动态赋分机制,AI生成的千人千面Profile不仅包含基础标签,更通过深度数据挖掘形成结构化报告,其PlayBook功能甚至能指导用户撰…

来源:AI每日精选摘要  硅星人Pro

◈ 11月24日 星期一 【 10 篇 】

透视外卖账本:京东被「暴击」,阿里方向转移


外卖与即时零售行业的竞争已进入白热化阶段,头部平台的巨额亏损与市场份额争夺成为焦点。京东、阿里、美团三大巨头在2025年第三季度的战况显示,补贴战带来的财务压力远超预期。京东新业务单季度亏损达157亿元,其中外卖业务日均亏损1.5亿以上;阿里旗下淘宝闪购同期亏损预估350-400亿元,美团亏损亦达150-200亿。高盛等机构数据显示,行业整体亏损规模已突破千亿,但订单量增长并未带来盈利改善,京东市场份额跌至8%,而阿里与美团日均单量维持在7000-8000万单。
效率差异成为竞争关键变量。美团凭借成熟的履约体系,单均亏损控制在1-2元,而淘宝闪购单均亏损峰值达5元,两者效率差扩大至3-…

来源:AI每日精选摘要  雷峰网

对话原子重塑:3D打印用户不是只喜欢4色模型,是硬件限制了内容生态


原子重塑公司近期推出的12喷嘴3D打印机原型引发了行业广泛关注,其创新方案试图解决多色打印效率低和材料浪费的核心痛点。“做产品就要做一个用户真正满意的,而不是做一个将就的产品”的理念贯穿了该公司的产品开发逻辑。团队选择“轮盘喷嘴库”方案,通过12个独立喷嘴实现多材料打印,避免了传统共用一个喷嘴导致的堵塞问题,同时优化了成型空间和工业设计。
面对拓竹等强劲对手,原子重塑采取了差异化竞争策略。“用户是期望有更多选择,使他们的创意能够更好地落地”,这一认知促使团队在产品定义阶段就瞄准了多材多彩的打印需求。技术方案上,固定热端设计和轮盘系统结构既保证了快速加热,又解决了空间占用问题。团队在控制算法…

来源:AI每日精选摘要  雷峰网

一人干翻一个剧组!北大哲学博士造出AI神器,20万人在排队用


AI工具Elser.AI通过降低创作门槛,将短剧和动漫制作流程简化为可交互的模块化操作,使非专业用户也能快速生成个性化视频内容。该系统支持从文本输入到角色设计、分镜调整、后期剪辑的全流程控制,尤其强调创作者对人物形象、镜头语言等细节的自主调节能力。核心功能包括通过prompt修改角色特征、内置选项调整运镜构图,以及允许随时回溯修改的灵活性。该工具已吸引20万全球活跃用户,主要集中在短剧和动漫领域的专业团队及个人创作者群体。
技术实现层面,Elser.AI的创新性体现在将传统影视工业的线性流程转化为可逆的数字化创作循环。其分镜故事板功能整合了构图、景深、机位等专业参数,使导演思维能够通过可视…

来源:AI每日精选摘要  新智元

主流开源大模型生态解析


开源生态已成为驱动AI领域发展的核心力量,2025年全球开源大模型形成了由Llama、GLM、Qwen和DeepSeek构成的”四强争霸”格局。Meta的Llama系列作为开源世界的奠基者,通过宽松许可证和完善工具链确立了生态标准,但其领先地位正面临中国力量的挑战。阿里巴巴的Qwen系列展现出”军团式”技术布局,其Qwen3模型在LMSYS Chatbot Arena中斩获全球第三,并在数学、代码等5项关键能力上取得第一。创业公司DeepSeek则以极致效率著称,其MoE架构模型显著降低推理成本,代码生成能力曾超越GPT-4。智谱的GLM-4.5创新性地原生融合智能体架构,在12项评测中获国…

来源:AI每日精选摘要  AIGC开放社区

“贴牌”AI产品溢价高达千倍!200家公司被曝仅18家真创新、38家代码相似度超 90%,创始人只想“忽悠”到底?


Reddit前CEO黄易山关于AI初创公司可能被基础模型提供商碾压的观点引发广泛讨论,马斯克也对此表示认同。一项针对200家获得融资的AI初创公司的调查揭示了行业内的严峻现实:73%的公司产品实际上是基于第三方API的封装,其中ChatGPT成为绝对核心,Claude则在多个应用场景中广泛渗透。真正进行技术创新的公司仅有18家。
调查由软件工程师Teja Kusireddy通过标准浏览器开发工具对公开网站进行被动观测完成,结果显示营销宣传与技术落地之间存在巨大差距。令人担忧的是,有12家公司甚至将API密钥直接暴露在前端代码中。调查曝光后,多位创始人联系Kusireddy,其中有人坦言”知…

来源:AI每日精选摘要  AI前线

训个“逆天改命”的模型,拯救公司也顺手重塑AI 3D |对话影眸


2023年,影眸科技面临资金链断裂危机时,创始人吴迪和张启煊做出了一个关键决策:放弃短期盈利的“穹顶光场”扫描服务,全力投入训练全球首个原生3D生成模型Rodin。这一赌注直接挑战了当时行业主流的“2D升维”技术路线,选择了一条公认更艰难但潜力更大的原生3D训练路径。
团队的技术积累始于上海科技大学MARS实验室。早期开发的“穹顶光场”采用光度立体法,能在0.1秒内捕捉面部微观细节;爆款APP WAND曾登顶中日应用商店榜首,却因GAN技术局限被主动放弃;ChatAvatar产品则验证了文字生成3D形象的可行性。这些探索最终汇聚成Rodin模型的核心架构——基于Transformer的CL…

来源:AI每日精选摘要  硅星人Pro

Anthropic 的报告闻起来像狗屁


Anthropic公司近期发布的关于AI自动化网络攻击的报告引发了广泛争议。该报告声称发现一个黑客组织利用其Claude AI工具对30家企业发动攻击,其中80-90%的攻击由AI自主完成,这一惊人论断迅速被主流媒体渲染为”AI黑客时代”的到来。然而,网络安全专业人士djnn.sh通过系统性质疑揭示了报告存在的严重问题。
报告缺乏威胁情报行业要求的关键技术证据。根据行业标准,合格的威胁报告应包含IOCs(威胁指标)、具体工具、攻击手法、时间线和防御建议等可验证信息。法国CERT发布的APT28报告就是范例,详细列出钓鱼邮件地址、源IP等具体数据。相比之下,Anthropic的报告未提供任何…

来源:AI每日精选摘要  硅星人Pro

EUV光刻机“秘史”!


光刻技术作为半导体制造的核心工艺,其发展历程直接推动了摩尔定律的实现。从20世纪70年代至今,晶体管尺寸从约10000纳米缩小至20-60纳米,这一突破主要依赖于光刻技术的持续创新。极紫外(EUV)光刻技术作为当前最先进的解决方案,使用13.5纳米波长的光源,其商业化应用标志着半导体制造进入新纪元。
EUV技术的研发历程揭示了创新生态系统的复杂性。尽管美国研究机构如DARPA、贝尔实验室和国家实验室投入数十年时间与数亿美元资金,但最终由荷兰ASML公司实现商业化。这一现象源于1990年代的关键决策:当美国能源部终止资助时,英特尔牵头成立EUV-LLC联盟,选择与中立的ASML合作而非日本竞…

来源:AI每日精选摘要  半导体行业观察

入侵30家大型机构、Claude自动完成90%?Anthropic 被质疑,Yann LeCun:他们利用可疑的研究来恐吓所有人


Anthropic研究人员报告发现首个由AI协同操作的网络攻击行动,称黑客利用其Claude AI工具自动化完成90%的攻击流程,仅在4-6个关键节点需要人工干预。该公司强调,这种AI Agent化能力标志着网络安全进入新阶段,系统可长期自主运行并完成复杂任务。但报告引发行业广泛质疑,外部专家认为其缺乏实质性证据,更像是营销噱头而非严谨研究。
技术社区对报告的严谨性提出尖锐批评。图灵奖得主Yann LeCun指出,此类研究可能被用于推动行业垄断性监管,而AnswerDotAI联合创始人Jeremy Howard则暗示这是企业游说政府的策略。独立测试显示,Claude自身也无法从公司报告中找…

来源:AI每日精选摘要  AI前线

芯片涨价潮,来了


存储芯片行业正经历前所未有的价格飙升和供需格局重塑。2025年下半年以来,全球存储芯片市场迎来罕见普涨行情,DDR5价格单月涨幅达102%,DDR4涨幅超过90%。三星电子服务器内存芯片合约价格上调30%-60%,创下历史最高单次涨幅纪录。这种涨势远超2016-2018年存储长周期,TrendForce数据显示2025年第四季度DRAM合约价同比上涨逾75%。
AI服务器需求成为本轮涨价的核心驱动力。与传统消费电子周期不同,AI大模型训练和推理带来存储需求的质变。单台AI服务器的DRAM用量是传统服务器的8倍,NAND Flash用量达3倍。高带宽内存(HBM)因能解决”内存墙”问题而需求…

来源:AI每日精选摘要  半导体行业观察

◈ 11月22日 星期六 【 10 篇 】

小米陈龙团队首作:统一具身与自动驾驶的开源模型


小米具身智能团队发布了首篇论文,提出统一具身智能与自动驾驶的新模型MiMo-Embodied。该模型在17项具身任务和12项自动驾驶任务中取得领先表现,首次从工程层面证明这两个长期分离的技术领域可以在同一框架下实现统一建模。论文由小米智驾团队的郝孝帅担任第一作者,首席科学家陈龙博士担任项目负责人。
模型的核心突破在于验证了视觉语言模型能够同时处理”抓取物体”与”驾驶车辆”这两类差异极大的任务。在具身智能方面,MiMo-Embodied在可供性推断、任务规划和空间理解三个能力维度上表现突出。例如在RoboRefIt基准中准确定位目标物体,在RoboVQA等任务规划测试中展现优秀的行动推理能力…

来源:AI每日精选摘要  AI科技评论

28岁印度裔创始人忽悠谷歌24亿!劈柴哥力推的王牌IDE,底裤被扒了个精光:“套壳”Windsurf,连Bug一起!


Google最新发布的Antigravity IDE平台引发了开发者社区的广泛讨论与争议。这款号称”下一代agentic开发平台”的产品,其核心技术基础可能源自Google此前以24亿美元获得授权的闭源IDE Windsurf,而非官方宣称的全新开发。深入分析显示,从界面布局到内部架构,Antigravity与Windsurf存在惊人的相似性,包括直接引用的私有代理系统Cascade和几乎未改动的资源名称。这种闭源软件的”专有分叉”(PORK)行为,因缺乏开源世界的透明度而引发伦理争议。
技术架构方面,Antigravity提出了颠覆传统IDE的三大核心组件:Agent Manager智能…

来源:AI每日精选摘要  AI前线

内部会上抱怨连连,但黄仁勋下周就要接好运了


英伟达CEO黄仁勋近期在内部会议中表达了对市场反应的失望,尽管公司三季度财报表现亮眼。570.1亿美元的营收创下同季度纪录,超出华尔街预期,四季度业绩展望更是高达650亿美元。然而,财报带来的股价提振十分短暂,英伟达股价在短暂上涨后迅速回落,市值一度缩水至4.35万亿美元。黄仁勋认为,外界对英伟达的过高期望导致公司陷入两难境地:业绩不佳被视为AI泡沫的证据,表现优异则被质疑助长泡沫。
市场对英伟达的担忧不仅限于业绩表现,还涉及其在全球AI产业链中的核心地位。黄仁勋强调,英伟达的业绩波动可能对全球经济产生重大影响,甚至引发“世界崩溃”的连锁反应。这种观点反映了英伟达在AI基础设施中的不可替代…

来源:AI每日精选摘要  钛媒体AGI

何恺明团队重磅新作:去掉VAE,无需Tokenizer,纯Transformer预测数据比预测噪声更高效


麻省理工学院何恺明团队发布了一项颠覆性研究,直指当前扩散生成模型的核心痛点。研究指出主流模型实际上并没有在做去噪工作,回归最原始的洁净数据预测才是高维像素生成的正解。何恺明作为计算机视觉领域的世界级科学家,其发明的残差神经网络ResNet解决了深度神经网络训练中的梯度消失难题,成为人工智能发展的里程碑。这项新研究再次展现了他对构建能理解复杂世界智能模型的执着追求。
扩散模型的预测目标已偏离去噪本质。生成式人工智能领域近年来被扩散模型彻底席卷,从DALL-E 3到Sora等震撼世界的应用背后,核心引擎几乎都是去噪扩散概率模型(DDPM)及其变体。然而研究发现,今天的去噪模型绝大多数并不直接输…

来源:AI每日精选摘要  AIGC开放社区

一文读懂:为什么Nano Banana Pro重新定义了AI图像生成标准


在Gemini 3的技术支持下,谷歌正式推出图像生成工具Nano Banana Pro,标志着AI图像生成领域的技术突破。该工具基于Gemini 3 Pro构建,通过增强的推理能力和实时信息整合,能够生成更准确、更具上下文关联的视觉效果。它不仅提升了图像的美学质量,还能结合谷歌搜索的知识库,快速生成包含实时信息的实用内容。一位资深设计师评价称,Nano Banana Pro在同期市场中展现出碾压性的竞争力,尤其在多语言处理、物理参数调整和高保真度生成方面表现突出。
Nano Banana Pro的推出,直接针对AI图像生成领域的五大难题:一致性与可控性、对物理世界的理解、文本渲染、深度伪造…

来源:AI每日精选摘要  钛媒体AGI

Nano Banana Pro最全解析,设计师和开发者都用得上,附官方提示指南


Nano Banana Pro作为新一代图像生成与编辑模型,标志着AI技术在视觉创作领域的重大突破。其核心突破在于将逻辑推理能力和真实世界知识注入像素生成过程,使模型不再局限于美学表现,而是能够理解图像背后的语境和逻辑。基于Gemini 3 Pro构建的这套系统,在视觉信息处理、多语言文本渲染、复杂场景一致性等方面实现了质的飞跃,为专业创作提供了前所未有的可能性。
模型最显著的特点是具备教学演示能力,能够将抽象知识转化为直观的视觉表达。在处理植物图谱或烹饪流程等场景时,不仅能准确呈现外观特征,还能整合起源、护理要点等知识性内容,生成包含分步骤指南的视觉流程。这种能力得益于与Google搜索…

来源:AI每日精选摘要  AIGC开放社区

具身智能「全明星日」来袭!智源组局30+行业掌门人,激辩机器人终极命题


中国具身智能产业的核心议题与未来方向在智源具身2025 OpenDay活动中得到深入探讨。30余位行业领军人物围绕技术架构、数据获取路径、硬件瓶颈及商业化落地展开激烈辩论,揭示了当前发展阶段的关键矛盾与潜在突破点。
技术架构的革新需求成为首要焦点。与会专家普遍认为现有视觉-语言-动作(VLA)架构存在根本性缺陷,语言中心主义的设计逻辑与人类行为模式存在本质差异。招商局集团AI首席科学家张家兴提出的”动作优先”(Action First)理念获得广泛认同,清华大学赵行进一步提出构建”大动作模型”(Large Action Model)的设想,强调闭环反馈机制的重要性。但北京大学王鹤指出,当前…

来源:AI每日精选摘要  新智元

家庭场景出行,华为乾崑用「奕境」给出新答案


奕境品牌的首款车型将于2026年4月北京车展亮相,这一全新品牌由华为乾崑与东风汽车在“2025华为乾崑生态大会”上联合发布。品牌名称“奕境”通过全网用户共创产生,寓意光明与智慧境界的结合,反映了中国汽车市场竞争重心向智能化与家庭场景的转移。家庭用户的需求已从交通工具升级为满足全家人需求的智慧伙伴,而奕境正是针对这一市场空白而生。
当前新能源汽车市场竞争激烈,车企普遍通过价格战和功能堆叠吸引消费者。然而,单靠配置竞争已无法支撑长期发展,体系化能力成为关键。奕境品牌依托东风汽车与华为乾崑的深度合作,整合了双方在研发、制造、供应链等全链条的优势。东风汽车整合了商企、研发、生产等全价值链资源,并构…

来源:AI每日精选摘要  雷峰网

特朗普急了,发动新「曼哈顿计划」:举国发力AGI!


在这个周一的清晨,白宫的空气中弥漫着一种久违的、近似于冷战时期的紧张与亢奋。特朗普即将签署的「创世纪行动」行政命令,彻底撕下了所谓「商业竞争」的温情面纱,将AI竞赛的战略高度直接对标当年的「曼哈顿计划」或美苏太空竞赛。这一行动的核心逻辑是集中力量办大事,扫除一切拦路虎。美国国家实验室将全面转向AI技术研发,司法部则被授权起诉那些制定了「违宪」AI法规的州政府。对于那些试图通过繁琐的安全测试、版权审查或以「伦理」为名限制AI发展的州,联邦政府将挥舞削减资金的大棒。这实际上是在向加利福尼亚州等地的立法者宣战。
「创世纪行动」的激进立场背后,站着的是黄仁勋等科技巨头的身影。为了在这场被特朗普称为…

来源:AI每日精选摘要  新智元

华为乾崑 all in 启境,开启造车新模式


华为与广汽合作的启境品牌在华为乾崑生态大会上明确了其生态定位与发展方向。该品牌以“全都要”为产品定义核心,旨在打造兼具安全、时尚、智能化与操控性的车型,并将长期愿景设定为“塑造移动智能体”。这一目标不仅要求车辆被动响应指令,还需通过传感器与IoT设备主动感知需求,结合AI模型实现自主决策与服务提供。
为实现这一目标,华为将技术、团队与流程深度赋能启境,使其成为聚焦出行解决方案的“小华为”。技术层面,启境全系车型搭载华为乾崑全家桶,包括智驾、鸿蒙座舱、车控等模块。其中,乾崑智驾采用独特的WEWA架构,分为云端“World Engine”与车端“World Action Model”,通过省略…

来源:AI每日精选摘要  AI科技评论

© 版权声明
“绘蛙”

相关文章

没有相关内容!
“讯飞星辰”

5 条评论

  • 硅星人Pro
    硅星人Pro 投稿者

    这个主题很棒,赞

    回复
  • AI前线
    AI前线 投稿者

    收藏啦收藏啦

    回复
  • admin

    有啥改进意见,欢迎提出

    回复
  • Founder Park
    Founder Park 投稿者

    精选内容有重复的😅

    回复
  • 新智元
    新智元 投稿者

    精选内容很好,方便查看

    回复