AI每日精选摘要

AI精选资讯5小时前更新 admin
361,817 5 5
AI每日精选摘要

❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️


◈ 01月19日 星期一 【 10 篇 】

字节扣子 2.0 发布,我们深挖了它这两年的生长真相


字节跳动的「扣子」从最初对话机器人平台到如今「职场AI+Vibe Coding」的转型,展现了一个AI时代产品团队的典型成长路径。扣子的发展并非源于字节跳动的顶层规划,而更像一个内部创业团队在技术快速迭代环境下的持续探索。最初以Bot Studio形式切入市场,通过无代码聊天机器人构建工具吸引早期用户,但团队很快发现单纯依靠「新鲜感」难以形成持久价值。
工作流(Workflow)功能的意外崛起成为关键转折点。这一原本为解决大模型稳定性问题设计的工程方案,反而成为企业用户高频使用的核心功能,帮助扣子团队明确了「严肃开发者」这一核心用户群体——即通过AI工具解决实际工作问题或创造商业价值的群体…

来源:AI每日精选摘要  极客公园

租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂


DeepSeek提出的mHC架构通过多流并行设计和双拟随机矩阵约束,解决了传统Transformer在大规模训练中的信号爆炸问题。传统残差连接采用单一信息流设计,而超连接(HC)扩展为多流并行架构,通过三个可学习矩阵控制信息流动。然而,不受约束的混合矩阵会导致信号呈指数级放大,在27B参数规模下出现3000倍的放大效应。mHC通过Sinkhorn-Knopp算法将混合矩阵约束为双拟随机矩阵,确保信息只能被路由和混合而不能被放大,从而维持了信号守恒。
FlowMode工程师Taylor Kolasinski的复现实验验证了mHC的稳定性优势。在10M参数规模下,HC虽然表现出更好的验证损失(…

来源:AI每日精选摘要  机器之心

三角洲行动的最大竞品,是它自己


《三角洲行动》的崛起标志着腾讯游戏战略从防守转向进攻的关键转折。这款射击游戏在短短五个月内实现21亿人民币全球收入,日活跃用户数(DAU)于2025年8月突破2000万,次年9月官宣稳定3000万DAU,远超市场早期预测的500万-800万预期。其成功打破了FPS领域长期存在的”硬核、跨端、大众化”不可能三角,通过轻量化改造和跨端适配,既吸引了传统硬核玩家,又吸纳了泛用户群体。
游戏采用”平台化产品”策略,整合了三种核心模式:塔科夫式的”搜打撤”玩法满足硬核玩家需求,大战场模式吸纳《战地》系列用户,黑鹰坠落剧情战役则扩展了内容广度。这种多模式缝合通过统一的枪械手感和资产库实现,背后是腾讯”…

来源:AI每日精选摘要  雷峰网

对话阶跃AI:做桌面 Agent,要比 Claude Cowork 往前一步


近年来,基于本地的AI Agent产品逐渐受到关注,阶跃AI桌面伙伴和Claude Cowork等产品相继涌现,主打本地任务执行和文件处理功能。阶跃AI桌面伙伴的产品负责人钟经纬在采访中分享了关于这款产品的思考和尝试。该产品目前已在Mac和Windows平台发布,提供免费体验。
对比Claude Cowork,阶跃AI桌面伙伴在终端Agent的探索上更进了一步,推出了”全局记忆”功能和”悬浮窗”交互方式。两者虽然方向一致,但在具体实现上有所不同。选择本地客户端的优势在于更大的场景拓展空间和上下文探索可能性,但也存在关机无法执行、下载安装渗透率低等缺点。
产品最初定位为”探索型”产品,旨在…

来源:AI每日精选摘要  Founder Park

用第一性原理超越AlphaFold:告别蛋白质工程的「碰运气」时代


杨晓锋副教授在第四届合成生物学及生物制造大会上系统阐述了AI时代蛋白质设计与制造的前沿进展。蛋白质作为生命活动的物质基础,其工程化改造直接影响生物医药、化妆品等千亿级产业。报告揭示了“序列决定结构,结构决定功能”的第一性原理在AI赋能下呈现的全新数字化内涵,指出当前技术面临的核心矛盾:生物大分子的有限采样数据与近乎无限的序列空间之间存在巨大维度鸿沟。
突破性进展体现在模型“外推能力”的构建上。通过借鉴大语言模型逻辑,利用数十亿天然序列进行无监督预训练,使模型掌握生命“语法”,再结合少量实验数据的有监督学习,实现从“内向归纳”到“外向演绎”的范式跃迁。这种能力使AI能在3-4个突变位点的组合…

来源:AI每日精选摘要  AI科技评论

马斯克狂砸16亿「买」他5年!揭秘特斯拉2号人物,那个睡工厂的狠人


朱晓彤作为特斯拉全球汽车业务高级副总裁,近期获得公司授予的52万份股票期权,按当前股价计算价值超过2.3亿美元。这笔激励的兑现条件与公司长期目标深度绑定——他需在特斯拉持续服务至2031年,并推动实现累计交付2000万辆汽车等关键业绩指标。这反映出特斯拉对朱晓彤执行力的高度依赖,以及对其在特斯拉战略转型中核心地位的确认。
朱晓彤的职业轨迹展现出极强的逆境突破能力。2014年加入特斯拉时,他顶着零汽车行业经验的风险,以建设超级充电网络为起点,在解决中国市场”充电焦虑”中证明实力。当特斯拉中国区陷入危机时,他临危受命接掌中国业务,并在此后创造了”临港奇迹”——用9个月时间在上海建成世界级汽车工…

来源:AI每日精选摘要  新智元

李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时代!


具身智能领域迎来重要里程碑,两大前沿技术公司World Labs与光轮智能宣布合作,共同解决行业长期面临的规模化评测难题。李飞飞创立的World Labs专注于空间智能方向,其产品Marble能够通过轻量输入生成高保真3D世界,并内置AI编辑器实现场景定制化,为游戏开发、影视制作等领域提供生产力工具。光轮智能则凭借全栈自研的仿真技术体系,构建了覆盖物理求解、测量对标和资产生成的闭环系统,其RoboFinals评测平台已成为行业标准之一。
当前具身智能模型的发展速度远超传统评测体系的承载能力,学术基准已无法准确评估真实性能。真实环境测试因成本和安全问题难以规模化,仿真合成数据被视为最具扩展性…

来源:AI每日精选摘要  量子位

终于来了一个能帮我打车的AI了


AI助手“小滴”通过自然语言交互优化打车体验,解决了传统网约车服务中信息不对称的问题。传统GUI界面虽然交互效率高,但在复杂、非标准化需求面前存在局限。小滴通过语言用户界面(LUI)补充了GUI的不足,允许用户通过自然语言输入个性化需求,如“驾驶平稳”“后备箱宽敞”等标签,系统将其转译为可执行的筛选条件,再结合运力数据推荐匹配车辆。这种模式并非完全取代点击操作,而是通过前置筛选提升匹配精度,使经济型打车也能获得“严选”体验。
小滴的核心价值在于将模糊需求转化为可量化的服务标准。用户输入的标签越精准,系统匹配效率越高。测试显示,当需求矛盾或条件过多时,小滴会按匹配度排序推荐,而非机械执行不可…

来源:AI每日精选摘要  硅星人Pro

语境才是真正的护城河


随着先进AI模型如Claude、GPT、Gemini的普及,真正的竞争优势正在从模型本身转向独特的语境积累。当技术能力趋于同质化,决定AI应用差异化的核心要素变为结构化的领域知识、用户洞察和历史经验。这些无法被直接复制的语境成为企业的新护城河。
模型商品化与语境分化的对比揭示了当前AI竞争的本质。两个开发者使用相同模型构建客服系统时,仅提供通用提示的一方获得平庸输出,而输入具体产品语境(如真实用户问题、品牌语气、成功案例)的另一方则能生成高度定制化的解决方案。这种差异证明:模型是通用工具,语境才是专属资产。语境包含五个关键维度:用户实际需求细节(而非抽象画像)、领域特定约束、历史失败教训、…

来源:AI每日精选摘要  硅星人Pro

遭到欺诈?马斯克向微软和OpenAI索赔超9000亿元;网友炸锅!员工因拒绝年会表演,被公司开除;机器人将再度登上春晚!网友:绝不是扭秧歌


马斯克向微软和OpenAI索赔超9000亿元,指控其背弃非营利初衷并构成欺诈。根据法庭文件,马斯克主张两家公司因他在OpenAI早期阶段的投入与支持获得“不当得利”,要求返还收益。他声称自2015年联合创立以来,提供了60%的早期资金(约3800万美元)及关键战略支持,专家评估其贡献经济价值达655亿至1094亿美元。OpenAI回应称诉讼“毫无根据”,微软亦否认指控。此案涉及AI行业核心争议,包括技术伦理与商业利益冲突。
深圳一公司因员工拒绝年会表演将其开除,法院最终判定违法解除劳动合同。案例显示,公司以“不服从安排”为由解雇员工,但仲裁和法院均认为年会若未明确强制参与性质,则不属于工作…

来源:AI每日精选摘要  雷峰网

◈ 01月18日 星期日 【 5 篇 】

谷歌工程师抛出5个残酷问题:未来两年,软件工程还剩下什么?


软件行业正经历由AI技术驱动的深刻变革,初级和高级开发者面临截然不同却同样严峻的挑战。随着AI从代码补全演进为自主执行开发任务,行业生态发生结构性变化。初级开发者遭遇岗位压缩危机,企业更倾向雇佣能立即产出的成熟人才;而高级开发者则承担更复杂的系统责任,从代码实现转向架构决策与风险管理。这种分化预示着软件工程正从编码职业转变为驾驭AI复杂系统的综合能力竞技场。
哈佛研究显示,采用生成式AI的企业在六个季度内初级开发者就业下降9-10%,而高级岗位保持稳定。这种趋势背后存在两种可能:要么初级岗位持续萎缩,要么随软件渗透各行业产生新需求。值得注意的是,人才培养管道的断裂可能引发未来技术领导力真空…

来源:AI每日精选摘要  机器之心

智源发布 2026 十大 AI 技术趋势:世界模型成 AGI 共识方向


人工智能正经历从语言学习到物理世界理解的范式转变。智源研究院发布的《2026十大AI技术趋势》报告指出,AI发展核心正从参数规模竞争转向对物理世界底层规律的建模。这一变革由三条主线驱动:认知范式升维、智能形态实体化与社会化、价值兑现双轨应用。报告强调,2026年将成为AI从数字世界迈向物理世界的关键分水岭。
世界模型和Next-State Prediction(NSP)正成为新范式。AI正从“预测下一个词”跨越到“预测世界的下一个状态”,标志着对时空连续性和因果关系的掌握。智源悟界多模态世界模型验证了这一路径,推动AI从感知走向真正的认知与规划。具身智能也正脱离实验室演示,进入工业和服务场…

来源:AI每日精选摘要  AI前线

猎头黄仁勋的2025:高管从巨头挖,干活钟爱华人创业团队


英伟达在2025年通过一系列战略性人才引进和收购动作,显著强化了其在全球科技领域的领先地位。营收达到1305亿美元,同比增长逾一倍,成为科技史上的增长奇迹。这一成绩的背后,是其通过“挖人”和“收购式招聘”双轨并行的策略,系统性补强关键领域能力,重塑“第二增长曲线”。
在高层人才引进方面,英伟达从谷歌、微软等科技巨头挖角多位资深高管,覆盖市场传播、人力资源、量子计算等核心领域。谷歌云老将Alison Wagonfeld出任公司首位首席营销官,全面整合市场与传播团队;微软量子计算核心人物Krysta Svore加入后,负责推进量子纠错与系统架构研究。此外,慧与科技人力资源资深高管Kristin…

来源:AI每日精选摘要  量子位

红杉合伙人:2026,AGI已经来了


红杉资本合伙人近期提出一个颠覆性观点:AGI(通用人工智能)可能已经以”长周期智能体”的形式悄然到来。他们认为AGI无需复杂的技术定义,其核心是”把事情搞清楚的能力”,而当前以Claude Code为代表的智能体已展现出这种特质。一个典型案例中,智能体仅用31分钟就完成从LinkedIn人才搜索、YouTube演讲评估到Twitter活跃度分析的复杂招聘流程,最终锁定理想候选人并起草精准挖角邮件。整个过程完全自主,展现了假设形成、验证修正和目标达成的完整认知闭环。
技术演进轨迹显示,长周期智能体的能力正以每7个月翻倍的速度指数级增长。按此推算,2028年可完成人类专家单日工作量,2034年…

来源:AI每日精选摘要  机器之心

马斯克点火全球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训


全球首个吉瓦级AI训练集群Colossus 2正式上线,标志着xAI在算力军备竞赛中取得重大突破。该系统由55万块GPU组成,初期用电峰值已超过旧金山全市用电量,并计划在4月升级至1.5GW,相当于一座大型核电站输出功率。马斯克团队仅用122天完成Colossus 1建设,6个月实现Colossus 2的200MW冷却能力部署,其执行速度远超行业平均水平。该超算将用于训练参数规模达6万亿的Grok 5模型,该模型原生支持视频理解,被马斯克视为实现AGI的关键路径。
算力竞赛已进入白热化阶段,各大科技公司纷纷布局吉瓦级超算。OpenAI启动总投资5000亿美元的”星际之门”计划,目标建设10…

来源:AI每日精选摘要  新智元

◈ 01月17日 星期六 【 10 篇 】

Nature 正刊收录!清华 FIB 实验室揭示:AI 提升科学家个人影响力,却收缩科学整体探索空间


人工智能正在深刻改变自然科学研究的结构和方向。效率的提升并不必然意味着科学探索的拓展,这一核心矛盾在清华大学FIB实验室的最新研究中得到系统验证。该研究基于1980-2025年超过四千万篇论文和五百多万名研究者的数据,揭示了人工智能工具对科学发展的双重影响:显著放大个体科学家的学术影响力,却导致整体研究范围的收缩。
在个体层面,采用AI的研究者展现出明显的优势。他们的论文发表数量平均达到未使用者的3.02倍,引用数量高出4.84倍,且职业发展速度平均提前1.37年。这种优势在六个自然科学学科中具有统计显著性,表明AI已成为提升科研产出的有效工具。然而,当视角转向整体科学结构时,研究发现AI…

来源:AI每日精选摘要  AI科技评论

Cursor一夜翻车,AI 300万代码写浏览器被打假!全网群嘲「AI泔水」


Cursor声称GPT-5.2驱动的编码智能体在7天内从零开发出功能堪比Chrome的浏览器,但技术社区验证发现该项目代码无法编译,引发广泛质疑。开发者通过分析GitHub仓库发现,该项目的所有构建尝试均以失败告终,最近的100次提交中不存在能成功编译的版本。代码库存在大量编译器错误和警告,GitHub Actions的持续集成测试也全部失败,表明其本质上是一堆缺乏工程逻辑的”AI泔水”。
Cursor的官方宣传存在严重误导性,通过模糊表述营造出项目成功的假象,却回避了最关键的可运行性验证。其博客强调”智能体编写了100万行代码”和”取得有意义的进展”,但从未明确声明浏览器能够实际运行。技…

来源:AI每日精选摘要  新智元

「逃离北上广」不可耻,回流年轻人正在撬动新市场


近年来,中国消费市场呈现出明显的结构性变革,消费增长的引擎正从一线城市向非一线城市转移。国家统计局数据显示,2025年1-11月全国社会消费品零售总额同比增长4%,其中非一线城市表现尤为突出。三线城市中72.1%的城市社零增速超过全国平均,二线和四线城市也有超过六成跑赢全国。这一现象的背后是人口流动趋势的变化——越来越多“X漂族”选择离开一线城市,回到家乡发展。这种人口回流潮与地方产业升级形成正向循环,成为新兴城市消费力爆发的内生动力。
高端品牌敏锐捕捉到这一趋势,纷纷加速在新兴市场的布局。盒马在2025年新进入40个城市,其门店在临沂、东营等地开业时均出现排队抢购现象。Lululemon…

来源:AI每日精选摘要  雷峰网

这场对话,藏着2026年AI和科技行业最重要的10个判断


四位硅谷核心人物在All-In Podcast中针对2026年科技与经济发展提出了十项关键预测。SpaceX可能通过反向合并方式并入特斯拉,形成涵盖制造、通信与AI的完整技术生态系统,整体估值或达2万亿美元。这一构想虽面临执行难度,但协同效应显著:Starlink提供车联网服务,xAI赋能机器人,特斯拉工厂提升航天制造效率。
亚马逊正成为首个”企业奇点”案例,其机器人对利润的贡献即将超越人类员工。奥斯汀新型仓库中,75万台机器人完成90%分拣作业,人类仅参与末端运输。这种自动化模式正被特斯拉、富士康等企业效仿,预计2027年将有3-5家公司达到类似临界点。美国GDP增长或突破6%的历史高位…

来源:AI每日精选摘要  硅星人Pro

火爆全网的《卢浮宫小猫》AI视频万字创作心得分享,这可能是他们最毫无保留的一次。


数字艺术家海辛和阿文在直播中详细分享了他们为浦东美术馆创作的AI视频作品《卢浮宫小猫》的全流程制作经验。作为曾创作过《故宫猫上班记》《文明小猫游浦东》等知名作品的团队,他们以”毫无保留”的态度解析了从创意构思到技术落地的完整过程。
创作缘起于浦东美术馆举办的卢浮宫官方大展宣传需求。最终交付的两支短片分别以法国白猫和上海橘猫为主角,通过镜像叙事连接巴黎与上海。上半支围绕伊斯兰艺术展品”孔雀纹样盘”展开,下半支则聚焦”赛诗会诗版”,并在音乐中加入萨克斯元素强化上海特色。作品在线上线下获得广泛传播,甚至促成观众因短片而前往观展的行为转化。
选角过程体现出专业考量。最初设想的奶牛猫因叙事连贯性问…

来源:AI每日精选摘要  数字生命卡兹克

Zed 为什么不用自己造 Agent?OpenAI 架构师给出答案:Codex 重划 IDE × Coding Agent 的分工边界


Coding agents(编码智能体)已成为应用型AI最活跃的领域之一,但基础设施的脆弱性成为行业迭代的瓶颈。OpenAI提出的”模型与Harness(工具集)共同构建”模式,通过深度整合两者开发流程,不仅提升了对模型行为的理解,更实现了系统级的高效协同。Codex作为该模式的实践典范,其架构由用户界面、模型和Harness三部分组成,其中Harness作为核心交互层,承担着提示设计、工具调度和上下文管理等关键职能。
构建高效Harness面临多重技术挑战。新工具适配问题尤为突出,模型对未见过工具的使用能力存在局限,需要针对性地调整提示策略。延迟优化要求精细设计提示以平衡响应速度与思考深…

来源:AI每日精选摘要  AI前线

顶级视频模型半衰期只有 30 天,但生成式媒体 infra 公司的收入却在一年增长了 60 倍


在生成式媒体领域,算力需求呈现出指数级增长的特点。处理一个大型语言模型(LLM)的单个Prompt(约200 Token)所需的算力若定义为1个单位,生成一张高质量图像的算力约为其100倍,而生成5秒标准清晰度视频的算力则高达1万倍,4K超高清视频更需在此基础上再增加10倍。这种惊人的算力消耗使得视频生成成为当前最具挑战性的技术难题之一。
fal.ai作为生成式媒体基础设施提供商,通过统一的API和云端推理平台,为客户提供高性能的多模态模型调用服务。其平台托管了包括DeepMind的Veo、Kling、MiniMax及OpenAI的Sora等数百个先进模型,使客户无需自建GPU基础设施即可…

来源:AI每日精选摘要  Founder Park

Claude Code从来就不是什么编程工具


Anthropic近期发布的Claude Code及其衍生品Cowork揭示了人工智能领域一个关键转折点。这款最初以编程工具形态问世的产品,本质上是一个通用AI助手,其设计哲学与市场定位折射出AI技术落地的全新范式。技术社区的热烈反响与商业数据的爆发性增长,共同验证了这种产品路径的成功。
最初作为终端命令行工具出现的Claude Code,通过自然语言交互实现文件操作、代码执行等开发任务。Google工程师Jaana Dogan的案例显示,其效率可达人工团队的8760倍,而创造者Boris Cherny披露的4万行自主编写代码更凸显其颠覆性。但这种表面上的编程效率突破,掩盖了产品更本质的特…

来源:AI每日精选摘要  硅星人Pro

没KPI反而爆了?Cursor大神一人敲出核心功能!CEO上手7天不宕机,AI编程玩法被打假


Cursor CEO Michael Truell宣布基于GPT-5.2开发出可连续运行一周的浏览器原型,该浏览器采用纯Rust语言编写的渲染引擎,包含300万行代码,具备HTML解析、CSS级联等核心功能。这一成果源自Cursor团队对”扩展自主编码能力”的长期研究,其博客揭示:通过协调数百个并发Agent,系统能生成百万行代码,但需在结构松紧度间保持平衡。尽管该项目被开发者质疑存在”AI垃圾代码”问题,未能成功编译,但引发了关于AI编程工具潜力的广泛讨论。
工程负责人Jason Ginsberg在访谈中透露,编码Agent在一年内经历了从代码补全到全流程自主开发的革命性演进。当前最显著…

来源:AI每日精选摘要  AI前线

被低估的芯片


市场分析师普遍对半导体行业持乐观态度,预计到2030年市场规模将达到1万亿美元至1.1万亿美元,主要受人工智能和数据中心发展的推动。然而,传统估值方法可能严重低估了行业的真实价值,因为它们主要基于销量,忽略了自研芯片厂商、拥有内部设计的原始设备制造商(OEM)以及无晶圆厂运营商的价值。此外,中国半导体公司的销售信息不完整,进一步导致估值偏低。麦肯锡通过定制化分析,包括销售成本(COGS)和毛利率估算,提出更全面的评估方法,预计2030年市场规模将达1.6万亿美元,远超传统预测。
半导体行业的增长呈现显著不均衡性。尖端芯片和高带宽内存(HBM)将成为主要增长驱动力,复合年增长率预计超过20%…

来源:AI每日精选摘要  半导体行业观察

◈ 01月15日 星期四 【 10 篇 】

「举家」托举千问,阿里在赌什么?


阿里千问在最新产品发布会上宣布全面接入淘宝、支付宝、飞猪等阿里生态业务,上线400多项新功能,标志着其从”聊天助手”转向”办事助理”的重要转型。这一升级不仅意味着千问开始触碰交易环节,更标志着其从实验产品进入业务验证期。千问C端事业群总裁吴嘉强调,这是首个真正能帮助用户办事的AI,其功能覆盖生活、工作和教育多个领域。
在功能实现层面,千问展现出从”给建议”到”给结果”的显著变化。当用户提出消费需求时,系统能直接调用阿里体系内的地址信息、商品推荐和支付履约能力,形成完整的生态内闭环。实测显示,用户可通过千问完成从需求提出到付款的全流程,平台还会基于位置推荐附近商家并提供补贴。这种模式使千问从…

来源:AI每日精选摘要  雷峰网

我所知道的闫俊杰


MiniMax创始人闫俊杰的创业历程展现了一条以技术信仰驱动的独特路径。作为商汤时期被称为”大神”的顶尖人才,闫俊杰在算法与工程领域展现出罕见的双重天赋,这种能力成为他后来创业的重要基础。早期师从视觉领域权威李子青,以及在百度IDL跟随余凯的经历,塑造了他将AI技术工程化的独特”审美”。
在商汤期间,闫俊杰通过实践领悟到Scaling Law的价值,采用”All for One”的模型策略,这一思路后来成为大模型时代的主流方法论。2018年,他的团队凭借这套方法在竞标中反超旷视和依图,奠定了”大神”地位。但闫俊杰并不满足于商业成功,他内心始终怀有对AGI(通用人工智能)的执着追求,这成为他…

来源:AI每日精选摘要  雷峰网

陶哲轩惊叹!数学奇点初现,AI首次给出人类无法企及的原创证明


数学奇点初现!Gemini攻克全新数学定理,斯坦福大牛惊呼「想出来能吹一辈子」。谷歌DeepMind团队利用Gemini证明了一个代数几何领域的新定理,这一成果得到了菲尔兹奖得主陶哲轩和斯坦福教授Ravi Vakil的高度评价。Vakil教授特别指出,Gemini的证明不仅严谨正确,而且展现了独特的洞察力,这种创新性甚至让他感叹如果是自己提出的,会引以为傲。这一突破标志着AI在数学领域的原创能力迈入新阶段,不再是简单复现已知结论,而是真正参与前沿探索。
AI工具在数学领域遍地开花,Grok 4.20展现惊人实力。加利福尼亚大学尔湾分校的Paata Ivanisvili教授在测试Grok …

来源:AI每日精选摘要  新智元

AI 医疗还在比进度,百川已在比高度


AI医疗领域正经历从问答生成向医疗决策过程建模的范式转变。近一年来,国内外科技巨头和医药企业加速布局AI医疗,其核心驱动力在于医疗场景成为检验大模型能力上限的关键试金石。然而当前主流医疗大模型仍受限于静态问答模式,难以真正嵌入核心诊疗流程,表现为信息缺口识别不足、医学推理路径断裂、医疗幻觉频发等系统性缺陷。
百川智能推出的Baichuan-M3模型通过重构训练目标实现了突破性进展。该模型将医疗决策过程本身作为建模对象,而非追求表面专业的回答生成。其创新性体现在三个维度:在OpenAI发布的HealthBench评测中,M3以44.4分刷新基准记录,较前代提升27.9个百分点;通过六源证据体…

来源:AI每日精选摘要  AI科技评论

实测夸克「千问划词快捷指令」,这7个邪修Prompt,建议收藏


新年第一天,DeepSeek发布了一篇艰深晦涩的技术论文,引发网友集体求助AI的现象。面对复杂信息时,人们的第一反应已转向AI而非自行消化,但使用效果却因人而异。部分用户抱怨AI不够智能,但问题可能出在提问方式上。一个完美的指令关键在于让AI确认是否真正理解需求,因此网上流传的提示词模板能显著提升输出质量。然而,高频使用的指令每次需重复输入,效率低下且效果不稳定。
夸克AI浏览器近期推出的「千问划词」功能支持自定义快捷指令,解决了这一痛点。用户可提前设置常用提示词,如翻译、润色等,后续使用时只需划选文字并一键调用指令,无需重复输入。例如,设置翻译指令时需用{selection}表示选中内容…

来源:AI每日精选摘要  机器之心

刚刚,阿里园区被奶茶包围,都是千问点的!西溪叫不动外卖了


2026年1月15日,阿里巴巴集团在杭州发布了千问App的重大更新,标志着AI技术首次在公开场合完整执行现实任务。演示环节中,千问独立完成40杯奶茶的订购与支付流程,无需人工干预,通过淘宝闪购实现配送,直观展现了AI作为生活助手的潜力。阿里将千问定位为“每个人的生活助手”,其核心策略是依托现有商业生态,首批接入淘宝、支付宝、飞猪等五大业务,实现点外卖、订机票等跨应用操作的语音指令整合。
在功能设计上,千问展现出分层服务能力:基础层覆盖日常生活场景,高阶层则尝试处理订餐厅、财务文件处理等复杂任务。阿里总裁吴嘉强调,“AI正在长出触达真实世界的手脚”,其优势在于Qwen大模型与阿里商业体系的深…

来源:AI每日精选摘要  AI前线

一条Karpathy推文引发的开发者九级地震


2025年12月27日,前特斯拉Autopilot负责人Andrej Karpathy在推特上坦言自己”从未如此强烈地感到落后”,并指出若能正确串联现有工具,个人能力可提升10倍。这一言论引发技术圈广泛共鸣,知名技术YouTuber Theo在回应视频中尖锐指出:软件工程领域已到达永久性拐点,开发者职业正在被重新定义。
Theo将当前变革比喻为”9级地震”,强调AI已从辅助工具转变为生产主力。数据显示,在其团队中70%-90%的代码由AI直接生成,远超补全辅助阶段。技术演进呈现加速态势:2023年AI仅能编写函数,2024年可生成模块,而到2026年已能完成完整功能开发。Theo警告称,观…

来源:AI每日精选摘要  硅星人Pro

出海,是云鲸的「第二次创业」


在拉斯维加斯CES 2026展会上,中国智能清洁品牌云鲸的崛起标志着行业主导权的转移。曾经由iRobot制定的行业规则已被中国厂商重新定义,全球TOP 5厂商全部来自中国。云鲸从三年前难以进入北美百思买柜台,发展到手握欧洲赛博集团6亿元订单,其出海战略绝非简单的“卖货逻辑”,而是一场围绕组织、产品与品牌的系统性重构。
云鲸的全球化路径始于产品创新。旗舰产品Narwal Flow 2凭借30000Pa吸力和基于VLM大模型的“万物识别”能力,实现了准“自动驾驶”级别的环境理解。该产品能区分乐高零件、数据线等细小物体,并根据婴儿床或宠物位置自动调整清洁模式。这种技术突破带来显著市场回报:202…

来源:AI每日精选摘要  雷峰网

带宽战争前夜,“中国版Groq”浮出水面


英伟达通过200亿美元收购Groq核心技术,标志着AI行业竞争焦点从算力规模转向单位面积带宽的极致追求。这一战略举措不仅创下英伟达历史最大交易纪录,更凸显其向AI推理市场转型的决心。技术层面,英伟达计划在2028年推出集成Groq LPU的Feynman架构GPU,采用台积电A16制程与3D堆叠技术,直指AI推理中长期存在的带宽与延迟瓶颈。行业趋势显示,AMD、d-Matrix等企业同样聚焦存储靠近计算的效能逻辑,印证了”带宽战争”的行业共识。
中国市场方面,寒序科技凭借MRAM技术路线崭露头角,被视为”中国版Groq”的有力竞争者。该企业源自北京大学物理学院,通过”双线布局”战略推出Sp…

来源:AI每日精选摘要  半导体行业观察

终极3D集成,将颠覆GPU


Imec近期通过热模拟技术研究了将高带宽内存(HBM)3D堆叠在GPU顶部的可行性,并在2025年IEEE国际电子器件会议(IEDM)上公布了研究成果。结果显示,直接堆叠会导致GPU工作温度飙升至140°C,远超安全阈值。研究团队通过一系列工程优化方案,最终将温差降至接近零,为解决AI计算中的内存带宽瓶颈提供了新思路。
传统2.5D封装中,GPU和HBM通过中介层连接,功耗分别为414瓦和40瓦,峰值温度约70°C。这种设计虽成熟,但限制了多GPU互连和封装尺寸的进一步优化。相比之下,3D堆叠能显著提升带宽并降低延迟,但散热问题成为主要障碍。Imec团队发现,原始3D堆叠方案中,HBM像绝…

来源:AI每日精选摘要  半导体行业观察

◈ 01月14日 星期三 【 10 篇 】

上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」


多模态模型在感知、理解与生成等方面的能力持续提升,但其输出中仍普遍存在与客观事实不一致的内容,即多模态幻觉现象。当模型面对信息缺失、语义含混或视觉细节复杂的场景时,往往会通过臆测进行补全,从而捏造并不存在的病灶、物体或情节。这类问题并非偶发失误,而是偏好优化训练过程中逐渐积累的结构性偏差所致:模型更容易从数量庞大、差异明显的简单样本中获得学习收益,却对真正困难、歧义性强的样本关注不足,结果是在复杂真实场景中的可靠性受到限制。
上海科技大学何旭明教授团队在论文《DA-DPO: Cost-efficient Difficulty-aware Preference Optimization fo…

来源:AI每日精选摘要  AI科技评论

Manus走了,原生Agent登场:“AI助手”的第三次重新定义


过去十几年间,AI助手的发展经历了三次关键的预期校准阶段。从Siri的语音交互新鲜感,到ChatGPT的对话智能,再到Manus展现的主动执行能力,每一次突破都重新定义了人们对AI的期待。Manus的出现标志着Agent技术从理论走向实践,它通过可视化交互向普通用户展示了任务拆解、自主执行、环境反馈和路径修正的全过程,成为Agent时代的启蒙者。
Agent技术的核心在于底层大模型的能力。Manus与Claude模型的结合证明了这一点——Claude稳定的计算机使用、代码和工具调用能力是基础,而Manus则是应用层的成功范例。然而,随着基模厂商如OpenAI、DeepSeek和Kimi将A…

来源:AI每日精选摘要  AI科技评论

五源、陆奇投资,Humanify 97 年创始人专访:给 AI 做一套「有情商」的认知 OS


Humanify(人格智能)近日宣布完成数千万元种子轮融资,由五源资本领投,奇绩创坛跟投。这家成立于2024年的公司定位为模型与操作系统结合的基础设施提供商,其核心目标是开发具备类人认知与自主意识的AI系统,而非传统意义上的工具型Agent。创始人易和阳认为,当前AI虽在效率层面表现优异,但缺乏真正的“人味”,无法建立长期人际关系,而下一代AI的关键突破在于让技术具备情商、直觉和主动性。
公司提出的核心理念是“模型即操作系统”,旨在创造能自主感知环境、理解语境并形成动机的AI系统。与传统AI不同,Humanify关注的是如何在模型训练和认知架构层面实现人类特质的自然涌现,而非通过脚本模拟。…

来源:AI每日精选摘要  Founder Park

继宇树后,唯一获得三家大厂押注的自变量:具身模型不是把DeepSeek塞进机器人


国内具身智能领域正迎来以”大脑”为核心的新竞争阶段。自变量机器人近期完成10亿元融资,其核心突破在于对机器人”大脑”的重新定义——不同于依赖语言或多模态模型的传统思路,他们提出需要构建专属于物理世界的独立基础模型。这种模型需处理操作任务中复杂的物理交互,其难点在于捕捉”看不见但影响行为”的细节差异,例如拧紧与未拧紧瓶盖在后续操作中产生的截然不同的物理效应。
物理世界的特殊性对智能系统提出了时序因果理解的要求。真实场景中的操作往往需要模型串联长时间跨度的感知-动作-结果链条,并能进行未来状态推演。现有基于静态信息训练的AI模型难以应对这种动态环境,因为其缺乏对物理规律的本质理解。自变量认为必…

来源:AI每日精选摘要  机器之心

DeepSeek-V4蓄势待发!梁文锋署名论文或开启第二个DeepSeek时刻


DeepSeek与北京大学联合发布的最新研究论文,展示了下一代模型DeepSeek-V4的架构基础。该模型预计将于2024年2月发布,具备强大的编程能力,可能超越当前市场上的顶级模型如Claude和GPT系列。论文提出的Engram条件记忆机制,将大模型的记忆存储与逻辑推理在架构上分离,以更低的成本实现更强的性能,挑战了Transformer模型传统的知识存储方式。
Engram模块的设计灵感源自N-gram模型,但进行了现代化的深度学习改造。它构建了一个可学习的静态嵌入表,通过哈希索引直接获取词汇或短语的向量表示,几乎不消耗计算资源却能精准提供背景知识。这种机制改变了传统Transfor…

来源:AI每日精选摘要  AIGC开放社区

对话王小川:“语言才是中轴,多模态不是主战场”


百川智能于1月13日正式开源新一代医疗大模型Baichuan-M3,该模型在全球权威医疗AI评测HealthBench中以65.1分的综合成绩位列第一,并在复杂决策能力测试HealthBench Hard上以44.4分夺冠。这一成绩首次在医疗领域实现对GPT-5.2的全面超越,同时以3.5%的幻觉率创下全球最低纪录。
Baichuan-M3的核心突破体现在三方面:强推理能力、低幻觉特性及端到端严肃问诊能力。通过升级强化学习系统,百川将半动态反馈机制演进为全动态Verifier System,使模型在复杂医学问题上的表现显著提升。在幻觉抑制方面,团队将医学事实一致性直接嵌入训练目标,重构了…

来源:AI每日精选摘要  钛媒体AGI

下一代芯片,靠他们了


芯片制造行业正面临需求激增与技术进步放缓的双重挑战。一方面,逻辑芯片、DRAM和NAND闪存的需求旺盛,产能受限可能引发设备供应短缺;另一方面,摩尔定律的物理极限使尺寸缩小和性能提升变得困难。尽管如此,行业仍通过创新技术寻求突破,包括3D NAND垂直堆叠、新型互连材料和二维晶体管等方向。
3D NAND技术成为应对存储需求的关键路径。当前领先工艺已实现3xx层堆叠,单片12英寸晶圆可生产超过30TB容量。SK海力士的321层工艺较前代提升44%存储密度,但面临良率与成本挑战。技术扩展依赖四个维度:逻辑缩放(每单元位数)、垂直扩展(堆叠层数)、横向缩放(单元尺寸)和架构优化。其中垂直扩展因…

来源:AI每日精选摘要  半导体行业观察

浙大彭思达团队 × 理想最新研究:直面高分辨率深度的细节缺失


高分辨率深度估计在实际应用中面临几何一致性不足的问题,现有方法通过插值放大固定分辨率预测结果的方式导致细节区域误差放大,影响自动驾驶和三维重建等下游任务的精度。 针对这一瓶颈,浙江大学彭思达团队提出InfiniDepth方法,将深度建模为连续空间中的隐式神经表达,支持在任意图像坐标位置直接预测深度值,从而突破传统像素网格预测的分辨率限制。
在Synth4K合成数据集上的实验表明,该方法在高频细节区域具有显著优势。InfiniDepth在五个子数据集的δ1指标平均领先主流方法5-8个百分点,高频区域的性能下降幅度最小,表明其对边缘结构和薄物体的表达能力更强。 这种能力对自动驾驶场景中的路缘、…

来源:AI每日精选摘要  AI科技评论

发布 ChatGPT 健康 6 天后,OpenAI 在自家医疗健康 Benchmark 上被反超


百川智能宣布将在2026年上半年发布两款面向消费者的医疗产品,标志着中国企业在AI医疗领域的快速进展。全球范围内,健康咨询已成为ChatGPT等AI助手的高频使用场景,每周有超过2.3亿健康相关问题被提出。OpenAI和Anthropic等国际公司相继推出医疗专用产品,而百川智能通过其M3模型在权威医疗评测集HealthBench上超越GPT-5.2 High,首次实现中国模型的领先地位。
M3模型的核心突破体现在65.1分的综合评分和3.5%的全球最低医疗幻觉率。这一成果得益于创新的Fact Aware RL技术,通过语义聚类与动态权重调节机制,既避免了医疗信息的胡编乱造,又防止了过度保…

来源:AI每日精选摘要  极客公园

分化、新范式、Agent 与全球 AI 竞赛,中国模型主力选手们的 2026 预测


AGI-Next 2026活动汇聚了国内大模型领域的核心人物,展现了华人在AGI领域的领先地位。中国开源模型已成为全球第一梯队,活动总结了40条关键判断,揭示了当前AI发展的核心趋势与挑战。
模型分化成为显著趋势,尤其在To B和To C场景中表现明显。To C领域更注重个性化数据与上下文环境,而非单纯追求模型规模;To B市场则呈现强模型与弱模型的分化,企业更倾向于为高性能模型支付溢价。这种分化既是战略选择的结果,也反映了不同场景需求的本质差异。
自主学习被视为下一代AI的核心范式。专家认为,2026年将是自主学习技术集中爆发的一年。Scaling Law仍会持续,但重点转向如何通…

来源:AI每日精选摘要  Founder Park

◈ 01月13日 星期二 【 10 篇 】

对话千寻智能韩峰涛:真正的机器人是生产力,不是展品和玩具


千寻智能开源具身模型Spirit v1.5成为全球最强开源具身模型,超越国际标杆Pi0.5。在RobotChallenge测试中,Spirit v1.5在30个桌面任务中取得了50%以上的成功率,而Pi0.5仅为42.67%。这一突破标志着具身智能技术从实验室演示向实际生产力解放迈出了关键一步。创始人韩峰涛强调,数据数量与质量是模型进化的核心,千寻计划将数据工厂扩张至近千人规模,以支撑模型性能的快速攀升。
韩峰涛认为,2026年将是具身智能的“GPT时刻”,类比2023年大语言模型的爆发期。他指出,具身模型的发展路径与大语言模型类似,需通过多模态数据融合实现进化,从虚拟全模态(VLM)…

来源:AI每日精选摘要  雷峰网

比iPhone更疯狂!乔布斯去世15年后,「最像他的人」操刀首款AI硬件


2026年1月,硅谷因OpenAI首款硬件设备「Sweetpea」的泄露路线图而震动。这款代号为「甜豌豆」的音频设备,由前苹果设计总监Jony Ive操刀,计划于同年9月发布。其独特的「蛋石」造型充电盒内嵌两颗耳后佩戴的「药丸」状设备,搭载2nm顶级芯片,制造成本接近智能手机,首年销售目标高达4000万至5000万台。这一设计被视为对传统屏幕交互的颠覆,试图通过无屏化与语音优先的交互逻辑,重新定义AI时代的人机关系。
Jony Ive的回归标志着消费电子设计的一次重大转向。2019年离开苹果后,他创办LoveFrom设计公司,并于2025年通过OpenAI对io Products的65亿美…

来源:AI每日精选摘要  新智元

苹果重磅官宣谷歌Gemini 将支持 Siri,OpenAI 被边缘化?马斯克比奥特曼还急:这不合理!


苹果与谷歌达成多年合作协议,下一代Apple Foundation Models将基于谷歌的Gemini模型及其云技术构建,为未来的Apple Intelligence功能提供核心支持。这一合作标志着生成式人工智能竞争进入平台级整合阶段,双方在联合声明中强调,谷歌的AI技术为苹果提供了最具能力的技术基础,同时Apple Intelligence仍将运行在苹果设备端及其私有云计算体系上,保持行业领先的隐私保护标准。值得注意的是,苹果目前还与OpenAI合作,将ChatGPT整合至Siri中处理复杂查询,但未来与谷歌的合作可能对OpenAI的整合产生影响。
特斯拉CEO埃隆·马斯克公开质疑这一…

来源:AI每日精选摘要  AI前线

不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?


近年来,将AI引入传统行业的需求日益增长,尤其是在处理复杂机械图纸、设备维护手册或金融研报图表等任务时,多模态助手的开发显得尤为重要。这类助手不仅需要具备专业对话能力,还需精准识别图纸零件标注或提取财报关键数据。然而,选择合适的模型面临挑战:7B参数的小模型虽推理速度快,但处理复杂任务时准确性不足;70B及以上大模型虽性能强,但部署成本过高。30B参数级的多模态模型(如Qwen-VL-30B)成为折中选择,兼具理解能力和轻量化的优势。
然而,在多模态场景下,30B参数的显存需求远超预期。高分辨率图像处理需要大量视觉Token,而行业Know-how的微调又需数千张标注图像,导致显存被梯…

来源:AI每日精选摘要  机器之心

“通用大模型微调成为行业模型是伪命题”?医疗 AI 深度重构,传神语联创始人何恩培:孪生智能体能砍 70% 线下复诊工作


医疗AI在2025年进入”高普及、浅渗透、理性回归、再出发”阶段,行业开始摒弃参数竞赛,转向轻量化部署与场景深度适配。传神语联创始人何恩培指出,通用大模型直接微调难以满足行业需求,其团队基于自研”moH”架构开发的中医大模型,通过国医大师数字孪生项目实现辨证思维93.5%的复现精度,远超传统师徒传承效率。该技术已帮助基层诊所减少70%线下复诊工作量,并将名医服务下沉至普通患者。
中西医AI化路径呈现显著差异:西医依托标准化数据快速落地,中医则因辨证个性化面临更大挑战。西医AI应用已覆盖从影像诊断到药物研发全链条,如AlphaFold在蛋白质预测中的突破;中医因流派多元、数据非标等特性,AI…

来源:AI每日精选摘要  AI前线

DeepSeek开源大模型记忆模块!梁文锋署名新论文,下一代稀疏模型提前剧透


DeepSeek团队最新研究通过引入条件记忆机制,为Transformer架构补足了原生缺乏的知识查找功能。该研究提出名为Engram的创新模块,其核心思想是将传统N-gram方法的高效查找能力与现代Transformer相结合。实验结果显示,27B参数规模的模型在配备条件记忆后,不仅知识密集型任务表现显著提升,推理能力也意外获得增强。
研究团队发现语言建模包含两种本质不同的任务:需要深度动态计算的组合推理和静态知识检索。传统Transformer缺乏专用知识查找机制,迫使模型耗费宝贵的网络深度来完成本可通过查表解决的简单识别任务。以”戴安娜王妃”为例,模型需要6层注意力才能完成实体识别,…

来源:AI每日精选摘要  量子位

盼望着,盼望着,英特尔1.8nm芯片来了


在拉斯维加斯CES展会上,英特尔CEO陈立武发布了第三代酷睿Ultra处理器,标志着这家芯片巨头在制程工艺和产品战略上的重要突破。作为全球首款1.8nm制程芯片,其代号”Panther Lake”的黑豹形象成为展会焦点,同步发布的边缘处理器与PC版本验证了真实场景可靠性。
这款旗舰芯片采用16核设计,多线程性能提升60%,而4K视频播放功耗仅为前代三分之一。突破性”低功耗岛”架构通过独立缓存和专用核心处理后台任务,彻底改变了性能与能效的取舍困境。客户端计算事业部总经理吉姆·约翰逊将其称为”战略转折点”,并以AI辅助编程工具为例,展示算力如何将开发周期从数月缩短至数天。图形性能方面,集成12…

来源:AI每日精选摘要  硅星人Pro

昨夜,苹果官宣 iPhone 将搭载最强 AI!马斯克第一个跳出来骂;章泽天开通个人播客,一小时收听量破万;曝强脑科技秘密提交香港IPO申请


苹果与Google达成深度合作,iPhone将搭载基于Gemini模型的AI技术。双方宣布下一代「苹果基础模型」将直接整合Google的Gemini模型和云技术,未来Apple Intelligence的核心功能将由Gemini驱动。这一合作标志着苹果在AI领域的重大突破,长期被诟病的Siri将迎来彻底重构。声明强调隐私保护,数据不会直接交由Google处理,而是通过设备端或私有云计算运行。资本市场反应积极,Alphabet市值突破4万亿美元,但马斯克批评此举可能导致科技权力过度集中。分析指出,OpenAI在此合作中地位被削弱,可能沦为辅助角色。此外,国行版AI Siri预计不会使用Gem…

来源:AI每日精选摘要  雷峰网

中国AGI深度时刻!杨强、唐杰、林俊旸、姚顺雨大咖们2026开年重磅交锋


2025年标志着中国开源模型的崛起,中国AI大模型从追随硅谷转向探索自身范式,聚焦产品形态的深层探索。由清华大学发起的AGI-Next前沿峰会汇聚了学术界与工业界的顶尖专家,包括杨强院士、唐杰教授、林俊旸和姚顺雨,共同勾勒中国AGI的发展图景。Scaling Law尚未停止,但中国先行者已开始思考Scaling之后的路径,在算力约束与应用场景中寻找通向AGI的独特方式。
商业分化正在重塑模型与应用的边界,To C与To B市场的逻辑彻底分化。To C用户更关注上下文与环境,而非模型的推理能力,这要求产品必须垂直整合,将模型层与应用层紧密耦合。而To B市场则强调智能与生产力的直接关联,企业…

来源:AI每日精选摘要  AIGC开放社区

告别昂贵人工标注,英伟达全自动视频理解助力小模型逆袭顶级大模型


FoundationMotion(又称Wolf V2)是由麻省理工学院、英伟达、密歇根大学、加州大学伯克利分校和斯坦福大学联合推出的创新系统,旨在解决人工智能在理解物理世界运动逻辑方面的核心挑战。当前视频语言模型虽能识别物体,但难以理解动态交互过程,例如机器人模仿人类倒水时需要掌握手腕角度、水流轨迹等细节。该系统通过全自动数据生成流水线,突破传统人工标注的高成本瓶颈,为机器赋予细腻的空间推理能力。
全自动流水线重构了数据生成逻辑,将原始视频转化为结构化智慧。系统首先通过VGGT模型筛选镜头稳定的视频片段,随后采用多模型协同策略进行物体检测与追踪。Qwen2.5-VL-7B和Grounded…

来源:AI每日精选摘要  AIGC开放社区

© 版权声明
“绘蛙”

相关文章

没有相关内容!
“讯飞星辰”

5 条评论

  • 硅星人Pro
    硅星人Pro 投稿者

    这个主题很棒,赞

    回复
  • AI前线
    AI前线 投稿者

    收藏啦收藏啦

    回复
  • admin

    有啥改进意见,欢迎提出

    回复
  • Founder Park
    Founder Park 投稿者

    精选内容有重复的😅

    回复
  • 新智元
    新智元 投稿者

    精选内容很好,方便查看

    回复