❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 06月12日 星期五 【 1 篇 】
◎ Tabbit 1.0 发布,9 块 9 国内模型免费用,首谈与美团合作细节
在AI浏览器功能逐渐趋同的行业背景下,Tabbit通过发布1.0版本并开启商业化进程,探索出一条差异化的发展路径。面对巨头入局和标配功能的快速贬值,Tabbit将市场潜力押注于尚未真正上手人工智能的普通用户,致力于打造一个为人设计的浏览器,而非完全交由智能体接管的工具。
在产品迭代方面,Tabbit在公测期内完成了从地址栏到智能体的演进。1.0版本新增了跨对话记忆和本地目录挂载等个性化功能,使其能更深地理解用户意图。同时,产品推出了妙招功能及分享广场,将常用操作沉淀为可反复调用和分享的小工具,使浏览器从单纯的网页浏览工具转变为大众共建的人工智能工作台。在模型层,Tabbit接入了多款国内头…
来源:
极客公园
◈ 06月11日 星期四 【 10 篇 】
◎ CVPR 2026|告别「一属性一训练」,美图&北交大提出统一属性编辑框架 All-in-One Slider
生成式AI在影像内容生产中面临语义高度纠缠的问题,导致在调整人物属性时容易破坏整体结构或改变其他特征。为实现对生成图像的可解释、细粒度及连续属性操纵,美图影像研究院联合北京交通大学提出了基于扩散模型的All-in-One Slider新框架。该方案实现了对人脸属性的连续精细化控制,并最大限度地保持了图像整体结构及面部细节信息。
传统方法多采用一对一模式训练独立滑块,存在参数冗余和扩展性差的问题。All-in-One Slider创新性地引入轻量级属性稀疏自编码器,将复杂的属性操纵分解为属性解耦训练和滑块属性操纵两个阶段。在解耦训练阶段,通过Top-k激活机制强制实现稀疏化,并结合辅助损失函…
来源:
AI科技评论
◎ AI睡眠的账该怎么算?一场闭门会揭露行业「虚火」
近期,一场聚焦AI睡眠赛道的创业者闭门会在深圳举行,与会者深入探讨了睡眠设备市场的真实状况与行业痛点。讨论揭示了一个核心现实,即尽管睡眠障碍人群庞大,但真正愿意为睡眠硬件设备买单的用户基数远低于市场预期。在治疗睡眠问题时,药物仍是消费者的首选,而硬件设备和保健品处于次要地位。
失眠问题具有极强的异质性,成因涵盖昼夜节律紊乱、皮质醇异常及心理焦虑等多个方面。这种复杂性意味着不存在一款能够解决所有失眠问题的普适性产品,盲目宣称全效往往会遭到市场反噬。此外,行业缺乏前置的市场教育,消费者无法准确识别自身的失眠类型,导致产品与人群难以精准匹配,进而引发退货与差评问题。同时,人体在夜间不同睡眠阶段对…
来源:
雷峰网
◎ 斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架
分布式系统共识协议的深层逻辑漏洞检测难度极高,传统测试与单体大语言模型难以胜任。为此,研究团队提出了首个将领域知识与大模型多智能体协同深度融合的自动化测试框架Agora。该框架旨在解决分布式协议状态复杂、多节点交织导致的深层漏洞检测难题。
Agora摒弃了单体模型测试的局限,引入假说驱动测试范式,将工作流解耦为协调者、策略家和代码官三个专业化智能体。通过极简的通信机制与自动化测试闭环架构,系统能够将抽象攻击场景转化为可运行的单元测试,并在报错时进行定向自我修正。这种多智能体协同设计不仅降低了上下文传输开销,还实现了跨编程语言的环境自适应,将系统专家的逻辑推演直觉转化为智能体间的博弈与协同。…
来源:
机器之心
◎ 一线对谈丨「龙虾」过后,百度不想再卷Token了
在AI行业进入新一轮调用量竞争周期的背景下,衡量业务健康度的标准正从资源消耗转向价值创造。百度提出DAA即活跃智能体数这一新指标,旨在取代单纯的Token消耗和调用次数,核心在于衡量究竟有多少智能体在持续工作并为企业创造真实的业务价值。相较于容易统计的物理指标,该指标更贴近客户收益,反映出智能体时代的商业本质。
关于AI业务的长期健康度,单纯依赖售卖底层云资源或参与价格战并非长久之计。一个业务离客户价值越近,其发展状态就越健康。大模型调用属于标准化且无状态的服务,客户迁移成本低且粘性较弱,亏本售卖难以有效带动其他计算资源的消耗。因此,云服务商的战略重心应转向平台与应用层,通过提供能深入企业…
来源:
雷峰网
◎ 硅谷大厂,员工人均月花5万养AI
根据Ramp发布的最新AI指数,企业AI采用率正迅速逼近百分之百,研究重点已转向追踪采用强度。数据显示,按AI采用程度排名前百分之一的公司,每位员工每月在AI工具和算力上的支出高达七千五百美元,且该支出仍在持续快速增长。这些头部企业通常采取混合策略,在多个前沿模型与低成本开源模型间灵活切换。尽管支出高昂,但目前最激进的AI使用者尚未跨越AI成本超过人力成本的门槛,其人均支出仍低于美国软件工程师的平均月薪。
随着大模型单次调用成本的大幅下降,企业的AI总账单却出现显著上涨。由于自主AI智能体工具的普及显著放大了单个任务的算力消耗,部分企业的算力成本已经超过了现有的人力成本。面对暴增的预算开销…
来源:
AI前线
◎ 从0到1带你速通WorkBuddy,这可能是最适合国内的Agent产品。
针对国内用户难以使用部分海外人工智能编程与办公工具的痛点,WorkBuddy作为一款通用智能体产品,提供了兼容多操作系统的本土化解决方案,能够覆盖大部分日常办公场景。该产品支持微信扫码便捷登录,内置代码开发、日常办公和设计创意三大场景模式,并提供纯聊天、计划制定和直接执行三种工作模式。在模型选择上,系统集成了多款主流国产大模型,同时支持接入兼容外部协议的应用接口,赋予用户高度的自定义权限。
在核心功能方面,WorkBuddy构建了丰富的专家与技能生态。系统内置百余位垂直领域的智能专家,并支持多智能体协同的专家团模式,能够自动拆解并并行处理复杂任务。同时,其技能市场提供了大量实用插件,连接器…
来源:
数字生命卡兹克
◎ NPO,冲上风口
近期光通信市场对光互联技术路线的讨论引发广泛关注,共封装光学的大规模商业化落地预计将推迟至2028年之后。在此背景下,近封装光学凭借在封装良率、集成难度和成本方面的综合优势,正成为当前人工智能算力集群光互联演进的核心技术路径。随着算力芯片带宽的指数级增长,传统铜缆互连在传输距离、功耗和散热等方面逼近物理极限,机架内部从铜缆向光互联升级已成为不可逆的产业趋势。
头部科技企业的架构设计进一步确立了近封装光学的市场地位。英伟达在新一代架构中大幅增加了光学引擎的用量,华为也在其超节点设计中导入自研硅光引擎以实现全光互联,这表明该技术已成为头部人工智能架构的标配方案。相较于共封装光学,近封装光学将光…
来源:
半导体行业观察
◎ 看完 Cursor 的开发者报告,我发现写代码这件事变了
AI编程正经历从单点工具红利向系统重构的深刻转变,软件开发模式逐渐由人主导转向人设定目标与机器执行流程。AI编程已不再局限于代码编辑器,而是逐步演变为全新的软件生产基础设施。在此背景下,行业竞争的核心护城河从模型能力转向上下文管理、缓存效率及成本控制。同时,人工智能并未抹平开发者之间的能力差异,反而进一步放大了具备架构设计与任务拆解能力的高手优势。
基于真实产品数据的分析揭示了当前智能编程领域的核心趋势。首先,开发者的工作效率与产出质量显著提升,代码编写速度翻倍,单次提交的代码量与任务复杂度大幅增加,且机器生成的代码在代码库中的长期保留率创下新高。其次,在智能经济学方面,不同模型的单次请求…
来源:
硅星人Pro
◎ 每百万 Token 成本砍六成,出海 AI 团队开始重算推理这笔账
随着AI出海团队的业务重心从模型打磨转向正式服务与推理部署,算力成本与架构优化成为决定项目盈利的关键因素。在推理场景下,盲目追求高端训练卡并非最优解,合理匹配模型与硬件才是控制成本的核心。支持特定低精度格式的中端数据中心卡在显存利用和推理吞吐上展现出极高的性价比。相比之下,消费级显卡在显存容量、数据纠错机制及多卡扩展性上存在明显局限,难以支撑大规模商业化业务。
在核算推理总成本时,除图形处理器租金外,中央处理器、存储及网络流量等隐性开销同样不容忽视。尤其是多模态生成带来的庞大出站流量,往往成为推高整体账单的主要因素。通过选择具备全球骨干网优势且流量定价更具竞争力的云服务提供商,并采用多云直…
来源:
硅星人Pro
◎ 代码作为Harness!UIUC、Meta等剖析代码如何撑起 AI 智能体
AI智能体的发展正日益依赖于被称为Harness的外围软件层,而代码正是构建这一运行底座的核心媒介。代码作为智能体与外部世界交互的唯一结构化实体媒介,具备可执行、可检查和有状态三个决定性特质,为大语言模型提供了客观验证与持续执行的物理法则。这种以代码为核心的架构在接口层承担着推理、行动与环境建模的关键角色,将模型的逻辑推演转化为可验证的计算过程,并将高层意图映射为符合环境约束的具体操作。
在维持智能体运转的底层机制方面,规划机制负责将庞大任务拆解为系统层面的实体控制,记忆机制通过状态管理解决了模型上下文窗口有限的痛点,而工具调用机制则极大拓展了智能体的能力边界。这些机制共同交织成一个以验证…
来源:
AIGC开放社区
◈ 06月10日 星期三 【 10 篇 】
◎ HiDream-O1-Image-1.5 刷新国产图像生成模型纪录:砍掉 VAE,是图像模型的未来吗?
智象未来发布的HiDream-O1-Image-1.5文生图模型在Artificial Analysis榜单上跃升至第三位,展现出全球视觉生成大模型第一梯队的竞争力。通过与竞品的八维盲测对比,该模型在复杂指令遵循、细节准确性以及中文文字渲染方面表现优异,能够提供稳定、高完成度的交付物,在标准测试下展现出极强的工程落地能力。
这种优势主要源于其引入的先推理后生成机制。该模型在生成管线内部嵌入了基于思维链的推理层,在扩散模型工作前先行梳理画面逻辑,将复杂的语义指令精准翻译为空间约束。这一机制有效解决了传统文本编码器在处理高信息密度指令时权重分配不均的问题,大幅提升了对多元素、复杂场景的理解深度…
来源:
AI科技评论
◎ 能跑马拉松,却拿不稳一瓶水:具身智能的“最后一厘米”怎么破?|对话超维传感CEO
当前具身智能机器人在视觉和语言模型上取得进展,但在处理真实物理世界中充满不确定性的精细操作时,常因缺乏高精度触觉而面临力控失稳的困境。触觉被视为具身智能落地的关键环节,也是机器人进化为生产力的核心要素,其背后蕴含着万亿级的市场规模。
机器人在执行轻拿轻放矿泉水瓶等简单任务时,需经历视觉预判、接触抓握、移动调整和放置释放四个步骤。由于缺乏精确的力反馈,机器人在非结构化环境中极易出现操作失误。灵巧手要实现跨物体和跨场景的通用泛化操作,必须依赖高一致性、高可靠性和高精度的触觉信息来构建视触闭环。
为满足灵巧手的真实物理交互需求,相关研发团队借鉴人类皮肤的多维度生物学构造,采用多物理量融合感知技…
来源:
机器人前瞻
◎ OiiOii 2.0升级后,这个AI拉片功能真的震撼到我了
在AI短片创作过程中,创作者常会遇到画面与叙事难以达到预期的瓶颈。AI视频创作的核心挑战已不再是技术生成,而是创作者的审美、整体调度与叙事能力。为突破这一瓶颈,团队选择暂停创作,转向剧本学习与影视拉片。然而,传统拉片工作繁琐且门槛较高,需要耗费大量时间进行暂停、记录与结构分析。
为提升学习效率,创作者引入了OiiOii AI视频创作工具。该工具的拉片复刻功能能够自动对视频进行多维度分析与拆解,将人物、动作、场景变化及镜头组织方式直观呈现。这种拆解将原本模糊的视觉感受具象化,使创作者能将精力集中于思考创作决策,而非消耗在基础素材整理上。通过上传参考视频进行复刻练习,创作者可以更具体地学习视频…
来源:
AI产品阿颖
◎ 抖音征召天下「AI视频英才」!创作者们,这次是真能吃上AI红利了…
抖音近期发起了一项总奖池高达四百万元现金与两千万积分的人工智能创作大赛,旨在征召视频方向的创作者,单人最高可获得百万元奖金。技术进步虽然抬高了智能视频行业的下限,但决定内容天花板的核心依然是故事与创造力。高质量的智能视频创作并非易事,创作者需要进行大量前期准备,包括构建详细的世界观背景、设计精细的人物资产卡以及规划复杂的分镜与动作轨迹,这对创作者的人生体验、阅片量、审美及持续输出能力提出了极高要求。
当前智能视频市场正面临原创内容匮乏与普通视频泛滥的双重局面,海量低质内容容易引发劣币驱逐良币的效应。平台与专家的背书能够作为有效信号,帮助优秀创作者在信息不对称的环境中脱颖而出。此次大赛将内容…
来源:
量子位
◎ 当行业还在卷模型,腾讯在谈怎么让 Agent 上班
在二零二六年腾讯云人工智能产业应用大会上,二十余款人工智能原生产品集中亮相,标志着智能体正全面进入企业核心工作场景。当前企业级智能体落地普遍面临用不起来、用不放心和用不起三大现实挑战,这些痛点主要源于模型之外的场景脱节、安全合规以及成本门槛问题。为应对这些挑战,腾讯云围绕场景连接力、工程驾驭力和模型驱动力构建全链路基础设施,推动智能体真正融入企业生产流程。
在场景连接力方面,核心在于打通数据与流程,解决数据孤岛问题。通过推出面向大数据全链路的智能体工作台以及高性能并行文件存储产品,企业能够实现数据的高效流转与全仓自动扫描。坚实的数据底座结合无缝嵌入营销、办公、运维等核心场景的智能体应用,使…
来源:
极客公园
◎ SwarmFlow来了!openJiuwen开创蜂群可控协同新范式
AI Agent 正从单兵作战向团队协作演进,以应对单个智能体难以独立完成的复杂任务。在多智能体协作中,依赖领导者智能体临场调度的传统模式面临领导者成为瓶颈、执行过程不稳定以及结果不可靠等痛点。为此,openJiuwen 社区开源了 SwarmFlow,这是一种面向多智能体团队的可控工作流编排工具,旨在解决复杂任务协作流程的稳定执行问题。
SwarmFlow 的核心思路是将编排与智能分离,即编排归系统,智能归智能体。该工具将协作关系和流程管理交由系统按程序稳定执行,而将具体的理解和推理任务留给智能体处理。这不仅减轻了领导者智能体的负担,还显著提升了协作的确定性和可复用性。作为团队协作能力包…
来源:
机器之心
◎ Meshy 做出了全球首个 3D Agent,3D 资产生产进入新拐点
当前3D打印硬件门槛已大幅降低,但模型获取仍面临建模学习成本高、搜索匹配度低及定制昂贵等痛点。为此,Meshy发布了全球首个3D创作智能体,通过多轮对话实现从概念探索到模型导出的完整流程,能够深度理解用户意图并一次性产出风格统一的资产。
3D领域的智能体化面临模型结构、格式适配及生产常识等复杂挑战。3D智能体的核心难点不仅在于生成质量,更在于对从想法到成品整个创作链路的深度理解。Meshy将过去积累的AI三维创作关键能力进行整合沉淀,使用户无需掌握专业参数和复杂工具,只需表达目标即可将模糊想法逐步推进为可用的三维资产。
在实际应用中,该智能体展现出强大的场景适配与执行能力。在3D打印场景…
来源:
硅星人Pro
◎ AI竞赛下半场:忘掉聊天机器人,入口与执行权定生死
当前人工智能行业的竞争焦点已从模型智力转向智能体的入口、上下文和执行权限。大模型提供基础智力,而掌握用户高频使用入口与执行权限才是构建未来商业护城河的关键。第三次入口战争的核心在于争夺执行发生的许可,交互逻辑正从用户主动操作应用转变为智能体自动推断意图并调用资源完成任务。一旦用户形成默认授权习惯,极高的切换成本将锁定未来的行业格局。
在全球市场,四大科技巨头正从不同方向争夺数字世界的征税权。苹果依托硬件特权与隐私结界深耕端侧,Meta利用庞大的社交流量截获商业意图,微软通过工作流深度绑定企业办公场景,谷歌则试图在搜索生态与端侧智能间实现自我颠覆。然而,没有任何一家巨头能够同时完美兼具触点、…
来源:
钛媒体AGI
◎ 万人内测,科研神器爆火实验室!4h肝出论文初稿,全自动接管科研
由深度原理团队开发的科研AI工具SciClaw经过内测后正式升级为Mira,首次将Vibe Researching理念产品化,旨在解决科研工作者在不同工具间频繁切换导致的认知成本问题。Mira的核心升级在于不预设固定的科研流程,而是提供支撑研究者自由定义全流程的能力,让研究人员能够像组建实验室团队一样配置AI。 此次升级推出了专家小队、科研画布和WIKI三大核心功能。
专家小队模式打破了传统自动化科研工具固定工作流的限制,提供空白的队伍配置面板。用户可以根据需求自定义文献检索、代码执行、数据可视化等AI队员的分工与协作顺序,从而实现高度个性化的科研流程配置。 这种模式极大提升了研究效率,使…
来源:
新智元
◎ “零数据”机器人来了,验证两月即可上岗!这群清华博士破局世界模型,靠“本能”让机器人上手就会
当前主流的具身智能技术路线如视觉语言动作模型和世界模型,主要依赖海量数据驱动,但在真实物理交互的执行侧面临接触不可预测与硬件本体微小差异的巨大挑战。视觉上的预测能力往往掩盖了物理执行层面的局限性,导致数据驱动路线难以实现真正的泛化与落地。针对这一困局,橡木果机器人团队结合机械工程与神经科学的跨界研究,提出了一种基于本能驱动而非单纯数据拟合的全新底层机制。
该团队认为,操作的本质是力学行为与物理规律,人类的通用操作能力源于先天本能而非后天的海量数据学习。基于此理念,研发团队提炼出定向、探索和执行交互三类操作本能,并历经多年突破了微米级滑移感知技术。这使得机器人能够在无需预设程序或示范数据的情…
来源:
AI前线
◈ 06月09日 星期二 【 10 篇 】
◎ 没有星图和蒲公英的海外市场,品牌的百亿预算怎么花?
海外达人营销市场近年来规模快速增长,为品牌带来显著曝光效果,但实际操作中却面临流程繁琐、缺乏统一基础设施的痛点。由于海外市场呈现极度分散的格局,品牌方与达人之间的发现、建联、议价、执行等环节耗费大量人力。传统自建团队或外包模式均受制于人力天花板,导致中小规模创业团队难以实现规模化增长,大量中长尾达人也因此被排除在合作之外。
针对这一行业困境,人工智能技术正被深度应用于重塑海外达人营销流程,通过打造AI原生双边平台来大幅提升效能并解决信任难题。相关平台利用AI接管匹配、建联、催稿等大量重复性工作,将复杂的合作流程压缩为品牌方在关键节点的少数几次决策,并无缝接入企业日常办公工具。这种模式不仅让…
来源:
极客公园
◎ 3D 还是 2D?哥大李昀烛:通用机器人基础模型需要走向「中间地带」| ICRA 2026
在ICRA 2026学术会议上,哥伦比亚大学学者针对具身智能领域真实物理交互数据采集成本极高且模型评估困难的核心痛点,提出将结构化世界模型作为机器人策略训练与评估的可扩展数据引擎。该研究开辟了一条融合纯端到端大模型与纯物理引擎优势的中间路线,旨在突破机器人基础模型的数据瓶颈。
在策略评估方面,研究团队利用3D高斯溅射与结构化世界模型,为复杂的柔性物体构建了高精度数字孪生系统。该系统实现了仿真与现实的高度对齐,使得大规模的并行策略评估成为可能,有效解决了真实机器人测试效率低下的问题。通过严格控制测试协议与初始状态的一致性,数字仿真环境在成功率预测上与真实环境表现出极高的线性相关性,能够准确筛…
来源:
AI科技评论
◎ 新架构模型HRM-Text创新纪录!1B参数、1000美元,图灵奖得主都亲自下场了
Sapient Intelligence发布的约1B参数语言模型HRM-Text在MATH、GSM8K和ARC-Challenge等推理基准测试中取得了优异成绩。其训练成本仅约1500美元,且从零预训练的数据使用量远低于主流同级模型。该模型证明了在有限数据和算力条件下,通过架构与训练目标的协同设计,能够显著提升基础模型的预训练效率。
在核心技术层面,HRM-Text实现了计算架构与训练目标的双重创新。在架构方面,模型引入了高低层双时间尺度模块,使有限参数在输出前进行多轮内部递归计算,从而有效增加了计算深度。为克服深层递归易导致的梯度消失或爆炸问题,研究引入了MagicNorm归一化与渐进式…
来源:
机器之心
◎ 普渡大学Aniket Bera教授:可靠自主机器人的「安全阀」,藏在“可检查接口”里 | ICRA 2026
当前多数自主系统的成功往往依赖简化环境,如为机械臂设置物理围栏或让自动驾驶车辆依赖高精地图,这本质上是人为铺设的外部脚手架。真正的自主性要求拆掉这些温室脚手架,让机器人在非结构化和以人为中心的真实环境中实现安全导航。
针对当前自主系统的结构性研发缺陷,研究提出了“学习负责提议,结构负责决策”的核心框架。在此范式下,视觉感知或大语言模型等学习型模块不应直接输出最终控制指令,而是必须通过可检查接口,输出可被形式化方法验证和约束求解器审查的结构化结果。学习赋予机器人灵活性,而结构赋予它们可靠性,二者是将自主系统推向真实世界的必由之路。
该核心框架贯穿于四大研究支柱。在感知方面,感知模块必须输出…
来源:
AI科技评论
◎ 抢到机器人落地入场券!具身首个超级合并诞生,阿里商汤智谱都投了
具身智能行业正经历从依赖数据采集与仿真的“采集型Scaling”向直接在真实业务中生产数据的“场景型Scaling”转变。原力灵机宣布通过股权并购完成与机器人公司Atomix的合并,并同步完成由多家大模型公司与产业资本参与的新一轮融资,构建起同时拥有模型与场景的超级组合。这一合并使得机器人机队产生的海量真实作业数据能直接用于大模型训练,模型能力的提升又能即刻部署到实际场景中,从而构建起数据飞轮。
在探索具身智能基础任务时,Picking(抓取与放置)被视为驱动数据飞轮运转的关键入口。Picking任务不仅拥有全球物流仓库每天产生的大规模真实数据来源,还具备基于物理定律的天然可验证反馈机制,…
来源:
机器人前瞻
◎ 腾讯想让企业打开AI的方式只剩一个
当前企业在应用人工智能时普遍面临员工个人提效但组织协同停滞的痛点,大量计算资源未能转化为组织生产力。为解决此问题,腾讯云发布WorkBuddy企业版,定位为企业人工智能办公统一入口,推动应用从赋能超级个体向打造超级团队转变。其核心逻辑从单点工具交互升级为工作流协同,确保任务启动、角色协同、上下文共享及经验复用。
WorkBuddy企业版通过专家、助理和团队三层能力设计,实现了岗位经验封装、云端全天候服务及人机共享项目空间的深度融合。该设计让数字员工自动理解场景并调用企业知识,使协作技能沉淀为团队资产,构建起员工使用、团队协同、资产沉淀到组织生产力持续释放的自增强飞轮。
在底层架构上,腾讯…
来源:
量子位
◎ 帮大家总结了一下凌晨的苹果WWDC26。
苹果WWDC 2026发布会以平稳的姿态落幕,这也是蒂姆·库克作为首席执行官最后一次主持该活动,整场发布会的核心主题全面聚焦于人工智能技术的深度整合与应用。
在底层架构方面,Apple Intelligence迎来了重大革新。苹果宣布与Google Gemini展开深度合作,构建专属云计算基础设施,并推出基础版与高级版双端侧模型。全新引入的系统编排器能够有效协调个人上下文理解、广泛世界知识、应用操作执行以及屏幕感知四大核心能力,同时重申了端到端加密和数据不留痕的严格隐私保护承诺。
语音助手迎来了实质性进化并被正式命名为Siri AI。新版助手基于全新架构大幅提升了连续对话与上下文理解能力…
来源:
数字生命卡兹克
◎ 首个企业IT运维Agent基准,Claude拿第一也才47%
Artificial Analysis与IBM联合推出了首个专门针对企业级IT任务的智能体基准测试ITBench-AA,旨在填补现有通用评测标准在高度专业化的企业运维领域的空白。该基准首期聚焦于站点可靠性工程师任务,后续将扩展至财务运营和信息安全方向。在真实的容器编排故障排查场景中,所有参与测试的前沿大模型得分均未超过50%,表明当前人工智能在处理复杂企业级运维任务时仍面临巨大挑战。
该测试包含59道贴近真实业务的排障题目,要求模型通过分析告警、日志、链路追踪等数据,精准定位导致故障的最小独立根因实体集合。评测采用全召回条件下的平均精度作为严格的评分规则,漏报真实根因将直接导致该次得分归零…
来源:
AIGC开放社区
◎ HBM,太热了!
随着人工智能芯片功耗逼近千瓦大关以及高带宽内存堆叠层数不断增加,存储芯片行业的竞争主轴正发生根本性位移。谁能让芯片有效降温,谁就能掌握下一代算力的核心优势。过去高带宽内存市场的竞争主要聚焦于堆叠层数与传输带宽,如今三大存储巨头已不约而同地将研发重心转向热管理领域。
散热升级为刚需是由多重因素共同驱动的。人工智能芯片功耗的代际暴涨使得传统风冷触及物理极限,而内存垂直堆叠的夹层式架构引发了严重的层间热阻问题。此外,物理层接口局部热失控风险加剧,叠加头部客户对热控能力的强势倒逼,热管理必须深度融入芯片布局与封装设计,从源头切断积热隐患。
面对热挑战,存储巨头探索出差异化的技术路径。三星展示的全…
来源:
半导体行业观察
◎ 阿里RTPurboV2:原生Transformer再次崛起,百步训练实现10倍稀疏注意
随着大模型应用中长序列需求的增加,传统全注意力机制因计算复杂度高而成为性能瓶颈。阿里团队推出了第二代注意力压缩技术,旨在彻底解决全注意力机制在超长序列下的推理瓶颈。该技术通过结合逐头压缩、低秩投影压缩以及聚类技术,在保留大部分滑动窗口注意力的基础上,对剩余的全注意力部分实现了极高的计算压缩。
研究表明,全注意力模型在预训练中已自发形成高度稀疏的结构。约85%的流式注意力头天然适配滑动窗口机制,而真正需要优化的是负责长距离信息召回的15%召回头。针对召回头,研究发现长程检索主要由旋转位置编码的低维子空间主导,高频分量会引入距离干扰。因此,通过低秩投影保留低频语义分量并过滤高频噪声,可大幅压缩…
来源:
机器之心
◈ 06月07日 星期日 【 5 篇 】
◎ AI真能学会心算?隐式思维链首次得到理论证明,Stuart Russell参与
当前AI推理模型在处理复杂任务时依赖显式思维链,逐个生成中间思考标记,导致推理延迟高且计算成本昂贵。为解决这一结构性问题,研究人员提出了隐式思维链技术,旨在让模型将中间推理步骤内化到隐藏状态中,在不输出任何中间步骤的情况下保留强大的推理能力。来自加州大学伯克利分校和普林斯顿大学的研究团队在此基础上迈出了关键一步,不仅提出了新的训练方法,还首次给出了严格的数学证明。
先前的隐式思维链训练方法存在训练阶段随推理链长度线性增长的问题,且缺乏理论上的有效性保证。新研究洞察到思维链具有树状结构,并据此提出了对数级隐式思维链方法,通过一次性隐藏树的整层节点,将训练阶段大幅缩减至对数级别。 这一设计使训…
来源:
机器之心
◎ 那些差点被“贱卖”的芯片公司
在半导体行业发展中,部分曾因监管干预或并购失败的芯片资产,凭借在AI基础设施关键节点的技术卡位,实现了显著的价值重估。这些企业的技术壁垒在AI训练、推理及边缘智能等新需求驱动下被重新验证,证明半导体行业最珍贵的资产是长期占据关键位置的底层能力。
高塔半导体在收购计划终止后,依托硅光子技术与特色工艺迎来高速增长。面对AI服务器数据流量激增带来的传输瓶颈,硅光成为基础设施核心方向。高塔半导体不仅斩获巨额硅光收入合同,还通过重组日本工厂强化300mm产能,巩固了特色工艺竞争优势。
铠侠经历周期低谷与并购阻碍后,借由AI推理和企业级固态硬盘需求爆发实现市值跃升。通过引入直接键合阵列技术提升闪存读…
来源:
半导体行业观察
◎ 5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
当前AI视频生成领域在长视频制作上面临角色一致性差、生成速度慢及修改成本高等瓶颈,限制了其规模化商业应用。针对这些行业痛点,京东团队开源了长音视频生成框架JoyAI-Echo,旨在推动长视频生成技术向实际生产工具演进。该框架通过跨模态音视频记忆库、记忆驱动后训练、轻量化实时超分以及Director Agent等核心技术,全面提升了长视频生成的稳定性、效率与可控性。
在解决角色和声音前后不一致的问题上,JoyAI-Echo引入了跨模态音视频记忆库。该机制通过提取并绑定人物的视觉与声音特征,在后续生成中持续调用关键身份信息,从而确保数分钟长视频内角色外观与音色的高度一致。 为提升生成效率,框架…
来源:
量子位
◎ 用什么 AI 暴露了你的阶层?没那么简单
一项针对美国成年人的联合调查揭示了不同AI产品的用户收入分布存在显著差异。这种差异并非源于用户的阶级身份选择,而是由AI产品的商业模式、定价策略和分发渠道所决定的。
在高端市场,Claude的用户群体严重偏向高收入人群。这源于其严格的免费版限制和高昂的订阅费用,加上需要用户主动检索和注册,天然筛选出年轻、懂技术且具备付费能力的早期采用者。相反,Meta AI的用户中低收入群体占比较高。由于其深度嵌入在成熟的社交应用中,用户无需额外下载或付费即可体验,极低的获取门槛和天然的生态优势使其覆盖了更广泛的下沉市场。
处于中间地带的ChatGPT、Gemini和Copilot等产品,其用户收入分布…
来源:
硅星人Pro
◎ 本周 AI 项目推荐:Seele、喵吉托、SodaGame……AI游戏产品不再迷恋“一句话生成”
过去两年,人工智能游戏主要停留在一键生成演示阶段,这类作品虽适合展示模型能力,但难以实现真正的玩家留存与商业化转化。当前,该领域正经历深刻转型,单纯证明生成能力已无法满足发展需求,行业焦点全面转向让人工智能理解游戏机制、融入真实生产流程并支撑商业化落地。一键生成游戏的演示时代正在过去,下一阶段的竞争核心在于寻找真正成立的人工智能原生游戏逻辑。
在技术演进与底层架构方面,部分企业致力于从生成单一素材向理解并驱动完整游戏世界跨越。通过构建多模态大模型与世界模型,人工智能被赋予理解空间、物理反馈、状态规则与因果关系的能力,从而生成可交互且持续演化的动态系统。同时,一些团队将内部开发管线产品化,打…
来源:
硅星人Pro
◈ 06月06日 星期六 【 9 篇 】
◎ 美股一夜蒸发2万亿!ASI三巨兽上市前夜,整个华尔街被抽干
近期美国股市遭遇剧烈震荡,总市值一夜蒸发约2万亿美元,其中芯片板块受创尤为严重,费城半导体指数创下近年来最大单日跌幅。人工智能股票目前已占据美国股市总市值的40%,极高的市场集中度引发了对类似互联网泡沫破裂的担忧。此次暴跌的直接导火索包括博通财报未上调全年人工智能收入目标,以及英伟达下一代芯片内存需求预期大幅下调,导致供应链相关企业业绩预期受损。此外,强劲的非农就业数据打破了市场对美联储年内降息的预期,进一步加剧了抛售情绪。
在市场下跌的背后,全球流动性正面临巨大的抽水压力。多家估值超万亿美元的科技与人工智能巨头正密集筹备上市或进行大规模股权融资,导致市场资金被严重分流。SpaceX、Op…
来源:
新智元
◎ Anthropic 被曝雇1000名人类工程师“培训”Claude Code,时薪280美元:AI 编程越进化越离不开真人兜底
Anthropic正通过代号为Marlin的项目提升其AI编程工具Claude Code的表现。该项目引入约一千名具备软件工程背景的人类承包商,对模型输出进行高质量反馈,旨在使生成的代码更干净、可靠且易于维护。承包商通过模拟真实开发场景,对模型生成的代码进行测试和审查,从正确性、安全性和可维护性等维度评估代码。这反映出数据标注行业正从低门槛重复性劳动向专业化方向发生结构性变化。
尽管AI编程工具正被推向更复杂的工程场景,但用户反馈显示其在处理复杂任务时存在能力退化现象。当模型思考深度下降时,其工作模式会从先研究再修改转向先编辑少研究,导致多步骤推理和遵循项目约定等能力下降。为弥补当前能力的…
来源:
AI前线
◎ DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录
随着人工智能在数学领域的产出速度远超人类的验证能力,数学界正面临验证危机。利用形式化定理证明让机器验证生成的证明,成为解决该危机的核心路径。针对现有系统成本高的问题,普林斯顿大学团队提出了Goedel-Architect智能体框架,基于DeepSeek-V4-Flash模型大幅降低了计算成本。
Goedel-Architect的核心创新在于引入“蓝图”机制与蓝图精炼策略。与传统递归分解不同,该系统在证明前生成一张包含引理及依赖关系的有向无环图作为全局视图,允许证明器并行处理节点。当证明失败时,系统会生成诊断报告:若命题有误,则提取反例原因并修正陈述;若证明过于复杂,则将节点拆分为更易处理的…
来源:
机器之心
◎ 大模型发展三年半,AI圈终于等来了一场“不要大厂,只赌脑洞”的比赛
B站正式推出“build in bilibili·AI创造公开赛”,这标志着一种不限技术门槛、专业背景和年龄的“全民创造”AI比赛新范式出现。与传统的黑客松或创投型比赛不同,该赛事不限制主题与赛道,鼓励零基础普通人、兴趣创作者及小团队借助大模型能力将想法转化为可运行、可交互的产品原型。这种模式打破了以往AI项目对精英团队和算力资源的依赖,使洞察痛点成为核心竞争力。
赛事的核心创新在于将产品的诞生过程纳入比赛本身,实现了真正的公开构建。参赛者被鼓励在平台上连载更新整个创造过程,从最初的想法、第一版原型到后续的版本迭代,均在公众视野下进行。依托独特的社区生态,观众可以通过弹幕提出需求、在评论区…
来源:
量子位
◎ 视频AI卷向5分钟:全量开源,一次生成,正式告别「盲盒抽卡」
当前AI视频生成技术在处理分钟级长视频时,常面临角色形象改变、声音不一致以及修改成本高昂等瓶颈,难以真正融入专业内容生产工作流。针对这一行业痛点,京东近期开源了长音视频生成框架JoyAI-Echo,成功实现了长达五分钟的跨镜头音视频双重一致性。该框架不仅保证了角色面部特征和说话音色在长时序和复杂多视角下的统一,还打破了传统盲盒式生成的局限,支持通过自然语言指令进行局部修改与非线性剪辑。
在技术创新方面,JoyAI-Echo构建了百万级身份向心型视频语料库,从数据源头解决了角色变脸问题。同时,模型采用了基于槽位配对的音视频记忆交互机制,将角色的面部与声音进行直接绑定,有效防止了跨事件中的人脸…
来源:
机器之心
◎ a16z 合伙人:大模型吃掉通用任务,创业公司吃掉垂直行业
当前AI应用领域面临着大模型公司能力不断增强的挑战,引发了关于应用层创业公司生存空间的广泛探讨。大模型公司的主攻方向集中在代码生成、写作等通用任务上,这构成了创业公司的禁区,但在这些通用任务之外,大量复杂且垂直的行业问题为大模型公司所不及,成为了创业公司的真正机遇。
为了在激烈的竞争中守住阵地,创业公司可以构建四道核心护城河。首先是基于行业隐性知识积累的数据飞轮,通过跨客户和单客户内部的模式识别,将不成文的行业惯例内化为系统能力。其次是管理模型变化与复杂性的灵活性,能够跨厂商为不同子任务选择最优模型,并帮助客户吸收模型迁移的成本。第三是成本优化优势,通过按任务难度分级路由,为工作流匹配最具…
来源:
硅星人Pro
◎ 热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿
当前AI应用公司面临严峻的算力账单挑战,对于Agent产品而言,token毛利通常需要达到30%以上才能使商业模式进入可循环状态。在模型厂商下调单价的背景下,控制单次任务的实际消耗量成为企业生存的核心。为此,在应用和底层模型之间增加一层运行中枢变得至关重要。由基元律动开发的开源框架OpenSquilla,正是致力于降低运行过程中的浪费率,并凭借该技术理念完成了高估值融资。
该框架通过四个核心环节实现成本与能力的优化。首先是智能路由机制,系统在任务进入模型前判断复杂度,并将其匹配到最合适的模型。这种将成本从事后结算转变为调用前决策的方式,有效避免了所有步骤均调用昂贵模型带来的浪费,在保证精度…
来源:
硅星人Pro
◎ DRAM,终遇寒冬?
存储器行业长期以来被投资界视为科技领域的底端和典型的周期性商品市场,但近期该行业涌现出多家市值和利润极高的巨头,其底层商业逻辑正在发生深刻转变。过去几十年,存储产品因高度标准化和可互换性而呈现强烈的商品属性,价格完全由供需周期决定。然而,三大存储制造商在近期不约而同地选择削减成熟产品的产能,这一供给侧的集体决策直接引发了内存价格的飙升,展现出企业前所未有的定价自主权。
这种转变的核心在于存储产品的去商品化进程。存储器正通过定制化设计和物理不可互换性,逐渐摆脱传统商品的同质化特征。 以高带宽内存为代表的前沿产品,不仅绕过了传统的通用标准,还深度绑定特定加速器,使得产品无法被竞争对手轻易替换。…
来源:
半导体行业观察
◎ AI芯片,引爆电力危机
随着人工智能技术的飞速发展,人工智能数据中心正面临电力消耗达到极限的严峻挑战。为了满足不断增长的算力需求,芯片制造商推出了功能更强大的图形处理单元,导致新一代数据中心的耗电量呈数倍增长。这种“人工智能工厂”消耗的巨大电力不仅加剧了碳排放,还可能推高电价,能源短缺已成为阻碍人工智能繁荣发展的最大制约因素之一。
面对电力需求的指数级增长,行业关键参与者正在重新构想数据中心的设计、建设与供电方式。传统数据中心依赖中央处理器,而人工智能数据中心采用高密度的图形处理单元,单个机架的芯片数量和功耗大幅攀升。此外,庞大的冷却系统和长距离电力传输也造成了显著的能源损耗。为提升能源效率,企业开始采用液冷技术…
来源:
半导体行业观察




这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看