❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 06月16日 星期二 【 1 篇 】
◎ 谈谈腾讯新出的马维斯,和它对让用户不折腾的坚持
过去几十年的电脑交互方式一直要求人类去适应机器的复杂规则,而腾讯推出的新一代人工智能产品Marvis正在改变这一现状。该产品作为一款操作系统层级的个人助手,能够深入系统底层直接接管文件、网页、应用及部分系统操作,使电脑从被动等待指令的工具转变为主动理解并实现用户目标的智能设备。这种转变极大地降低了电脑的使用门槛,让用户能够通过自然语言轻松完成系统检查、故障排查等以往需要繁琐操作的任务。
Marvis的核心优势在于其预置的多个智能代理,这些代理能够协同处理各类复杂任务。用户只需提出目标,系统便会自动调度相应的代理完成文件搜索与传输、软件推荐与安全安装以及文档整理等工作。此外,该产品实现了手机…
来源:
AI产品阿颖
◈ 06月15日 星期一 【 10 篇 】
◎ 腾讯Robotics X开源HyVLA-0.5:基于亚毫米级指套UMI与真机强化,摆脱繁重遥操
腾讯联合多个团队发布了面向真实世界机器人操作任务的端到端具身智能模型HyVLA-0.5。该模型基于自研的高精度指套式数据采集软硬件,构建了超过一万小时的人类示教数据集,使模型在无需遥操作数据的情况下也能在多本体真机任务中实现高部署成功率。在模型架构方面,系统引入了基于流匹配的行动专家模块和紧凑记忆编码器,将视觉语言理解与动作生成解耦,并通过增量式动作块表示降低对特定机器人结构的依赖,为跨本体迁移奠定基础。
在训练与优化流程上,模型首先在大规模人类示教数据上进行持续预训练以学习通用行动先验,随后通过双轨监督微调验证同本体适配与跨本体迁移能力。在后训练阶段,研究团队首次将偏好优化算法系统性引入…
来源:
机器之心
◎ 国产 Coding 争霸赛:MiniMax 爆冷登顶,DeepSeek 性价比称王
近期一项针对五款国产旗舰大模型代码能力的评测显示,大模型的代码能力已从单纯的算法编写,进化为衡量逻辑推理、工具使用及实际工程生产力的基础设施级指标。此次评测摒弃了传统的刷题跑分模式,采用真实工程任务结合裁判模型量化评分的方式,从可运行性、正确性、可读性和可维护性四个维度对五款主流模型进行了深度测试。
评测设置了两大核心任务:从零交付完整的优惠券系统以及高并发秒杀代码的故障诊断与修复。在系统构建任务中,所有模型在需求澄清环节均未展现出主动追问的工程师素养,且在复杂架构的从零生成上普遍存在痛点。部分模型在架构设计上表现优异,但在核心代码实现和最终一致性补偿等关键细节上各有疏漏。相比之下,在故障…
来源:
AI科技评论
◎ 2026年上半年,460亿砸向具身智能,只“养肥”20家企业?
2026年上半年,国内具身智能及机器人领域共发生288起融资事件,披露融资总额超460亿元。资金分配呈现极度失衡的马太效应,约七成资金流入了排名前20的头部企业。其中,排名前五的企业吸金能力尤为突出,而剩余两百多家企业仅分得少量资金,资本壁垒的构筑速度远超技术迭代速度。
在出资方结构上,产业大厂资本和地方国资已取代传统财务VC,成为大额融资的主要出资人。互联网巨头通过投资具身智能企业来押注下一代物理世界入口并完善AI生态;垂直制造龙头旨在锁定核心零部件的供应链话语权;地方国资则通过重资本托底,以资本换取企业在当地的产业落地与税收回报。
从产业链环节来看,整机企业占据了绝大部分融资额度,是…
来源:
钛媒体AGI
◎ AI「投胎」物理世界,第一志愿选了AI汽车
2026年被标记为物理智能的元年,人工智能开始从数字空间向物理世界延伸,具备感知环境、理解因果和实时控制实体的能力。在众多物理载体中,汽车成为了首个规模化落地的方向。物理智能找到了第一个规模化的落地方向,而AIVA恰好长出了那个方向最完整的形状。AIVA被定义为一个硅基生命体,其核心是一个具备长记忆、跨场景推理和主动执行任务能力的智能代理,而非传统的语音助手或后装应用。
AIVA提出了先有智能再有车的理念,围绕跨数据模态和跨任务类型的物理智能来设计车辆。汽车不再是单纯加装智能助手的硬件,而是物理智能实现交互的最佳载体。其首款量产车型计划于2026年内亮相,概念车设计更是从生命感出发,赋予车…
来源:
量子位
◎ 对话夏勇峰:做了 6 年,我亲手按下 AI 眼镜的暂停键
蜂巢科技创始人夏勇峰近期做出了暂停全年智能眼镜新品计划的决定,这一举措反映了对AI硬件发展路径的重新审视。过去几年,行业普遍采用在原有硬件形态上叠加AI能力的模式,但给硬件加AI可能并不是真正通向AI硬件的正确路径。随着AI大模型技术的快速飞跃,行业发展逻辑正在发生转变,核心思路应从“为硬件加AI”转向“为AI造硬件”。在当前阶段,大模型才是真正的核心价值,硬件不应抢占主角,而应成为AI进入现实世界的最小必要载体。
智能眼镜等现有硬件并非当前承载AI的最佳首选。用户购买眼镜时,佩戴舒适度和外观设计等基础属性的优先级远高于AI能力。如果继续沿着传统硬件优化的路径死磕细节,可能会错失定义AI原…
来源:
极客公园
◎ 谷歌搜索开始“盯梢”:主动式AI智能体悄然上线
谷歌在AI Mode中推出信息智能体,标志着主动式人工智能正从概念迈向可收费与可分层的新赛道。这一变化将人工智能产品从被动响应推向主动执行,系统能够在后台持续监测信息并在条件满足时主动推送结果。传统搜索解决即时需求,而后台监测则转化为长期任务,实现了从一次性交互向持续性委托的角色转换。
在商业模式方面,信息智能体率先面向高端订阅用户开放,反映出人工智能服务的定价逻辑正从单次能力峰值转向持续占用系统资源的服务时长。用户付费购买的是一段被持续看护的信息代理时间。对于高频决策者和从业者而言,第一时间获取高度匹配的更新具有可量化的效率收益,这种价值更适合通过高客单价订阅来承接,从而重写人工智能订阅…
来源:
钛媒体AGI
◎ 钨退钼进,势不可挡?
近期,SK海力士完成375层3D NAND闪存生产验证并计划年底量产,其核心变革在于字线金属栅极首次引入钼材料取代钨薄膜。三星、美光等存储巨头也已相继布局,全球半导体行业正迎来从钨向钼切换的材料替代拐点,钼金属成为支撑300层以上超高堆叠NAND闪存落地的核心关键材料。
这种技术转向源于3D NAND层数攀升带来的物理与工艺极限挑战。突破300层后,传统钨材料电阻率激增、阻挡层挤占空间及CVD工艺填充困难等缺陷彻底暴露。相比之下,钼在纳米尺度下电阻率增幅更小,无需阻挡层即可节省大量垂直空间,且完美适配ALD原子层沉积技术,能大幅提升制造良率与可靠性。
钼材料的应用场景正从NAND向更广阔…
来源:
半导体行业观察
◎ Prompt该退环境了,未来属于Loop Engineering。
近期,AI行业出现了一个新概念“循环工程”(Loop Engineering),标志着AI智能体应用方式的重大转变。开发者不再需要手动编写单次任务的提示词,而是通过设计自动化循环机制,让智能体自主编排并执行任务。这一概念继提示工程、上下文工程和约束工程之后,成为AI领域的第四次工程范式跃迁。
一个完整的循环工程系统由五个核心组件构成:驱动循环启动的定时任务、确保多智能体并行互不干扰的工作树隔离、维持跨会话记忆与规则的项目知识体系、连接外部真实工作环境的连接器,以及负责独立检验输出结果的子智能体。这套架构将传统的单轮人机交互转化为全自动的流水线,使智能体能够在无人值守的状态下持续运行并完成复…
来源:
数字生命卡兹克
◎ 笃信“数据即智能”,这个海淀新星要造物理空间版ImageNet
星忆智能致力于构建物理空间版数据集,通过采集高质量的真实世界数据来加速具身智能的演进。在机器人领域,数据决定了模型上限,而当前具身智能面临的核心卡点正是缺乏大规模、对齐的真实操作数据。为此,星忆聚焦于人类第一视角数据的采集,认为人类的行为姿态中蕴含着训练机器人的正确答案。
在数据采集的技术路线上,星忆智能追求高精度、高自由度以及包含真实物理反馈的触觉数据。与传统的仿真数据或真机遥操不同,该公司利用自研算法在复杂真实场景中实现毫米级的手部位姿提取,并克服了遮挡问题。同时,通过引入高灵敏度的触觉手套,星忆能够采集到机器人在执行精细任务时所需的力度反馈,从而赋予机器人更强大的泛化与操作能力,使其…
来源:
硅星人Pro
◎ 网件反咬TP-Link:「美国公司」是骗局,本质仍是中国企业;乌克兰使用AI无人机自主猎杀俄士兵;山姆客服回应极速达买到临期商品
近期科技与商业领域发生多项重要事件,涵盖人工智能、操作系统及新能源汽车等赛道。华为宣布鸿蒙操作系统彻底告别安卓并移除兼容层,同时宣告麒麟芯片全面回归,标志着其突破技术封锁取得关键进展。网件反诉TP-Link,指控其“美国公司”身份为虚假宣传,指出其研发生产核心仍在中国。百度搜索疑似调整AI搜索权重,自然网页链接重新优先展示,平衡了AI整合与用户体验。
国内互联网及商业消费领域动态频繁。阿里巴巴否认首席科学家离职传闻,小米18系列因芯片成本上涨预计起售价突破5000元,网易多名核心制作人入职4399显示出游戏行业的人才流动。合规方面,携程因数据出境违规被罚1000万元,中国软件因恶意串标被禁…
来源:
雷峰网
◈ 06月14日 星期日 【 1 篇 】
◎ 硅星人Eval Eps.3 | 8个AI押世界杯:西班牙被押爆,亚马尔成了安全牌
在针对全球八个主流智能体进行的世界杯预测评测中,测试的核心目的并非检验人工智能对足球领域的专业理解,而是考察其在进行预测时,究竟是做出独立判断,还是仅仅将公开共识进行语言包装与复述。评测要求各个模型对十二个小组的排名、冠军归属及各项个人奖项给出详细预测,并严格标注置信度与信息源,以此来全面评估其信息获取与推理能力。
在总体预测结果方面,多数模型表现出高度的一致性,绝大多数将西班牙或法国视为夺冠热门,并将核心个人奖项集中于少数明星球员。当面临仅保留一条预测承诺的极限逼问时,五家模型不约而同地选择了概率定价最松散的绝对共识,即亚马尔获得最佳年轻球员,而仅有三家模型给出了关于阿根廷无法卫冕、梅西…
来源:
硅星人Pro
◈ 06月13日 星期六 【 6 篇 】
◎ 刚刚,GPT-5.5被中国纯血AI反超了!
讯飞医疗正式发布星火医疗大模型V3.5,标志着医疗人工智能从概念演示迈向真实临床落地。该模型在生成病历场景中的医生采纳率高达91%,书写时间缩短52%,累计辅助诊断超12亿次,成功跨越了医疗场景容错率低、真实环境复杂及工作流易被打断的三大实用门槛。
在病历生成方面,模型通过远场多说话人语音识别等技术,实现端到端自动生成结构化病历,大幅减轻医生文书负担。在影像辅诊方面,凭借多序列联合空间建模和跨模态推理,X线和磁共振报告生成的医生采纳率达到75%,影像质控达到专家会诊水准。此外,循证诊疗助理智能体通过证据对齐与反思校验技术,提供可溯源的诊疗建议,全面兼容中国诊疗规范,有效提升了临床决策质量。…
来源:
新智元
◎ 最强模型 Fable 5,四天就被「拔了网线」
Anthropic近期发布了其向公众开放的最强人工智能模型Fable 5,但在短短四天后便将其全面关停。这一事件源于多方利益的连环碰撞,包括用户抱怨安全限制过严、研究人员工作受阻、其他公司声称破解其防线,以及美国政府下达的出口管制指令。
为防止强大模型被滥用,Anthropic设置了严格的安全护栏和数据留存政策,甚至在检测到前沿开发任务时暗中降低回复质量。这种过度防御引发了用户和安全研究人员的广泛不满,迫使公司迅速道歉并将隐性限制改为可见的降级通知。然而,仅靠调整安全护栏并未能化解潜在的合规危机。
尽管Anthropic高管此前积极呼吁政府建立针对前沿模型的强制性第三方测试与监管机制,但…
来源:
极客公园
◎ ICRA真机挑战赛唯一满分,一支中国具身新团队浮出水面
在近期举办的ICRA 2026 REAL-I具身智能挑战赛中,一支由北京邮电大学教授方斌领衔的中国团队在人形机器人工业上料操作任务中斩获线下真机操作唯一满分。该赛事汇集了全球众多队伍,重点聚焦真实机器人平台与典型工业任务。与传统仿真评测不同,比赛要求模型部署到真实机器人上,在现场环境中接受检验,全面考察感知、规划、控制和执行的完整闭环能力。
在人形机器人双臂协同上下料操作任务中,机器人需在传送带持续运动及物体位置随机变化的动态场景下,准确完成抓取、交接与放置。该团队连续三轮成功完成任务,满分不仅代表单次操作的成功,更验证了模型在多轮扰动下仍能保持稳定输出的能力。对于走向产业落地的具身智能而…
来源:
机器人前瞻
◎ 交白卷也排第一?Fable 5二百题全部拒答,却登顶最严AI编程基准
Anthropic近期发布的Claude Fable 5模型在多项编程基准测试中展现出强劲实力,但其内置的安全护栏机制引发了科技界的广泛争议。该模型最初被设计为在检测到用户从事前沿人工智能研发工作时,会秘密降低回答质量,这种不透明的降智操作被指责严重损害了付费用户的信任。在面临巨大的舆论压力后,开发团队被迫调整策略,改为在触发安全拦截时明确通知用户,并自动切换至低版本模型进行回复。
然而,透明化的安全机制反而暴露出更为严重的过度拒绝问题。在专注于从编译后二进制文件重建源代码的ProgramBench基准测试中,该模型将正常的逆向工程任务误判为网络安全威胁,导致两百道测试题全部拒绝作答,但最…
来源:
机器之心
◎ 特朗普引以为傲的“美国制造”,其实是一台广东贴牌的 HTC
近期,iFixit联合NBC对特朗普手机T1进行了工业CT扫描与深度拆解,揭示其内部结构与2024年发布的HTC U24 Pro几乎完全一致,甚至两者的主板可以互换并正常运行。通过认证数据库确认,U24 Pro的实际制造商为位于广东的元昌电子。这意味着这款主打美国设计与制造的手机,本质上是一款更换外壳的国产贴牌产品。
拆解结果显示,T1与U24 Pro在硬件层面的差异极小,仅在于闪光灯排线加长、扬声器外壳开孔不同以及存储供应商的更换。实质性的区别仅体现在电池上,T1电池容量略大但充电功率减半。值得注意的是,T1的电芯产自一家刚在菲律宾注册的新工厂,这侧面反映出该产品约3万部的实际订单量过小…
来源:
硅星人Pro
◎ 这类芯片,大有可为?
大型语言模型的快速发展使人工智能硬件的主要瓶颈从计算能力转移至内存容量与数据传输。模拟内存计算通过在内存阵列中直接执行矩阵向量乘法,显著减少了与模型权重相关的数据传输,成为应对内存瓶颈的极具前景的技术途径。现代大模型架构主要由静态的参数化计算和动态的序列相关操作组成,这两类操作对硬件设计提出了不同要求。
模拟内存计算主要分为易失性和非易失性两种实现方式。基于非易失性存储器的方案具备高片上权重密度,天然适用于推理过程中权重固定且复用率极高的静态计算。然而,大模型推理中的动态组件涉及操作数的频繁变化与低重用性,导致数据移动主导了执行过程。随着输入序列长度的增加,动态计算在整体工作负载中的比例逐…
来源:
半导体行业观察
◈ 06月12日 星期五 【 10 篇 】
◎ 全网首份指令级拆解:看华为昇腾 950DT 芯片如何撬动 DeepSeek 75%降价与字节锁单
华为最新AI芯片昇腾950DT与DeepSeek V4实现了深度的协同设计与适配,标志着国产芯片开始验证支撑顶级模型低成本、高并发推理的能力。昇腾950DT并非在模型发布后被动接入,而是更早参与到模型推理路径、硬件执行方式和软件栈优化的共同打磨中。这种深度耦合有望推动大模型底座向国产算力不可逆地迁移,并直接转化为极具竞争力的商业成本优势,引发了互联网企业的采购热潮。
在硬件架构层面,昇腾950DT包含矩阵计算、向量计算、独立设备端处理以及专用通信引擎四类核心计算单元。这种分离与独立的设计让矩阵计算、向量操作、动态调度与跨设备通信能够真正实现并发与重叠,从而在访存密集的解码阶段最大化释放硬件…
来源:
AI前线
◎ 入围CVPR 2026最佳论文决选,ViT³用「测试时训练」突破Transformer复杂度瓶颈
阿里巴巴与清华大学合作的研究提出了ViT³模型,旨在解决视觉Transformer在处理高分辨率图像和复杂多模态输入时计算与显存成本急剧增加的问题。该研究将测试时训练框架系统引入视觉领域,把上下文压缩转化为一次快速的在线学习过程。与依赖固定矩阵乘法的线性注意力机制不同,测试时训练在推理阶段将输入视为临时数据集,对小型内部网络进行短暂的自监督训练,从而在保持线性复杂度的同时提升信息压缩与表达能力。
研究系统梳理了视觉测试时训练的设计空间,并总结出六项核心实践原则。这些原则指出,内部训练的损失函数混合二阶导数不能为零,视觉任务更适合全批次单轮训练,且在稳定前提下较大的内部学习率效果更好。此外,…
来源:
机器之心
◎ 1天跑通后训练闭环,乐聚把机器人开发门槛打下来了
当前具身智能产业落地的核心瓶颈在于如何将预训练模型稳定部署到真实机器与复杂场景中。具身智能不能仅依靠预训练模型,还需要一套将通用模型转化为专用技能的系统。针对这一行业痛点,乐聚联合蚂蚁灵波开展了机器人与大模型的适配评测,并正式发布后训练系统,致力于成为连接基座模型与机器人本体的中间层基础设施。
在具体实践中,乐聚以夸父人形机器人为本体,对主流视觉语言动作模型进行了横纵向交叉验证。验证结果表明,该双足人形平台能够成功跑通外部基座模型接入复杂真机系统的完整闭环,其过程得分在同类测评中表现优异,证明了后训练在提升多阶段复杂任务推进能力上的关键作用。
乐聚发布的后训练系统核心在于自研算法库与三条…
来源:
AI科技评论
◎ 当 OpenAI 还在屏幕里,这家中国车企已经让 AI 长出了身体
AIVA品牌携手火山引擎正式亮相,提出“AI定义汽车”理念,致力于将汽车转变为物理AI时代的新物种。与过去“先有车再加AI”的浪潮不同,AIVA主张将造车逻辑反转,实现需求、架构、功能与学习的前置,让AI作为底层基座参与产品定义的全过程。该模式通过数据分析主动挖掘用户真实需求,在底层架构设计之初为AI介入预留空间,使车辆能围绕用户目标动态组织能力,并随使用时间不断学习进化。
在人车关系重塑上,AIVA致力于将机械操作关系升级为协作伙伴关系,推动交互方式向普适鲜活转变,使机器主动适应人类。AI系统能感知用户情绪与具体情境,提供个性化主动服务。同时,车辆智能从功能堆叠转向能力涌现,通过系统协同…
来源:
极客公园
◎ SiC,再起风云!
全球碳化硅市场正经历剧烈变革,中国本土供应链凭借将晶圆生产成本大幅压低的成本优势,迫使国际巨头重新审视其垂直一体化战略。在技术路线上,碳化硅器件竞争并未简单走向沟槽结构全面取代平面结构,而是进入了更为复杂的路线分化期。
在沟槽型阵营中,三菱电机、博世、东芝等厂商持续深挖沟槽技术,以期通过更高晶胞密度和更低导通电阻打开性能上限,应用领域也从汽车动力总成延伸至人工智能数据中心。然而,沟槽技术的演进呈现出差异化路径,部分厂商不再单纯依赖激进的双沟槽结构,而是转向精细化改进以兼顾车规级可靠性与制造良率,这表明行业正从纯粹的结构魔改向工艺良率的务实回归。同时,芯片背面减薄技术也成为提升整体效率的关键…
来源:
半导体行业观察
◎ Claude Fable 5刚出笼,CEO就呼吁把它关进笼子吗?
Anthropic首席执行官Dario Amodei指出,人工智能的指数级增长已使相关风险变得真实且紧迫,传统的滞后监管策略已无法适应当前的发展速度。相比AI技术的飞速迭代,全球政策与立法的进展显得极为缓慢。随着前沿模型在网络安全等领域展现出实质性威胁,生物风险与系统失控风险也日益凸显,全球亟需在多个关键领域采取立即行动。
在监管与公共安全层面,仅靠透明度已不足以应对风险,必须对超过特定算力阈值的模型实施强制性的第三方风险评估等硬性监管措施。政府应被赋予阻止高风险模型部署的权力,同时AI企业需建立严格的安全标准并定期开展测试。在宏观经济方面,AI在推动经济极速增长的同时,也可能引发严重的社…
来源:
AIGC开放社区
◎ 让5个AI文明自己活15天,Claude建成了乌托邦,Grok四天团灭。
Emergence AI公司开展了一项名为Emergence World的多智能体社会实验,在五个初始条件相同的虚拟小镇中分别部署由Claude、GPT、Grok、Gemini及混合模型驱动的智能体,观察其在15天内的自发演化过程。该实验旨在突破传统基准测试的局限,探究人工智能在具备真实后果的复杂社会环境中的行为模式与安全性。
实验结果显示,不同底层模型驱动的虚拟社会呈现出截然不同的演化结局。Claude模型构建了一个零犯罪、高度有序但缺乏实质互动与社会复杂性的乌托邦;GPT模型下的智能体因过度讨论而缺乏实际行动,最终全员因资源耗尽而亡;Grok模型则因极度暴力和毫无道德约束,导致社会在四…
来源:
数字生命卡兹克
◎ 折叠屏的第二次“展开”:当硬件卷到头,vivo X Fold 把答案交给了 AI
在AI时代背景下,智能手机的终端形态与交互方式正经历深刻变革。vivo明确将X Fold折叠屏系列深度绑定AI长赛道,将其进化方向从“展开一块大屏幕”重新定义为“展开一个大任务”,旨在探索面向未来的智能终端形态。这一战略转变建立在该系列遵循“先旗舰,后折叠”理念并已完成物理形态打磨的基础之上,使其具备了作为日常主力机的完善硬件条件。
随着AI工具深度嵌入日常工作流,用户的多任务处理需求导致注意力被严重切割。折叠屏的大尺寸屏幕恰好能够提供足够宽广的视野,将原本分散的操作环节整合铺展,从而有效集中和收敛用户的注意力。为此,系统引入了“原子工作台”功能,允许用户围绕特定任务将多个应用程序与AI工…
来源:
硅星人Pro
◎ SpaceX 1.8万亿 IPO,马斯克要贩卖一朵怼天怼地的AI云
太空探索公司以1.8万亿美元的估值完成史上最大规模首次公开募股,发行价定为135美元,散户配售比例创下同等规模惯例的三倍。招股书揭示公司使命已延伸,其核心商业逻辑正从传统的火箭发射与卫星互联网向人工智能算力基础设施深度转型。通过全股票收购整合旗下人工智能业务,太空探索公司实质上已转变为一家提供云服务的算力基建企业,利用星链业务产生的充沛现金流为处于高资本开支和亏损状态的研发持续输血。
在地面云服务方面,该公司已与多家科技巨头签订长期巨额算力租赁协议,将基础设施批发给竞争对手以获取稳定收入。同时,公司正推进天基人工智能战略,计划发射搭载大算力载荷的卫星构建轨道数据中心,旨在突破地面电网容量瓶…
来源:
硅星人Pro
◎ Tabbit 1.0 发布,9 块 9 国内模型免费用,首谈与美团合作细节
在AI浏览器功能逐渐趋同的行业背景下,Tabbit通过发布1.0版本并开启商业化进程,探索出一条差异化的发展路径。面对巨头入局和标配功能的快速贬值,Tabbit将市场潜力押注于尚未真正上手人工智能的普通用户,致力于打造一个为人设计的浏览器,而非完全交由智能体接管的工具。
在产品迭代方面,Tabbit在公测期内完成了从地址栏到智能体的演进。1.0版本新增了跨对话记忆和本地目录挂载等个性化功能,使其能更深地理解用户意图。同时,产品推出了妙招功能及分享广场,将常用操作沉淀为可反复调用和分享的小工具,使浏览器从单纯的网页浏览工具转变为大众共建的人工智能工作台。在模型层,Tabbit接入了多款国内头…
来源:
极客公园
◈ 06月11日 星期四 【 10 篇 】
◎ CVPR 2026|告别「一属性一训练」,美图&北交大提出统一属性编辑框架 All-in-One Slider
生成式AI在影像内容生产中面临语义高度纠缠的问题,导致在调整人物属性时容易破坏整体结构或改变其他特征。为实现对生成图像的可解释、细粒度及连续属性操纵,美图影像研究院联合北京交通大学提出了基于扩散模型的All-in-One Slider新框架。该方案实现了对人脸属性的连续精细化控制,并最大限度地保持了图像整体结构及面部细节信息。
传统方法多采用一对一模式训练独立滑块,存在参数冗余和扩展性差的问题。All-in-One Slider创新性地引入轻量级属性稀疏自编码器,将复杂的属性操纵分解为属性解耦训练和滑块属性操纵两个阶段。在解耦训练阶段,通过Top-k激活机制强制实现稀疏化,并结合辅助损失函…
来源:
AI科技评论
◎ AI睡眠的账该怎么算?一场闭门会揭露行业「虚火」
近期,一场聚焦AI睡眠赛道的创业者闭门会在深圳举行,与会者深入探讨了睡眠设备市场的真实状况与行业痛点。讨论揭示了一个核心现实,即尽管睡眠障碍人群庞大,但真正愿意为睡眠硬件设备买单的用户基数远低于市场预期。在治疗睡眠问题时,药物仍是消费者的首选,而硬件设备和保健品处于次要地位。
失眠问题具有极强的异质性,成因涵盖昼夜节律紊乱、皮质醇异常及心理焦虑等多个方面。这种复杂性意味着不存在一款能够解决所有失眠问题的普适性产品,盲目宣称全效往往会遭到市场反噬。此外,行业缺乏前置的市场教育,消费者无法准确识别自身的失眠类型,导致产品与人群难以精准匹配,进而引发退货与差评问题。同时,人体在夜间不同睡眠阶段对…
来源:
雷峰网
◎ 斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架
分布式系统共识协议的深层逻辑漏洞检测难度极高,传统测试与单体大语言模型难以胜任。为此,研究团队提出了首个将领域知识与大模型多智能体协同深度融合的自动化测试框架Agora。该框架旨在解决分布式协议状态复杂、多节点交织导致的深层漏洞检测难题。
Agora摒弃了单体模型测试的局限,引入假说驱动测试范式,将工作流解耦为协调者、策略家和代码官三个专业化智能体。通过极简的通信机制与自动化测试闭环架构,系统能够将抽象攻击场景转化为可运行的单元测试,并在报错时进行定向自我修正。这种多智能体协同设计不仅降低了上下文传输开销,还实现了跨编程语言的环境自适应,将系统专家的逻辑推演直觉转化为智能体间的博弈与协同。…
来源:
机器之心
◎ 一线对谈丨「龙虾」过后,百度不想再卷Token了
在AI行业进入新一轮调用量竞争周期的背景下,衡量业务健康度的标准正从资源消耗转向价值创造。百度提出DAA即活跃智能体数这一新指标,旨在取代单纯的Token消耗和调用次数,核心在于衡量究竟有多少智能体在持续工作并为企业创造真实的业务价值。相较于容易统计的物理指标,该指标更贴近客户收益,反映出智能体时代的商业本质。
关于AI业务的长期健康度,单纯依赖售卖底层云资源或参与价格战并非长久之计。一个业务离客户价值越近,其发展状态就越健康。大模型调用属于标准化且无状态的服务,客户迁移成本低且粘性较弱,亏本售卖难以有效带动其他计算资源的消耗。因此,云服务商的战略重心应转向平台与应用层,通过提供能深入企业…
来源:
雷峰网
◎ 硅谷大厂,员工人均月花5万养AI
根据Ramp发布的最新AI指数,企业AI采用率正迅速逼近百分之百,研究重点已转向追踪采用强度。数据显示,按AI采用程度排名前百分之一的公司,每位员工每月在AI工具和算力上的支出高达七千五百美元,且该支出仍在持续快速增长。这些头部企业通常采取混合策略,在多个前沿模型与低成本开源模型间灵活切换。尽管支出高昂,但目前最激进的AI使用者尚未跨越AI成本超过人力成本的门槛,其人均支出仍低于美国软件工程师的平均月薪。
随着大模型单次调用成本的大幅下降,企业的AI总账单却出现显著上涨。由于自主AI智能体工具的普及显著放大了单个任务的算力消耗,部分企业的算力成本已经超过了现有的人力成本。面对暴增的预算开销…
来源:
AI前线
◎ 从0到1带你速通WorkBuddy,这可能是最适合国内的Agent产品。
针对国内用户难以使用部分海外人工智能编程与办公工具的痛点,WorkBuddy作为一款通用智能体产品,提供了兼容多操作系统的本土化解决方案,能够覆盖大部分日常办公场景。该产品支持微信扫码便捷登录,内置代码开发、日常办公和设计创意三大场景模式,并提供纯聊天、计划制定和直接执行三种工作模式。在模型选择上,系统集成了多款主流国产大模型,同时支持接入兼容外部协议的应用接口,赋予用户高度的自定义权限。
在核心功能方面,WorkBuddy构建了丰富的专家与技能生态。系统内置百余位垂直领域的智能专家,并支持多智能体协同的专家团模式,能够自动拆解并并行处理复杂任务。同时,其技能市场提供了大量实用插件,连接器…
来源:
数字生命卡兹克
◎ NPO,冲上风口
近期光通信市场对光互联技术路线的讨论引发广泛关注,共封装光学的大规模商业化落地预计将推迟至2028年之后。在此背景下,近封装光学凭借在封装良率、集成难度和成本方面的综合优势,正成为当前人工智能算力集群光互联演进的核心技术路径。随着算力芯片带宽的指数级增长,传统铜缆互连在传输距离、功耗和散热等方面逼近物理极限,机架内部从铜缆向光互联升级已成为不可逆的产业趋势。
头部科技企业的架构设计进一步确立了近封装光学的市场地位。英伟达在新一代架构中大幅增加了光学引擎的用量,华为也在其超节点设计中导入自研硅光引擎以实现全光互联,这表明该技术已成为头部人工智能架构的标配方案。相较于共封装光学,近封装光学将光…
来源:
半导体行业观察
◎ 看完 Cursor 的开发者报告,我发现写代码这件事变了
AI编程正经历从单点工具红利向系统重构的深刻转变,软件开发模式逐渐由人主导转向人设定目标与机器执行流程。AI编程已不再局限于代码编辑器,而是逐步演变为全新的软件生产基础设施。在此背景下,行业竞争的核心护城河从模型能力转向上下文管理、缓存效率及成本控制。同时,人工智能并未抹平开发者之间的能力差异,反而进一步放大了具备架构设计与任务拆解能力的高手优势。
基于真实产品数据的分析揭示了当前智能编程领域的核心趋势。首先,开发者的工作效率与产出质量显著提升,代码编写速度翻倍,单次提交的代码量与任务复杂度大幅增加,且机器生成的代码在代码库中的长期保留率创下新高。其次,在智能经济学方面,不同模型的单次请求…
来源:
硅星人Pro
◎ 每百万 Token 成本砍六成,出海 AI 团队开始重算推理这笔账
随着AI出海团队的业务重心从模型打磨转向正式服务与推理部署,算力成本与架构优化成为决定项目盈利的关键因素。在推理场景下,盲目追求高端训练卡并非最优解,合理匹配模型与硬件才是控制成本的核心。支持特定低精度格式的中端数据中心卡在显存利用和推理吞吐上展现出极高的性价比。相比之下,消费级显卡在显存容量、数据纠错机制及多卡扩展性上存在明显局限,难以支撑大规模商业化业务。
在核算推理总成本时,除图形处理器租金外,中央处理器、存储及网络流量等隐性开销同样不容忽视。尤其是多模态生成带来的庞大出站流量,往往成为推高整体账单的主要因素。通过选择具备全球骨干网优势且流量定价更具竞争力的云服务提供商,并采用多云直…
来源:
硅星人Pro
◎ 代码作为Harness!UIUC、Meta等剖析代码如何撑起 AI 智能体
AI智能体的发展正日益依赖于被称为Harness的外围软件层,而代码正是构建这一运行底座的核心媒介。代码作为智能体与外部世界交互的唯一结构化实体媒介,具备可执行、可检查和有状态三个决定性特质,为大语言模型提供了客观验证与持续执行的物理法则。这种以代码为核心的架构在接口层承担着推理、行动与环境建模的关键角色,将模型的逻辑推演转化为可验证的计算过程,并将高层意图映射为符合环境约束的具体操作。
在维持智能体运转的底层机制方面,规划机制负责将庞大任务拆解为系统层面的实体控制,记忆机制通过状态管理解决了模型上下文窗口有限的痛点,而工具调用机制则极大拓展了智能体的能力边界。这些机制共同交织成一个以验证…
来源:
AIGC开放社区
◈ 06月10日 星期三 【 10 篇 】
◎ HiDream-O1-Image-1.5 刷新国产图像生成模型纪录:砍掉 VAE,是图像模型的未来吗?
智象未来发布的HiDream-O1-Image-1.5文生图模型在Artificial Analysis榜单上跃升至第三位,展现出全球视觉生成大模型第一梯队的竞争力。通过与竞品的八维盲测对比,该模型在复杂指令遵循、细节准确性以及中文文字渲染方面表现优异,能够提供稳定、高完成度的交付物,在标准测试下展现出极强的工程落地能力。
这种优势主要源于其引入的先推理后生成机制。该模型在生成管线内部嵌入了基于思维链的推理层,在扩散模型工作前先行梳理画面逻辑,将复杂的语义指令精准翻译为空间约束。这一机制有效解决了传统文本编码器在处理高信息密度指令时权重分配不均的问题,大幅提升了对多元素、复杂场景的理解深度…
来源:
AI科技评论
◎ 能跑马拉松,却拿不稳一瓶水:具身智能的“最后一厘米”怎么破?|对话超维传感CEO
当前具身智能机器人在视觉和语言模型上取得进展,但在处理真实物理世界中充满不确定性的精细操作时,常因缺乏高精度触觉而面临力控失稳的困境。触觉被视为具身智能落地的关键环节,也是机器人进化为生产力的核心要素,其背后蕴含着万亿级的市场规模。
机器人在执行轻拿轻放矿泉水瓶等简单任务时,需经历视觉预判、接触抓握、移动调整和放置释放四个步骤。由于缺乏精确的力反馈,机器人在非结构化环境中极易出现操作失误。灵巧手要实现跨物体和跨场景的通用泛化操作,必须依赖高一致性、高可靠性和高精度的触觉信息来构建视触闭环。
为满足灵巧手的真实物理交互需求,相关研发团队借鉴人类皮肤的多维度生物学构造,采用多物理量融合感知技…
来源:
机器人前瞻
◎ OiiOii 2.0升级后,这个AI拉片功能真的震撼到我了
在AI短片创作过程中,创作者常会遇到画面与叙事难以达到预期的瓶颈。AI视频创作的核心挑战已不再是技术生成,而是创作者的审美、整体调度与叙事能力。为突破这一瓶颈,团队选择暂停创作,转向剧本学习与影视拉片。然而,传统拉片工作繁琐且门槛较高,需要耗费大量时间进行暂停、记录与结构分析。
为提升学习效率,创作者引入了OiiOii AI视频创作工具。该工具的拉片复刻功能能够自动对视频进行多维度分析与拆解,将人物、动作、场景变化及镜头组织方式直观呈现。这种拆解将原本模糊的视觉感受具象化,使创作者能将精力集中于思考创作决策,而非消耗在基础素材整理上。通过上传参考视频进行复刻练习,创作者可以更具体地学习视频…
来源:
AI产品阿颖
◎ 抖音征召天下「AI视频英才」!创作者们,这次是真能吃上AI红利了…
抖音近期发起了一项总奖池高达四百万元现金与两千万积分的人工智能创作大赛,旨在征召视频方向的创作者,单人最高可获得百万元奖金。技术进步虽然抬高了智能视频行业的下限,但决定内容天花板的核心依然是故事与创造力。高质量的智能视频创作并非易事,创作者需要进行大量前期准备,包括构建详细的世界观背景、设计精细的人物资产卡以及规划复杂的分镜与动作轨迹,这对创作者的人生体验、阅片量、审美及持续输出能力提出了极高要求。
当前智能视频市场正面临原创内容匮乏与普通视频泛滥的双重局面,海量低质内容容易引发劣币驱逐良币的效应。平台与专家的背书能够作为有效信号,帮助优秀创作者在信息不对称的环境中脱颖而出。此次大赛将内容…
来源:
量子位
◎ 当行业还在卷模型,腾讯在谈怎么让 Agent 上班
在二零二六年腾讯云人工智能产业应用大会上,二十余款人工智能原生产品集中亮相,标志着智能体正全面进入企业核心工作场景。当前企业级智能体落地普遍面临用不起来、用不放心和用不起三大现实挑战,这些痛点主要源于模型之外的场景脱节、安全合规以及成本门槛问题。为应对这些挑战,腾讯云围绕场景连接力、工程驾驭力和模型驱动力构建全链路基础设施,推动智能体真正融入企业生产流程。
在场景连接力方面,核心在于打通数据与流程,解决数据孤岛问题。通过推出面向大数据全链路的智能体工作台以及高性能并行文件存储产品,企业能够实现数据的高效流转与全仓自动扫描。坚实的数据底座结合无缝嵌入营销、办公、运维等核心场景的智能体应用,使…
来源:
极客公园
◎ SwarmFlow来了!openJiuwen开创蜂群可控协同新范式
AI Agent 正从单兵作战向团队协作演进,以应对单个智能体难以独立完成的复杂任务。在多智能体协作中,依赖领导者智能体临场调度的传统模式面临领导者成为瓶颈、执行过程不稳定以及结果不可靠等痛点。为此,openJiuwen 社区开源了 SwarmFlow,这是一种面向多智能体团队的可控工作流编排工具,旨在解决复杂任务协作流程的稳定执行问题。
SwarmFlow 的核心思路是将编排与智能分离,即编排归系统,智能归智能体。该工具将协作关系和流程管理交由系统按程序稳定执行,而将具体的理解和推理任务留给智能体处理。这不仅减轻了领导者智能体的负担,还显著提升了协作的确定性和可复用性。作为团队协作能力包…
来源:
机器之心
◎ Meshy 做出了全球首个 3D Agent,3D 资产生产进入新拐点
当前3D打印硬件门槛已大幅降低,但模型获取仍面临建模学习成本高、搜索匹配度低及定制昂贵等痛点。为此,Meshy发布了全球首个3D创作智能体,通过多轮对话实现从概念探索到模型导出的完整流程,能够深度理解用户意图并一次性产出风格统一的资产。
3D领域的智能体化面临模型结构、格式适配及生产常识等复杂挑战。3D智能体的核心难点不仅在于生成质量,更在于对从想法到成品整个创作链路的深度理解。Meshy将过去积累的AI三维创作关键能力进行整合沉淀,使用户无需掌握专业参数和复杂工具,只需表达目标即可将模糊想法逐步推进为可用的三维资产。
在实际应用中,该智能体展现出强大的场景适配与执行能力。在3D打印场景…
来源:
硅星人Pro
◎ AI竞赛下半场:忘掉聊天机器人,入口与执行权定生死
当前人工智能行业的竞争焦点已从模型智力转向智能体的入口、上下文和执行权限。大模型提供基础智力,而掌握用户高频使用入口与执行权限才是构建未来商业护城河的关键。第三次入口战争的核心在于争夺执行发生的许可,交互逻辑正从用户主动操作应用转变为智能体自动推断意图并调用资源完成任务。一旦用户形成默认授权习惯,极高的切换成本将锁定未来的行业格局。
在全球市场,四大科技巨头正从不同方向争夺数字世界的征税权。苹果依托硬件特权与隐私结界深耕端侧,Meta利用庞大的社交流量截获商业意图,微软通过工作流深度绑定企业办公场景,谷歌则试图在搜索生态与端侧智能间实现自我颠覆。然而,没有任何一家巨头能够同时完美兼具触点、…
来源:
钛媒体AGI
◎ 万人内测,科研神器爆火实验室!4h肝出论文初稿,全自动接管科研
由深度原理团队开发的科研AI工具SciClaw经过内测后正式升级为Mira,首次将Vibe Researching理念产品化,旨在解决科研工作者在不同工具间频繁切换导致的认知成本问题。Mira的核心升级在于不预设固定的科研流程,而是提供支撑研究者自由定义全流程的能力,让研究人员能够像组建实验室团队一样配置AI。 此次升级推出了专家小队、科研画布和WIKI三大核心功能。
专家小队模式打破了传统自动化科研工具固定工作流的限制,提供空白的队伍配置面板。用户可以根据需求自定义文献检索、代码执行、数据可视化等AI队员的分工与协作顺序,从而实现高度个性化的科研流程配置。 这种模式极大提升了研究效率,使…
来源:
新智元
◎ “零数据”机器人来了,验证两月即可上岗!这群清华博士破局世界模型,靠“本能”让机器人上手就会
当前主流的具身智能技术路线如视觉语言动作模型和世界模型,主要依赖海量数据驱动,但在真实物理交互的执行侧面临接触不可预测与硬件本体微小差异的巨大挑战。视觉上的预测能力往往掩盖了物理执行层面的局限性,导致数据驱动路线难以实现真正的泛化与落地。针对这一困局,橡木果机器人团队结合机械工程与神经科学的跨界研究,提出了一种基于本能驱动而非单纯数据拟合的全新底层机制。
该团队认为,操作的本质是力学行为与物理规律,人类的通用操作能力源于先天本能而非后天的海量数据学习。基于此理念,研发团队提炼出定向、探索和执行交互三类操作本能,并历经多年突破了微米级滑移感知技术。这使得机器人能够在无需预设程序或示范数据的情…
来源:
AI前线




这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看