❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 07月02日 星期四 【 10 篇 】
◎ Anthropic 公告里最刺眼的 3 个名字,有 1 家中国模型
近期,全球人工智能市场格局发生显著变化,中国大语言模型正加速从“廉价替代品”向“优质技术供给”转型,并在海外市场实现了重要突破。随着中国模型性价比与技术领先优势的不断凸显,越来越多的国际头部企业开始将核心业务切换至国产大模型,推动了全球AI技术供给的多元化发展。这不仅反映了全球客户采购逻辑的转变,也标志着国产模型在全球产业链中的地位稳步提升。
在技术认知与研发层面,国产模型展现出前瞻性的战略布局。国产大模型不仅在底层架构和推理优化技术上实现突破,更率先将智能体确立为核心战略方向,在复杂任务规划与工具使用能力上取得领先进展。通过在训练阶段引入大量真实场景数据,部分国内团队的创新思路被国际同行…
来源:
极客公园
◎ 李飞飞 、 英伟达 Jim Fan 、徐丹飞三巨头联合重磅论文,改写灵巧手触觉赛道
在具身智能领域,灵巧手技术的发展迎来关键突破。过去的行业探索往往试图将触觉信息直接融入现有视觉模型中,但这反而导致机器人执行任务时的表现显著下降。针对这一瓶颈,最新研究提出了T-Rex框架,通过重新设计模型架构与数据处理方式,实现了触觉信号的高效利用。
为解决视觉与触觉信息处理中的冲突,T-Rex采用了Mixture-of-Transformers架构。该架构内部设有三个分工明确的专家系统,分别负责预测视觉状态、规划宏观运动以及专门处理高频触觉信号。其中,动作规划与触觉修正采用不同运行频率,触觉专家以更高频率实时调整手指动作,在不增加过多计算负担的前提下,确保灵巧手在接触物体瞬间的精准反馈…
来源:
AI科技评论
◎ 谷歌贴身对标字节:最新轻量版 Nano Banana 2 四秒出图,单张仅 0.034 美元,还能直出视频
谷歌正式推出Nano Banana 2 Lite文生图模型,以0.034美元的单图成本和4秒的极速生成能力,直接向字节跳动的Seedream 5.0 Lite发起挑战。该模型在几乎同价位的情况下,将1K分辨率文生图的质量和响应速度全面提升,精准击中高吞吐量与规模化生成场景下成本高、延迟大的行业痛点。
在性能表现上,Nano Banana 2 Lite在人类审美偏好评分与端到端延迟两个核心指标上均超越竞品,打破了参数量决定一切的传统认知。其核心技术逻辑在于知识蒸馏与场景化特训的深度结合。该模型不仅继承了旗舰模型的世界知识,还针对高频通用场景进行了专项训练,同时大幅强化了文字渲染准确率与跨图角…
来源:
AI前线
◎ ICML 2026前瞻:投稿翻倍背后,机器学习正在换挡
第43届国际机器学习大会首次在韩国首尔举行,主题为机器学习在真实场景中的落地。本次大会接收论文6352篇,投稿量实现翻倍增长,接受率维持在26.6%,传递出会议主动扩容的讯号。同时,会议推行两项新制度以提升透明度,允许作者选择仅以论文集形式展示,并公开原始投稿版本与审稿讨论内容。
本届大会呈现出三大重塑行业走向的技术趋势,即大语言模型推理从堆砌参数转向提升思考能力、人工智能安全研究从经验主义走向理论化,以及模型压缩与扩散加速并行以降低推理成本。此外,强化学习成为第一大研究方向,而人工智能赋能科学研究和具身智能方向则展现出惊人的增速,标志着前沿技术正从虚拟环境加速走向物理世界。
在学术力量…
来源:
AI科技评论
◎ 从生成内容到生成世界,AI 需要一套新的底层语言
人工智能的生成对象正从文字、图片等内容层面,逐步向世界模型演进,而构建世界的核心在于生成能被编辑和驱动的结构化资产。VAST近日完成超10亿元人民币的A3战略轮融资,投资方涵盖了车企、游戏厂商及互联网企业等产业上下游。产业资本的密集注入,根本原因在于其三维资产生成能力已实质性地进入产业方的真实生产管线,解决的是产业方每天都在面对的真实问题。
在三维生成领域,技术正从追求视觉呈现向满足生产需求跨越。针对传统生成模型底层布线混乱、难以直接用于实时渲染和后续编辑的痛点,VAST推出了能够直接输出拓扑干净的生产级网格模型的方案。这一技术突破使人工智能生成的模型能够适应人类积累数十年的工业标准,无需…
来源:
硅星人Pro
◎ 高德 GrowLoop:构建感性对话的理性 Benchmark
开放域对话的真人感评测长期面临标准难以制定、量化与统一的难题,其核心困境在于评判标准本身缺乏明确的客观共识且处于动态变化之中。现有的专家手写规则、奖励模型训练以及题目自动进化等业界常规思路,均无法从根本上解决标准本身说不清的核心问题。针对这一挑战,研究团队提出了一种名为GrowLoop的创新解决方案,旨在将难以言喻的感性标准转化为理性的动态评测基准。
该方案的核心在于利用少量人类标注作为种子,通过大模型的自我反思机制来自动学习和外化评分细则。通过将测试题目划分为共识区与分歧区,系统允许大模型在无统一标准答案的分歧区内提供合理的新判断视角,从而打破人类主观经验的局限。在细则学习方面,采用启发…
来源:
AI前线
◎ 一个开源平台,编织起了Agent「互联网」
技术发展依赖于“连接”的打通。当前单一AI模型能力已足够强大,但各类AI助手各自为战,被困在独立工作流中,无法形成连续任务链条。为解决系统分散的困境,面向企业组织场景的开源协作平台应运而生。该平台旨在将分散的助手聚合到同一协作空间,使其从个人工具蜕变为企业级数字资产与数字员工。
该平台以即时通信为入口重写协作结构,打破传统人机一对一关系,建立人与多助手同等身份的消息主体连接,实现真正的任务接力。针对复杂长程任务,平台引入事项概念,将任务沉淀为包含起因、时间线、产出及反馈的可追溯决策卡。这不仅避免了信息被消息流淹没,更将过程中的人类判断转化为底层学习素材,形成持续累积的组织记忆。
在实战反…
来源:
机器之心
◎ 630GB 机密文件外泄:iPhone 18 Pro 被扒了个干净
近期,勒索软件组织WorldLeaks宣称从印度塔塔电子窃取超630GB内部数据,其中包含苹果与特斯拉的机密工程文档。此次事件标志着该组织已全面转型为纯数据窃取加勒索的新型攻击模式,通过放弃文件加密、直接威胁公开数据来施压受害者支付赎金。这一转变与全球网络犯罪领域中纯数据勒索支付金额逆势增长的趋势高度吻合。
泄露文件详细揭示了苹果未来旗舰机型的核心技术规划与制造机密。iPhone 18 Pro系列的主板设计图纸、元器件清单以及测试文档被曝光,确认了下一代机型将搭载台积电2nm制程的A20 Pro芯片与第二代自研C2基带。A20 Pro芯片在封装技术上实现重大转向,采用WMCM晶圆级多芯片模…
来源:
硅星人Pro
◎ 红杉高瓴投资,前美团民宿 CEO 联合伯克利教授,做了一只 AI 蘑菇
Sowii公司推出首款实体潮玩产品“秃秃”,首批三万件迅速售罄并创下极高的预售与留存记录。该实体产品本身不包含硬件芯片,其核心的人工智能能力依托于手机应用程序,通过生成视频片段展现数字角色的全天候生活状态。
这种产品设计基于对生成式人工智能时代内容形态演变的深刻洞察。当生成式人工智能使得图片、视频能够以极低成本被无限生产时,单条独立内容将失去稀缺性。因此,关键挑战转化为如何组织这些海量内容以维持用户的长期关注。公司提出的解决方案是打造“数字生命”形态,即让所有内容围绕同一个持续存在且具备生活连续性的角色展开,从而赋予内容长期价值。为了实现这一目标,系统不仅依赖用户交互,更引入了长期目标和底…
来源:
Founder Park
◎ Anthropic偷偷在Claude Code中植入了隐形代码,只为识别中国用户。
近日,大量中国大陆用户遭遇人工智能产品的账号封禁,部分封禁通知邮件中被发现植入了地址追踪代码。进一步的代码逆向分析揭露,该产品的代码端采取了隐蔽的技术手段,专门用于识别并拦截中国大陆用户,且该识别过程完全绕过了传统的代理网络检测机制。
技术识别主要依赖两条独立于网络出口地址的路径。第一条路径是读取本地操作系统的时区设置,因绝大多数中国开发者会将电脑时区设置为北京时间,该代码会直接获取此时区信息。第二条路径则是读取特定的环境变量,并将其域名与一份经过编码混淆的内置黑名单进行比对,该黑名单包含了上百个已知的中转站地址及国内知名企业的域名。
在识别出特定用户后,系统采用隐写术进行标记回传。在用…
来源:
数字生命卡兹克
◈ 06月30日 星期二 【 10 篇 】
◎ 80 亿美元,Rocket Lab 要在太空复制一个 SpaceX
Rocket Lab 计划以80亿美元收购拥有近三十年历史的 Iridium。当前卫星通信赛道面临频谱和轨道位置资源紧缺的问题,从头部署全球星座不仅耗时漫长且资本消耗极高。此次收购使 Rocket Lab 能够直接获取现成的卫星基础设施、两百多万活跃用户以及稀缺的 L 波段全球协调频谱,从而成功绕过漫长的资本消耗与监管审批阶段。
长期以来,Rocket Lab 被外界视为填补大火箭发射空隙的小型补充玩家,缺乏市场主导权。收购 Iridium 促使 Rocket Lab 建立起涵盖发射服务、航天系统制造以及应用服务的三大核心业务板块,实现了类似垂直整合的商业逻辑,彻底改变了其原有的基本商业属…
来源:
极客公园
◎ 24小时直播,只靠一张照片?虎牙实时多模态数字人VAM 1.0率先突围行业三堵墙
虎牙近期推出了基于DiT架构的实时多模态数字人基础模型虎牙VAM 1.0。用户仅需输入一张照片,即可生成具备说话、聆听、唱歌跳舞以及游戏互动能力的AI数字人。该模型能够实现高分辨率的实时流式输出,并支持连续稳定运行24小时以上,满足严苛的直播需求。
在实测体验环节,该模型展现出高度的拟真感与流畅的自然交互能力。其核心的全状态拟人交互仿真技术,能够自然覆盖静默、聆听和说话三种状态,并在面部微表情与肢体动作上实现精准调控。系统支持用户随时打断并无缝接话,彻底消除了传统数字人的机械感。此外,数字人还能实时生成不重样的歌舞表演,并在复杂的多角色策略游戏中展现出优秀的协同驱动能力,大幅提升了场景沉浸…
来源:
量子位
◎ 短短两个月,智谱市值已是MiniMax的近7倍 | 巴伦港股
2026年6月,港股AI大模型赛道呈现极致分化态势。智谱市值突破万亿港元,年内涨幅近20倍;而MiniMax市值缩水至约1330亿港元,自高点回撤近七成。此次行情分化完全由最新行业政策、公司资本动作、技术迭代及机构估值重构驱动。此次行情分化标志着AI大模型行业正式进入业绩兑现与赢家通吃的存量博弈阶段,资源与资金加速向具备核心技术与落地能力的头部企业集中。
智谱的强劲表现得益于政策红利、技术迭代与资本动作的多重共振。国内AI顶层政策落地扩大了科创板相关标准的适用范围,智谱回A进度显著提速并进入辅导验收阶段。同时,公司发布旗舰大模型GLM-5.2并适配国产算力平台,叠加百亿级募资计划与政企大额…
来源:
钛媒体AGI
◎ Claude、GPT 和 Seedance,就是新的全球 AI 御三家
到2026年年中,全球人工智能大模型行业的核心格局发生显著变化,Seedance正式跻身由GPT和Claude组成的头部阵营,标志着视频生成领域确立了新的行业标准模型。Seedance的成功不仅在于技术指标的领先,更在于其成功将视频生成从偶尔的单次展示推进到了稳定可用的真实生产环节,确立了该领域不可替代的默认位置。
真正的行业标准模型需要在核心能力、竞品对标、融入日常工作流以及商业化四个维度上建立壁垒。GPT和Claude分别在通用任务与复杂编程领域实现了从技术能力到生产力基础设施的跨越。相较于早期视频生成模型在连续生产中易出现画面断裂等稳定性问题,Seedance 2.0通过原生多模态音…
来源:
硅星人Pro
◎ AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口「很小」
OpenAI首席研究官Mark Chen指出通用人工智能即将到来,人工智能模型正在数学、计算机和编程等多个领域展现出超越人类的创新能力。未来模型将能够自主提出创新并进行自我维持的研究,从而在长周期的复杂任务中实现实质性技术突破。这种从理论概念到实际落地的转变,标志着各个行业正在经历由人工智能驱动的深度变革。
针对业界频繁出现的预训练已死等质疑声,相关负责人予以强烈反驳,坚定认为扩展定律尚未失效。预训练、数据工程、推理训练和更长的任务链条仍然是通向通用人工智能的主干道路。此前推理模型的成功推出充分证明,只要辅以新的工程技巧和研究洞见,就能够持续击穿技术瓶颈,维持在指数曲线上的发展势头,这为模…
来源:
新智元
◎ AI圈刚开始谈Loop Engineering,两位95后博士已经盯上了人类闭环数据
人工智能工程的重心正从单次提示词驱动转向工作流驱动的持续闭环系统。在机器人和具身智能领域,真实世界的物理交互要求系统具备在反馈中不断修正的能力。人类本身即是成熟的闭环系统,其动作包含感知、决策、执行、反馈与修正的完整环路。为将人类闭环控制过程转化为高质量训练资产,脸谱心智推出全新数据范式Ego-NeuroLoop,旨在捕捉多模态闭环信号,而非仅记录动作结果。
在模型架构层面,团队发布了基于循环变换器的世界模型,通过参数共享模块对潜在状态进行迭代优化,使模型在内部多轮修正以逼近更稳定的环境理解。然而,现有第一视角数据多仅记录行为轨迹,缺乏对动作动机与修正过程的记录。因此,数据范式向深层次的闭…
来源:
机器之心
◎ 字节CEO梁汝波发全员信:要求Leader实质产出;DeepSeek V4正式版高峰期价格将翻倍;共享单车79分钟收30元?哈啰客服:新车型成本超1200元
近期科技与商业领域发生多项重要人事调整与战略变革。阿里前副总裁贾扬清因开源承诺分歧正式离开英伟达,字节跳动则全面更新领导力原则,明确要求各级管理者深入一线并产出实质业务。同时,快手核心技术高管转岗可灵AI事业部,以强化技术底盘并推进独立上市进程。科技巨头正通过组织架构优化与人事变动,加速向AI与核心技术赛道聚焦。
在人工智能与通信基础设施方面,大模型商业化与资源调度持续深化。DeepSeek计划引入API峰谷定价机制,以优化高峰时段资源配置。中国移动正式设立集团级Token办公室,拉通词元创造、输送与应用的全流程,标志着运营商全面进军词元经济。此外,月之暗面针对市场不实融资信息发布打假声明…
来源:
雷峰网
◎ 评论送书 | Code Agent实战案例——用Pywen Agent、Claude Agent和Codex Agent从零开始构建一款网页游戏
通过自然语言提示词与代码智能体协作,能够零基础快速构建可交互的网页游戏。以斯特鲁普效应测试小游戏为例,展示了利用代码智能体进行软件开发生命周期实践的完整过程,揭示了人工智能在辅助编程领域的巨大潜力。
在代码生成阶段,三种不同风格的代码智能体展现出显著差异。Pywen Agent采用渐进式构建与多回合迭代,适合需求模糊或需动态调整的场景;Claude Agent倾向于先制定计划再按步骤执行,路径清晰且可追踪,适合严谨流程项目;Codex Agent以代码直出、一步到位见长,初期生成结构完整且效果最佳,大幅减少后续调整。这说明不存在绝对最优的模型,只有最契合具体项目需求的智能体,且清晰简明的提…
来源:
AIGC开放社区
◎ 让 AI 上夜班。
将人工智能作为夜间工作者正逐渐成为知识工作者的重要习惯。当前智能代理已能独立执行耗时较长的任务,但白天等待结果会严重干扰人类注意力。将需求交由人工智能并在夜间运行,可实现人类休息与机器工作的无缝衔接,次日早晨直接验收成果。同时,算力正呈现出类似电力的峰谷计费特征,多家企业推出了夜间算力大幅降价的机制,使得夜间运行大规模任务在成本上极具优势。
工作节奏的调整为团队协作带来了显著变化。日常任务安排从晨会复盘转向下班前的部署,以明确哪些耗时任务可交由智能代理夜间处理。白天工作的核心转变为给智能代理准备充足的生产资料与明确目标,确保夜间执行时不会因上下文缺失或逻辑卡顿而中断。通过这种错峰执行机制,…
来源:
AI产品阿颖
◎ 3000块钱,这支中国团队把ChatGPT成功的“秘密”用在了机器人训练上
大语言模型的成功得益于海量低成本的互联网数据,而机器人领域因数据采集成本高而难以突破。传统机器人训练依赖昂贵设备,仿真数据又存在现实鸿沟。针对痛点,穹明智能团队推出了千元级的手持采集系统UMI ver.2并全面开源。
UMI ver.2将整机成本控制在三千元以内,实现了毫米级定位精度与双臂协同,大幅提升了复杂场景下数据采集的可用性。该系统采用多传感器同步对齐与严格的采集标准,确保高质量数据稳定产出。相比传统动捕方案,其成本节省90%以上且部署快捷,使数据采集能力得以向中小团队普及,打破了少数机构的技术垄断。
在生态建设上,团队将硬件清单、软件代码与训练流程完全开放,采用GPLv3协议保障…
来源:
AI前线
◈ 06月29日 星期一 【 10 篇 】
◎ 登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™
物理AI面临泛化能力质疑,无界动力发布全球首个“长时序双向物理因果链”隐空间世界模型MWA™具身通用大脑。该模型采用“双向动力学”架构,创新时序Chunk级逆向动力学建模机制,解决了传统模型在开放场景中缺乏物理认知和长时序规划能力的瓶颈。MWA™具身通用大脑从底层范式上为机器人多场景泛化与高精度执行提供了全新解法。
MWA™通过潜动作自监督预训练在隐空间淬炼通用物理常识,摆脱对动作标签的依赖。其双向动力学架构结合正动力学解码器的由因及果与逆动力学编码器的由果推因,在抽象空间内校正预测偏差。首创的“长时序双向物理因果链”打破了单步瞬时推理瓶颈,能够稳定规划10秒以上长周期连续动作序列,从根本…
来源:
机器之心
◎ Kimi K2.7 Code 有多能打?找 Bug,写 3D 游戏,2000 行代码砍掉 55%
随着人工智能编程工具从单纯的代码补全向承担完整开发任务演进,Kimi K2.7 Code 正式发布。该模型主要面向长上下文、复杂编码任务和智能体工作流,官方数据显示其在多项基准测试中表现优异,特别是在智能体工作流方面接近甚至在部分指标上超越头部模型。人工智能编程的竞争逻辑已从单纯的代码生成转向完整项目的开发交付。
在针对数据库引擎的隐蔽漏洞修复测试中,模型成功识别并修复了所有逻辑缺陷,展现出较强的陌生代码阅读与局部逻辑修复能力。在生成单文件三维滚球闯关游戏的测试中,相较于其他模型,Kimi K2.7 Code 在物理反馈、交互稳定性和功能闭环上表现更为完整,但三维场景生成中仍存在视觉重叠等…
来源:
雷峰网
◎ Agent 刚拿到自己的邮箱和钱包,人类的收件箱已经挤爆了
腾讯推出专为智能代理设计的独立邮箱,赋予人工智能独立的数字身份,使其能够以自身名义进行信息收发与业务处理。尽管配套了数据隔离与人工确认等安全机制,但这标志着机器实体开始具备基础的通信能力。这一举措打破了传统工具属性,使人工智能开始拥有独立的数字身份与通信渠道。
相关研究显示,目前全球过半的垃圾邮件由人工智能生成,其完美的语法大幅提升了钓鱼邮件的欺骗性与攻击效率,导致网络攻防双方均高度依赖此类技术。同时,大量用户开始使用智能代理代读代回邮件,使得通信链条演变为机器间的自动信息交换。这种技术泛滥与人类接管的双重趋势,让人类在通信中逐渐从直接参与者退居为最终的确认者。这种替代模式使得人类陷入了利…
来源:
极客公园
◎ 自变量连融四轮后,深圳终于有了自己的「200亿估值」具身企业
具身智能企业自变量近期连续完成四轮融资,投后估值超过200亿元,成为大湾区首家且唯一一家估值破200亿的具身智能企业。此次融资呈现出节奏快、阵容全的特点,汇聚了包括美团、阿里、字节跳动、小米在内的互联网巨头,以及众多产业资本和国资背景基金,成为具身智能领域估值超200亿元的第一梯队成员。
此次豪华投资阵容的背后,体现了资本市场正从“为概念买单”转向“为确定性买单”的核心逻辑。互联网巨头的连续领投与加注,本质上是对企业“技术确定性”的认可;产业资本的进入,是在押注自变量为实体产业带来升级机会的“落地确定性”;而“国字头”和地方资本的密集下注,则折射出对具身智能作为未来核心赛道的“政策确定性”…
来源:
AI科技评论
◎ 斩获三项全国首个!北京人形慧思开物双模型完成备案,补齐具身智能商业化短板
北京人形机器人创新中心慧思开物平台的双大脑模型天鹕(Pelican-VL)和我悟(WoW)同步完成生成式人工智能服务备案。此次备案一举斩获国内首个完成备案的通用大脑基座模型、首个完成备案的具身世界模型,以及行业内唯一一家一次性完成双底层核心模型同步备案三项全国首个纪录。这标志着该平台完成从底层数据、平台发布、真机验证、技术迭代到合规资质的全链条闭环。
在具体技术架构方面,天鹕作为通用大脑基座模型,强调面向具身智能场景的通用视觉语言理解能力,为任务规划和交互决策提供认知底座。我悟则是具身世界模型与物理世界仿真底层引擎,以真实世界物理规律为核心构建高精度数字孪生环境。这两大模型协同构成了完整的…
来源:
机器人前瞻
◎ 给Transformer变个形,LLM竟能变得更聪明
当前大模型行业热衷于通过各类架构设计在有限算力预算下塞入更多参数,却忽略了模型内部参数分配方式的优化。传统神经网络各层分配完全相同的参数量,但大量研究表明模型各层的重要性并不均匀,浅层与深层承担不同的处理功能,提前退出与层剪枝实验均印证了这一点。模型各层的重要性存在显著差异,传统的均匀参数分配方式并非算力利用的最优解。因此,重新考量网络层之间的资源分配逻辑,成为提升模型效能的关键突破口。
研究团队通过对照实验证实,在保持总参数量绝对不变的前提下,将参数容量向模型前段集中能够显著降低模型的困惑度,而向后端集中则会导致性能恶化。基于这一物理现象,研究者提出了“锥形语言模型”概念,使前馈网络宽度…
来源:
机器之心
◎ 刚刚,姚班传奇陈立杰苦思7年的计算几何核心难题,被ChatGPT推翻了
加州大学圣地亚哥分校的研究者在计算几何领域取得重大突破,证明了“最远点对”等经典计算几何问题在任意超常数维度下需要近平方时间。GPT-5.5 Pro生成了核心的数学证明过程,解决了学者陈立杰苦思七年未解的核心难题。该研究确认,只要维度持续增长,就不可能存在真正快于平方时间复杂度的算法,现有算法的表现已基本触及理论极限。
在探讨高维空间计算复杂度的历程中,传统证明方法的核心卡点在于所依赖的质数密度不够,导致编码计算开销过高。破局的关键转机来自代数数论技术。通过构建特定的数域,将普通世界中不可分割的质数转化为新数系中的多个素理想,这一过程相当于让质数“裂开”。该项代数数论技术恰好应用于上月Op…
来源:
新智元
◎ 物理 AI 演进之路:从受控环境走向现实世界
物理人工智能正在推动各类机器从受控环境走向复杂多变的现实世界,使其具备感知、推理及实时响应能力。这一技术演进将大幅提升全球生产力,对未来经济增长产生深远影响。
在具体应用层面,技术突破在多重场景下取得显著进展。人形机器人展现出灵巧操控与环境自主导航能力,能够实时融合感知、推理与控制技术。同时,四足与工业机器人被广泛应用于地形复杂及高危场景,通过异构计算架构实现低延迟的环境感知与实时控制,有效替代人工执行危险任务。此外,自动驾驶系统借助处理海量传感器数据,在复杂路况下实现高级别自主行驶与即时决策。
支撑上述应用的核心机制在于感知、决策与行动之间的高效循环。系统通过多模态推理融合各类输入,并…
来源:
AI前线
◎ 周鸿祎一小时密集输出:AI落地最大的误区,是把先进发动机装在马车上
周鸿祎在第十四届互联网安全大会上指出,当前企业在应用人工智能时面临效率未显著提升、网络安全遭受降维打击以及智能体安全存在不确定性等三大核心挑战。
在组织效率方面,许多企业虽然全员使用人工智能工具并消耗大量算力资源,但由于传统的组织架构、管理流程和岗位定义并未改变,导致整体效率依然原地踏步。企业要实现效率的真正提升,不能仅依赖个人使用新工具,而是必须改变企业文化、压平管理流程并重新定义岗位,从而将组织打造成超级组织。此外,在算力资源消耗上,应从盲目探索转向追求可见产出,严格控制开放推理型智能体的算力浪费。
在网络安全领域,大模型技术的涌现大幅降低了漏洞挖掘与攻击代码编写的成本,使攻防双方陷…
来源:
钛媒体AGI
◎ 更好用的 Claude Design 来了,可以免费用。
TRAE Work新上线的Design模式支持在AI编码前通过自然语言快速生成设计稿,并实现与已有设计资产的无缝对接。该功能无需在不同软件间来回跳转,生成的设计产物可直接导出进入代码编写模式。此举旨在解决AI仅优化编码环节而无法同步提升整体产品交付速度的痛点,成功将人工智能能力延伸至设计与审核等前置产研阶段。
传统的产品文档编写模式正被全新的敏捷工作流取代,产品经理不再撰写冗长文本,而是直接构建可被直接实现的页面原型。产品团队基于高保真页面原型进行需求沟通,显著提升了评审效率并减少了理解偏差。这一流程变革要求设计产物直接作为后续开发的唯一基准,促使产品经理承担部分前端设计职能,从而打破传统…
来源:
AI产品阿颖
◈ 06月28日 星期日 【 10 篇 】
◎ 太空算力的国产答案:用光子更高效!马斯克和老黄都太绕了
太空算力竞赛正面临严峻的工程挑战。随着科技巨头推动生成数据智能化,该领域进入白热化阶段。太空环境对计算载荷提出了抗辐射、散热和功耗三大严苛要求,传统电子芯片受限于高能粒子干扰、真空散热困难及能源有限,难以满足算力需求。光计算凭借光子天然抗辐射、光传播不产热及静态功耗趋近零等特性,提供了创新解法。在同等能源供给和散热条件下,光计算能够突破物理制程限制,实现比传统电计算更高的算力总量。
企业在光计算核心技术上已取得关键突破。针对存算分离导致的带宽瓶颈与规模化集成困难等痛点,研发团队成为全球唯一同时实现光子存内计算与玻璃基光计算的机构。通过将大模型参数直接存储于芯片内,计算延迟大幅降低,并研制出…
来源:
量子位
◎ 长视频平台终于集体打响AI反击战
长视频平台集体入局AI创作平台,以应对短视频冲击与自身生存压力。腾讯视频推出WorkRally,爱奇艺主推纳逗Pro,芒果TV推出芒果灵创。AI技术的引入大幅压缩了影视制作成本与周期,使漫剧成本下降超50%,复杂镜头成本下降90%,有效支撑了平台对海量新内容的产能需求。
面对AI带来的行业变革,长视频平台的战略重心超越了单纯的降本增效,转向成为影视创作生态的操盘手。长视频平台将专业影视能力封装进AI工具,试图向非中心化转型,构建创作者拥有IP资产的新影视内容生态系统。各大平台利用自身积累的高质量行业数据和影视制作经验,聚焦B端工业级应用,致力于解决AI剧集在连续逻辑、角色一致性和叙事节奏上…
来源:
钛媒体AGI
◎ 芯片设备,新机会
全球半导体设备市场预计将在未来几年保持强劲增长,其核心动力源自芯片底层结构与工艺路线的颠覆性重构。未来的行业巨变并非依靠晶圆厂单纯扩产带来的设备叠加,而是由晶体管架构演进与底座变迁驱动的设备需求重塑。
芯片正全面加速向3D空间发展,逻辑器件晶体管架构从FinFET向全环绕栅极及互补场效应晶体管过渡,存储芯片则向千层级3D闪存和三维动态随机存取存储器演进。这种3D化转型大幅提升了制造复杂度,设备厂商纷纷围绕材料工程、化学机械抛光、电镀及应力平衡等工艺环节展开技术布阵。随着芯片走向更高堆叠的三维结构,沉积和刻蚀设备的工艺强度与价值量将显著放大,甚至面临极高的形貌控制与薄膜应力管理挑战。
在封…
来源:
半导体行业观察
◎ 大神Karpathy用Claude的方式,原来是这样的?
近日,一份据称是人工智能专家安德烈·卡帕西实际使用的项目级说明文档在开发者社区广泛流传。该文档专为人工智能编程助手设计,旨在通过标准化规则规范大语言模型生成代码的行为,从而提升代码质量与开发效率。这类说明文件能够有效纠正大语言模型在代码生成过程中反复出现的可预测错误,是区分有效构建与混乱构建的关键所在。
文档详细列出了指导人工智能编写代码的核心准则。在动手编写代码前,开发者必须要求模型先认真阅读现有代码库并理解项目风格,同时需明确具体需求与技术取舍,避免主观猜测导致代码与整体架构脱节。此外,强调保持代码极简,坚决抵制过早抽象、过度设计以及不必要的配置项。在进行代码修改时,需遵循外科手术式的…
来源:
机器之心
◎ 上线 14 个月,Notion 关掉了自己的 AI 邮件产品
Notion近日宣布全面关闭上线仅十七个月的Notion Mail,将邮件管理交由Agent处理。这一决策源于超过一半用户在不打开收件箱的情况下管理邮件的行为变化。过去AI在邮件系统中主要用于优化人类界面的体验,但随着Agent能力的增强,邮件未来的发展方向正转变为让人无需直接阅读或操作。Notion Mail最初承载着挑战行业巨头的愿景,致力于通过自然语言提示和AI自动执行来重新定义收件箱,将其打造为可筛选和组织的数据库。
在面临邮件客户端繁琐的长尾工程挑战后,Notion选择了战略收缩。管理层判断软件的未来在于替用户完成工作,而不仅仅是展示工作内容。因此,Notion决定关停专属邮箱界…
来源:
Founder Park
◎ vivo X Fold6 上手:堆到“满配”之后,它把宝押在了 AI 办公上
vivo X Fold6 被定位为一款“满配”折叠屏手机,其核心突破在于将折叠屏的定位从单纯的显示终端提升为能够高效处理复杂工作的工作台。该设备通过创新的分屏与多任务处理机制,使大屏利用率达到极致,实现了从视觉展开到任务展开的跨越。
在交互与办公体验上,其首发的原子工作台支持一屏五用与四窗口真正平铺并行,且各窗口互不干涉。配合AI跨窗拖放功能,打破了应用间的壁垒,实现数据无缝流转。在具体场景中,AI文件管家能够基于端侧模型自动识别、重命名和分类文件,并构建专题问答知识库;AI会议助手则提供分角色转写及智慧洞察功能,大幅提升会议复盘效率。原子工作台与AI深度整合,让多应用与AI工具能在同一屏…
来源:
硅星人Pro
◎ 长链路手机AI训练总崩盘?vivo全新半在线RL,仅15k轨迹稳定收敛
针对训练图形用户界面智能体时在线强化学习交互成本高易崩溃、离线强化学习时序短视且误差累积的困境,相关研究提出了一种半在线强化学习框架。该框架旨在保留离线训练稳定性的同时,将全局轨迹信号回填至离线学习过程中,以解决长程任务中的信用分配难题。
该框架的核心方法包含离线轨迹重构与轨迹感知奖励塑形两个关键组件。在离线轨迹重构阶段,通过对同一任务的每一步并行采样多条候选轨迹并首尾相接,结合严格的逐步有效性核验与截断机制,将有限的静态数据扩展为多样化的伪在线探索数据。在奖励塑形阶段,系统通过失败点检测与前缀信用分配,结合原子动作细粒度打分与目标对齐的动态惩罚机制,将整条轨迹的执行质量回溯性拆解为稠密且…
来源:
量子位
◎ 光芯片“新军”崛起
随着AI算力集群从电互联向光互联跨越,光通信芯片成为半导体产业的新支点。长久以来,全球高端数通光芯片市场被博通与Marvell两家企业牢牢垄断,合计占据九成以上的高端PAM4 DSP市场份额,并在CPO技术走向商用的过程中提前完成了全链条专利布局。面对固化的产业格局,以联发科为首的台湾光芯片军团正通过差异化技术路线与产业链协同发起集体突围,试图重塑全球半导体产业格局。
联发科凭借光电融合与单片集成的差异化路线,实现400Gbps频宽的CPO技术突破,其Micro LED光学方案可大幅降低传输功耗。同时,联发科通过投资Ayar Labs切入硅光子核心生态圈,并依托子公司达发科技直接杀入可插…
来源:
半导体行业观察
◎ CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!
杭州Om AI团队发布了全球首个面向物理世界的端侧流式多模态模型系列VLX,该系列专为真实世界的端侧与具身场景打造。VLX系列包含三款模型,分别负责实时流式感知、精准定位和行动决策,共同构建了多模态模型在物理世界中的能力闭环。
流式多模态技术旨在让人工智能在物理世界中持续、实时地感知环境。VLX-Flow采用流式处理机制与注意力技术,结合双层记忆机制,使模型能够持续接收视频信息并实时更新环境认知,解决了传统模型计算成本高且易丢失上下文的问题。VLX-Seek通过区域标记替代传统坐标生成,将定位过程转化为候选区域的检索和匹配,大幅降低端侧部署成本并保持精确定位表现。VLX-Go将感知与定位结…
来源:
量子位
◎ 跨机器、物体与各种任务!RoboScience发布通用具身大模型
RoboScience机器科学发布了Visics通用具身大模型,全面披露了VLOA技术架构。该模型以3D点云轨迹作为全新的具身基础表征单元,旨在解决具身智能领域泛化能力差、精细操作难及长程任务误差累积的核心瓶颈。这种三维点云轨迹结合了空间结构与时间演化,使模型能在真实三维空间中建模并满足几何约束,为能力迁移提供底层支点。
作为大模型的前半部分,具身世界模型承担认知大脑角色,负责理解物理世界并预演未来轨迹。它接收语言指令和视觉图像,将场景分解为独立物体以预测运动路径。该模型具备跨物体泛化、动态过程建模等能力,严格遵循动力学与碰撞等物理约束。通过支持物理多解性建模与长时序空间一致性,它能生成符…
来源:
AIGC开放社区




这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看