
❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 07月04日 星期五 【 9 篇 】
◎ 首销破三万台,「卖爆」的小米眼镜给行业带来了什么?
小米AI眼镜的发布标志着中国AI眼镜行业进入了一个新的发展阶段。根据官方数据,截至2025年7月2日,小米AI眼镜的实际用户激活数量已突破三万台,这一数字直接反映了真实用户规模,成为硬件销售的重要指标。小米的入局不仅推动了AI眼镜概念的普及,更将行业从少数极客的“浅滩游戏”带入了充满变数与机遇的“深水区”。
闪极的失败案例揭示了创业公司在AI眼镜领域的困境。其产品在品控、功能实现和硬件选型上均存在问题,暴露了创业公司在供应链整合、工程化能力和软件调优上的短板。相比之下,小米凭借强大的供应链议价能力、硬件工程经验和质量控制体系,迅速在市场中站稳脚跟。小米的成功并非偶然,而是建立在行业前期探索…
来源: 极客公园
◎ 为什么 DeepSeek 大规模部署很便宜,本地很贵
AI模型的推理服务在吞吐量和延迟之间存在权衡,这种权衡的核心在于批处理大小的选择。GPU擅长执行大型矩阵乘法(GEMMs),因此同时计算一批补全比逐个处理token更高效。批处理推理的实现方式是将多个用户请求的token堆叠成一个矩阵,通过一次GEMM完成计算,随后分割结果并返回给用户。批处理大小直接影响延迟和吞吐量:较小的批处理降低延迟但牺牲吞吐量,而较大的批处理提高吞吐量但增加延迟。
专家混合模型(如DeepSeek-V3)因其架构特性需要更大的批处理规模才能实现高效运行。这类模型包含多个独立的前馈权重块(专家),路由层为每个token选择子集。由于专家数量较多,GPU被迫执行大量小型…
来源: AI前线
◎ 心芯相栖黄思铭:我们做了只像狗狗一样的小猫 | 00 后创业者系列
黄思铭的创业故事始于他在杜克大学的焦虑体验。面对AI技术的飞速发展,他感受到教育体系的滞后,决定休学并投身创业。他的创业动机不仅源于对技术的好奇,还源于他对“特权”的深刻反思。黄思铭意识到自己拥有许多幸运的条件,包括优质的教育资源和人际关系,而这些并非每个人都能享有。他希望通过AI技术,将“优质关系的平权”带给更多人,尤其是那些缺乏支持性关系的人。
黄思铭的创业项目“小喵希拉”是一个虚拟角色,旨在通过AI提供情感陪伴。这只电子小猫不仅会倾听用户的诉说,还会主动关心用户的生活,分享自己的日常,并通过互动建立情感连接。黄思铭强调,小喵希拉并非试图复刻真人关系,而是抽取人与人之间美好的元素,结合…
来源: AI科技评论
◎ 新天终启,万象智生——万年奇点时刻,谁将引爆中国ASI?
2025年上半年,人工智能领域迎来了前所未有的突破与变革,标志着智能爆炸的奇点已经悄然降临。DeepSeek R1的横空出世,迅速成为全球焦点,其影响力远超预期,甚至动摇了硅谷巨头的地位。与此同时,美国政府宣布启动“星际之门”计划,投入5000亿美元,旨在推动AI技术的进一步发展。马斯克推出的Grok-3模型,凭借20万块GPU的训练规模,成为全球首个超大规模智能模型,进一步推动了AI技术的边界。
在这一年中,AGI(通用人工智能)的实现似乎不再遥不可及。特朗普政府被曝出早已预见到AGI的到来,而Meta的Llama 4开源项目却因训练作弊丑闻陷入危机,导致公司高层动荡。相比之下,中国阿里…
来源: 新智元
◎ 汽车芯片,遇冷
近年来,智能汽车作为继智能手机之后的“计算平台”,带动了对计算、感知、控制、通信等芯片的需求激增,引发了全球范围内的创业与投资热潮。然而,2025年以来,这一领域逐渐显现出“遇冷”迹象,海外巨头与本土企业纷纷调整战略,反映出行业正经历结构性分化。
海外巨头的战略收缩尤为明显。英特尔宣布逐步关闭汽车业务,聚焦核心客户端和数据中心产品。尽管其在汽车领域拥有近50年历史,并曾斥巨资收购Mobileye,但主业压力迫使它剥离非核心资产。安霸则因持续亏损和客户集中度过高,寻求出售业务。英飞凌也因市场不确定性推迟了晶圆厂扩建计划,反映出对汽车行业库存消化能力的担忧。
国内市场同样面临挑战。早期进入者…
来源: 半导体行业观察
◎ 人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破
大语言模型(LLM)的生成能力虽然强大,但其输出是否符合人类偏好需要依赖奖励模型(Reward Model, RM)的精准评判。奖励模型在大模型训练中扮演着关键角色,它通过打分机制引导模型生成更符合人类价值观的内容。昆仑万维近期发布的Skywork-Reward-V2系列模型,在七大主流评测榜单上均取得第一,标志着奖励模型技术的新突破。该系列包含8个不同参数规模的模型,从6亿到80亿不等,展现出广泛的适用性和卓越的性能。
奖励模型面临的核心挑战在于如何平衡评判准确性、通用性和灵活性。当前开源奖励模型普遍存在过度优化和过拟合问题,难以捕捉人类偏好的复杂性。为解决这一问题,昆仑万维创新性地构建…
来源: 机器之心
◎ AI杀死了破折号,也绞杀了语文。
在互联网的汪洋大海中,一个看似不起眼的标点符号——破折号,成为了近期热议的焦点。破折号因其被广泛认为是AI生成内容的标志,遭到了社交媒体用户的集体抵制。这一现象的背后,反映了人们对AI生成内容的厌倦与不满。许多用户发现,AI生成的文章中频繁使用破折号和双引号,试图通过复杂的标点符号和句式来模仿人类的“高级”表达方式,但这种模仿往往显得生硬且不自然。
破折号和双引号的使用,原本是人类文化和逻辑表达的体现,如今却因AI的滥用而被迫“污名化”。许多作家和网民长期以来依赖这些标点符号来增强文章的节奏感和逻辑性,但现在,使用这些符号的文章往往会被误认为是AI生成的垃圾内容。这种现象不仅让那些习惯使用…
来源: 数字生命卡兹克
◎ 英伟达市值直逼4万亿,冲击史上最贵公司
英伟达市值在华尔街对人工智能的持续乐观情绪推动下,一度达到3.92万亿美元,逼近苹果创下的历史最高市值纪录。该公司股价在早盘交易中上涨2.4%,至160.98美元,使其市值短暂超过苹果2023年底的3.915万亿美元峰值。尽管收盘时涨幅收窄至1.5%,市值回落至3.89万亿美元,但这一表现仍凸显了市场对其高端人工智能芯片的强劲需求。微软、亚马逊、Meta等科技巨头争相建设人工智能数据中心,进一步刺激了对英伟达处理器的采购。分析师指出,英伟达的崛起反映了华尔街对生成式人工智能技术的巨大押注,其硬件已成为该领域的基础设施。
英伟达的市值增长轨迹令人瞩目,过去四年内从5000亿美元飙升至近4万亿…
来源: 半导体行业观察
◎ 小米 YU7 爆单 29 万辆后,19.58 万的小鹏 G7 能否杀出血路?
小鹏G7作为一款AI智能家庭SUV,于7月3日正式上市,售价区间为19.58万元到22.58万元,相比预售价直降4万元,显示出其在价格上的竞争力。这款车定位在20万到30万元的市场区间,与特斯拉Model Y等车型展开直接竞争。小鹏G7通过硬核科技和空间舒适两大核心优势,试图在激烈的市场中脱颖而出。
在技术层面,小鹏G7搭载了自研的图灵AI芯片,总算力超过2200 TOPS,使其成为首款具备L3级别算力的AI汽车。这一算力远超行业主流旗舰,能够支持更复杂的AI程序运行。此外,小鹏G7采用了VLA-OL+VLM双架构,不依赖云端即可完成复杂场景决策,进一步提升了车辆的智能化水平。VLA模型负…
来源: 极客公园
◈ 07月03日 星期四 【 6 篇 】
◎ 李飞飞曝创业招人标准!总结AI 大牛学生经验,告诫博士们不要做堆算力项目
李飞飞,被誉为“AI教母”,近日以创业者身份接受了YC的采访,深入探讨了AI发展的瓶颈及其初创公司World Labs的目标。她指出,当前以语言大模型为代表的AI繁荣存在根本性局限,教会AI理解、生成并驾驭物理世界的复杂性远超文本处理。她认为,空间智能是AGI(通用人工智能)缺失的关键拼图,而World Labs将致力于攻克这一难题。
李飞飞回顾了她早期创建的ImageNet项目,该项目在2009年发布,至今已有超过8万次引用。ImageNet的诞生源于当时数据稀缺的背景下,她与团队希望通过大规模图像数据库推动计算机视觉的发展。ImageNet的开源和挑战赛为AI领域设定了基准,并在201…
来源: AI前线
◎ AI科学家组团搞科研,爆肝万字报告震惊医学家!Nature独刊揭秘细节
近年来,人工智能(AI)技术在科研领域的应用逐渐深入,谷歌、斯坦福大学和上海人工智能实验室等机构相继推出了「AI科学家」系统,旨在协助人类科学家推动科研范式的革新。这些系统通过大型语言模型(LLM)的加持,能够进行头脑风暴、实验设计、文献整合以及提出研究假设,极大地加速了科学发现的进程。AI科学家不仅仅是简单的聊天机器人,它们能够联网、写代码,并与其他软件工具交互,成为自主AI的一部分。
斯坦福大学的Virtual Lab系统由James Zou团队开发,利用GPT-4o构建,包含一个「首席调查研究员」和一个「评论家」,分别负责提出想法和改进建议。谷歌的AI系统则基于Gemini 2.0,…
来源: 新智元
◎ 百万特效太贵?18张图,百度MuseSteamer直出电影成片
百度最新发布的视频生成模型MuseSteamer标志着国内首个支持声画同步的视频生成技术的诞生。该模型支持最长10秒、最高1080p分辨率的视频生成,并推出Turbo、Lite、Pro三个版本以满足不同场景需求。技术实现了画面与音效、人声台词的协同创作,彻底打破传统AIGC视频“先画面后配音”的割裂流程,在VBench I2V榜单中以89.38%的总分位居全球第一。
不同于多数视频生成模型的技术导向,MuseSteamer源自百度商业体系的实际需求。短剧投放、奢侈品广告、小说推广等业务场景对视频内容的具体要求促使团队开发这一解决方案。能否真正解决商家的实际问题、创造商业价值才是检验模型可用…
来源: 硅星人Pro
◎ AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑
过去半年,AI语音领域迎来了密集的融资热潮,多家初创公司获得了大额投资,推动了这一赛道的快速发展。例如,Wispr Flow、Cartesia和ElevenLabs等公司分别完成了数千万美元的融资,显示出市场对AI语音技术的高度关注。与此同时,科技巨头如Meta、OpenAI和Google也在积极布局语音模型和产品,甚至Siri也可能被ChatGPT或Claude等模型接管,以跟上语音交互的进展。
大模型的崛起是推动AI语音爆发的重要因素。声智副总裁黄赟贺指出,语音对话从功能模块进化为AI时代的入口级应用,得益于大模型的加持。大模型不仅加速了语音识别的效率,还使得声音本身携带的更多信息被A…
来源: 极客公园
◎ 夸克生成千万份志愿报告背后:一个Agent应用“深度落地”的真实样本
夸克在高考志愿填报领域的实践,展示了AI如何从一个技术工具进化为智能助手的真实样本。今年夏天,夸克通过其深度研究技术,免费生成了超过1000万份详尽的高考志愿报告,直接影响了千万中国家庭的决策。这一服务不仅是一次技术演示,更是一项高风险的实践,涉及复杂的决策场景和零容错的要求。
夸克的Agent通过简单的用户交互,生成包含完整志愿表的深度报告。用户只需输入分数等基本信息,并用日常语言表达自己的需求,如想去哪个城市或对什么专业感兴趣。Agent随后会根据这些信息生成报告,用户可以反复修改和生成,甚至有人生成了上百份报告以辅助决策。这种互动方式不仅简化了志愿填报的复杂性,还为用户提供了更多的选…
来源: 硅星人Pro
◎ 从电源到车身控制,南芯如何突破车规核心场景?
中国汽车产业在过去十年经历了深刻的电动化和智能化转型,其中芯片技术成为关键驱动力。数据显示,2024年中国汽车电子市场规模预计达到11,585亿元,智能座舱、电驱电控等领域成为投资焦点。国产厂商南芯科技在车规级芯片市场表现突出,其高可靠电源解决方案和功能安全产品矩阵已覆盖摄像头、雷达、主控MCU/SOC等应用场景。该公司从消费电子领域积累的快速迭代和系统整合能力,为其进军汽车市场提供了重要支撑。
车身控制系统的集成化趋势为芯片技术带来新机遇。南芯科技市场总监殷亮指出,高边开关作为新能源车核心组件,单车需求超过75颗,其性能直接影响系统安全与效率。传统分散式控制正被域控制器取代,这种变革要求…
来源: 半导体行业观察
◈ 07月02日 星期三 【 10 篇 】
◎ ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦
MIT的最新研究展示了大型语言模型(LLM)在操控宇宙飞船方面的潜力,尤其是在太空追逐挑战赛中的表现。研究团队通过少量微调和提示词工程,成功让ChatGPT在Kerbal Space Program衍生的航天挑战赛中获得了第二名,而开源的Llama模型表现更为出色,实现了0%的失败率。这一成果验证了AI在小数据环境下的高效性,并为自主航天系统的可行性提供了有力支持。
研究团队并未对模型进行大规模训练,而是通过精心设计的提示词和少量微调,使ChatGPT能够完成复杂的太空任务,如追击卫星和规避侦测。整个系统由文本状态输入、语言模型决策和代码执行三个步骤组成,展现了LLM在泛化和适应能力上的强…
来源: 新智元
◎ 华为CloudMatrix384超节点很强,但它的「灵魂」在云上
AI领域正进入一个全新的阶段,评估和系统架构的重要性逐渐超越单纯的芯片性能。过去几年,全球科技巨头在AI领域的竞争主要集中在芯片性能的提升上,但随着算力的增强,通信开销成为了新的瓶颈。在大规模分布式训练中,节点间的数据同步问题导致算力利用率大幅下降,AI行业面临深刻的效率危机。为了解决这一问题,华为云推出了CloudMatrix384超节点,旨在构建一个高效的算力网络,彻底消除芯片间的通信瓶颈。
CloudMatrix384是华为云基于下一代AI数据中心架构CloudMatrix构建的,采用了全对等高带宽互联和细粒度资源解耦的设计理念,实现了“一切可池化、一切皆对等、一切可组合”的架构愿景…
来源: 机器之心
◎ 百度搜索近10年最大改版,自己革自己的命?
百度搜索近期进行了近10年来最大规模的改版,标志着其从底层技术到用户体验的全链路升级。最显著的变化是AI智能框的引入,取代了传统的搜索框,支持超长文本搜索、文件搜索、语音搜索等多种形式。此外,全新的百看功能能够自动分析用户需求,优先呈现多模态富媒体内容,如视频、图片和文字的综合答案,极大地提升了搜索结果的直观性和实用性。
在输入端,AI生成式相机的推出进一步增强了搜索的智能化。用户只需拍摄照片,系统便能自动解析需求并提供解决方案,如识别洗衣机故障并提供维修建议。输出端则通过百看功能,将搜索结果以更结构化的方式呈现,如电视剧推荐、咖啡店信息等,用户无需再点击多个网页自行查找答案。
百度搜索…
来源: 量子位
◎ RecFound:面向推荐系统的生成式表征学习统一框架
构建能够在多样化任务中表现卓越的单一基座模型是人工智能领域的长期目标。随着通用大模型技术的推进,其影响力已扩展至推荐系统领域。然而,当前针对推荐任务的基座模型研究普遍忽视了表征式任务,并在处理多任务学习的复杂性方面面临挑战。为应对这些局限性,上海交通大学与华为诺亚方舟实验室的研究团队提出了RecFound,一个面向推荐基座模型的生成式表征学习统一框架。该框架通过创新的模型架构与训练策略,成功地在单一模型内统一了生成与表征两类异构任务。
核心挑战在于推荐基座模型中的任务分歧与训练困境。表征学习是现代推荐系统的核心,但许多研究过度侧重于生成式任务,未能充分整合和优化底层的表征学习能力。这导致模…
来源: AI科技评论
◎ Altman嘲讽小扎挖走的都不是顶尖人才!OpenAI高管再营业曝内幕:ChatGPT爆红后,我火速升职了!
在AI领域竞争日益激烈的背景下,Meta和OpenAI之间的AI人才争夺战成为焦点。Meta首席执行官马克·扎克伯格近期宣布成立超级智能团队,并成功招募了多位OpenAI的前高管,这一举动引发了OpenAI的强烈反应。OpenAI CEO Sam Altman在公司内部发表了一份措辞强硬的回应,强调留在OpenAI才是打造通用人工智能的最佳选择,并对Meta的招聘行为表示不满,认为这可能会在未来引发严重的文化问题。Altman还暗示公司正在全面评估研究机构的薪酬方案,以应对人才流失的挑战。
与此同时,OpenAI首席研究官马克·陈将Meta的挖角行为形容为“有人闯入我们家偷东西一样”,并透…
来源: AI前线
◎ 到底什么样的充电宝才能带上飞机,看完这篇你就懂了
3月20日,香港航空HX115航班在飞行途中发生了一起充电宝起火事件,导致航班紧急降落。法国航空事故调查局(BEA)确认事故由“充电宝热失控”引起,涉事设备为罗马仕品牌的20000mAh充电宝,尽管该设备符合当时的航空携带标准,但仍引发了广泛关注。6月初,北京多所高校发布紧急通知,提醒师生停用该型号充电宝,指出其“更容易发生爆炸现象”。罗马仕随后公开致歉,并于6月16日宣布召回491745台移动电源,涉及三款主力机型,召回原因直指“部分电芯原材料来料原因”,可能导致过热甚至燃烧风险。此次召回并非罗马仕首次因安全隐患召回产品,2019年该公司曾因电芯组装缺陷召回3792台移动电源。
罗马仕事…
来源: 硅星人Pro
◎ 我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料
2025年上半年,AI开源领域的竞争聚焦于效率提升、多模态能力和智能体开发三大方向。参数规模不再是唯一追求,如何通过架构创新和训练方法优化实现“小模型强性能”成为关键突破点。智谱AI最新开源的GLM-4.1V-9B-Thinking模型正是这一趋势的典型代表,其仅9B参数却在18项测试中超越72B参数的竞品,展现出革命性的参数效率。
该模型的核心突破在于创新的“思考范式”架构。视觉编码器采用3D卷积处理时空信息,配合独创的2D-RoPE位置编码技术,可处理宽高比超200:1的极端尺寸图像。语言解码器升级为3D-RoPE结构,使多模态空间理解与文本生成能力同步提升。训练策略上采用三阶段进阶方…
来源: 硅星人Pro
◎ All in AI 两年,AI代码采纳率突破50%!安克创新龚银:AI平台一旦过时,我们会毫不犹豫重构
安克创新在2023年决定全面投入AI领域,探索如何将AI技术应用于内部运营和新产品形态。这一过程中,公司经历了技术快速迭代带来的挑战,既有成功落地的项目,也有因技术变化而被迫放弃的尝试。2023年,安克创新内部主要进行可行性评估,号召全体员工参与AI工具的探索,并在智能客服、营销等场景初步落地。2024年,随着AI技术的进一步发展,公司开始更深层次的探索,选择亚马逊云科技的生成式AI技术与云计算服务,从产品线和内部效率两方面进行实践。
在内部,安克创新建设了AIME智能体平台,旨在普及AI能力,使非技术岗位员工也能使用AI工具。研发领域,公司自研插件式编程体系,代码采用率从2023年的30…
来源: AI前线
◎ 专访AI.Talk赵汗青 – 我不是一个创作者。
AI虚拟偶像YURI的爆火标志着AI内容创作进入新阶段。这个由AI.Talk团队打造的虚拟IP,通过单曲《Surreal》获得700万播放量后,又以出道视频引发全网热议,获得北面等品牌的商业合作。其背后推手赵汗青揭示了一个系统性思考:虚拟IP需要构建文本、音频、影像、互动四个层面的完整人格,而YURI正是这种理念的产物。
汗青的创作路径具有显著差异性。先建立AI.Talk这个”厂牌”再孵化IP的模式,与传统的单点爆款逻辑形成对比。他认为在注意力饱和的当下,AI内容创作者更需要建立与用户间的信任关系。AI.Talk作为试验田,经过两年沉淀才孕育出YURI,这种长期主义思维使其避免了行业常见的…
来源: 数字生命卡兹克
◎ 比10年专业医生准4倍!微软发布突破性医疗AI系统
微软最新发布的医疗AI系统MAI-DxO通过模型无关的设计实现了突破性进展,能够适配不同厂商的语言模型并显著提升诊断性能。该系统模拟真实医生的诊断流程,在测试中展现出远超人类医生的准确率。与21名经验丰富的专业医生相比,人类医生在56例隐藏测试集上的平均准确率仅为19.9%,而MAI-DxO使用OpenAI的o3模型时准确率达到81.9%,集成模式下更高达85.5%,比专业医生准确4倍以上,同时大幅降低了诊断成本。
MAI-DxO的核心创新在于其借鉴真实医疗团队的协作模式,通过五个虚拟医生角色的分工合作优化诊断流程。Dr. Hypothesis负责维护鉴别诊断列表并更新疾病概率;Dr. T…
来源: AIGC开放社区
◈ 07月01日 星期二 【 10 篇 】
◎ Kimi,这次敢为天下后。
Kimi近期推出的”深度研究”功能展现出显著的技术突破和产品创新。该功能通过自主规划关键词、调用搜索工具、筛选信息等全自动化流程,最终生成结构化的研究报告和可视化网页。测试显示,在处理”蔡澜生平研究”案例时,系统能主动使用80组中英文关键词,覆盖南方周末、中国日报香港版等权威信源,并在发现信息偏差时自主纠偏,整个过程耗时约16分钟,最终输出9345字可溯源报告和交互式网页。
深度研究功能实质上是将Agent技术应用于垂直场景的成功实践。与传统的”推理模型”不同,这种Agent需要应对真实环境的动态变化,处理长链条、跨度的复杂任务,对模型的记忆力、上下文管理和连贯推理能力提出极高要求。值得注…
来源: AI产品阿颖
◎ o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦
近年来,大型语言模型(LLM)的快速发展促使研究人员寻找更有效的评估工具,以衡量这些模型在感知、记忆和推理等方面的能力。在这一背景下,经典游戏如《宝可梦》逐渐成为测试AI模型的重要工具。尽管这些游戏看似简单,但它们对AI的长期规划、决策和记忆能力提出了极高的要求。例如,Anthropic的Claude模型和Google的Gemini模型都尝试通过《宝可梦》来展示其推理能力,但这些测试缺乏标准化,导致结果难以比较。
为了解决这一问题,加州大学圣地亚哥分校(UCSD)等机构推出了Lmgame Bench,这是一个标准化的评估框架,旨在通过一系列经典游戏系统地测试LLM的能力。Lmgame Be…
来源: 新智元
◎ 跳槽实现财富自由!小扎千万年薪快要“掏空”OpenAI核心人才,还高调“晒”挖人成绩单:各栈大牛,近70%是华人
Meta 近期宣布成立“Meta 超级智能实验室”(MSL),旨在整合其基础研究、产品开发以及 FAIR 团队,并专注于下一代模型的研发。该实验室由原 Scale AI CEO Alexandr Wang 和前 GitHub CEO Nat Friedman 共同领导,团队成员包括来自 OpenAI、Anthropic 和谷歌等顶尖 AI 公司的资深研究员。扎克伯格在备忘录中强调,Meta 的目标是在未来一年内达到技术前沿水平,并已启动下一代模型的研发工作。
Meta 的超级智能实验室汇聚了来自多家顶级 AI 公司的核心人才,其中包括 OpenAI 的 Trapit Bansal、Shuc…
来源: AI前线
◎ 超越微软,全球第一!上交AI智能体炼成「Kaggle特级大师」,登顶OpenAI MLE-bench
上海交通大学人工智能学院Agents团队提出的AI专家智能体「ML-Master」在OpenAI发布的权威基准测试MLE-bench中取得了显著成绩,以29.3%的平均奖牌率位居榜首,大幅领先微软的RD-Agent(22.4%)和OpenAI的AIDE系统(16.9%)。MLE-bench是衡量AI在机器学习工程(MLE)中表现的权威基准,精选了Kaggle上的75个相关竞赛,测试AI在模型训练、数据准备、实验运行等机器学习工程中的能力。ML-Master的成功标志着AI自主优化AI领域迈出了关键一步,达到了Kaggle比赛「Grandmaster」级的水平。
ML-Master通过创新的…
来源: 新智元
◎ 程序员还写啥前端?Claude 工程师凌晨2点造出Artifacts:AI直接生成可交互App,现在又重磅升级了
Anthropic公司于6月26日升级了其AI工具Artifacts,标志着Claude聊天机器人向实用工具平台的转型迈出关键一步。这项功能允许用户无需编程技能即可创建交互式应用程序,自去年8月发布以来已支持数百万用户生成超过五亿个作品,涵盖生产力工具和教育游戏等领域。此次更新重点优化了共享机制和功能强度,使开发过程更加直观高效。
Artifacts的诞生源于研发团队对AI生成网站效率的探索。一名成员通过构建简易的并排界面,实现了模型生成内容的直接渲染,显著缩短了从构思到实现的周期。原型从开发到内部测试仅用一周半时间,体现了团队对技术落地的敏捷响应。该功能的核心价值在于重新定义了人机协作模…
来源: AI前线
◎ 苹果芯片,完成颠覆?
英特尔近期宣布关闭汽车业务并裁员,进一步加剧了其转型困境。与此同时,苹果宣布macOS 26 Tahoe将是最后一个支持英特尔芯片的macOS版本,标志着苹果自研芯片的成功,并加速了PC处理器行业的变革。苹果的ARM架构芯片M1、M2、M3系列在性能和能效上取得了显著突破,逐渐取代了英特尔在Mac产品线中的地位。苹果的成功不仅颠覆了PC处理器市场格局,还推动了ARM架构在PC领域的普及。
回顾历史,英特尔凭借x86架构和“Wintel联盟”在PC处理器市场占据了长达四十多年的主导地位。然而,随着AMD的崛起和苹果自研芯片的突破,英特尔的统治地位开始动摇。AMD通过Zen架构和台积电的先进工…
来源: 半导体行业观察
◎ 字节腾讯们齐聚,近万开发者人挤人,魔搭终成所有人的魔搭
2022年8月,一个名为ModelScope的AI平台悄然进入开发者视野,尽管当时大模型尚未流行,但这一平台迅速吸引了大量关注,浏览量在不到三周内达到四五十万。这标志着开发者对开源AI模型的强烈需求,成为社区爆发的第一个信号。到了2025年6月30日,首届魔搭开发者大会的盛况表明,这一平台已发展成为中国最大的AI开源社区。在不到三年的时间里,魔搭社区的托管模型数量从300个激增至超过7万个,开发者数量从100万扩展至1600万,贡献机构也从100多家增加到500多家。
魔搭社区的成功不仅体现在规模的快速扩张,更在于其从“阿里的项目”转变为“开发者的魔搭”。这一转变在开发者大会中得到了充分体…
来源: 硅星人Pro
◎ 700 万商家都在用的 AI 工具,凭什么?
在刚刚结束的618电商大促中,淘天集团的商家AI工具「生意管家」展现了其强大的商业应用价值。该工具累计服务了超过700万淘宝天猫商家,帮助商家生成了超过2亿的商品素材,完成了千万次智能代理操作和5亿次接待辅助。这一成绩不仅验证了工具的实用性,也为AI技术在商业领域的落地提供了有力证明。
生意管家的核心价值在于其显著的成本降低和效率提升。通过AIGC技术,该工具在素材生成、经营诊断、运营代理和客服辅助等多个维度实现了全面覆盖。在素材生成方面,商家只需上传参考图,即可在几分钟内生成高质量的图片和视频,大幅降低了传统素材制作的时间和成本。例如,服装商家无需再花费数千元聘请模特和摄影师,AI工具能…
来源: 极客公园
◎ 摩尔线程、沐曦三年共巨亏超80亿,“中国英伟达”们争夺GPU芯片第一股|深读
2025年上半年最后一天,被誉为“中国英伟达”的两家GPU芯片独角兽公司——沐曦集成电路和摩尔线程智能科技,同时启动了科创板IPO上市。沐曦股份拟募集资金39.04亿元,而摩尔线程计划募资80亿元。尽管两家公司在过去几年中累计营收分别为11.17亿元和6.09亿元,但净亏损分别高达32.9亿元和50.05亿元,显示出GPU芯片行业的高投入与高风险特性。这两家公司的估值总计超过450亿元,反映了资本市场对国产GPU芯片市场的高度关注。
沐曦股份和摩尔线程的IPO标志着中国GPU芯片行业的快速发展。沐曦股份成立于2020年,专注于异构计算领域,提供全栈GPU芯片及解决方案,广泛应用于智算、智慧…
来源: 钛媒体AGI
◎ 不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵
淘天集团举办的第四届硬核少年技术节于6月30日至7月4日在北京和杭州两地同步举行,展示了其在AI技术领域的深厚积累和创新能力。与传统的技术节不同,硬核少年技术节注重技术的实际应用和落地,通过AI展示场、AI交流场、AI开放场和AI比赛场等多种形式,全面展示了淘天集团在AI技术上的最新成果。
在AI展示场,淘天集团展示了AIGX技术体系的近40项最新技术成果,涵盖了电商经营中的多个场景,如索引、推荐、出价、拍卖、创意和数据等。AIGX技术体系的核心在于将AI技术与淘宝天猫的商业场景紧密结合,推动电商业务的智能化升级。此外,淘天集团还宣布与爱橙科技联合开源了强化学习训练框架ROLL,该框架在多…
来源: 量子位
◈ 06月30日 星期一 【 9 篇 】
◎ 95后,边改造业务边发AI顶会论文,是怎样的体验?
在AI时代的浪潮下,顶尖技术人才的市场价值被推升至前所未有的高度。无论是谷歌Transformer论文八子,还是从OpenAI出走的科学家,他们的选择直接影响企业技术代差甚至竞争格局。面对互联网大厂和初创公司急剧膨胀的需求,顶尖人才展现出极强的议价能力,促使企业通过行业顶级薪酬、专项人才计划(如京东TGT、字节TopSeed)展开全球化人才争夺。这场高强度军备竞赛背后,反映的是技术创新驱动下人力资源的战略性重构。
企业与人才的”双向奔赴”需要完善的培养体系支撑。京东技术沙龙零售专场的案例显示,从学界到产业的转型需要克服实验室思维与工业场景的鸿沟。27岁的博士洛川在入职一年内,通过双导师制快…
来源: 机器之心
◎ 2025 ToC AI产品:仅有3%用户愿意付费,29%的父母每天使用
消费级AI已经进入大众日常生活,超过六成的美国成年人在过去半年使用过AI,全球用户约18亿。然而,付费意愿极低,仅3%的用户愿意为AI服务付费,留下了4200亿美元的市场空白。父母群体是AI的“超级用户”,29%的父母每天使用AI,频率是非父母群体的1.9倍。通用AI助手占据了81%的市场收入,但专业工具在特定场景中仍有巨大机会。
AI的普及跨越了所有年龄代际,千禧一代是日常使用的中坚力量,而婴儿潮一代的广泛参与揭示了AI的普适性魅力。学生、在职人士和高收入家庭是AI使用率最高的群体,尤其是在工作与学习场景中,AI的渗透率显著提升。父母群体则利用AI应对繁杂的日常生活,随着孩子年龄增长,父…
来源: Founder Park
◎ 只用2700万参数,这个推理模型超越了DeepSeek和Claude
大语言模型在复杂推理任务中面临任务分解复杂、数据需求大以及高延迟等问题,当前的思维链(CoT)技术存在局限性。为了解决这些问题,Sapient Intelligence的研究者提出了分层推理模型(HRM),这是一种受大脑分层和多时间尺度处理机制启发的全新循环架构。HRM通过两个相互依赖的循环模块,在单次前向传递中执行顺序推理任务,无需对中间过程进行明确的监督。其中一个高级模块负责缓慢、抽象的规划,另一个低级模块负责处理快速、细致的计算。HRM仅包含2700万个参数,仅使用1000个训练样本,便在复杂的推理任务上取得了卓越的性能。
HRM无需预训练或CoT数据即可运行,在包括复杂数独谜题和大…
来源: 机器之心
◎ 比女皇报告还炸裂!67页AI深度调研刷屏,全球LLM大决战真正开始
Iconiq Capital发布的《2025年AI现状报告》深入探讨了AI从概念炒作到实战落地的关键问题。报告基于对300家AI公司高管和初创公司真实支出的分析,揭示了AI落地过程中的七大核心挑战和趋势。AI正从概念炒作转向实战落地,报告的核心关注点从“是否采用AI”转向了“如何高效实施AI”,强调了产品策略、成本控制和快速试错的重要性。
报告指出,AI选型中,OpenAI仍占据主导地位,而Claude紧随其后。在支出方面,大数据存储和处理的成本远超模型训练和推理,表明数据管理是AI落地的关键瓶颈。此外,报告还详细分析了AI开发工具的使用情况,提供了当前生产环境中实际部署的框架、库和平台的…
来源: 新智元
◎ AI编程里程碑!谷歌AI自己写代码惊呆工程师,GPU内核算法反超人类21%
AlphaEvolve的开源实现OpenEvolve在苹果芯片上实现了突破性的GPU核函数优化,性能超越人类工程师21%,标志着自动化编程进入新纪元。该系统通过自我进化代码,在真实的Transformer推理任务中实现了平均12.5%的性能提升,峰值性能甚至达到106%的飞跃。这一成就的核心在于OpenEvolve自主发现了三项关键优化策略:完美匹配Apple Silicon硬件特性的SIMD指令优化、减少内存带宽占用的两阶段在线Softmax算法,以及针对分组查询注意力(GQA)模型的特定内存布局优化。
进化过程展现出算法层面的创新性突破,特别是在处理128维注意力头时,系统自动采用8元…
来源: 新智元
◎ 华为盘古大模型开源,推理方案、基础代码全公开!
华为今日宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型以及基于昇腾的模型推理技术。这一举措被视为华为推进昇腾生态战略的关键步骤,旨在推动大模型技术的研究与创新,加速人工智能在各行各业的应用与价值创造。盘古Pro MoE模型基于分组混合专家模型(MoGE)架构构建,总参数量为720亿,激活参数量达160亿,并针对昇腾300I Duo和800I A2平台进行了系统优化。MoGE架构通过专家分组和跨设备计算负载均衡的设计,显著提升了训练和推理场景下的系统吞吐量。在昇腾800I A2上,盘古Pro MoE实现了单卡1148 tokens/s的推理吞吐性能,并通过投机…
来源: AI前线
◎ 美国芯片,凭啥领先?
美国在半导体技术领域的领导地位对经济和国家安全至关重要。为了在全球技术竞争中保持领先,美国必须重新巩固其作为半导体创新中心的地位。近年来,联邦政府通过《芯片与科学法案》资助的研发项目,正在努力应对行业变革,弥补美国在半导体竞争力、韧性和供应链安全方面的差距。这些投资旨在确保美国在人工智能、高性能计算、先进通信等关键领域的技术优势。
半导体行业的创新正面临前所未有的挑战,传统的“摩尔定律”模式逐渐接近物理极限,新的技术路径如先进封装、全栈创新等正在崛起。这些新方法不仅要求硬件和软件的协同发展,还需要整个价值链的紧密合作。联邦政府通过芯片研发办公室(CRDO)等项目,正在推动这些创新,确保美国…
来源: 半导体行业观察
◎ AI改变了一切,除了猫咪
近年来,AI生成的猫咪视频在各大社交平台上迅速走红,成为了一种新的文化现象。这些视频主要分为两类:一类是拟人化的剧情短片,另一类则是展示AI技术的视觉奇观。拟人化的剧情短片通过赋予猫咪人类的情感和行为,吸引了大量观众的共鸣。例如,“大橘剧场”中的胖橘猫被赋予了各种生活场景,甚至发展成了连续剧,赚足了全球网友的眼泪。而技术展示类的视频则通过模拟物理规律,如猫咪完成跳水动作,展现了AI技术的惊人进步。
这些视频的流行不仅仅是因为它们的有趣和可爱,更因为它们背后隐藏的商业价值。AI猫咪视频已经成为一种快速涨粉、吸引眼球的生意。许多创作者通过批量运营AI猫咪账号,获得了可观的收入。例如,一位名叫安…
来源: 硅星人Pro
◎ 人类下一个奇点,超级智能时代
Sam Altman在其博客文章《温和的奇点》中,详细探讨了人工智能(AI)技术发展的现状与未来趋势。他指出,人类已经跨越了技术发展的关键转折点,正迈向数字超级智能时代。尽管目前机器人尚未普及,但AI在许多领域已经展现出超越人类的能力,并显著提升了工作效率。Altman预测,到2025年,能够进行认知工作的智能体将出现,2026年可能会出现能够提出新见解的系统,2027年或许会有能够执行现实世界任务的机器人问世。这些技术将使更多人能够创造软件和艺术,虽然专家仍会优于新手,但新工具的普及将带来巨大变革。
到2030年代,智力和能源将成为极其丰富的资源,这将消除人类进步的两大限制。Altman…
来源: AIGC开放社区
◈ 06月29日 星期日 【 6 篇 】
◎ 硅谷大厂“杀疯了”!华人AI大牛被疯狂挖角,黄仁勋买下清华“天才少年”公司
全球AI竞争进入白热化阶段,硅谷科技巨头正通过高薪挖角顶尖人才和战略性收购来巩固领先地位。英伟达创始人黄仁勋近期亲自招募两位清华校友——华盛顿大学助理教授朱邦华和伯克利教授焦剑涛,两人此前联合创办的AI安全公司Nexusflow已被英伟达整合,其核心团队将主导Star Nemotron项目。该公司开发的Athene-V2模型在多项基准测试中媲美GPT-4o,安全场景准确率高达95%,显著优于行业水平。
Meta则从OpenAI批量挖走4名核心华人科学家,包括多模态负责人毕树超和感知技术负责人余家辉等,这被OpenAI员工公开称为”巨大损失”。统计显示Meta6月已招募超过9名OpenAI研…
来源: 钛媒体AGI
◎ 华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
AI大厂在GPU采购上的投入持续加码,但单纯堆砌硬件已无法满足高效算力需求。马斯克的xAI计划将10万卡超算规模扩大10倍,Meta则投资100亿美元建设130万卡数据中心,然而GPU数量并非衡量AI实力的唯一标准。集群化模式下,通信瓶颈、内存碎片化和资源利用率波动等问题制约了GPU性能的充分发挥。华为近期发布的60页论文提出下一代AI数据中心架构设计Huawei CloudMatrix,其首代产品CloudMatrix384通过高带宽全对等互连和细粒度资源解耦,突破了传统堆卡模式的局限。
CloudMatrix384的核心优势体现在高效性、准确性和灵活性三方面。预填充吞吐量达6688 t…
来源: 量子位
◎ Gary Marcus惊世之言:纯LLM上构建AGI彻底没了希望!MIT、芝大、哈佛论文火了
著名人工智能学者Gary Marcus转推了一篇由MIT、芝加哥大学和哈佛大学合著的论文,该论文揭示了大型语言模型(LLM)在推理和理解上存在的一种被称为“波将金式”的不一致性模式。研究表明,即使是顶级模型如o3也频繁犯此类错误,表明这些模型无法保持自身论断的一致性,从而无法实现通用人工智能(AGI)。论文指出,基准测试的成功仅证明了“波将金式理解”,即一种由与人类对概念的理解方式完全不可调和的答案驱动的理解假象。这些失败不仅反映了理解错误,更揭示了概念表征深层次的内在矛盾。
Gary Marcus认为,这项研究宣告了任何试图在纯粹LLM基础上构建AGI希望的终结。他通过非正式测试发现,像…
来源: 机器之心
◎ 更大的光罩,要来了?
High NA EUV光刻技术的应用面临电路拼接和掩模尺寸的挑战。曝光场之间的电路拼接对高数值孔径(0.55)EUV的设计、良率和可制造性提出了严峻考验。替代方案是将6×6英寸掩模版改为6×11英寸,从而消除拼接问题,但这需要几乎完全更换掩模制造基础设施。现代多核SoC的片上内存越来越大,难以保持在光罩极限内,193nm浸没式和EUV光刻的面积为26平方毫米,而High NA的光罩面积会缩小到该尺寸的一半。将中介层纳入封装中允许晶圆厂将设计拆分为芯片,但中介层仍须适合标准场大小,由光罩尺寸(6×6英寸)决定,光刻扫描仪会将其缩小4倍(最大为676平方毫米)。对于High NA EUV,该场要…
来源: 半导体行业观察
◎ 2025,10000个Vibe Coding井喷
2025年标志着AI编程技术的爆发式发展,“AI Coding元年”的概念被广泛认可。各类创新工具正彻底改变传统编程模式,从简单的代码补全进化到能自主理解需求、规划任务甚至编写完整应用的“AI程序员”。开发者角色随之发生根本性转变,从代码编写者转变为代码审核者,“Vibe Coding”理念迅速成为全球开发者社区的热门话题。
国内外科技巨头和创业公司纷纷布局这一领域。字节跳动的Trae以Builder模式重新定义开发流程,支持自然语言需求描述并自动生成完整代码结构,月活用户突破100万。阿里的通义灵码插件下载量达1500万,累计生成代码超30亿行。美团NoCode专注于“对话式应用生成”,…
来源: 硅星人Pro
◎ 一家芯片公司,猛攻英伟达护城河
在AI数据中心主导的2024年,云巨头们争相投资AI芯片,英伟达成为最大赢家,而博通和Marvell凭借定制芯片也在市场中占据重要位置。然而,如何高效利用大规模AI芯片集群成为云巨头面临的核心挑战,网络基础设施因此成为关键议题。Arista Networks作为一家专注于以太网技术的公司,正通过技术创新在AI网络领域崭露头角,成为英伟达的有力竞争者。
Arista的起源可以追溯到2004年,由硅谷三位技术先驱Andy Bechtolsheim、David Cheriton和Kenneth Duda共同创立。公司最初名为Arastra,寓意“开荒”,旨在重新定义网络硬件架构。2008年,Ja…
来源: 半导体行业观察
◈ 06月28日 星期六 【 3 篇 】
◎ 56岁的英特尔“背水一战”:裁员、高管离职、逐步关停汽车业务
英特尔近期经历了一系列重大变动,新任CEO陈立武上任102天后,公司持续进行业务收缩与组织优化。高级副总裁兼首席战略官Safroadu Yeboah-Amankwah将于6月30日离职,这是继汽车业务逐步关停后的又一高层人事变动。英特尔回应称对其贡献表示感谢,但未透露具体原因。Safroadu曾主导公司的战略投资与合作伙伴关系,其离职可能影响长期规划的执行。
汽车业务成为战略调整的首要收缩目标。英特尔强调此举并非完全关停,而是为聚焦核心的PC与数据中心业务。该业务曾涵盖智能座舱芯片和Mobileye自动驾驶技术,累计服务超5000万辆汽车。但近期内部通知显示,客户端计算事业部(CCG)旗下…
来源: 钛媒体AGI
◎ 这类芯片,寒冬已过?
全球芯片市场正释放出复苏信号,尤其是内存芯片领域,从通用DRAM到高带宽内存(HBM),市场价格回升、库存去化、订单恢复,呈现出“春天将至”的新趋势。韩国作为全球DRAM产业的核心基地,其出口数据成为观察行业周期的风向标。自今年2月起,韩国DRAM出口额结束同比下滑态势,连续四个月实现两位数增长,3月增长27.8%,4月增长38%,5月增长36%,6月前20天增长25.5%。这些数据表明,通用DRAM市场正快速形成供需紧张格局,TrendForce预计第三季度通用型DRAM价格将上涨18–23%。这一现象挑战了此前关于行业长期低迷的判断,重新点燃了市场对芯片产业整体复苏的期待。
三星在通用…
来源: 半导体行业观察
◎ Kimi Researcher团队自述:Agent不是缝合怪,它就是模型(附内测名额)
月之暗面(Moonshot AI)推出了其首个AI Agent产品——Kimi Researcher,该产品定位为一个能够生成带引用来源的深度研究报告的AI Agent,而不仅仅是一个简单的搜索工具。根据技术博客披露的数据,Kimi Researcher在实际运行中平均会搜索超过200个URL,运行70多次搜索查询,最终生成超过1万字的深度报告。在Humanity’s Last Exam(HLE)这一高难度基准测试中,其得分达到26.9%,创下了该测试的最高纪录。
2024年以来,AI Agent领域呈现两个明显趋势:一是从“外挂式”向“内化式”转变,即从依赖外部工具调用转向提升模型本身的…
来源: 硅星人Pro
这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看