AI每日精选摘要

AI精选资讯12小时前更新 admin
87,115 5 5
AI每日精选摘要

❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️


◈ 04月30日 星期三 【 9 篇 】

我手搓了一个电商AI应用,激动坏了


ChatGPT近期发布了一系列新特性,其中最引人注目的是购物功能的增强。用户现在可以在聊天界面中直接查看产品卡片,包含图片、价格、评分等详细信息,进一步点击还能展示购买渠道和用户评论。这一更新标志着ChatGPT的功能边界继续扩展,未来可能成为整合各种生活场景的入口。对于开发者而言,这一趋势也提供了新的机会,特别是在智能体中接入购物能力,未来智能体可能像浏览器和搜索引擎一样,成为人们触达互联网和服务的首选入口。
与此同时,百度旗下的电商品牌“百度优选”正式开放了MCP Server,这一协议为AI提供了“手”和“脚”,使得AI能够通过第三方服务完成更多任务,如与电商结合。李彦宏提到,基于M…

来源:AI每日精选摘要  AI产品阿颖

GruAI 张海龙:产品形态只是表象,Cursor 与 Devin 终有一战|AI 产品十人谈


自2022年12月ChatGPT问世以来,AI技术引发了广泛关注,但实际落地的产品却寥寥无几。AI编程(AI Coding)作为当前AI应用领域中最具商业化潜力的行业,吸引了大量创业者和投资者的目光。硅谷和国内的创业公司如Cursor、Lovable、Devin等纷纷涌现,估值飙升,显示出这一领域的火热程度。然而,尽管市场热度高涨,真正找到产品市场契合度(PMF)的产品并不多,许多公司仍处于试验性收入阶段,缺乏持续的用户需求。
Cursor的成功被视为AI编程领域的一个里程碑。它通过大胆的创新和独特的用户界面(UI)设计,成功找到了PMF,并创造了一个全新的市场。Cursor的成功不仅在于…

来源:AI每日精选摘要  AI科技评论

o3解读:OpenAI发力tool use,Manus们会被模型取代吗?


OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(Chain-of-Thought)能力,成为目前最先进的推理模型。o4-mini则是一款专为高效推理而优化的小模型,尽管在某些基准测试中表现优异,但与o3相比仍有明显差距。OpenAI的发布策略也发生了变化,先推出mini版本,再逐步扩展为具备完整工具使用能力的模型,这与之前的GPT模型发布策略有所不同。
o3的agentic能力使其从传统的Chatbot进化为更接近人类工作方式的agent。它能够无缝地使用工具,内置的CoT…

来源:AI每日精选摘要  Founder Park

一个月 78 块的 AI 日历,治好了我的「万事开头难」


许多人面对复杂的任务时,往往会因为启动困难而拖延,尤其是在使用传统的日程管理软件时,繁琐的任务添加和规划过程让人望而却步。然而,一款名为Splitti的AI-native日程管理软件,通过引入人工智能技术,为用户提供了全新的体验。Splitti的设计理念与传统日程软件不同,它更像是一个私人教练,能够根据用户的个人情况,自动分解任务、设置截止日期,并提供定制化的日程安排。用户只需用自然语言描述任务,AI便会自动将其拆解为多个子任务,并为每个任务分配合理的时间。这种任务分解的方式,尤其适合那些启动困难的人群,帮助他们逐步完成任务。
Splitti的另一个亮点在于其个性化服务。通过分析用户的自我…

来源:AI每日精选摘要  极客公园

只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍


南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模型在资源有限的情况下,展示了强大的推理能力,为人工智能领域带来了新的突破。Tina 模型的核心创新在于将微型模型架构与基于 LoRA 的强化学习相结合,显著降低了计算成本和硬件需求。通过这种方法,团队成功实现了在极低预算下(仅 9 美元)复现最佳模型检查点,而完整实验的总成本也仅为 526 美元。
Tina 模型的基础是 DeepSeek-R1-Distill-Qwen-1.5B,团队通过 LoRA 技术对…

来源:AI每日精选摘要  机器之心

Qwen3真香!通义App满血接入,一手实测在此


开源大模型Qwen3的发布引发了广泛关注,成为全球最强开源模型之一。该模型在多个领域展现出卓越性能,尤其是在编程、逻辑推理和多语言处理方面。Qwen3的参数量从0.6B到235B全面覆盖,其中32B模型在编程基准测评中超越了OpenAI o1和DeepSeek R1,甚至超过了Gemini 2.5 Pro。Qwen3支持119种语言和方言,并增强了对MCP的支持,展现出强大的多语言处理能力。此外,模型还支持思考和非思考模式,进一步提升了其灵活性和适用性。
在代码生成方面,Qwen3表现尤为突出。通过经典测试“空间内弹小球”,模型在1分钟内生成了一百多行代码,虽然初始版本缺少3D空间感,但经…

来源:AI每日精选摘要  量子位

人人都能有一个满血DeepSeek?清华90后出手,10万块畅玩FP8原版


一款由清华90后团队打造的AI利器——行云褐蚁一体机,首次实现了以14.9万元的低成本流畅运行满血版DeepSeek模型,并支持顶配的128K上下文,性能媲美百万级方案。DeepSeek-R1自开源以来,高昂的硬件成本和复杂的私有化部署方案一直是企业和开发者面临的难题。然而,行云褐蚁一体机的出现打破了这一局面,不仅大幅降低了成本,还提供了与官方版本相当的速度和精度,能够以超过20 token/s的速度运行未经量化的FP8原版DeepSeek模型。
该产品的核心优势在于其极致的性价比和高效的硬件选型。褐蚁系列一体机提供了三种型号,支持不同参数规模的模型,甚至在FP8和FP4精度下都能保持较高…

来源:AI每日精选摘要  新智元

披露1.4nm细节,英特尔更新晶圆代工路线图


英特尔在最近的晶圆代工大会上详细介绍了其最新的工艺节点进展,特别是14A和18A节点的开发与生产计划。14A节点是继18A之后的下一代产品,预计将成为业界首个采用高数值孔径EUV光刻技术的节点。英特尔已与多家客户共享了14A的工艺设计套件,并计划在2027年推出该节点。14A将采用第二代PowerVia背面供电技术和RibbonFET 2环绕栅极技术,进一步提升芯片的性能和能效。此外,英特尔还引入了“turbo cell”技术,旨在优化芯片的速度和功耗平衡。
18A节点目前已进入风险生产阶段,并计划于今年晚些时候实现量产。该节点是业界首个同时采用PowerVia背面供电网络和RibbonF…

来源:AI每日精选摘要  半导体行业观察

BBA加速智能化转型,谁是中国市场的关键推手?


在2025上海车展上,奔驰全球首发的纯电长轴距CLA车型成为焦点,标志着德系豪华品牌智能化转型进入新阶段。宝马、奥迪同期发布的AI全场景战略,进一步印证了智能化已成为豪华车市竞争的主战场。火山引擎和豆包大模型正在与中国汽车产业建立越来越紧密的联系,成为众多车企智能化转型的重要合作伙伴。
奔驰在全新CLA车型上推出的MB.OS 3.0智能车机系统,通过与火山引擎深度合作,实现了AI语音交互技术的重大突破。该系统不仅支持多种方言识别,还能智能感知用户情绪状态并动态调整反馈方式,为用户带来更加人性化的交互体验。宝马通过与火山引擎深度定制的智能营销工具,提升了用户购车体验和营销效率。上汽奥迪则基于…

来源:AI每日精选摘要  硅星人Pro

◈ 04月29日 星期二 【 10 篇 】

大模型时代,百度智能云迎来最大机会


随着AI技术的快速发展,尤其是DeepSeek等大模型的崛起,AI产业化进程显著加速。然而,AI的真正落地不仅依赖于技术突破,更需要强大的基础设施和开放的生态系统作为支撑。当前,AI产业正面临从模型训练到应用部署的全链条挑战,企业级AI Agent的需求激增,预计到2025年将成为AI落地的重点方向之一。尽管如此,企业在实际应用中仍面临场景选择难、技术门槛高、成本控制难、规模化部署复杂等痛点,这些问题亟需通过基础设施重构和生态优化来解决。
大模型的落地应用正在多个行业快速推进,尤其是在金融、制造和政务领域,AI技术的应用场景不断扩展。数据显示,2024年中国AI产业规模已达2697亿元,增…

来源:AI每日精选摘要  极客公园

发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕


2025年,AI领域的发展呈现出开源与创新加速的趋势。2月,DeepSeek的R1模型引发全球关注,将焦点集中在“中国”和“开源”上。4月,Meta宣布举办LlamaCon开发者大会,试图重新夺回AI开源领域的领导地位。与此同时,DeepSeek-R2、Qwen3和Llama4等开源模型的发布成为行业焦点,尤其是Qwen3的发布,标志着开源模型领域的新一轮竞争正式开启。
Qwen3作为阿里巴巴开源的新一代通义千问模型,凭借其卓越的性能和创新的架构,迅速登顶全球最强开源模型。其旗舰型号Qwen3-235B-A22B的参数量仅为DeepSeek-R1的1/3,但性能全面超越R1、OpenAI-…

来源:AI每日精选摘要  极客公园

钛媒体AGI独家|AI芯片巨头将在中国成立合资公司?英伟达发言人:我们拒绝发表评论


美国限制英伟达H20芯片对华出口,英伟达为维护其在中国市场的CUDA生态地位,正在低调启动“B计划”,考虑在中国设立合资企业,并可能为未来将中国业务单独拆分做准备。这一举措被内部人士描述为“修补漏洞”的生存之战,反映了地缘政治紧张局势下的企业策略调整。尽管英伟达发言人拒绝评论,但多位行业人士认为这一消息可能只是谣言。
英伟达自1993年成立以来,凭借GPU图形计算技术推动了PC游戏市场的发展,并开创了现代AI加速计算的新时代。近年来,英伟达搭上元宇宙、加密货币以及人工智能的东风,几乎一统AI算力芯片市场,成为一家全栈AI计算公司,致力于开发CPU、GPU、DPU和AI软件,为数据中心、自动…

来源:AI每日精选摘要  钛媒体AGI

9万9的人形机器人,与特斯拉的“擎天柱”到底有什么区别?


市场上的人形机器人价格差异显著,从9.9万到99万不等,主要分为工业级、科研级和展演级三类。工业级机器人专注于复杂工业场景中的精准操作和协同作业,具备高精度感知设备和灵巧手,价格通常在50万左右。科研级机器人强调开放性和可扩展性,价格在30-65万元之间,适合高校和研究机构进行深度开发。展演级机器人则通过简化配置降低成本,价格通常不到10万元,主要用于展示和表演。
工业级人形机器人配备了多样化及数量众多的高精度感知设备,确保在复杂环境中精准操作。例如,优必选Walker S1在头部前后、两侧及腰部均装备多部RGBD相机及鱼眼相机等多种传感器,能够全方位感知环境。科研级机器人则具备基础感知设…

来源:AI每日精选摘要  硅星人Pro

刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了


阿里巴巴发布了新一代通义千问模型 Qwen3,该模型采用混合专家(MoE)架构,总参数量为 235B,但激活仅需 22B,显著降低了成本。Qwen3 在性能上全面超越了 DeepSeek-R1 和 OpenAI-o1 等全球顶尖模型,成为国内首个“混合推理模型”,能够根据需求在“快思考”与“慢思考”之间灵活切换,大大节省算力消耗。在多项官方测评中,Qwen3 创下了国产模型及全球开源模型的性能新高,尤其是在奥数水平的 AIME25 测评中,以 81.5 分刷新了开源纪录。
Qwen3 的部署成本也大幅下降,仅需 4 张 H20 即可部署满血版,显存占用仅为性能相近模型的三分之一。官方推荐使…

来源:AI每日精选摘要  AI前线

AI 2027研究揭秘美国算力真相!中国全球AI专利Top1,但美国或以算力取胜


中美在AI领域的竞争日益激烈,尤其是在专利数量和算力方面的对比尤为突出。数据显示,中国在生成式AI(GenAI)专利数量上占据全球70%的份额,远超其他国家,特别是在2014年至2023年间,提交量达到了38,000多项。然而,尽管中国在专利数量上领先,美国在专利和出版物的引用量上依然稳居第一。例如,OpenAI虽然仅发表了48篇文章,但这些文章获得了高达11,816次的引用,显示出美国在学术影响力上的优势。中美顶级模型的差距已经缩小至0.3%,几乎可以忽略不计。
然而,AI竞赛的核心并非仅仅是专利数量,而是算力。根据AI Futures Project的两位核心成员Scott Alexa…

来源:AI每日精选摘要  新智元

半导体,最新预测


全球半导体材料市场在2024年预计将增长3.8%,达到675亿美元,主要得益于整体半导体市场的复苏以及对高性能计算和高带宽存储器制造中先进材料需求的增加。晶圆制造材料和封装材料分别增长3.3%和4.7%,其中化学机械平坦化(CMP)、光刻胶及光刻胶辅助设备市场表现尤为强劲,主要受到先进DRAM、3D NAND闪存和前沿逻辑集成电路(IC)工艺复杂性的推动。然而,由于行业持续消化过剩库存,硅的需求在后缘细分市场表现疲软,导致其收入下降7.1%。
台湾地区以201亿美元的营收连续15年成为全球最大的半导体材料消费地区,中国大陆和韩国分别以135亿美元和105亿美元的营收位居第二和第三。除日本外…

来源:AI每日精选摘要  半导体行业观察

猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火


Qwen3系列模型正式发布,采用Apache2.0协议开源,全球开发者、研究机构和企业均可免费下载并商用。该系列包含两款MoE模型和六款密集模型,每款模型又分为基础版和量化版等多个版本。旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中表现优异,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相当。小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%,但性能更优。Qwen3系列模型的部署成本大幅下降,仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一。
Qwen3系列模型在性…

来源:AI每日精选摘要  机器之心

4 月,1000 个通用 Agent 爆发


通用 Agent 技术的快速发展和应用正在成为行业的新共识。随着技术的迁移,Chatbot 逐渐被改造为更具智能的 Agent,催生了新的产品形态,如通用 Agent、Manus 和 Deep Research。这一趋势表明,应用开发仍然是中国开发者的重要机会。为了记录这一创新浪潮,Founder Park 推出了「AI 产品市集」,旨在展示创业团队、大厂和独立开发者的创新产品。
在众多 Agent 产品中,Genspark 的表现尤为突出。其新功能 Super Agent 在发布后 9 天内,ARR 达到了 1000 万美元,付费用户超过一万。Super Agent 能够通过研究目的地、…

来源:AI每日精选摘要  Founder Park

DeckSpeed 严訸:创业的本质是对全世界的祛魅| 00后创业者系列


严訸,一位00后创业者,从小受到姥爷的影响,对工程和生意产生了浓厚的兴趣。初中时期,他便通过复现各类产品,如电磁炮、特斯拉线圈等,积累了产品开发的早期经验。大学期间,他通过参加创客比赛和黑客松比赛,获得了人生的“第一桶金”,并逐渐积累了创业的启动资金。严訸曾就读于巴布森学院,但最终选择了All in创业,认为创业本质是对全世界的祛魅,并坚信自己可以通过创业实现自我价值。
2023年,严訸正式加入硅谷创业大军,推出了多款AI相关产品,包括DeckSpeed、CoreSpeed和Zypher Agent。其中,DeckSpeed被硅谷多家创业公司评价为“Cursor for Slide”,旨在…

来源:AI每日精选摘要  AI科技评论

◈ 04月27日 星期日 【 6 篇 】

纳米AI放大招!MCP万能工具箱,人人都能用上超级智能体


近年来,AI技术的快速发展带来了许多新概念和术语,如MoE、强化学习、智能体等,这些技术名词对普通用户而言往往难以理解,导致他们与AI的交互仅限于简单的聊天框操作。MCP(Model Context Protocol)作为支撑复杂任务自动化的关键协议,长期以来被认为是开发者的专属工具,因其文档晦涩、工具注册复杂、个性化配置门槛高,普通用户难以真正使用。然而,随着360旗下的纳米AI推出面向个人用户的「MCP万能工具箱」,这一局面正在改变。
「MCP万能工具箱」旨在降低普通用户的使用门槛,使其无需技术背景即可掌握前沿AI技术。该产品全面支持MCP协议,能够基于多种大模型底座运行智能体任务,并…

来源:AI每日精选摘要  机器之心

「拍照问夸克」,从「Know-What」到「Get it Done」的跃迁


夸克近期推出的「拍照问夸克」功能,标志着AI多模态入口的进一步升级。通过将相机作为与AI交互的核心工具,夸克AI相机不仅简化了用户的操作流程,还提供了更为智能的体验。与传统的文本输入相比,相机作为入口能够更直观地与物理世界互动,尤其是在旅游、点餐、博物馆参观等场景中,展现了其独特的优势。例如,用户可以通过拍摄多张照片,让AI自动生成朋友圈文案,甚至帮助选择最适合发布的图片。此外,夸克AI相机还支持多图识别,能够在点餐时帮助用户快速整理菜单,并计算热量摄入,极大地提升了决策效率。
夸克AI相机的核心能力在于其深度推理和意图识别。通过对模糊图片的溯源,AI能够准确识别拍摄地点,甚至在用户提问时…

来源:AI每日精选摘要  极客公园

从「黑科技」到「量产」,爱奇艺的虚拟制作进化论


虚拟拍摄技术近年来在国内影视行业中迅速崛起,成为推动影视工业化的重要力量。自2020年迪士尼《曼达洛人》引发行业关注以来,国内长视频平台如爱奇艺、腾讯视频等纷纷加码虚拟制作技术,应用于《流浪地球2》《长空之王》等电影,以及《大梦归离》《狐妖小红娘》等热门剧集。这一技术通过LED虚拟影棚和虚幻引擎的结合,替代传统绿幕和后期合成,实现了实时可视化和更逼真的视觉效果,尤其适合玄幻、科幻类影视剧。
尽管虚拟制作技术在国内火热,但实践团队常遇到技术难以适配剧组的瓶颈。爱奇艺通过自研IQ Stage系统、美术置景电动旋转地台和QClip云端协作等创新,切实解决了创作团队的使用痛点。这些软硬件的优化,使…

来源:AI每日精选摘要  极客公园

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔


OpenAI的o3模型展示了通过照片识别地理位置的强大能力,引发了广泛的关注和讨论。Django Web框架的创始人Simon Wilson通过实验发现,o3能够通过Python代码和图像处理技术,准确推测出照片的拍摄地点。这一功能不仅令人惊叹,也让人感到不安,因为它揭示了AI在隐私保护方面的潜在威胁。Wilson的实验显示,o3能够通过分析照片中的细节,如车牌、建筑和自然景观,逐步缩小范围,最终给出准确的地理位置。尽管o3的第一次猜测存在偏差,但它很快修正了错误,并成功识别出拍摄地点为加州的El Granada。
与其他AI模型相比,o3在图像处理和推理能力上表现出色。Claude 3….

来源:AI每日精选摘要  新智元

全新纯电长轴距CLA晒出“极致能耗”,奔驰决心在中国当实干家


梅赛德斯-奔驰首席技术官薛夫铭近期结束了为期10天的中国市场访问,期间他参与了产品发布会、F1赛事,并与中国的研发团队、供应商及合作伙伴进行了深入交流。此次访问并非例行公事,而是体现了奔驰对中国市场的高度重视。薛夫铭作为奔驰全球研发和采购的负责人,提出了将更多研发主导权交给中国团队的建议,标志着德国总部对中国研发能力的认可。
在中国市场,电动车的续航和能耗是消费者关注的核心。奔驰全新纯电长轴距CLA(CLA L)在2025年品牌科技日上亮相,凭借百公里电耗仅10.9千瓦时、CLTC工况续航高达866公里的表现,刷新了电动车能耗的标杆。其技术源自奔驰的能效概念车VISION EQXX,通过空…

来源:AI每日精选摘要  硅星人Pro

当AI基建告别“蛮力生长”:百度百舸如何用“系统思维”为应用铺路


在AI技术飞速发展的背景下,百度创始人李彦宏在Create 2025大会上强调了应用的重要性,认为“应用才是王者”。他指出,尽管大模型不断迭代,但找到合适的场景并善用模型工具的应用将超越模型本身。与此同时,全球AI算力竞赛进入白热化阶段,科技巨头们投入巨额资金,推动更强模型和应用的突破,AGI(通用人工智能)的讨论也日益升温。然而,中国AI发展面临高端芯片供应与制造的瓶颈,单纯复制海外“堆算力”模式面临挑战,如何在现有及可预见的算力资源下,通过系统性的优化和工程创新,最大化效率、降低成本,成为关键破局点。
百度在Create 2025大会上宣布了文心大模型降价、基于自研昆仑芯P800的3万…

来源:AI每日精选摘要  硅星人Pro

◈ 04月26日 星期六 【 10 篇 】

秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一


Kimi-Audio 是一个全新的通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在多个音频基准测试中实现了最先进的性能。结果显示,Kimi-Audio 总体性能排名第一,几乎没有明显短板。例如,在 LibriSpeech ASR 测试上,Kimi-Audio 的词错误率(WER)仅为 1.28%,显著优于其他模型。在 VocalSound 测试上,Kimi-Audio 达到了 94.85% 的准确率,接近满分。此外,在 MMAU 任务中,Kimi-Audio 摘得两项最高分,并在 VoiceBench 评测中,在所有子任务中得分最高,包括一项满分。
Kimi-A…

来源:AI每日精选摘要  机器之心

OpenAI“Agent万能论”遭打脸!LangChain创始人:Deep Search恰恰证明Workflows不可取代


当前,AI领域呈现出一种近乎“追星式”的热情氛围,每当有新的技术发布,便迅速引发广泛关注与高度评价。OpenAI最近发布的《A Practical guide to building AI agents》指南,被誉为“市面上最优秀的资源”,旨在为产品和工程团队提供构建AI智能体的实用方法。然而,LangChain创始人Harrison Chase对这份指南提出了强烈异议,认为其核心观点具有误导性,并指出OpenAI在定义Agent时采取了过于僵硬的“二元对立”方法。实际上,大多数“Agentic系统”是Workflows和Agents的有机结合,理想的Agent框架应支持从“结构化工作流”向…

来源:AI每日精选摘要  AI前线

上交大冷静文:模型发展需要和芯片、系统厂商协同


上海交通大学与魔形智能联合研究团队在HPCA 2025会议上发表了论文《VQ-LLM: High-performance Code Generation for Vector Quantization Augmented LLM Inference》,提出了VQ-LLM框架,通过分层代码本缓存和代码本中心计算引擎两大核心技术,成功实现了超过50%的推理延迟降低,性能超越同比特宽度的传统逐元素量化方法。这一突破为向量量化(VQ)技术的实际部署提供了可行方案,在保持大语言模型高精度的同时,显著提升了推理效率。
论文的主要负责人冷静文教授指出,向量量化的优势在于其极限、等效的比特压缩位宽比单元素…

来源:AI每日精选摘要  AI科技评论

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI


美国政府近期公开了各界对「AI行动计划」的政策建议,引发了广泛关注。OpenAI和Anthropic等公司提出了对中国加强技术封锁的建议,认为必须限制高端GPU芯片和模型权重流向中国,以确保美国在AI领域的领导地位。OpenAI特别强调,中国在数据、能源、技术人才和芯片产业等方面具有显著优势,因此美国需要通过严格的出口管制和监管策略来应对这一挑战。Anthropic则呼吁控制H20芯片的出口,并建议美国政府签署政府间协议,防止芯片违规流通到中国。
Meta则持相反立场,强调开源AI的重要性,认为出口管制只会削弱美国的竞争力,并可能导致全球开发者转向中国的开源模型。谷歌也批评了拜登政府的AI…

来源:AI每日精选摘要  新智元

强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏


近年来,大语言模型在推理能力方面取得了显著进展,尤其是在处理数学和编程等复杂逻辑问题时。可验证奖励强化学习(RLVR)被认为是提升模型推理能力的关键技术,其通过简单的奖励信号优化模型,减少了对大量人工标注数据的依赖。然而,清华大学和上海交通大学的一项研究对这一观点提出了挑战,揭示了RLVR可能并未真正赋予模型全新的推理能力,而是主要提高了采样效率。
研究团队通过pass@k指标进行实验,发现当k值较小时,RLVR训练模型的表现优于基础模型,但随着k值增大,基础模型逐渐超越RLVR模型。这表明,基础模型通过多样化采样能够生成原本被认为只有RLVR模型才能解决的正确答案。此外,RLVR训练虽然…

来源:AI每日精选摘要  新智元

双AI引擎开启舱驾“团战时代”!联发科C-X1捅穿智舱算力天花板


《高智能方程式》作为上世纪九十年代风靡一时的日本动漫,讲述了男主角风见隼人驾驶其父亲设计的赛车“阿斯拉达”成为高智能方程式史上最年轻冠军的故事。这部作品不仅展现了赛车的速度与激情,还通过“阿斯拉达”这一高性能电脑,将赛车拟人化,使其能够与驾驶者分享车辆状态、道路信息,甚至在驾驶者遇到困扰时提供情感支持。这一设定在当时被认为是科幻,但如今,随着计算芯片和大模型技术的飞速发展,类似的智能座舱技术正在成为现实。
近年来,智能座舱领域迎来了重大突破,尤其是Agentic AI(智能体AI)的出现,标志着智能座舱从被动应答向主动预判的转变。根据英伟达CEO黄仁勋的观点,AI技术的发展将经历三个阶段:…

来源:AI每日精选摘要  半导体行业观察

OpenAI继续商业化狂飙:要靠Agent 5年赚1750亿美元


OpenAI正在通过AI Agent技术重塑其商业模式,并预计到2025年,Agent将成为其主要的收入来源。2025年被OpenAI称为“Agent元年”,公司希望通过Agent技术实现显著的收入增长。今年以来,OpenAI推出了两款基于ChatGPT的AI Agent:Operator和Deep Research,分别用于自动化任务执行和生成专业研究报告。这些举措表明,OpenAI正在加速在AI领域的布局,尤其是在模型推理和开源工具方面。4月18日,OpenAI发布了其“迄今最强大”的AI推理模型,并推出了一款开源编程智能体Codex CLI,这是自2019年以来OpenAI首次推出的重…

来源:AI每日精选摘要  硅星人Pro

晶圆厂,巨变


全球半导体行业正迎来前所未有的投资热潮,预计到2030年,全球半导体公司将在新晶圆厂建设上投入约1万亿美元,行业年收入也有望突破1万亿美元。这一巨额投资不仅旨在满足日益增长的市场需求,还将增强各地区在半导体价值链上的供应弹性。然而,尽管这一大规模投资有望显著扩展半导体产能,但其实现预期效益的道路并不平坦。北美和欧洲市场尤其面临五大结构性障碍,包括资本与运营成本高企、材料需求增长、关键原材料及封装环节的离岸集中、物流与处理瓶颈,以及人才短缺等问题。
资本与运营成本是首要挑战。在美国和欧洲建设晶圆厂的成本显著高于亚洲,尤其是在建筑和劳动力成本方面。美国本土建设先进逻辑芯片厂的前期资本投入和长期…

来源:AI每日精选摘要  半导体行业观察

宝马秀起汽车科技来,哪有其他汽车什么事…


上海车展展示了众多前沿科技,尤其是电动车领域的创新。展会上,宝马推出的BMW新世代驾趣概念车成为焦点,这款车不仅外观极具未来感,还搭载了多项黑科技,展现了电动车时代的驾驶乐趣。BMW新世代驾趣概念车的轮上扭矩达到了18000牛·米,能够轻松应对54度的斜坡,这得益于其搭载的5台风扇,通过制造地效增强下压力。这种技术不仅提升了车辆的爬坡能力,还增强了平地上的操控性,使车辆在转向和过弯时更加精准。
宝马通过智能科技进一步增强了驾驶体验。其自研的驾控超级大脑Heart of Joy深度集成了传动、制动、能量回收和转向等功能,使得98%的驾驶场景无需依赖传统制动系统,大幅提升了能量效率。此外,车辆…

来源:AI每日精选摘要  量子位

Windsurf团队科普Agent:不是什么都叫智能体!


Agent系统的核心概念可以简单理解为“LLM+工具”的循环。Agent系统通过接收用户输入,交替调用推理模型(LLM)和工具来完成任务。 推理模型负责决定下一步行动,并输出结构化信息,指定调用哪个工具及其参数。工具则执行推理模型指定的行动,并将结果反馈给推理模型,形成一个循环。这种设计使得LLM不仅仅是内容生成器,而是更像一个负责选择工具的推理组件。 推理在Agent领域特指利用LLM决定下一步行动,而非其他语境下的思维链推理。
Agent系统与非Agent系统的区别在于,前者允许LLM在运行时自行决定调用哪些工具,而后者则是在工作流中预先规定好LLM的调用顺序和方式。Agent系统的优…

来源:AI每日精选摘要  Founder Park

◈ 04月25日 星期五 【 8 篇 】

DeepMind CEO 放话:未来十年赌上视觉智能,挑战 OpenAI 语言统治地位


Demis Hassabis,作为AI领域的先驱,其职业生涯始于对国际象棋的痴迷,并最终引领了通用人工智能(AGI)的研究。Hassabis从小展现出非凡的国际象棋天赋,13岁时便成为国际象棋大师,这段经历不仅塑造了他的思维方式,也为他日后在AI领域的探索奠定了基础。2010年,他与人共同创立了DeepMind,该公司于2014年被谷歌收购,成为AI研究的重要力量。2017年,他开发的AlphaZero算法在国际象棋领域取得了突破性进展,仅通过自对弈便成为最强棋手。
2024年,Hassabis因开发AlphaFold2模型获得诺贝尔化学奖。AlphaFold2能够在几分钟内预测几乎所有已…

来源:AI每日精选摘要  AI前线

打造「无所不能、无处不在」的 AI,百度为何要从「操作系统」做起?


大模型虽然具备广泛的知识储备和强大的解释能力,但在实际应用中却常常无法满足具体的任务需求。聪明、博学并不等同于能干活,大模型需要从单纯的“深度思考”进化到“深度交付”,才能真正实现其价值。百度在这一领域迈出了重要一步,推出了全球首个内容领域的操作系统——沧舟 OS。这一系统通过整合百度文库和百度网盘的底层技术、能力和数据,旨在实现低门槛、端到端的高质量交付,让 AI 真正做到“无所不能、无处不在”。
沧舟 OS 的推出标志着 AI 技术从实验室走向实际应用的重大突破。任何技术的成熟都需要经历 Gartner 曲线的过程,从技术狂热到实际落地,再到生态爆发。沧舟 OS 的架构分为三层:底座基…

来源:AI每日精选摘要  极客公园

“DeepSeek不是万能的”,李彦宏今年押注AI 应用:模型价再“打骨折”,重点布局多智能体、多模态


在百度 Create 开发者大会上,百度创始人李彦宏发布了两款新的大模型——文心大模型 4.5 Turbo 和文心大模型 X1 Turbo,并宣布了一系列支持开发者全面拥抱 MCP(模型上下文协议)的措施。这两款模型具备多模态、强推理和低成本三大特性,多模态能力成为未来基础模型的标配,文心 4.5 Turbo 在多个基准测试中与 GPT 4.1 持平,甚至优于 GPT 4o。李彦宏强调,模型的价值在于应用,未来真正统治世界的将是应用,而非模型本身。他还指出,当前开发者面临的主要障碍是大模型成本高,而百度通过大幅降低价格,为开发者提供了更具竞争力的选择。
百度 CTO 王海峰详细介绍了文心 …

来源:AI每日精选摘要  AI前线

英特尔一季度营收疲软股价暴跌,陈立武:当前是成败攸关的时刻|钛媒体AGI


英特尔于2025财年第一季度发布了财报,显示营收为126.67亿美元,同比下降0.4%,净亏损8.21亿美元,同比扩大115%。这是新任CEO陈立武上任后的首份财报,标志着公司进入了一个关键转折点。财报数据显示,尽管营收略高于预期,但利润表现远低于市场预期,反映出英特尔在市场竞争中面临的严峻挑战。陈立武在财报电话会议中强调,公司正在努力重回增长轨道,但这一过程将充满困难,且没有捷径可走。
陈立武宣布了一系列重大变革措施,旨在重塑英特尔的文化和运营效率。他指出,公司内部存在过多的层级和官僚主义,导致决策缓慢,创新受阻。为此,英特尔将通过裁员和扁平化管理来简化组织结构,预计裁员规模可能超过2万…

来源:AI每日精选摘要  钛媒体AGI

文心 4.5 发布,但李彦宏说应用才是王者


在2025年AI技术快速迭代的背景下,百度在Create开发者大会上发布了两大新模型和多项AI应用,旨在帮助开发者全面拥抱MCP(Model Context Protocol)生态。文心大模型4.5 Turbo和X1 Turbo的推出,分别以多模态能力、低成本和强推理为核心特性,展现了技术与性价比的平衡。文心4.5 Turbo在多模态能力上进一步突破,速度更快,价格大幅下降,每百万token输入价格仅0.8元,输出3.2元,较DeepSeek-V3低至40%。X1 Turbo则在问答、创作、逻辑推理和工具调用等场景中表现领先,每百万token输入1元、输出4元,仅为DeepSeek-R1的2…

来源:AI每日精选摘要  极客公园

最新实测!文心4.5T/X1T双卷王登场效果惊人,骨折价卷到DeepSeek


百度最新发布的两款大模型——文心大模型4.5 Turbo和文心大模型X1 Turbo,标志着其在多模态、深度推理和低成本方面的显著突破。这两款模型不仅在性能上超越了市场上的同类产品,还在价格上展现了极高的性价比。文心X1 Turbo在推理、创作、逻辑推理、工具调用和多模态能力上表现尤为突出,其严谨的思维链和高效的数学解题能力令人印象深刻。例如,在回答“全球人类同时起跳对地球的影响”这一复杂问题时,X1 Turbo通过详细的计算和推理,得出了科学且严谨的结论。此外,X1 Turbo在创作方面也展现了强大的能力,能够模仿古文风格撰写文章,并融入现代元素,展现了其多模态理解与生成的能力。
文心4…

来源:AI每日精选摘要  新智元

国产AI ISP,跑出新巨头


随着人工智能与图像处理技术的深度融合,AI ISP(人工智能图像信号处理器)正成为科技领域的新焦点。它不仅提升了成像质量,还为智能视觉应用场景的拓展提供了关键技术支持。AI ISP已成为科技厂商竞相布局的新战场,国内外企业纷纷投入资源,推动技术创新与市场应用。
传统ISP在复杂场景下的局限性促使行业转向AI技术寻求突破。传统图像信号处理器在处理弱光、运动等场景时表现不足,难以满足日益增长的图像处理需求。特别是在安防市场,随着传统市场趋于饱和,企业亟需通过技术升级实现“看得清、看得懂”的目标。AI ISP通过深度学习算法,构建了更智能的图像处理模型,显著提升了图像降噪、色彩还原等性能,尤其在…

来源:AI每日精选摘要  半导体行业观察

用AI做“跳看”,爱奇艺要让用户掌握主动权


爱奇艺在最新的App更新中推出了“跳看”功能,用户只需在屏幕两侧上下划动即可直接跳转到精彩剧情点。这一功能的实现依赖于AI技术,能够识别视频中的关键情节,确保用户在快速浏览时不会错过重要内容。跳看功能不仅提升了用户的观看体验,还赋予了他们更大的内容掌控权。爱奇艺基础架构与智能分发事业群总裁刘文峰在4月23日的爱奇艺世界大会上详细演示了这一功能,并强调其核心在于通过AI技术精准识别剧情点,帮助用户更高效地消费内容。
在碎片化时间增多的背景下,用户注意力集中的时间越来越短,但他们对娱乐体验的需求并未减少。爱奇艺通过跳看功能,解决了传统拖拽进度条和倍速播放带来的问题,如定位不精准和音画失真。这一…

来源:AI每日精选摘要  硅星人Pro

◈ 04月24日 星期四 【 10 篇 】

阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈


视觉-语言-导航(VLN)和视觉-语言-动作(VLA)是近年来具身智能领域的重要研究方向。2018年,吴琦与Peter Anderson、Abhishek Das首次将视觉-语言(VL)与机器人导航结合,提出了VLN的概念,并在CVPR 2018上发表了相关研究。随后,他们在ACL会议上进一步探讨了视觉、语言与动作的结合,正式开启了VLA领域的研究。吴琦提出的“V3A”概念,即视觉(Vision)、提问(Ask)、回答(Answer)和行动(Act),强调了机器人在理解多模态信息后,还需与真实环境进行交互以解决实际问题。
VLN的研究不仅推动了视觉导航技术的发展,还为具身智能提供了新的研究…

来源:AI每日精选摘要  AI科技评论

智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!


上海车展上,长安马自达新车发布中,智能座舱成为亮点,面壁智能的端侧大模型cpmGO以惊人的速度从零到量产仅用10个月,刷新了行业纪录。 这一成就不仅展示了端侧大模型在汽车领域的快速应用,也标志着汽车智能化进入了一个新的阶段。cpmGO由面壁智能自研的MiniCPM端侧大模型驱动,完全在车机等终端设备本地运行,无需依赖云端算力,保障了数据隐私安全,并在车机芯片上实现了毫秒级响应。此外,cpmGO整合了视觉、语音、图形UI等多模态数据,实现了“可见即可说”的交互,极大提升了人车交互体验。
cpmGO的纯端侧设计解决了云端方案的网络依赖问题,在隧道、山区等网络不稳定场景下仍能稳定提供全功能服务。…

来源:AI每日精选摘要  量子位

这才是真正好用的MCP服务


360公司在MCP(多通道协议)的理解和落地方面表现出色,尤其是在用户体验上的创新值得关注。通过将MCP技术隐藏在“万能工具箱”这一用户友好的界面背后,360成功降低了普通用户的技术门槛。这种做法不仅避免了用户对复杂技术概念的困惑,还使得MCP的使用变得简单直观。例如,用户无需手动配置或申请密钥,只需在工具箱中选择所需功能即可直接使用,如百度地图或火车票查询等工具。这种“开箱即用”的设计极大地提升了用户体验,尤其对于非技术用户而言,使用MCP工具变得像安装普通应用一样简单。
MCP技术的核心在于标准化工具调用,而纳米AI进一步将其平民化。通过预置常用工具和简化安装流程,纳米AI成为目前国内…

来源:AI每日精选摘要  AI产品阿颖

被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路


强化学习(RL)与大型语言模型(LLM)的结合在2025年展现了巨大的潜力,尤其是在后训练时代。RL通过其在策略优化和创造力方面的优势,证明了其与LLM的互补性。LLM虽然在数据驱动的生成任务中表现出色,但其缺乏持续进步和纠错的能力,而RL则能够弥补这一不足。通过Inverse RL和Data-Driven Reward Models,RL与LLM的结合在数学、聊天等领域取得了显著成功。例如,AlphaProof和Alpha Geometry在数学竞赛中表现出色,而RLHF(Reinforcement Learning from Human Feedback)在OpenAI的ChatGPT中…

来源:AI每日精选摘要  机器之心

TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨


在大语言模型(LLMs)竞争日益激烈的背景下,推理能力成为评估模型性能的关键指标。测试时缩放(TTS)作为一种新兴策略,通过优化推理过程(如多数投票、蒙特卡洛树搜索等)提升模型性能,而无需修改模型参数。研究表明,TTS在计算效率上优于预训练阶段扩大模型规模,能以更低资源成本实现更好表现。然而,TTS依赖预训练知识,在面对未标注新数据或输入分布变化时,泛化能力受限。例如,OpenAI的o3模型在基准任务上达到75.7%的成功率,但对更复杂的新任务仅能解决4%的问题。
为克服TTS的局限,测试时训练(TTT)一度受到广泛关注。TTT通过在测试阶段利用强化学习(RL)等技术动态更新模型参数,使模…

来源:AI每日精选摘要  机器之心

终于有个不瞎编的旅游AI了。


飞猪最近推出了“问一问”功能,旨在通过AI技术为用户提供个性化的旅游攻略。这一功能在五一假期前上线,正好迎合了旅游高峰期用户的需求。与传统的AI旅游攻略工具不同,飞猪的“问一问”不仅能够根据用户的具体需求生成详细的行程安排,还能实时查询机票、酒店等信息,并提供一键预订服务。这种垂直场景下的AI应用,显著提升了用户体验,避免了用户在多平台之间切换的繁琐操作。
飞猪的“问一问”功能通过四位顾问的协作,分别负责交通、酒店、预算和行程规划,确保用户的每一个需求都能得到精准的满足。例如,用户提出“五一去曼谷五天行程,预算一万五”的需求后,系统会实时查找航班、推荐酒店,并计算整个行程的费用,确保不超出…

来源:AI每日精选摘要  数字生命卡兹克

AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理


2025年被许多人视为“AI智能体元年”,然而当前大多数智能体仍处于实验阶段,尚未真正进入企业应用。李飞飞团队与多所大学及微软合作,推出了名为RAGEN的新系统,旨在提升人工智能在企业应用中的稳定性和可靠性。该项目由前DeepSeek研究员王子涵主导,专注于大语言模型的自主性、效率和长文本理解。RAGEN系统基于StarPO强化学习框架,通过多轮交互训练智能体,使其能够在不确定性中进行推理并记忆历史对话。RAGEN的核心在于训练智能体完成完整的决策路径,而非仅仅优化某一次回答。
RAGEN的训练框架包括两个交替阶段:rollout阶段生成完整的交互序列,update阶段根据累计奖励更新模型…

来源:AI每日精选摘要  AI前线

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI


昆仑万维最新发布的Skywork-R1V 2.0版本,标志着多模态推理模型的又一次重大突破。作为全球首个工业界多模态推理模型,R1V 2.0不仅在技术上实现了显著进化,还全面开源了模型权重、技术报告和代码仓库,推动了多模态推理社区的发展。R1V 2.0的亮点在于其强大的高考数理解题能力,能够准确解答复杂的物理、化学和生物题目,展现出985高校水平的推理能力。例如,在2022年江苏高考物理真题中,模型通过法拉第电磁感应定律准确计算了感应电动势,并给出了正确答案。这种能力不仅限于物理,模型在化学和生物题目中也表现出了极高的准确率。
R1V 2.0的另一个显著特点是其在数学推理和编程能力上的跃升…

来源:AI每日精选摘要  新智元

1.4nm正式亮相,台积电更新路线图


台积电在TSMC Symposium 2025上发布了一系列新技术,并更新了其技术路线图,展示了其在半导体领域的持续创新。第二代GAA工艺14A首次曝光,计划于2028年投产,预计在相同功耗下速度提升15%,或在相同速度下功耗降低30%,逻辑密度提升20%以上。该工艺旨在推动人工智能(AI)转型,并通过提升智能手机的内置AI功能,使其更加智能。台积电凭借其在纳米片晶体管设计与技术协同优化方面的经验,正在将其TSMC NanoFlex标准单元架构升级为NanoFlex Pro,以实现更高的性能、能效和设计灵活性。
除了A14,台积电还推出了新的逻辑、特殊工艺、先进封装和3D芯片堆叠技术,这些…

来源:AI每日精选摘要  半导体行业观察

深度 | 鏖战 AI Agents:硅谷修路,中国造车


硅谷和中国在AI Agent领域的发展路径呈现出显著差异。硅谷通过推动统一协议标准,如Anthropic的MCP和谷歌的A2A,逐步建立AI Agent的互联互通基础设施,类似于“修路”。这些协议旨在整合现有软件生态,降低开发成本,并推动Agent之间的标准化交互。相比之下,中国AI Agent行业则更加注重实际应用场景的落地,尤其是在To B领域,企业通过自主研发和定制化解决方案,快速响应市场需求,类似于“造车”。
硅谷的软件生态高度标准化,SaaS普及率超过80%,这使得统一协议成为Agent发展的必要条件。MCP等协议不仅简化了开发流程,还使得现有SaaS服务能够被Agent调用,形…

来源:AI每日精选摘要  硅星人Pro

© 版权声明
“绘蛙”

相关文章

没有相关内容!
“极客训练营”

5 条评论

  • 硅星人Pro
    硅星人Pro 投稿者

    这个主题很棒,赞

    Reply
  • AI前线
    AI前线 投稿者

    收藏啦收藏啦

    Reply
  • admin

    有啥改进意见,欢迎提出

    Reply
  • Founder Park
    Founder Park 投稿者

    精选内容有重复的😅

    Reply
  • 新智元
    新智元 投稿者

    精选内容很好,方便查看

    Reply