标签:算力优化
清华教授翟季冬:Benchmark正在「失效」,智能路由终结大模型选型乱象
「选择悖论」正在AI模型与算力领域显现。随着大模型参数激增、算力成本下降,用户的实际落地负担却日益加重。翟季冬教授指出,Benchmark的高分未必能匹配真实...
美团龙猫LongCat技术升级!新注意力机制解码速度快10倍,还能处理1M超长文本
美团龙猫LongCat系列发布全新稀疏注意力机制LoZA(LongCat ZigZag Attention),重点解决长文本任务的理解和算力难题。该技术通过改造原有的全注意力MLA机制...
一人剧组不是梦,商汤 Seko 2.0 把拍剧流程做成了按钮
2025年成为AI视频生成领域的'祛魅'年份,行业从OpenAI Sora等模型带来的技术震撼转向对产品化落地的集体焦虑。当前AI视频生成的核心矛盾在于'碎片化能力'与'...
V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了
OpenAI前首席科学家Ilya Sutskever近期提出,过去五年依赖算力堆叠模型的'规模时代'正面临瓶颈,单纯扩大模型规模难以实现质变。然而DeepSeek通过V3.2系列模...
抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10
传统推荐架构面临规模化瓶颈与范式局限,级联式设计导致算力碎片化,整体算力利用效率(MFU)长期低于1%。快手提出的生成式端到端架构OneRec通过统一召回、粗...
华为开源突破性技术Flex:ai,AI算力效率直升30%,GPU、NPU一起用
华为联合三所高校发布了开源AI容器技术Flex:ai,旨在解决全球算力资源利用率低下的核心问题。当前AI产业面临算力资源严重浪费的困境:小模型任务独占整卡导致...
360纳米AI的“多智能体蜂群引擎”如何为智能体时代铺设高速公路?
当AI告别单打独斗,多智能体协作被视为打开生产力新纪元的钥匙。然而,从理论走向现实的路上,横亘着层层技术壁垒。算力成本是第一道隐形的天花板,单个智能...
狂拿大模型明星订单,一家清华系HPC-AI Infra公司浮出水面
93年创始人闫博文带领的是石科技在高性能计算领域展现出独特的发展路径。这家从国家超级计算无锡中心孵化而来的企业,凭借深厚的技术积累,在不盲目囤积算力...
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
AI大厂在GPU采购上的投入持续加码,但单纯堆砌硬件已无法满足高效算力需求。马斯克的xAI计划将10万卡超算规模扩大10倍,Meta则投资100亿美元建设130万卡数据...
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
推荐系统正经历由大型语言模型(LLM)驱动的范式变革。传统级联架构因算力碎片化、目标冲突等问题面临瓶颈,而快手提出的端到端生成式系统OneRec通过整合Enco...
1
2




