标签:算力优化

智谱发布龙虾基座模型GLM-5-Turbo,还适配了一个养龙虾的盒子

智谱推出的GLM-5-Turbo是专为“龙虾”(OpenClaw)智能体场景深度优化的基座模型,旨在解决通用大模型在真实复杂工作流中易出现的指令偏差、工具调用不稳定及长...

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

硅谷的算力竞争已从GPU数量转向电力资源的争夺,OpenAI和马斯克的xAI等巨头正投入万亿级资金建设超大规模算力集群。然而,Anthropic的研究揭示了一个关键问题...

真武810E亮相,阿里如何「重构」估值?

云厂商在AI竞赛中的核心策略已转向自研芯片底座,以实现业务场景的深度适配与效率最大化。通用芯片设计因泛用性妥协而面临效率瓶颈,头部云厂商则通过真实业...

清华教授翟季冬:Benchmark正在「失效」,智能路由终结大模型选型乱象

「选择悖论」正在AI模型与算力领域显现。随着大模型参数激增、算力成本下降,用户的实际落地负担却日益加重。翟季冬教授指出,Benchmark的高分未必能匹配真实...

美团龙猫LongCat技术升级!新注意力机制解码速度快10倍,还能处理1M超长文本

美团龙猫LongCat系列发布全新稀疏注意力机制LoZA(LongCat ZigZag Attention),重点解决长文本任务的理解和算力难题。该技术通过改造原有的全注意力MLA机制...

一人剧组不是梦,商汤 Seko 2.0 把拍剧流程做成了按钮

2025年成为AI视频生成领域的'祛魅'年份,行业从OpenAI Sora等模型带来的技术震撼转向对产品化落地的集体焦虑。当前AI视频生成的核心矛盾在于'碎片化能力'与'...

V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

OpenAI前首席科学家Ilya Sutskever近期提出,过去五年依赖算力堆叠模型的'规模时代'正面临瓶颈,单纯扩大模型规模难以实现质变。然而DeepSeek通过V3.2系列模...

抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10

传统推荐架构面临规模化瓶颈与范式局限,级联式设计导致算力碎片化,整体算力利用效率(MFU)长期低于1%。快手提出的生成式端到端架构OneRec通过统一召回、粗...

华为开源突破性技术Flex:ai,AI算力效率直升30%,GPU、NPU一起用

华为联合三所高校发布了开源AI容器技术Flex:ai,旨在解决全球算力资源利用率低下的核心问题。当前AI产业面临算力资源严重浪费的困境:小模型任务独占整卡导致...

360纳米AI的“多智能体蜂群引擎”如何为智能体时代铺设高速公路?

当AI告别单打独斗,多智能体协作被视为打开生产力新纪元的钥匙。然而,从理论走向现实的路上,横亘着层层技术壁垒。算力成本是第一道隐形的天花板,单个智能...
1 2 3