标签:算力优化

手机跑多模态也能快到飞起!面壁MiniCPM-V 4.6开源

大模型技术正加速向移动终端演进,实现复杂图文与视频任务的本地化实时处理。MiniCPM-V 4.6作为一款专为端侧部署深度优化的多模态模型,依托视觉编码器与轻量...

「第二次 Token 大战」或再打响,「新全栈」或许才是内卷的「解药」

随着AI智能体应用范式的全面落地,复杂任务执行导致Token消耗呈指数级上升,云服务市场正从单一的技术堆叠转向深度的价值生态竞争。日活跃智能体指标的提出,...

对话小宿科技:搜索比推理便宜10倍,但90%的人不知道

Agent时代不属于消耗最多算力的人,而属于最会使用算力的人。当前AI应用面临严峻的Token成本压力,根本原因在于大量资源被消耗在重复搜索、低质量上下文及不...

腾讯AI Lab绝唱:30B模型击败万亿旗舰,靠的是让AI学会「预习」

大模型智能体正经历从被动执行指令向具备自主演化能力的系统性转变。针对当前多轮推理场景高度依赖人工奖励机制、预设流程僵化且导致计算资源过度消耗的现状...

Kimi、智谱背后的“隐形冠军”藏不住了!AI Infra抢跑者开始重写资本坐标

随着人工智能大模型全面进入工程化与规模化应用阶段,底层基础设施的运行效率与系统承载能力已逐步超越单一算法性能,成为决定产业演进的核心变量。面对异构...

DeepSeek V4:架构极度聪明,黄仁勋担心的事也许就此开始

在参数训练与模型精炼环节,方案引入梯度整列独立更新技术与约束边界残差连接机制,确保深层网络传播过程中的数值稳定,并配套路由解耦与激活截断策略消除训...

Meta发布Muse Spark:华人天团废墟重建,最恨Llama的果然是小扎自己

Meta近日正式发布了旗下MSL部门成立后的首款模型,这一战略举措象征着公司在人工智能领域经历重大路线调整后的全面转型。九个月前为扭转此前技术栈的被动局面...

智谱发布龙虾基座模型GLM-5-Turbo,还适配了一个养龙虾的盒子

智谱推出的GLM-5-Turbo是专为“龙虾”(OpenClaw)智能体场景深度优化的基座模型,旨在解决通用大模型在真实复杂工作流中易出现的指令偏差、工具调用不稳定及长...

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

硅谷的算力竞争已从GPU数量转向电力资源的争夺,OpenAI和马斯克的xAI等巨头正投入万亿级资金建设超大规模算力集群。然而,Anthropic的研究揭示了一个关键问题...

真武810E亮相,阿里如何「重构」估值?

云厂商在AI竞赛中的核心策略已转向自研芯片底座,以实现业务场景的深度适配与效率最大化。通用芯片设计因泛用性妥协而面临效率瓶颈,头部云厂商则通过真实业...
1 2 3