标签:性能优化
开源SOTA!商汤原生多模态一个大脑完成看图、推理、作画
商汤正式开源新一代视觉多模态模型SenseNova U1,其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案,转而采用自研的NEO-unify原生统一架构。该...
压榨系统性能:视频审核中台从 280ms 降低至 90ms 的架构演进与深度优化
视频审核服务中台初期采用串行检测架构,旨在快速失败以节约算力,但在合法图片占多数的实际场景中,串行累加耗时导致链路延迟不可接受。系统底层潜伏着三大...
端侧AI时代,存储变了:江波龙全面出击
在人工智能从云端向终端大规模落地的转折期,端侧AI应用对存储系统提出全新挑战,传统存储方案难以满足其在功耗、性能与尺寸方面的差异化需求。文章指出,当...
OpenAI绝地反击!Codex大脑首曝,8亿用户极限架构硬刚Claude
数据库架构方面,OpenAI披露了仅用1个PostgreSQL主节点支撑8亿用户的方案。关键技术包括PgBouncer连接池代理、缓存锁定机制和跨地域级联复制,实现了读写分离...
大模型Infra新突破!腾讯混元开源LLM推理算子库,推理吞吐提升30%
腾讯混元AI Infra团队开源了生产级高性能LLM推理核心算子库HPC-Ops,该库通过底层架构创新和指令级优化,显著提升了大模型推理效率。在真实场景测试中,混元...
刚刚,Anthropic内部考题开源!年薪百万工程师,被AI秒了
Claude Opus 4.5的突破性表现直接颠覆了Anthropic的技术招聘体系,这家AI公司被迫公开其曾经用于筛选顶级工程师的机密试题。这个被称为'史上最强模型'的版本...
极简主义的胜利:清华团队用最简单的强化学习配方刷新1.5B模型纪录
清华大学、伊利诺伊大学和上海AI实验室的研究团队提出了一种名为JustRL的全新架构,该架构通过单阶段训练和固定超参数,在DeepSeek-R1-Distill-Qwen-1.5B与Ne...
圣诞写代码,AI谁最强?M2.1、GLM-4.7、K2正面硬刚
2025年圣诞节前夕,MiniMax在IPO冲刺阶段高调发布新一代文本模型M2.1,并通过与智谱GLM-4.7、月之暗面Kimi K2的实测对比展现技术实力。 测试设计三个编程任务...
推理快30%,性能超过千亿参数模型,15B模型Apriel-1.6重新定义端侧推理
ServiceNow人工智能团队最新发布的Apriel-1.6-15b-Thinker模型,以150亿参数的轻量级体量,在多模态推理能力上实现了显著突破。该模型不仅击败了体量大其十倍...
基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台
大语言模型(LLM)推理服务正迅速成为企业级应用的核心基础设施,其生产级落地需平衡性能、稳定性与成本。当前架构正从单体模式向分布式演进,主流路径包括Pr...


