性能优化 | 学习AIGC

开源SOTA！商汤原生多模态一个大脑完成看图、推理、作画

商汤正式开源新一代视觉多模态模型SenseNova U1，其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案，转而采用自研的NEO-unify原生统一架构。该...

AIGC动态

1个月前

压榨系统性能：视频审核中台从 280ms 降低至 90ms 的架构演进与深度优化

视频审核服务中台初期采用串行检测架构，旨在快速失败以节约算力，但在合法图片占多数的实际场景中，串行累加耗时导致链路延迟不可接受。系统底层潜伏着三大...

AIGC动态

1个月前

端侧AI时代，存储变了：江波龙全面出击

在人工智能从云端向终端大规模落地的转折期，端侧AI应用对存储系统提出全新挑战，传统存储方案难以满足其在功耗、性能与尺寸方面的差异化需求。文章指出，当...

AIGC动态

2个月前

OpenAI绝地反击！Codex大脑首曝，8亿用户极限架构硬刚Claude

数据库架构方面，OpenAI披露了仅用1个PostgreSQL主节点支撑8亿用户的方案。关键技术包括PgBouncer连接池代理、缓存锁定机制和跨地域级联复制，实现了读写分离...

AI-Agent

4个月前

大模型Infra新突破！腾讯混元开源LLM推理算子库，推理吞吐提升30%

腾讯混元AI Infra团队开源了生产级高性能LLM推理核心算子库HPC-Ops，该库通过底层架构创新和指令级优化，显著提升了大模型推理效率。在真实场景测试中，混元...

AIGC动态

4个月前

刚刚，Anthropic内部考题开源！年薪百万工程师，被AI秒了

Claude Opus 4.5的突破性表现直接颠覆了Anthropic的技术招聘体系，这家AI公司被迫公开其曾经用于筛选顶级工程师的机密试题。这个被称为'史上最强模型'的版本...

AIGC动态

4个月前

极简主义的胜利：清华团队用最简单的强化学习配方刷新1.5B模型纪录

清华大学、伊利诺伊大学和上海AI实验室的研究团队提出了一种名为JustRL的全新架构，该架构通过单阶段训练和固定超参数，在DeepSeek-R1-Distill-Qwen-1.5B与Ne...

AIGC动态

5个月前

圣诞写代码，AI谁最强？M2.1、GLM-4.7、K2正面硬刚

2025年圣诞节前夕，MiniMax在IPO冲刺阶段高调发布新一代文本模型M2.1，并通过与智谱GLM-4.7、月之暗面Kimi K2的实测对比展现技术实力。测试设计三个编程任务...

AIGC动态

5个月前

推理快30%，性能超过千亿参数模型，15B模型Apriel-1.6重新定义端侧推理

ServiceNow人工智能团队最新发布的Apriel-1.6-15b-Thinker模型，以150亿参数的轻量级体量，在多模态推理能力上实现了显著突破。该模型不仅击败了体量大其十倍...

AIGC动态

6个月前

基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台

大语言模型（LLM）推理服务正迅速成为企业级应用的核心基础设施，其生产级落地需平衡性能、稳定性与成本。当前架构正从单体模式向分布式演进，主流路径包括Pr...

AI-Agent

6个月前

标签：性能优化

开源SOTA！商汤原生多模态一个大脑完成看图、推理、作画

压榨系统性能：视频审核中台从 280ms 降低至 90ms 的架构演进与深度优化

端侧AI时代，存储变了：江波龙全面出击

OpenAI绝地反击！Codex大脑首曝，8亿用户极限架构硬刚Claude

大模型Infra新突破！腾讯混元开源LLM推理算子库，推理吞吐提升30%

刚刚，Anthropic内部考题开源！年薪百万工程师，被AI秒了

极简主义的胜利：清华团队用最简单的强化学习配方刷新1.5B模型纪录

圣诞写代码，AI谁最强？M2.1、GLM-4.7、K2正面硬刚

推理快30%，性能超过千亿参数模型，15B模型Apriel-1.6重新定义端侧推理

基于 SGlang RBG + Mooncake 打造生产级云原生大模型推理平台

热门网址

标签：性能优化

AstronClaw

LibTV-AI视频创作

AI大学堂

热门网址