独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资
文章摘要
国内专注超快流式推理芯片的创业公司寒序科技,宣布完成数千万元融资,投资方为启高资本、赛意产业基金,源合资本担任本轮独家财务顾问。创立以来寒序科技一直保持低调,过去两年间并未对外系统披露其AI推理系列SpinPU-E Series产品的相关进展。寒序科技成立于2023年8月,源于国内磁学研究重要高地北京大学磁学中心,核心团队是国内首个有能力跑通从物理、材料、器件到异质集成、芯片设计、算法的全链条交叉团队。
知情人士透露,寒序科技首颗芯片样片回片测试结果非常理想,关键指标单位面积带宽达到100 GB/s/mm²,与Groq LPU披露的指标一致,该指标是衡量AI芯片推理性能的最重要指标,也是支撑推理达到2000Tokens/s速度的核心基础。这项能力直接决定大模型推理能否真正实现流畅的流式输出与高Tokens/s表现,是当前推理芯片竞争中最具辨识度的硬指标之一,寒序科技也因此被业内评价为国内少有的、真正沿着Groq方向深入研发的团队。目前寒序科技下一代芯片已经进入流片阶段,采用“片上MRAM+SRAM”架构搭配“确定性流式乘加单元”设计,目标性能超过2000Tokens/s,而当前主流对话模型的推理速度仅约30-50Tokens/s。
业内近期普遍传闻,NVIDIA已以约200亿美元估值级别锁定Groq的推理技术合作,并计划在2026年NVIDIA GTC大会即将发布的新一代AI推理系统中采用Groq芯片设计,寒序科技的方案被业界认为是国内最贴近该方案的超大带宽流式处理芯片。和GPU的通用路线不同,寒序科技选择更聚焦更极致的产品定位,不追求大而全的功能布局,不布局通用训练领域,将全部研发资源集中投入到提升推理速度上,核心理念为“唯快不破”,明确不做GPU,只专注打磨推理速度。目前寒序科技的关键技术与样片验证已经度过最具风险的阶段,此次对外释放信息也基于这一背景,同时新一轮融资也已在推进中。
原文和模型
【原文链接】 阅读原文 [ 805字 | 4分钟 ]
【原文作者】 雷峰网
【摘要模型】 doubao-seed-2-0-lite-260215
【摘要评分】 ★☆☆☆☆



