“邪修”AI芯片的Taalas,成色如何?|AGI焦点
文章摘要
【关 键 词】 AI芯片、ASIC、大模型、性能领先、前景待考
加拿大多伦多初创公司Taalas近期推出的AI推理芯片引发行业广泛关注,该公司2023年成立,由24人核心团队耗时2年、投入3000万美元打造首款产品HC1芯片,目前累计融资额达2.19亿美元。HC1专为Meta 2024年推出的Llama 3.1 8B开源大模型优化,30芯片集群可实现每秒12000 tokens的推理速度,能效较传统GPU方案提升50倍;单芯片峰值推理速度接近17000 tokens/秒,性能是英伟达主力产品H200的48倍、行业此前最高性能保持者Cerebras产品的9倍左右,构建成本降至同类方案的1/20,功耗仅为原有水平的1/10,实测中大模型可实现秒级用户响应。
Taalas创始团队均拥有头部芯片企业任职经历,创始人兼CEO柳比沙·巴伊奇曾为AMD架构师,核心工程师多来自AMD、苹果、谷歌、英伟达等企业。其采取差异化的结构化ASIC技术路线,奉行“模型即计算机”的核心理念,无需传统软件编译流程,直接通过EDA流程将特定大模型转化为定制芯片,消除了传统计算架构的“内存墙”问题,可在一周内完成客户提供模型的电路设计,交由台积电代工后两个月即可交付专属芯片。当前ASIC路线凭借更低的总拥有成本已获得市场认可,野村证券预测2026年ASIC芯片总出货量将首次超过GPU,多数芯片初创企业都选择该路线切入市场。
该产品也面临诸多质疑,目前HC1仅适配参数规模最小的Llama 3.1 8B模型,被指存在输出幻觉严重、推理质量低于同参数GPU方案的问题,同时由于大模型迭代速度快,专属芯片两个月的交付周期使其面临快速过时的风险,模型锁定的模式成为规模化商业化的核心阻碍。业内也有观点认为,硬连线模式是未来芯片发展的重要趋势,其芯片更新仅需修改两层金属设计,成本极低,待大模型迭代速度放缓后将获得更广阔的市场空间,低延迟、低功耗的特性也更适配机器人、自动驾驶等边缘推理场景。目前Taalas计划2025年春季推出适配中等规模模型的产品,冬季推出第二代HC2芯片,后续市场表现仍待验证。
原文和模型
【原文链接】 阅读原文 [ 2987字 | 12分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 doubao-seed-2-0-pro-260215
【摘要评分】 ★★★☆☆



