量化起家，万卡在手，降价狂魔，DeepSeek可能就是中国大模型混战的终结者

AIGC动态2年前 (2024)发布 Si-Planet

5,531 0 0

文章摘要

最近中国大模型领域掀起了一场价格战，由量化对冲基金幻方旗下的AI团队深度求索引发。深度求索发布了新的模型DeepSeek-V2，并将API价格大幅下调至GPT-4 Turbo的百分之一水平。这引发了字节、阿里等公司的跟进，从而拉开了价格战的序幕。深度求索的创新在于其模型架构，DeepSeek-V2采用Transformer架构并进行了创新设计，使用MLA注意力和高性能MoE架构，使模型效率提升5-100倍，大幅降低成本。DeepSeek-V2的发布也使得深度求索受到业界关注，并加速了其独立上市的进程。深度求索的母公司幻方原本专注量化投资，但在近年来转向AI算法研究，并积累了大量高性能GPU，成为国内大模型行业的重要参与者。深度求索也在致力于独立发展，成为大模型行业的重要玩家。