量化起家,万卡在手,降价狂魔,DeepSeek可能就是中国大模型混战的终结者

AIGC动态6个月前发布 Si-Planet
1,104 0 0
量化起家,万卡在手,降价狂魔,DeepSeek可能就是中国大模型混战的终结者

 

文章摘要


【关 键 词】 价格战AI模型创新架构行业竞争独立发展

最近中国大模型领域掀起了一场价格战,由量化对冲基金幻方旗下的AI团队深度求索引发。深度求索发布了新的模型DeepSeek-V2,并将API价格大幅下调至GPT-4 Turbo的百分之一水平。这引发了字节、阿里等公司的跟进,从而拉开了价格战的序幕。深度求索的创新在于其模型架构,DeepSeek-V2采用Transformer架构并进行了创新设计,使用MLA注意力和高性能MoE架构,使模型效率提升5-100倍,大幅降低成本。DeepSeek-V2的发布也使得深度求索受到业界关注,并加速了其独立上市的进程。深度求索的母公司幻方原本专注量化投资,但在近年来转向AI算法研究,并积累了大量高性能GPU,成为国内大模型行业的重要参与者。深度求索也在致力于独立发展,成为大模型行业的重要玩家。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3680字 | 15分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 glm-4
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...