标签:高效训练

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

面壁智能团队在大模型领域的探索与实践面壁智能团队,由曾国洋担任CTO,自2020年GPT-3发布后开始训练大模型,逐渐认识到提升模型效果是大模型训练的根本目标...
1 2