标签:FP8训练

国产大模型新SOTA:蚂蚁万亿级旗舰模型赶超GPT-5

蚂蚁集团近期开源了其万亿参数旗舰大模型Ling-1T,这是全球已知采用FP8低精度模式训练的最大基座模型。该模型属于蚂蚁Ling 2.0家族,包含三个分工明确的系列...

国产开源模型,代码能力比肩 Claude,DeepSeek-V3 正式发布

DeepSeek 近日发布了其最新系列模型 DeepSeek-V3 的首个版本,并已开源上线。该模型以其卓越的代码能力受到关注,被认为与行业领先的 Claude Sonnet 3.5 相媲...

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

AI大模型开发系统Colossal-AI实现了混合精度训练的升级,支持BF16(O2)与FP8(O1)的新一代混合精度训练方案。这种升级通过FP8的独特数值表示方式,在保持精度的...