标签：自适应计算

预训练就学会思考！字节、北大等用14亿参数，撬动百亿模型推理能力

Ouro模型通过循环语言模型（LoopLM）的全新范式，在预训练阶段就内化了推理能力，仅用14亿参数就实现了百亿级模型的性能。这一突破性技术由字节、加州大学等...

AIGC动态

3个月前

字节Seed团队发布循环语言模型Ouro，在预训练阶段直接「思考」，Bengio组参与

现代大型语言模型（LLM）通常依赖显式的文本生成过程（如思维链）进行推理训练，但这种方法未能充分利用预训练数据的潜力。为解决这一问题，字节Seed团队联合...

AIGC动态

3个月前