标签:循环推理

预训练就学会思考!字节、北大等用14亿参数,撬动百亿模型推理能力

Ouro模型通过循环语言模型(LoopLM)的全新范式,在预训练阶段就内化了推理能力,仅用14亿参数就实现了百亿级模型的性能。这一突破性技术由字节、加州大学等...