标签:高质量数据

超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙

“得数据者得天下”,高质量数据集对AI模型的准确性、泛化性和可用性至关重要。中国电信天翼AI打造了超10万亿tokens通用大模型语料数据和覆盖14个关键行业的专...

微软发布Phi-4,最强小模型!参数极小、超GPT-4o

微软研究院推出的Phi-4模型以其140亿参数的小规模在多个基准测试中超越了参数量更大的模型。在GPQA和MATH基准测试中,Phi-4分别取得了56.1和80.4的高分,超越...