标签:技术评估
Llama 4 详细评测:开源模型的全面倒退?
Meta最新发布的开源大模型Llama 4在技术社区引发了广泛争议。尽管其规格参数堪称“顶配开源”,包括两个混合专家(MoE)架构版本——Scout(109B总参数,17B活跃...
实测 | GPT-o1:学会了思考,也学会了偷懒
在对OpenAI最新模型GPT-o1的测试中,作者林杰鑫通过一系列精心设计的题目来评估其在数学、物理和生物领域的综合逻辑思考能力。这些题目包括计算全球人类心算...