标签：能力评测

悬赏5000刀！148局AI斗蛐蛐世界杯官方战报出炉，全球赛邀你接棒来战

针对大模型能力差距是否仅能通过榜单直观体现、大模型在复杂互动场景下逻辑推理能力能否维持榜单表现的疑问，淘宝组织12个全球一线顶尖大模型，在完全统一的A...

AI-Agent

4周前

国产黑马与GPT-4o称霸中文榜首！Yi-Large勇夺国内LLM盲测桂冠，冲进世界第七

零一万物公司提交的Yi-Large模型与OpenAI的GPT-4o并列中文分榜第一，同时在总榜上位列世界第七，成为中国大模型中的佼佼者。Yi-Large模型的参数量达到千亿级...

AIGC动态

2年前 (2024)

全球140+模型考试出炉！超8万道考题国产模型分数亮眼，智源评测体系发布

智源研究院于2024年5月17日推出了一套科学、权威、公正、开放的大模型评测体系，并对全球140余个大模型进行了全方位能力评测。评测从主观和客观两个维度进行...

AIGC动态

2年前 (2024)

国内外140+大模型、8万+考题测评结果出炉！智源评测体系出品

智源研究院于2024年5月17日推出了一项科学、权威、公正、开放的大模型评测体系，并发布了国内外140余个语言及多模态大模型的全方位能力评测结果。该评测从主...

AIGC动态

2年前 (2024)