标签:能力评测

悬赏5000刀!148局AI斗蛐蛐世界杯官方战报出炉,全球赛邀你接棒来战

针对大模型能力差距是否仅能通过榜单直观体现、大模型在复杂互动场景下逻辑推理能力能否维持榜单表现的疑问,淘宝组织12个全球一线顶尖大模型,在完全统一的A...

国产黑马与GPT-4o称霸中文榜首!Yi-Large勇夺国内LLM盲测桂冠,冲进世界第七

零一万物公司提交的Yi-Large模型与OpenAI的GPT-4o并列中文分榜第一,同时在总榜上位列世界第七,成为中国大模型中的佼佼者。Yi-Large模型的参数量达到千亿级...

全球140+模型考试出炉!超8万道考题国产模型分数亮眼,智源评测体系发布

智源研究院于2024年5月17日推出了一套科学、权威、公正、开放的大模型评测体系,并对全球140余个大模型进行了全方位能力评测。评测从主观和客观两个维度进行...

国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

智源研究院于2024年5月17日推出了一项科学、权威、公正、开放的大模型评测体系,并发布了国内外140余个语言及多模态大模型的全方位能力评测结果。该评测从主...