GPT-4 Turbo首次被击败！国产大模型拿下总分第一

AIGC动态2年前 (2024)发布 QbitAI

4,002 0 0

文章摘要

【关键词】 SuperCLUE、商汤科技、日日新5.0、榜首成绩、技术进步

在中文大模型测评基准SuperCLUE的最新评测中，商汤科技的日日新5.0（SenseChat V5）以总分80.03分荣登榜首，超过此前长期领先的GPT-4 Turbo。

具体来看，SenseChat V5在文科领域以82.20分位居国内第一，理科领域虽低于GPT-4 Turbo，但依旧在国内大模型中位列首位。

商汤科技对SenseChat V5的打造，技术上主要围绕三大方面：采用MoE架构、基于超过10TB tokens的大规模训练，以及推理上下文窗口达到200K。

此外，通过实际测试，SenseChat V5展现了其在逻辑推理、数学问题解决、中文理解等方面的应用能力。

这一系列成就的背后，是商汤科技在数据层面的创新，包括使用大量高质量数据和生成数千亿tokens的思维链数据，从而激发了大模型的深度推理能力。

原文和模型

【原文链接】 阅读原文 [ 3274字 | 14分钟 ]
【原文作者】 量子位
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

智谱AI

智谱AI是一家国内的AI大模型...

# AIGC动态 # AI大模型 # GPT-GPTs # SuperCLUE # 商汤科技 # 技术进步 # 日日新5.0 # 榜首成绩

文章版权归作者所有，未经允许请勿转载。

情侣合照逼真到恐怖，竟被代码识出破绽？沃顿教授预言AI 18个月封神！

新智元

3,448

商汤CVPR「最佳论文」上车！数千行代码实现端到端智驾，“留给传统自动驾驶公司时间不多了”

admin

3,116

大模型行业，根本没有什么“真”开源？

硅星人Pro

4,037

世界最强大模型易主！Anthropic发布Claude 3系列模型，幻觉问题更少了

Founder Park

3,592

端侧 AI 新篇章！商汤科技发布「速度最快」的端侧模型

极客公园

5,099

性能超越GPT-4 Turbo！6000亿商汤多模态大模型登场，35万元一体机能自动生成代码｜钛媒体AGI

钛媒体AGI

3,168

暂无评论

暂无评论...

GPT-4 Turbo首次被击败！国产大模型拿下总分第一

文章摘要

原文和模型

Wegic：收起你那根戳设计师屏幕的手指

天呐，AI音乐软件Suno又融了1.25亿美元

相关文章

暂无评论

热门网址

热门文章

GPT-4 Turbo首次被击败！国产大模型拿下总分第一

文章摘要

原文和模型

Wegic：收起你那根戳设计师屏幕的手指

天呐，AI音乐软件Suno又融了1.25亿美元

相关文章

暂无评论

AstronClaw-安全养虾

LibTV-AI视频创作

讯飞AI大学堂

热门网址

热门文章