GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

AIGC动态2年前 (2024)发布 QbitAI

2,873 0 0

GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

文章摘要

【关键词】 人工智能、商汤科技、模型比较、多模态、性能提升

SenseChat Lite：轻量级端侧大模型

1. 性能对比：在《街头霸王》游戏中，SenseChat Lite与GPT-4进行了一场PK，展示了其快速反应能力。尽管GPT-4还在决策中，SenseChat Lite已经迅速出拳。

2. 离线模式：商汤CEO徐立展示了SenseChat Lite在离线模式下的能力，包括生成员工请假申请和对长段文字进行快速总结。

3. 性能水平：SenseChat Lite在同等尺度性能上达到了SOTA（State of the Art）水平，在多项测试中击败了Llama2-7B和13B。

4. 速度优势：采用端云“联动”的MoE框架，SenseChat Lite在端侧推理中表现出色，中等性能手机上达到18.3字/秒，高端手机上达到78.3字/秒。

5. 多模态能力：除了文本生成，SenseChat Lite还展示了其在图像处理方面的能力，如快速扩图和自由扩图。

SenseNova 5.0：全面升级的大模型

1. 定位：商汤将SenseNova 5.0定位为全面对标GPT-4 Turbo的模型。

2. 逻辑推理：SenseNova 5.0在处理“弱智吧”问题时表现出了强大的逻辑推理能力，能够精准回答问题。

3. 自然语言生成：在2022年高考作文题目的测试中，SenseNova 5.0生成的文章具有诗意，句子工整对仗，能够引经据典。

4. 数学能力：在解决数学问题时，SenseNova 5.0展现了比GPT-4更强的数学推理能力。

5. 数据和算力：商汤通过使用超过10T的tokens和数千亿tokens的思维链数据，以及算法和算力设施的联合优化，提升了SenseNova 5.0的性能。

6. 多模态领域：SenseNova 5.0在多模态领域的核心指标中取得了领先成绩，包括图像理解和生成效果。

文章最后提到，商汤科技的这两款新模型在逻辑推理、自然语言生成、数学能力和多模态处理等方面均展现出了强大的能力，预示着商汤在人工智能领域的进一步发展。

原文和模型

【原文链接】 阅读原文 [ 6116字 | 25分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # AI大模型 # GPT-GPTs # 图像生成 # 人工智能 # 商汤科技 # 多模态 # 性能提升 # 模型比较

文章版权归作者所有，未经允许请勿转载。

技术大揭秘！荣耀曝光首款AI PC，MagicBook Pro 16现场谍照抢先看

机器之心

3,491

“反转”来得这么快！英伟达正式宣布，外媒：开始反击了

admin

4,626

过劳病倒、职权被削、联创跑路：xAI 48小时内上演最惨烈人才地震

AI前线

1,565

智源悟界 · Emu3.5 重塑世界模型格局：首提多模态 Scaling 范式，AI 理解世界再进化

AI科技评论

1,629

谷歌数学版Gemini破解奥赛难题，堪比人类数学家！

新智元

4,142

46秒AI生成真人视频爆火，遭在线打假「换口型、声音」

机器之心

3,814

暂无评论

暂无评论...

GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

文章摘要

原文和模型

股价久违飙涨，商汤要用自己的Scaling law挑战GPT4

生成式 AI 抢滩生死战：全球云计算巨头怎么打

相关文章

暂无评论

热门网址

热门文章

GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

文章摘要

原文和模型

股价久违飙涨，商汤要用自己的Scaling law挑战GPT4

生成式 AI 抢滩生死战：全球云计算巨头怎么打

相关文章

暂无评论

AstronClaw-安全养虾

LibTV-AI视频创作

讯飞AI大学堂

热门网址

热门文章