商汤大模型的「5o」交互,普通人如何和 AI 过一天?

AIGC动态5个月前发布 aitechtalk
599 0 0
商汤大模型的「5o」交互,普通人如何和 AI 过一天?

 

文章摘要


【关 键 词】 AI 2.0流式交互多模态智能助手实时交互

在2024年世界人工智能大会上,商汤科技推出了国内首个”流式交互多模态大模型——”日日新5o”,标志着AI 2.0时代超级时刻和应用的爆发。该模型具备实时视觉能力,能通过摄像头和语音与用户进行流畅的视频交互,实现真人聊天般的体验。

日日新5o拥有丰富的多领域知识,能看懂现实世界,对摄像头捕捉到的信息进行分析总结,通过实时对话告诉用户问题答案,没有延迟。在生活中,它可以作为贴身AI助手,提供各种生活建议,如出门前告知天气状况、拍照时指导摆姿势、烧烤时告知注意事项等。在职场中,它也能迅速总结书籍内容、识别手写文字等。

日日新5o的最大变革在于交互模式的变化。商汤将流式交互融入大模型,给用户带来真人般的交流体验。商汤CEO徐立认为,行业要变化,交互模式一定是先行的。AI 2.0时代的超级时刻需要一个超级应用,而日日新5o正是商汤对AI 2.0时代的判断。

要推动AI超级时刻的到来,商汤认为需要实时的交互性能带来流畅体验、构建高阶思维逻辑的合成数据提升模型智力、对文本图像视频等有可控性。大模型本质上是做记忆的事情,记住世界知识,回答更准确。在垂直行业里构造高阶思维逻辑的合成数据是制胜和差异化的关键。

日日新5o基于商汤最新发布的日日新5.5基座模型,该模型通过大量合成高阶思维链数据,提升了模型能力30%。商汤认为,不应依赖人构建高级思维链数据,而应通过与真实世界的交互形成执行数据进行推理。日日新5o在摄像头移动过程中与真实世界互动获取新信息,进行推理反馈。

日日新5o的功能离不开日日新5.5的支撑。日日新5.0是国内首个对标GPT-4 Turbo的大模型,经过技术迭代,日日新5.5在多项能力上明显增强,交互效果和核心指标可比肩GPT-4o。徐立认为,将流式交互多模态大模型置入端侧设备,可能推动应用的爆发。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 4043字 | 17分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...