对标GPT4o!谷歌发布Project Astra,全民AI代理时代来啦

AIGC动态7个月前发布 AIGCOPEN
885 0 0
对标GPT4o!谷歌发布Project Astra,全民AI代理时代来啦

 

文章摘要


【关 键 词】 AI代理多模态理解实时解读智能RPA全民AI

在5月15日的谷歌“ I/O 2024”大会上,生成式AI成为焦点,谷歌DeepMind发布了一款名为Project Astra的AI代理产品。Project Astra能够实现跨文本、音频、视频的多模态实时推理,与OpenAI发布的GPT4o类似。该产品在多个领域具有潜在应用,如帮助盲人解读周围环境、提供翻译服务、辅助学习和导游等。

Project Astra的多模态理解能力使其具有广泛的应用场景。例如,用户可以通过手机摄像头让Astra解读所见所闻,解释物品的用途和含义。Astra还可以与谷歌眼镜配合使用,为盲人提供实时解读功能。然而,Astra在语音情感输出和数据响应效率方面似乎略逊于GPT4o。

除了上述功能,Astra还能提升搜索体验,例如通过视频解释留声机指针未放在转盘上的原因,并直接跳转至搜索页面提供解决方案。Astra甚至能在接到诈骗电话时提醒用户,显示出其多功能性。

AI代理的概念并非新近出现,其最早的形态如20多年前的按键精灵,能够根据用户指令执行特定操作。随后,按键精灵演变成RPA(机器人流程自动化),在金融、日常办公、数据搬运等领域得到广泛应用。Project Astra作为第三代AI代理,在大模型的加持下,使用方式和能力得到显著提升,能够为我们做更多事情。

AI代理在健康管理与医疗咨询、客户服务自动化和个性化学习辅导等方面具有广泛应用。例如,AI健康代理助手可以提供个性化健康建议和早期疾病预警;AI代理集成在客服系统中,提供全天候服务;AI学习代理根据学生的学习进度和兴趣定制个性化学习计划。

尽管谷歌尚未公布Project Astra的具体发布时间,但预计其将很快登陆Android、iOS等平台。由OpenAI、谷歌引领的全能AI代理将成为生成式AI领域的新热门赛道,推动智能RPA、AutoGPT等技术的发展,扩大市场范围,培养用户习惯,预示着全民AI代理时代的到来。

原文和模型


【原文链接】 阅读原文 [ 1917字 | 8分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...