标签:多模态交互
全球首个具身智能开放平台来了!让大模型长出“身体”,像人一样自然表达交互
魔珐科技发布了全球首个面向开发者的具身智能3D数字人开放平台——魔珐星云,该平台旨在为大语言模型和AI智能体赋予身体和表达能力,实现自然的多模态交互。通...
智元精灵 G2 重磅发布,首批订单过亿,多场景作业能力拉满
智元机器人于2025年10月16日发布新一代工业级交互式具身作业机器人精灵G2,该产品以高性能运动关节、高精度力矩传感器和空间感知系统为核心,支持快速学习部...
机器人WAIC现场抢活讲PPT?商汤悟能具身智能平台让机器人「觉醒」
商汤科技在WAIC上发布了具身智能平台「悟能」,该平台以世界模型为核心引擎,旨在解决机器人行业面临的数据瓶颈和场景泛化难题。平台通过自然语言描述生成符...
当AI遇上心理学:如何让AI的眼神更像人?|AAAI 2025
高瓴人工智能学院宋睿华团队与跨学科研究者合作开发的EyEar技术,成功实现了对人类视听同步场景下注视轨迹的预测。该模型通过结合物理启发的动力系统和多模态...
DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口
在AI行业的新赛道“多模态交互”中,声网推出了“对话式AI引擎”,使得所有文本大模型能够迅速获得实时语音对话能力,弥补了大模型在语音交互方面的不足。这一创...
亲测!豆包+PC,解锁生产力「神器」
豆包电脑版以其便捷、实用、高效的AI工具特性,满足了用户对AI的核心诉求。它通过将AI功能嵌入日常办公流程,实现了工作效率的提升、创作辅助和沟通协作。豆...
ChatGPT版Her能视频通话和共享屏幕了,附赠一个限时圣诞老人
OpenAI的ChatGPT推出了高级语音模式的新功能,其中包括视频对话和实时屏幕共享,以及节日特别活动“圣诞老人”音色。用户现在可以通过点击对话框中的高级语音模...
o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2
近期,OpenAI的完整版o1模型意外泄露,允许用户直接体验其功能。泄露的模型展现出了强大的图像推理能力,能够处理上传的附件并进行多模态交互。在测试中,o1...
OpenAI董事会主席新AI Agent公司获12亿元,估值320亿
Sierra AI,由OpenAI董事会主席Bret Taylor和前谷歌AI实验室负责人Clay Bavor共同创立,已完成1.75亿美元融资,公司估值达到45亿美元。该公司专注于利用OpenA...
讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”
在第七届世界声博会暨2024科大讯飞全球1024开发者节上,科大讯飞董事长刘庆峰宣布了讯飞星火大模型4.0 Turbo的发布,该模型在七大核心能力上全面超越了GPT-4 ...
1
2





