多模态技术 | 学习AIGC

开源SOTA！商汤原生多模态一个大脑完成看图、推理、作画

商汤正式开源新一代视觉多模态模型SenseNova U1，其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案，转而采用自研的NEO-unify原生统一架构。该...

AIGC动态

2个月前

当前，AI正加速从实验室走向产业深水区，成为企业降本增效与创新增长的核心引擎。然而，应用仍普遍存在“停留在工具层面”“落地效果不及预期”“行业场景适配难”...

AIGC动态

3个月前

逗逗AI是一款以虚拟形象或悬浮球形式存在于用户屏幕中的AI玩伴，通过屏幕共享技术实时理解用户所处的游戏场景并提供互动。其核心创新在于“共享视角”的陪伴模...

AIGC动态

9个月前

蚂蚁推出的AI医疗应用AQ标志着C端医疗AI产品的重大突破。这款集成了100多项功能的APP，通过连接全国5000家医院和近百万医生资源，实现了从健康咨询到就诊服务...

AIGC动态

1年前 (2025)

阶跃星辰在首届Step UP生态开放日上展示了其在智能终端Agent领域的战略布局与技术突破，重点围绕汽车、手机、IoT和具身智能四大场景展开深度合作与创新。公司...

AI-Agent

1年前 (2025)

视频生成领域的竞争日益激烈，许多公司如Pika、Sora、Luma AI和国内的可灵等都在探索多模态视频生成技术。尽管视频生成技术备受关注，但其实际应用场景落地相...

AIGC动态

2年前 (2024)

北京智源人工智能研究院在第六届北京智源大会上分享了关于通用人工智能（AGI）的最新进展和见解。智源研究院院长王仲远认为，基于大模型的人工智能技术实现AG...

AI-Agent

2年前 (2024)

根据文章内容，以下是详细的分段摘要总结：技术进步放缓近期，大模型行业似乎出现了技术进步放缓的现象。OpenAI新发布的GPT-4o在文本处理能力上与GPT-4相比提...

AIGC动态

2年前 (2024)