标签:多模态技术
开源SOTA!商汤原生多模态一个大脑完成看图、推理、作画
商汤正式开源新一代视觉多模态模型SenseNova U1,其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案,转而采用自研的NEO-unify原生统一架构。该...
2026 中国企业 AI 应用场景报告:千份实践解码 AI 价值落地全路径 | 极客时间企业版
当前,AI正加速从实验室走向产业深水区,成为企业降本增效与创新增长的核心引擎。然而,应用仍普遍存在“停留在工具层面”“落地效果不及预期”“行业场景适配难”...
对话逗逗AI:猛涨千万用户背后,不抢屏幕时间,不做超级app,也不止于游戏了
逗逗AI是一款以虚拟形象或悬浮球形式存在于用户屏幕中的AI玩伴,通过屏幕共享技术实时理解用户所处的游戏场景并提供互动。其核心创新在于“共享视角”的陪伴模...
真·全民AI健康管家来了!实测蚂蚁AQ:追问识药看皮肤,还能连医院接硬件
蚂蚁推出的AI医疗应用AQ标志着C端医疗AI产品的重大突破。这款集成了100多项功能的APP,通过连接全国5000家医院和近百万医生资源,实现了从健康咨询到就诊服务...
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
阶跃星辰在首届Step UP生态开放日上展示了其在智能终端Agent领域的战略布局与技术突破,重点围绕汽车、手机、IoT和具身智能四大场景展开深度合作与创新。公司...
AI 视频不只是视频生成!英伟达领投 5000 万,专注视频理解的这家公司值得关注
视频生成领域的竞争日益激烈,许多公司如Pika、Sora、Luma AI和国内的可灵等都在探索多模态视频生成技术。尽管视频生成技术备受关注,但其实际应用场景落地相...
对话智源研究院院长:我们距离 AGI 还有多远
北京智源人工智能研究院在第六届北京智源大会上分享了关于通用人工智能(AGI)的最新进展和见解。智源研究院院长王仲远认为,基于大模型的人工智能技术实现AG...
大模型的 5 月:热闹的 30 天和鸿沟边缘
根据文章内容,以下是详细的分段摘要总结:技术进步放缓近期,大模型行业似乎出现了技术进步放缓的现象。OpenAI新发布的GPT-4o在文本处理能力上与GPT-4相比提...



