标签:视觉能力

顶尖AI竟输给三岁宝宝,BabyVision测试暴露多模态模型硬伤

大模型在纯视觉任务上的表现远低于人类儿童水平。UniPat AI与红杉中国xbench团队联合发布的BabyVision评测集揭示,当前最先进的多模态大模型在基础视觉能力上...

Claude 3.5 Sonnet发布,不仅超过了GPT-4o,还在交互上有大更新

Anthropic公司发布了其下一代旗舰大模型Claude 3.5 Sonnet,标志着该公司在人工智能领域的最新进展。作为Claude 3.5系列的首个版本,Sonnet在智能水准上已领...

GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了

OpenAI 最新旗舰大模型 GPT-4o 已经发布,它不仅免费可用,而且能力横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。GPT-4o 的 'o' 是 Omni 的缩写...