标签：视觉能力

顶尖AI竟输给三岁宝宝，BabyVision测试暴露多模态模型硬伤

大模型在纯视觉任务上的表现远低于人类儿童水平。UniPat AI与红杉中国xbench团队联合发布的BabyVision评测集揭示，当前最先进的多模态大模型在基础视觉能力上...

AIGC动态

2个月前

Claude 3.5 Sonnet发布，不仅超过了GPT-4o，还在交互上有大更新

Anthropic公司发布了其下一代旗舰大模型Claude 3.5 Sonnet，标志着该公司在人工智能领域的最新进展。作为Claude 3.5系列的首个版本，Sonnet在智能水准上已领...

AIGC动态

2年前 (2024)

GPT-4o深夜炸场！AI实时视频通话丝滑如人类，Plus功能免费可用，奥特曼：《她》来了

OpenAI 最新旗舰大模型 GPT-4o 已经发布，它不仅免费可用，而且能力横跨听、看、说，丝滑流畅毫无延迟，就像在打一个视频电话。GPT-4o 的 'o' 是 Omni 的缩写...

AIGC动态

2年前 (2024)