标签:多模态

字节按下 AI Agent 加速键

2025年初,随着DeepSeek、Manus等AI产品的崛起,大厂们正在重新调整战略,以应对AI技术的快速演进。过去两个月里,AI领域出现了多个现象级产品,如DeepSeek-R...

全球顶尖AI来考公,不会推理全翻车!致命缺陷曝光,被倒数5%人类碾压

卡内基梅隆大学(CMU)的研究团队针对公务员考试中的逻辑推理题,设计了一套名为VisualPuzzles的视觉推理基准测试,旨在评估多模态大模型的推理能力。该测试...

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

近期,大模型领域迎来了一系列重要进展,尤其是豆包大模型家族的更新和火山引擎的创新发布。 豆包大模型家族推出了「豆包 1.5・深度思考模型」,包含两个版本...

让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?

OpenAI 最新发布了 OpenAI o3 和 o4-mini 模型,标志着 ChatGPT 能力的一次飞跃。这些模型首次实现了自主调用并整合 ChatGPT 内的全量工具,包括网页搜索、Py...

OpenAI发布o3/o4-mini两大推理模型,要把Agent吞进模型里了

OpenAI近期发布了两个新模型o3和o4-mini,标志着其在人工智能领域的进一步突破。这两个模型不仅在编码、数学、科学等传统领域展现出强大的推理能力,还首次实...

刚刚,o4-mini发布!OpenAI史上最强、最智能模型

OpenAI在技术直播中发布了其最新的多模态模型o4-mini和满血版o3,这两款模型能够同时处理文本、图像和音频,并具备调用外部工具的能力。这一创新使得模型能够...

OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表

OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能,尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链,能够...

支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢

国内最大的MCP中文社区正式上线,标志着AI开发门槛的进一步降低。魔搭ModelScope推出的「MCP广场」汇集了近1500款MCP服务,覆盖搜索、地图、支付、开发者工具...

刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文

OpenAI在凌晨1点发布了最新模型GPT-4.1,同时推出的还有GPT 4.1-Mini和GPT 4.1-Nano两款模型。这些模型在多模态处理、代码能力、指令遵循和成本方面实现了显...

永别了,GPT-4!

OpenAI宣布GPT-4将从ChatGPT中移除,并由GPT-4o完全取代,标志着这一曾经引领全球AI大模型发展的标志性模型正式退出历史舞台。GPT-4于2023年3月14日发布,作...
1 2 3 4 31