标签:多模态

复旦大学团队提出跨模态越狱防御新架构 BlueSuffix

复旦大学联合香港城市大学、新加坡管理大学的研究团队在视觉-语言模型安全防御领域取得重要进展,提出了一种基于强化微调的黑盒防御新架构——BlueSuffix。该架...

微软上线两款新模型:增强RAG和AI Agent

微软在Azure AI Foundry上线了Cohere的Embed 4和Command A两款新模型,旨在增强RAG(检索增强生成)和AI Agent的功能。Embed 4是一款多模态嵌入模型,支持超...

字节按下 AI Agent 加速键

2025年初,随着DeepSeek、Manus等AI产品的崛起,大厂们正在重新调整战略,以应对AI技术的快速演进。过去两个月里,AI领域出现了多个现象级产品,如DeepSeek-R...

全球顶尖AI来考公,不会推理全翻车!致命缺陷曝光,被倒数5%人类碾压

卡内基梅隆大学(CMU)的研究团队针对公务员考试中的逻辑推理题,设计了一套名为VisualPuzzles的视觉推理基准测试,旨在评估多模态大模型的推理能力。该测试...

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

近期,大模型领域迎来了一系列重要进展,尤其是豆包大模型家族的更新和火山引擎的创新发布。 豆包大模型家族推出了「豆包 1.5・深度思考模型」,包含两个版本...

让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?

OpenAI 最新发布了 OpenAI o3 和 o4-mini 模型,标志着 ChatGPT 能力的一次飞跃。这些模型首次实现了自主调用并整合 ChatGPT 内的全量工具,包括网页搜索、Py...

OpenAI发布o3/o4-mini两大推理模型,要把Agent吞进模型里了

OpenAI近期发布了两个新模型o3和o4-mini,标志着其在人工智能领域的进一步突破。这两个模型不仅在编码、数学、科学等传统领域展现出强大的推理能力,还首次实...

刚刚,o4-mini发布!OpenAI史上最强、最智能模型

OpenAI在技术直播中发布了其最新的多模态模型o4-mini和满血版o3,这两款模型能够同时处理文本、图像和音频,并具备调用外部工具的能力。这一创新使得模型能够...

OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表

OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能,尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链,能够...

支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢

国内最大的MCP中文社区正式上线,标志着AI开发门槛的进一步降低。魔搭ModelScope推出的「MCP广场」汇集了近1500款MCP服务,覆盖搜索、地图、支付、开发者工具...
1 10 11 12 13 14 41