标签:多模态
Gemini 3 来了,AI 应用创业公司谁兴奋,谁冷静,谁觉得它不太行?
Gemini 3的发布引发了AI行业的多维度讨论,其能力拓展对创业公司的影响呈现两极分化。模型在视觉理解、代码生成和长任务处理上的突破,直接补足了Agent开发的...
Gemini 3 登场后,哈萨比斯要「改造」Google 全系产品
Google DeepMind CEO 德米斯·哈萨比斯在访谈中系统阐述了Gemini 3的技术突破与战略布局。作为Google未来架构的关键节点,这一代模型在推理能力、多模态处理、...
AI应用进入下半场:从模型的入口到真正的超级入口
AI应用的竞争已进入以用户需求为核心的下半场。近期,Google Gemini3、OpenAI GPT-5.1等模型更新均强调应用集成能力,阿里千问、蚂蚁灵光等产品则直接瞄准C端...
太炸裂了!全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西!
谷歌最新发布的Nano Banana Pro(又名Gemini 3 Pro Image)文生图模型引发广泛关注。该模型整合了Gemini 3 Pro的多模态理解能力和谷歌搜索知识库,在图像生成...
昆仑万维发布Skywork R1V4-Lite:30B多模态模型胜Gemini 2.5 Pro,速度还快19倍
2025年被普遍视为AI Agent技术落地的关键年份,行业期待从“对话生成”转向“任务执行”的范式突破。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力...
昆仑万维发布Skywork R1V4-Lite:用30B多模态模型打平Gemini 2.5 Pro,速度还快19倍
2025年被普遍视为AI Agent技术爆发的关键节点,行业期待AI从被动响应转向主动执行。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力封装为独立设...
Gemini 3正式发布成最强模型!OpenAI更新GPT-5.1,马斯克发布Grok 4.1,大模型争宠让世界沸腾
大语言模型领域近期迎来密集更新,OpenAI、xAI和谷歌相继推出突破性产品。OpenAI的GPT-5.1通过高情商交互和精准指令遵从引发关注,而xAI的Grok 4.1在LMArena...
一个能思考、会记忆的AI导演诞生了!新加坡管理大学,香港中文大学等实现故事化视频生成
视频生成领域长期面临工具碎片化的困境,专业模型虽在单一任务上表现优异,但缺乏整合能力。为解决这一问题,新加坡管理大学、香港中文大学和斯坦福大学联合...
实测完“灵光”,我意识到人类对 AI 助手的开发不足1%
蚂蚁集团推出的AI应用“灵光”近期引发广泛关注,定位为零门槛全模态助手,其核心功能展现了AI生成能力的突破性进展。通过自然语言指令30秒生成可互动小应用,...
Gemini 3.0还在预热,中国AI抢先!30秒造APP全网首测
AI技术正经历从单一模态生成向「生成涌现」的深刻范式转变。谷歌Gemini 3.0未正式发布便已通过实测展示其革命性能力,包括一键生成操作系统界面、可交互网页...





