多模态 | 第 5 页

多模态思维链如何重塑 AI 与短视频的未来

快手高级算法专家文彬在AICon全球人工智能开发与应用大会上分享了Keye-VL多模态大模型的技术突破与应用实践。该模型通过多模态思维链技术实现了动态视频理解...

AI-Agent

4个月前

震撼全网！3位00后夺200万大奖，卷走鹅厂顶级Offer

历时四个月的腾讯广告算法大赛近日落下帷幕，这场汇聚全球30个国家、8400多名技术精英的「千团大战」最终由来自华中科技大学、北京大学和中国科学技术大学的...

AIGC动态

4个月前

这一次，ChatBot 的容器变了

蚂蚁的灵光App通过创新的交互方式重新定义了AI助手的表现力。与传统的纯文本聊天框不同，灵光采用多模态呈现方式，将复杂信息以结构化、可视化的形式展现。在...

AIGC动态

4个月前

Nano Banana Pro的最神级用法，其实是一键生成PPT。

Nano Banana Pro与NotebookLM的深度整合带来了一键生成高质量PPT的突破性功能。用户只需将原始素材（如论文、文章或研究报告）上传至NotebookLM，系统即可自...

AIGC动态

4个月前

Gemini 3 来了，AI 应用创业公司谁兴奋，谁冷静，谁觉得它不太行？

Gemini 3的发布引发了AI行业的多维度讨论，其能力拓展对创业公司的影响呈现两极分化。模型在视觉理解、代码生成和长任务处理上的突破，直接补足了Agent开发的...

AI-Agent

4个月前

Gemini 3 登场后，哈萨比斯要「改造」Google 全系产品

Google DeepMind CEO 德米斯·哈萨比斯在访谈中系统阐述了Gemini 3的技术突破与战略布局。作为Google未来架构的关键节点，这一代模型在推理能力、多模态处理、...

AIGC动态

4个月前

AI应用进入下半场：从模型的入口到真正的超级入口

AI应用的竞争已进入以用户需求为核心的下半场。近期，Google Gemini3、OpenAI GPT-5.1等模型更新均强调应用集成能力，阿里千问、蚂蚁灵光等产品则直接瞄准C端...

AIGC动态

4个月前

太炸裂了！全网实测Nano Banana Pro，网友：这模型里到底装了什么鬼东西！

谷歌最新发布的Nano Banana Pro（又名Gemini 3 Pro Image）文生图模型引发广泛关注。该模型整合了Gemini 3 Pro的多模态理解能力和谷歌搜索知识库，在图像生成...

AIGC动态

4个月前

昆仑万维发布Skywork R1V4-Lite：30B多模态模型胜Gemini 2.5 Pro，速度还快19倍

2025年被普遍视为AI Agent技术落地的关键年份，行业期待从“对话生成”转向“任务执行”的范式突破。然而早期硬件化尝试如Rabbit R1的失败案例表明，将Agent能力...

AI-Agent

4个月前

昆仑万维发布Skywork R1V4-Lite：用30B多模态模型打平Gemini 2.5 Pro，速度还快19倍

2025年被普遍视为AI Agent技术爆发的关键节点，行业期待AI从被动响应转向主动执行。然而早期硬件化尝试如Rabbit R1的失败案例表明，将Agent能力封装为独立设...

AI-Agent

4个月前

标签：多模态

多模态思维链如何重塑 AI 与短视频的未来

震撼全网！3位00后夺200万大奖，卷走鹅厂顶级Offer

这一次，ChatBot 的容器变了

Nano Banana Pro的最神级用法，其实是一键生成PPT。

Gemini 3 来了，AI 应用创业公司谁兴奋，谁冷静，谁觉得它不太行？

Gemini 3 登场后，哈萨比斯要「改造」Google 全系产品

AI应用进入下半场：从模型的入口到真正的超级入口

太炸裂了！全网实测Nano Banana Pro，网友：这模型里到底装了什么鬼东西！

昆仑万维发布Skywork R1V4-Lite：30B多模态模型胜Gemini 2.5 Pro，速度还快19倍

昆仑万维发布Skywork R1V4-Lite：用30B多模态模型打平Gemini 2.5 Pro，速度还快19倍

热门网址

标签：多模态

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址