多模态 | 第 2 页

可灵3.0系列模型正式上线：属于每个人的导演时代来临

可灵AI 3.0系列模型的发布标志着AI视频创作进入影视级导演时代。该系列包含视频3.0、视频3.0 Omni及图片3.0、图片3.0 Omni模型，覆盖从生成到后期的全流程链...

AIGC动态

2个月前

AI能帮忙厨房看火了！面壁智能开源全模态模型MiniCPM-o4.5，边看边听还能主动抢答

面壁智能开源的全模态模型MiniCPM-o4.5标志着AI交互方式的重大突破。该模型首次实现了边看、边听、主动说的全双工交互能力，打破了传统AI'一问一答'的串行模...

AIGC动态

2个月前

Win版Claude Cowork杀疯了！140元雇个全职AI员工，全网首测真香

昆仑天工推出的Skywork桌面版填补了Windows生态中高效AI助手的空白，成为专为Windows设计的高阶桌面Agent。该工具无需迁移且零门槛上手，能同时调用Claude和G...

AI-Agent

2个月前

登顶行业SOTA的多模态视频生成标杆，昆仑天工刚给开源了

昆仑天工最新发布的SkyReels-V3开源多模态视频生成模型引发广泛关注。该模型具备文生视频、图生视频、视频延长及虚拟形象生成等多样化功能，显著提升了AI生成...

AIGC动态

2个月前

杨植麟亲自发布，月之暗面最强模型Kimi K2.5开源

月之暗面发布了迄今为止最强的多模态模型Kimi K2.5，该模型在Kimi K2基础上进行了约15万亿视觉与文本混合数据的持续预训练，具备顶尖的编程与视觉能力，并引...

AI-Agent

2个月前

解决算力瓶颈，给多模态瘦身！Token压缩完整图谱与选型指南

当前技术选型需权衡多重因素：纯视觉方案通用性强但精度有限，文本引导方法查询相关但计算成本高；合并策略保留语义而丢弃策略压缩比更高。未来演进将聚焦三...

AIGC动态

2个月前

Kimi K2.5来了：杨植麟亲自站台，还能分身出100个Agent！

月之暗面CEO杨植麟以非传统形式发布了Kimi最新模型K2.5，该模型被定位为全能型开源模型，整合了视觉、文本、对话、agent及思考等多元能力。在多个专业评测中...

AI-Agent

2个月前

又见印奇

印奇与作者在硅谷的会面引发了对AI商业化路径的深度探讨。作为旷视科技创始人和阶跃星辰董事长，他回顾了AI 1.0时代未能实现商业闭环的教训，认为'拿着锤子找...

AIGC动态

2个月前

成立两年半登顶全球AI创作社区，背后是中国团队在“卖情绪”？？

SeaArt作为全球领先的AI创作社区平台，凭借其独特的定位和功能吸引了大量用户。该平台月访问量超过3000万，注册用户超过5000万，单日生成内容高达2000万张图...

AI-Agent

2个月前

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

近年来，将AI引入传统行业的需求日益增长，尤其是在处理复杂机械图纸、设备维护手册或金融研报图表等任务时，多模态助手的开发显得尤为重要。这类助手不仅需...

AIGC动态

3个月前

标签：多模态

可灵3.0系列模型正式上线：属于每个人的导演时代来临

AI能帮忙厨房看火了！面壁智能开源全模态模型MiniCPM-o4.5，边看边听还能主动抢答

Win版Claude Cowork杀疯了！140元雇个全职AI员工，全网首测真香

登顶行业SOTA的多模态视频生成标杆，昆仑天工刚给开源了

杨植麟亲自发布，月之暗面最强模型Kimi K2.5开源

解决算力瓶颈，给多模态瘦身！Token压缩完整图谱与选型指南

Kimi K2.5来了：杨植麟亲自站台，还能分身出100个Agent！

又见印奇

成立两年半登顶全球AI创作社区，背后是中国团队在“卖情绪”？？

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

热门网址

标签：多模态

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址