标签:多模态

可灵3.0系列模型正式上线:属于每个人的导演时代来临

可灵AI 3.0系列模型的发布标志着AI视频创作进入影视级导演时代。该系列包含视频3.0、视频3.0 Omni及图片3.0、图片3.0 Omni模型,覆盖从生成到后期的全流程链...

AI能帮忙厨房看火了!面壁智能开源全模态模型MiniCPM-o4.5,边看边听还能主动抢答

面壁智能开源的全模态模型MiniCPM-o4.5标志着AI交互方式的重大突破。该模型首次实现了边看、边听、主动说的全双工交互能力,打破了传统AI'一问一答'的串行模...

Win版Claude Cowork杀疯了!140元雇个全职AI员工,全网首测真香

昆仑天工推出的Skywork桌面版填补了Windows生态中高效AI助手的空白,成为专为Windows设计的高阶桌面Agent。该工具无需迁移且零门槛上手,能同时调用Claude和G...

登顶行业SOTA的多模态视频生成标杆,昆仑天工刚给开源了

昆仑天工最新发布的SkyReels-V3开源多模态视频生成模型引发广泛关注。该模型具备文生视频、图生视频、视频延长及虚拟形象生成等多样化功能,显著提升了AI生成...

杨植麟亲自发布,月之暗面最强模型Kimi K2.5开源

月之暗面发布了迄今为止最强的多模态模型Kimi K2.5,该模型在Kimi K2基础上进行了约15万亿视觉与文本混合数据的持续预训练,具备顶尖的编程与视觉能力,并引...

解决算力瓶颈,给多模态瘦身!Token压缩完整图谱与选型指南

当前技术选型需权衡多重因素:纯视觉方案通用性强但精度有限,文本引导方法查询相关但计算成本高;合并策略保留语义而丢弃策略压缩比更高。未来演进将聚焦三...

Kimi K2.5来了:杨植麟亲自站台,还能分身出100个Agent!

月之暗面CEO杨植麟以非传统形式发布了Kimi最新模型K2.5,该模型被定位为全能型开源模型,整合了视觉、文本、对话、agent及思考等多元能力。在多个专业评测中...

又见印奇

印奇与作者在硅谷的会面引发了对AI商业化路径的深度探讨。作为旷视科技创始人和阶跃星辰董事长,他回顾了AI 1.0时代未能实现商业闭环的教训,认为'拿着锤子找...

成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??

SeaArt作为全球领先的AI创作社区平台,凭借其独特的定位和功能吸引了大量用户。该平台月访问量超过3000万,注册用户超过5000万,单日生成内容高达2000万张图...

不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?

近年来,将AI引入传统行业的需求日益增长,尤其是在处理复杂机械图纸、设备维护手册或金融研报图表等任务时,多模态助手的开发显得尤为重要。这类助手不仅需...
1 2 3 4 43