标签:多模态
登顶行业SOTA的多模态视频生成标杆,昆仑天工刚给开源了
昆仑天工最新发布的SkyReels-V3开源多模态视频生成模型引发广泛关注。该模型具备文生视频、图生视频、视频延长及虚拟形象生成等多样化功能,显著提升了AI生成...
杨植麟亲自发布,月之暗面最强模型Kimi K2.5开源
月之暗面发布了迄今为止最强的多模态模型Kimi K2.5,该模型在Kimi K2基础上进行了约15万亿视觉与文本混合数据的持续预训练,具备顶尖的编程与视觉能力,并引...
解决算力瓶颈,给多模态瘦身!Token压缩完整图谱与选型指南
当前技术选型需权衡多重因素:纯视觉方案通用性强但精度有限,文本引导方法查询相关但计算成本高;合并策略保留语义而丢弃策略压缩比更高。未来演进将聚焦三...
Kimi K2.5来了:杨植麟亲自站台,还能分身出100个Agent!
月之暗面CEO杨植麟以非传统形式发布了Kimi最新模型K2.5,该模型被定位为全能型开源模型,整合了视觉、文本、对话、agent及思考等多元能力。在多个专业评测中...
又见印奇
印奇与作者在硅谷的会面引发了对AI商业化路径的深度探讨。作为旷视科技创始人和阶跃星辰董事长,他回顾了AI 1.0时代未能实现商业闭环的教训,认为'拿着锤子找...
成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??
SeaArt作为全球领先的AI创作社区平台,凭借其独特的定位和功能吸引了大量用户。该平台月访问量超过3000万,注册用户超过5000万,单日生成内容高达2000万张图...
不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?
近年来,将AI引入传统行业的需求日益增长,尤其是在处理复杂机械图纸、设备维护手册或金融研报图表等任务时,多模态助手的开发显得尤为重要。这类助手不仅需...
顶尖AI竟输给三岁宝宝,BabyVision测试暴露多模态模型硬伤
大模型在纯视觉任务上的表现远低于人类儿童水平。UniPat AI与红杉中国xbench团队联合发布的BabyVision评测集揭示,当前最先进的多模态大模型在基础视觉能力上...
ARR 超300万刀、实现月度盈亏平衡!ListenHub 完成天使+轮融资,加速出海进程
MarsWave近日宣布完成200万美元天使+轮融资,由天际资本领投,小米联合创始人王川跟投。在AI音频赛道普遍面临盈利质疑的背景下,MarsWave凭借清晰的商业化路...
为什么是这10个词,定义了2025年AI叙事
2025年标志着人工智能领域从技术探索迈向深度产业化的关键转折点。AI不再局限于代码与算法,而是通过Agent(智能体)渗透至千行百业,推动机器人实现具身智能...




