标签:多模态

上海一群青年,造了个学术版OpenClaw

在心肌病基因调控网络的单细胞转录组学数据分析场景中,一款AI可从5亿篇文献中精准定位相关研究,14个智能体并行工作,经11轮迭代将性能提升11%以上,原本研...

阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队

国产大模型圈的季后赛已紧锣密鼓拉开帷幕。一方面,字节豆包、阿里千问、腾讯元宝等巨头砸超40亿元红包吸引用户,除夕夜豆包AI互动达19亿次,千问“一句话下单...

端侧天花板!Qwen3.5家族强悍系列模型来袭

模型性能极限突破放缓,但模型进化依然在向着极致的能效加速,新一代语言系统摆脱单纯堆砌物理算力的传统路径,转而依靠混合计算网络、高质量清洗数据及强化...

可灵3.0系列模型正式上线:属于每个人的导演时代来临

可灵AI 3.0系列模型的发布标志着AI视频创作进入影视级导演时代。该系列包含视频3.0、视频3.0 Omni及图片3.0、图片3.0 Omni模型,覆盖从生成到后期的全流程链...

AI能帮忙厨房看火了!面壁智能开源全模态模型MiniCPM-o4.5,边看边听还能主动抢答

面壁智能开源的全模态模型MiniCPM-o4.5标志着AI交互方式的重大突破。该模型首次实现了边看、边听、主动说的全双工交互能力,打破了传统AI'一问一答'的串行模...

Win版Claude Cowork杀疯了!140元雇个全职AI员工,全网首测真香

昆仑天工推出的Skywork桌面版填补了Windows生态中高效AI助手的空白,成为专为Windows设计的高阶桌面Agent。该工具无需迁移且零门槛上手,能同时调用Claude和G...

登顶行业SOTA的多模态视频生成标杆,昆仑天工刚给开源了

昆仑天工最新发布的SkyReels-V3开源多模态视频生成模型引发广泛关注。该模型具备文生视频、图生视频、视频延长及虚拟形象生成等多样化功能,显著提升了AI生成...

杨植麟亲自发布,月之暗面最强模型Kimi K2.5开源

月之暗面发布了迄今为止最强的多模态模型Kimi K2.5,该模型在Kimi K2基础上进行了约15万亿视觉与文本混合数据的持续预训练,具备顶尖的编程与视觉能力,并引...

解决算力瓶颈,给多模态瘦身!Token压缩完整图谱与选型指南

当前技术选型需权衡多重因素:纯视觉方案通用性强但精度有限,文本引导方法查询相关但计算成本高;合并策略保留语义而丢弃策略压缩比更高。未来演进将聚焦三...

Kimi K2.5来了:杨植麟亲自站台,还能分身出100个Agent!

月之暗面CEO杨植麟以非传统形式发布了Kimi最新模型K2.5,该模型被定位为全能型开源模型,整合了视觉、文本、对话、agent及思考等多元能力。在多个专业评测中...
1 2 3 43