标签:AIGC

开源中小模型+Skills也性能暴增!卢森堡大学探索了小模型驾驭Skills的边界

专注AIGC领域的专业社区,持续关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型的发展与应用落地,聚焦大语言模型的市场研究及AIGC开发者生态。在此背景...

我已经四个月没打开 Photoshop 了。

很多人上手Nano Banana 2初期感到未达预期,未看到类似初代定义图像生成新范式、Pro大幅提升画质与可控性的惊艳突破。但这款模型实则将Pro的质量与Flash的速...

李飞飞团队新作:无需修改架构,重组数据即显著提升AI对视频理解能力

斯坦福大学、微软研究院和威斯康辛大学团队提出了一种名为VideoWeave的数据中心化方法,通过重组短视频素材显著提升了AI对长视频的理解能力,且无需增加计算...

机器人GPT时刻!英伟达WAM赋予全机器人零样本操作能力

英伟达最新发布的世界动作模型DreamZero标志着机器人技术的重要突破。这款拥有14B参数的模型通过视频生成与动作预测的深度耦合,赋予机器人预测未来并指导动...

智谱GLM-OCR,0.9B开源即巅峰,复杂文档精准解析

智谱发布的GLM-OCR模型以仅0.9B参数实现多项突破,登顶OmniDocBench V1.5榜单,并在公式识别、表格解析等主流基准中取得SOTA表现。该模型通过多Tokens预测损...

蚂蚁开源世界模型LingBot-World:具有分钟级记忆的实时世界模拟器

蚂蚁集团旗下灵波科技开源了两项具身智能领域的突破性成果:具身智能模型和LingBot-World世界模型。前者被誉为'最强开源机器人大脑',基于两万小时真机数据训...

美团智能体SOTA模型LongCat-Flash-Thinking-2601开源

美团龙猫团队开发的LongCat-Flash-Thinking-2601模型标志着智能体推理能力的重大突破。这个总参数5600亿、激活参数270亿的混合专家模型(MoE),在代理搜索、...

免费领200元算力!高校专属调研福利速抢~

面向高校的专属算力云平台正式推出,旨在为科研创新、人才培养与学科建设提供高效稳定的计算资源支持。该平台通过整合AI大模型、Agent智能体等技术资源,重点...

自动驾驶VLA新SOTA:复旦联合团队提出WAM-Diff重塑端到端自动驾驶

复旦大学与引望智能科技联合提出的WAM-Diff框架,在NAVSIM-v1榜单上以91.0 PDMS的预测驾驶得分刷新了自动驾驶领域的性能记录。这一端到端自动驾驶系统通过掩...

加速200倍,单显卡1.8秒生成5秒高清视频!清华与Vidu解开了视频扩散模型的速度枷锁

TurboDiffusion技术通过稀疏注意力、蒸馏量化和硬件优化,将视频生成速度提升至实时水平。传统视频扩散模型因计算复杂度高而效率低下,尤其在处理时间连贯性...
1 2 3 13