音频生成
音频,audio
从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录
AI视频技术从极客专属到全民可用的跨越,标志着生成式AI进入新阶段。2025年第四季度,OpenAI的Sora 2与阿里的Wan2.5-Preview两大模型引发全球热潮,前者通过'...
模力工场 017 周 AI 应用榜: 从营销工具到情感共鸣,最“温柔”AI 应用榜单来袭
模力工场与极客时间联合举办的八周年直播活动聚焦“程序员如何成为AI时代超级个体”,邀请多位行业专家进行圆桌讨论。与会者认为,AI工具正在重塑开发方式,推...
刷新SOTA高出19.05分!英伟达开源OmniVinci全模态理解模型,只用1/6的数据,实现全方位超越
英伟达研究团队推出的OmniVinci全模态理解大语言模型,通过创新的架构设计和数据策略,仅用六分之一训练数据便在关键基准测试中超越现有顶尖模型19.05分。该...
MiniMax,可能是今年最大的黑马。
MiniMax公司最新发布的M2语言模型在性能与成本效益方面展现出显著优势,引发行业关注。该模型在Artificial Analysis测试榜单中位列全球第五,总分低于GPT-5、...
特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线
特斯拉自动驾驶副总裁Ashok Elluswamy在计算机视觉顶会ICCV上展示了其世界模拟器技术,该技术能够生成高度真实的驾驶场景视频,用于自动驾驶模型的训练和评估...
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
OpenAI近期被曝正在筹备AI音乐生成项目,这一动向直接威胁到估值20亿美元的初创公司Suno AI的市场地位。OpenAI已与世界顶级艺术院校茱莉亚学院合作,通过标注...
阿里云神秘团队曝光:AI时代的新蓝军
AI蠕虫病毒的出现标志着攻击模式从人为传播转向智能体之间的自主传播,这种新型威胁通过语言、图片等媒介污染和操纵AI的“思维”。研究人员已成功开发出第一代A...
程序员用AI写歌还赚钱了!用AI 批量生产“爆款”,这个副业“杀疯了”?
AI音乐创作正以前所未有的速度改变着艺术生产和消费的格局。2024年多个案例显示,由AI生成的音乐作品已具备市场竞争力:原神玩家用Suno制作的歌曲获得640万播...
这个 AI 产品,真的绝了,好用
谷歌发布了Veo 3.1视频生成模型,虽然是小版本迭代,但在多个用户场景中实现了显著改进。新版本支持多图参考和首尾帧功能,音频效果与画面纹理质量均有提升。...






