音频生成
音频,audio
MiniMax,可能是今年最大的黑马。
MiniMax公司最新发布的M2语言模型在性能与成本效益方面展现出显著优势,引发行业关注。该模型在Artificial Analysis测试榜单中位列全球第五,总分低于GPT-5、...
特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线
特斯拉自动驾驶副总裁Ashok Elluswamy在计算机视觉顶会ICCV上展示了其世界模拟器技术,该技术能够生成高度真实的驾驶场景视频,用于自动驾驶模型的训练和评估...
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
OpenAI近期被曝正在筹备AI音乐生成项目,这一动向直接威胁到估值20亿美元的初创公司Suno AI的市场地位。OpenAI已与世界顶级艺术院校茱莉亚学院合作,通过标注...
阿里云神秘团队曝光:AI时代的新蓝军
AI蠕虫病毒的出现标志着攻击模式从人为传播转向智能体之间的自主传播,这种新型威胁通过语言、图片等媒介污染和操纵AI的“思维”。研究人员已成功开发出第一代A...
程序员用AI写歌还赚钱了!用AI 批量生产“爆款”,这个副业“杀疯了”?
AI音乐创作正以前所未有的速度改变着艺术生产和消费的格局。2024年多个案例显示,由AI生成的音乐作品已具备市场竞争力:原神玩家用Suno制作的歌曲获得640万播...
这个 AI 产品,真的绝了,好用
谷歌发布了Veo 3.1视频生成模型,虽然是小版本迭代,但在多个用户场景中实现了显著改进。新版本支持多图参考和首尾帧功能,音频效果与画面纹理质量均有提升。...
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了
谷歌凌晨发布了视频生成模型Veo 3.1的重大更新,标志着AI视频生成进入导演级精控阶段。此次升级聚焦两大核心功能:叙事与音频控制的强化,以及输入与编辑能力...
当我们谈论「AI 搜索」,我们在谈些什么?
AI搜索正经历从传统信息检索向任务解决和创意生产平台的转型,交付能力成为行业竞争的核心分水岭。百度近期全面升级文心助手的AIGC创作能力,支持8种模态内容...
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
中国科学院计算技术研究所的研究团队在NeurIPS 2025发表论文《SpaceServe: Spatial Multiplexing of Complementary Encoders and Decoders for Multimodal LL...





