音频生成
音频,audio
这个 AI 产品,真的绝了,好用
谷歌发布了Veo 3.1视频生成模型,虽然是小版本迭代,但在多个用户场景中实现了显著改进。新版本支持多图参考和首尾帧功能,音频效果与画面纹理质量均有提升。...
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了
谷歌凌晨发布了视频生成模型Veo 3.1的重大更新,标志着AI视频生成进入导演级精控阶段。此次升级聚焦两大核心功能:叙事与音频控制的强化,以及输入与编辑能力...
当我们谈论「AI 搜索」,我们在谈些什么?
AI搜索正经历从传统信息检索向任务解决和创意生产平台的转型,交付能力成为行业竞争的核心分水岭。百度近期全面升级文心助手的AIGC创作能力,支持8种模态内容...
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
中国科学院计算技术研究所的研究团队在NeurIPS 2025发表论文《SpaceServe: Spatial Multiplexing of Complementary Encoders and Decoders for Multimodal LL...
谁在赚钱,谁爱花钱,谁是草台班子,2025 年度最全面的 AI 报告
2025年标志着AI行业从技术研究向实际生产系统的转变,成为全球经济增长的重要驱动力。头部AI公司的年化总收入达到185亿美元,进入百亿美元时代。AI不再局限于...
当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测
近期AI视频生成领域迎来重要进展,Vidu Q2参考生视频功能与Sora 2展开多维度技术对比。测试聚焦三大核心维度:一致性保持、物理规律遵循和运镜能力。在一致性...
Sora 和 AI 视频的爆炸性红利
团队在一次长达两个半小时的周会上重点讨论了OpenAI最新发布的社交类AI视频应用Sora及其第二代模型Sora 2。会议气氛异常兴奋,与会者深入探讨了这项技术带来...
刚刚,Figure 03人形机器人登场,能感知一枚回形针重量
Figure 03是Figure公司推出的第三代人形机器人,专为家庭服务和规模化量产设计。该机器人能够自主完成端茶倒水、收拾垃圾、清洗餐具、洗衣叠衣等家务任务,同...
Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。
Sand.ai团队正式发布了全新的音画同步视频模型GAGA-1,该模型在人物表演领域展现出显著的技术突破。经过六个月的开发周期,这款国产模型目前已开放免费使用,...
刚刚,Figure03发布!全自主干遍家务,还能分拣快递、送货上门
Figure公司发布了第三代人形机器人Figure 03,专为Helix系统设计,面向家庭场景与全球规模化应用。这款机器人从零开始即为量产而设计,团队重构了软硬件体系...


