音频生成

音频,audio

谁在赚钱,谁爱花钱,谁是草台班子,2025 年度最全面的 AI 报告

2025年标志着AI行业从技术研究向实际生产系统的转变,成为全球经济增长的重要驱动力。头部AI公司的年化总收入达到185亿美元,进入百亿美元时代。AI不再局限于...

当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测

近期AI视频生成领域迎来重要进展,Vidu Q2参考生视频功能与Sora 2展开多维度技术对比。测试聚焦三大核心维度:一致性保持、物理规律遵循和运镜能力。在一致性...

Sora 和 AI 视频的爆炸性红利

团队在一次长达两个半小时的周会上重点讨论了OpenAI最新发布的社交类AI视频应用Sora及其第二代模型Sora 2。会议气氛异常兴奋,与会者深入探讨了这项技术带来...

刚刚,Figure 03人形机器人登场,能感知一枚回形针重量

Figure 03是Figure公司推出的第三代人形机器人,专为家庭服务和规模化量产设计。该机器人能够自主完成端茶倒水、收拾垃圾、清洗餐具、洗衣叠衣等家务任务,同...

Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。

Sand.ai团队正式发布了全新的音画同步视频模型GAGA-1,该模型在人物表演领域展现出显著的技术突破。经过六个月的开发周期,这款国产模型目前已开放免费使用,...

刚刚,Figure03发布!全自主干遍家务,还能分拣快递、送货上门

Figure公司发布了第三代人形机器人Figure 03,专为Helix系统设计,面向家庭场景与全球规模化应用。这款机器人从零开始即为量产而设计,团队重构了软硬件体系...

刚刚,OpenAI开发者大会重磅发布:AgentKit、Codex正式版、Apps SDK与Sora 2 API

OpenAI在2025年开发者大会上公布了一系列重要进展与新产品。首席执行官山姆・奥特曼首先分享了公司的里程碑数据:400万开发者、8亿周活跃ChatGPT用户,以及AP...

小红书发布FireRedChat:首个可私有化部署的全双工大模型语音交互系统

小红书智创音频团队推出的FireRedChat系统是业内首个支持私有化部署的全双工大模型语音交互解决方案,通过自研核心技术解决了传统语音交互中延迟高、噪声敏感...

刷屏的Sora 2,不是“AI抖音”时刻

OpenAI正式推出新一代视频生成模型Sora 2,并将其以独立iOS应用的形式发布,标志着从技术模型向消费级产品的转型。与第一代Sora不同,Sora 2不再局限于ChatGP...

把我的第一次日本旅行,完全交给 AI 是什么体验?

AI作为旅行助手的能力目前展现出实用潜力,但仍存在明显局限。通过一次完全依赖AI的东京旅行实验发现,AI生成的旅行攻略具有图文并茂、结构完整的优势,能快...
1 3 4 5 6 7 52