15 秒音频即可“复制”原声！但OpenAI 担心新语音模型被滥用而限制发行

AIGC动态1年前 (2024)发布 ai-front

1,657 0 0

文章摘要

【关键词】 OpenAI、Voice Engine、语音生成、技术应用、造假风险

OpenAI近期展示了其新型语音生成模型“Voice Engine”，这一技术能够通过文本输入和短短15秒的音频样本，生成与原始说话者声音高度相似的自然语言语音。这项技术已经被应用于OpenAI的文本转语音API以及ChatGPT的语音和朗读功能中。

Voice Engine的问世对于需要频繁录制语音的专业人士，如播客、配音艺术家、有声书解说员等，具有重大影响。然而，目前这项技术仅在小范围内提供，OpenAI与包括教育技术公司、视觉叙事平台、健康软件制造商等在内的几家公司合作，以此来收集反馈，优化技术，并考虑其在不同行业中的应用。

OpenAI官网提供了Voice Engine的使用示例，展示了AI生成的音频剪辑，这些剪辑在音色、语调和停顿等方面都与原始音频极为相似。该技术不仅能“复制”声音，还能将音频翻译成不同语言，这对音频业务公司如Spotify等非常有用。

AI文本到音频生成是生成式AI的一个领域，目前主要集中在生成音乐或自然声音上，而语音生成方面的探索相对较少，部分原因是人们对深度伪造的风险持担忧态度。Voice Engine可以创建听起来非常像本人的语音，但这也带来了安全问题。例如，已经有AI技术被用于伪造声音，如模仿美国总统的声音进行电话骚扰。

为了应对这些风险，OpenAI采取了一系列措施，包括缩减发布规模、要求合作伙伴遵守使用政策、获取原始说话者的知情同意、向听众披露声音为AI生成，并在音频剪辑中添加不可听见的水印以区分AI生成的音频。

最后，OpenAI呼吁银行取消语音认证作为安全措施，并加强对AI深度伪造的教育，同时开发更多技术以检测音频内容的真实性，以应对更先进的AI技术带来的挑战。这表明，尽管Voice Engine带来了创新和便利，但其潜在的风险也需要通过合作和技术进步来共同管理。

原文和模型

【原文链接】 阅读原文 [ 1305字 | 6分钟 ]
【原文作者】 AI前线
【摘要模型】 gpt-4
【摘要评分】 ★★★☆☆

OpenAI GPT-4

GPT-4是OpenAI公司开发的自然...

# AIGC动态 # GPT-GPTs # 大模型 # 音频生成 # AI前线 # Azure # gpt-4 # OpenAI # Voice Engine # 技术应用 # 语音生成 # 造假风险

文章版权归作者所有，未经允许请勿转载。

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

新智元

1,587

让 Kimi Chat 学完了整本周易，给 Sam Altman 算了一卦｜AI 鲜测

硅星人Pro

2,273

谁能终结英伟达？

admin

2,539

从造车策略的十年变化来看，苹果造车为什么会失败？

Founder Park

1,719

离开百度7年后，吴恩达终于大厂“再就业”：加入亚马逊董事会，帮其实现AI大志

AI前线

1,875

南洋理工发布多模态智能体 FinAgent，开启高效金融交易的创新之旅

AI科技评论

2,418

暂无评论

暂无评论...

15 秒音频即可“复制”原声！但OpenAI 担心新语音模型被滥用而限制发行

文章摘要

原文和模型

大模型生产力的头场变革，从英特尔商用 AI PC 说起

上来就是万亿模型，要单挑大厂的阶跃星辰就是中国版Inflection AI

相关文章

暂无评论

热门网址

热门文章

15 秒音频即可“复制”原声！但OpenAI 担心新语音模型被滥用而限制发行

文章摘要

原文和模型

大模型生产力的头场变革，从英特尔商用 AI PC 说起

上来就是万亿模型，要单挑大厂的阶跃星辰就是中国版Inflection AI

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章