音频生成

音频,audio

谷歌Android重大更新!底层植入Gemini,苹果已掉队

移动通信设备的操作系统正经历从传统硬件堆叠向意图驱动体验的深刻转型。智能手机生态长期受限于应用孤岛模式,用户被迫在不同独立软件间频繁切换以处理日常...

黄仁勋100万亿预言兑现!易鑫Voice Agent落地,汽车金融迎效率革命

通用语音交互技术在面对汽车金融等垂直领域时,普遍存在抗干扰能力弱、复杂逻辑易断裂及合规边界模糊等缺陷,难以直接匹配真实生产线需求。针对行业应用瓶颈...

马斯克、库克随特朗普访华,黄仁勋未获邀请;SK海力士中国员工无法做管理层,奖金不到韩国人的5%;390万元起!宇树发布载人变形机甲

近期科技与商业领域呈现密集动态,人工智能产业的资本角逐与商业化落地成为核心焦点。Anthropic正洽谈逾三百亿美元的新轮融资,投前估值突破九千亿美元,标志...

绝杀!OpenAI正式接管人类耳朵,首个GPT-5级推理音频模型来了

伴随核心模型的发布,GPT-Realtime-Translate与GPT-Realtime-Whisper进一步构建了完整的实时音频处理生态。翻译模块覆盖数十种语言的输入与输出,在保持高准...

Suno不再是唯一答案,企业开始选择这个国产AI音乐

企业级客户正逐步将生成式音频技术从原有非官方或高成本路径转向专用解决方案,底层性能的跨越式进阶与配套体系的完善主导了此次产业替换潮。在过往缺乏成熟...

Product Hunt月榜盘点:单纯做Agent已经不够了,要切进真实、高频的工作流中

四月AI新产品市场数据折射出行业范式的显著迁移。前期依赖命名红利与生态占位的趋势逐步消退,产品形态走向稳定。AI系统正跨越单一的能力演示阶段,全面转向...

GPT-5级推理能力塞进语音模型,OpenAI把同传翻译成本砍穿地板价

OpenAI正式推出三款实时语音交互模型,涵盖高维逻辑推演、流式多语翻译与低延迟语音转写,全面拓展了端到端交互的技术边界。新一代语音架构通过极低的响应延...

非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品

针对大语言模型的情感与主观体验评估,研究人员通过五十六个基础模型系统性地构建了功能性幸福感测评框架。该框架摒弃了意识真伪的哲学争议,转而依赖经验效...

他用AI办了个音乐节,主题:别读博

科研工作者因意外骨折被迫中止实验室工作,在此期间利用AI技术创作了“不读博音乐节”音乐改编系列。该系列聚焦研究生群体面临的实验受挫、论文拒稿、延期毕业...

实测纳逗 Pro:能做专业影视级内容的智能平台长啥样

当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...
1 2 3 60