音频生成
音频,audio
哈工大发布动画多智能体,文本一键生成连贯动画
随着大规模多模态模型的兴起,AI技术在生成叙事性视频方面的应用成为研究热点。现有的方法,如MINT Video和TTT-Video,虽然在生成单个视频片段时质量有所提升...
Sam Altman邮件证实,OpenAI将开发硬件语音AI Agent
OpenAI首席执行官Sam Altman近期公开了与AI硬件公司iyO的交涉邮件,揭示了OpenAI在硬件语音AI Agent领域的布局。邮件显示,OpenAI最初对与iyO合作开发硬件语...
纳米 AI 梁志辉:超级搜索智能体是 AI 时代的真正入口
在 AGI Playground 2025 上,360 集团副总裁、纳米 AI 负责人梁志辉分享了 360 在 AI 搜索、智能体搭建和 AI 浏览器领域的探索与经验。传统搜索存在诸多痛点...
亚马逊全球AI报告:2025年,企业加大生成式AI落地和投资
全球电商和云计算巨头亚马逊近期发布了一份《全球企业生成式AI应用指数报告》,该报告基于对9个国家3,739位高级IT决策者的深度调查,揭示了生成式AI在企业中...
谷歌Gemini 2.5全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机
谷歌最新发布的Gemini 2.5系列模型,标志着其在人工智能领域的又一次重大突破。此次更新包括Gemini 2.5 Pro、Gemini 2.5 Flash以及首次亮相的Gemini 2.5 Flas...
松下发布多模态大模型,文本、图像、音频随意切换
随着大模型技术的快速发展,多模态数据处理逐渐成为研究热点。多模态生成任务通过整合文本、图像、音频等多种类型的数据,实现不同模态之间的相互转换与生成...
AI改变世界!微软发布700个真实AI Agent、Copilot应用案例
微软作为全球AI领域的领导者,发布了700个真实的Agent智能体和Microsoft Copilot应用案例,展示了AI如何在不同行业中改变工作模式。这些案例涵盖了金融、医疗...
从高考到实战,豆包大模型交卷了
在火山引擎原动力大会 Force 2025 上,火山引擎发布了多项 AI 新产品和升级,展示了其在 AI 领域的全面布局。豆包大模型 1.6 成为焦点,其性能在一般任务和推...
谷歌悄咪咪上线了 10 款 AI 应用,下一个 NotebookLM 可能在里面
Google Labs作为谷歌官方的AI实验平台,已成为生成式AI创新的重要孵化器。该平台近期密集上线了十余款兼具实用性和趣味性的AI工具,涵盖内容创作、生活服务、...
太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗
火山引擎发布了豆包·播客模型,这一AI工具能够生成高度拟真的双人对话播客,其语音表现力与真人几乎无异。用户只需在豆包PC版中点击“网页播客”按钮,即可快速...




