音频生成

音频,audio

实测纳逗 Pro:能做专业影视级内容的智能平台长啥样

当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...

20岁了!劈柴哥发帖庆生:谷歌翻译换了4代AI,第一次有了「呼吸感」

四月二十八日,谷歌翻译迎来二十周年发展节点,其系统升级路径完整映射出底层人工智能算法的迭代轨迹。早期架构依赖统计机器翻译技术,通过海量语料库计算词...

说实话,Kimi这次的东西挺难描述的

Kimi 近期发布了多项新功能,包括 K2.6 模型、Agent 集群以及 Claw Group 群聊协作模式,这些更新标志着人机协作方式正在发生重大转变。当真人与 AI 坐进同一...

字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列

字节跳动旗下现象级 AI 视频技术 Seedance 2.0 已在 arXiv 正式发布论文,公开了长达 26 页的评测基准及完整的 170 位团队成员名单,署名和尊重细节十分到位...

字节Seed最新模型,让豆包学会闭嘴听人说话(骂人也更自然了!)

字节跳动旗下 AI 研究团队_seed 于 4 月 9 日发布全新语音模型 Seeduplex 并在豆包 App 完成全量部署,其核心在于解决了长期存在的通信延迟与状态分离问题。...

王智、沈今晶、方汉、郑林等等都来了,AIFUT大会Day2上午场全记录。

AIFUT 大会次日上午的议程密集且干货满满,现场嘉宾对人工智能在各垂直领域的应用进行了深入剖析。社区建设方面,WaytoAGI 发起人回顾了三年发展历程,见证了...

罗振宇、张鹏、王力行等齐聚一堂,AIFUT大会Day1上午场的全面总结来了。

位于北京亦庄举办的 AI 相关盛会吸引了大量关注,现场氛围热烈标志着技术发展进入新的实景阶段。在城市规划与管理方面,一座城市的未来是一次次真实的探索和...

张雪机车燃爆封神!国产2B语音模型重磅开源,全网听完都起鸡皮疙瘩

面壁智能联合清华大学团队于近日推出了名为VoxCPM 2的二千万级语音模型。该产品已开源,并在性能参数上展现出显著的竞争力。除了全面支持全球30种语言文字外...

AI 语音赛道的角逐,可能已经结束了。

VoxCPM 2 是由面壁智能联合开源社区及清华大学实验室共同推出的开源高性能语音模型。 此模型虽然在参数规模上控制在 2B 以内,但在语音质量与功能集上实现了...

国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口

面壁智能联合清华大学人机交互实验室推出的全新语音大模型在最近引发科技圈关注,该项目凭借极低参数实现了极高精度的声音复刻效果。演示视频显示,模型不仅...
1 2 3 59