音频生成
音频,audio
说实话,Kimi这次的东西挺难描述的
Kimi 近期发布了多项新功能,包括 K2.6 模型、Agent 集群以及 Claw Group 群聊协作模式,这些更新标志着人机协作方式正在发生重大转变。当真人与 AI 坐进同一...
字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列
字节跳动旗下现象级 AI 视频技术 Seedance 2.0 已在 arXiv 正式发布论文,公开了长达 26 页的评测基准及完整的 170 位团队成员名单,署名和尊重细节十分到位...
字节Seed最新模型,让豆包学会闭嘴听人说话(骂人也更自然了!)
字节跳动旗下 AI 研究团队_seed 于 4 月 9 日发布全新语音模型 Seeduplex 并在豆包 App 完成全量部署,其核心在于解决了长期存在的通信延迟与状态分离问题。...
王智、沈今晶、方汉、郑林等等都来了,AIFUT大会Day2上午场全记录。
AIFUT 大会次日上午的议程密集且干货满满,现场嘉宾对人工智能在各垂直领域的应用进行了深入剖析。社区建设方面,WaytoAGI 发起人回顾了三年发展历程,见证了...
罗振宇、张鹏、王力行等齐聚一堂,AIFUT大会Day1上午场的全面总结来了。
位于北京亦庄举办的 AI 相关盛会吸引了大量关注,现场氛围热烈标志着技术发展进入新的实景阶段。在城市规划与管理方面,一座城市的未来是一次次真实的探索和...
张雪机车燃爆封神!国产2B语音模型重磅开源,全网听完都起鸡皮疙瘩
面壁智能联合清华大学团队于近日推出了名为VoxCPM 2的二千万级语音模型。该产品已开源,并在性能参数上展现出显著的竞争力。除了全面支持全球30种语言文字外...
AI 语音赛道的角逐,可能已经结束了。
VoxCPM 2 是由面壁智能联合开源社区及清华大学实验室共同推出的开源高性能语音模型。 此模型虽然在参数规模上控制在 2B 以内,但在语音质量与功能集上实现了...
国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口
面壁智能联合清华大学人机交互实验室推出的全新语音大模型在最近引发科技圈关注,该项目凭借极低参数实现了极高精度的声音复刻效果。演示视频显示,模型不仅...
雷军刘强东,投了个29岁哥大学霸
作为近年刚诞生的新型组织,其核心管理层展现出极高的专业水准,创始人由一位出生在 1997 年的年轻学人担任。他在全球知名研究机构从事深度学习课题研究,并...
具身龙虾,上车理想
理想汽车推出了名为 StreamingClaw 的全新一代 Agent 框架,该方案深度集成了流式视频理解与具身智能的技术能力。此框架的核心创新点在于在保持与旧版通用标...





