音频生成

音频,audio

非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品

针对大语言模型的情感与主观体验评估,研究人员通过五十六个基础模型系统性地构建了功能性幸福感测评框架。该框架摒弃了意识真伪的哲学争议,转而依赖经验效...

他用AI办了个音乐节,主题:别读博

科研工作者因意外骨折被迫中止实验室工作,在此期间利用AI技术创作了“不读博音乐节”音乐改编系列。该系列聚焦研究生群体面临的实验受挫、论文拒稿、延期毕业...

实测纳逗 Pro:能做专业影视级内容的智能平台长啥样

当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...

20岁了!劈柴哥发帖庆生:谷歌翻译换了4代AI,第一次有了「呼吸感」

四月二十八日,谷歌翻译迎来二十周年发展节点,其系统升级路径完整映射出底层人工智能算法的迭代轨迹。早期架构依赖统计机器翻译技术,通过海量语料库计算词...

说实话,Kimi这次的东西挺难描述的

Kimi 近期发布了多项新功能,包括 K2.6 模型、Agent 集群以及 Claw Group 群聊协作模式,这些更新标志着人机协作方式正在发生重大转变。当真人与 AI 坐进同一...

字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列

字节跳动旗下现象级 AI 视频技术 Seedance 2.0 已在 arXiv 正式发布论文,公开了长达 26 页的评测基准及完整的 170 位团队成员名单,署名和尊重细节十分到位...

字节Seed最新模型,让豆包学会闭嘴听人说话(骂人也更自然了!)

字节跳动旗下 AI 研究团队_seed 于 4 月 9 日发布全新语音模型 Seeduplex 并在豆包 App 完成全量部署,其核心在于解决了长期存在的通信延迟与状态分离问题。...

王智、沈今晶、方汉、郑林等等都来了,AIFUT大会Day2上午场全记录。

AIFUT 大会次日上午的议程密集且干货满满,现场嘉宾对人工智能在各垂直领域的应用进行了深入剖析。社区建设方面,WaytoAGI 发起人回顾了三年发展历程,见证了...

罗振宇、张鹏、王力行等齐聚一堂,AIFUT大会Day1上午场的全面总结来了。

位于北京亦庄举办的 AI 相关盛会吸引了大量关注,现场氛围热烈标志着技术发展进入新的实景阶段。在城市规划与管理方面,一座城市的未来是一次次真实的探索和...

张雪机车燃爆封神!国产2B语音模型重磅开源,全网听完都起鸡皮疙瘩

面壁智能联合清华大学团队于近日推出了名为VoxCPM 2的二千万级语音模型。该产品已开源,并在性能参数上展现出显著的竞争力。除了全面支持全球30种语言文字外...
1 2 3 60