音频生成

音频,audio

SALMONN 系列音视频理解大模型霸榜回归!推理增强、高帧率、无文本泄漏全线突破

SALMONN家族在音视频理解领域取得重大突破,最新发布的video-SALMONN 2+、video-SALMONN-o1、F-16和AVUT基准在多个方面实现了技术飞跃。video-SALMONN 2+通过...

京东的“他她它”App藏不住了!实测后:这个AI产品暴露了京东的野心

京东正借助 AI 技术,将生态服务与 AI 内容社区整合进“他她它”智能入口,进军超级应用新赛道。“他她它”App 于 5 月开启公测后正式发布,集成数字人助手、AI ...

带你们重新认识一下这个全栈AI生产力工具,它的名字,叫剪映。

本文介绍了剪映在AI创作和剪辑领域的强大功能,展示其低门槛、便捷且全面的特点。剪映的AI降噪功能简单实用:有朋友询问音频降噪工具,作者推荐剪映。使用时...

高通祭出全球最快移动SoC!卢伟冰携全球首发小米17Pro现身

2025 年在古北水镇举办的骁龙峰会·中国会场,高通推出最新移动旗舰 SoC——第五代骁龙 8 至尊版移动平台(骁龙 8 Elite Gen 5),采用台积电 3nm 制程工艺,首...

秘塔AI放大招!「边想边搜边做」,内置20+智能体,想法一键实现

在AI快速迭代的浪潮下,搜索正经历前所未有的重构。秘塔AI最新推出的「Agentic Search」模式,开启了「边想边搜边做」的全新搜索范式。谷歌传统搜索引擎模式...

阿里一口气发了N款新模型,让我们向源神致敬。

阿里云栖大会发布了众多模型,展现了其在AI领域强大的技术实力和构建全生态的决心。Qwen3-Max正式版对标GPT - 5等世界顶尖模型。它参数超1万亿,用36万亿toke...

来了!纳芯微汽车电子技术研讨会·重庆站,报名通道已开启

在智能化、电动化重塑汽车产业的背景下,芯片成为技术核心与系统演进的驱动力。9月25日13:30 - 18:00,纳芯微将在重庆市渝北区金州大道116号金科大酒店举办【...

字节跳动发布OmniHuman-1.5,数字人界的“影帝”诞生了

想象与能“眉来眼去”、进行情绪交流的AI虚拟人聊天并非科幻,字节跳动智能创作实验室推出的OmniHuman - 1.5宣告“数字人新王”登基。此前市面上的AI数字人多是“...

长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

随着内容创作智能化需求增长,长时长、高质量数字人视频生成成为行业痛点。字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型...

实测“AI界Netflix” Showrunner:5分钟拍一集《南方公园》,但问题是给谁看

Fable是一家由资深人士创立的旧金山初创公司,试图用AI技术改革娱乐业。其Showrunner平台已上线,号称“AI界的Netflix”,获亚马逊旗下Alexa基金投资。Showrunn...
1 2 3 4 5 49