音频生成
音频,audio
AI 语音赛道的角逐,可能已经结束了。
VoxCPM 2 是由面壁智能联合开源社区及清华大学实验室共同推出的开源高性能语音模型。 此模型虽然在参数规模上控制在 2B 以内,但在语音质量与功能集上实现了...
国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口
面壁智能联合清华大学人机交互实验室推出的全新语音大模型在最近引发科技圈关注,该项目凭借极低参数实现了极高精度的声音复刻效果。演示视频显示,模型不仅...
雷军刘强东,投了个29岁哥大学霸
作为近年刚诞生的新型组织,其核心管理层展现出极高的专业水准,创始人由一位出生在 1997 年的年轻学人担任。他在全球知名研究机构从事深度学习课题研究,并...
具身龙虾,上车理想
理想汽车推出了名为 StreamingClaw 的全新一代 Agent 框架,该方案深度集成了流式视频理解与具身智能的技术能力。此框架的核心创新点在于在保持与旧版通用标...
当 AI 视频创作进入「下半场」
随着Seedance 2.0等技术的迭代,AI视频创作门槛被大幅降低,相关内容迎来了规模激增。三月下旬结束的B站首届AI视频大赛共汇集了超过八千三百件参赛案例,站内...
阿里3天3王炸!全模态、精准控图和智能体编程SOTA,但没开源
阿里巴巴在近三天的时间跨度里密集发布三款战略级人工智能模型,确立了在大模型技术与行业应用中的前沿地位。此次亮相的核心产品涵盖通义千问全域版本、万相...
美团LongCat-Next:把图像、声音、文字都变成Token,然后呢?
LongCat-Next 是美团发布的一项多模态大模型里程碑式成果,其核心在于首次在纯离散框架下实现了与专用连续模型相当的细粒度视觉理解能力。该模型基于 LongCat...
中国第一,全球第三!Token日耗120万亿,直逼谷歌OpenAI
当前,中国AI产业正经历从技术验证到规模落地的关键转折。火山引擎通过豆包大模型2.0与OpenClaw生态协同,构建了面向企业级应用的Agent智能体体系,其中“龙虾...
独家丨前Nothing AI负责人许奇离职创业,要做硬件版输入法
许奇——原Nothing AI负责人、曾任职一加软件产品经理——已离职创业,成立新公司「随心所语」,聚焦AI语音硬件赛道。该企业计划推出硬件版输入法产品,首轮融资...
6小时,200美元,0人类代码:Anthropic把AI编程推过了临界点
Anthropic在最新实验中验证了AI从“生成内容”向“完整项目交付”的跃迁能力。面对“开发一套复古游戏编辑器”的模糊需求,传统单智能体模式仅20分钟产出一个功能不...




