音频生成

音频,audio

OpenClaw 3.12来了:UI大翻新,模型提速,更耐造更安全

OpenClaw 近期连续发布 2026.3.11 与 2026.3.12 两个版本,聚焦实际业务场景中的稳定性与易用性提升。Control UI 经历 V2 级重构,采用模块化设计,将概览、...

全球首个!国产AI捅破AI漫剧天花板,狼王不变哈士奇,30个分镜连播

生数科技发布的Vidu Q3模型AI漫剧解决方案,聚焦漫剧生产中的核心痛点,提出从底层算法到产品设计均专为漫剧全链路工作流定制的技术路径。该方案并非影视模型...

3亿美元巨额融资,AI视频新独角兽爱诗科技,正在抢跑「实时世界模型」

爱诗科技作为成立不到三年的中国AI视频创业公司,近期完成3亿美元C轮融资,创下国内该赛道单笔融资纪录,累计融资近30亿元人民币,跻身独角兽行列。本轮投资方...

AI的七窍打通了!谷歌发布Gemini Embedding 2原生多模态嵌入模型

谷歌正式发布了名为 Gemini Embedding 2 的新型基础架构,实现了 AI 像人类一样用五种感官同步感知世界。这个系统将文字、图像、视频、音频和文档数据全部整...

谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌正式发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,该模型能够将文本、图像、音视频及 PDF 文档无损融合于统一向量空间。这一突破性进展实现...

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

谷歌发布了首款原生多模态嵌入模型 Gemini Embedding 2。该模型的核心突破在于将文本、图像、视频、音频及文档等多种数据类型映射至同一个统一的嵌入空间。不...

在字节 Coze 里玩了 OpenClaw 和 Skill 后,我看到了新世界的大门。

开发者耗时两小时,完成了一款AI作文处理应用的开发,该应用可接收孩子作文图片,输出针对性写作反馈,生成作文音频文件,并自动将内容保存到Notion,本次开...

Seedance 2.0之后,又一中国视频模型SkyReels-V4登上全球第二

近期中国AIGC领域大模型表现突出,Seedance 2.0凭借卓越性能跻身全球顶尖视频模型行列,昆仑天工SkyReelsV4同步发布,成为视频生成赛道的核心力量。截至2月25...

Artificial Analysis 榜单第二,SkyReels-V4 宣告 AI 视频进入「全栈统一」阶段

在AI视频赛道权威评测平台Artificial Analysis的最新带音频文生视频榜单上,昆仑天工的SkyReels-V4以1090的ELO评分位列全球第二,仅落后第一名3分,Google Ve...

46.5万次盲测封王!Grok视频模型屠榜Arena,谷歌最强对手来了

xAI旗下Grok图像转视频模型grok-image-video-720p以1404分的ELO评分登顶Image-to-Video Arena排行榜,在46.5万次盲测投票中力压包括谷歌Veo 3.1在内的竞品位...
1 2 3 4 5 6 60