音频生成
音频,audio
在字节 Coze 里玩了 OpenClaw 和 Skill 后,我看到了新世界的大门。
开发者耗时两小时,完成了一款AI作文处理应用的开发,该应用可接收孩子作文图片,输出针对性写作反馈,生成作文音频文件,并自动将内容保存到Notion,本次开...
Seedance 2.0之后,又一中国视频模型SkyReels-V4登上全球第二
近期中国AIGC领域大模型表现突出,Seedance 2.0凭借卓越性能跻身全球顶尖视频模型行列,昆仑天工SkyReelsV4同步发布,成为视频生成赛道的核心力量。截至2月25...
Artificial Analysis 榜单第二,SkyReels-V4 宣告 AI 视频进入「全栈统一」阶段
在AI视频赛道权威评测平台Artificial Analysis的最新带音频文生视频榜单上,昆仑天工的SkyReels-V4以1090的ELO评分位列全球第二,仅落后第一名3分,Google Ve...
46.5万次盲测封王!Grok视频模型屠榜Arena,谷歌最强对手来了
xAI旗下Grok图像转视频模型grok-image-video-720p以1404分的ELO评分登顶Image-to-Video Arena排行榜,在46.5万次盲测投票中力压包括谷歌Veo 3.1在内的竞品位...
Game over!视频GPT-4o时刻!字节Seedance 2.0引爆全球
字节跳动推出的多模态AI视频生成模型Seedance 2.0引发全球热议,其突破性技术被认为将彻底改变影视内容生产模式。该模型支持文本、图像、视频和音频四模态输...
Runway完成3.15亿美元E轮融资,估值飙升至53亿美元,推动下一代AI世界模型
Runway作为人工智能视频生成领域的初创企业,近期完成了3.15亿美元的E轮融资,估值达到约53亿美元。此次融资由General Atlantic领投,NVIDIA、Adobe Ventures...
马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩
Grok Imagine 1.0正式上线,作为xAI推出的最新视频音频生成模型,其能力覆盖文生视频、图生视频,单次生成时长达10秒,分辨率达720P,并显著提升了音频表现。...
在「今夜科技谈」立春特别版,找回对未来的掌控感
2025年至2026年初,科技领域呈现出加速融合与深度变革的态势。智能眼镜从功能性设备升级为具备端侧算力和助手级交互的“AI-first”产品,形态更轻量化但功能更...
昆仑万维多模态视频生成开源,影音图文全统一
昆仑万维开源的SkyReels-V3通过统一的多模态上下文学习框架,在单一模型中实现了参考图像生成视频、视频持续扩展以及音频驱动的虚拟数字人三大核心功能。该模...
刚刚,创智+模思发布开源版Sora2,电影级音视频同步生成,打破闭源技术垄断
上海创智学院OpenMOSS团队与模思智能联合发布了中国首个高性能开源音视频生成模型MOVA,实现了真正意义上的'音画同出'。该模型能够生成长达8秒、最高720p分辨...







