音频生成

音频,audio

大模型一定就比小模型好?谷歌的这项研究说不一定

Google Research的一个团队近期对隐扩散模型(LDM)进行了大量实验研究,发现在预算有限的情况下,更大的模型并不总是更好。他们的研究成果发表在论文《Bigge...

微软推出VASA-1:可生成会说话的,动态人物视频

本文介绍了微软亚洲研究院推出的VASA-1,这是一个能够通过输入一张图片和一段音频生成表情丰富、细节逼真的动态人物视频的模型。根据演示效果,VASA-1能够以4...

4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI

随着中国加速研发AI大模型技术,追赶美国,如今已迎来新的节点。北京时间4月18日,Meta推出了新版开源大模型Llama 3,并推出了8B和70B的预训练和指令微调版本...

直播网友AI写歌征婚,实测最新登榜音乐SOTA模型:免费无限次,一键生成

金磊在凹非寺的文章介绍了国内首个AI音乐生成大模型——天工SkyMusic。这款产品由昆仑万维开发,能够根据用户提供的歌词和参考曲目生成音乐。文章首先通过实验...

重磅!Llama-3,最强开源大模型正式发布!

4月19日,Meta在官网发布了开源大模型Llama-3,包括80亿和700亿两种参数版本,分为基础预训练和指令微调两种模型。相比Llama-2,Llama-3使用了15T tokens的训...

从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型

昆仑万维近日发布了全球最大规模的开源MOE大模型「天工3.0」,并基于此打造了国内首个公开可用的AI音乐生成大模型「天工SkyMusic」。这款音乐大模型在多个性...

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

昆仑万维在其大模型“天工”的一周年之际,宣布了“天工 3.0”基座大模型和“天工 SkyMusic”音乐大模型的公测。这一进展标志着人工智能在音乐创作领域的又一重要里...

中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

市场规模与增长预测中国AIGC应用市场正在迅速扩张,预计2024年市场规模将达到200亿人民币,而到2030年,市场规模有望达到万亿级别。这一增长得益于AIGC技术的...

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

2023年,人工智能技术的发展速度达到了前所未有的水平,斯坦福HAI研究所发布的第七个年度AI Index报告为我们提供了一个全面的行业现状概览。报告强调了大型语...

DeepMind前员工创立的AI公司发布新模型,能理解音频与视频,推理性能超过Gemini

Reka是一家总部位于旧金山的AI初创公司,由来自DeepMind、Google和Meta的研究人员联合创立,最近推出了一款名为Reka Core的全新多模态语言模型。这款模型被誉...
1 2 3 12