音频生成
音频,audio
Jony Ive 操刀设计、下半年问世,OpenAI 的第一款硬件是款 AI 耳机?
关于OpenAI计划推出首款消费级硬件设备的传闻持续引发关注。这款代号为“Sweet Pea”的产品预计于2026年下半年面世,其核心定位并非传统智能音箱或AR眼镜,而是...
2.4万亿参数“最强文科生”,文心5.0正式版,你挺懂山东人啊?
文心大模型5.0正式版的发布标志着国产AI技术进入全球第一梯队。参数量高达2.4万亿的原生全模态架构使其在语言、视觉、音频等多领域展现出卓越性能。LMArena竞...
成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??
SeaArt作为全球领先的AI创作社区平台,凭借其独特的定位和功能吸引了大量用户。该平台月访问量超过3000万,注册用户超过5000万,单日生成内容高达2000万张图...
是别针还是耳机?OpenAI首款AI硬件形态成谜
OpenAI正加速推进商业化进程,首款AI硬件设备预计将于2024年下半年面世。在达沃斯论坛上,首席全球事务官克里斯·莱恩透露设备开发是公司年度重点,但未披露具...
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
模思智能发布的多说话人自动语音识别模型MOSS-Transcribe-Diarize在语音识别与分析领域取得突破性进展。该模型由复旦邱锡鹏团队研发,能够同时完成语音转文字...
好的AI硬件都是“为创始人自己做的”|硅谷对话Omi,Looki和Bondu
硅谷与中国AI硬件创业公司Omi、Looki和Bondu的创始人在GenAI Assembling Meetup上展开了一场关于AI硬件未来的深度对话。这些公司虽然产品形态各异,但都聚焦...
3 个月达成 5 亿平台播放量,Wispr Flow 分享如何做好红人营销
Wispr Flow作为语音输入领域的代表性产品,其增长策略与运营模式展现出独特亮点。用户数据表现尤为突出:年环比多个月份增速超50%,付费转化率约20%,活跃用...
有人提前五年,预判了 OpenAI 的预判。
Sam Altman在访谈中将现代手机使用体验比作置身纽约时代广场,充斥着各种干扰和注意力争夺。他认为当前手机形态本质上是一个不断打断用户的设备,每个应用都...
火爆全网的《卢浮宫小猫》AI视频万字创作心得分享,这可能是他们最毫无保留的一次。
数字艺术家海辛和阿文在直播中详细分享了他们为浦东美术馆创作的AI视频作品《卢浮宫小猫》的全流程制作经验。作为曾创作过《故宫猫上班记》《文明小猫游浦东...
顶级视频模型半衰期只有 30 天,但生成式媒体 infra 公司的收入却在一年增长了 60 倍
在生成式媒体领域,算力需求呈现出指数级增长的特点。处理一个大型语言模型(LLM)的单个Prompt(约200 Token)所需的算力若定义为1个单位,生成一张高质量图...






