音频生成

音频,audio

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI近期发布了一系列新的语音和文本处理模型,包括两个语音转文本(STT)模型和一个文本生成语音(TTS)模型。这些模型通过API提供接入方式,旨在提升语音...

一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

百度在文心一言两周年之际,推出了两款新模型——文心大模型4.5和文心大模型X1,并宣布免费向用户开放。这一消息迅速在海外社交媒体上引发热议,尤其是关于是否...

免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考

百度近日发布了两款大模型——文心4.5和X1,均已上线并免费向用户开放。文心4.5是一款多模态模型,能够对文字、图片、视频、音频等多种内容进行综合解读,其能...

百度周末发布文心4.5和推理模型X1,已经两周年了啊。

百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型,能够理解音频、视频和图片,但不具备输出能力。相比之下,X1是一个推理模...

提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人

百度近日发布了两款全新的大模型——文心大模型 X1 和文心大模型 4.5,标志着其在 AI 领域的进一步突破。这两款模型不仅在功能上各有侧重,还通过技术创新和优...

蔡浩宇的“AI版米哈游”,预告了一款神秘游戏

米哈游创始人蔡浩宇在离开公司后,于硅谷创立了新公司Anuttacon,并推出了首款AI驱动的游戏《Whispers from the Star》。这款游戏于3月15日发布了首支预告片...

语音模型平台Cartesia获6400万美元,只需3秒克隆语音

语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...

苹果的“传感器战略”,能否将用户拉进未来生活方式?

自2014年苹果发布Apple Watch和2016年推出AirPods以来,苹果在智能穿戴领域的创新一直备受关注。Apple Watch经过十代迭代,已从一款简单的智能手表发展为功能...

DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路

GRPO训练作为一种基于PPO算法的改进方法,近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式,简化了训练过程,提升了稳定性和可维护...

机器人到来前,智能汽车可能是更早服务人类的 AI Agent

在智能化转型的浪潮下,汽车行业正逐步深入AI领域,探索如何将AI技术与汽车产品深度融合。2025年被视为一个关键节点,众多车企纷纷接入DeepSeek等AI模型,宣...
1 2 3 4 5 6 40