音频生成
音频,audio
蔡浩宇的“AI版米哈游”,预告了一款神秘游戏
米哈游创始人蔡浩宇在离开公司后,于硅谷创立了新公司Anuttacon,并推出了首款AI驱动的游戏《Whispers from the Star》。这款游戏于3月15日发布了首支预告片...
语音模型平台Cartesia获6400万美元,只需3秒克隆语音
语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...
苹果的“传感器战略”,能否将用户拉进未来生活方式?
自2014年苹果发布Apple Watch和2016年推出AirPods以来,苹果在智能穿戴领域的创新一直备受关注。Apple Watch经过十代迭代,已从一款简单的智能手表发展为功能...
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
GRPO训练作为一种基于PPO算法的改进方法,近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式,简化了训练过程,提升了稳定性和可维护...
机器人到来前,智能汽车可能是更早服务人类的 AI Agent
在智能化转型的浪潮下,汽车行业正逐步深入AI领域,探索如何将AI技术与汽车产品深度融合。2025年被视为一个关键节点,众多车企纷纷接入DeepSeek等AI模型,宣...
接入DeepSeek后的自由画布,做PPT还真的有点强。
百度文库最新上线的自由画布功能通过创新的多模态交互设计,显著提升了非演讲类PPT的制作效率。与传统AI工具的单线程问答模式不同,该工具采用白板式界面,支...
当AI遇上心理学:如何让AI的眼神更像人?|AAAI 2025
高瓴人工智能学院宋睿华团队与跨学科研究者合作开发的EyEar技术,成功实现了对人类视听同步场景下注视轨迹的预测。该模型通过结合物理启发的动力系统和多模态...
16G显存4499元起香爆!AMD RX 9070系列显卡震撼发布,游戏、AI性能狂飙
AMD在最新发布会上正式推出基于RDNA 4图形架构的Radeon RX 9000系列显卡,包含RX 9070和RX 9070 XT两款型号。这两款产品均搭载16GB GDDR6显存,配备重新设计...
Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了
Andrej Karpathy发布了一部时长2小时18分钟的教学视频,系统性地解析大型语言模型(LLM)的实践应用方法。该视频以普通用户为对象,聚焦如何通过LLM提升工作...
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...


