音频生成

音频,audio

潘乱对谈小宇宙 CEO Kyth:播客是在饱和时代,提供稀缺价值

中文播客在过去两年中经历了快速的发展,越来越多的明星、喜剧演员、品牌机构和企业家投资人参与其中,内容覆盖影视、科技、商业等多个领域。在极客公园IF202...

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

斯坦福大学的研究团队在多模态语言模型领域取得了新进展,提出了一种能够同时处理语音、文本和动作生成任务的模型。该模型能够理解并生成富有表现力的人类动...

重磅!OpenAI开放满血o1模型API,成本暴降60%

OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...

OpenAI狂打“骨折价”的一天:暴降成本开放全新o1,实时 API 全面降价 60%

近期,OpenAI和谷歌在人工智能领域展开了激烈的竞争。OpenAI推出了一系列针对开发者的新功能和升级,包括API中的OpenAI o1模型,该模型支持函数调用、开发人...

突破性功能!OpenAI发布ChatGPT Projects,万能工具箱上线!

OpenAI在技术直播中推出了ChatGPT Projects,标志着ChatGPT从单一AI对话工具转变为高效率协作平台。Projects集成了文件与指令上传、自定义对话、Canvas、网络...

细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新

MiniMax近期推出了图生视频模型I2V-01-Live,专门优化了二次元效果,能够将静态二次元图片转化为流畅自然的动态视频,标志着其正式进入动漫领域。这一新模型...

谷歌发布Gemini2.0,开启Agent新时代

谷歌近日发布了其最新的AI模型Gemini 2.0,标志着公司在AI领域的重大进步。Gemini 2.0是首个实现原生多模态输入输出的模型,性能全面升级,速度是前代1.5 Pro...

OpenAI版Her登场,GPT能实时视频通话了!德扑AI之父:比 o1“更受宠”的模式降临

OpenAI最近推出了高级语音模式的新功能,包括实时视频通话、屏幕共享和图像上传,这些功能将在未来几天内向所有Team用户以及大多数ChatGPT Plus和Pro用户推出...

谷歌发布Geimini2.0,开启Agent新时代

谷歌近期发布了其最新的AI模型Gemini2.0,标志着公司在AI领域的重大进步。Gemini2.0是首个实现原生多模态输入输出的模型,性能全面升级,速度是前代1.5 Pro的...

OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1

谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...
1 19 20 21 22 23 50