标签:语音交互
Jony Ive 操刀设计、下半年问世,OpenAI 的第一款硬件是款 AI 耳机?
关于OpenAI计划推出首款消费级硬件设备的传闻持续引发关注。这款代号为“Sweet Pea”的产品预计于2026年下半年面世,其核心定位并非传统智能音箱或AR眼镜,而是...
是别针还是耳机?OpenAI首款AI硬件形态成谜
OpenAI正加速推进商业化进程,首款AI硬件设备预计将于2024年下半年面世。在达沃斯论坛上,首席全球事务官克里斯·莱恩透露设备开发是公司年度重点,但未披露具...
有人提前五年,预判了 OpenAI 的预判。
Sam Altman在访谈中将现代手机使用体验比作置身纽约时代广场,充斥着各种干扰和注意力争夺。他认为当前手机形态本质上是一个不断打断用户的设备,每个应用都...
估值 7 亿美元的 AI 语音输入产品:语音输入的关键问题是听写,不是转录
键盘作为人机交互的核心工具,长期以来被视为一种过渡性的“输入输出瓶颈”。在“后键盘时代”,语音交互正逐渐成为更自然的沟通方式。Wispr Flow创始人Tanay Kot...
小红书发布FireRedChat:首个可私有化部署的全双工大模型语音交互系统
小红书智创音频团队推出的FireRedChat系统是业内首个支持私有化部署的全双工大模型语音交互解决方案,通过自研核心技术解决了传统语音交互中延迟高、噪声敏感...
字节的豆包居然有了自己的IP宇宙
豆包APP作为字节跳动旗下的AI产品,凭借其强大的技术背景和推广资源,逐渐在市场中崭露头角。最初,豆包被视为一个了解字节最新模型进展的窗口,但随着用户互...
AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑
过去半年,AI语音领域迎来了密集的融资热潮,多家初创公司获得了大额投资,推动了这一赛道的快速发展。例如,Wispr Flow、Cartesia和ElevenLabs等公司分别完...
语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%
百度最近为文小言接入了基于Cross-Attention的端到端语音语言大模型,实现了更自然、有情感的实时语音对话功能。这个全新的技术方案在用户体验上带来了显著提...
三年狂飙!「AIGC第一股」纯软件营收产品交付破2.2亿,暴增88.5%跑通全球
出门问问2024年度业绩报告显示,集团在生成式AI(AIGC)领域的纯软件产品收入突破2.2亿元,同比增长88.5%,驱动总收入达到3.9亿元。这一增长主要得益于集团从...
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话
DeepSeek开口说话了,并且实现了超低延迟实时秒回,用户可以随时打断对话。这一突破性进展得益于声网推出的对话式AI引擎,该引擎不仅价格低廉,每分钟仅需0.0...





