音频生成

音频,audio

一年卖超 500 万副耳机的韶音,杀入「AI 眼镜」赛道

韶音在CES 2025后宣布入局智能眼镜市场,展示了其第一代智能眼镜工程样机,标志着这家国内蓝牙耳机龙头企业的业务范围进一步扩展。韶音在开放式耳机领域保持...

端侧 GPT-4o来了! 面壁发布全新端侧模型,全模态、端到端,支持实时流式音视频通话!

面壁智能最近发布了全新一代小钢炮MiniCPM-o 2.6,这是一款端到端模型,参数规模为8B,在视觉、语音和多模态方面与GPT-4o-202405性能相当。MiniCPM-o 2.6支持...

全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑

面壁智能最新推出的AI模型MiniCPM-o 2.6因其在多模态能力上的卓越表现而受到广泛关注。该模型仅8B的体量,就能在多模态任务中与GPT-4o相媲美,且能在iPad等移...

CES提前上演百镜大战,AI眼镜这2个方向4大技术最火

在2025年的CES展会上,AI眼镜成为了备受瞩目的焦点,尤其是中国品牌的表现尤为突出。AI眼镜产品主要分为AI拍摄眼镜和AI+AR眼镜两大类,其中Halliday Glasses...

商汤破解世界模型秘诀,「日日新」实现AI大一统!原生融合模型破纪录双冠王

商汤科技在人工智能领域取得了重大突破,推出了「日日新」原生融合大模型,实现了多模态融合,标志着AI从大语言模型和多模态模型分立的现状迈向了「大一统」...

RAG 的未来,走向繁荣、重塑还是消亡?

检索增强生成(RAG)技术通过整合外部知识库与生成模型,提升了内容生成的时效性和准确性,降低了幻觉率,对多个行业产生了显著影响。然而,在企业实际应用中...

一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」

AI领域的发展日新月异,为了成为AI工程专家,更新论文清单至关重要。目前AI工程技术可分为十个领域,每个领域都有其代表作和相关工作。在前沿大模型领域,Ope...

雷鸟V3,可能是 Meta 智能眼镜史上最有竞争力的挑战者

在CES 2025上,雷鸟创新发布了RayNeo V3 AI拍摄眼镜,挑战海外品牌Meta的智能眼镜。V3是雷鸟首款不带有显示功能的产品,主打AI拍摄功能。为了实现“无感佩戴”...

机器人ChatGPT时刻!英伟达开源世界大模型,完美模拟物理世界!

NVIDIA在2025年CES展会上开源了NVIDIA Cosmos,这是一个全新的世界大模型,旨在从数据整合、训练到定制开发阶段,为大规模模拟和构建物理世界的基础模型提供...

AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

在LLM技术应用领域,医疗行业尤其是AI scribe产品展现出较高的应用确定性,有效解决了临床文档记录的痛点。Abridge公司凭借其专用于临床文档的ASR和文本生成...
1 17 18 19 20 21 50