标签:语音识别
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
模思智能发布的多说话人自动语音识别模型MOSS-Transcribe-Diarize在语音识别与分析领域取得突破性进展。该模型由复旦邱锡鹏团队研发,能够同时完成语音转文字...
这款让丁磊都紧张的游戏,上新AI大模型玩法
巨人网络在《超自然行动组》中推出全新“AI大模型挑战”,标志着AI技术从辅助角色正式升级为游戏核心玩法参与者。该玩法是国内首个在大DAU(高日活用户)游戏中...
千人千面的真人级AI名师,劈开教育「不可能三角」
教育行业长期面临规模、质量与成本难以兼顾的困境,而「与爱为舞」公司开发的AI导师系统通过技术创新实现了突破。该系统已服务百万级用户,其核心在于将通用...
智谱重磅三箭齐发:从看懂世界到操作手机,千亿模型上云、手机智能体入袋、语音输入重构
AutoGLM是首个具备真机操作能力的AI智能体,实现了让AI像人一样操作手机完成任务的愿景。经过32个月的探索,团队构建了Phone Use能力框架,模型学会了将自然...
横评近期很火爆的三款 AI 录音卡,发现它们确实有点东西
2025年智能AI硬件领域出现全新形态产品——AI录音卡,这类名片大小的设备通过磁吸方式附着于手机背部,集成录音、转写、总结等功能。当前市场主流的三款产品(...
AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金
2025年下半年,输入法赛道因大模型技术的爆发迎来新一轮竞争热潮。国内外厂商密集发布新产品:字节的豆包输入法结束内测正式上线,微信输入法持续迭代AI功能...
中国AI Agent产业化参考范本:斑马口语攻克的四大技术难关
2025年AI产业的关键转折点在于从通用探索转向垂直场景的深度落地。以斑马推出的「斑马口语」为例,这款针对6-12岁儿童的AI外教一对一产品,突破了技术瓶颈,...
识别1600+种人类语言,支持少样本扩展到5400+种语言,Meta自动语音识别模型开源
Meta AI发布的Omnilingual ASR技术标志着自动语音识别领域的重大突破。该系统首次实现对1600多种语言的转录能力,其中500多种语言是历史上首次被AI系统记录。...
腾讯这款现象级 AI,又上新模板了
腾讯会议近期推出的'学霸笔记'AI纪要模板引发广泛关注。这一功能通过AI技术对会议或知识分享内容进行深度理解和逻辑梳理,而非简单的语音转写。在知识类场景...
麻省理工AI放王炸!无需说话、秒懂你的想法,外挂AI大脑来了
麻省理工学院分享的突破性研究Alterego,是一款非侵入式可穿戴无声语音交互AI设备,核心是捕捉神经肌肉信号实现无声沟通。当用户内心发声时,大脑向发声系统...




