六问讯飞 AI:新品耳机发布背后,如何理解讯飞 AI 翻译战略与技术创新?

AIGC动态4小时前发布 ai-front
43 0 0
六问讯飞 AI:新品耳机发布背后,如何理解讯飞 AI 翻译战略与技术创新?

 

文章摘要


【关 键 词】 AI翻译技术升级新品发布全球化多语种

科大讯飞在上海和迪拜同步举行发布会,展示其AI翻译技术的最新进展,重点包括同传大模型技术升级、AI翻译耳机新品发布以及双屏翻译机2.0的功能升级。中英同传效果优化后,翻译主观体验提升至4.6分(满分5分),首字响应时间降低至2秒。专业词库扩充至10万以上,覆盖医疗、金融、法律等高壁垒行业,新增中英到阿拉伯语、西班牙语的端到端同传互译功能,并引入“声音复刻”功能,用户仅需一句话语音样本即可用自身音色播报翻译结果。

新一代讯飞AI翻译耳机搭载“多感融合AI降噪系统”,采用骨导与气导结合的开放式设计,支持60种语言同传互译,内置10万以上专业词库,中英同传首响播报延迟低至2秒。耳机覆盖通话实时翻译、面对面翻译、线上同传和旁听同传四大核心场景,同时集成语音助手功能,支持口语陪练、资讯查询等服务。讯飞双屏翻译机2.0新增讲话人分离功能,可智能区分讲话人并支持自定义名称,结合星火办公大模型,新增会议纪要生成与内容分享功能。

国际权威咨询机构IDC最新报告显示,科大讯飞在AI翻译速度、效果、专业度等8大核心维度中排名第一,其中6项获得满分。科大讯飞副总裁赵翔表示,全球化交流的深化趋势是AI翻译战略的核心背景,讯飞已形成“语音识别-翻译-语音合成-端侧产品”的完整技术链条。战略定位围绕夯实基础技术、聚焦场景做深做精、全产品矩阵一体化展开,构建从轻量级软件到标准化硬件再到软硬件一体解决方案的全链条产品矩阵。

讯飞大模型战略核心是“自主研发+场景落地”,基于自主芯片与国产化硬件,致力于打造多语种能力突出的模型,并与教育、医疗、翻译等行业场景深度融合。赵翔强调,讯飞坚持自主研发大模型,是因为在开源模型上微调难以达到国际领先水平。讯飞在语音翻译领域的优势源于20多年的技术积累,从底层语音识别、语音合成到中间的语音翻译算法,整个技术链条持续迭代。多语种和方言的长期投入构成竞争壁垒,大模型的迁移学习能力大幅减少新语种拓展所需的标注数据量。

AI翻译耳机在降噪方面的创新包括全球首创的“多感融合能源降噪”,配备2个数字硅麦克风和1个骨传导麦克风,基于讯飞自研的降噪算法,在地铁、酒会等嘈杂场景下仍能清晰拾音。科大讯飞翻译耳机总经理林会杰表示,复杂的算法全离线运行,通过模型芯片化将复杂模型压缩至几十KB大小,保障翻译质量。新品战略创新核心是“场景化定制+全产品协同”,与讯飞的其他翻译产品数据打通,形成闭环优化。

方言和小语种翻译是语音翻译深度应用的核心难题,讯飞的解决方案包括长期投入“苦活”和技术创新。已覆盖全国202个地市级方言,支持101个语种的识别和55个语种的合成。采用多语种共享建模关键技术,设计多语种通用音素体系和基本语言单元,显著提升小语种语音系统性能。

讯飞硬件产品在AI翻译战略中扮演重要角色,是“技术+硬件+场景”的融合,覆盖全场景并与软件、云平台数据打通。随着“一带一路”推进和中国企业出海潮,跨国商务沟通对即时、准确、便携的翻译工具需求激增。讯飞翻译产品已在机场接待、外事会议等场景落地,双屏翻译机2.0针对高要求场景做了双屏设计、多语种支持、降噪与收音优化等关键适配,具备离线模式,适配高保密场景。

原文和模型


【原文链接】 阅读原文 [ 3277字 | 14分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...