首页 > 新闻 > 滚动 > 正文

科技赋能冬奥,科大讯飞核心创新技术应用冬奥现场

2022-02-23 16:41:13来源:壹点网  

 

赛事成绩多语种呈现,人们跨越语言沟通障碍顺畅交流,视障人士可以“听见”文字,听障人士可以“看见”文字……在刚刚闭幕的北京2022年冬奥会上,作为官方自动语音转换与翻译独家供应商的科大讯飞,提供了自动翻译和相关的语音转换、语音识别及语音合成等硬核技术,助力实现赛场内外的沟通交流无障碍,一个沟通无障碍奥运会如约呈现。

北京冬奥会与科大讯飞可谓是“一拍即合”,前者汇聚世界不同国家、不同语言的人群,后者具有面向冬奥场景的多语音、多语言处理关键技术。早在2019年,科大讯飞就组建了北京2022年冬奥会和冬残奥会示范应用专项团队,借助先进的机器翻译和多语言语音转换技术,围绕“人和人之间沟通无障碍、人和组织之间沟通无障碍、人和赛事之间沟通无障碍”三大方向,加速应用场景落地。

基于智能语音新一代人工智能开放创新平台,科大讯飞研发定制了具有冬奥特征的多语种语音及语言服务平台,可提供面向冬奥场景定制优化的语音识别、语音合成、机器翻译、自动问答等多种核心能力。达成60个语种语音合成,69个语种语音识别,168个语种机器翻译和3个语种的交互理解,覆盖面超过全球超200个国家和地区,同时还能识别内容进行文本书面化处理。而机器领域的突破,可支持168种语言的机器翻译;自动问答的多

语种信息获取及交互技术,可支持中、英、日等3种语言的交互理解。

语言是一门艺术、一种智慧,也是促进世界相知相融的重要工具。北京2022年冬奥会和冬残奥会上,科大讯飞担纲官方自动语音转换与翻译独家供应商,是科技发展的大势所趋,也是自身核心技术发展的水到渠成。然而,由于自动语音转换与翻译涉及技术众多,难度和挑战非常大,科大讯飞在为赛事提供技术支持的过程中,也遇到了不少难点。

在多语种语音语言技术研发领域,由于涉及60多个语种的语音识别合成翻译等技术研发,除了中英文之外,针对其他语种(比如瑞典语、波兰语等)语料比较少的问题,通过源头核心技术创新,在端到端建模和无监督、弱监督训练方面取得重大突破,例如在多语种语音识别方面,100小时有监督数据加上大量无标签语音和文本数据可以达到1万小时有监督训练的效果。这项技术也在OpenASR国际低资源多语种语音识别挑战赛的15个语种受限赛道和7个语种非受限赛道系统,全部取得第一名的成绩。

在语音同传技术实时性和效果的平衡上,我们知道,同传要解决两个问题,第一是要将语音识别转写出来,第二是将转写的内容翻译出来,以前这两个任务是单独建模先后完成的,现在我们提出“流式的CAAT语音翻译框架”模型,在一个模型内解决这两个问题,从而实现同传效果的“又快又好”。这些技术创新,对于保障冬奥场景下的语音同传应用效果起到非常关键的作用。

在多语种自动问答中,融合了数字人生成、语音识别、语音合成、自然语言理解等多项技术,并结合FAQ问答、文档集合问答、知识库问答和基于文本蕴含识别的多源答案验证等技术进行知识库构建,最终实现人们可以和冬奥虚拟志愿者“爱加”用六种语言自由互动交流。

讲好中国故事、传递中国声音,科大讯飞自创建以来始终致力于语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究,在行业发展史上树立了从“能听会说”到“能理解会思考”的关键里程碑。此次担当北京2022冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,科大讯飞更是不断攻坚克难,突破了多语种语音语言技术的研发、语音同传技术实时性和效果的平衡、多语种智能(自动)问答三大技术难题,让多语种交流、同传又准、又好、又快,真正实现了交流无国界、沟通无障碍。让我们一起,为中国技术实力点赞!

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签: 技术应用

责任编辑:hnmd003

相关阅读

资讯播报

推荐阅读