中关村科金荣获VoxSRC 2021国际声纹识别竞赛双赛道亚军

2021-09-16 388
摘要: 近日,北京中关村科金技术有限公司(简称“中关村科金”)与西北工业大学音频、语音与语言处理研究组(以下称ASLP@NPU)组成的参赛队伍,荣获国际权威声纹识别赛事VoxSRC2021的Trick1和Trick2两个赛道双榜第二名,表明中关村科金声纹识别技术达到国际领先水平。 据了解,该奖项是全球语音领域顶尖会议interspeech2021

近日,北京中关村科金技术有限公司(简称“中关村科金”)与西北工业大学音频、语音与语言处理研究组(以下称ASLP@NPU)组成的参赛队伍,荣获国际权威声纹识别赛事VoxSRC2021的Trick1和Trick2两个赛道双榜第二名,表明中关村科金声纹识别技术达到国际领先水平。

据了解,该奖项是全球语音领域顶尖会议interspeech2021的特别竞赛,由牛津大学、麻省理工学院林肯实验室、斯坦福语音技术研究实验室、韩国Naver等全球顶尖高校和学术机构联合举办。此次竞赛高手云集,包括美国约翰霍普金斯大学、微软研究院、思必驰、字节跳动、国音智能、搜狗、美团等国内外一流高校、研究机构及企业。

声纹识别是指通过人工智能技术识别两段语音是否为同一人。目前声纹识别广泛应用在金融质检、安防、刑侦等领域,关系到用户隐私和安全问题。在应用的过程中,声纹识别跨域问题、复杂音频环境问题为各行各业提出了严峻的挑战。如何在应用中,有效降低跨域对声纹识别的干扰、提升声纹识别在复杂音频环境下的识别准确性能,成为了整个行业共同关心的课题。

本次竞赛中,中关村科金使用基于深度学习的声纹识别技术,参加Trick1和Trick2两个赛道的比赛。两赛道均为文本无关声纹识别任务。其中,Trick1采用指定的Voxceleb2 dev作为训练集,Track2则可使用测试集之外任何开放数据作为训练集。比赛最大挑战是需要进行跨语言及复杂环境下的声纹识别。中关村科金通过探索新的数据增广方案,改进声纹识别算法,优化训练损失函数,并融合多个SOTA行业领先模型,显著提升了声纹识别在跨语言和复杂环境的鲁棒性以及识别准确率,从而获得两个赛道的亚军。

作为国内领先的人工智能科技公司,中关村科金长期在声纹识别技术领域进行研发投入,基于海量预训练模型以及AI算法助力,在声纹识别公开数据评测中,识别准确率超过99.7,广泛应用于客服、催收、投诉等场景,为保护用户隐私和数据安全、保障数字经济健康发展提供先进的科技力量支撑。

依托强大的AI算法能力和声纹识别技术,中关村科金助力银行、保险、证券、信托、教育、医疗、智能制造等行业客户实现安全、高效的数字化升级。目前,已为数百家知名行业机构、企业合作提供智能化转型解决方案,在服务企业数字化转型、实现低碳绿色发展方面处于行业领先地位。


最新文章