微软小冰发布古诗词儿歌专辑 听传统与科技的优雅相融 | 都说马蜂窝捅不得 他们却靠它脱贫致富 | 短视频的新故事:如何为1700万视障用户打开一扇窗 | 如何把双11玩high 上优酷每天集能量刷金币 | 同盾“声纹识别建模大赛”落幕 助力智能语音产学研用联合发展 | 百度的5G雄心:开创“互联网+电信”合作与“5G+AI”协同两大模式 | 360企业安全集团入选北京民营企业科技创新百强 | 360手机助手8.0版上线 下载应用同时还能挖矿赚钱 | 同样两个卡口 为什么这种M.2固态硬盘速度不一样? | Mate 20 Pro坐稳2018最强旗舰!外媒称其创意“疯狂” |
 
当前位置: 新闻>滚动>

同盾“声纹识别建模大赛”落幕 助力智能语音产学研用联合发展

发布时间:2018-10-23 07:55:00  |  来源:中国网科学  |  作者:张铭阳  |  责任编辑:科学频道

AI技术正在以各种方式全面渗透入我们的生活。而作为人工智能相关技术中与用户接触最为直接的部分——语音技术也正在通过各种终端硬件潜移默化的改变着我们的生活方式。

10月22日,由同盾科技主办,同盾大学、科赛网承办,得意音通协办的“声纹识别建模大赛”决赛路演正式开幕。通过为期三个多月的层层筛选与比拼,浙江大学的河姆渡团队夺得大赛冠军,南京大学的咖喱棒团队与东南大学的SeuTao团队夺得亚军,北京航空航天大学的HelloKitty团队、厦门大学Cehn团队以及C-baseline团队获得季军。

30万奖金池

英雄榜花落浙大河姆渡团队

路演现场,浙江大学计算机学院人工智能研究所教授、博士生导师、浙江大学计算机学院前院长庄越挺,清华大学教授、清华大学语音和语言技术中心主任、博士生导师郑方,麦子金服副总裁李晓忠,Rokid网络安全部门负责人白嘎力,云之声上海AI Labs负责人李轶杰,同盾科技副总裁、同盾金融科技研究院院长顾威,同盾科技-语音及自然语言实验室负责人燕鹏举,线性资本CEO、合伙人王淮出席担任评委。

image.png

选手们根据现场提问依次对自己的模型方案进行了精彩答辩。评委从方案的技术创新程度、技术关键路径的完整性、技术方案在实际应用中的可行性几个维度进行综合打分,同时结合复赛成绩,最终河姆渡团队获得“一等奖”、赢得8万奖金,咖喱棒团队与SeuTao团队获得“二等奖”、赢得5万奖金, HelloKitty团队、Cehn团队以及C-baseline团队获得“三等奖”、获得2万奖金,来自HelloKitty团队的包梦蛟获得凭借其优秀的声纹识别模型、流利的现场答辩获得“最佳表现奖”。

image.png

此次的冠军团队在比赛中实现了一种端到端的声纹特征学习模型,在网络模型和损失函数方面进行了创新和改进,凭借新的Triplet在线选择方法并定义一种新颖的损失函数获得了专家评委的一直好评。

河姆渡小分队卞腾跃在领奖时表示,此次大赛是团队第一次对于不定类别的识别类问题进行探究,通过比赛得以学习了各种loss function的优缺利弊和适应场景,让团队成员获得更多新想法新思考。

10支队伍同台竞技

成绩超工业一级水平

据了解,本届声纹识别建模大赛于8月1日启动,共吸引了386人报名参赛,成功组建队伍260支,案例提交总数超过2946次。其中近60%参赛人员来自国内顶尖高校在校学生,40%参赛人员为各企业团队和AI极客,近80%的参赛选手拥有研究生及以上学历,堪称是中国声纹识别领域顶级人才的比拼。

大赛全程以一线实战经验为素材,参赛者基于给定的训练数据建立模型,从而可对任给定的两段语音数据,模型输出这两段语音是由同一个人说的概率。大赛的训练数据随机从希尔贝壳中文普通话语音数据库中抽取,数据量与难度随着赛程的推进呈指数增加,评审最终根据EER值来判断分类模型的精确程度,并依据排行榜名单竞选出前十支队伍。

入围决赛的这十支队伍,测评榜成绩平均分达到了0.0052222(成绩越接近0,越接近满分),而第一名的模型精确度高达0.0011111分,已经达到甚至超越声纹识别工业级水平。

产学研联动

共推智能语音发展

目前随着深度学习的引入以及在此基础上派生的各类模型的组合,语音识别准确率得到了大幅度提升,智能音频设备也呈现出多样化和日常化。这些产品虽然大大普及了公众对语音交互的认知和使用,但实际上由于真实场景使用下的复杂、不同设备体积限制对算力的要求等因素,语音产业的发展仍然受技术瓶颈的限制尚处在起步阶段,业界依然共同面临许多技术难题。

“同盾推动声纹识别建模大赛,与我们自身战略是高度统一的。本届大赛正是同盾科技联合社会各界对智能语音领域人才挖掘、人才培育、人才输出的一次新模式的探索。”同盾科技副总裁、同盾金融科技研究院院长顾威表示,通过本次大赛,同盾希望能够为年轻选手提供一个竞争和成长的舞台,激发大家无限的创造力和想象力,共同探索技术创新的各种路径。同时,结合同盾在商业应用上的优势,推动大赛成果的产业落地。

作为国内智能风控和分析决策服务提供商,同盾科技也已开启了智能语音的战略布局。近来,同盾陆续与浙江大学、西北工业大学达成合作,组建了人工智能实验室及智能语音技术联合实验室,希望通过产学研结合的方式搭建一个智能语音领域高端人才的培养阵地和科技成果转化基地,共同探索语音技术在智能客服、智能翻译、信息安全、身份认证、智能催收以及智能安防等领域的应用空间。

此前,同盾已将智能语音技术应用到金融行业,创新研发了逾期管家和逾期精灵两款产品,通过智能语音识别、语音合成、语义理解以及交互话术共同形成高度智能化、精准化的催收策略,解决金融机构催收业务的合规、合法、效率等问题。

未来,同盾科技将持续在科研攻关、理论创新、人才培养、商业应用等层面进行深度布局和探索,在强化自主创新的同时,同盾也持续撬动产业链上下游的资源,优势互补形成协同效应,不断突破语音技术在更多场景的应用落地,推动中国智能语音技术取得突破性进展。(作者:张铭阳)