强化小微企业数据安全防护,畅捷通T+Cloud专属云普及版发布会亮点抢先看! | 校企局多元融合 助力提升涉虚拟币跨境赌博打击治理新质公安战斗力 | 现场直击丨“荷美疆南·玉润丝路”荷花节暨冰川玉藕粉新品发布会圆满成功 | GenAI安全成关注焦点!专业Bot管理厂商瑞数信息获Gartner投资推荐 | 67岁农技达人跑遍全国为果树“问诊”抖音走红,获央视点赞 | 新质生产力革新,杰克科技“过梗王”包缝机亮相 | 第十六届中国国际机床工具展览会(CIMES 2024)盛大开幕 | 汇聚众多行业领军药企,生命科学行业峰会盛大召开! | 奖金50万!新“智”慧全国AI数字创意大赛邀你来战! | 百度王海峰:规模定律未来几年仍有效 |
 
当前位置: 前沿科技>科技生活>

首个支持30种方言混说语音大模型亮相

发布时间:2024-06-17 16:56:14  |  来源:科技日报  |  作者:  |  责任编辑:科学频道

记者6月16日获悉,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持方言种类最多的语音识别大模型。

基于几亿用户和丰富应用场景优势,中国电信人工智能研究院构建了超30种、超30万小时的高质量方言数据库,推出星辰超多方言语音识别大模型。研发团队通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持方言种类最多、覆盖人口最多的语音大模型。

团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。星辰超多方言语音识别大模型也是业内首个开源的基于离散语音表征的语音识别大模型,将推理时语音传输比特率降低数十倍。

据悉,星辰超多方言语音识别大模型已在福建、江西、广西等地的智能客服试点应用。接入大模型后,智能客服能秒懂30种方言,日均处理约200万通电话。星辰超多方言语音识别大模型还落地多地市12345平台,为客服人员赋能,提升沟通效率,助力政务工作智能化升级。