全国统一服务热线: 4006-855-333

Alexa AI科学家通过半监督学习将语音识别错误降低了22%

2019年08月08日        先锋官网
亚马逊的Alexa Speech团队科学家今天宣布,他们已经使用了他们认为有史以来最大的无标签数据集之一,用于训练声学模型并提高智能助理理解人声的能力。

使用半监督学习,一种结合人和机器标记用于训练AI模型的数据的方法,亚马逊科学家能够训练模型并将语音识别错误率降低10-22%,而单纯依靠监督的方法学习。在噪声较大的音频中可以看到语音识别错误减少的更大收益。
声学模型用7,000小时的标记数据训练,然后用100万小时的未注释或未标记的数据训练。声学模型是一系列AI系统之一,它为自动语音识别提供动力,将语音命令转换为计算机的动作。
“我们目前正在努力将新模型整合到Alexa中,预计发布日期为今年晚些时候,”Alexa高级应用科学家Hari Parthasarathi在一篇博文中表示。

这项工作将于下个月在英国布莱顿举行的IEEE国际声学,语音和信号处理会议上发表。

Alexa理解人声的能力的这些进步是通过使用称为师生培训的长短期记忆(LSTM)网络的方法实现的。“老师”经过培训,可以理解30毫秒的音频块,然后将一些理解传递给使用未标记数据的“学生”网络。

应用了许多其他技术来优化或加速模型训练,例如分析学生模型音频一次而不是两次,交错或混合两种模型,并在训练期间仅存储20种概率最高的教师模型输出,而不是结果分为3,000个不同的集群。然后,学生模型必须尝试准确匹配尽可能多的20个概率。

“7,000小时的注释数据比机器标记的数据更准确,因此在训练学生时,我们将两者交错。我们的直觉是,如果机器标记的数据开始以错误的方向引导模型,注释的数据可以提供路线校正,“帖子读取。

今天的新闻是在2月份宣布将语音识别错误率降低20%与其他半监督学习方法,以及使双麦克风阵列比七麦克风阵列更有效的进展,本周早些时候宣布。

上一篇:产业联盟揭开盖头 探索人工智能行业发展新模式 下一篇:先锋音讯应邀参加  2019第四届上海国际人工智能展览会暨人工智能产业大会
新闻中心
先锋音讯应邀参加  2019第四届上海国际人工智能展览会暨人工智能产业大会
未经对方同意的必威体育手机版本,有法律效力吗?!
滴滴:行程必威体育手机版本已覆盖所有订单 录像年底覆盖50%
先锋音讯浅谈云必威体育手机版本系统应如何架构?
解码腾讯优图人工智能:为落地而战!
德勤:2025年全球人工智能市场规模将超6万亿美元,复合增长率达30%
人工智能大会专题|看懂2019世界人工智能大会,“预见”未来
2019世界人工智能大会在沪开幕 李强出席并致辞
重磅!平安人寿推出AI视频机器人!
2019世界人工智能大会 AI赋能未来金融
行业定制开发解决方案
公安系统云通讯数据解决方案
监狱管理云通讯数据解决方案
电力调度云通讯数据解决方案
武警军队云通讯数据解决方案
金融理财云通讯数据解决方案
电子商务云通讯数据解决方案
证券服务云通讯数据解决方案
航运调度云通讯数据解决方案
税务监督云通讯数据解决方案
保险行业云通讯数据解决方案
销售服务中心
全国统一销售热线:
4006-855-333
下班及节假日业务咨询热线:
13581829597 (李小姐)
15321719818(李小姐)
15110089706 (何小姐)
技术服务中心
全国统一技术热线:
4008-158-111
7X24小时技术服务热线:
18310479300(杨先生)
15901455758(张先生)
13522882101(商先生)
13522649022(陈先生)
18201150332(李先生)
技术监督电话
13521701318(赵工)
关于我们
QQ技术支持
陈工程师
商工程师
张工程师
杨工程师
李工程师