两遍端到端语音识别
实质审查的生效
摘要
两遍自动语音识别(ASR)模型能够被用于执行流传输设备上ASR以生成在音频数据中捕获的话语的文本表示。各种实施方式包括ASR模型的用于生成在音频数据中捕获的话语的(多个)流传输候选识别的第一遍部分。例如,该第一遍部分能够包括循环神经网络变换器(RNN‑T)解码器。各种实施方式包括ASR模型的用于修订话语的(多个)流传输候选识别并且生成话语的文本表示的第二遍部分。例如,该第二遍部分能够包括听参加拼写(LAS)解码器。各种实施方式包括在RNN‑T解码器与LAS解码器之间共享的共享编码器。
基本信息
专利标题 :
两遍端到端语音识别
专利标题(英):
暂无
公开(公告)号 :
CN114270434A
申请号 :
CN202080040756.2
公开(公告)日 :
2022-04-01
申请日 :
2020-12-03
授权号 :
暂无
授权日 :
暂无
发明人 :
塔拉·C·赛纳特何彦璋李博阿伦·纳拉亚南庞若鸣安托万·让·布吕盖张硕英李炜
申请人 :
谷歌有限责任公司
申请人地址 :
美国加利福尼亚州
代理机构 :
中原信达知识产权代理有限责任公司
代理人 :
李宝泉
优先权 :
CN202080040756.2
主分类号 :
G10L15/06
IPC分类号 :
G10L15/06 G10L15/16 G10L15/22 G10L15/26
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/06
创建基准模板;训练语音识别系统,例如对说话者声音特征的适应
法律状态
2022-04-19 :
实质审查的生效
IPC(主分类) : G10L 15/06
申请日 : 20201203
申请日 : 20201203
2022-04-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载