两遍端到端语音识别

实质审查的生效

摘要

两遍自动语音识别(ASR)模型能够被用于执行流传输设备上ASR以生成在音频数据中捕获的话语的文本表示。各种实施方式包括ASR模型的用于生成在音频数据中捕获的话语的(多个)流传输候选识别的第一遍部分。例如，该第一遍部分能够包括循环神经网络变换器(RNN‑T)解码器。各种实施方式包括ASR模型的用于修订话语的(多个)流传输候选识别并且生成话语的文本表示的第二遍部分。例如，该第二遍部分能够包括听参加拼写(LAS)解码器。各种实施方式包括在RNN‑T解码器与LAS解码器之间共享的共享编码器。

基本信息

专利标题：

两遍端到端语音识别

专利标题（英）：

暂无

公开（公告）号：

CN114270434A

申请号：

CN202080040756.2

公开（公告）日：

2022-04-01

申请日：

2020-12-03

授权号：

暂无

授权日：

暂无

发明人：

塔拉·C·赛纳特何彦璋李博阿伦·纳拉亚南庞若鸣安托万·让·布吕盖张硕英李炜

申请人：

谷歌有限责任公司

申请人地址：

美国加利福尼亚州

代理机构：

中原信达知识产权代理有限责任公司

代理人：

李宝泉

优先权：

CN202080040756.2

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/16 G10L15/22 G10L15/26

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/06

创建基准模板；训练语音识别系统，例如对说话者声音特征的适应

法律状态

2022-04-19 ：

实质审查的生效

IPC(主分类) : G10L 15/06
申请日 : 20201203

2022-04-01 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载