首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]具有关键词适配的可定制关键词定位系统在审

申请号：	202080071838.3	申请日：	2020-08-26
公开（公告）号：	CN114586094A	公开（公告）日：	2022-06-03
发明（设计）人：	L.考希克;Z.葛	申请（专利权）人：	索尼互动娱乐股份有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/16;G10L15/187;G06F40/242;G10L15/02;G10L15/08;G10L15/22
代理公司：	北京市柳沈律师事务所 11105	代理人：	张晓明
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	具有关键词定制定位系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于识别语音中的关键词的方法，其包括：

检测所述语音中的第一音素；

将所述第一音素转换为第一字素；

将来自词典的第二字素添加到所述第一字素以呈现扩充字素集；

将所述扩充字素集转换为第二音素集；

修剪所述第二音素集以呈现输出音素；以及

至少部分地基于所述输出音素识别所述关键词。

2.如权利要求1所述的方法，其包括使用适用于生成所述语音的人类的至少一个神经网络来执行所述方法。

3.如权利要求1所述的方法，其中所述词典包括：基本词，每个基本词与“K”个音素映射相关；翻译词，每个翻译词与“N”个音素映射相关；并且每个基本词与“M”个翻译词相关，其中“K”、“N”和“M”为整数且至少“K”大于1。

4.如权利要求1所述的方法，其中所述语音中的所述关键词由用户指示，所述关键词不是在所述语音中被指示之前预定的。

5.如权利要求1所述的方法，其包括：

指示用户按大于1的预定次数说出所述关键词，并向所述用户指示所述关键词应该至少包含三个音素。

6.如权利要求1所述的方法，其中修剪所述第二音素集包括从所述第二音素集中去除重复的音素序列。

7.如权利要求1所述的方法，其中修剪所述第二音素集包括如果特定音素序列短于阈值序列长度，则从所述第二音素集中消除音素序列。

8.如权利要求1所述的方法，其中修剪所述第二音素集包括如果所述第二音素集中的第一音素序列与由所述第一音素建立的第二音素序列不相似，则从所述第二音素集中消除音素序列。

9.如权利要求8所述的方法，其中使用基于Jaro Winkler归一化距离和基于DemerauLevenshtein归一化距离的融合距离度量来测量相似性。

10.如权利要求9所述的方法，其中所述融合距离度量是使用等式来确定的，其中α是加权参数，其中dl是Demerau Levenshtein归一化距离，并且其中jw是JaroWinkler归一化距离。

11.如权利要求1所述的方法，其中修剪所述第二音素集包括基于正样本和负样本的样本匹配来进行修剪，其中来自所述第二音素集的音素序列如果仅与负样本匹配则被消除。

12.如权利要求11所述的方法，其中如果匹配样本的加权平均值大于阈值则不从所述第二音素集中消除来自所述第二音素集的与正样本和负样本匹配的音素序列。

13.如权利要求1所述的方法，其中使用音素识别器模型执行所述检测，并且其中所述方法包括：

在所述修剪之后，基于指示所述第一音素的一个或多个记录来训练所述音素识别器模型。

14.如权利要求13所述的方法，其中所述输出音素为第一输出音素，其中所述音素识别器模型为第一音素识别器模型，其中所述训练从所述第一音素识别器模型呈现第二音素识别器模型，并且其中所述方法包括：

在所述训练之后，使用所述第二音素识别器模型来呈现第二输出音素；以及

或者将所述第二输出音素添加到所述第一输出音素以尝试基于所述第一和第二输出音素两者来识别所述关键词，或者用所述第二输出音素替换所述第一输出音素以尝试基于所述第二输出音素而不是所述第一输出音素来识别所述关键词。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于索尼互动娱乐股份有限公司，未经索尼互动娱乐股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202080071838.3/1.html，转载请声明来源钻瓜专利网。

上一篇：混合软性-刚性电气互连系统
下一篇：成组变速器装置、尤其是分流式变速器

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top