[发明专利]基于双重匹配的匹配集获取方法、装置和计算机设备在审
| 申请号: | 202010357579.2 | 申请日: | 2020-04-29 |
| 公开(公告)号: | CN111708861A | 公开(公告)日: | 2020-09-25 |
| 发明(设计)人: | 刘晓军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/247;G06F40/289;G06K9/62;G10L15/02;G10L15/06;G10L15/16 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 双重 匹配 获取 方法 装置 计算机 设备 | ||
本申请揭示了一种基于双重匹配的匹配集获取方法、装置、计算机设备和存储介质,所述方法包括:获取输入的语音信息;根据预设的语音识别方法,对所述语音信息进行语音识别处理,从而得到文字文本;利用第一匹配算法,使用所述文字文本在预设的数据池中进行匹配处理,从而得到第一匹配集;利用预设的特征提取工具,对语音信息进行特征提取处理,从而得到声音特征;利用第二匹配算法,使用所述声音特征在所述数据池中进行匹配处理,从而得到第二匹配集;根据预设的数据集合并方法,对所述第一匹配集和所述第二匹配集进行合并处理,从而得到与所述输入的语音信息对应的最终匹配集。本申请还涉及区块链技术,所述数据池可存储于区块链节点中。
技术领域
本申请涉及到计算机领域,特别是涉及到一种基于双重匹配的匹配集获取方法、装置、计算机设备和存储介质。
背景技术
用户意图在数据池中获取想要的数据,一般可采用数据匹配方法来实现。传统的数据匹配方法,是基于关键词匹配的方式实现,例如用户通过语音输入装置输入具有准确关键词的语音,并且数据池中的数据预先标注有该关键词,从而用户能够获取与所述关键词匹配的数据。这种传统的匹配方法,需要用户对数据池中的数据较为熟悉,能够给出准确的关键词,导致适用面不广,并且这种匹配方式只利用了语音中的关键词,缺失了语音中的声音特征信息,导致匹配结果的准确性不足。
发明内容
本申请的主要目的为提供一种基于双重匹配的匹配集获取方法、装置、计算机设备和存储介质,旨在提高了匹配集获取的准确性。
为了实现上述发明目的,本申请提出一种基于双重匹配的匹配集获取方法,包括以下步骤:
获取输入的语音信息;
根据预设的语音识别方法,对所述语音信息进行语音识别处理,从而得到文字文本;
利用预设的第一匹配算法,使用所述文字文本在预设的数据池中进行匹配处理,从而得到第一匹配集,其中所述第一匹配集由一个或多个第一匹配数据构成;
利用预设的特征提取工具,对所述语音信息进行特征提取处理,从而得到声音特征;
利用预设的第二匹配算法,使用所述声音特征在所述数据池中进行匹配处理,从而得到第二匹配集,其中所述第二匹配集由一个或多个第二匹配数据构成;
根据预设的数据集合并方法,对所述第一匹配集和所述第二匹配集进行合并处理,从而得到与所述输入的语音信息对应的最终匹配集。
进一步地,所述利用预设的第一匹配算法,使用所述文字文本在预设的数据池中进行匹配处理,从而得到第一匹配集的步骤,包括:
对所述文字文本进行分词处理,从而得到由多个词语构成的初始词语序列;
对所述初始词语序列进行同义词转换,从而得到中间词语序列;
从所述中间词语序列中提取出关键词,并利用所述关键词获取所述数据池中的指定数据,其中所述指定数据被标注有所述关键词;
将所述指定数据构成的集合作为所述第一匹配集。
进一步地,所述对所述文字文本进行分词处理,从而得到由多个词语构成的初始词语序列的步骤,包括:
进行第一次分词处理,所述第一次分词处理指将所述文字文本依次输入至所述p个分词工具,从而得到对应的p个第一分词结果,其中所述第一分词结果由第一分词和除所述第一分词之外的第一剩余文本构成;
进行第一次筛选处理,所述第一次筛选处理指,从所述p个第一分词结果中筛选出一个指定第一分词结果,其中所述指定第一分词结果由指定第一分词和指定第一剩余文本构成;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010357579.2/2.html,转载请声明来源钻瓜专利网。





