[发明专利]基于双重匹配的匹配集获取方法、装置和计算机设备在审

申请号：	202010357579.2	申请日：	2020-04-29
公开（公告）号：	CN111708861A	公开（公告）日：	2020-09-25
发明（设计）人：	刘晓军	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F40/247;G06F40/289;G06K9/62;G10L15/02;G10L15/06;G10L15/16
代理公司：	深圳市明日今典知识产权代理事务所(普通合伙) 44343	代理人：	王杰辉
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于双重匹配获取方法装置计算机设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请揭示了一种基于双重匹配的匹配集获取方法、装置、计算机设备和存储介质，所述方法包括：获取输入的语音信息；根据预设的语音识别方法，对所述语音信息进行语音识别处理，从而得到文字文本；利用第一匹配算法，使用所述文字文本在预设的数据池中进行匹配处理，从而得到第一匹配集；利用预设的特征提取工具，对语音信息进行特征提取处理，从而得到声音特征；利用第二匹配算法，使用所述声音特征在所述数据池中进行匹配处理，从而得到第二匹配集；根据预设的数据集合并方法，对所述第一匹配集和所述第二匹配集进行合并处理，从而得到与所述输入的语音信息对应的最终匹配集。本申请还涉及区块链技术，所述数据池可存储于区块链节点中。

技术领域

本申请涉及到计算机领域，特别是涉及到一种基于双重匹配的匹配集获取方法、装置、计算机设备和存储介质。

背景技术

用户意图在数据池中获取想要的数据，一般可采用数据匹配方法来实现。传统的数据匹配方法，是基于关键词匹配的方式实现，例如用户通过语音输入装置输入具有准确关键词的语音，并且数据池中的数据预先标注有该关键词，从而用户能够获取与所述关键词匹配的数据。这种传统的匹配方法，需要用户对数据池中的数据较为熟悉，能够给出准确的关键词，导致适用面不广，并且这种匹配方式只利用了语音中的关键词，缺失了语音中的声音特征信息，导致匹配结果的准确性不足。

发明内容

本申请的主要目的为提供一种基于双重匹配的匹配集获取方法、装置、计算机设备和存储介质，旨在提高了匹配集获取的准确性。

为了实现上述发明目的，本申请提出一种基于双重匹配的匹配集获取方法，包括以下步骤：

获取输入的语音信息；

根据预设的语音识别方法，对所述语音信息进行语音识别处理，从而得到文字文本；

利用预设的第一匹配算法，使用所述文字文本在预设的数据池中进行匹配处理，从而得到第一匹配集，其中所述第一匹配集由一个或多个第一匹配数据构成；

利用预设的特征提取工具，对所述语音信息进行特征提取处理，从而得到声音特征；

利用预设的第二匹配算法，使用所述声音特征在所述数据池中进行匹配处理，从而得到第二匹配集，其中所述第二匹配集由一个或多个第二匹配数据构成；

根据预设的数据集合并方法，对所述第一匹配集和所述第二匹配集进行合并处理，从而得到与所述输入的语音信息对应的最终匹配集。

进一步地，所述利用预设的第一匹配算法，使用所述文字文本在预设的数据池中进行匹配处理，从而得到第一匹配集的步骤,包括：

对所述文字文本进行分词处理，从而得到由多个词语构成的初始词语序列；

对所述初始词语序列进行同义词转换，从而得到中间词语序列；