[发明专利]一种语义匹配方法及智能设备有效
申请号: | 201610227718.3 | 申请日: | 2016-04-12 |
公开(公告)号: | CN107291783B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 陈见耸;高鹏 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
代理公司: | 北京中原华和知识产权代理有限责任公司 11019 | 代理人: | 寿宁 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 匹配 方法 智能 设备 | ||
1.一种语义匹配方法,适用于智能设备;其特征在于,于所述智能设备中预设多个规则语义句式,还包括:
步骤S1,根据使用者的输入获取待解析语句;
步骤S2,根据所述待解析语句匹配得到至少一个所述规则语义句式;
步骤S3,处理得到所述待解析语句的第一语句向量,以及分别处理得到匹配得到的至少一个所述规则语义句式的第二语句向量;
步骤S4,分别根据所述第一语句向量和每个所述第二语句向量,处理得到所述待解析语句与每个匹配得到的所述规则语义句式之间的向量相似度;
步骤S5,分别将每个所述向量相似度与一预设的相似度阈值进行比较,并返回大于所述相似度阈值的所述向量相似度所对应的所述规则语义句式的语义信息,以作为所述待解析语句的语义;
在上述步骤之前,预设所述规则语义句式,并建立关联于所述规则语义句式的索引的方法,具体包括:
步骤A1,分别以使用者预先设置的不同类型的标签替代所述规则语义句式中相应类型的关键信息;
步骤A2,将每个所述标签视为一个字,并以每个字为一个索引单元,建立对于所述规则语义句式的索引。
2.如权利要求1所述的语义匹配方法,其特征在于,所述步骤A2具体包括:
步骤A21,采用哈希倒排索引方式罗列在所有所述规则语义句式中出现的所述索引单元;
步骤A22,在每个所述索引单元后分别链接关联于所述索引单元的每个所述规则语义句式的序号。
3.如权利要求1所述的语义匹配方法,其特征在于,在执行所述步骤S2之前,首先以不同类型的所述标签替代所述待解析语句中相应类型的关键信息;
所述步骤S2具体包括:
步骤S21,将每个所述标签视为一个字,并以所述待解析语句中的每个字作为一个检索单元,依据所述规则语义句式的所述索引,分别检索得到匹配于所述待解析语句的至少一个所述规则语义句式;
步骤S22,分别处理得到每个检索得到的所述规则语义句式与所述待解析语句之间的匹配度;
步骤S23,分别将关联于每个检索得到的所述规则语义句式的所述匹配度与一预设的匹配度阈值进行比较,保留大于所述匹配度阈值的所述匹配度所对应的至少一个所述规则语义句式;
步骤S24,输出被保留的至少一个所述规则语义句式,以作为匹配得到的所述规则语义句式。
4.如权利要求3所述的语义匹配方法,其特征在于,所述步骤S22中,依照下述公式计算得到所述匹配度:
S=(S1+S2)/2;
其中,S表示所述匹配度;
S1表示所述待解析语句与所述规则语义句式之间的匹配部分占所述待解析语句的比例;
S2表示所述待解析语句与所述规则语义句式之间的匹配部分占所述规则语义句式之间的比例。
5.如权利要求1所述的语义匹配方法,其特征在于,预先训练形成一向量处理模型;
所述步骤S3中,计算得到所述第一语句向量的方法包括:
步骤S31a,将一条所述待解析语句进行分词处理;
步骤S32a,将经过所述分词处理的所述待解析语句中的每个词输入至所述向量处理模型中,以分别得到关联于每个词的词向量;
步骤S33a,根据所有所述词向量处理得到所述待解析语句的所述第一语句向量。
6.如权利要求1所述的语义匹配方法,其特征在于,预先训练形成一向量处理模型;
所述步骤S3中,计算得到所述第二语句向量的方法包括:
步骤S31b,将一条所述规则语义句式进行分词处理;
步骤S32b,将经过所述分词处理的所述规则语义句式中的每个词输入至所述向量处理模型中,以分别得到关联于每个词的词向量;
步骤S33b,根据所有所述词向量处理得到所述规则语义句式的所述第二语句向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610227718.3/1.html,转载请声明来源钻瓜专利网。