[发明专利]一种通过自然语言实现结构化数据搜索的方法有效
申请号: | 201711015609.6 | 申请日: | 2017-10-26 |
公开(公告)号: | CN107748784B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 邢加和 | 申请(专利权)人: | 江苏赛睿信息科技股份有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;陈国军 |
地址: | 211100 江苏省南京市雨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 自然语言 实现 结构 数据 搜索 方法 | ||
1.一种通过自然语言实现结构化数据搜索的方法,通过自然语言输入模块、语言解析模块、数据处理模块、输出模块实现,其特征在于,包括:
自然语言输入模块接收用户输入的自然语言,所述自然语言为文字或语音;
语言解析模块用于对所述自然语言进行解析,并将语言解析结果发送给数据处理模块;
数据处理模块根据接收到的语言解析结果对待检索数据进行操作,并将操作结果发送至输出模块,所述操作包括查询操作;
输出模块将接收到的输出结果进行输出;
所述语言解析结果,包括关键字和每个关键字所对应的解析准确性权值;
所述数据处理模块根据接收到的语言解析结果对待检索数据进行操作,并将操作结果发送至输出模块,可实施为:
数据处理模块接收到的语言解析结果,包括关键字和每个关键字所对应的解析准确性权值;
数据处理模块根据预设规则对所述关键字进行分类,得到不同类别的关键字,包括过滤条件关键字、输出列关键字、结果展现方式关键字;
数据处理模块通过关键字按其类别对待检索的结构化数据进行检索;
数据处理模块根据每个检索结果所用到的关键字进行排序,得到排序后的检索结果,所述排序方法为根据所用到的关键字的解析准确性权值之和由大到小进行排序;
数据处理模块在排序后的检索结果中从前向后选取预设数量的检索结果,并将其设置为操作结果;
数据处理模块将操作结果发送至输出模块;
所述语言解析模块,还用于:
对解析得到的关键字进行扩展,得到扩展后的关键字,所述扩展为根据预设的规则通过关键字获取潜在关键字,所述潜在关键字为根据预设规则获取的、与关键字的读音或形状相近的关键字;
根据预设的规则对扩展后的关键字赋予解析准确性权值,所述权值小于1;
所述潜在关键字,还包括:
与关键字的输入按键序列相似度在预设范围内的字或词,所述字或词在预设的词典中查找,所述输入按键序列相似度由第一公式计算,所述第一公式为:
其中,S表示相似度;n为关键字的输入按键的次数;ai表示关键字的第i次按键;bi表示字或词的第i次按键;d(ai,bi)为字或词的第i次按键与关键字的第i次按键在键盘上的距离的函数,d(ak+1,bk+2)表示为字或词的第k+1次按键与关键词的第k+2次按键在键盘上的距离的函数,d(ak+2,bk+1)表示为字或词的第k+2次按键与关键词的第k+1次按键在键盘上的距离的函数,当所述距离增加时,其值降低,其最小值为0,当所述距离为0时,该函数值为1;q为可调整参数,其值大于0且小于1,表示字或词调整2个按键的输入顺序即变成关键字的可能性权重;k为大于等于i且小于等于n的任一正整数。
2.如权利要求1所述的方法,其特征在于,所述查询操作,对待检索的结构化数据执行查询操作,所述查询操作实施为先根据输入的自然语言中过滤条件筛选出相应的行,再根据输入的自然语言中需要的内容查询出相应的列。
3.如权利要求1所述的方法,其特征在于,
所述自然语言输入模块,包括显示设备显示的输入框,用于输入自然语言;
所述输出模块,包括显示设备显示的输出界面,用于以数字、图表、图形中任一种,或数字、图表、图形的组合的方式显示输出结果;所述输出界面与所述输入框在显示设备显示的同一界面显示。
4.如权利要求1所述的方法,其特征在于,所述语言解析模块用于对所述自然语言进行解析,包括:
语言解析模块对所述自然语言进行分词,得到分词结果;
语言解析模块对所述分词结果进行词性标注,得到标注结果;
语言解析模块对所述标注结果进行命名实体识别,得到实体识别结果;
语言解析模块依据预设的规则对所述命名实体识别结果赋予权值,得到带有权值的实体识别结果;
语言解析模块根据预设的规则选择带有权值的实体识别结果,将其设置为关键字,将其权值设置为和关键字对应的解析准确性权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏赛睿信息科技股份有限公司,未经江苏赛睿信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711015609.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于句向量的多标签公司描述文本分类方法
- 下一篇:衣橱管理方法及移动终端