[发明专利]基于词表模型的用户检索意图判断方法有效
| 申请号: | 201811634847.X | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN109670102B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 敬石开;鬲玲;陈泽峰 | 申请(专利权)人: | 北京神舟航天软件技术有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F40/30;G06F40/289 |
| 代理公司: | 北京世誉鑫诚专利代理有限公司 11368 | 代理人: | 孙国栋 |
| 地址: | 100094*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 词表 模型 用户 检索 意图 判断 方法 | ||
1.基于词表模型的用户检索意图判断方法,其特征在于,包括以下步骤:
101、构建词表模型,完成后进入步骤102;
102、获取用户检索请求,完成后进入步骤103;
103、判断所述检索请求中的相邻词汇在词表模型中的结构关系,完成后进入步骤104;
104、利用结构关系信息,判断用户意图,完成后进入步骤105;
105、对于所述检索请求中的每一个关键词,被重复判断意图的词汇进行意图合并,完成后进入步骤106;
106、形成用户意图量化表达,其中:
步骤101包括以下步骤:
S1011词表词汇抽取:
利用某领域下的一批文献或语料,将其中所用到的专业术语词汇整理形成词汇表,完成后进入步骤S1012;
S1012词表词汇关系构建
利用步骤S1011得到的词汇表,将词汇间的语义关联整理成关系表,完成后进入步骤S1013;
S1013词汇关系侧面构建
对于同一主体词汇,其所在的某些关系具有相近的语义,侧面即表示相同主体词汇下具有某方面语义的关系的集合,若侧面没有定义具体的语义含义,则称其为侧面标识,根据关系表形成侧面表;
词表模型包括关系要素R,其表达式为R=(Wo,Ws,tf,tr),其中:
Wo表示主体词汇,即在关系中,被其他词汇所解释的专业词汇;
Ws表示客体词汇,即在关系中,用来解释主体词汇的专业词汇;
tf表示侧面标识;
tr表示关系类型。
2.根据权利要求1所述的基于词表模型的用户检索意图判断方法,其特征在于步骤102包括以下步骤:
201、对用户检索输入进行分词处理,并去除停止词,生成关键词列表,完成后进入步骤202;
202、对关键词列表进行相邻去重,若相邻词汇相同,则保留其中之一,完成后进入步骤203;
203、将关键词列表中的英文全部转化为小写,然后查询步骤101得到的词表模型,将词表同义词全部转化为词表核心词。
3.根据权利要求1所述的基于词表模型的用户检索意图判断方法,其特征在于步骤103包括以下步骤:
301、将相邻的关键词两两组合,完成后进入步骤302;
302、判断相邻双词正序是否为父子关系,若是,结束本次操作,若不是,则进一步判断相邻双词反序是否为父子关系,若是,则结束本次操作,若不是则进入步骤303,其中:
若双词间满足关系四元组rAB=(A,B,tf,tr)或rAB=(B,A,tf,tr),则双词为父子关系,其中A、B表示双词,tf为该关系的侧面,tr为该关系的关系类型;
303、判断相邻双词正序是否为祖孙关系,若是,结束本次操作,若不是,则进一步判断相邻双词反序是否为祖孙关系,若是,则结束本次操作,若不是则进入步骤304,其中:
若双词间满足关系四元组或则双词为祖孙关系,其中A、B表示双词,tfi和tfj分别为两条关系的侧面,tri和trj分别为两条关系的关系类型;
304、判断相邻双词正序是否为亲兄弟关系,若是,结束本次操作,若不是,则进一步判断相邻双词反序是否为亲兄弟关系,若是,则结束本次操作,若不是则进入步骤305,其中:
若双词间满足关系四元组则双词为亲兄弟关系,其中A、B表示双词,tf为该关系的侧面,tr为该关系的关系类型;
305、判断相邻双词正序是否为表兄弟关系,若是,结束本次操作,若不是,则进一步判断相邻双词反序是否为表兄弟关系,若是,则结束本次操作,若不是则进入步骤306,其中:
若双词间满足关系四元组则双词为表兄弟关系,其中A、B表示双词,tfi和tfj分别为两条关系的侧面,tri和trj分别为两条关系的关系类型;
306、相邻双词之间没有语义关联关系,结束本次操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神舟航天软件技术有限公司,未经北京神舟航天软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811634847.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:爬虫调度方法、装置、电子设备及存储介质
- 下一篇:数据抓取方法及装置





