[发明专利]数据处理方法、装置、电子设备以及存储介质在审
| 申请号: | 202010572653.2 | 申请日: | 2020-06-22 |
| 公开(公告)号: | CN111737607A | 公开(公告)日: | 2020-10-02 |
| 发明(设计)人: | 申亚坤 | 申请(专利权)人: | 中国银行股份有限公司 |
| 主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F16/953 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
| 地址: | 100818 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 以及 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
获取输入的检索语句包含的至少一个关键词;
基于所述至少一个关键词,获得所述检索语句与各文本分别对应的第一相关度;
其中,一个文本与所述检索语句的第一相关度是指所述至少一个关键词分别位于所述文本的词频与所述至少一个关键词分别对应的重要性调整系数的乘积的和;一个所述关键词位于所述文本的词频是指所述文本包含所述关键词的总数目与所述文本包含的词语的总数目的比值;一个关键词对应的重要性调整系数与所述各文本中包含所述关键词的文本的总数目与所述各文本的总数目的比值成负相关;
获取各文本分别对应的属性信息;
其中,一个文本对应的属性信息至少包括各文本中与所述文本具有上下文关系的至少一个第一文本分别与所述文本之间的文本距离;具有同一上下文关系的两个文本是指所述两个文本分别包含的内容为同一源文本中的不同自然段;具有同一上下文关系的两个文本的文本距离是指所述两个文本位于同一源文本中的自然段间隔;
基于各文本分别对应的属性信息,得到各文本分别对应的相关度调整系数;
基于各文本分别对应的相关度调整系数,以及,各文本分别对应的第一相关度,得到各文本分别对应的第二相关度;
基于所述各文本分别对应的第二相关度,对所述各文本进行排序,以得到所述检索语句对应的搜索结果。
2.根据权利要求1所述数据处理方法,其特征在于,所述一个文本对应的属性信息还包括:各文本中与所述文本具有预设关联关系的第二文本的总数目;
所述基于各文本分别对应的属性信息,得到各文本分别对应的相关度调整系数,包括:
针对每一文本,基于所述总数目以及所述至少一个第一文本分别与所述文本之间的文本距离,获得所述文本对应的相关度调整系数,以得到所述各文本分别对应的相关度调整系数。
3.根据权利要求1所述数据处理方法,其特征在于,所述一个文本对应的属性信息还包括所述文本的热度属性信息;一个文本对应的热度属性信息包括展现量、点击量和点击率中的一种或多种;
所述基于各文本分别对应的属性信息,得到各文本分别对应的相关度调整系数,包括:
针对每一文本,基于所述文本对应的热度属性信息以及所述至少一个第一文本分别与所述文本之间的文本距离,获得所述文本对应的相关度调整系数,以得到各文本分别对应的相关度调整系数。
4.根据权利要求1所述数据处理方法,其特征在于,所述一个文本对应的属性信息还包括所述文本的热度属性信息以及所述各文本中与所述文本具有预设关联关系的第二文本的总数目;一个文本对应的热度属性信息包括展现量、点击量和点击率中的一种或多种;
所述基于各文本分别对应的属性信息,得到各文本分别对应的相关度调整系数,包括:
针对每一文本,基于所述文本对应的热度属性信息、所述总数目以及所述至少一个第一文本分别与所述文本之间的文本距离,获得所述文本对应的相关度调整系数,以得到各文本分别对应的相关度调整系数。
5.根据权利要求1所述数据处理方法,其特征在于,所述获取各文本分别对应的属性信息,包括:
将各文本分别对应的第一相关度进行降序排序,以得到第一排序结果;
获得位于所述第一排序结果中最前面的第一预设数目个文本;
获取所述第一预设数目个文本分别对应的属性信息。
6.根据权利要求1所述数据处理方法,其特征在于,还包括:
获取各文本分别对应的第二相关度的降序排序结果中,位于最前面的第二预设数目个文本;
基于所述第二预设数目个文本分别对应的类型标签,将所述第二预设数目个文本进行分类,以得到分类结果;
展示所述分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010572653.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:坐席转接方法及装置
- 下一篇:文本业务处理系统、方法及装置





