[发明专利]一种节点文本融合方法、装置、计算机设备及存储介质在审
| 申请号: | 202110705528.9 | 申请日: | 2021-06-24 |
| 公开(公告)号: | CN113420161A | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 孙梓淇;白祚;莫洋 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06K9/62 |
| 代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 节点 文本 融合 方法 装置 计算机 设备 存储 介质 | ||
1.一种基于图传播算法的节点文本融合方法,其特征在于,包括下述步骤:
接收用户终端发送的携带有待处理节点文本的节点融合请求;
根据训练好的语言模型对所述待处理节点文本进行语义表示操作,得到节点语义向量;
根据所述节点语义向量计算所述每两个待处理节点文本之间的文本相似度;
对所述文本相似度大于所述关联阈值的所述待处理节点文本建立关联关系,得到节点数据集合;
根据所述节点数据集合构建与所述待处理节点文本相对应的原始知识图谱;
根据图传播算法对所述原始知识图谱进行筛选操作,得到同标签节点数据;
根据预设的主节点确认策略在所述同标签节点数据中确认主节点概念以及融合节点概念,得到语义融合后的节点数据集合。
2.根据权利要求1所述的基于图传播算法的节点文本融合方法,其特征在于,在所述根据所述节点语义向量计算所述每两个待处理节点文本之间的文本相似度的步骤之前,还包括下述步骤:
采用MiniBatch KMeans算法对所述待处理节点文本进行分解操作,得到若干原始概念簇类;
所述根据所述节点语义向量计算所述每两个待处理节点文本之间的文本相似度的步骤,具体包括下述步骤:
在同一所述原始概念簇类中根据所述节点语义向量计算所述每两个待处理节点文本之间的所述文本相似度。
3.根据权利要求1所述的基于图传播算法的节点文本融合方法,其特征在于,所述文本相似度表示为:
其中,X、Y表示所述待处理节点文本;Dist(X,Y)为待处理节点文本X和待处理节点文本Y之间的相似度;xi表示在待处理节点文本X中的第i个节点语义向量,且i∈(1,n);y_max(xi)表示为在待处理节点文本Y中与节点语义向量xi的相似度最高的节点语义向量;dist(xi,y_max(xi)表示节点语义向量xi与节点语义向量y_max(xi)的词向量距离。
4.根据权利要求3所述的基于图传播算法的节点文本融合方法,其特征在于,所述文本相似度还表示为:
其中,α表示自定义的放大系数,c表示概念X和概念Y相同的文本,len()表示文本长度。
5.根据权利要求1所述的基于图传播算法的节点文本融合方法,其特征在于,所述根据所述节点语义向量计算所述每两个待处理节点文本之间的文本相似度的步骤,具体包括:
判断所述每两个待处理节点文本中是否存在相同文本;
若所述每两个待处理节点文本中不存在相同文本,则基于所述文本相似度表达公式计算所述文本相似度;
若所述每两个待处理节点文本中存在相同文本,则根据增大规则增大所述放大系数α,并基于增大的所述文本相似度表达公式计算所述文本相似度。
6.根据权利要求5所述的基于图传播算法的节点文本融合方法,其特征在于,在所述根据预设的主节点确认策略在所述同标签节点数据中确认主节点概念以及融合节点概念,得到语义融合后的节点数据集合的步骤之后还包括:
将所述待处理节点文本以及所述节点数据集合存储至区块链中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110705528.9/1.html,转载请声明来源钻瓜专利网。





