[发明专利]类型确定方法、装置、设备和介质有效
| 申请号: | 201910114557.0 | 申请日: | 2019-02-14 |
| 公开(公告)号: | CN109933788B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 张强;冯知凡;任可欣;张扬;朱勇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/35 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 类型 确定 方法 装置 设备 介质 | ||
1.一种类型确定方法,其特征在于,包括:
识别目标文本中的目标实体;
根据目标实体与目标文本中其他词语的语义关系,以及目标实体的先验知识,确定目标实体的类型;
所述根据目标实体与目标文本中其他词语的语义关系,以及目标实体的先验知识,确定目标实体的类型,包括:
将语境向量、先验类型向量和页面浏览向量拼接后输入深度神经网络的全连接层,经与全连接层连接的输出层输出对目标实体的分类结果;
其中,所述语境向量是将上下文信息特征表示通过双向LSTM网络处理得到,所述上下文信息特征表示包括各维度信息特征表示,所述各维度信息特征表示中描述相同目标文本内容的特征表示,在上下文信息特征表示中的位置集中设置;所述目标实体的先验知识包括目标实体所属各类型的解释和目标实体所属各类型的点击量,所述先验类型向量根据目标实体所属各类型的解释进行向量转换生成,所述页面浏览向量根据目标实体所属各类型的点击量进行向量转换生成。
2.根据权利要求1所述的方法,其特征在于,根据目标实体在目标文本中的上下文信息,确定所述目标实体与所述目标文本中其他词语的所述语义关系,其中所述上下文信息包括目标实体、目标实体在目标文本中的位置、目标文本包括的字、目标文本包括的词语和各词语的词性中的至少一种。
3.根据权利要求2所述的方法,其特征在于,所述根据目标实体在目标文本中的上下文信息,确定所述目标实体与所述目标文本中其他词语的所述语义关系,包括:
对目标实体在目标文本中各维度的上下文信息进行特征表示转换,生成各维度信息特征表示;
根据各维度信息特征表示描述的文本内容,确定各维度信息特征表示在上下文信息特征表示中的位置;
根据上下文信息特征表示,确定目标实体与目标文本中其他词语的语义关系。
4.根据权利要求3所述的方法,其特征在于,所述根据各维度信息特征表示描述的文本内容,确定各维度信息特征表示在上下文信息特征表示中的位置,包括:
将包括目标实体和目标文本的字向量序列、目标文本的词向量序列,以及目标文本的词性向量序列,作为目标矩阵的各行向量;
将目标实体在目标文本中的位置向量作为列向量,分别设置在目标矩阵的两侧,将经过行向量和列向量设置的目标矩阵作为上下文信息特征表示。
5.一种类型确定装置,其特征在于,包括:
实体识别模块,用于识别目标文本中的目标实体;
类型确定模块,用于根据目标实体与目标文本中其他词语的语义关系,以及目标实体的先验知识,确定目标实体的类型;
所述类型确定模块具体用于将语境向量、先验类型向量和页面浏览向量拼接后输入深度神经网络的全连接层,经与全连接层连接的输出层输出对目标实体的分类结果;
其中,所述语境向量是将上下文信息特征表示通过双向LSTM网络处理得到,所述上下文信息特征表示包括各维度信息特征表示,所述各维度信息特征表示中描述相同目标文本内容的特征表示,在上下文信息特征表示中的位置集中设置;所述目标实体的先验知识包括目标实体所属各类型的解释和目标实体所属各类型的点击量,所述先验类型向量根据目标实体所属各类型的解释进行向量转换生成,所述页面浏览向量根据目标实体所属各类型的点击量进行向量转换生成。
6.根据权利要求5所述的装置,其特征在于,还包括:
语义关系确定模块,用于根据目标实体在目标文本中的上下文信息,确定所述目标实体与所述目标文本中其他词语的语义关系,其中所述上下文信息包括目标实体、目标实体在目标文本中的位置、目标文本包括的字、目标文本包括的词语和各词语的词性中的至少一种。
7.根据权利要求6所述的装置,其特征在于,所述语义关系确定模块,包括:
特征表示单元,用于对目标实体在目标文本中各维度的上下文信息进行特征表示转换,生成各维度信息特征表示;
位置确定单元,用于根据各维度信息特征表示描述的文本内容,确定各维度信息特征表示在上下文信息特征表示中的位置;
语义关系确定单元,用于根据上下文信息特征表示,确定目标实体与目标文本中其他词语的语义关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910114557.0/1.html,转载请声明来源钻瓜专利网。





