[发明专利]一种观点抽取方法、装置及设备在审
| 申请号: | 201811037185.8 | 申请日: | 2018-09-06 |
| 公开(公告)号: | CN109299400A | 公开(公告)日: | 2019-02-01 |
| 发明(设计)人: | 谢忠玉 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06F17/27 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 装置及设备 抽取 评价对象 文本 计算复杂度 启发式规则 记忆网络 实体标记 训练样本 分析 预设 关联 | ||
1.一种观点抽取方法,其特征在于,包括:
获取待分析文本;
基于预先训练的长短期记忆网络LSTM模型,确定所述待分析文本中的观点实体;其中,所述观点实体包括评价对象和评价词,所述LSTM模型是根据带有观点实体标记的多个训练样本训练得到的;
通过预设启发式规则,建立所述评价对象与所述评价词之间的关联,以确定所述待分析文本对应的观点。
2.根据权利要求1所述的方法,其特征在于,所述通过预设启发式规则,建立所述评价对象与所述评价词之间的关联,包括:
针对各个评价对象,计算该评价对象分别与各个评价词之间的距离;
确定所有所述距离中的最小距离;
确定所述最小距离对应的评价词为目标评价词;
建立该评价对象与所述目标评价词之间的关联。
3.根据权利要求1所述的方法,其特征在于,预先训练所述LSTM模型的步骤,包括:
获取多个训练样本;
针对每个训练样本,将该训练样本输入至预设LSTM模型,对所述预设LSTM模型进行训练,得到训练好的LSTM模型,其中,该训练样本中词语带有观点实体标记。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述观点实体标记包括通过序列标注方式进行标注的标记。
5.根据权利要求1至3任一项所述的方法,其特征在于,在所述获取待分析文本之后,所述方法还包括:
过滤所述待分析文本中的观点无关内容,得到过滤后待分析文本;
所述基于预先训练的长短期记忆网络LSTM模型,确定所述待分析文本中的观点实体的步骤,包括:
基于所述LSTM模型,确定所述过滤后待分析文本中的观点实体。
6.一种观点抽取装置,其特征在于,包括:
第一获取模块,用于获取待分析文本;
确定模块,用于基于预先训练的长短期记忆网络LSTM模型,确定所述待分析文本中的观点实体;其中,所述观点实体包括评价对象和评价词,所述LSTM模型是根据带有观点实体标记的多个训练样本训练得到的;
建立模块,用于通过预设启发式规则,建立所述评价对象与所述评价词之间的关联,以确定所述待分析文本对应的观点。
7.根据权利要求6所述的装置,其特征在于,所述建立模块,包括:
计算子模块,用于针对各个评价对象,计算该评价对象分别与各个评价词之间的距离;
第一确定子模块,用于确定所有所述距离中的最小距离;
第二确定子模块,用于确定所述最小距离对应的评价词为目标评价词;
建立子模块,用于建立该评价对象与所述目标评价词之间的关联。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个训练样本;
训练模块,用于针对每个训练样本,将该训练样本输入至预设LSTM模型,对所述预设LSTM模型进行训练,得到训练好的LSTM模型,其中,该训练样本中词语带有观点实体标记。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述观点实体标记包括通过序列标注方式进行标注的标记。
10.根据权利要求6至8任一项所述的装置,其特征在于,所述装置还包括,过滤模块,用于在所述获取待分析文本之后,过滤所述待分析文本中的观点无关内容,得到过滤后待分析文本;
所述确定模块,具体用于基于所述LSTM模型,确定所述过滤后待分析文本中的观点实体。
11.一种观点抽取设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811037185.8/1.html,转载请声明来源钻瓜专利网。





