[发明专利]资料识别方法及装置、电子设备、存储介质有效
| 申请号: | 202010520924.X | 申请日: | 2020-06-10 |
| 公开(公告)号: | CN111666767B | 公开(公告)日: | 2023-07-18 |
| 发明(设计)人: | 张发恩;姜勇越 | 申请(专利权)人: | 创新奇智(上海)科技有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/211;G06F16/35 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
| 地址: | 201900 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 资料 识别 方法 装置 电子设备 存储 介质 | ||
1.一种资料识别方法,其特征在于,包括:
从文本中筛选出符合预设规则的句子,获得预设目标;预设目标是指符合预设规则的句子;
通过命名实体识别和依存句法分析从所述预设目标的上下文提取所述预设目标的第一主语;
将所述预设目标作为已构建的分类模型的输入,获得所述分类模型输出的所述预设目标的第二主语;
根据所述第一主语和所述第二主语,得到所述预设目标的正确主语。
2.根据权利要求1所述的方法,其特征在于,所述预设目标为观点,所述从文本中筛选出符合预设规则的句子,获得预设目标,包括:
按照表达观点的标准句式,从所述文本中提取与所述标准句式匹配的句子。
3.根据权利要求2所述的方法,其特征在于,在所述按照表达观点的标准句式,从所述文本中提取与所述标准句式匹配的句子之后,所述方法还包括:
根据已构建的情感词库,对所述文本中剩余的句子进行扫描,筛选出包含所述情感词库中情感词的句子。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
通过命名实体识别和规则判断,从所述文本中筛选出所述观点的提出地点。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据已构建的时间词库,从所述文本中提取所述观点的相对提出时间;
根据所述文本的发布时间,对所述相对提出时间进行换算,获得所述观点的绝对提出时间。
6.根据权利要求2所述的方法,其特征在于,在所述根据所述第一主语和所述第二主语,得到所述预设目标的正确主语之后,所述方法还包括:
将所述观点和所述观点的正确主语进行关联存储。
7.根据权利要求2所述的方法,其特征在于,在所述根据所述第一主语和所述第二主语,得到所述预设目标的正确主语之后,所述方法还包括:
通过计算所述文本与不同事件的语义相似度,确定所述文本归属的目标事件;
将所述观点以及所述观点的正确主语与所述目标事件关联存储。
8.一种资料识别装置,其特征在于,包括:
目标筛选模块,用于从文本中筛选出符合预设规则的句子,获得预设目标;预设目标是指符合预设规则的句子;
主语分析模块,用于通过命名实体识别和依存句法分析从所述预设目标的上下文提取所述预设目标的第一主语;
主语分类模块,用于将所述预设目标作为已构建的分类模型的输入,获得所述分类模型输出的所述预设目标的第二主语;
主语确定模块,用于根据所述第一主语和所述第二主语,得到所述预设目标的正确主语。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-7任意一项所述的资料识别方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-7任意一项所述的资料识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(上海)科技有限公司,未经创新奇智(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010520924.X/1.html,转载请声明来源钻瓜专利网。





