[发明专利]词语挖掘方法、装置、电子设备和可读存储介质有效
| 申请号: | 202110925212.0 | 申请日: | 2021-08-12 |
| 公开(公告)号: | CN113807091B | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | 张阳;杨双全;韩磊;周科科;谢奕;周炜;陈珺仪;史东建;白桂华;李轩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 词语 挖掘 方法 装置 电子设备 可读 存储 介质 | ||
本公开提供了一种词语挖掘方法、装置、电子设备和可读存储介质,涉及自然语言处理、深度学习、云服务等人工智能技术领域。词语挖掘方法包括:获取搜索数据;将所述搜索数据中的第一标识信息、搜索语句与第二标识信息作为节点,将第一标识信息与搜索语句之间的关系、第一标识信息与第二标识信息之间的关系以及搜索语句与第二标识信息之间的关系作为边,构建行为图谱;根据所述行为图谱中具有预设标签的搜索语句,得到所述行为图谱中每个搜索语句的标签向量;根据所述标签向量,确定所述行为图谱中的目标搜索语句;从所述目标搜索语句中提取目标词,将所述目标词作为所述搜索数据的词语挖掘结果。本公开能够提升词语挖掘的准确性与效率。
技术领域
本公开涉及数据处理技术领域,尤其涉及自然语言处理、深度学习、云服务等人工智能技术领域。提供了一种词语挖掘方法、装置、电子设备和可读存储介质。
背景技术
随着智能手机和移动互联网的普及,互联网开始贯穿人们的衣食住行,互联网中也不断地出现一些新的网络用语,这些新的网络用语具有一定的隐蔽性。由于互联网中存在的一些敏感词,是由相关人员刻意为逃避监管所创造出来的,因此这些敏感词的隐蔽性更强,导致现有技术在挖掘互联网中的敏感词时,存在挖掘准确性与挖掘效率较低的技术问题。
发明内容
根据本公开的第一方面,提供了一种词语挖掘方法,包括:获取搜索数据;将所述搜索数据中的第一标识信息、搜索语句与第二标识信息作为节点,将第一标识信息与搜索语句之间的关系、第一标识信息与第二标识信息之间的关系以及搜索语句与第二标识信息之间的关系作为边,构建行为图谱;根据所述行为图谱中具有预设标签的搜索语句,得到所述行为图谱中每个搜索语句的标签向量;根据所述标签向量,确定所述行为图谱中的目标搜索语句;从所述目标搜索语句中提取目标词,将所述目标词作为所述搜索数据的词语挖掘结果。
根据本公开的第二方面,提供了一种词语挖掘装置,包括:获取单元,用于获取搜索数据;构建单元,用于将所述搜索数据中的第一标识信息、搜索语句与第二标识信息作为节点,将第一标识信息与搜索语句之间的关系、第一标识信息与第二标识信息之间的关系以及搜索语句与第二标识信息之间的关系作为边,构建行为图谱;处理单元,用于根据所述行为图谱中具有预设标签的搜索语句,得到所述行为图谱中每个搜索语句的标签向量;确定单元,用于根据所述标签向量,确定所述行为图谱中的目标搜索语句;挖掘单元,用于从所述目标搜索语句中提取目标词,将所述目标词作为所述搜索数据的词语挖掘结果。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
由以上技术方案可以看出,本实施例能够根据搜索数据中搜索行为之间的关联性来挖掘目标词,从而提升了在挖掘目标词时的准确性与效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是根据本公开第三实施例的示意图;
图4是根据本公开第四实施例的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110925212.0/2.html,转载请声明来源钻瓜专利网。





