[发明专利]基于图结构的公文推荐方法、装置、计算机设备及介质有效
申请号: | 202010475897.9 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111666401B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 谢静文;阮晓雯;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F18/22 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 结构 公文 推荐 方法 装置 计算机 设备 介质 | ||
1.一种基于图结构的公文推荐方法,其特征在于,包括:
获取具有不同公文类型的多种公文,根据TF-IDF基于预设的词语统计特征确定获取的所述公文中的特征词语,根据TF-IDF筛选出现频率大于或等于预设频率的特征词语,并将筛选出的所述特征词语记录为与其对应的所述公文的关键词标签;
将所述公文输入至预设的LDA主题模型,通过所述LDA主题模型计算所述公文中的文本主题-关键词的分布概率矩阵,再获取所述LDA主题模型根据所述公文的文本主题-关键词的分布概率矩阵筛选出的选取概率大于或等于预设概率的所述文本主题,并将筛选出的所述文本主题记录为与其对应的所述公文的主题标签;所述文本主题-关键词的分布概率矩阵中包含多个所述选取概率,所述选取概率是指所述公文中的关键词属于该公文的文本主题的概率;
根据所述关键词标签和所述主题标签生成公文属性;
根据每一种公文类型获取所述公文的记录数据,通过Neo4j框架根据所述公文的所述记录数据和所述公文属性建立基于图结构的公文推荐库;所述公文推荐库中包含多个图结构,一个所述图结构对应至少一种所述公文类型的所述公文,一个所述图结构中包含相互连接的多个节点;一个所述节点代表所述记录数据、所述关键词标签和所述主题标签中的一种;
接收到用户自所述公文推荐库中输入的检索内容,依据SimRank计算出的相似度的高低次序输出目标公文;所述相似度是指所述检索内容与所述节点的相似度。
2.根据权利要求1所述的基于图结构的公文推荐方法,其特征在于,所述获取具有不同公文类型的多种公文之前,还包括:
通过已训练成功的BERT模型对所述公文的整体篇章结构进行分析,得到一个对所述公文的整体篇章结构的分析结果;所述整体篇章结构是指所述公文的各个组成结构,所述分析结果是对所述公文的各个所述组成结构的完整性和合理性进行判断的结果;
在所述分析结果为所述公文的其中一个组成结构不具备所述完整性或/和所述合理性时,从所述公文中提取出所述公文中缺失的所述组成结构或/和不合理的所述组成结构,以突出显示的形式标注出所述公文中缺失的所述组成结构或/和不合理的所述组成结构,并令预设数据接收方对该公文进行修改。
3.根据权利要求1所述的基于图结构的公文推荐方法,其特征在于,所述公文属性还包括数字实体;所述通过Neo4j框架根据所述公文的所述记录数据和所述公文属性建立基于图结构的公文推荐库之前,还包括:
通过预设规则模板中的目标实体表达式对所述公文进行数字实体搜索后定位出所述数字实体的目标位置,并通过所述预设规则模板中的抓取规则表达式从所述目标位置抓取所述数字实体。
4.根据权利要求1所述的基于图结构的公文推荐方法,其特征在于,所述公文属性还包括公文来文时间和来文单位;所述通过Neo4j框架根据所述公文的所述记录数据和所述公文属性建立基于图结构的公文推荐库之前,还包括:
获取所述公文的公文内容,通过NLP模型从所述公文内容中识别出与时间组成成分对应的所述公文来文时间以及与单位组成成分对应的所述来文单位;
所述根据所述关键词标签和所述主题标签生成公文属性,包括:
根据所述公文来文时间、所述来文单位、所述关键词标签和所述主题标签生成所述公文属性。
5.根据权利要求1所述的基于图结构的公文推荐方法,其特征在于,所述通过Neo4j框架根据所述公文的所述记录数据和所述公文属性建立基于图结构的公文推荐库,包括:
通过Neo4j框架中的创建节点语句依据节点属性搭建出与所述公文对应的各个节点;所述节点属性与所述记录数据和所述公文属性分别对应;
通过Neo4j框架中的创建关系语句依据预设关系搭建出各个所述节点之间的连接关系;所述预设关系与所述记录数据和所述公文属性分别对应;
通过Neo4j框架中的路径语句依据所述连接关系确定出所有所述节点的路径,建立完成基于图结构的所述公文推荐库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010475897.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:坡沟系统土壤侵蚀试验装置及试验方法
- 下一篇:一种拼接式环网柜的实现方法