[发明专利]一种基于模糊理论的文本数据与职能部门自动匹配方法在审
申请号: | 202210963505.2 | 申请日: | 2022-08-11 |
公开(公告)号: | CN115408519A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 常飞;朱进;酆尘颖;贾劲颂;汪源远;沈忱;徐晓东;徐然 | 申请(专利权)人: | 国网江苏省电力有限公司南京供电分公司;国网江苏省电力有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F40/289 |
代理公司: | 南京同泽专利事务所(特殊普通合伙) 32245 | 代理人: | 闫彪 |
地址: | 210019*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模糊 理论 文本 数据 职能部门 自动 匹配 方法 | ||
本发明涉及一种基于模糊理论的文本数据与职能部门自动匹配方法,包括:构造引力系数矩阵用以反映文本关键词与职能部门之间的关联程度;构造数量矩阵用以反映文本数据的关键词信息;通过数量矩阵与质量矩阵相乘,从而得到文本数据与各个职能部门的模糊匹配度矩阵;根据模糊匹配度矩阵为文本数据选择相应的主办职能部门等步骤。本发明提供的基于模糊理论的文本数据与职能部门自动匹配方法,能够凭借计算机技术实现文本数据与职能部门之间的自动匹配,从而节约阅读文本数据的人工成本,优化办事流程并提升办事效率。
技术领域
本发明及一种基于模糊理论的文本数据与职能部门自动匹配方法,属于数据分析应用技术领域。
背景技术
随着互联网办公的普及,网上的海量信息数据主要以文本形式存储。由于文本数据与职能部门之间没有直接、精确的对应关系,而是存在着模糊、复杂的关联性,因此将相应的文本数据匹配给对应职能部门目前还主要依靠人力完成。需要消耗大量的时间和人工成本,处理效率低下。
发明内容
为克服现有技术中的问题,本发明在于提出一种基于模糊理论的文本数据与职能部门自动匹配方法。
为了解决上述技术问题,本发明提出的技术方案是:一种基于模糊理论的文本数据与职能部门自动匹配方法,包括如下步骤:
(1)构造引力系数矩阵用以反映文本关键词与职能部门之间的关联程度;
(2)构造数量矩阵用以反映文本数据的关键词信息;
(3)通过数量矩阵与质量矩阵相乘,从而得到文本数据与各个职能部门的模糊匹配度矩阵;所述质量矩阵即引力系数矩阵;
(4)根据模糊匹配度矩阵为文本数据选择相应的主办职能部门。
上述方案进一步的改进在于:所述步骤(1)中,引力系数矩阵是一个常量矩阵,通过统计关键词出现在文本数据中的文档频率,并累积到该文本数据对应的职能部门下予以构建;令i表示第i个职能部门,i=1,2…,m;令j表示第j个关键词,j=1,2,…,n;x’ij表示第j个关键词在第i个职能部门所有文本数据中出现的文档频次,构建原始引力系数矩阵X’,表达式为:
令zi表示第i个职能部门处理文本数据的数量,xij表示第j个关键词在第i个职能部门所有文本数据中出现的文档频率,则有:
构建引力系数矩阵X,表达式为:
上述方案进一步的改进在于:将语义相近的关键词归为一个词组,令k表示第k个关键词组,k=1,2…,p;pm;则关键词组与职能部门的引力系数矩阵X*为:
上述方案进一步的改进在于:所述步骤(2)中,数量矩阵是一个变量矩阵,通过统计单个文本的关键词频率进行构建;令yOj表示文本数据O的第j个关键词的词频,yOk表示文本数据O的第k个关键词组的词频,则有:yOk=∑yOj(j=1,2,…,n;j∈k);进而得到文本数据O的关键词组数量矩阵YO,YO=(yO1 yO2 … yOp)。
上述方案进一步的改进在于:所述步骤(3)中,通过数量矩阵与质量矩阵相乘,得到单个文本与各个职能部门的关联程度,将单个文本与各个智能部门的关联程度定义为模糊匹配度;令lOi表示文本数据O与第i个职能部门的模糊匹配度,则文本数据O的模糊匹配度矩阵LO为:LO=(lO1 lO2 … lOn);
模糊匹配度矩阵L的计算式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司南京供电分公司;国网江苏省电力有限公司,未经国网江苏省电力有限公司南京供电分公司;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210963505.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钕铁硼磁体及其制备方法
- 下一篇:一种天井机的控制方法、控制装置及天井机