[发明专利]一种基于模糊理论的文本数据与职能部门自动匹配方法在审
申请号: | 202210963505.2 | 申请日: | 2022-08-11 |
公开(公告)号: | CN115408519A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 常飞;朱进;酆尘颖;贾劲颂;汪源远;沈忱;徐晓东;徐然 | 申请(专利权)人: | 国网江苏省电力有限公司南京供电分公司;国网江苏省电力有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F40/289 |
代理公司: | 南京同泽专利事务所(特殊普通合伙) 32245 | 代理人: | 闫彪 |
地址: | 210019*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模糊 理论 文本 数据 职能部门 自动 匹配 方法 | ||
1.一种基于模糊理论的文本数据与职能部门自动匹配方法,其特征在于,包括如下步骤:
(1)构造引力系数矩阵用以反映文本关键词与职能部门之间的关联程度;
(2)构造数量矩阵用以反映文本数据的关键词信息;
(3)通过数量矩阵与质量矩阵相乘,从而得到文本数据与各个职能部门的模糊匹配度矩阵;所述质量矩阵即引力系数矩阵;
(4)根据模糊匹配度矩阵为文本数据选择相应的主办职能部门。
2.根据权利要求1所述的基于模糊理论的文本数据与职能部门自动匹配方法,其特征在于:所述步骤(1)中,引力系数矩阵是一个常量矩阵,通过统计关键词出现在文本数据中的文档频率,并累积到该文本数据对应的职能部门下予以构建;令i表示第i个职能部门,i=1,2…,m;令j表示第j个关键词,j=1,2,…,n;x’ij表示第j个关键词在第i个职能部门所有文本数据中出现的文档频次,构建原始引力系数矩阵X’,表达式为:
令zi表示第i个职能部门处理文本数据的数量,xij表示第j个关键词在第i个职能部门所有文本数据中出现的文档频率,则有:
构建引力系数矩阵X,表达式为:。
3.根据权利要求2所述的基于模糊理论的文本数据与职能部门自动匹配方法,其特征在于:将语义相近的关键词归为一个词组,令k表示第k个关键词组,k=1,2…,p;pm;则关键词组与职能部门的引力系数矩阵X*为:
4.根据权利要求3所述的基于组合权重的电网公司督查督办业务流程评价方法,其特征在于:所述步骤(2)中,数量矩阵是一个变量矩阵,通过统计单个文本的关键词频率进行构建;令yOj表示文本数据O的第j个关键词的词频,yOk表示文本数据O的第k个关键词组的词频,则有:yOk=∑yOj(j=1,2,…,n;j∈k);进而得到文本数据O的关键词组数量矩阵YO,YO=(yO1 yO2 … yOp)。
5.根据权利要求4所述的基于组合权重的电网公司督查督办业务流程评价方法,其特征在于:所述步骤(3)中,通过数量矩阵与质量矩阵相乘,得到单个文本与各个职能部门的关联程度,将单个文本与各个智能部门的关联程度定义为模糊匹配度;令lOi表示文本数据O与第i个职能部门的模糊匹配度,则文本数据O的模糊匹配度矩阵LO为:
LO=(lO1 lO2 … lOn);
模糊匹配度矩阵L的计算式为:
。
6.根据权利要求5所述的基于组合权重的电网公司督查督办业务流程评价方法,其特征在于:对模糊匹配度矩阵L作归一化处理,计算公式为:
7.根据权利要求5所述的基于组合权重的电网公司督查督办业务流程评价方法,其特征在于:所述步骤(4)中,根据模糊匹配度矩阵LO,选取模糊匹配度lOi最大值对应的职能部门为文本数据O的主办部门。
8.根据权利要求7所述的基于组合权重的电网公司督查督办业务流程评价方法,其特征在于:所述步骤(4)中,若需要选定协办部门,则事先拟定协办部门的个数为c,选取模糊匹配度次于主办部门的c个部门为协办部门。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司南京供电分公司;国网江苏省电力有限公司,未经国网江苏省电力有限公司南京供电分公司;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210963505.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钕铁硼磁体及其制备方法
- 下一篇:一种天井机的控制方法、控制装置及天井机