[发明专利]纸质信件快速采集分拣阅信系统有效
| 申请号: | 202210822765.8 | 申请日: | 2022-07-12 |
| 公开(公告)号: | CN115082947B | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | 李振国;金雷;刘坤;王国清 | 申请(专利权)人: | 江苏楚淮软件科技开发有限公司 |
| 主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/262;G06V30/19;G06F40/216;G06Q10/10;G06Q50/26 |
| 代理公司: | 南京明杰知识产权代理事务所(普通合伙) 32464 | 代理人: | 张文杰 |
| 地址: | 223001 江苏省淮安市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 纸质 信件 快速 采集 分拣 系统 | ||
1.纸质信件快速采集分拣阅信系统,其特征在于,所述系统包括:纸质信件扫描处理模块、内容处理模块、关注指数计算模块、重要指数计算模块、推送模块;
所述纸质信件扫描处理模块,用于分别对每份信件材料利用采用快速扫描仪单独分开扫描识别,将扫描识别后得到的信件内容自动转入系统录入界面,生成对应每份信件材料的信件清单;信件材料包括若干纸质信件;其中,纸质信件的类别包括申诉书、身份证明、委托代理证明;纸质信件的形式包括手写体、印刷体;对各份信件材料的来源信息进行登记;将所述来源信息和扫描识别得到的材料内容汇总显示在所述信件清单中;所述信件清单包含清单二维码,所述清单二维码中存有清单编号;
所述内容处理模块,用于将每次扫描后得到的信件内容与对应的材料原件进行对比审阅,将对比审阅无误后的信件内容设置自动进入系统待办理界面,进行要素提取;设置办理周期,分别对在办理周期内,概况信息要素分栏中呈现的各概况信息部分进行语义分解,得到对应各份信件材料的诉求部分和申述事实部分;基于各份信件材料对应的诉求部分和申述事实部分的语义文字特征,对各份信件材料进行所属民生舆情热点类别的识别;
所述关注指数计算模块,用于提取在所述办理周期内,于待办理界面中呈现的各份信件材料内容,基于在各份信件材料内容内诉求部分中的特征文字分布情况,对各份信件材料计算关注指数;
关注指数计算模块包括标注区域识别处理单元、第一关注指数计算单元、第二关注指数计算单元、第三关注指数计算单元;
所述标注区域识别处理单元,用于对各份信件材料对应的扫描信件内容进行区域标注,并基于各标注区域的分布特征完成标注区域的整合处理;
所述标注区域识别处理单元包括:
预先在大数据中抓取所有扬言性特征词或者短语、敏感性特征词或者短语,同时将所有扬言性特征词或者短语、敏感性特征词或者短语,汇成特征词库;分别对所述特征词库内各特征词或者短语设置程度等级数;
分别获取对各份信件材料扫描后得到的诉求部分文字内容排版,分别对分属于各类别民生舆情热点的材料进行内容排查,基于所述特征词库,将在各所述材料诉求部分中出现的扬言性特征词或者短语、敏感性特征词或者短语标注显示在所述诉求部分文字内容排版上;一个标注词或者短语对应一个第一标注区域;
捕捉各第一标注区域之间的行间隔字数C,设置间隔字数阈值,若相邻两个第一标注区域之间的行间隔字数C小于所述间隔字数阈值,将所述相邻两个第一标注区域之间的非标注词部分进行标注,生成由两个相邻第一标注区域与间隔非标注区域汇成的第二标注区域
所述第一关注指数计算单元,用于接收所述标注区域识别处理单元中的数据,对各份信件材料计算第一关注指数;
所述第一关注指数计算单元包括:接收所述标注区域识别处理单元中的第一标注区域信息、第二标注区域信息;分别对各份信件材料计算第一关注指数Attention1:
其中,Yai表示在各份信件材料诉求部分中第i个第一标注区域的文本字符长度;Yaj表示在各份信件材料诉求部分中第j个第二标注区域的文本字符长度;A表示在各份信件材料诉求部分中的文本总长度;
所述第二关注指数计算单元,用于接收所述标注区域识别处理单元中的数据,对各份信件材料计算第二关注指数;
所述第二关注指数计算单元包括:接收所述标注区域识别处理单元中的第一标注区域信息、第二标注区域信息;分别对各份信件材料计算第二关注指数Attention2:
Attention2=ΣDgreee(ai)+ΣavDgreee(aj)
其中,Dgreee(ai)表示在各份信件材料诉求部分中第i个第一标注区域对应的程度等级数;avDgreee(aj)表示在各份信件材料诉求部分中第j个第二标注区域对应的平均程度等级数;
所述第三关注指数计算单元,用于接收所述标注区域识别处理单元中的数据,对各份信件材料计算第三关注指数;
所述第三关注指数计算单元包括:
获取各份信件材料在扫描识别前的文本排版,对在所述文本排版中对应诉求部分捕捉出现在各第一标注区域、各第二标注区域的前面、内部、后面的特征符号格式;并将出现各所述特征符号格式的部分逐一标注凸显在扫描识别后得到的诉求部分内容中;其中,所述特征符号格式包括感叹号、问号、异于相邻文本字的字体、异于相邻文本字的字号、异于相邻文本字的字体颜色、下划线、加粗体、高亮显示;
分别对各所述材料计算第三关注指数Attention3:Attention3=∑(R1ai*R2ai)+∑(R1aj*R2aj);其中,R1ai表示在各份信件材料诉求部分中,出现在第i个第一标注区域前面、内部、后面的特征符号格式种类数;R2ai表示在各份信件材料诉求部分中,出现在第i个第一标注区域前面、内部、后面的特征符号格式总个数;R1aj表示在各份信件材料诉求部分中,出现在第j个第二标注区域前面、内部、后面的特征符号格式种类数;R2aj表示在各所述材料诉求部分中,出现在第j个第二标注区域前面、内部、后面的特征符号格式总个数;
所述重要指数计算模块,用于提取在所述办理周期内,于待办理界面中呈现的各份信件材料内容,基于在各份信件材料内容内申述事实部分中的特征文字分布情况,对各份信件材料计算重要指数;
所述推送模块,用于根据各份信件材料对应的关注指数和重要指数,以及各份信件材料对应的清单二维码生成时间,得到各份信件材料的综合推送关注度;基于各份信件材料的综合推送关注度,将待办理界面中的所有信件材料进行整理,得到向工作人员推送的待办理信件清单;
所述推送模块包括:
获取分属于不同民生舆情热点类别向中,各份信件材料对应的第一关注指数Attention1、第二关注指数Attention2、第三关注指数Attention3、重要指数import;将分属于不同民生舆情热点类别向中,各份信件材料按照各自对应的清单二维码生成时间进行排序,得到各材料对应的时间排序序号;
对各材料计算综合推送关注度:
F=[(Attention1+Attention2+Attention3)*import]st
其中,F表示综合推送关注度,st表示各材料对应的时间排序序号;在分属于不同民生舆情热点类别的各份信件材料中,将各份信件材料按照综合推送关注度从大到小进行排序,得到分属于不同民生舆情热点类别的清单编号序列集;按照清单编号序列集内的清单编号排序向工作人员推送待办理的材料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏楚淮软件科技开发有限公司,未经江苏楚淮软件科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210822765.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在线手摇法兰车床
- 下一篇:一种全株玉米生物乙醇生产方法





