[发明专利]基于灾情表单自动生成灾情报告的方法及系统在审
申请号: | 201710400461.1 | 申请日: | 2017-05-31 |
公开(公告)号: | CN107315728A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 张鹏;张云霞;范春波;张妮娜;孙舟;张弛;吕明;刘南江;丁一;汪洋;刘哲;陆野;费伟;任景军;牟新利 | 申请(专利权)人: | 民政部国家减灾中心;北京方位捷讯科技有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/30 |
代理公司: | 北京酷爱智慧知识产权代理有限公司11514 | 代理人: | 孟凡臣 |
地址: | 100124*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 灾情 表单 自动 生成 报告 方法 系统 | ||
技术领域
本发明涉及信息科学技术领域,具体涉及基于灾情表单自动生成灾情报告的方法及系统。
背景技术
目前,由于灾情报告公文包括以下几点特殊性:不同数量级灾情指标的差异化进位格式、标准行政区划的复杂表述格式、长短句间的断句和标点使用规则等。由于上述灾情报告公文的特殊性,使得基于现有技术无法准确地按照公文要求对结构化的灾情表单进行文本转化,形成符合自然语言规则的灾情报告,因此,需要人工制作灾情报告,这增加了制作报告的时间,提高了人工成本,同时人工制作过程中极易出错。
发明内容
针对现有技术中的缺陷,本发明提供的基于灾情表单自动生成灾情报告的方法及系统,能够依据结构化的灾情表单数据,按公文语言格式标准化、自动地化生成灾情报告文本。
第一方面,本发明提供的一种基于灾情表单自动生成灾情报告的方法,包括:
获取灾情的灾情表单;
提取所述灾情表单中的受灾区域,从数据库中提取所述受灾区域包括的行政区域,根据提取的行政区域生成受灾区域文本段落;
提取所述灾情表单中的灾情指标数据,将所述灾情指标数据转化为标准指标数值后填入预先设定的指标文本中形成灾情文本段落;
连接所述受灾区域文本段落和所述灾情文本段落得到符合自然语言规则的灾情报告。
本实施例提供的基于灾情表单自动生成灾情报告的方法,以结构化表单数据为基础,按照一定自然语言规则自动化的生成灾情报告文本,不仅极大提升了业务工作效率、提高了灾情发布效率,而且将灾情报告中出现数据错误的概率将至最低。
优选地,所述提取所述灾情表单中的受灾区域,从数据库中提取所述受灾区域包括的行政区域,根据提取的行政区域生成受灾区域文本段落,包括:
提取所述灾情表单中的受灾区域;
从数据库中提取所述受灾区域包括的行政区域形成受灾区域列表;
统计所述受灾区域列表中行政区域的区划名称的字数得到总文字数量;
若所述总文字数量超过预设的字数阈值,则缩减所述受灾区域列表中的行政区域的区划名称,否则,保持所述受灾区域列表中的行政区域的区划名称不变;
根据所述受灾列表中行政区域的区划名称生成受灾区域文本段落。
优选地,所述缩减所述受灾区域列表中的行政区域的区划名称,包括:
根据预先构建的区划名称缩写词库,对所述受灾区域列表中的行政区域的区划名称采用缩写进行替换。
优选地,所述缩减所述受灾区域列表中的行政区域的区划名称,包括:按照区划继承关系,对所述受灾区域列表中的行政区域进行合并,得到缩减后的受灾区划列表。
优选地,所述形成受灾区域列表之前还包括:根据预先构建的第一列表过滤所述受灾区域列表,剔除所述受灾区域列表中的特殊区域,所述特殊区域包括空头市和直管县,所述第一列表包括所有空头市和直管县;
所述根据所述受灾列表中行政区域的区划名称生成受灾区域文本段落,包括:将所述特殊区域与所述受灾区域列表中的行政区划名称进行挂接,生成受灾区域文本段落。
优选地,提取所述灾情表单中的灾情指标数据,将所述灾情指标数据转化为标准指标数值后填入预先设定的指标文本中形成灾情文本段落,包括:
提取所述灾情表单中的灾情指标数据,所述灾情指标数据标注有指标类别,一种指标类别对应一种灾情指标,每个在灾情指标包含至少一个子级指标;
对不同指标类别的灾情指标数据分别进行如下操作:将所述灾情指标数据转化为标准指标数值,确定每个所述标准指标数值对应的子级指标,将所述标准指标数值写入各子级指标对应的指标文本中,连接各个子级指标的指标文本得到单类指标文本;
连接所有单项指标文本得到形成灾情文本段落。
优选地,所述将所述灾情指标数据转化为标准指标数值,包括:
根据所述灾情指标数据确定数量级,
根据所述数量级对所述灾情指标数据进行进位处理,并添加与所述数量级对应的单位词得到标准指标数据。
优选地,还包括:
对各类灾情指标的子级指标写入数量进行统计;
若各类灾情指标的子级指标写入数量均为1,则所述连接所有单项指标文本得到形成灾情文本段落包括:采用一级分割符号连接所有单项指标文本得到形成灾情文本段落,所述灾情文本段落末尾用句号匹配;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民政部国家减灾中心;北京方位捷讯科技有限公司,未经民政部国家减灾中心;北京方位捷讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710400461.1/2.html,转载请声明来源钻瓜专利网。