[发明专利]基于本体的稿件自动审查方法在审
申请号: | 201510156543.7 | 申请日: | 2015-04-03 |
公开(公告)号: | CN104751230A | 公开(公告)日: | 2015-07-01 |
发明(设计)人: | 刘永坚;白立华;杨朝阳;杨慧;曾瑞;李文忠 | 申请(专利权)人: | 武汉理工大学;时代出版传媒股份有限公司 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q50/00;G06F17/30 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 张惠玲 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 本体 稿件 自动 审查 方法 | ||
技术领域
本发明涉及数字出版物技术领域,尤其涉及到一种用于数字信息处理技术的基于本体的稿件自动审查方法。
背景技术
知识处理是信息技术发展的必然趋势,随着对知识应用要求越来越高,传统的知识数据库系统已经不能满足新的需求,所以将本体引用到知识工程中,将本体相关原理技术运用到知识库的开发中。
本体知识系统是20世纪70年代后期,专家系统、知识系统和知识密集型的信息系统的构建技术发展而形成知识工程,所建立的系统简称为知识系统(knowledge-based systems)。知识系统是人工智能学科最重要的工业化和商业化产物。知识系统用于辅助人们进行问题求解,如检测信用卡诈骗、加速船舶设计、辅助医疗诊断、使科学软件更加智能化、向全体决策人员提供金融服务、产品质量的评价和广告宣传、支持电子网络的服务恢复。
随着知识系统的发展与流行,知识服务也成为了信息技术发展的必然趋势,基于本体的知识工程应用开始受人瞩目,在数字出版行业的知识服务是知识工程新的应用领域,目前人们还在依靠人工方式进行稿件审核,还没有一种自动化的基于领域本体的审稿技术。
发明内容
本发明所要解决的技术问题是正对上述存在的技术不足,提供一种利用知识本体技术构件个体,能够对个体稿件进行自动审核,并返回审稿结果,大幅度降低人员工作强度,提高出版效率的基于本体的稿件自动审查方法。
本发明解决其技术问题所采用的技术方案是:
基于本体的稿件自动审查方法,其特征在于,包括有如下步骤:
选择领域本体:根据稿件所属领域选择相应的领域本体模型,该模型是在其他领域模型系统中已经构建好的、包含类、对象属性、数据属性和规则信息的本体模型,而且相应的个体模型已经搭建好。
稿件预处理获取构建词表:在计算机系统中对稿件进行拆分处理,并对其中的文本信息使用分词工具进行分词且过滤掉没有用的虚词、助词等停用词后得到一个构建词表,该词表用于构建与稿件对应的个体模型,词表保存有相应的位置信息。
稿件个体模型自动构建:稿件个体模型自动构建包括个体识别、数据属性与对象属性填充,具体实现分为以下几个步骤:
个体识别:以根据所选领域模型类信息为参照标准类,在计算机系统中采用相应的分类算法或工具对构建词表分类,计算其与参照标准类词语的相似度,根据相似度阀值标识出构建词表中的个体。
为个体填充数据属性、对象属性:将对应参照标准类下的个体名称和数据属性名称、对象属性名称在构建词表中进行匹配;使用相似度计算的方式匹配,匹配范围是在与构建词表中个体附近的词语进行匹配;当匹配程度达到一个阈值时,将对应的文本数据标填充到数据属性和对象属性,并标识出该文本为相应属性。
自动审稿:自动审稿包括数据属性匹配、对象属性匹配结果以及相应结果信息返回,返回信息作为审稿结果返回给用户,具体实现如下:
数据属性匹配:根据所选领域本体模型中与构建词表匹配成功的个体的数据属性与识别出的个体数据属性进行匹配,匹配度达到一定阀值则匹配成功,否则匹配失败返回个体信息数组(匹配类型即数据属性匹配、个体信息即被参照个体与稿件个体信息、源信息即被参照数据属性源信息与稿件数据属性源信息)。
对象属性匹配:根据所选领域本体模型中与构建词表匹配成功的个体的对象属性与识别出的个体对象属性进行匹配,匹配度达到一定阀值则匹配成功,否则匹配失败返回个体信息数组(匹配类型即对象属性匹配、个体信息即被参照个体与稿件个体信息、源信息即被参照对象属性源信息与稿件数据属性源信息)。
匹配方法:根据所选领域本体模型中与词库匹配成功个体属性为匹配标准,采用相似度计算方法或者工具计算对应属性之间的相似度,当相似度达到一定阀值则匹配成功,低于阀值则匹配失败。
返回信息处理:根据返回信息数组对逻辑有误的地方标红,且将信息编号返回给用户查看。
本发明的原理是根据稿件所属领域选择相应的领域本体模型,以该模型为被参照本体模型;将作者的稿件进行一系列预处理获得用于构建杆件个体模型的词库;通过个体识别、数据属性与对象属性填充构建稿件个体模型;然后通过对被参照模型与稿件个体模型的属性匹配完成自动审稿并返回审稿结果信息。
本发明的有益效果是:
本发明方法利用知识本体技术构件个体,能够对个体稿件进行自动审核,并返回审稿结果,大幅度降低人员工作强度,提高了出版效率。
附图说明
图1是本发明实施例的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学;时代出版传媒股份有限公司,未经武汉理工大学;时代出版传媒股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510156543.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络订票的订票请求讯号处理方法及系统
- 下一篇:一种河口区咸淡水比例测量方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理