[发明专利]一种科学新闻标题的多层次多分类方法有效
申请号: | 201610114278.0 | 申请日: | 2016-03-01 |
公开(公告)号: | CN105760524B | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 朱全银;邵武杰;唐海波;周泓;李翔;胡荣林;金鹰;曹苏群;潘舒新 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 223005 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 科学 新闻标题 多层次 分类 方法 | ||
本发明公开了一种科学新闻标题的多层次多分类方法,本发明通过新闻标题,使用多层次多分类方法对科学类新闻进行分类,将科学类新闻分为生命科学、医学科学、地球科学、数学物理科学、化学科学、信息科学六类,多层次为多层对待分类的科学类新闻文本分类进行判断其类别,首先判断待分类的新闻文本是否为信息类科学类新闻,如果是则结束,否则判断待分类的新闻文本是否为生命科学类或医学科学类新闻,或者为地球科学类、数学物理科学类和化学科学类新闻三者之一,前者进一步再判断为生命科学类新闻,还是医学科学类新闻,后者再进一步判断为地球科学类、数学物理类或化学科学类新闻中的一类;本发明解决了Web网页上对科学类新闻详细分类的问题,提高了Web网页上科学类新闻分类后的使用价值。
技术领域
本发明属于文本挖掘的文本分类领域,特别涉及一种科学新闻的多层次多分类方法,可应用于对科学新闻的详细分类,提高科学新闻分类后的使用价值。
背景技术
文本分类方法是解决从Web网页中杂乱的文本信息提取分类出详细类别的一种重要方法,随着科技的不断发展,网络已经成为科学类新闻的主要来源。近年来,如何对网上的各类信息进行科学的组织和管理日益成为一个重要的研究领域,研究文本分类的方法也比较广泛,如向量空间距离测度分类算法、K最邻近分类算法、支持向量机算法、神经网络算法、决策树分类算法等。
2009 年到 2015 年,朱全银等人给出了 Web 文本处理的办法 (朱全银,潘禄,刘文儒,李翔,张永军,刘金岭. Web科技新闻分类抽取算法. 淮阴工学院学报.2015. Vol.24(5):18-24;李翔, 朱全银. 联合聚类和评分矩阵共享的协同过滤推荐. 计算机科学与探索. 2014. Vol.8(6):751-759; Suqun Cao, Quanyin Zhu, Zhiwei Hou. CustomerSegmentation Based on a Novel Hierarchical Clustering Algorithm. 2009, p:1-5;Quanyin Zhu, Sunqun Cao. A Novel Classifier- independent Feature SelectionAlgorithm for Imbalanced Datasets. 2009, p:77-82; Suqun Cao, Zhiwei Hou,Liuyang Wang, Quanyin Zhu. Kernelized Fuzzy Fisher Criterion based ClusteringAlgorithm. DCABES 2010, p:87-91; Quanyin Zhu, Yunyang Yan, Jin Ding, JinQian. The Case Study for Price Extracting of Mobile Phone Sell Online. 2011,p:282-285; Quanyin Zhu, Suqun Cao, Pei Zhou, Yunyang Yan, Hong Zhou.Integrated Price Forecast based on Dichotomy Backfilling and DisturbanceFactor Algorithm. International Review on Computers and Software, 2011, Vol.6(6):1089-1093; Suqun Cao, Gelan Yang, Quanyin Zhu, Haihei Zhai. A novelfeature extraction method for mechanical part recognition. Applied Mechanicsand Materials, 2011, p:116-121; Pei Zhou, Quanyin Zhu. Multi-factor MatchingMethod for Basic Information of Science and Technology Experts Based on WebMining. 2012, P:718-720; Jianping Deng, Fengwen Cao, Quanyin Zhu, Yu Zhang.The Web Data Extracting and Application for Shop Online Based on CommoditiesClassified. Communications in Computer and Information Science, Vol.234(4):120-128; Hui Zong, Quanyin Zhu, Ming Sun, Yahong Zhang. The case study forhuman resource management research based on web mining and semantic analysis.Applied Mechanics and Materials, Vol.488, 2014 p:1336-1339).
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610114278.0/2.html,转载请声明来源钻瓜专利网。