[发明专利]一种基于半监督学习的用户评论聚类方法有效
申请号: | 201811539726.7 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109783638B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 周宇;苏彦颀;史志成;杨忻莹;黄志球 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06F40/30 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 用户 评论 方法 | ||
本发明公开了一种基于半监督学习的用户评论聚类方法,包括步骤如下:将用户评论处理成后续操作所需形式;将处理后的用户评论转换成向量空间模型并用主成分分析进行降维;使用N‑gram确定用户评论的聚类簇数目K值;构建必连约束和勿连约束;使用COP‑Kmeans聚类算法进行用户评论聚类。本发明提出基于半监督学习的用户评论聚类方法,结合开发人员的领域专业知识,提高了用户评论聚类的准确率,减少了开发人员从用户评论中挖掘信息所需的时间。
技术领域
本发明属于计算机技术领域,尤其涉及一种基于半监督学习的用户评论聚类方法。
背景技术
随着智能设备的广泛应用,移动应用程序(Mobile App)存在大量的用户评论,现在已经成为软件生态系统的重要组成部分。这些用户评论一般分布在主要的在线应用商店,如Google Play和Apple App Store。在用户评论中,包含了大量的有用信息,这些有用信息是开发人员与用户实现交互的一个重要接口。用户可以通过发表用户评论,提出一些新功能的要求及使用过程中遇到的一些问题,此信息对于软件的维护及改进有着至关重要的作用。
在下文中,总结了对用户评论进行聚类的主要相关研究,这些相关研究均发表在国际重要期刊或会议上,具有较高的参考价值。
Harman等人通过识别客户评级与移动应用程序的下载排名之间的相关性,介绍了应用商店挖掘的概念。Iacob和Harrison根据经验评估了移动应用程序用户的使用程度靠用户评论来描述变更请求,发现有23%的用户评论描述了功能请求。此外,Pagano和Malej发现33%的用户评论与需求和用户体验有关,并且开发人员使用用户提供的反馈来收集需求。
Chen等人在2014年ICSE上发表了AR-Miner:Mining Informative Reviews forDevelopers from Mobile App Marketplace,设计了AR-Miner,一种使用半监督学习方法对信息性用户评论进行过滤和排序的方法。他们证明:平均而言,35%的用户评论包含信息内容。Khalid等人报道了一项研究,共有6390个用户评论,旨在将其定性分类为12种类型的投诉。结果表明,超过45%的投诉与开发人员可以解决的问题有关。
Di Sorbo等人设计了SURF,一种总结用户评论以收集新要求的工具。
Panichella等人在2016年FSE上发表论文ARdoc:App Reviews DevelopmentOriented Classifier,提出了ARdoc,这种方法结合了自然语言处理,情感分析和文本分析技术,通过机器学习(ML)算法来检测用户评论中的句子,自动分类应用用户评论中包含的有用反馈,对于执行软件维护和演化任务非常重要。用户评论中包含的ARdoc分类句,对于维护视角非常有用,包括:功能请求,问题发现,信息搜索,信息提供等。这些类别来自Pagano等人描述的应用用户评论中发生的主题分类之间的系统映射以及开发人员关于发展特定通信的讨论中发生的句子类别的分类。具体而言,这种分类法定义为从维护角度对用户评论的反馈进行建模。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811539726.7/2.html,转载请声明来源钻瓜专利网。