[发明专利]一种应用于开源问答社区中回答者推荐方法在审
申请号: | 201910019945.0 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109657048A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 朱良堃;廖志芳;宋炳政 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答社区 用户影响力 知识发现技术 计算复杂度 时间影响 数据挖掘 问题网络 问题文本 综合考虑 构建 应用 | ||
本发明公开了一种应用于开源问答社区中回答者推荐方法,属于数据挖掘与知识发现技术领域。本发明提出的回答者推荐方法解决了传统推荐方法精度较低,计算复杂度高等缺点,它首先构建用户‑问题网络来计算每个用户的用户影响力,然后根据问题文本内容来计算问题相似性,最后综合考虑用户影响力,问题相似性和时间影响因素,对回答者进行评分。该方法缩短了开源问答社区中回答者推荐的时间,提高了回答者推荐的精确度。
技术领域
本发明涉及一种应用于开源问答社区中回答者推荐方法,属于数据挖掘与知识发现技术领域。
背景技术
社区问答网站是一种用户可以在其中提出问题,然后由其他用户去回答的社区。社区问答网站的出现,不仅为用户提供了一个快捷的问答方式,同时也成为了特定领域重要的知识储备库,社区问答网站也变得越来越重要。通过使用社区问答网站,用户可以快速找到自己领域的问题和一些答案。没有找到解决自己问题的方法,用户也可以在网站中进行提问,请求具有相关知识的人进行回答。社区问答网站的出现为用户寻找相关领域的知识提供了极大的方便,但是也带来了新的挑战。这之中最重要的一个就是大多数新问题无法在短时间内传递给社区问答网站中适合回答这个问题的用户,导致新问题的答复效率不尽如人意。因此,研究如何在短时间内找到新问题最合适的回答者是非常有必要的。一方面,回答者推荐可以减少提问者的等待时间,提升用户体验。另一方面,用户也更有可能获得一个高质量的答案。传统的推荐方法存在计算复杂度高,精度低,推荐时效性低等特点。因此考虑将用户影响力,问题相似性,答案提交时间等因素加入推荐方法,从而构建出一个新的方法。
发明内容
本发明的目的是为了解决开源问答社区中回答者推荐计算复杂度高,精度较低,时效性低等特点,提出的一种新的基于用户影响力和时间的回答者推荐方法。
为了实现上述目的,本发明的技术方案是:
步骤1:问答数据的筛选和清洗,从原始数据中选取我们所需要的数据。
步骤2:对步骤1中获取的数据进行分析,我们可以得到每个问题以及其对应的答案,然后构建用户- 问题网络,从而计算用户影响力。
步骤3:利用步骤1中获取的问题数据,我们对其进行简单的文本处理,然后可以计算问题之间的相似性,找到相似的问题。
步骤4:结合步骤2与步骤3的用户影响力与问题相似性,再考虑时间因素的影响,对每个回答者进行评分
步骤5:根据步骤4中的回答者评分,选取其中评分高的若干回答者进行推荐。
所述的方法步骤1包括以下步骤:
步骤1.1:因为我们的方法涉及到时间因素,所以要从一段连续的时间段内抽取数据使得数据满足要求。
步骤1.2:选取比较热门的标签下的问答数,这些数据更具代表性。
步骤1.3:从原始数据中获取到相应的数据之后,我们可以根据需要对这些数据进行清洗,清洗数据的目的是为了去掉一些无用的数据,比如没有被回答的问题,或者回答者信息丢失的问题等等。
所述的方法步骤2包括以下步骤:
步骤2.1:用户-问题网络的构建。开源问答社区中用户与问题之间的关系是一个多对多的关系,一个问题可以被多个用户回答,一个用户也可以回答多个问题。所以可以用一个无向加权的异构网络G<V,E> 用来表示用户-问题网络。其中节点V可以是用户节点,也可以表示问题节点,边E分为两种,一种是用户-问题的边,用来表示用户与问题之间的联系,一种是用户-用户的边,用来表示两个用户对相同问题的兴趣关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910019945.0/2.html,转载请声明来源钻瓜专利网。