[发明专利]基于主题模型和机器学习的回答者推荐方法有效

专利信息
申请号: 201710733139.0 申请日: 2017-08-24
公开(公告)号: CN107562836B 公开(公告)日: 2020-10-30
发明(设计)人: 张莉;王丽婷;蒋竞;黎功辉 申请(专利权)人: 北京航空航天大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06N20/00
代理公司: 北京永创新实专利事务所 11121 代理人: 祗志洁
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 主题 模型 机器 学习 回答者 推荐 方法
【说明书】:

发明提出一种基于主题模型和机器学习的回答者推荐方法,属于软件工程与机器学习领域。本发明同时考虑了用户的专业知识、主题和活跃度,扩展隐含的狄利克雷模型得到回答者推荐模型,将推荐问题转化为机器学习的分类问题,将用户主题分布、用户主题专业知识分布和用户主题活跃度分布转化为特征向量,得到用户的主题特征、专业知识特征和活跃度特征,从而得到一种问题回答者的推荐方法。本发明方法直观、简单、有效,在一定程度上解决了现有的问题回答者推荐方法缺乏对推荐的回答者能够及时回答的可能性以及对新问题推荐回答者的准确性等问题,并且能够更好地提高对问题推荐回答者的有效性和可用性。

技术领域

本发明涉及软件工程及机器学习领域,具体地,涉及一种基于主题模型和机器学习的回答者推荐方法。

背景技术

随着问答社区的发展,越来越多的互联网用户通过问答社区获取所需信息。由于大型互动问答系统中每天产生大量的新问题,提问者不得不等待较长的时间,问题才能得到响应和解决;同时,回答者不得不在成千上万的未解决的问题中浏览查找自己感兴趣的问题回答,非常费时费力,从而利用回答者推荐方法来准确、快速地获取所需信息受到了越来越多的重视。

问答社区中问题回答者推荐问题,致力于解决问答社区中由于海量信息给提问者和回答者造成的困难,帮助问答社区中回答者便捷地得到自己感兴趣的问题,同时减少提问者问题得到解决的等待时间。根据问题的主题分类,利用主题相似性对问题感兴趣的回答者进行推荐,并进行相应回答的验证是比较容易实现的,绝大多数问答社区的回答者推荐都利用此类推荐方法进行验证。然而,该方法只能解决与问题主题相似的回答者进行推荐,但不能保证被推荐的回答者是否能够及时的回答提问者的问题,因此缺乏回答者推荐的有效性,以及问题被回答的可能性。本发明在考虑主题相似性的同时考虑了回答者的活跃度,并在原有的训练模型的语料库中加入了用户的评论信息,进一步精确了数据的分析精准度,基于对这两个方面的充分考虑,可以使得问题不仅为其推荐主题相似的回答者,而且该回答者最有可能回答该问题,从而可以减少问题得到解决的等待时间。

现有的基于Stack Overflow问答社区进行回答者推荐的研究,例如Yang Liu等人提出的CQARank方法和Jose等人提出的RankSLDA方法等,它们大都应用主题模型进行回答者推荐问题的研究工作。目前大部分回答者推荐模型只考虑了问题主题相似性、回答者专业知识,针对这两个因素进行相关的主题模型的研究,针对回答者的活跃程度在问答社区中也是一个重要的回答者推荐因素,然而已有的这些推荐方法不能做到活跃度这方面的回答者推荐,因此这些回答者推荐方法缺乏一定的有效性。

目前已经证明,已有的回答者推荐方法进行帮助问答社区中的问题推荐回答者以及提问者等待问题解决的时间的有效性和及时性存在问题。此外,现有的一些推荐方法的语料库缺乏用户评论信息的数据,从而导致回答者推荐的准确度有待提高,相比已有的推荐方法在回答者推荐方面的研究并不具备显著优势。

发明内容

针对当前问答社区中涌现的大量新问题,使得回答者推荐方法复杂化、多样化等特点,以及现有的回答者推荐方法具有面向Stack Overflow问答社区缺乏的有效性,现有推荐方法对语料库信息考虑的不够充分等问题,本发明提出一种基于主题模型和机器学习的回答者推荐方法。该方法可以较好地解决上述问题,使得针对主题模型和机器学习的回答者推荐方法能够应用到Stack Overflow问答社区中,为新问题提供回答者推荐列表。

本发明是一种基于主题模型和机器学习的回答者推荐方法,具体包括如下步骤:

(一)基于扩展隐含的狄利克雷主题模型构建回答者推荐模型,所述回答者推荐模型包括三部分:用户的专业知识、用户的主题和用户的活跃度;包括如下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710733139.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top