[发明专利]一种基于用户背景的社区问答网站标签推荐方法在审

申请号：	201910445656.7	申请日：	2019-05-27
公开（公告）号：	CN110188272A	公开（公告）日：	2019-08-30
发明（设计）人：	吕建;徐锋;姚远;张素威	申请（专利权）人：	南京大学
主分类号：	G06F16/9535	分类号：	G06F16/9535
代理公司：	南京乐羽知行专利代理事务所(普通合伙) 32326	代理人：	李玉平
地址：	210046 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	标签推荐用户背景用户背景信息文本特征建模网站神经网络模型循环神经网络注意力机制动态建模静态建模问题建模问题文本影响动态用户历史真实数据综合考虑关联性预测社区匹配个性化融合分类提问记录学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于用户背景的社区问答网站标签推荐方法。综合考虑了待推荐问题文本信息和用户背景信息及两者的关联性，将标签推荐问题建模为一个基于深度学习的多分类预测问题。方法的核心是深度神经网络模型PcTagger，通过动态建模用户背景信息，解决了已有个性化标签推荐方法中存在的用户背景静态建模难以匹配不同推荐任务的不足。模型主要包括：1)基于循环神经网络和注意力机制的文本特征建模；2)基于用户历史提问记录的用户背景影响动态建模；3)融合文本特征和用户背景影响的标签推荐。在真实数据集上的实验结果显示，与已有的同类标签推荐方法相比，本方法能够显著提高预测精度。

技术领域

本发明涉及一种基于用户背景的社区问答网站标签推荐方法，属于文本标签推荐技术领域。本发明利用序列化的文本内容，以及从用户历史行为中提取的用户背景影响，基于深度神经网络模型，提升了社区问答网站问题标签的推荐精度，有效改善了针对新问题的标签推荐效果。

背景技术

互联网的发展使知识的交流和分享变得方便快捷。以Stackoverflow为代表的社区问答网站为广大技术人员提供了交流问题、分享方法的平台，极大地提升了学习和工作的效率。由于信息增长迅速，这些平台的用户都不同程度地面临信息过载问题，如答案检索困难、问题难以引起关注等。信息过载问题严重影响社区总体活跃度和用户使用体验。为缓解信息过载问题，各平台通常引入标签机制对内容进行索引，并且会自动为用户推荐一定数量的标签。

针对社区问答网站问题的标签推荐属于基于文本内容的标签推荐。在已有的文本标签推荐方法中，一类是基于LDA模型的方法。这类方法使用LDA模型及其变体，基于文本内容计算其主题分布情况，然后根据主题分布计算候选标签被推荐的概率。已有方法中还有一类是基于深度学习的方法。这类方法首先将输入文本离散化表示，然后用特定的深度神经网络模型处理，得到文本的高阶语义特征，最后根据高阶语义特征推荐标签。总的来说，这两类方法都是直接根据文本语义特征推荐标签，诸多已有的工作尝试尽可能地提升语义特征提取的精确度。

然而，单纯的基于文本内容的方法还不足以推荐高质量的标签。首先由于社区问答网站的文本内容的长度是有限的，并且用户在表述问题时极有可能会省略技术领域等信息，所以单纯从文本内容无法得知这一类型的信息，也就无从推荐与此相关的标签。其次，文本歧义性可能造成同一段文本对应多个可能的标签。如在不同的技术领域存在共有的关键词，当关键词出现时可能无法判断所属技术领域，从而产生歧义。所以还有一些标签推荐方法试图引入用户个性化信息。如建立用户的个性化标签列表或从用户历史信息中提取出某种表示作为用户个性化表示。但是这种方式存在用户个性化信息固定，在面对多变的待推荐内容时不能准确反映用户背景的影响。

发明内容

发明目的：已有方法存在用户个性化信息表示固定，面对不同的待推荐内容时无法反映出不同的历史影响，所以提取出的用户背景信息灵活性不足，造成推荐精度低，难以满足实际需求。

针对现有技术中存在的问题与不足，本发明综合考虑待推荐问题的文本信息和当前用户的个性化背景信息，提出了一种新的用户背景影响建模方法。首先从用户的历史记录中采样出一定数量的问题，保存问题的文本及其对应的标签。随后使用相同的文本特征提取模型提取出当前问题文本和采样问题文本的表示，计算两者之间的相关性，并将其映射为一系列权重。然后根据相关性权重将采样问题所包含标签的离散化表示向量加权求和，得到用户背景信息的影响向量。

用户背景提取模型和文本特征提取模型共同组成一个新的标签推荐模型PcTagger。PcTagger结合当前问题文本特征和用户背景信息影响向量给出可能被使用的标签。

技术方案：本发明建立了一个新的针对问答社区问题的标签推荐模型PcTagger。该模型基于深度神经网络，能够准确提取问题的文本特征表示，同时根据当前问题文本与用户历史的相关性动态获取用户个人背景对当前推荐行为的影响向量。融合文本特征向量和历史影响向量，模型为当前问题推荐合适的标签。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910445656.7/2.html，转载请声明来源钻瓜专利网。

上一篇：搜索方法以及装置
下一篇：资讯内容的通知方法、装置、服务器及可读介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于用户背景的社区问答网站标签推荐方法在审

专利文献下载