[发明专利]社区问答服务中基于主客观上下文的问题转发系统和方法有效

专利信息
申请号: 201410037875.9 申请日: 2014-01-26
公开(公告)号: CN103823844B 公开(公告)日: 2017-02-15
发明(设计)人: 郭亮;阙喜戎;王文东;龚向阳 申请(专利权)人: 北京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司11018 代理人: 夏宪富
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种社区问答CQA服务中基于主客观上下文的问题转发系统和转发方法,该系统根据社区问答服务中用户、话题、问题三者之间的关联关系,为每个用户问题配置话题Topic、社会Social和上下文Context的三维属性,然后综合该三维属性信息分析用户问题的内容及其提问意图,为CQA服务提供一种有效的、更精细的问题转发方法利用相似性计算方法计算用户问题特征与其三维属性相关的三种问题特征的相似度值,作为每个用户问题的三维属性值,再根据这些属性值,将用户问题转发给适宜的候选人集合。本发明弥补了现有CQA服务的技术缺陷,从主客观多角度出发分析用户问题,有助于深层次分析CQA用户问题,为CQA提问用户寻找到潜在的更适宜的回答者,即提供确实有效的问题转发服务。
搜索关键词: 社区 问答 服务 基于 主客观 上下文 问题 转发 系统 方法
【主权项】:
一种社区问答CQA(Community Question and Answering)服务中基于主客观上下文的问题转发系统,其特征在于:该系统根据社区问答服务中用户、话题、问题三者之间的关联关系,为用户的每个问题配置话题Topic、社会Social和上下文Context的三维属性,然后综合该三维属性信息分析用户问题的内容及其提问意图,为CQA服务提供一种有效的、更精细的问题转发方法;该系统设有:爬虫模块、知识库、问题聚类模块、数据预处理模块、特征提取模块、相似度计算模块,问题表示模块、问题转发模块和问题扩展模块;其中:爬虫模块,负责采用其网络爬虫功能抓取现有社区问答服务中的用户数据和问题数据,并将抓取的所有用户数据和问题数据存储于知识库;其中,用户数据包括用户的个人资料、系统维护的用户好友关系、用户关注的问题与话题、用户的提问历史与回答历史;问题数据包括与问题相关的话题、与问题相关的用户、问题与答案列表;知识库,负责存储爬虫模块抓取的所有用户数据和问题数据,以及针对这些数据所执行的全部操作行为记录,包括所有用户、话题、问题及其答案的标识,以供问题聚类模块对用户问题及其答案的历史进行聚类分析,以及问题扩展模块对用户问题进行扩展分析;问题聚类模块,负责根据知识库中存储的用户数据与问题数据,将其中存储的所有用户问题聚类为分别对应该问题中的话题Topic、社会Social和上下文Context的三维属性的三类问题:专家回答的问题、好友回答的问题和上下文相关的问题,再将聚类后的三类问题传递到数据预处理模块进行分析处理;数据预处理模块,设有分词、过滤与匹配三个单元,分别对来自问题聚类模块的三类问题数据进行相应处理,再将处理后的三类问题的三类关键词集合输出到特征提取模块,以供提取特征;其中,分词单元负责对问题内容进行分词,且对中文文本和外文文本分别根据不同的分词方法进行处理;过滤单元用于过滤和删除问题文本中的停用词和没有实际涵义的虚拟动词与形容词;匹配单元负责提取经过分词和过滤后的问题中的关键词集合;特征提取模块,负责根据数据预处理模块传递的三类关键词集合,分别提取每类问题的相关特征集合:专家问题特征集合Expertise:{feature1,feature2,...,featurei,...,featureI},社交问题特征集合Socializing:{feature1,feature2,...,featurej,...,featureJ}和与上下文相关的其他问题特征集合Others:{feature1,feature2,...,featurek,...,featureK};以便将该三类问题特征用于相似度计算模块计算用户问题的三维属性值;其中,自然数i和I、j和J、以及k和K分别是Expertise特征集合、Socializing特征集合和Others特征集合中的特征序号及其总个数;问题扩展模块,负责根据用户输入的问题以及知识库中存储的、包括该用户的个人资料及其历史行为、该用户的好友资料及其好友的历史行为的相关信息,对该用户问题进行扩展:将简短的用户问题扩展为信息丰富的问题文本,使得扩展后的问题文本包含更多的关键词;再将该问题文本传送给问题表示模块进行后续处理;问题表示模块,负责利用经典的语言模型描述来自问题扩展模块的用户问题文本的关键词序列,并采用特征提取方法选取该问题文本的特征Question:{feature1,feature2,...,featurem,...,featureM},并将该问题文本的特征Question与特征提取模块的三种问题特征Expertise、Socializing和Others一起传送到相似度计算模块,计算其相似度值;式中,自然数m和M分别是问题文本的特征Question集合中的特征序号及其总个数;相似度计算模块,负责采用包括余弦相似度计算公式的相似度计算方法,分别计算用户问题文本特征Question与三种问题特征Expertise、Socializing和Others的三个相似度值,用于分别表示该用户问题的三维属性Topic、Social和Context;再将该用户问题的三维属性值传递到问题转发模块,以供指导用户问题的转发;问题转发模块,负责根据来自相似度计算模块的用户问题的三维属性值Topic、Social和Context,将用户问题转发到适宜的回答者候选人集合中,最后,将提问者、问题和回答者的信息都存储于知识库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410037875.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top