[发明专利]利用答案相关性排序的评估度量来计算问题相似度的方法有效
申请号: | 201610194522.9 | 申请日: | 2016-03-31 |
公开(公告)号: | CN105893523B | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 兰曼;吴国顺 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用答案相关性排序的评估度量来计算问题相似度的方法,该方法包括:步骤一:在问答知识库中的训练数据集上学习答案排序模型;步骤二:采用快速信息检索从问答知识库中检索出用户问题的相关问题;步骤三:根据学习出的答案排序模型分别对用户问题和相关问题的同一候选答案集进行排序;步骤四:计算问题‑答案相关性排序的评估度量,即斯皮尔曼、皮尔森和肯德尔相关系数;步骤五:将得到的相关系数直接作为问题的相似度得分;或加入到相似度特征集合中训练分类器,然后将分类器输出的概率置信得分作为问题的相似度得分。本发明通过答案的相似度来计算问题的相似度,克服了同一问题具有不同自然语言表述的词汇鸿沟难题。 | ||
搜索关键词: | 利用 答案 相关性 排序 评估 度量 计算 问题 相似 方法 | ||
【主权项】:
1.一种利用答案相关性排序的评估度量来计算问题相似度的方法,其特征在于,该方法包括如下步骤:步骤一:在CQA问答知识库中已有问题‑答案排序信息的训练数据集上学习有监督的答案排序模型;步骤二:采用快速信息检索方法,从问答知识库中检索出与用户问题相关的候选问题集合,其中包含噪声问题;步骤三:根据构建的答案排序模型计算分别得到用户问题和各个相关的候选问题针对同一答案集的相关性排序;步骤四:计算相关性排序的评估度量,即斯皮尔曼、皮尔森和肯德尔相关系数;步骤五:得到的相关系数直接作为用户问题和相关的候选问题的相似度得分;或者加入到问题相似度特征集合中来训练分类器,然后将分类器输出的概率置信得分作为用户问题和相关的候选问题的相似度得分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610194522.9/,转载请声明来源钻瓜专利网。
- 上一篇:固定球阀动载密封型双阀座结构
- 下一篇:全金属夹层密封环及应用其的阀板装置