[发明专利]根据基于社区的问题回答档案库的自动常问问题汇编在审
| 申请号: | 201180022734.4 | 申请日: | 2011-04-06 |
| 公开(公告)号: | CN102884527A | 公开(公告)日: | 2013-01-16 |
| 发明(设计)人: | 蔡达成;明朝燕 | 申请(专利权)人: | 新加坡国立大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;李春晖 |
| 地址: | 新加坡*** | 国省代码: | 新加坡;SG |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 根据 基于 社区 问题 回答 档案 自动 汇编 | ||
1.一种根据基于社区的问题回答(CQA)数据来生成常问问题(FAQ)数据的方法,所述方法包括:
接收多个数据源和具有一个或多个题目的主题,其中每个数据源具有与一个或多个主题相关联的数据;
生成所述多个数据源的题目层次;
基于所述题目层次将多个CQA数据分类成一个或多个题目,其中所述CQA数据包含多个问题回答对;
基于所述分类从所述CQA数据中选择多个问题回答对;以及
使用选择的所述CQA数据的问题回答对来生成FQA数据。
2.根据权利要求1所述的方法,其中,所述多个数据源的主题和题目分层次地组织在所述题目层次内。
3.根据权利要求1所述的方法,其中,将所述多个CQA数据进行分类包括使用基于质心的分类器,其中所述CQA数据的题目具有与所述题目相关联的多个原型的质心。
4.根据权利要求3所述的方法,其中,与所述题目相关联的多个原型的质心基于分配给与所述题目相关联的多个原型的权重。
5.根据权利要求1所述的方法,其中,从所述CQA数据中选择多个问题回答对包括:
针对所述CQA数据的每个题目,将多个CQA数据分组成多个簇,其中簇中的CQA数据共享与所述题目相关联的一个或多个特征,并且CQA数据的簇具有表示所述簇的题目的质心。
6.根据权利要求5所述的方法,还包括:
针对CQA数据的每个簇:
从所述簇中选择多个代表性数据;
测量所述代表性数据的质量;以及
生成所述代表性数据的每个问题回答对的代表性得分。
7.根据权利要求6所述的方法,其中,测量所述代表性数据的质量包括:生成所述代表性数据的质量得分。
8.根据权利要求6所述的方法,其中,生成所述代表性数据的代表性得分包括:计算所述CQA数据的问题回答对与所述簇的质心之间的距离。
9.根据权利要求6所述的方法,其中,生成所述代表性数据的每个问题回答对的代表性得分还包括:基于所述代表性得分对所述簇中的CQA数据的问题回答对进行排名。
10.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质存储有用于根据基于社区的问题回答(CQA)数据来生成常问问题(FAQ)数据的可执行计算机程序代码,所述计算机程序代码包括用于执行如下步骤的代码:
接收多个数据源,数据源具有与一个或多个主题相关联的数据,并且主题具有一个或多个题目;
生成所述多个数据源的题目层次;
基于所述题目层次将多个CQA数据分类成一个或多个题目,其中所述CQA数据包含多个问题回答对;
基于所述分类从所述CQA数据中选择多个问题回答对;以及
使用选择的所述CQA数据的问题回答对来生成FQA数据。
11.根据权利要求10所述的计算机可读介质,其中,所述多个数据源的主题和题目分层次地组织在所述题目层次内。
12.根据权利要求10所述的计算机可读介质,其中,用于将所述多个CQA数据进行分类的计算机程序代码包括用于使用基于质心的分类器的计算机程序代码,其中所述CQA数据的题目具有与所述题目相关联的多个原型的质心。
13.根据权利要求10所述的计算机可读介质,其中,用于从所述CQA数据中选择多个问题回答对的计算机程序代码包括用于执行以下步骤的计算机程序代码:
针对所述CQA数据的每个题目,将多个CQA数据分组成多个簇,其中簇中的CQA数据共享与所述题目相关联一个或多个特征,并且CQA数据的簇具有表示所述簇的题目的质心。
14.根据权利要求13所述的计算机可读介质,还包括用于执行以下步骤的计算机程序代码:
针对CQA数据的每个簇:
从所述簇中选择多个代表性数据;
测量所述代表性数据的质量;以及
生成所述代表性数据的每个问题回答对的代表性得分。
15.根据权利要求14所述的计算机可读介质,其中,用于测量所述代表性数据的质量的计算机程序代码包括用于生成所述代表性数据的质量得分的计算机程序代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新加坡国立大学,未经新加坡国立大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180022734.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于刷新半导体存储器装置的技术
- 下一篇:修改解调以避免干扰





