[发明专利]问答的质量确定方法、装置、服务器和存储介质在审
| 申请号: | 201810580409.3 | 申请日: | 2018-06-07 | 
| 公开(公告)号: | CN108960574A | 公开(公告)日: | 2018-12-07 | 
| 发明(设计)人: | 姚后清;孟子扬;吴广发;田彤;施鹏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 | 
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/30 | 
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 | 
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 向量表示 存储介质 问答数据 问题内容 质量确定 服务器 质量分析模型 用户体验 质量数据 准确率 构建 | ||
1.一种问答的质量确定方法,其特征在于,包括:
确定问答数据中问题内容的向量表示以及回答内容的向量表示;
向预先构建的问答质量分析模型输入所述问题内容的向量表示和所述回答内容的向量表示,得到所述问答数据的质量数据。
2.根据权利要求1所述的方法,其特征在于,所述问答质量分析模型的构建,包括:
确定样本问题内容的向量表示;
确定所述样本问题内容的第一回答内容的向量表示以及所述样本问题内容的第二回答内容的向量表示;
将所述样本问题内容的向量表示,第一回答内容的向量表示,以及第二回答内容的向量表示作为对级排序学习模型的输入,所述第一回答内容与所述第二回答内容的排序结果作为所述对级排序学习模型的输出进行训练,得到问答质量分析模型。
3.根据权利要求1所述的方法,其特征在于,确定问答数据中问题内容的向量表示,包括:
向预先训练的循环神经网络模型输入问题内容中各词语的向量表示,得到问题内容的向量表示。
4.根据权利要求1所述的方法,其特征在于,确定回答内容的向量表示,包括:
向预先训练的卷积神经网络模型输入回答内容中各词语的向量表示,得到回答内容的向量表示。
5.根据权利要求1所述的方法,其特征在于,还包括:
确定所述问答数据中问题内容与回答内容的相关度;
依据所述问答数据的质量数据以及所述相关度,对所述问答数据的质量数据进行修正。
6.根据权利要求5所述的方法,其特征在于,确定所述问答数据中问题内容与回答内容的相关度,包括:
依据问题内容中包含的关键词与回答内容中包含的关键词之间的关键词相似度,问题内容所属类别与回答内容所属类别之间的聚合相似度,问题内容的标签与回答内容的标签之间的标签相似度,以及问题内容的主题与回答内容的主题之间的主题相似度中的至少一项,确定问题内容与回答内容的相关度。
7.根据权利要求6所述的方法,其特征在于,问题内容所属类别与回答内容所属类别之间的聚合相似度的确定,包括:
确定语料库中包括的各词语的词向量;
对各词语的词向量作聚类处理得到各词语所属的聚类簇;
依据问题内容中词语所属的聚类簇与回答内容中词语所属的聚类簇得到问题内容所属类别与回答内容所属类别之间的聚合相似度。
8.根据权利要求1所述的方法,其特征在于,还包括:
获取回答内容的用户反馈行为数据,以及反馈行为数据所属用户的授信级别;
依据所述反馈行为数据以及所述授信级别对回答内容的质量数据进行修正。
9.一种问答的质量确定装置,其特征在于,包括:
向量模块,用于确定问答数据中问题内容的向量表示以及回答内容的向量表示;
质量模块,用于向预先构建的问答质量分析模型输入所述问题内容的向量表示和所述回答内容的向量表示,得到所述问答数据的质量数据。
10.根据权利要求9所述的装置,其特征在于,还包括构建模块,所述构建模块用于构建所述问答质量分析模型,包括:
确定样本问题内容的向量表示;
确定所述样本问题内容的第一回答内容的向量表示以及所述样本问题内容的第二回答内容的向量表示;
将所述样本问题内容的向量表示,第一回答内容的向量表示,以及第二回答内容的向量表示作为对级排序学习模型的输入,所述第一回答内容与所述第二回答内容的排序结果作为所述对级排序学习模型的输出进行训练,得到问答质量分析模型。
11.根据权利要求9所述的装置,其特征在于,所述向量模块具体用于:
向预先训练的循环神经网络模型输入问题内容中各词语的向量表示,得到问题内容的向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810580409.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





