[发明专利]问答方法、装置与电子设备在审
| 申请号: | 202110529809.3 | 申请日: | 2021-05-14 |
| 公开(公告)号: | CN115344674A | 公开(公告)日: | 2022-11-15 |
| 发明(设计)人: | 张士卫;闫昭;饶孟良 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35 |
| 代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 问答 方法 装置 电子设备 | ||
1.一种问答方法,其特征在于,包括:
获取目标问题;
在已构建的文档切片库中,根据N个第一文档切片中每个第一文档切片的特征值,确定每个第一文档切片与所述目标问题之间的第一匹配度,其中,所述文档切片库中包括所述N个第一文档切片、以及每个所述第一文档切片的特征值,所述N为正整数;
根据每个所述第一文档切片与所述目标问题之间的第一匹配度,从所述N个第一文档切片中确定出所述目标问题的答案切片。
2.根据权利要求1所述的方法,其特征在于,所述根据N个第一文档切片的特征值,确定每个第一文档切片与所述目标问题之间的第一匹配度,包括:
针对所述N个第一文档切片中的每个所述第一文档切片,根据所述第一文档切片的特征值,确定所述第一文档切片与所述目标问题之间的第二匹配度;
确定所述第一文档切片中标题与所述目标问题之间的第三匹配度、所述第一文档切片中正文与所述目标问题之间的第四匹配度、所述第一文档切片的正文中句子与所述目标问题之间的第五匹配度中的至少一个匹配度;
根据所述第二匹配度,以及所述第三匹配度、所述第四匹配度和所述第五匹配度中的至少一个匹配度,确定所述第一文档切片与所述目标问题之间的第一匹配度。
3.根据权利要求2所述的方法,其特征在于,确定所述第一文档切片的正文中句子与所述目标问题之间的第五匹配度,包括:
确定所述第一文档切片的正文中每个句子与所述目标问题之间的匹配度;
将所述第一文档切片的正文中每个句子与所述目标问题之间的匹配度中的最大匹配度,确定为所述第五匹配度。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第二匹配度,以及所述第三匹配度、所述第四匹配度和所述第五匹配度中的至少一个匹配度,确定所述第一文档切片与所述目标问题之间的第一匹配度,包括:
将所述第二匹配度、所述第三匹配度、所述第四匹配度和所述第五匹配度之和,确定为所述第一文档切片与所述目标问题之间的第一匹配度。
5.根据权利要求2所述的方法,其特征在于,所述第一文档切片的特征值包括所述第一文档切片中每个词的第一特征值,所述根据所述第一文档切片的特征值,确定所述第一文档切片与所述目标问题之间的第二匹配度,包括:
根据所述第一文档切片中每个词的第一特征值,确定所述目标问题中每个词在所述第一文档切片中的第一特征值;
根据所述目标问题中每个词在所述第一文档切片中的第一特征值,确定所述第一文档切片与所述目标问题之间的第二匹配度。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
获取目标类型文档集,所述目标类型文档集包括多个目标类型文档;
根据目标类型文档的特征,对每个所述目标类型文档进行切片,得到每个所述目标类型文档的至少一个第二文档切片;
针对每个第二文档切片,将所述第二文档切片与所述第二文档切片所属的标题组成第一文档切片,并确定所述第一文档切片对应的特征值;
根据每个所述第一文档切片对应的特征值,构建所述文档切片库。
7.根据权利要求6所述的方法,其特征在于,所述根据目标类型文档的特征,对每个所述目标类型文档进行切片,得到每个所述目标类型文档的至少一个第二文档切片,包括:
根据所述目标类型文档的特征,对所述目标类型文档进行标题识别,得到所述目标类型文档的标题信息;
根据所述目标类型文档的标题信息,对所述目标类型文档进行切片,得到所述目标类型文档的至少一个第二文档切片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110529809.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用程序启动方法、装置、电子设备及可读存储介质
- 下一篇:清扫车





