[发明专利]问答方法、装置与电子设备在审
| 申请号: | 202110529809.3 | 申请日: | 2021-05-14 |
| 公开(公告)号: | CN115344674A | 公开(公告)日: | 2022-11-15 |
| 发明(设计)人: | 张士卫;闫昭;饶孟良 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35 |
| 代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 问答 方法 装置 电子设备 | ||
本申请实施例提供一种问答方法、装置与电子设备,该方法包括:获取目标问题;在已构建的文档切片库中,根据N个第一文档切片中每个第一文档切片的特征值,确定每个第一文档切片与目标问题之间的第一匹配度;根据每个第一文档切片与目标问题之间的第一匹配度,从N个第一文档切片中确定出目标问题的答案切片。本申请实施例以文档的切片作为答案的最小粒度,在文档切片库中自动查询目标问题的答案切片,提高了问答效率,降低了问答成本。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种问答方法、装置与电子设备。
背景技术
在政务领域,用户对于自己关切的问题可以在政务系统上进行提问,政务系统针对用户的问题,给出相应的答案。例如,用户在政务系统上提出“业务A的办理流程”,政务系统可以在展示页面上向用户展示办理业务A的具体流程以及注意事项等,进而方便用户各业务的办理效率。
目前解答用户问题的方式是通过人工客服的方式实现,例如政务系统的客服在预设的资料库中查询用户的问题对应的答案,并将查询到的答案通过政务系统展示给用户。
由上述可知,通过人工客服查询答案的方式,其效率低,且成本高。
发明内容
本申请实施例提供一种问答方法、装置与电子设备,用以提高答案查询的效率。
第一方面,本申请实施例提供一种问答方法,包括:
获取目标问题;
在已构建的文档切片库中,根据N个第一文档切片中每个第一文档切片的特征值,确定每个第一文档切片与所述目标问题之间的第一匹配度,其中,所述文档切片库中包括所述N个第一文档切片、以及每个所述第一文档切片的特征值,所述N为正整数;
根据每个所述第一文档切片与所述目标问题之间的第一匹配度,从所述N个第一文档切片中确定出所述目标问题的答案切片。
在一些实施例中,所述根据所述目标问题中每个词在所述第一文档切片中的第一特征值,确定所述目标问题中每个词的第一特征值,包括:
针对所述目标问题中的每个词,若所述第一文档切片中包含所述词,则从所述文档切片库中获取所述词在所述第一文档切片中的第一特征值;
若所述第一文档切片中不包含所述词,则确定所述词在所述第一文档切片中的第一特征值为第一数值。
在一些实施例中,所述根据所述目标问题中每个词在所述第一文档切片中的第一特征值,确定所述第一文档切片与所述目标问题之间的第二匹配度,包括:
根据所述目标问题中每个词在所述第一文档切片中的第一特征值,使用BM25匹配方式,确定第一文档切片与所述目标问题之间的第二匹配度。
在一些实施例中,所述根据所述第一文档切片中每个词的出现频率和逆文本频率,确定所述第一文档切片对应的特征值,包括:
将所述第一文档切片中每个词的出现频率和逆文本频率的乘积,确定为所述第一文档切片对应的特征值。
在一些实施例中,所述根据每个所述第一文档切片对应的特征值,构建所述文档切片库,包括:
根据每个所述第一文档切片对应的特征值,对各所述第一文档切片进行倒排,并确定各所述第一文档切片的索引;
根据具有索引的各所述第一文档切片,构建所述文档切片库。
在一些实施例中,所述根据每个所述第一文档切片与所述目标问题之间的第一匹配度,从所述N个第一文档切片中确定出所述目标问题的答案切片,包括:
将所述N个第一文档切片中与所述目标问题之间的第一匹配度最大的第一文档切片,确定为所述目标问题的答案切片。
在一些实施例,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110529809.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:应用程序启动方法、装置、电子设备及可读存储介质
- 下一篇:清扫车





