[发明专利]基于混合策略的FAQ系统排序方法、装置及系统在审
| 申请号: | 202110132061.3 | 申请日: | 2021-01-30 |
| 公开(公告)号: | CN112749268A | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 姜姗;刘升平;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 混合 策略 faq 系统 排序 方法 装置 | ||
本发明提供了基于混合策略的FAQ系统排序方法、装置及系统,其中,方法包括步骤10,模型训练:将第一训练集输入文本匹配模型,获得训练好的文本匹配模型;将第二训练集输入pairwise排序模型,获得训练好的pairwise排序模型;步骤20,粗筛:通过训练好的文本匹配模型计算用户输入的问题和标准候选库中候选的相似度,根据得分排序选取前m个候选;步骤30,精排:通过训练好的pairwise排序模型,为m个候选打分,根据得分排序返回top‑k个候选;其中k≤m。文本匹配模型关注单个句对之间的相关性,用其粗筛可以缩小召回的候选范围。Pairwise排序模型考虑到了候选之间的相对位置,对候选之间的偏序关系学习更充分。两类模型结合可以提高现有基于单一文本匹配策略的FAQ系统排序性能。
技术领域
本发明书一个或多个实施例涉及信息检索技术领域,尤其涉及一种基于混合策略的FAQ(Frequently Asked Questions,常见问题)系统排序方法、装置及系统。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。智能问答是人工智能的一个领域,随着互联网业务的迅速增长,市场对于智能问答的需求日渐高涨。智能问答以一问一答的形式,精确定位用户的提问,通过与用户交互,为用户提供个性化的信息服务。
常用的问答系统,大部分是以实现FAQ问答为主的。FAQ包括客户常见的问题。基于FAQ进行检索,主要能够检索到常见的典型问题,基于文本匹配策略的检索式问答系统(FAQ)排序方法通常是,给定标准问题库,系统根据用户输入的一条query从标准问题库中召回n个候选,通过文本匹配模型计算query和每个候选的相似度得分,最后根据得分排序输出top-k个候选。
但该方法存在如下问题:
文本匹配模型只能判断query与某条候选是否相关,不能建模一条query对应的多条候选之间的偏序关系。
有鉴于此,亟需一种新的技术,用于提升基于文本匹配策略的FAQ系统排序性能。
发明内容
本说明书一个或多个实施例描述了基于混合策略的FAQ系统排序方法、装置及系统,使用文本匹配模型粗筛和pairwise排序模型精排的混合排序策略,结合了两类模型的优点,解决了现有技术中存在文本匹配模型只能判断query与某条候选是否相关,不能建模一条query对应的多条候选之间的偏序关系问题。
本说明书一个或多个实施例提供的技术方案如下:
第一方面,本发明提供了基于混合策略的FAQ系统排序方法,其特征在于,包括步骤10,模型训练:
将第一训练集输入文本匹配模型,获得训练好的文本匹配模型;
将第二训练集输入pairwise排序模型,获得训练好的pairwise排序模型;
步骤20,粗筛:
通过训练好的文本匹配模型计算用户输入的问题和标准候选库中候选的相似度,根据得分排序选取前m个候选;
步骤30,精排:
通过训练好的pairwise排序模型,为m个候选打分,根据得分排序返回top-k个候选;其中k≤m。
在一个示例中,所述第一训练集具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110132061.3/2.html,转载请声明来源钻瓜专利网。





