[发明专利]问题信息的生成方法、装置、计算机设备及其存储介质在审
申请号: | 201910502350.0 | 申请日: | 2019-06-11 |
公开(公告)号: | CN110348006A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 戴磊 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62;G06Q40/02 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问题信息 应答信息 问题识别 业务类型 测评 语言数据处理 方法和装置 计算机设备 存储介质 输出 问题库 申请 预测 | ||
本申请为语言数据处理技术领域,本申请提供一种问题信息的生成方法和装置,所述方法包括根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。该方法有利于提高问答测评项目的准确性。
技术领域
本申请涉及语言数据处理技术领域,具体而言,本申请涉及一种问题信息的生成方法、装置、计算机设备及其存储介质。
背景技术
在很多场景中,都会使用问答,比如在金融行业(比如贷款),为了控制风险,风控人员往往会向申请者提出问题,并且根据申请者的回答提出下一个问题,如此往复,从而判断可能存在的风险。
现有技术中,利用终端设备录入所有问题,形成一个问题库,存放需要进行提问的所有问题信息,然后使用者通过预设的方式生成下一个问题并进行输出,这种方式不能灵活根据实际的回答情况设定下一个问题,容易脱离实际的情况,难以符合客观性,因此,用于判断风险的准确性偏低。
发明内容
为克服以上技术问题,特别是现有技术中只能按照预设的方式生成下一个问题,造成可能脱离实际的情况下得到下一个问题信息,特提出以下技术方案:
第一方面,本申请提供一种问题信息的生成方法,其包括以下步骤:
根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;
将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;
将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。
在其中一个实施例中,对历史的问题信息和应答信息进行训练得到所述问题识别模型,包括:
建立关于问题信息与对应的应答信息的历史数据库;
对所述历史数据库中的问题信息与对应的应答信息形成样本问答序列;
对所述样本问答序列进行向量化,得到样本问答向量序列;
利用所述样本问答向量序列进行训练,生成所述问题识别模型。
在其中一个实施例中,在所述对所述样本问答序列进行向量化的步骤之前,还包括:
对历史数据库的问题信息与对应的应答信息进行分词得到第一分词结果。
在其中一个实施例中,所述对所述样本问答序列进行向量化,得到样本问答向量序列的步骤包括:
利用词向量模型对所述第一分词结果进行向量化,得到历史数据库中的问题信息的特征向量和对应的应答信息的特征向量;
将历史数据库中的问题信息的特征向量和对应的应答信息的特征向量进行组合以形成样本问答向量序列。
在其中一个实施例中,将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息的步骤之前,还包括:
对所述候选问题库中的每个问题信息进行分词,得到第二分词结果;
利用词向量生成器对所述第二分词结果进行向量化,得到每个问题信息的第一特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910502350.0/2.html,转载请声明来源钻瓜专利网。