[发明专利]语料收集方法、装置和计算机设备在审

专利信息
申请号: 201810045661.4 申请日: 2018-01-17
公开(公告)号: CN108153904A 公开(公告)日: 2018-06-12
发明(设计)人: 李和瀚;周晓 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 宋合成
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语料收集 计算机设备 模板化 应答 反馈 查询请求 接收用户 结果反馈 任务导向 真实度 多轮 语料 申请 对话 文本 查询 场景 平衡
【说明书】:

本申请提出一种语料收集方法、装置和计算机设备,上述语料收集方法包括:接收用户输入的查询请求;向所述用户展现模板化应答,所述模板化应答包括反馈部分和引导部分;所述反馈部分包括对所述用户输入的查询文本的结果反馈,所述引导部分包括对所述用户的下一轮输入的引导;接收所述用户输入的语料。本申请可以实现为语料收集人呈现一个较为真实的对话场景,通过效率与对话真实度之间的平衡,降低任务导向的多轮语料收集难度。

技术领域

本申请涉及人机对话技术领域,尤其涉及一种语料收集方法、装置和计算机设备。

背景技术

现在,任务导向对话理解与交互应用的场景越来越多,但大部分场景只支持单轮对话。多轮对话理解与交互的技术实现难度大大超过单轮对话,其首要原因就是多轮对话的语料获取远比单轮对话困难。单轮对话的语料可以由熟悉业务的相关人员通过简单直接的富集得到,但多轮对话由于存在交互的过程,无法凭空富集得到,因此获取难度更大,进而直接导致了多轮对话的技术发展受限。

现有相关技术中,效仿单轮语料的收集方式,由熟悉业务的相关人员自行通过想象模拟对话场景,收集对话语料。然后,投入大量人力开发一个完整的对话理解与交互系统,实现包含语言理解、对话状态管理、结果查询、对话决策和应答生成等多个模块的完整交互流程,再交由熟悉业务的相关人员在较为真实的环境下进行收集。

但是上述语料收集方式,远离真实场景,容易陷入个人的思维及语言定式,导致语料真实度差,并且需要自行想象场景,效率低下;投入大量人力开发一个完整的对话理解与交互系统,人力成本高昂,开发周期长,无法满足快速发展的技术及产品需求,各模块需要分别开发及调优,但单独模块的调优同样需要语料支撑;在缺乏语料的情况下,每个模块的效果优化十分困难,效果难以达到理想。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本申请的第一个目的在于提出一种语料收集方法,以实现为语料收集人呈现一个较为真实的对话场景,通过效率与对话真实度之间的平衡,降低任务导向的多轮语料收集难度。

本申请的第二个目的在于提出一种语料收集装置。

本申请的第三个目的在于提出一种计算机设备。

本申请的第四个目的在于提出一种非临时性计算机可读存储介质。

为达上述目的,本申请第一方面实施例提出了一种语料收集方法,包括:接收用户输入的查询请求;向所述用户展现模板化应答,所述模板化应答包括反馈部分和引导部分;所述反馈部分包括对所述用户输入的查询文本的结果反馈,所述引导部分包括对所述用户的下一轮输入的引导;接收所述用户输入的语料。

本申请实施例的语料收集方法中,接收用户输入的查询请求之后,向上述用户展现模板化应答,上述模板化应答包括反馈部分和引导部分,其中,上述反馈部分包括对上述用户输入的查询文本的结果反馈,上述引导部分包括对上述用户的下一轮输入的引导,然后接收上述用户输入的语料,从而可以实现为语料收集人呈现一个较为真实的对话场景,通过效率与对话真实度之间的平衡,降低任务导向的多轮语料收集难度,开发成本低廉,几乎不需要人力和时间进行系统开发,并且可扩展性好,可任意迁移场景,效果稳定,收集的语料质量有较好保障。

为达上述目的,本申请第二方面实施例提出了一种语料收集装置,包括:接收模块,用于接收用户输入的查询请求;展现模块,用于向所述用户展现模板化应答,所述模板化应答包括反馈部分和引导部分;所述反馈部分包括对所述用户输入的查询文本的结果反馈,所述引导部分包括对所述用户的下一轮输入的引导;所述接收模块,还用于接收所述用户输入的语料。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810045661.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top