[发明专利]一种相识文本自动扩展的系统及其方法在审

专利信息
申请号: 201910988927.3 申请日: 2019-10-17
公开(公告)号: CN110727780A 公开(公告)日: 2020-01-24
发明(设计)人: 刘德建;梁益冰;林剑锋;林琛 申请(专利权)人: 福建天晴数码有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/335;G06F16/33;G06F40/186;G06F40/289
代理公司: 35233 福州旭辰知识产权代理事务所(普通合伙) 代理人: 程勇
地址: 350000 福建省福州市君竹路83*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 技能 扩展能力 语料 知识库 产品管理模块 配置模块 同步模块 自动化 产品配置 产品提供 扩展类型 模板配置 自动扩展 配置的 整合 替换 集合 文本 配置 创建
【说明书】:

发明提供了一种相识文本自动扩展的系统,所述系统包括:技能配置模块、产品管理模块、技能同步模块、以及生成语料模块;所述技能配置模块,负责扩展类型的创建和对应的扩展模板配置;所述产品管理模块,通过产品配置技能的方式来为产品提供扩展能力,产品同时配置多个技能来完善扩展能力,所述技能同步模块,负责将当前产品所配置的所有技能下的所有扩展模板进行整合,作为产品扩展能力的知识库;所述生成语料模块,将导入产品的语料集合通过当前产品的技能能力与知识库进行一个自动化扩展,本发明可以实现自动化扩展替换,有效提高执行效率。

技术领域

本发明涉及计算机技术领域,特别是一种相识文本自动扩展的系统及其方法。

背景技术

在智能领域高速发展的当今,自然语言理解是一个很重要的发展方向。拥有好的语意理解将赋予产品(如机器人)更加智能的形象。以目前最常见的客服机器人为例,机器人回答的所有答案都是通过预先设置好的内容(闲聊机器人除外),与此同时机器人能够理解的文本内容也是通过人为配置的。为了让机器人能够识别不同的问法,配置人员需要赋予机器人足够多的语料集合,测试人员也需要编写足够多的语料来测试机器人回复的正确性。举例,原始需求语料有一句:“如何办理图书馆准入证”,那么机器人除了识别“如何办理图书馆准入证”这句话并给出答案之外,“图书馆准入证怎么办理”、“你知道图书馆准入证的办理流程吗”、“图书馆准入证如何办理”等问法也需要能够被识别。而这些语料扩展目前主要是通过人为的去思考扩展,甚至有时候为了覆盖更多的语料,配置和测试人员也需要通过查询语句中关键词的同义词来做替换扩展。

现有的扩展语料的方式存在如下缺点:

缺点一,目前为了让机器人能够识别足够多的问法,语料都会通过人工的方式进行问句扩展,再将其赋予给机器人。但是如果都是通过人为来扩展的话,扩展的人员可能由于文采水平的限制,没有思绪,扩展并不充分,而导致机器人识别能力并不是很高。

缺点二,除了缺点一中案例的句式扩展,同义词的扩展也是必要的。但是操作人员长期通过同义词查询进行同义词替换的操作,随着时间久了,很容易给执行该工作的人员带来厌烦的情绪(同义词替换的举例:图书馆的地址在哪?地址的同义词:位置、地点,替换同义词询问:图书馆的位置在哪,程序也应该能够识别)。

缺点三,目前汉语文本虽然可以通过同义词推荐的来进行替换扩展,同缺点二中所述,同义词替换来扩展推荐的同义句是必要的,但是同义词也存在不可完全替换的情况。需要针对场景来进行替换,有些场景下同义词替换之后,语意可能就变了。所以主要的判断最终还是落到了人工来处理,就导致语料扩展的成本非常高。

缺点四,配置或测试人员拿到对话需求之后,都要针对对话需求中的内容进行扩展,配置人员是为了让机器人支持不同的问句方式,而测试人员则是为了验证程序是否支持花样的问法。而这两方的实施基础都是基于丰富的语料集合。但是如果针对所有的语料进行独立扩展,两方都会占用大量的语料扩展时间,但是又不得不进行扩展。

缺点五,客服系统的智能另一方面体现在正确性、及时性,所以每个产品都会不断的去完善补充新的语料或更新最新答案,这种情况下很容易出现新旧问句答案不一样的情况。这种情况下,大部分是通过测试人员测试过程中去发现。但是测试才发现,会导致需要重新调整配置的情况,会增加测试往返的轮次,除此之外也可能出现回答的随机性,从而导致测试人员的漏测。

发明内容

为克服上述问题,本发明的目的是提供一种相识文本自动扩展的系统,实现一些常见模板问法的自动化扩展,无需人工投入,有效提高执行效率。

本发明采用以下方案实现:一种相识文本自动扩展的系统,所述系统包括:技能配置模块、产品管理模块、技能同步模块、以及生成语料模块;

所述技能配置模块,负责扩展类型的创建和对应的扩展模板配置;

所述产品管理模块,通过产品配置技能的方式来为产品提供扩展能力,产品同时配置多个技能来完善扩展能力,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建天晴数码有限公司,未经福建天晴数码有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910988927.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top