[发明专利]一种相识文本自动扩展的系统及其方法在审

专利信息
申请号: 201910988927.3 申请日: 2019-10-17
公开(公告)号: CN110727780A 公开(公告)日: 2020-01-24
发明(设计)人: 刘德建;梁益冰;林剑锋;林琛 申请(专利权)人: 福建天晴数码有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/335;G06F16/33;G06F40/186;G06F40/289
代理公司: 35233 福州旭辰知识产权代理事务所(普通合伙) 代理人: 程勇
地址: 350000 福建省福州市君竹路83*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 技能 扩展能力 语料 知识库 产品管理模块 配置模块 同步模块 自动化 产品配置 产品提供 扩展类型 模板配置 自动扩展 配置的 整合 替换 集合 文本 配置 创建
【权利要求书】:

1.一种相识文本自动扩展的系统,其特征在于:所述系统包括:技能配置模块、产品管理模块、技能同步模块、以及生成语料模块;

所述技能配置模块,负责扩展类型的创建和对应的扩展模板配置;

所述产品管理模块,通过产品配置技能的方式来为产品提供扩展能力,产品同时配置多个技能来完善扩展能力,

所述技能同步模块,负责将当前产品所配置的所有技能下的所有扩展模板进行整合,作为产品扩展能力的知识库;

所述生成语料模块,将导入产品的语料集合通过当前产品的技能能力与知识库进行一个自动化扩展,所述语料包含问题和回答两个字段。

2.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述技能配置模块进一步具体为:提供一个技能平台化界面,用户能通过技能平台化界面创建自定义技能,在对应技能下,能创建各类扩展类型及说明,在每个扩展类型下,能进行扩展模板的配置;所述技能配置模块还提供一个词性查询功能,用于用户查询原有语句文本中的词性组合情况;所述词性组合的结构为:分词+词性名称+词性代码;用户能根据原有语句词性组合的情况扩展下配置对应的扩展模板,所述扩展模板的结构为:扩展类型名称+扩展说明+原有语句+扩展句式。

3.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述产品管理模块进一步具体为:提供一个产品平台化界面,该产品平台化界面创建专属产品,并添加个人定制的技能,与此同时也能添加其他人员创建的技能;所述产品管理模块还提供一个同义词导入的功能、一个产品配置功能、一个同义词扩展开关、一个restful的访问接口,所述同义词导入的功能,用于将同义词导入到系统中,且导入格式不限制;所述产品配置功能,用于支持配置是否启用同义词扩展能力;所述同义词扩展开关,用于加载当前产品下技能的所有扩展模板,加入到内存中,为对外提供扩展能力提供知识库;所述restful的访问接口,供其他需求的业务调用,只要输入文档主题属性body 中包含question=“这是一个字段”的请求内容,访问接口会以列表属性字段来显示返回当前产品下能够扩展的所有句子。

4.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述技能同步模块进一步具体为:根据产品所配置的技能列表,读取所有所配置的技能;再则读取每个技能下的扩展类型及扩展模板并进行整合;最后将整合的所有扩展模板配置作为扩展的知识库。

5.根据权利要求1所述的一种相识文本自动扩展的系统,其特征在于:所述生成语料模块进一步包括语料查重单元和句式扩展单元,所述语料查重单元,对语料进行过滤处理,给出存在的冲突语料列表;所述句式扩展单元用于读取待扩展的语料集合,每条语料以问题和回答两个字段的形式存储到列表中;对每条待扩展的语料进行分词和词性标注,然后再把该分词和标注的结果和知识库里面的扩展模板进行比对,如果发现存在一样的模板,则找到该模板的扩展类型,并将该扩展类型下的模板进行词汇替换,给出替换完后的扩展词汇;把扩展的问句以对象的方式加入到扩展语料集合,并继续进行扩展直到完成所有扩展。

6.根据权利要求5所述的一种相识文本自动扩展的系统,其特征在于:所述语料查重单元进一步具体为:对每个语料对象与其他语料对象进行对比,判断是否存在分词之后一模一样的问句,如果存在一模一样的问句,再比对二者的答案是否一样,如果答案也一样,则删除其中一个问句,如果答案不一样,则把这两个问句对象加到一设置的冲突列表中;所有语料都完成对比操作后,最终输出冲突列表,供用户进行调整。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建天晴数码有限公司,未经福建天晴数码有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910988927.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top