[发明专利]对话信息抽取方法、系统和计算机可读存储介质在审

专利信息
申请号: 202111104955.8 申请日: 2021-09-18
公开(公告)号: CN113822058A 公开(公告)日: 2021-12-21
发明(设计)人: 唐广法 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06F40/279 分类号: G06F40/279;G06F40/205;G06F40/35;G06F16/335;G06F16/35;G06N3/04;G06N3/08
代理公司: 青岛清泰联信知识产权代理有限公司 37256 代理人: 魏炜
地址: 200030 上海市徐汇区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对话 信息 抽取 方法 系统 计算机 可读 存储 介质
【权利要求书】:

1.一种对话信息抽取方法,其特征在于,包括以下步骤:

重复对话筛选步骤,采用滑窗算法,根据预设窗口长度将对话分为若干个对话片段,分析并删除重复的所述对话片段;

类别识别步骤,根据一深度匹配模型对所述对话片段进行场景识别,得到该所述对话片段的场景类别;

场景信息抽取步骤,根据所述场景类别下预先设定的场景类别属性,与所述对话片段进行匹配,得到对应的属性状态。

2.根据权利要求1所述的对话信息抽取方法,其特征在于,所述类别识别步骤进一步包括:

对话片段向量表示获取步骤,利用多头自注意力机制获取所述对话片段的特征编码,并使用Bi-LSTM编码所述对话片段,增加序列信息,得到对话片段向量表示;

场景类别向量表示获取步骤,采用所述对话片段向量表示获取步骤的相同方法根据所述场景类别和所述场景类别属性获得场景类别向量表示;

特征匹配步骤,将所述对话片段向量表示和所述场景类别向量表示输入至所述匹配模型,得到与所述对话片段相关度最高的所述场景类别;

对话片段评分步骤,将所述对话片段和与之对应的所述场景类别输入至一评分模型,若得分超过预设阈值,则将所述对话片段划分至该所述场景类别下;

对话评分步骤,综合所有所述对话片段的评分,并据此判断所述对话是否属于该所述场景类别。

3.根据权利要求2所述的对话信息抽取方法,其特征在于,所述特征匹配步骤进一步包括:

针对每一个所述场景类别和对应的所述场景类别属性,采用注意力机制查询,将注意力查询设置为所述场景类别属性,得到与所述对话片段相关度最高的所述场景类别。

4.根据权利要求2所述的对话信息抽取方法,其特征在于,所述对话片段评分步骤包括将所述对话片段向量表示全连接至一个维度,再利用激活函数激活,获得范围在零到一的评分,当所述评分超过所述预设阈值,将该所述对话片段划分至该场景类别下。

5.根据权利要求1所述的对话信息抽取方法,其特征在于,所述场景信息抽取步骤进一步包括:

编码步骤,将所述场景类别、所述场景类别属性以及属性状态进行编码,并将所述对话片段各自独立编码,得到各自的向量表示;

信息抽取步骤,将所述向量表示输入至所述匹配器,并抽取所述对话片段对应所述场景类别属性和所述属性状态;

信息聚合步骤,将所述场景类别、所述场景类别属性以及所述属性状态进行匹配聚合并输出;

抽取评分步骤,利用一评分器对抽取结果进行评分,当评分结果满足预设条件则将所述结果以文本形式输出。

6.根据权利要求1所述的对话信息抽取方法,其特征在于,所述重复对话筛选步骤包括:

将整段所述对话根据说话顺序依次标号为1,2,...,N,并设置预设窗口长度为M,将标号1~M,2~(M+1),...,(N-M)~N分别作为一个对话片段并进行分析,对所述对话片段进行打标,当出现标签相同的对话片段,将在后所述对话片段覆盖在前所述对话片段。

7.一种对话信息抽取系统,其特征在于,包括:

重复对话筛选模块,采用滑窗算法,根据预设窗口长度将对话分为若干个对话片段,分析并删除重复的所述对话片段;

类别识别模块,根据一深度匹配模型对所述对话片段进行场景识别,得到该所述对话片段的场景类别;

场景信息抽取模块,根据所述场景类别下预先设定的场景类别属性,与所述对话片段进行匹配,得到对应的属性状态。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111104955.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top