[发明专利]对话信息抽取方法、系统和计算机可读存储介质在审
| 申请号: | 202111104955.8 | 申请日: | 2021-09-18 | 
| 公开(公告)号: | CN113822058A | 公开(公告)日: | 2021-12-21 | 
| 发明(设计)人: | 唐广法 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 | 
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/205;G06F40/35;G06F16/335;G06F16/35;G06N3/04;G06N3/08 | 
| 代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 魏炜 | 
| 地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 对话 信息 抽取 方法 系统 计算机 可读 存储 介质 | ||
1.一种对话信息抽取方法,其特征在于,包括以下步骤:
重复对话筛选步骤,采用滑窗算法,根据预设窗口长度将对话分为若干个对话片段,分析并删除重复的所述对话片段;
类别识别步骤,根据一深度匹配模型对所述对话片段进行场景识别,得到该所述对话片段的场景类别;
场景信息抽取步骤,根据所述场景类别下预先设定的场景类别属性,与所述对话片段进行匹配,得到对应的属性状态。
2.根据权利要求1所述的对话信息抽取方法,其特征在于,所述类别识别步骤进一步包括:
对话片段向量表示获取步骤,利用多头自注意力机制获取所述对话片段的特征编码,并使用Bi-LSTM编码所述对话片段,增加序列信息,得到对话片段向量表示;
场景类别向量表示获取步骤,采用所述对话片段向量表示获取步骤的相同方法根据所述场景类别和所述场景类别属性获得场景类别向量表示;
特征匹配步骤,将所述对话片段向量表示和所述场景类别向量表示输入至所述匹配模型,得到与所述对话片段相关度最高的所述场景类别;
对话片段评分步骤,将所述对话片段和与之对应的所述场景类别输入至一评分模型,若得分超过预设阈值,则将所述对话片段划分至该所述场景类别下;
对话评分步骤,综合所有所述对话片段的评分,并据此判断所述对话是否属于该所述场景类别。
3.根据权利要求2所述的对话信息抽取方法,其特征在于,所述特征匹配步骤进一步包括:
针对每一个所述场景类别和对应的所述场景类别属性,采用注意力机制查询,将注意力查询设置为所述场景类别属性,得到与所述对话片段相关度最高的所述场景类别。
4.根据权利要求2所述的对话信息抽取方法,其特征在于,所述对话片段评分步骤包括将所述对话片段向量表示全连接至一个维度,再利用激活函数激活,获得范围在零到一的评分,当所述评分超过所述预设阈值,将该所述对话片段划分至该场景类别下。
5.根据权利要求1所述的对话信息抽取方法,其特征在于,所述场景信息抽取步骤进一步包括:
编码步骤,将所述场景类别、所述场景类别属性以及属性状态进行编码,并将所述对话片段各自独立编码,得到各自的向量表示;
信息抽取步骤,将所述向量表示输入至所述匹配器,并抽取所述对话片段对应所述场景类别属性和所述属性状态;
信息聚合步骤,将所述场景类别、所述场景类别属性以及所述属性状态进行匹配聚合并输出;
抽取评分步骤,利用一评分器对抽取结果进行评分,当评分结果满足预设条件则将所述结果以文本形式输出。
6.根据权利要求1所述的对话信息抽取方法,其特征在于,所述重复对话筛选步骤包括:
将整段所述对话根据说话顺序依次标号为1,2,...,N,并设置预设窗口长度为M,将标号1~M,2~(M+1),...,(N-M)~N分别作为一个对话片段并进行分析,对所述对话片段进行打标,当出现标签相同的对话片段,将在后所述对话片段覆盖在前所述对话片段。
7.一种对话信息抽取系统,其特征在于,包括:
重复对话筛选模块,采用滑窗算法,根据预设窗口长度将对话分为若干个对话片段,分析并删除重复的所述对话片段;
类别识别模块,根据一深度匹配模型对所述对话片段进行场景识别,得到该所述对话片段的场景类别;
场景信息抽取模块,根据所述场景类别下预先设定的场景类别属性,与所述对话片段进行匹配,得到对应的属性状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111104955.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种传动效率高的电机
- 下一篇:便捷冲洗及排气的造口袋及生产工艺
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





