[发明专利]一种基于神经网络架构搜索技术的对话文本情景划分方法在审
申请号: | 202210507663.7 | 申请日: | 2022-05-10 |
公开(公告)号: | CN115203402A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 林劼;李赛鹏;姜铼;王元芳;肖新宇;梁玉龙 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/30;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 郭肖凌 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 架构 搜索 技术 对话 文本 情景 划分 方法 | ||
1.一种基于神经网络架构搜索技术的对话文本情景划分方法,其特征在于,包括以下步骤:
步骤一:对话文本句向量转换,训练一个用于捕获对话语义信息的句向量模型,在句向量模型构建完成后,利用模型将对话文本语句转换为同一维度的句向量特征;
步骤二:将对话文本按照语义特征划分为若干段落,构建分段模型,将对话文本分段作为序列标注任务,使用三个分段符号标识一个文本段落;在分段模型中使用条件随机场CRF约束最后输出分段符号之间的先后顺序,并基于神经网络架构搜索技术搜索一种用于捕获对话语义信息的循环神经网络RNN结构;
步骤三:将离散的文本段落按照对话情景划分,基于DBSCAN算法提出一种对话段落情景聚类算法进行对话文本聚类,并通过调控密度半径和样本阈值调整最后的聚类效果,最后形成的聚类簇即可视为划分好的对话情景。
2.根据权利要求1所述的一种基于神经网络架构搜索技术的对话文本情景划分方法,其特征在于,所述步骤一具体包括以下子步骤:
步骤11:构建对话文本句向量模型DSimCSE的训练样本数据集;
步骤12:以正样本对的目标函数作为句向量模型的训练目标,对句向量模型进行训练,正样本对的目标函数如下式所示:
其中Si表示正样本对中的原始语句,S+i表示正样本对中的新语句,m表示对话语句个数,t表示温度超参数,sim表示余弦相似度函数;
对于负样本对,将正样本对的训练目标取相反后对句向量模型进行训练;
步骤13:将对话语句输入对话文本句向量模型DSimCSE进行句向量特征转换,获得对话语句对应的句向量特征。
3.根据权利要求2所述的一种基于神经网络架构搜索技术的对话文本情景划分方法,其特征在于,所述步骤11包括以下步骤:
步骤111:将同一篇对话文本中的不同语句作为负样本对;
步骤112:在构建正样本对时,对于每条对话语句,首先通过词性判别器识别出对话语句中词性为名词或动词的单词,通过对这类单词进行重复得到新的语句,将新语句与原始语句作为一组正样本对。
4.根据权利要求1所述的一种基于神经网络架构搜索技术的对话文本情景划分方法,其特征在于,所述步骤二具体包括以下子步骤:
步骤21:通过基于强化学习的神经网络架构搜索方法搜索一种新型循环神经网络架构DRNN,用于捕获对话句向量中的语义信息;
步骤22:在DRNN的输出特征矩阵之后接一层使用条件随机场CRF来约束分段符号之间的顺序,其中S表示段落开始语句,M表示段落中间的语句,E表示段落结束语句;对于已知输入对话序列Dialogue={s1,s2,...,sm},经过CRF输出的分段标记符号为T={t1,t2,...,tm},则T的得分可如下式所示:
其中,Score(S,T)表示分段标记符号T的得分,A表示CRF的转移矩阵,P表示输出的概率矩阵;
当训练完成后,确定CRF的转移矩阵参数;输出所有序列得分并取序列得分最大的序列作为对话句向量的最终语义输出,具体如下式所示:
其中,TS表示输入对话序列S时可以输出的所有分段标记序列;
步骤23:在训练集上优化对分段模型的参数进行优化;
步骤24:在验证集上对控制器的参数进行优化;
步骤25:得到对话文本的分段结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210507663.7/1.html,转载请声明来源钻瓜专利网。