[发明专利]一种面向电网调度系统实时调度助手的文本意图识别方法在审
申请号: | 202111413457.1 | 申请日: | 2021-11-25 |
公开(公告)号: | CN113901225A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 杨强;张云菊;郭明;史虎军;张玉罗;司胜文;杜秀举 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 商小川 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 电网 调度 系统 实时 助手 文本 意图 识别 方法 | ||
本发明公开了一种面向电网调度系统实时调度助手的文本意图识别方法,所述方法为:利用LSTM时序学习和长距离关联学习的能力分时刻编码对话文本,然后使用Attention机制将当前时刻和过往每轮对话的向量表示进行融合,加强与过往时刻话术的关联,同时去掉冗余噪声信息,进而得到当前时刻轮话术文本的向量表示,最后将向量输入分类器进行分类;解决了调度交互作业过程文本是语音翻译过来,包含更多的噪音文字,同时在内容上也会包含很多打招呼、寒暄以及身份确认等过程干扰信息,会在模型的学习过程中引入过多的噪声且忽略了时序的因素,影响模型最终的分类效果,进而影响意图识别理解的结果等技术问题。
技术领域
本发明属于自然语言处理的文本分类技术,尤其涉及一种面向电网调度系统实时调度助手的文本意图识别方法。
背景技术
电力系统调度过程的两类重要参与者是调令员和受令员。调令员通过电网调度系统发出指令由受令员来执行,为了高质量的完成调度工作,提高效率,规避错误,调令员和受令员调度交互过程要合理,过程要标准化。为防止调令员和受令员发生遗漏、误报等错误,基于人工智能的技术可以建设电网调度实时调度助手系统。利用语音识别和语义理解技术,实时调度助手协助调、受令员工作,提供辅助服务,规范调令员及受令员的通话,提升调配电安全,革新调度办公新方式。通过搭建实时调度助手系统,可以实现实时智能推送功能、舆情监控等功能,为实现这些功能调令员和受令员实时的话术语义意图理解是必备的基础技术
电力系统调度过程中调令员和受令员交互作业过程是多轮对话的交互过程,交互作业过程实时语义意图理解可以转化成实时话术的意图分类问题。通过语音转写工具将调令员或受令员的话术实时翻译成文本,对文本进行意图分类解决了调令员和受令员实时话术语义意图理解的问题。调令员和受令员调度交互作业过程和一般的闲聊类型的多轮对话不同,调度过程是很规范的具有很强逻辑性,在理解实时话术的时候要重点考虑上文的语义且远距离的文本话术也具有很大的关联性,因此调令员和受令员调度交互作业过程实时的话术意图理解要求模型要能很好的解决长距离语义关联的问题。
在多轮对话的单轮对话意图识别(实时意图识别)中,当前的研究工作往往倾向于直接将常见的文本分类模型应用到将当前轮对话文本任务中。这些模型处理会话文本的通用方法就是将当前轮文本句子数字化编码后作为模型输入,提取特征并分类。
已有多轮对话意图识别方法工作忽略了调令员和受令员调度交互作业过程自身特点,没有考虑多轮对话句子与句子之间的时序因素以及前后语句的强关联性,同时,与常见的文本分类任务所使用的数据相比,调令员和受令员调度交互作业过程文本是语音翻译过来,包含更多的噪音文字,同时在内容上也会包含很多打招呼、寒暄以及身份确认等过程,此类过程和调度标准过程是无关的干扰信息。因此,如果简单地将其视为普通文本进行编码,则会在模型的学习过程中引入过多的噪声且忽略了时序的因素,影响模型最终的分类效果,进而影响意图识别理解的结果。
发明内容
本发明要解决的技术问题是:提供一种面向电网调度系统实时调度助手的文本意图识别方法,以解决调令员和受令员调度交互作业过程文本是语音翻译过来,包含更多的噪音文字,同时在内容上也会包含很多打招呼、寒暄以及身份确认等过程,此类过程和调度标准过程是无关的干扰信息,将其视为普通文本进行编码,则会在模型的学习过程中引入过多的噪声且忽略了时序的因素,影响模型最终的分类效果,进而影响意图识别理解的结果等技术问题。
本发明技术方案:
一种面向电网调度系统实时调度助手的文本意图识别方法,所述方法为:利用LSTM时序学习和长距离关联学习的能力分时刻编码对话文本,然后使用Attention机制将当前时刻和过往每轮对话的向量表示进行融合,加强与过往时刻话术的关联,同时去掉冗余噪声信息,进而得到当前时刻轮话术文本的向量表示,最后将向量输入分类器进行分类。
对原始数据集采取去除停用词、去除标点符号和不可见字符、去除低频词数据预处理操作,将原始数据集文本信息表示成数字形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111413457.1/2.html,转载请声明来源钻瓜专利网。