[发明专利]一种基于语义、情感惯性和情感共性的对话情感分析方法有效
| 申请号: | 202110205409.7 | 申请日: | 2021-02-24 |
| 公开(公告)号: | CN112579762B | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 李太豪;廖龙飞;刘昱龙;裴冠雄 | 申请(专利权)人: | 之江实验室 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/35 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
| 地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 情感 惯性 共性 对话 分析 方法 | ||
本发明涉及到情感分析领域,提出了一种基于语义、情感惯性和情感共性的对话情感分析方法,步骤包括:首先获取对话交替进行的多轮对话数据,并对不同人物角色进行标明;然后对多轮对话中的每条对话信息进行时序建模,提取出其中对应的语义信息表达序列;最后基于多轮对话所提取的语义信息表达序列,分离出对应的情感状态表达序列,并进行情感识别。在本发明中,打破了传统的以语义信息决定情感分类的做法,提出了由语义状态与情感状态分离的方法,由情感状态决定情感分类,从心理学的角度改进了现有对话情感分析方法,提升了情感识别的效果。
技术领域
本发明涉及到多模态情感分析领域,具体为一种基于语义、情感惯性和情感共性的对话情感分析方法。
背景技术
情感计算是目前来说比较新的研究领域,它是让机器智能的核心因素之一,具有情感理解能力的机器能够更加有效地应用于各种人机交互场景中,如人机对话。而在过去的研究中,为了获得对话中的对话片段情感信息,往往是先获得对话片段的语义表示,然后通过语义表示来计算对话片段的情感标签。这种做法局限于文本语义的表达,但是情感状态并不是语义信息,它们之间存在着关联,但是本质上情感状态是一种相对独立的状态。所以如何有效地将对话中的语义信息与情感状态的联系进行建模,是提升最终情感计算准确率的关键点之一。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出一种基于语义、情感惯性和情感共性的对话情感分析方法,其具体技术方案如下。
一种基于语义、情感惯性和情感共性的对话情感分析方法,包含以下步骤:
步骤1,获取对话交替进行的多轮对话数据,并对其中对话人物进行特定标记;
步骤2,对多轮对话中的每条对话信息进行建模,提取出其中对应的语义信息表达序列;
步骤3,基于多轮对话所提取的语义信息表达序列,分离出对应的情感状态表达序列;
步骤4,根据情感状态,对对话情感进行识别。
进一步的,所述步骤1具体包括:
步骤1.1,通过采集电源、电视剧视频数据或采集现有的带有情感标记的多轮对话数据集,挑选并剪辑出数据中的双人对话场景,分离出其中的对话数据,并在utterance级别进行切割,然后对切割的utterance进行人工情感标注,标注出每个utterance对应的情感标签,并且对对话人物进行标记,获取对话情感分析数据;
步骤1.2,根据对话人物不同,把获取的对话情感分析数据切分为3个集合,分别是人物的对话集合:
此对话集合只包含人物的对话文本,代表人物的第n段对话;
人物的对话集合:
此对话集合只包含人物的对话文本,代表人物的第n段对话;
人物和人物的整体对话集合:
此对话集合包含两人对话文本,并且对话为交替进行。
进一步的,所述步骤2具体包括:
步骤2.1,对获取到的对话情感分析数据文本进行字符级清洗,然后通过预训练好字符级BERT模型,得到结果,其中C代表输入文本的字符向量集合,代表文本中第i个字符向量,然后把得到的字符向量集合通过padding到统一长度,通过一个bi-lstm模型,得到最终的字符级语义表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110205409.7/2.html,转载请声明来源钻瓜专利网。





