[发明专利]一种基于时序分析用户会话情感趋势的表情符号推荐方法有效
申请号: | 201710976797.2 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107729320B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 高岭;周俊鹏;曹瑞;杨旭东;郑杰;杨建峰;高全力;王海 | 申请(专利权)人: | 西北大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/36;G06F17/18;H04L29/08 |
代理公司: | 西安西达专利代理有限责任公司 61202 | 代理人: | 刘华 |
地址: | 710069 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时序 分析 用户 会话 情感 趋势 表情符号 推荐 方法 | ||
1.一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,包括以下步骤:
1)发掘用户聊天记录来预处理并分析对话的情感值,以此构建表情符号在情感矩阵中的映射关系;
2)利用情感字典分析对话历史记录计算情感关键词;情感字典分为情感词典、语气词情感字典、标点符号情感字典;在用情感字典进行词语匹配计算情感值的时候使用正向最大匹配法,具体将包含相同词语的不同长度的词语划分在用户字典上,以由长至短的方式排列,以便优先匹配最直接可寻的短语、词语;
3)通过情感关键词以及计算规则计算会话的21维情感向量;
4)通过时间序列模型对用户当前对话情感向量的发展进行单步预测,并将预测结果从映射关系中通过最近邻算法选取用户情感趋势的表情组并生成推荐列表。
2.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,在步骤1)中描述的发掘用户聊天记录进行预处理,具体流程包括:对用户聊天记录信息进行初分类,分为文本信息、语音信息;对文本部分信息进行符号过滤、分词、去停用词操作,并和情感字典匹配建立属于个人独特的情感字典,用于标注表情符号的情感值。
3.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤1)构建表情符号在情感矩阵中的映射关系,包括通过计算用户的情感值,得到一个表情-情感指数计算矩阵;该矩阵能够统计到每一个表情和其所能够表达的情感值的二维关系,主要用于描述每一个用户发送的表情符号在情感值上的表现形式;在情感值计算过程中,抽取有表情符号的前k条带有情感的话语,确保用于分词的用户字典和用于计算情感值的情感字典拥有相同的词条,以便最大化词典匹配效果。
4.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤3 )通过情感关键词以及计算规则计算会话的21维情感向量,包括:将情感按照Ekman划分方法,确定情感的划分准则,扩展出21小类;通过情感划分,建立一个参照标准,量化其具体词语的实际情感表达;利用情感字典分析对话历史记录计算情感关键词,包括建立相应的情感字典;针对用户历史会话记录,对其进行分词、提取处理,同时也要对语气词、标点符号建立辅助情感语气词表、情感标点符号表。
5.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤3)中通过情感关键词以及计算规则计算会话的21维情感向量,包括抽取用户会话记录的前n条带有感情的话语,进行分词、去除多余空格、过滤停用词、去除在情感字典中没有出现的其他符号;将处理后的语句在情感字典中进行查找匹配,计算其情感倾向的总期望,以此得到对应表情的21维情感向量。
6.根据权利要求1所述的一种基于时序分析用户会话情感趋势的表情符号推荐方法,其特征在于,所述的步骤4)中涉及的用户当前对话情感向量是将用户对话情感数据按时间先后次序排列,构成一条随机时间序列,公式为:
{Emotioni},i=t1,t2,t3,…,tn,
将会话记录中重复出现的语句进行数据去重,对不完整信息进行曲线拟合+重采样处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710976797.2/1.html,转载请声明来源钻瓜专利网。