[发明专利]喜好标签挖掘方法和装置有效
| 申请号: | 201510076723.4 | 申请日: | 2015-02-12 |
| 公开(公告)号: | CN104598644B | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 孙晓 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;合肥工业大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/435 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 喜好 标签 挖掘 方法 装置 | ||
一种用户喜好标签挖掘方法,包括:获取文本以及对应的音频和/或面部视频;对文本进行分词,得到词序列;提取词序列中的情感主体和情感对象;根据文本提取出表征情感主体对情感对象的情感倾向的文本特征向量;根据音频提取出表征情感主体对情感对象的情感倾向的音频特征向量,以及/或者,根据面部视频提取出表征情感主体对情感对象的情感倾向的视频特征向量;根据文本特征向量、以及视频特征向量和/或音频特征向量,采用已训练的情感倾向判别模型,判断出情感主体对情感对象的情感倾向;生成情感主体对情感对象的喜好标签。上述方法可挖掘出可更加准确反映用户真实喜好的用户喜好标签。此外,还提供一种用户喜好标签挖掘装置。
技术领域
本发明涉及数据挖掘领域,特别是涉及一种用户喜好标签挖掘方法和装置。
背景技术
常见的用户标签为可反映用户特征的字、词、短语或短句。用户喜好标签则为可反映用户喜好或情感倾向的一种用户标签。
现有的互联网应用多注重个性化服务,为用户量身推荐适合用户的产品和社交信息等,以提高信息推送命中率以及用户粘性。如何挖掘出用户兴趣点,分析用户情感倾向,从而生成用户喜好标签是很多互联网应用希望解决的问题。
传统技术一般通过社交网络中其它用户给某一用户定义的关键词生成该用户的喜好标签,但是由于个人主观因素的存在,生成的用户喜好标签不一定能真实地反映用户的喜好及情感倾向。
发明内容
基于此,有必要提供一种可挖掘出准确反映用户真实喜好的标签的用户喜好标签挖掘方法和装置。
一种用户喜好标签挖掘方法,包括以下步骤:
获取待分析的文本以及文本对应的面部视频和/或音频;
对所述文本进行分词,得到组成所述文本的词序列;
提取所述词序列中的作为情感主体和情感对象的词;
根据所述文本提取出表征所述情感主体对所述情感对象的情感倾向的文本特征向量;
根据所述面部视频提取出表征所述情感主体对所述情感对象的情感倾向的视频特征向量,以及/或者,根据所述音频提取出表征所述情感主体对所述情感对象的情感倾向的音频特征向量;
根据所述文本特征向量、以及所述视频特征向量和/或音频特征向量,采用已训练的情感倾向判别模型,判断出所述情感主体对所述情感对象的情感倾向;
根据得到的所述情感倾向生成所述情感主体对所述情感对象的喜好标签。
一种用户喜好标签挖掘装置,包括:
原始数据获取模块,用于获取待分析的文本以及文本对应的音频和/或面部视频;
分词模块,用于对所述文本进行分词,得到组成所述文本的词序列;
主体及对象提取模块,用于提取所述词序列中的作为情感主体和情感对象的词;
文本特征提取模块,用于根据所述文本提取出表征所述情感主体对所述情感对象的情感倾向的文本特征向量;
音视频特征提取模块,用于根据所述音频提取出表征所述情感主体对所述情感对象的情感倾向的音频特征向量,以及/或者,根据所述面部视频提取出表征所述情感主体对所述情感对象的情感倾向的视频特征向量;
情感倾向判断模块,用于根据所述文本特征向量、以及所述视频特征向量和/或音频特征向量,采用已训练的情感倾向判别模型,判断出所述情感主体对所述情感对象的情感倾向;
标签生成模块,用于根据得到的所述情感倾向生成所述情感主体对所述情感对象的喜好标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;合肥工业大学,未经腾讯科技(深圳)有限公司;合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510076723.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音解锁方法
- 下一篇:网页内容的提取方法、装置及系统





