[发明专利]用户性格判定方法、装置、存储器和电子设备在审
申请号: | 202011343567.0 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112487184A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 姜鹏;唐杰;刘德兵;张鹏;仇瑜 | 申请(专利权)人: | 北京智源人工智能研究院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/205;G06N3/04;G06Q50/00 |
代理公司: | 北京动力号知识产权代理有限公司 11775 | 代理人: | 梁艳 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 性格 判定 方法 装置 存储器 电子设备 | ||
本发明公开了一种用户性格判定方法、装置、存储介质和电子设备。方法包括:获取目标用户在社交网络中的发文数据并将其转换为文本向量;将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;基于所述性格分类概率判定所述用户的性格类型。本发明兼具高效性和鲁棒性,解决了算法模型训练/预测速度问题以及长文本预测的准确性问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户性格判定方法、装置、存储器和电子设备。
背景技术
目前,人工智能技术广泛地应用于人才的发现和推荐中。例如对于运营学者数据的招聘系统,不仅需要利用人工智能技术分析学者的学术成就,还需要了解学者的性格情况。用户在社交平台发布的内容能够反映用户的性格特征,通常利用文本分类的方式进行性格预测,可以训练k个二分类器或者训练输出维度为k的多标签分类器,虽然二者方法不同,但是能够实现同样的功能。前一种方法大多采用支持向量机、贝叶斯等机器学习方法对社交动态进行分类,后一种方法大多采用循环神经网络对文本进行特征编码。但这两种方法都有其缺点,利用机器学习训练的分类器可扩展性低于深度神经网络,采用循环神经网络训练的分类模型实时计算效率太低,没办法达到工业级算法要求。
发明内容
鉴于以上缺点,本发明提供了一种基于膨胀门卷积神经网络和注意力机制的用户社交性格判定方法,能够高效、准确地处理多源的社交数据。
本发明的第一方面涉及一种用户性格判定方法,包括:
获取目标用户在社交网络中的发文数据并将其转换为文本向量;
将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;
基于所述性格分类概率判定所述用户的性格类型。
进一步地,所述获取目标用户在社交网络中的发文数据并将其转换为文本向量包括:
对所述发文数据进行预处理;
采用预训练的词向量模型对预处理后的发文数据进行向量化,得到所述文本向量。
进一步地,所述将所述文本向量输入预先训练的性格分类模型,输出多个维度的性格分类概率包括:
将所述文本向量输入多个膨胀门卷积神经网络,得到多个输出向量;
拼接所述多个输出向量得到拼接向量;
利用注意力网络为所述拼接向量进行打分;
将打分的拼接向量输入全连接神经网络编码并进行非线性化处理;
将非线性化处理后的编码输入分类网络得到所述多个维度的性格分类概率。
进一步地,所述多个膨胀门卷积神经网络包括大小不同的过滤器。
进一步地,每个维度包括多种状态,每种状态对应一种性格类型。
进一步地,所述维度为4,每个维度包括2种状态,性格分类概率小于预设阈值为第一状态,对应第一性格类型,大于或等于预设阈值为第二状态,对应第二性格类型。
本发明的第二方面涉及一种用户性格判定装置,包括:
获取模块,用于获取目标用户在社交网络中的发文数据并将其转换为文本向量;
性格分类模型模块,用于接收所述文本向量输入,输出多个维度的性格分类概率,所述性格分类模型包括膨胀门卷积神经网络和注意力网络;
判定模块,用于基于所述性格分类概率判定所述用户的性格类型。
进一步地,所述性格分类模型模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智源人工智能研究院,未经北京智源人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343567.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人为再造阻水边界的方法
- 下一篇:一种汽车自动变速箱的油液冷却装置