[发明专利]一种联合情感和话语角色的在线论坛主题建模方法在审
| 申请号: | 202210222944.8 | 申请日: | 2022-03-09 |
| 公开(公告)号: | CN114996390A | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 张思;陈娟;徐佳丽;刘清堂 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/30;G06Q50/00;G06Q50/20 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 联合 情感 话语 角色 在线 论坛 主题 建模 方法 | ||
1.一种联合情感和话语角色的在线论坛主题建模方法,其特征在于,包括:
S1:根据帖子的需要,结合情感分类规则和标准,确定帖子中各类情感占比;
S2:根据发帖人的需要,结合预设的发帖话语角色分类表,确定发帖的各类话语角色占比;
S3:根据回帖人的需要,结合预设的回帖话语角色分类表,确定回帖的各类话语角色占比;
S4:根据帖子中各类情感占比和回帖的各类话语角色占比,获取二者联合后的概率矩阵,综合主题向量,确定在不同情感、不同话语角色下的主题分布情况,其中主题向量为帖子中各类主题出现的频率;
S5:根据S4中的在不同情感、不同话语角色下的主题分布情况、帖子的情感以及每个主题中分布的词向量,获取在特定情感、特定回帖话语角色下特定主题中的词分布情况;
S6:根据各类情感占比、发帖的各类话语角色占比、回帖的各类话语角色占比、在不同情感、不同话语角色下的主题分布情况以及在特定情感、特定回帖话语角色下特定主题中的词分布情况,构建联合情感和话语角色的主题模型。
2.如权利要求1所述的联合情感和话语角色的在线论坛主题建模方法,其特征在于,步骤S1包括:
S1.1:构建情感词典,得到情感分类规则和标准;
S1.2:根据情感分类规则和标准计算各类情感占比,计算公式为:
其中,表示在情感种类词向量中选择特定情感的概率,即帖子中各类情感占比;表示迪利克雷分布,表示在这篇文档中选择这类情感的概率,表示情感向量,表示情感向量的稀疏度;π表示文档中的情感概率分布;m表示文档数,M表示全部文档数;j表示情感种类,E表示全部情感种类数目;表示第m篇文档中第j种情感所有的词数。
3.如权利要求1所述的联合情感和话语角色的在线论坛主题建模方法,其特征在于,步骤S2包括:
S2.1:构建发帖话语角色分类表;
S2.2:根据发帖话语角色分类表,计算发帖的各类话语角色占比,计算公式为:
其中,表示在话语角色种类词向量中选择发帖角色的概率,即发帖的各类话语角色占比;表示迪利克雷分布,表示在这篇文档中选择发帖的话语角色的概率,表示发帖的话语角色向量,表示话语角色向量的稀疏度;ε表示发帖的话语角色概率分布;m表示文档数,M表示全部文档数;r表示话语角色种类,R表示全部话语角色种类数目;表示第m篇文档中发帖时第r类话语角色所拥有的数量。
4.如权利要求1所述的联合情感和话语角色的在线论坛主题建模方法,其特征在于,步骤S3包括:
S3.1:构建回帖话语角色分类表;
S3.2:根据回帖话语角色分类表,计算回帖的各类话语角色占比,计算公式为:
其中,表示在发帖话语角色既定的情况下,从话语角色种类词向量中选择回帖角色的概率,即回帖的各类话语角色占;表示迪利克雷分布,表示在某类特定发帖角色中选择回帖的话语角色的概率,表示回帖的话语角色向量,表示话语角色向量的稀疏度;ε表示回帖的话语角色概率分布;m表示文档数,M表示全部文档数;r表示话语角色种类,R表示全部话语角色种类数目;表示第m篇文档、发帖是第r种话语角色的情况下回帖中第r′类话语角色所拥有的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210222944.8/1.html,转载请声明来源钻瓜专利网。





