[发明专利]一种暴力词汇的分析方法、系统、装置及介质在审
申请号: | 202310482598.1 | 申请日: | 2023-04-28 |
公开(公告)号: | CN116629250A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 黄景修;丁若飞;吴晓敏;钟金萍;郑云翔;骆羡妃 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/237;G06F40/117;G06F40/289;G06F16/35;G06N3/045 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黎扬鹏 |
地址: | 510631 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 暴力 词汇 分析 方法 系统 装置 介质 | ||
1.一种暴力词汇的分析方法,其特征在于,包括:
获取待检测的目标词汇;
根据更新后的万有引力模型对所述目标词汇进行效价分析,得到所述目标词汇的暴力效价值;
其中,所述更新后的万有引力模型通过以下步骤得到:
获取目标暴力词汇语料库;
根据所述目标暴力词汇语料库,得到训练暴力词汇集和核心暴力词汇集;
获取所述训练暴力词汇集中,与各个训练暴力词汇对应的训练暴力效价值;
根据所述核心暴力词汇集、所述训练暴力词汇集、所述目标暴力词汇语料库和各个所述训练暴力效价值,对待更新的万有引力模型的参数进行更新,得到所述更新后的万有引力模型。
2.根据权利要求1所述的暴力词汇的分析方法,其特征在于,所述获取目标暴力词汇语料库,包括:
获取原始暴力词汇语料库;
对所述原始暴力词汇语料库进行协同标注,得到所述目标暴力词汇语料库。
3.根据权利要求1所述的暴力词汇的分析方法,其特征在于,所述根据所述目标暴力词汇语料库,得到训练暴力词汇集和核心暴力词汇集,包括:
对所述目标暴力词汇语料库中的各个目标暴力词汇语料进行分词处理,得到各个目标暴力词汇;
根据预设的筛选规则对所述各个目标暴力词汇进行筛选划分,得到所述训练暴力词汇集和所述核心暴力词汇集。
4.根据权利要求1所述的暴力词汇的分析方法,其特征在于,所述万有引力模型包括效价值、目标质量、核心质量、引力系数和词汇距离;
所述万有引力模型的更新,包括:词汇距离更新、引力系数更新和质量更新。
5.根据权利要求4所述的暴力词汇的分析方法,其特征在于,所述词汇距离更新包括:
根据向量处理模型对所述训练暴力词汇集和所述核心暴力词汇集进行词向量化处理,得到训练词向量集和核心词向量集;
对所述核心词向量集进行降维、聚类处理,得到所述核心暴力词汇集的中心数据;
根据所述中心数据对所述训练词向量集的各个训练词向量进行距离计算,得到词汇距离集。
6.根据权利要求4所述的暴力词汇的分析方法,其特征在于,所述质量更新,包括:
根据向量处理模型对所述训练暴力词汇集、所述核心暴力词汇集和所述目标暴力词汇语料库进行句向量化处理,得到训练句向量集、核心句向量集和语料句向量集;
所述质量更新中的目标质量更新,包括:
获取所述训练句向量集中的训练句向量与所述语料句向量集中的各个语料句向量之间的第一句距离;
根据各个所述第一句距离,得到所述训练句向量与所述语料句向量集的第一句平均距离;
根据所述第一句平均距离和各个所述第一句距离,得到所述训练暴力词汇集中训练暴力词汇的重要性;
根据所述训练暴力词汇的重要性得到所述训练暴力词汇的目标质量;
所述质量更新中的核心质量更新,包括:
获取所述核心句向量集中的核心句向量与所述语料句向量集中的各个语料句向量之间的第二句距离;
根据各个所述第二句距离,得到所述核心句向量与所述语料句向量集的第二句平均距离;
根据所述第二句平均距离和各个所述第二句距离,得到所述核心暴力词汇集中核心暴力词汇的重要性;
根据所述核心暴力词汇集中的各个核心暴力词汇的重要性得到所述核心暴力词汇集的核心质量。
7.根据权利要求5和6所述的暴力词汇的分析方法,其特征在于,所述引力系数更新,包括:
根据所述训练暴力效价值、所述核心暴力词汇集的核心质量和所述训练暴力词汇集中各个训练暴力词汇的目标质量,得到各个所述训练暴力词汇对应的训练引力系数;
根据各个所述训练引力系数完成引力系数的更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310482598.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有自动换向的电机
- 下一篇:姿态检测的方法、装置、存储介质及电子设备