[发明专利]一种信息处理方法、装置、电子设备及计算机存储介质有效
| 申请号: | 201810745000.2 | 申请日: | 2018-07-09 | 
| 公开(公告)号: | CN109101485B | 公开(公告)日: | 2022-07-29 | 
| 发明(设计)人: | 杜若;覃勋辉;向海;侯聪;刘科 | 申请(专利权)人: | 重庆邂智科技有限公司 | 
| 主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/284;G06F40/247 | 
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 | 
| 地址: | 400000 重庆市渝北区金*** | 国省代码: | 重庆;50 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 装置 电子设备 计算机 存储 介质 | ||
1.一种信息处理方法,其特征在于,包括:
接收信息处理请求,所述信息处理请求包括多个文本信息,各个所述文本信息包括至少一个文本词;
根据所述多个文本信息包括的文本词,得到关于所述文本词的第一同义词集合,所述第一同义词集合包括所述文本词以及所述文本词的至少一个同义词;
针对各个所述文本信息,确定所述文本信息的第一系数,所述第一系数与包含所述文本信息中的文本词的第二同义词集合相对应,所述第一同义词集合包括所述第二同义词集合,所述第一系数用于建立所述第二同义词集合和所述文本信息之间的线性表示关系;
根据所述文本信息的第一系数,得到所述第二同义词集合的词频-逆文件频率;
其中,所述确定所述文本信息的第一系数,包括:
获取所述文本信息中各个文本词的词频,所述文本词的词频用于建立所述文本词和所述文本信息之间的线性表示关系;
获取包含各个所述文本词的第二同义词集合;
针对各个所述第二同义词集合,根据所述第二同义词集合针对各个所述文本词的第二系数和所述文本词的词频,得到所述第二同义词集合的第一系数;其中,一个文本词的第二系数用于建立第三同义词集合和所述一个文本词之间的线性表示关系,所述第二同义词集合包括所述第三同义词集合。
2.根据权利要求1所述的方法,其特征在于,所述信息处理请求还包括目标同义词集合的目标数量N,所述根据所述文本信息的第一系数,得到所述第二同义词集合的词频-逆文件频率之后,所述方法还包括:
从所述第二同义词集合中选择词频-逆文件频率最大的前N个第二同义词集合作为目标同义词集合。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第二同义词集合针对各个所述文本词的第二系数和所述文本词的词频,得到所述第二同义词集合的第一系数之前,所述方法还包括:
针对所述文本信息中的各个文本词,确定所述文本词的第一向量;
根据所述文本词的第一向量,得到包含所述文本词的第三同义词集合的第二向量;
根据所述文本词的第一向量和所述第三同义词集合的第二向量,得到所述文本词和所述第三同义词集合之间的余弦相似度;
根据所述余弦相似度,得到所述第三同义词集合针对所述文本词的第二系数。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述信息处理请求还包括所有文本信息的数量,所述根据所述文本信息的第一系数,得到所述第二同义词集合的词频-逆文件频率,包括:
对所述文本信息的所有第一系数求和,得到第一数值;
将所述第二同义词集合对应的第一系数除以所述第一数值,得到第二数值;
对所述第二同义词集合针对各个所述文本信息的第一系数求和,得到第三数值;
对所述信息处理请求包括的所有文本信息的数量除以所述第三数值的结果进行对数运算,得到第四数值;
将所述第二数值和所述第四数值相乘,得到所述第二同义词集合的词频-逆文件频率。
5.根据权利要求1~3任一项所述的方法,其特征在于,所述根据所述多个文本信息包括的文本词,得到关于所述文本词的第一同义词集合,包括:
对所述多个文本信息进行分词处理,得到文本词集合,所述文本词集合包括至少一个文本词;
在预设同义词数据库中查找各个所述文本词的同义词,得到关于各个所述文本词的第四同义词集合,所述第四同义词集合包括所述文本词以及查找到的所述文本词的同义词;
根据所述第四同义词集合,得到所述第一同义词集合。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第四同义词集合,得到所述第一同义词集合,包括:
确定文本词和所述文本词的所有同义词均存在于其他第四同义词集合中的目标第四同义词集合,所述其他第四同义词集合为所述关于各个所述文本词的第四同义词集合中除所述目标第四同义词集合以外的第四同义词集合;
将所述其他第四同义词集合确定为所述第一同义词集合。
7.一种信息处理装置,其特征在于,所述装置包括用于执行如权利要求1~6任一项所述的方法的单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邂智科技有限公司,未经重庆邂智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810745000.2/1.html,转载请声明来源钻瓜专利网。





