[发明专利]计算词的TF-IDF值的方法、装置、设备及存储介质有效
申请号: | 201911330916.2 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111125332B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 陈建华;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种计算词的TF‑IDF值的方法、装置、设备及存储介质,包括:根据目标词遍历树形数据结构的根节点下的子节点,确定出目标子节点;获取该目标子节点对应的目标集合,该目标集合中包括有文本标识以及该目标词在该文本标识对应的文本中的TF值;根据该目标集合中所包括的文本标识的数量以及该根节点所指示的文本总数,确定出该目标词的IDF值,进而计算出该目标词的TF‑IDF值。可见,在确定该目标词对应的目标集合后,可以直接确定出文本库中存在哪些文本包含该目标词以及该目标词在每个文本中的TF值,从而可以有效减少确定这些文本所需消耗的计算资源,提高确定目标词对应的TF‑IDF值的效率。 | ||
搜索关键词: | 计算 tf idf 方法 装置 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911330916.2/,转载请声明来源钻瓜专利网。