[发明专利]基于字频词频的字符分组方法、存储介质及电子设备有效
| 申请号: | 202211416941.4 | 申请日: | 2022-11-14 |
| 公开(公告)号: | CN115455987B | 公开(公告)日: | 2023-05-05 |
| 发明(设计)人: | 田辉;朱鹏远;鲁国峰;郭玉刚;张志翔 | 申请(专利权)人: | 合肥高维数据技术有限公司 |
| 主分类号: | G06F40/44 | 分类号: | G06F40/44;G06F40/289;G06F17/16 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明特别涉及一种基于字频词频的字符分组方法、存储介质及电子设备,其中该字符分组方法包括如下步骤:遍历语料库,计算待分组的N个字符的概率及其所组成的各词语概率;根据字符概率和词语概率计算状态转移矩阵;对状态转移矩阵进行归一化得到归一化的状态转移矩阵;逐一遍历字符,计算待分配字符c分配到所有分组的权重并将字符c添加到权重最大的组,该权重和随机二元字符包含组别数的期望值正相关,以此类推直到所有字符完成分组。通过权重计算公式,让经常出现在一起的两个字符分在不同组时的权重增大,再通过选择权重最大的组来让一起出现的字符尽量不同组,实现了字符的合理分组,该分组方式对每组中字符个数不做限制,从而更加合理。 | ||
| 搜索关键词: | 基于 字频 词频 字符 分组 方法 存储 介质 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥高维数据技术有限公司,未经合肥高维数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211416941.4/,转载请声明来源钻瓜专利网。





