[发明专利]基于归类分析的文字处理系统在审
| 申请号: | 201710860278.X | 申请日: | 2017-09-21 |
| 公开(公告)号: | CN107657003A | 公开(公告)日: | 2018-02-02 |
| 发明(设计)人: | 曾传德 | 申请(专利权)人: | 曾传德 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/25 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610000 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 归类 分析 文字处理 系统 | ||
1.基于归类分析的文字处理系统,其特征在于,包括:
用于读取文本文件的读取模块;
用于将文本文件中的文本块进行赋值的赋值模块,赋值采用文本块所对应的左上角坐标值;
用于将任意选择一个不是核心对象的文本块作为核心对象,并选择文本块密度P和边界半径R的聚类模块;所述边界半径R采用几何距离;
所述聚类模块还用于当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入同一类然后再次聚类;所述聚类模块还用于当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象。
2.根据权利要求1所述的基于归类分析的文字处理系统,其特征在于,还包括:
用于当所有的文本块都执行过聚类后,将不是核心对象的所有文本块视为噪音文本块的判断模块。
3.根据权利要求1所述的基于归类分析的文字处理系统,其特征在于,还包括:
用于将划分好的类按照规则重新进行排版的排版模块。
4.根据权利要求1所述的基于归类分析的文字处理系统,其特征在于,所述文本块密度P正比于边界半径R的平方。
5.根据权利要求1所述的基于归类分析的文字处理系统,其特征在于,所述取消核心对象仅限于聚类模块任意选择得到的核心对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曾传德,未经曾传德许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710860278.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文件同步方法及装置
- 下一篇:视频推荐方法、系统及设备





