[发明专利]电子文本处理与检索的便捷方法和系统无效
| 申请号: | 200710164298.X | 申请日: | 2007-10-24 |
| 公开(公告)号: | CN101201841A | 公开(公告)日: | 2008-06-18 |
| 发明(设计)人: | 刘二中 | 申请(专利权)人: | 刘二中 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100089北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电子 文本 处理 检索 便捷 方法 系统 | ||
1.一种计算机执行的对多个含有同样关键词的电子文本进行处理的方法,包括:
获得多个含有同样关键词的电子文本;
规定邻接词段所含字词数量或邻接词段截取方式;
根据部分或全部文本中的每个文本内容中所述关键词的邻接词段与其他文本相同还是不同,将该文本与其他文本划分入同一或不同子集或类别或者进行相应的相同或不同处理;
所述的相应的相同或不同处理可以包括:相应文本具有相同或不同的分布位置或存储方式,或者得到相同或不同的子集标记,或者使得其索引具有相同或不同的标记或索引项,或者具有相同或不同的编排方式,或者在交互界面具有相同或不同的显示方式或位置,或者允许至少部分子集各有一个或多个邻接词段或文本进行跨子集组合或排序或在交互界面展示;
所述的文本可以是电子文件或网页或者它们的摘要或索引或题录或题目。
2.按照权利要求1所述的处理方法,其中包括:对于属于某个或某些同一第一级子集或较高的子集或其内容含有同样关键词及邻接词段的不同文本,根据其含有的所述同样关键词及邻接词段的其他邻接词段的相同还是不同,将部分或全部所述文本划分入上述子集同一或不同的下一级或多级子集或者进行相应的相同或不同处理;
所述处理方法允许依次的邻接词段的合并或分开,以减少或增加子集层次。
3.按照权利要求1所述的处理方法,包括:
编排一个反映所述文本的同样关键词的不同邻接词段或间接邻接词段或者包含这些词段的语句或例句或摘要实例的并列或先后关系的一级或多级的目录或树状目录或序列,其中,可以包括所述文本的一个或多个不同子集各自的所述的相同邻接词段或相同间接邻接词段或者包含该词段的语句或例句或摘要实例,或者包括这个或这些子集的下一级或下几级多个子集各自的相同的邻接词段或间接邻接词段或者包含该词段的语句或例句或摘要实例,按照并列或隶属先后关系编排或分布或存储或展示;其中所述的词段或语句或例句或摘要实例可以是跨子集并列的。
4.按照权利要求1或2或3所述的处理方法,包括:
在上述的文本或目录或语句或例句或摘要实例中或者在它们所包含的关键词或邻接词段或间接邻接词段附近,可以具有其相应的并列子集数目或下级子集数目或者相关词或词段所在子集的并列子集数目或所含的下级子集数目或文本数目的提示。
5.按照权利要求1所述的处理方法,包括:
编排含有同样关键词的多个文本或文本部分内容的序列,它们含有的由多个词组成的邻接词段互不相同,或基本上互不相同。
6.按照权利要求1或3或5所述的处理方法,包括:
将所述文本的同样关键词的不同邻接词段进行相似比较,将相互符合一定相似要求的多个不同邻接词段划分入同一相似子集,或者将相互不符合一定相似要求的多个不同邻接词段划分入不同相似子集,或者将相互不符合一定相似要求的多个不同邻接词段编成彼此不相似邻接词段的序列或目录,可以将同一相似子集的各元素的共同的内容作为该相似子集的名称或标记,或者将其列入相似子集名称序列或目录;
所述的一定相似要求至少包括对不同邻接词段所含有的同样的字或词或词组或字符的数量或所占比例的要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘二中,未经刘二中许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710164298.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理设备、图像处理方法、程序、及存储介质
- 下一篇:粘合剂组合物及方法





