[发明专利]支持基于规则的文档内容挖掘的系统与方法无效
申请号: | 200780001495.8 | 申请日: | 2007-04-10 |
公开(公告)号: | CN101361063A | 公开(公告)日: | 2009-02-04 |
发明(设计)人: | 陈翌;何余良 | 申请(专利权)人: | 龙搜(北京)科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 王茂华;李辉 |
地址: | 100083中国北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于支持从结构化数据或非结构化数据提取内容的基于规则的内容挖掘的系统,该系统接收包含结构化数据、或非结构化数据、或者两者混合数据的文件。然后,系统基于所述接收的文件来生成易处理的可扩展标记语言(pXML)文件。系统进一步基于一种或多种规则来从所述pXML文件提取内容,以及基于指定格式来生成语义XML文件。 | ||
搜索关键词: | 支持 基于 规则 文档 内容 挖掘 系统 方法 | ||
【主权项】:
1.一种用于支持从结构化数据或非结构化数据提取内容的基于规则的内容挖掘的方法,所述方法包括:接收包含结构化数据、或非结构化数据、或者两者混合数据的文件;基于所述接收的文件来生成易处理的可扩展标记语言(pXML)文件;基于一种或多种规则来从所述pXML文件提取内容;以及基于指定格式来生成语义XML文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙搜(北京)科技有限公司,未经龙搜(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200780001495.8/,转载请声明来源钻瓜专利网。
- 上一篇:粘胶衬里
- 下一篇:带有可更换的测量插件的温度计和更换该测量插件的方法