[发明专利]用于处理用于在XML数据库中存储的非XML文档的方法和系统无效
| 申请号: | 200810098199.0 | 申请日: | 2008-05-26 |
| 公开(公告)号: | CN101320380A | 公开(公告)日: | 2008-12-10 |
| 发明(设计)人: | 米歇尔·盖斯曼 | 申请(专利权)人: | 软件股份公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 柳春雷 |
| 地址: | 德国达*** | 国省代码: | 德国;DE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 处理 xml 数据库 存储 文档 方法 系统 | ||
1.一种用于处理用于在XML数据库中存储的非XML文档(10)的方法,包括步骤:
a.根据预定XML模式(50)生成用于非XML文档(10)的影子XML文档(20),所述影子XML文档(20)包括从所述非XML文档(10)提取的元数据;
b.在所述XML数据库中存储所述影子XML文档(20)和所述非XML文档(10);
c.其中所述XML模式(50)包括适于包装至少部分未定义的XML结构的XML内容的包装元素(51)。
2.如权利要求1所述的方法,其中所述包装元素(51)定义为所述XML模式(50)的根元素。
3.如权利要求1或2所述的方法,其中使用XML文档类型定义来定义所述包装元素(51)。
4.如任一前述权利要求所述的方法,其中适于使用具有通配符的XQuery来搜索所述包装元素(51)的所述XML内容。
5.如任一前述权利要求所述的方法还包括在所述影子XML文档(20)上创建索引的步骤。
6.如前一权利要求所述的方法,其中在所述XML模式(50)中定义用于所述索引的信息(52,53)。
7.如任一前述权利要求所述的方法,其中所述非XML文档(10)包括图像并且其中使用图像处理软件提取所述元数据。
8.如任一前述权利要求所述的方法,其中所述非XML文档(10)包括文本,尤其是.pdf文档或Microsoft Office文档。
9.如任一前述权利要求所述的方法,其中所述非XML文档(10)包括音频和/或视频文件。
10.如任一前述权利要求所述的方法,其中所述非XML文档(10)是压缩文件。
11.如任一前述权利要求所述的方法,其中所述影子XML文档(20)包括标识所述对应非XML文档(10)的唯一标识符。
12.包括用于执行如任一前述权利要求所述的方法的指令的计算机程序。
13.一种XML数据库系统(1),包括:
a.适于分析非XML文档(10)的分析器(6);
b.适于从所述非XML文档(10)提取元数据并且根据预定义XML模式(50)生成用于所述非XML文档(10)的影子XML文档(20)的至少一个提取器(7),所述影子XML文档(20)包括所述元数据;
c.适于包装所述影子XML文档(20)中的所提取元数据的包装器(8),其中所包装元数据的结构是在所述XML模式(50)中至少部分未定义的。
14.如权利要求13所述的XML数据库系统(1)还包括适于存储所述非XML文档(10)和所述影子XML文档(20)两者的存储装置(3)。
15.如权利要求13或14所述的XML数据库系统(1),其中所述分析器(6)、所述提取器(7)和所述包装器(8)作为数据库服务器的扩展(5)来提供。
16.如前述权利要求13到15中任意一个所述的XML数据库系统(1),还包括基于所述影子XML文档(20)的内容的索引。
17.如权利要求16所述的XML数据库系统(1),其中所述索引基于所述影子XML文档(20)的所包装元数据中的信息(52,53)。
18.如前述权利要求13到17中任意一个所述的XML数据库系统(1),其中所述影子XML文档(20)包括标识所述对应非XML文档(10)的唯一标识符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于软件股份公司,未经软件股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810098199.0/1.html,转载请声明来源钻瓜专利网。





