热门关键字:  ubuntu  分区  函数  linux系统进程  Fedora

使用 pureXML 发挥出数据的最大价值

来源: 作者: 时间:2007-09-09 Tag: 点击:

  处理非结构化数据 —— 缺少的拼图

  在使用 XML 方面,很多公司的一个关键目标就是能够处理各种类型的、不能有效地存储在关系数据库(RDB)中的数据。这是一个重要的目标,因为一个企业中的大部分数据都不是结构化的,不能存储在常规的 RDB 中。据调查发现,一个企业中只有 10% 的数据是在 RDB 中管理的。这意味着企业中还有 90% 的信息没有得到系统化的管理或利用。大多数企业不能有效地利用那些非结构化数据。

  很多 XML 的支持者一直期望 XML 可以很快帮助实现将这种非结构化数据转换成便于管理和利用的形式的目标。但是直到现在,这个目标的实现还缺少两块重要的拼图:

  •   一种能存储 XML 数据,并将其当作 XML 数据来操纵的数据库
  •   一种用于开发本地 XML 应用程序的完善的工具。

  然而,在 2006 年的夏季,第三代数据库 IBM DB2 9(代码名为 “DB2 Viper”)以及 Justsystems 公司的本地 XML 应用程序平台 “xfy” 作为这最后两块拼图出现了。

  用于 XML 数据的 DB2 9 混合型数据库

  DB2 9 是一种混合型数据库。除了具有 RDB 的功能以外,DB2 9 还具有 XML 数据库(XMLDB)的功能。DB2 9 可以将 XML 数据不作改变地存储为实际的 XML 数据。这是之前的 RDB 无法做到的,RDB 一般是通过将 XML 数据放进特定的表结构中来存储 XML 数据,而且只是简单地将数据作为大型字符串来处理。

  DB2 9 可以使用 SQLXQuery 来搜索关系数据和 XML 数据。除了使用 XQuery 搜索 XML 数据和使用 SQL 搜索关系数据外,用户还可以在同一个查询中同时搜索关系数据和 XML 数据。

  相对于单模式的 RDB 来说,DB2 9 可以非常灵活地处理多种模式。例如,DB2 9 可以存储多种模式的 XML 数据,或者存储无模式的 XML 数据。这种模式灵活性使查询可以横跨不同的 XML 数据(例如具有不同模式的 XML 数据)进行搜索。这种多源搜索常被称作 “联邦搜索”。

  一个搜索 —— 多个数据源

  DB2 9 支持在具有不同模式的数据上进行联邦搜索。这大大扩展了企业利用那些没有被有效地存储在关系 RDB 中的数据的能力。

  例如,考虑一个企业使用的各种不同类型的数据,如电子邮件、订单或建议书。在过去,这些在性质上各不相同的数据甚至常常不是存储在相同的 RDB 中,即使是存储在相同的 RDB 中,这种 RDB 也只是简单提供低级的搜索功能。但是现在,可以将 XML 格式的数据存储在 DB2 9 数据库中,对所有数据都可以进行查询。这使得用户可以在一个查询中搜索多种类型的数据。例如,用户可以提取与一个客户相关的所有数据,即使是具有不同模式的结构化的数据。

图 1. 在一个查询中访问多种模式
在一个查询中访问多种模式

最新评论共有 4 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册