混合数据库悄然来临(1)

发表于:2007-06-13来源:作者:点击数: 标签:
中国软件行业协会数据库及应用软件分会于3月16日在北京大学成立。该会吸引了国家证券、保险等行业和IBM、NCR等数据库厂商的关注。 数据库发展四十多年,经历了第一代层次型数据库,第二代关系型数据库,到XML登场,再到面向对象技术上市。但是数据库作为软件

中国软件行业协会数据库及应用软件分会于3月16日在北京大学成立。该会吸引了国家证券、保险等行业和IBM、NCR等数据库厂商的关注。

数据库发展四十多年,经历了第一代层次型数据库,第二代关系型数据库,到XML登场,再到面向对象技术上市。但是数据库作为软件领域中最硬的一颗核、最坚固的堡垒,面临着来自四面八方的冲击,如开源趋势的不可阻挡,互联网对数据库结构性的解构……如何应对这些挑战,也是数据库及应用软件分会和众多数据库厂商们需要做的事情。

对于绝大多数IT技术人员,数据库等同于关系型数据库,数据则与表紧密联系,E-R模型几乎成为描述世界的唯一方式,SQL语言是数据库信息访问处理的唯一手段。关系型数据库已经成为一种宗教式的信仰。追溯数据库短暂的历史,可以让我们梳理出数据库的未来。

“数据库”作为短语最早使用的是在1963年6月,System Development Corporation赞助举办了一个题为“开发计算机管理中心数据库”(“Development and Management of a Computer-centered Data Base”)的研讨会。数据库作为一个独立的单词大量出现在70年代初的欧洲,直到二十世纪末才被美国各大报纸使用(数据银行Databan) 。

数据模型是数据库系统的核心和基础。因此,对数据库技术发展阶段的划分应该以数据模型的发展演变作为主要依据和标志。总体说来,数据库技术从开始到现在一共经历了三个发展阶段:第一代是网状、层次数据库系统,第二代是关系数据库系统,第三代是以面向对象数据模型为主要特征的数据库系统。

层次型数据库第一次实现了数据管理与应用逻辑的分离。二十世纪七十年代E.F Codd博士提出关系型理论,SQL语言同时出现。第二代数据库系统支持关系数据模型。关系模型不仅具有简单,清晰的优点,而且有关系代数作为语言模型,有关系数据理论作为理论基础。因此关系数据库具有形式基础好,数据独立性强,数据库语言非过程化等特点,这些特点是数据库技术发展到了第二代的显著标志。

虽然关系数据模型描述了现实世界数据的结构和一些重要的相互联系,但是仍然不足以抓住和表达数据对象所具有的丰富而重要的语义,因而它属于语法模型。

二十世纪九十年代中期,XML作为一种数据存储格式出现,它采用层次型的方式组织数据,能够清晰描述复杂对象,并易于扩展。

XML(Extensible Markup Language)技术在当前的IT环境中扮演着越来越重要的角色,它事实上已经成为数据交换的标准、SOA架构的基石,而微软Office 2007中也将以XML格式存储文档(笔者不久前就试用了这一产品的Beta2版本,发现以XML格式存储的文档较之在Office 2003下要节省20%甚至更多的存储空间)。IDC前段时间发布的一份报告就认为,XML技术的应用将会非常广泛。

同时XML也模糊了传统上结构化数据和非结构化数据的严格分界线,冲击20余年来关系型数据库的发展。

面向对象技术鼓励设计者使用对象来思考数据。有一个比较经典的比喻是这样的:你想把车停在一个面向对象的车库里。把车开进车库,下车,关上车门,然后回到你的房间。当你想出去的时候,只要走进车库,钻进汽车,启动,然后开走。

你想把车停在一个关系数据库的车库里。把车开进车库,下车,卸下车门,将它们放在地上;卸下所有的车轮,将它们放到地上;卸下保险杠及其它的东西。然后回到你的房间。当你想出去的时候,走进车库,先安上车门,再安上保险杠,然后是车轮等等,都安完了,钻进汽车,点火,然后开走。

在今天的应用领域中,软件开发已经广泛采用了面向对象的设计思想和技术,但是面向对象的数据库技术却迟迟未被市场接受。

对象数据库出现时,关系型数据库供应商已经积聚了巨大的动力,并占领了大量的市场份额。在标准的SQL接口下,访问关系型数据库的面向对象程序很容易写,但是,多数早期的对象数据完全不提供SQL接口,不适合任何查询应用程序。

XML的出现,以及相关国际标准的制定(如Xquery、SQL/XML),为数据库引入面向对象的技术提供了新的动力。虽然关系数据库正推动公司发展业务,但是它们无法与用XML表示的半结构化内容相比,它的投资巨大,过去20年来,企业在关系数据和关系数据库管理系统(RDBMS)上的投资高达万亿美元。

未来的争论

在《Software Development》组织的专家研讨会上,Don Chamberlin深信,XML 在未来的数据库中将处于中心地位:“XML 将成为文档交换的主要格式。”

而Cattel 却有不同的看法:“我可不认为纯 XML 数据库会有美好的未来。人们难道会完全用 XML 格式来存储和查询数据吗?性能肯定是大问题!我在10 年前就站到了另一边,赞成通过面向对象技术解决问题,实际上目前的主流厂商,都已经在关系数据库中很好地支持了对象。互操作性和兼容性当然重要,XML作为通用的数据交换模型,因为它的可扩展性,可能会非常适用于各种特殊目的的专门市场,但是绝不会替代关系数据库。”

Don Chamberlin同时也承认,XML是灵活的,而且能够自我描述。许多程序都需要用交换数据的格式进行查询。其他数据都将映射为XML,通过接口与外界联系。但是关系数据库和SQL不会退出历史舞台,因为它们在数据的无关性方面,在处理关系上有着天然的优势。

简单地将RDB替换成XML存储的做法并不可取,世界可以是关系的,也可以是层次的,二者各有优劣,那么数据库技术的未来在哪里?

数据库专家说,“解决的办法有两个,一个是通过对现有的关系型数据库进行对XML的支持改进,另一个就是干脆以XML作为数据标准开发一个纯粹的XML数据库。”不过开发一个新的、完全根据XML数据模型特性来设计的数据库,不仅困难而且将会不可避免地失去商业关系型数据库在数据存储方面的优势。


共2页: 1 [2] 下一页

原文转自:http://www.ltesting.net

...