对分布式数据的管理和访问就成为必须解决的问题。由于一个事务所涉及的数据可能分布在多个结点上(如图四),这就要求数据库系统具备一个优化的分布查询策略。对于这种分布执行的事务,系统要保证事务执行的原子性和可串行化,以及解决分布环境下的安全问题、恢复问题、分布透明性、节点自治、全局命令空间、分布式查询、分布式更新、数据分布与复制、两阶段提交2PC、网络数据字典NDD等关键问题。分布式数据库系统正是为解决上述问题而设计的。一个分布式数据库系统由一个逻辑数据库组成,这个逻辑数据库的数据存储在一个或多个结点的物理数据库上,通过两阶段提交2PC协议来提供透明的数据访问和事务管理。分布式数据库系统在系统结构上的真正含义是指物理上分布、逻辑上集中的分布式数据库结构。数据在物理上分布后,由系统统一管理,使用户不感到数据的分布。用户看到的似乎不是一个分布式数据库,而是一个数据模式为全局数据模式的集中式数据库。分布式数据库有性能高、可扩充性好、可用性好以及具有自治性等优点。分布式数据库系统仍存在不足:由于数据库系统的应用通常是逐步发展的,起先是建立各种孤立的数据库,而管理这些数据库的计算机系统和DBMS包括数据模型很可能是不同的,也就是异构的Heteroge
eous。当应用需要转向分布式数据处理时,抛弃原有的系统另砌炉灶显然是不合理的,这就需要解决异构数据库的集成问题。这在技术上有一定的复杂性,而且目前还很难用一个通用的DBMS来解决这样的问题。我们希望一种新的数据库技术联邦数据库系统FederatedDatabaseSystem能解决这一问题。此外分布式数据库系统虽然有利于改善性能,但如果数据库设计不好,数据分布不合理,使远距离访问过多,特别是当分布连接操作过多时,都会降低系统的性能。
222
联邦式数据库架构
分布式数据库系统不能很好解决的异构数据库的集成问题,可以通过建立联邦数据库系统来解决。通常称相互独立运行的数据库系统为单元数据库系统Compo
e
tDBS。它是原本存在的、在局部地区应用的数据库系统,它们是联邦数据库系统的一部分。所谓联邦式数据库系统是一种物理上分布、逻辑上分布的分布式数据库结构。这种分布式数据库结构的特点是结点自治SiteAuto
omy和没有全局数据模式GlobalDataSchema。每个结点所看到的数据模式仅仅限于该结点所用到的数据。它一般由两部分组成:一是本结点的数据模式,二是供本结点共享的其他结点上的有关的数据模式。结点间的数据共享由双r