全球旧事资料 分类
143查询处理和优化
1、影响分布式查询处理的因素详细见分布式数据库系统的查询优化影响分布式查询处理效率的主要因素有:①数据分布(数据的局部性)。系统中数据的合理分布将使数据存放到离其应用点最近的节点,这样就使得每个节点只处理数据库的一个部分,CPU和IO服务的竞争就不像集中式数据库那样严重,而且还减少了远程访问的延迟(这样的延迟常发生在通信链路中)和节点间数据的传输量。②内部查询和内在查询的并行化。系统的内部查询并行化是多个查询同时执行的结果;内在查询并行化是将单个查询分解成子查询以便每个子查询在不同的节点执行的结果。这样的并行将大大降低查询处理所需的时间,提高查询处理的效率。③节点间传输的数据总量。在系统的分布式处理中,查询策略的不同将导致在节点间传输的数据总量的差异,这将极大的影响查询处理的效率(特别是在节点间的通信效率不高时)。④传输一组数据的代价。在系统中,传输一组数据的代价随具体查询处理的要求和通信线路的状况而变,将影响查询处理的代价模型从而改变查询处理的策略,导致查询处理效率的变化。
f⑤各节点的处理延迟。在分布式查询处理中,由于涉及多个节点的操作,各个节点的处理延迟就成为影响查询处理效率的重要因素了。2、分布式查询的优化
经过对分布式查询处理的分析(如上文所述),对其优化处理如下:1查询分解
2查询的场地选择在分布式数据库系统中,由于数据分布在用网络连接的多个场地上,有重复副本的数据库中每个关系在不同的场地上又都有一些副本,这样在查询处理时,必然要涉及场地选择问题。场地选择关系到传输延迟,因而是影响查询处理效率的重要因素之一。场地选择的原则是:①保证查询的成功;②尽量保证处理的局部性;③尽可能选取通信开销小的场地。对于分布式查询处理中的场地选择有四种典型算法:分支与估界算法(BB)、贪婪算法(GR)、模拟退火法(SA)和局部搜索算法(LS)。3查询优化的实现以个人代理营销业务系统为例,查询优化主要从两个方面考虑:①减少场地间的数据传输;②要增加操作的并行性。对通信费用的算法主要思想是对每个查询条件都尝试是否能够用半连接减少通信费用;对响应时间的算法主要采用“本地析取,异地合取”的策略,即把各节点满足条件C1∨…∨Cm数据元组集合先传送到选定的处理节点,然后在处理节点对其并集过滤出满足条件C1∧…∧
fCm的数据元组集合,得到所需的结果。这样可以r
好听全球资料 返回顶部