An adaptive query execution system for data integration

1 June 1999

proceedings article
Published by Association for Computing Machinery (ACM)

Vol. 28 (2) , 299-310
https://doi.org/10.1145/304182.304209

Abstract

Query processing in data integration occurs over network- bound, autonomous data sources. This requires extensions to traditional optimization and execution techniques for three reasons: there is an absence of quality statistics about the data, data transfer rates are unpredictable and bursty, and slow or unavailable data sources can often be replaced by overlapping or mirrored sources. This paper presents the Tukwila data integration system, designed to support adap- tivity at its core using a two-pronged approach. Interleaved planning and execution with partial optimization allows Tuk- wila to quickly recover from decisions based on inaccurate estimates. During execution, Tukwila uses adaptive query operators such as the double pipelined hash join, which pro- duces answers quickly, and the dynamic collector, which ro- bustly and efficiently computes unions across overlapping data sources. We demonstrate that the Tukwila architecture extends previous innovations in adaptive execution (such as query scrambling, mid-execution re-optimization, and choose nodes), and we present experimental evidence that our tech- niques result in behavior desirable for a data integration system.

Keywords

This publication has 18 references indexed in Scilit:

Memory-adaptive scheduling for large query execution
Published by Association for Computing Machinery (ACM) ,1998
Cost-based query scrambling for initial delays
Published by Association for Computing Machinery (ACM) ,1998
Scaling access to heterogeneous data sources with DISCO
IEEE Transactions on Knowledge and Data Engineering, 1998
Query processing and optimization in Oracle Rdb
The VLDB Journal, 1996
Query reformulation for dynamic information integration
Journal of Intelligent Information Systems, 1996
Mariposa: a wide-area distributed database system
The VLDB Journal, 1996
Optimization of dynamic query evaluation plans
Published by Association for Computing Machinery (ACM) ,1994
Query evaluation techniques for large databases
ACM Computing Surveys, 1993
Optimization of parallel query execution plans in XPRS
Distributed and Parallel Databases, 1993
Decomposition—a strategy for query processing
ACM Transactions on Database Systems, 1976