Scaling Heterogeneous Databases and the Design of Disco

Abstract

Access to large numbers of data sources introduces new problems for users of heterogeneous distributed databases. End users and application programmers must deal with unavailable data sources. Database administrators must deal with incorporating each new data source into the system. Database implementors must deal with the transformation of queries between query languages and schemas. The Distributed Information Search COmponent (DISCO) addresses these problems. Query processing semantics give meaning to queries that reference unavailable data sources. Data modeling techniques manage connections to data sources. The component interface to data sources flexibly handles different query languages and different interface functionalities. This paper describes in detail (a) the distributed mediator architecture of DISCO, (b) its query processing semantics, (c) the data model and its modeling of data source connections, and (d) the interface to underlying data sources. We describe several advantages of our system and describe the internal architecture of our planned prototype. Key-words: Heterogeneous, Distributed, Database, Autonomous, Mediator, Wrapper, Partial Evaluation, Unavailable Data, Database Implementation, Query Optimization (Résumé : tsvp) Address: INRIA Rocquencourt, 78153 Le Chesnay, France. e-mail: Anthony.Tomasic@inria.fr, http://rodin.inria.fr/person/tomasic This research has been partially supported by the Advanced Research Project Agency under grant ARPA/ONR 92-J1929 and by the Commission of European Communities under Esprit project IDEA. Address: University of Maryland, College Park, MD, 20742, USA. e-mail: louiqa@umiacs.umd.edu, http://www.cs.umd.edu/users/louiqa/ Address: INRIA Rocquencourt, 78153 Le Chesnay, France. e-mail: Patrick.Valduriez@inria.fr Unité de recherche INRIA Rocquencourt Domaine de Voluceau, Rocquencourt, BP 105, 78153 LE CHESNAY Cedex (France) Téléphone : (33 1) 39 63 55 11 – Télécopie : (33 1) 39 63 53 30 Bases de données hétérogène en grand et le conception de Disco Résumé : L’accès à un grand nombre de sources de données introduit de nouveaux problèmes pour les utilisateurs de sources de données hétérogènes distribuées. Les utilisateurs et programmeurs d’applications doivent prendre en compte les sources de données non disponibles. Les adminstrateurs de sources de données s’occupent d’ajouter de nouvelles sources de données dans le système. Les développeurs de sources de données s’occupent de la transformation des requêtes. Le Distributed Information Search COmponent (DISCO) s’occupe de ces problemes. La sémantique de traitement des requêtes gère les situations où les sources de données ne sont pas disponibles. Les techniques de modélisation de données gèrent la communication avec les sources de données. L’interface de médiateur avec les sources des données gère les différents langages et les fonctionnalités des différents interfaces. Ce article décrit en détail (a) l’architecture de mediateurs distribuées de DISCO, (b) la sémantique des requêtes, (c) le modele de donné et le modele de communication avec les sources de données, et (d) l’interface avec les sources de données. Nous décrivons aussi plusieurs avantages de notre système et ainsi que l’architecture interne de notre prototype. Mots-clé : Base de Donnée Hétérogène Distribué, Autonome, Médiateur, Wrapper, Évaluation partielle, Donnée non disponible The Design of DISCO 3

DOI: 10.1109/ICDCS.1996.507993

Extracted Key Phrases

Statistics

02040'97'99'01'03'05'07'09'11'13'15'17
Citations per Year

313 Citations

Semantic Scholar estimates that this publication has 313 citations based on the available data.

See our FAQ for additional information.

Cite this paper

@inproceedings{Tomasic1996ScalingHD, title={Scaling Heterogeneous Databases and the Design of Disco}, author={Anthony Tomasic and Louiqa Raschid and Patrick Valduriez}, booktitle={ICDCS}, year={1996} }