In modern computing ecosystems, data no longer resides in a single monolithic database. Within these environments—defined as federated (queries across heterogeneous sources) or polyglot (diverse formats and protocols)—the query engine's optimizer must make critical decisions. It must determine which filter or projection operations to execute directly at the source (pushdown), identify which data to transfer across the network to the central engine, and effectively orchestrate joins between tables residing on remote sources.

Nei moderni ecosistemi informatici, i dati non risiedono più in un unico database monolitico. In questi contesti, definiti federati (query su sorgenti eterogenee) o poliglotti (diversi formati e protocolli), l'optimizer del motore di query si trova a dover prendere decisioni critiche. Deve stabilire quali operazioni di filtro o proiezione eseguire direttamente alla sorgente (pushdown), determinare quali dati trasferire attraverso la rete verso il motore centrale e orchestrare efficacemente i join tra tabelle residenti su sorgenti remote diverse.

Ottimizzazione delle query federate per la minimizzazione del data transfer: analisi comparativa tra Trino, Apache Calcite e motori emergenti.

GRENZI, LUCIO
2024/2025

Abstract

In modern computing ecosystems, data no longer resides in a single monolithic database. Within these environments—defined as federated (queries across heterogeneous sources) or polyglot (diverse formats and protocols)—the query engine's optimizer must make critical decisions. It must determine which filter or projection operations to execute directly at the source (pushdown), identify which data to transfer across the network to the central engine, and effectively orchestrate joins between tables residing on remote sources.
2024
Federated query optimization for data transfer minimization: a comparative analysis of Trino, Apache Calcite, and emerging engines.
Nei moderni ecosistemi informatici, i dati non risiedono più in un unico database monolitico. In questi contesti, definiti federati (query su sorgenti eterogenee) o poliglotti (diversi formati e protocolli), l'optimizer del motore di query si trova a dover prendere decisioni critiche. Deve stabilire quali operazioni di filtro o proiezione eseguire direttamente alla sorgente (pushdown), determinare quali dati trasferire attraverso la rete verso il motore centrale e orchestrare efficacemente i join tra tabelle residenti su sorgenti remote diverse.
Query optimization
Data transfer
Federated query
Trino
Accio
File in questo prodotto:
File Dimensione Formato  
Grenzi.Lucio.pdf

accesso aperto

Dimensione 572.11 kB
Formato Adobe PDF
572.11 kB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/5453