Video: Apache Drill Introduction 2024
Apache Drill è un progetto candidato nell'incubatore di Apache. Apache Drill non è particolarmente malaticcio, però. Le tecnologie candidate di Apache Software Foundation (ASF) iniziano tutte come progetti di incubazione prima di diventare tecnologie ASF ufficiali. Puoi leggere l'Incubatore Apache. Puoi leggere su Drill.
Ispirato dalla tecnologia Dremel di Google, l'obiettivo prestabilito per Drill è di abilitare query SQL su petabyte o su più dati distribuiti su più di 10.000 server. La figura illustra l'architettura di Apache Drill.
È possibile notare che la chiave dell'architettura Drill sono i server DrillBit distribuiti su ciascun nodo di dati. Si noti che ogni server include un parser di query, un compilatore, un ottimizzatore e un runtime, ma esiste un server master DrillBit nominato dai server Zookeeper, che supervisiona l'esecuzione delle query e cura l'attività di riunire i set di risultati intermedi in un singolo set di output.
Come Dremel, Drill può coesistere con e complemento, MapReduce, ma MapReduce non viene utilizzato per soddisfare le richieste, come con Apache Hive. Invece, i motori di esecuzione denominati Drillbits sono stati sviluppati dai membri della comunità Drill.
Questa community mira a fornire query a bassa latenza per applicazioni quali cruscotti di business intelligence in tempo reale, rilevamento di frodi e altri casi d'uso sensibili al fattore tempo. Drill supporta tipi di dati annidati come Avro, JSON e buffer di protocollo di Google. Questi tipi di dati nidificati consentono tabelle denormalizzate molto grandi.
Il team di sviluppo Drill sta inoltre lavorando per fornire un supporto SQL completo, mirando alla conformità con SQL2003. Infine, si noti che il team Drill fornisce supporto HBase in modo che gli utenti possano interrogare le tabelle HBase con SQL.