Hive CLI Client - dummies - Finanza personale 2025

Video: Hive commands using command line interface 2025

Il primo client Hive è l'interfaccia a riga di comando Hive (CLI). Per padroneggiare i punti più fini del client CLI Hive, potrebbe essere utile rivedere l'architettura Hive (un po 'caotica).

Nella seconda figura, l'architettura è ottimizzata per concentrarsi solo sui componenti richiesti durante l'esecuzione della CLI.

Questi sono i componenti di Hive necessari quando si esegue la CLI su un cluster Hadoop. Qui, si esegue Hive in modalità locale, che utilizza l'archiviazione locale, piuttosto che l'HDFS, per i dati.

Per eseguire la CLI di Hive, si esegue il comando hive e si specifica CLI come servizio che si desidera eseguire. Nel seguente elenco, è possibile visualizzare il comando richiesto e alcune delle nostre prime istruzioni HiveQL. (Un'annotazione di passi che utilizza il modello A-B-C è inclusa nell'elenco per indirizzare l'attenzione sui comandi dei tasti.)

(A) $ $ HIVE_HOME / bin hive --service cli (B) hive> imposta hive. cli. stampare. attuale. db = true; (C) hive (predefinito)> CREATE DATABASE ourfirstdatabase; OK Tempo impiegato: 3. 756 secondi (D) hive (predefinito)> USE ourfirstdatabase; OK Tempo impiegato: 0. 039 secondi (E) hive (ourfirstdatabase)> CREATE TABLE our_first_table (> FirstName STRING,> LastName STRING,> EmployeeId INT); OK Tempo impiegato: 0. 043 secondi hive (ourfirstdatabase)> esci; (F) $ ls / home / biadmin / Hive / warehouse / ourfirstdatabase. db our_first_table

Il primo comando (vedere il punto A) avvia la CLI Hive utilizzando la variabile di ambiente $ HIVE_HOME. L'opzione della riga di comando -service cli indirizza il sistema Hive all'avvio dell'interfaccia della riga di comando, anche se potresti aver scelto altri server.

Successivamente, nel passo B, dite alla CLI Hive di stampare il vostro attuale database di lavoro in modo da sapere dove vi trovate nel namespace. (Questa affermazione ha senso dopo che spieghiamo come usare il prossimo comando, quindi tienilo stretto.)

Nel passo C usi il linguaggio di definizione dei dati di HiveQL (DDL) per creare il tuo primo database. (Ricordare che i database in Hive sono semplicemente spazi dei nomi in cui risiedono tabelle particolari, perché un insieme di tabelle può essere pensato come un database o uno schema, si potrebbe aver usato il termine SCHEMA al posto di DATABASE per ottenere lo stesso risultato.).

Più in particolare, stai utilizzando DDL per dire al sistema di creare un database chiamato nostro database di primo livello e quindi rendere questo database predefinito per i successivi comandi DDL di HiveQL utilizzando il comando USE nel passaggio D. Nella fase E, devi creare il tuo primo tabella e dargli il nome (abbastanza appropriato) our_first_table.

(Fino ad ora, potreste aver pensato che somiglia molto a SQL, con forse alcune piccole differenze di sintassi a seconda di quale RDBMS siete abituati - e avreste avuto ragione.) L'ultimo comando, in Passo F, esegue un elenco di directory della directory del magazzino di Hive prescelta in modo da poter vedere che our_first_table è stato effettivamente memorizzato su disco.

Imposta l'alveare. metastore. magazzino. dir variabile per puntare alla directory locale / home / biadmin / Hive / warehouse nella macchina virtuale Linux piuttosto che usare l'HDFS come faresti su un cluster Hadoop appropriato.

Dopo aver creato una tabella, è interessante visualizzare i metadati della tabella. Negli ambienti di produzione, potresti avere decine di tavoli o più, quindi è utile essere in grado di rivedere la struttura della tabella di volta in volta. È c an utilizzare un comando HiveQL per eseguire questa operazione utilizzando la CLI di Hive, ma il server Hive Web Interface (HWI) fornisce un'interfaccia utile per questo tipo di operazione.

L'uso del server HWI al posto della CLI può anche essere più sicuro. È necessario prestare particolare attenzione quando si utilizza la CLI negli ambienti di produzione poiché la macchina che esegue la CLI deve avere accesso all'intero cluster Hadoop.

Di conseguenza, gli amministratori di sistema in genere mettono a disposizione strumenti come la shell sicura (ssh) per fornire un accesso controllato e sicuro alla macchina che esegue la CLI e per fornire la crittografia di rete. Tuttavia, quando viene utilizzato il server HWI, un utente può accedere solo ai dati Hive consentiti dal server HWI tramite il proprio browser web.