Video: Cloudera Overview Video 2025
HBase è scritto in Java, un linguaggio elegante per costruire tecnologie distribuite come HBase, ma faccia a faccia - non tutti coloro che vogliono approfittare delle innovazioni HBase è uno sviluppatore Java. Ecco perché c'è un ricco ecosistema di client HBase là fuori il cui unico scopo è quello di fare il pesante sollevamento Java per te e lasciarti concentrare sul far funzionare HBase per te.
Rich di solito è una buona caratteristica, ma quando quell'aggettivo supera la linea in travolgente, si inizia ad avere un problema. Ecco una panoramica dell'ecosistema del cliente in forma di diagramma. Si noti che il diagramma è simile al diagramma dell'architettura HBase, con una vista esplosa del box del cliente.
I seguenti elenchi riassumono le opzioni, iniziando con i client Apache Hadoop, in particolare i client HBase che fanno parte dell'ecosistema di Apache Hadoop insieme a quelle in bundle con HBase progettate per aiutarti a costruire Client HBase:
-
Hive: Hive è un altro progetto Apache di livello superiore. Hive fornisce le proprie funzionalità di data warehousing su Apache Hadoop. Viene fornito con un gestore di storage per HBase e fornisce anche il linguaggio di query HiveQL, che è abbastanza simile a SQL. Con Hive, puoi eseguire tutte le query su HBase che vuoi usando HiveQL e - ecco il kicker - non è richiesto alcun codice Java quando stai usando HBase con Hive.
-
MapReduce: MapReduce è parte del framework Apache Hadoop. L'affermazione di MapReduce è che si tratta di un modello di programmazione per l'elaborazione di dati in parallelo su un cluster distribuito. Nell'universo di Hadoop, HBase è (come suggerisce il nome) il "Database Hadoop". "HBase sfrutta il file system distribuito Hadoop (HDFS) e può anche essere sfruttato dai lavori MapReduce. Le tabelle HBase possono essere un'origine o un sink per i lavori MapReduce di elaborazione parallela.
-
Pig: Pig è un'altra tecnologia inclusa con Apache Hadoop e, come con Hive, Pig può sfruttare HBase. Pig ti porta su un livello dandoti un linguaggio di programmazione di livello superiore chiamato Pig Latin, che può fare il pesante sollevamento di MapReduce per te.
-
Multi-Language Thrift System: Thrift offre un approccio neutro alla lingua per la creazione di client HBase. Sviluppato da Facebook, IDL (Interface Definition Language) di Thrift consente di definire i tipi di dati e le interfacce di servizio in modo che due sistemi diversi scritti in lingue diverse possano comunicare tra loro. Dopo la scrittura dell'IDL, Thrift genera il codice necessario per la comunicazione.
-
Client Java: Se ti capita di essere uno sviluppatore Java e capisci i dettagli di pacchetti Java, allora ti consigliamo di controllare il pacchetto che viene fornito in bundle con la distribuzione HBase.
-
Sistema REST: Probabilmente l'approccio più veloce per accedere a una tabella HBase è sfruttare l'interfaccia REST. REST, che sta per Re presentazione S tate T ransfer, è la tecnologia che fa funzionare il tuo browser web. La maggior parte delle persone dà per scontato i browser web in questi giorni, quindi cosa potrebbe essere più naturale per chiunque che utilizzare il proprio browser preferito come gateway per un cluster HBase?
Come per l'approccio Thrift, il server gateway REST viene fornito con HBase ed è necessario avviarne almeno uno per abilitare l'interazione del browser con le tabelle. Per farlo, basta selezionare un numero di porta per il server gateway e digitare il seguente comando:
$ INSTALL_DIR / hbase-0. 94. 7 / bin / hbase resto start _p 7777
-
JRuby (shell HBase): Il modo più veloce per rimboccarsi le maniche e imparare a usare HBase è tramite la shell HBase. Come probabilmente già visto nell'esempio pratico della shell HBase nella sezione precedente, la shell è un potente strumento per interagire con HBase. La shell HBase si basa su Interactive Ruby Shell di JRuby o IRB in breve.
Tenere presente, tuttavia, che è anche possibile scrivere script ed eseguirli in modalità batch.
