Prendi HBase per un test run - dummies

Video: Predictive Personalization 101 2025

Qui, scopri come scarica e distribuisci HBase in modalità standalone. È incredibilmente semplice installare HBase e iniziare a utilizzare la tecnologia. È sufficiente tenere presente che HBase viene generalmente distribuito su un cluster di server commodity, sebbene sia possibile anche distribuire facilmente HBase in una configurazione autonoma, per scopi di apprendimento o di dimostrazione.

Come Apache Hadoop, HBase supporta principalmente Linux, ma può usare Windows in ambienti non di produzione se si scarica Cygwin per la prima volta. Cygwin offre agli utenti di Microsoft Windows una shell Unix con tutti i suoi comandi e utilità. Quindi, se segui la Guida rapida, ti consigliamo di scaricare l'ultima versione di HBase.

Si arriva a scegliere dove installare HBase. Tuttavia, se vuoi che le cose funzionino in modalità standalone, dovrai modificare un paio di file prima di poter avviare effettivamente HBase. Il primo file è mostrato nel seguente elenco. Le modifiche che desideri apportare sono in grassetto per farle risaltare:

hbase. rootdir file: /// home / biadmin / my-local-hbase / hbase-data hbase. grappolo. distribuito true HBase. Zookeeper. proprietà. clientPort 2222 Proprietà dallo zoo di configurazione ZooKeeper. CFG. La porta a cui i client si connetteranno. HBase. Zookeeper. proprietà. DataDir / home / BiAdmin / my-local-HBase / guardiano dello zoo HBase. Zookeeper. quorum bivm

Si specifica una directory nel file system locale per memorizzare i dati HBase. Negli ambienti di produzione, questa proprietà punta all'HDFS per l'archivio dati. A scopo illustrativo, la modalità pseudo-distribuita farà sì che HBase avvii un'istanza RegionServer, un'istanza MasterServer e un processo Zookeeper.

Inoltre, è necessario specificare la directory in cui Zookeeper memorizzerà i suoi dati () e un elenco di server su cui verrà eseguito Zookeeper per formare un quorum (). Per standalone, si specifica solo il server singolo Zookeeper.

Iniziare con HBase in modalità standalone è molto semplice in parte perché HBase gestisce Zookeeper per te. È possibile scaricare una versione separata di Zookeeper e puntare HBase su di essa, ma per le installazioni standalone, troverete molto più facile lasciare che lo HBase gestisca Zookeeper per voi.

Per cristallizzare la decisione di consentire a HBase di gestire Zookeeper, ecco come impostare una variabile di ambiente in un altro file HBase. Il seguente elenco mostra cosa deve essere aggiunto:

# Indica a HBase se deve gestire la propria istanza di Zookeeper o no. export HBASE_MANAGES_ZK = true # L'implementazione java da utilizzare.Java 1. 6 richiesto. export JAVA_HOME = / opt / ibm / biginsights / jdk

Dovrai assicurarti di puntare al JDK scelto. Infine, devi specificare il nome del tuo sistema Linux in un altro file. (In un ambiente di produzione completamente distribuito, questo file contiene un elenco linea per riga di tutti i server su cui HBase può avviare il processo RegionServer.)

Ora è possibile avviare HBase e testare l'installazione. Per avviare HBase, usa lo script come spiegato nella seguente lista.

$ cd $ INSTALL_DIR / hbase-0. 94. 7 / bin $. / Start-HBase. sh bivm: start zookeeper, accesso a / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-zookeeper-bivm. avviare master iniziale, accedere a / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-master-bivm. out localhost: avvio di regionserver, accesso a / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-regionserver-bivm. out

Si noti che la prima riga ha un comando cd (cambia directory) che ti porta a una variabile d'ambiente. È necessario impostare tale variabile nella directory di installazione effettiva per HBase o digitare il percorso completo.

Successivamente utilizzare lo strumento JConsole, fornito in dotazione con Java, per eseguire un controllo rapido su quali processi sono in esecuzione al termine dello script. È possibile avviare lo strumento JConsole digitando il seguente comando: $ JAVA_HOME / bin / jconsole.

JConsole rivela che i tre processi che lo script ha affermato di avviare sono effettivamente in esecuzione, ovvero i processi Zookeeper, Master e RegionServer.

Per mettere HBase a frutto, si interagisce con tutti e tre i processi HBase, iniziando con il MasterServer. Per impostazione predefinita, il server master segnala sullo stato del sistema tramite un'interfaccia utente del browser sul numero di porta 60010. Nell'esempio, è possibile verificare che il MasterServer funzioni correttamente inserendo il seguente URL in un browser Web: // bivm: 60010 /. Farlo fa apparire le informazioni che vedi qui.