Sommario:
Video: Isilon CRU: Replace a battery Isilon Infinity 2024
I nodi periferici sono l'interfaccia tra il cluster Hadoop e la rete esterna. Per questo motivo, a volte vengono definiti nodi gateway . Più comunemente, i nodi periferici vengono utilizzati per eseguire applicazioni client e strumenti di amministrazione del cluster.
Sono spesso utilizzati anche come aree di sosta per i dati trasferiti nel cluster Hadoop. In questo modo, Oozie, Pig, Sqoop e gli strumenti di gestione come Hue e Ambari funzionano bene lì. La figura mostra i processi che è possibile eseguire sui nodi Edge.
I nodi Edge sono spesso trascurati nelle discussioni sull'architettura hardware Hadoop. Questa situazione è sfortunata perché i nodi periferici hanno uno scopo importante in un cluster Hadoop e hanno requisiti hardware diversi dai nodi master e dai nodi slave.
In generale, è una buona idea minimizzare le distribuzioni di strumenti di amministrazione su nodi master e nodi slave per garantire che i servizi Hadoop critici come il NameNode abbiano la minore concorrenza possibile per le risorse.
Evitare di collocare un'utilità di trasferimento dati come Sqoop su qualsiasi cosa tranne un nodo edge, poiché i volumi elevati di trasferimento dei dati potrebbero mettere in pericolo la capacità dei servizi Hadoop sullo stesso nodo di comunicare. I messaggi di scambio di servizi Hadoop sono la loro linfa vitale, quindi una latenza elevata significa che l'intero nodo potrebbe essere tagliato fuori dal cluster.
La figura mostra due nodi del bordo, ma per molti cluster Hadoop sarebbe sufficiente un singolo nodo di bordo. I nodi di bordo aggiuntivi sono più comunemente necessari quando il volume di dati trasferiti dentro o fuori dal cluster è eccessivo per un singolo server da gestire.
Memoria consigliata
Per i nodi periferici in un cluster Hadoop, utilizzare l'archiviazione di classe enterprise. Per i nodi periferici incentrati sugli strumenti di amministrazione e le applicazioni client in esecuzione, utilizzare quattro unità SAS da 900 GB, insieme a un controller RAID HDD configurato per RAID 1 + 0.
I nodi periferici orientati all'ingestione dei dati richiedono ovviamente molto più spazio di archiviazione, quindi è possibile aggiungere unità al nodo periferico. In questo caso, utilizzare le unità LFF SAS poiché sono disponibili capacità molto più elevate rispetto alle unità SAS di dimensioni ridotte.
Processori consigliati
Un nodo edge per uso generico sarebbe ben servito da una configurazione del processore simile a quella utilizzata per i nodi slave, in particolare un server dual-socket con processori Ivy Bridge con clock compreso tra 2 e 2. 5GHz.
Memoria consigliata
Per la maggior parte dei carichi di lavoro sui nodi periferici, sono sufficienti 48 GB di RAM.
Rete raccomandata
Per abilitare la comunicazione tra la rete esterna e il cluster Hadoop, i nodi periferici devono essere multi-homed nella sottorete privata del cluster Hadoop e nella rete aziendale.
Un computer multi-homed è uno che ha connessioni dedicate a più reti. Questa è una dimostrazione pratica del motivo per cui i nodi del bordo sono perfettamente adatti per l'interazione con il mondo esterno al cluster Hadoop. Mantenere il proprio cluster Hadoop nella propria sottorete privata è una pratica eccellente, quindi questi nodi periferici fungono da finestra controllata all'interno del cluster.
Per i nodi periferici che servono allo scopo di eseguire applicazioni client o strumenti di amministrazione, sono consigliate due coppie di connessioni di rete 1GbE legate: una coppia per connettersi al cluster Hadoop e un'altra coppia per la rete esterna.
I nodi periferici orientati alla gestione di elevate velocità di trasferimento dati in entrata e in uscita avranno bisogno di due (o più) coppie di connettori di rete 10GbE collegati: una coppia per connettersi al cluster Hadoop e un'altra coppia per la rete esterna o specifiche fonti di importazione dati.