Casa Finanza personale In esecuzione Applicazioni prima di Hadoop 2 - dummies

In esecuzione Applicazioni prima di Hadoop 2 - dummies

Video: How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox 2025

Video: How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox 2025
Anonim

Poiché molte distribuzioni Hadoop esistenti non stanno ancora utilizzando ancora un altro negoziatore di risorse (YARN), date un'occhiata a come Hadoop gestiva la sua elaborazione dei dati prima dei giorni di Hadoop 2. Concentrarsi sul ruolo svolto dai demoni master JobTracker e dai daemon slave TaskTracker nella gestione dell'elaborazione MapReduce.

L'intero punto di utilizzo dei sistemi distribuiti è di essere in grado di distribuire le risorse di elaborazione in una rete di computer autonomi in un modo tollerante ai guasti, facile e poco costoso.

In un sistema distribuito come Hadoop, in cui si dispone di un cluster di nodi di elaborazione autonomi che funzionano tutti in parallelo, una grande quantità di complessità va a garantire che tutti i pezzi lavorino insieme. In quanto tali, questi sistemi in genere hanno livelli distinti per gestire attività diverse per supportare l'elaborazione parallela dei dati.

Questo concetto, noto come separazione delle preoccupazioni, assicura che se si è, ad esempio, il programmatore dell'applicazione, non è necessario preoccuparsi dei dettagli specifici per, ad esempio, il failover di mappare le attività. In Hadoop, il sistema consiste di questi quattro livelli distinti, come mostrato:

  • Archiviazione distribuita: Il file system distribuito Hadoop (HDFS) è il livello di archiviazione in cui sono archiviati i dati, i risultati intermedi e i set di risultati finali.

  • Gestione risorse: Oltre allo spazio su disco, tutti i nodi slave nel cluster Hadoop hanno cicli CPU, RAM e larghezza di banda della rete. Un sistema come Hadoop deve essere in grado di suddividere queste risorse in modo che più applicazioni e utenti possano condividere il cluster in modi prevedibili e sintonizzabili. Questo lavoro viene eseguito dal daemon JobTracker.

  • Framework di elaborazione: Il flusso del processo MapReduce definisce l'esecuzione di tutte le applicazioni in Hadoop 1. Ciò inizia con la fase della mappa; continua con l'aggregazione con shuffle, sort, o merge; e termina con la fase di riduzione. In Hadoop 1, anche questo viene gestito dal daemon JobTracker, con l'esecuzione locale gestita dai daemon TaskTracker in esecuzione sui nodi slave.

  • API (Application Programming Interface): Le applicazioni sviluppate per Hadoop 1 dovevano essere codificate utilizzando l'API MapReduce. In Hadoop 1, i progetti Hive e Pig forniscono ai programmatori interfacce più semplici per scrivere applicazioni Hadoop e, sotto il cofano, il loro codice viene compilato in MapReduce.

Nel mondo di Hadoop 1 (che era l'unico mondo che avevi fino a poco tempo fa), tutta l'elaborazione dei dati ruotava attorno a MapReduce.

In esecuzione Applicazioni prima di Hadoop 2 - dummies

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...