Casa Finanza personale Il paradigma di programmazione MapReduce - dummies

Il paradigma di programmazione MapReduce - dummies

Video: Il paradigma di programmazione di Pregel con Spark GraphX by Andrea Iacono 2024

Video: Il paradigma di programmazione di Pregel con Spark GraphX by Andrea Iacono 2024
Anonim

MapReduce è un paradigma di programmazione progettato per consentire l'elaborazione distribuita parallela di grandi serie di dati, convertendoli in gruppi di tuple e quindi combinando e riducendo quelle tuple in gruppi più piccoli di tuple. In parole povere, MapReduce è stato progettato per raccogliere grandi quantità di dati e utilizzare il calcolo distribuito parallelo per trasformare i big data in dati di dimensioni piccole o regolari.

L'elaborazione distribuita parallela si riferisce a una potente struttura in cui i volumi massivi di dati vengono elaborati molto rapidamente distribuendo le attività di elaborazione tra i cluster di server di merci. Per quanto riguarda MapReduce, tuple si riferiscono a coppie chiave-valore in base alle quali i dati vengono raggruppati, ordinati ed elaborati.

I lavori MapReduce funzionano tramite la mappa e riducono le sequenze operative del processo in un gruppo distribuito di server. Nell'attività mappa , si delegano i dati alle coppie valore-chiave, si trasforma e si filtra. Quindi si assegnano i dati ai nodi per l'elaborazione.

Nel ridurre l'attività , si aggregano i dati in serie di dati di dimensioni più ridotte. I dati della fase di riduzione vengono trasformati in un formato di valore chiave standard - dove il tasto funge da identificativo del record e il valore è il valore che viene identificato dalla chiave. I nodi di calcolo dei cluster elaborano la mappa e riducono le attività definite dall'utente. Questo lavoro viene eseguito in base ai seguenti due passaggi:

  1. Mappa i dati.

    I dati in entrata devono prima essere delegati in coppie chiave-valore e divisi in frammenti, che vengono quindi assegnati alle attività della mappa. A ciascun cluster di elaborazione, un gruppo di nodi connessi tra loro ed eseguiti un'attività di elaborazione condivisa, viene assegnato un numero di attività della mappa, che vengono successivamente distribuite tra i relativi nodi.

    All'elaborazione delle coppie chiave-valore, vengono generate coppie chiave-valore intermedie. Le coppie chiave-valore intermedie sono ordinate in base ai loro valori chiave e questa lista è divisa in una nuova serie di frammenti. Qualunque sia il numero di punti per questi nuovi frammenti, sarà lo stesso del conteggio delle attività di riduzione.

  2. Riduci i dati.

    Ad ogni task di riduzione è assegnato un frammento. L'attività di riduzione elabora semplicemente il frammento e produce un output, che è anche una coppia chiave-valore. Ridurre le attività sono anche distribuite tra i diversi nodi del cluster. Una volta completata l'attività, l'output finale viene scritto su un file system.

In breve, puoi ridurre in modo rapido ed efficiente e iniziare a dare un senso a un volume enorme, velocità e varietà di dati utilizzando la mappa e ridurre le attività per taggare i dati per coppie (chiave, valore) e quindi ridurre quelle coppie in insiemi di dati più piccoli attraverso operazioni di aggregazione - operazioni che combinano più valori da un set di dati in un singolo valore.Un diagramma dell'architettura MapReduce può essere trovato qui.

Se i tuoi dati non si prestano ad essere taggati ed elaborati tramite chiavi, valori e aggregazioni, quindi mappare e ridurre generalmente non è adatto alle tue esigenze.

Se si utilizza MapReduce come parte di una soluzione Hadoop, l'output finale viene scritto sul Hadoop Distributed File System (HDFS). HDFS è un file system che include cluster di server di merci che vengono utilizzati per archiviare i big data. HDFS rende finanziariamente fattibile la gestione e lo storage di grandi quantità distribuendo le attività di storage tra i cluster di server economici a basso costo.

Il paradigma di programmazione MapReduce - dummies

Scelta dell'editore

Scattare foto digitali con uno zoom ottico - dummy

Scattare foto digitali con uno zoom ottico - dummy

La fotocamera digitale potrebbe avere uno zoom ottico, che è un Obiettivo zoom attuale vecchio stile (al contrario di uno zoom digitale). Per utilizzare lo zoom ottico della fotocamera digitale per scatti ravvicinati, segui questi passaggi di preparazione delle immagini prima di attivare il pulsante o lo switch di zoom:

La reflex digitale e la sensibilità alla luce - dummy

La reflex digitale e la sensibilità alla luce - dummy

La tua reflex digitale ha un'opzione per determinare la sensibilità del sensore della fotocamera è alla luce. Le fotocamere digitali sono le stesse delle fotocamere a pellicola in quanto la sensibilità alla luce è determinata dalla valutazione ISO. Il vantaggio di una fotocamera digitale è che non è necessario cambiare pellicola per modificare le valutazioni ISO. Quando aumenti ...

Scatti grandangolari con obiettivi standard - manichini

Scatti grandangolari con obiettivi standard - manichini

Fotografia grandangolare con un angolo di campo maggiore rispetto alla lunghezza focale normale o teleobiettivo. A volte si percepiscono le foto come molto espansive. Altre volte, a malapena lo si nota. Dipende tutto dal soggetto e da come si inquadra la scena. Questa figura mostra una scena di terreni agricoli che è stata scattata utilizzando un Sony APS-C ...

Scelta dell'editore

Come usare il meta tag DESCRIPTION - dummies

Come usare il meta tag DESCRIPTION - dummies

I meta tag sono tag HTML speciali che puoi utilizzare per trasportare informazioni, che i browser o altri programmi possono quindi leggere. Quando i motori di ricerca di Internet furono creati per la prima volta, i webmaster includevano i meta tag nelle loro pagine per rendere più facile per i motori di ricerca determinare le pagine. I motori di ricerca hanno utilizzato anche questi meta ...

Come scrivere un grande tag Title Web Marketing - dummies

Come scrivere un grande tag Title Web Marketing - dummies

Scrivere un tag title è fondamentale per il successo del web marketing e coinvolge più che mettere le parole chiave prima. I motori di ricerca mostrano il tag parola chiave nella parte superiore di ciascun elemento nelle pagine dei risultati dei motori di ricerca (SERP). Un tag del titolo ben scritto potrebbe aumentare le probabilità che un cliente in ricerca faccia clic sul tuo annuncio. Se ...

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

Quando le persone effettuano ricerche sul Web utilizzando Yahoo! , ottengono una combinazione di risultati organici e pagati. Se lavori per una società più grande, potresti provare Yahoo! La ricerca inoltra Pro per ottenere un vantaggio rispetto alla concorrenza e puoi persino registrare il tuo sito con Yahoo! Directory. Yahoo! I risultati di ricerca organica ...

Scelta dell'editore

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

ShareMyPlaylists (o SMP, in breve) è stato uno dei primi siti di condivisione di playlist Spotify e continua a innovare e offrire nuove funzionalità ai visitatori. Il mantra del sito è "Long Live the Mixtape", e qui troverai tantissime creazioni accuratamente compilate da migliaia di utenti. Dopo aver creato una playlist Spotify piena di ...

Spotify Unlimited - dummies

Spotify Unlimited - dummies

Spotify Unlimited è un modo brillante per ascoltare tutta la musica che vuoi senza limiti. È come una persona speciale che ti compra da mangiare e da bere tutta la sera per non doverti preoccupare del conto. È come essere in grado di dormire nel weekend senza preoccuparsi del lavoro o se ...

I generi di Spotify - dummies

I generi di Spotify - dummies

Che si tratti di hard rock, techno, pop, jazz, industrial, indie pop, folk , classico, heavy metal, valzer o qualsiasi altra cosa ti piaccia, Spotify ha il genere o il tipo di musica coperto. Puoi cercare i generi comuni da Spotify. Sebbene Spotify abbia pubblicato un elenco di quasi 1, 000 generi noti, non tutti saranno in grado di offrire ...