Casa Finanza personale Gestione dei file con i comandi del file system Hadoop - dummies

Gestione dei file con i comandi del file system Hadoop - dummies

Video: PSmanFS: il gestore di file system per Lubuntu Linux 2024

Video: PSmanFS: il gestore di file system per Lubuntu Linux 2024
Anonim

HDFS è uno dei due componenti principali del framework Hadoop; l'altro è il paradigma computazionale noto come MapReduce. Un file system distribuito è un file system che gestisce lo storage attraverso un cluster di macchine in rete.

HDFS memorizza i dati in blocchi , unità la cui dimensione predefinita è 64 MB. I file che si desidera archiviare in HDFS devono essere suddivisi in blocchi a dimensione di blocco che vengono quindi archiviati in modo indipendente all'interno del cluster. È possibile utilizzare il comando fsck line per elencare i blocchi che compongono ciascun file in HDFS, come segue:

% hadoop fsck / -files -blocks

Poiché Hadoop è scritto in Java, tutte le interazioni con HDFS sono gestite tramite l'API Java. Tieni presente, tuttavia, che non è necessario essere un guru Java per lavorare con i file in HDFS. Diverse interfacce Hadoop basate su API Java sono ora di uso comune (e nascondono Java), ma la più semplice è l'interfaccia a riga di comando; utilizzare la riga di comando per interagire con HDFS negli esempi forniti.

Si accede alla shell del file system Hadoop eseguendo una forma del comando hadoop. Tutti i comandi hadoop sono invocati dallo script bin / hadoop. (Per recuperare una descrizione di tutti i comandi hadoop, eseguire lo script hadoop senza specificare alcun argomento.) Il comando hadoop ha la sintassi

hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]

The - l'opzione config confdir sovrascrive la directory di configurazione predefinita ($ HADOOP_HOME / conf), quindi puoi facilmente personalizzare la configurazione dell'ambiente Hadoop. Le opzioni generiche e le opzioni di comando sono un insieme comune di opzioni supportate da diversi comandi.

I comandi shell del file system Hadoop (per le interfacce della riga di comando) assumono come identificativi gli identificatori di risorse (URI) uniformi. Un URI è una stringa di caratteri che viene utilizzata per identificare un nome o una risorsa Web.

La stringa può includere un nome di schema - un qualificatore per la natura dell'origine dati. Per HDFS, il nome dello schema è hdf e, per il file system locale, il nome dello schema è file. Se non si specifica un nome schema, il valore predefinito è il nome dello schema specificato nel file di configurazione. Un file o una directory in HDFS può essere specificato in un modo completo, come in questo esempio:

hdfs: // namenodehost / parent / child

Oppure può essere semplicemente / parent / child se il file di configurazione punta in hdf: // namenodehost.

I comandi shell del file system Hadoop, che sono simili ai comandi file Linux, hanno la seguente sintassi generale:

hadoop hdfs dfs - file_cmd

I lettori con qualche precedente esperienza Hadoop potrebbero chiedere, "Ma che cosa riguardo il comando hadoop fs?"Il comando fs è deprecato nella serie di rilascio Hadoop 0. 2, ma funziona ancora in Hadoop 2. Usa invece i file dfs di hdfs.

Come ci si potrebbe aspettare, si usa il comando mkdir per creare una directory in HDFS, proprio come si farebbe su Linux o su sistemi operativi basati su Unix. Sebbene HDFS abbia una directory di lavoro predefinita, / user / $ USER, dove $ USER è il tuo nome utente di accesso, devi crearlo tu stesso usando la sintassi

$ hadoop hdfs dfs -mkdir / user / login_user_name

Ad esempio, per creare una directory chiamata "joanna", esegui questo comando mkdir:

$ hadoop hdfs dfs -mkdir / user / joanna

Usa il comando Hadoop put per copiare un file da il file system locale su HDFS:

$ hadoop hdfs dfs -put file_name / user / login_user_name

Ad esempio, per copiare un file denominato data. txt in questa nuova directory, eseguire il seguente comando put:

$ hadoop hdfs dfs -put data. txt / user / joanna

Esegui il comando ls per ottenere un file HDFS che elenca:

$ hadoop hdfs dfs -ls. Trovati 2 articoli drwxr-xr-x - joanna supergroup 0 2013-06-30 12: 25 / utente / joanna -rw-r - r-- 1 joanna supergroup 118 2013-06-30 12: 15 / user / joanna / dati. txt

Il file che elenca se stesso si scompone come descritto in questo elenco:

  • La colonna 1 mostra la modalità file ("d" per la directory e "-" per il file normale, seguita dalle autorizzazioni). I tre tipi di permessi - read (r), write (w) ed execute (x) - sono gli stessi che si trovano sui sistemi basati su Linux e Unix. L'autorizzazione di esecuzione per un file viene ignorata perché non è possibile eseguire un file su HDFS. Le autorizzazioni sono raggruppate per proprietario, gruppo e pubblico (tutti gli altri).

  • La colonna 2 mostra il fattore di replicazione per i file. (Il concetto di replica non si applica alle directory). I blocchi che compongono un file in HDFS vengono replicati per garantire la tolleranza agli errori. Il fattore di replicazione , o il numero di repliche conservate per un file specifico, è configurabile. È possibile specificare il fattore di replicazione quando il file viene creato o successivo, tramite l'applicazione.

  • Le colonne 3 e 4 mostrano il file proprietario e gruppo . Supergroup è il nome del gruppo di superutenti e un superuser è l'utente con la stessa identità del processo NameNode. Se avvii il NameNode, per il momento sei il superuser. Questo è un gruppo speciale: gli utenti regolari avranno i propri useridi appartenenti a un gruppo senza caratteristiche speciali, un gruppo definito semplicemente da un amministratore di Hadoop.

  • La colonna 5 mostra la dimensione del file, in byte, o 0 se è una directory.

  • Le colonne 6 e 7 mostrano rispettivamente la data e l'ora dell'ultima modifica.

  • La colonna 8 mostra il nome non qualificato (che indica che il nome dello schema non è specificato) del file o della directory.

Usa il comando Hadoop get per copiare un file da HDFS sul tuo file system locale:

$ hadoop hdfs dfs -get file_name / user / login_user_name

Usa Hadoop rm comando per cancellare un file o una directory vuota:

$ hadoop hdfs dfs -rm file_name / user / login_user_name

Usa il comando hadoop hdfs dfs -help per ottenere assistenza dettagliata per ogni opzione.

Gestione dei file con i comandi del file system Hadoop - dummies

Scelta dell'editore

Scattare foto digitali con uno zoom ottico - dummy

Scattare foto digitali con uno zoom ottico - dummy

La fotocamera digitale potrebbe avere uno zoom ottico, che è un Obiettivo zoom attuale vecchio stile (al contrario di uno zoom digitale). Per utilizzare lo zoom ottico della fotocamera digitale per scatti ravvicinati, segui questi passaggi di preparazione delle immagini prima di attivare il pulsante o lo switch di zoom:

La reflex digitale e la sensibilità alla luce - dummy

La reflex digitale e la sensibilità alla luce - dummy

La tua reflex digitale ha un'opzione per determinare la sensibilità del sensore della fotocamera è alla luce. Le fotocamere digitali sono le stesse delle fotocamere a pellicola in quanto la sensibilità alla luce è determinata dalla valutazione ISO. Il vantaggio di una fotocamera digitale è che non è necessario cambiare pellicola per modificare le valutazioni ISO. Quando aumenti ...

Scatti grandangolari con obiettivi standard - manichini

Scatti grandangolari con obiettivi standard - manichini

Fotografia grandangolare con un angolo di campo maggiore rispetto alla lunghezza focale normale o teleobiettivo. A volte si percepiscono le foto come molto espansive. Altre volte, a malapena lo si nota. Dipende tutto dal soggetto e da come si inquadra la scena. Questa figura mostra una scena di terreni agricoli che è stata scattata utilizzando un Sony APS-C ...

Scelta dell'editore

Come usare il meta tag DESCRIPTION - dummies

Come usare il meta tag DESCRIPTION - dummies

I meta tag sono tag HTML speciali che puoi utilizzare per trasportare informazioni, che i browser o altri programmi possono quindi leggere. Quando i motori di ricerca di Internet furono creati per la prima volta, i webmaster includevano i meta tag nelle loro pagine per rendere più facile per i motori di ricerca determinare le pagine. I motori di ricerca hanno utilizzato anche questi meta ...

Come scrivere un grande tag Title Web Marketing - dummies

Come scrivere un grande tag Title Web Marketing - dummies

Scrivere un tag title è fondamentale per il successo del web marketing e coinvolge più che mettere le parole chiave prima. I motori di ricerca mostrano il tag parola chiave nella parte superiore di ciascun elemento nelle pagine dei risultati dei motori di ricerca (SERP). Un tag del titolo ben scritto potrebbe aumentare le probabilità che un cliente in ricerca faccia clic sul tuo annuncio. Se ...

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

Quando le persone effettuano ricerche sul Web utilizzando Yahoo! , ottengono una combinazione di risultati organici e pagati. Se lavori per una società più grande, potresti provare Yahoo! La ricerca inoltra Pro per ottenere un vantaggio rispetto alla concorrenza e puoi persino registrare il tuo sito con Yahoo! Directory. Yahoo! I risultati di ricerca organica ...

Scelta dell'editore

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

ShareMyPlaylists (o SMP, in breve) è stato uno dei primi siti di condivisione di playlist Spotify e continua a innovare e offrire nuove funzionalità ai visitatori. Il mantra del sito è "Long Live the Mixtape", e qui troverai tantissime creazioni accuratamente compilate da migliaia di utenti. Dopo aver creato una playlist Spotify piena di ...

Spotify Unlimited - dummies

Spotify Unlimited - dummies

Spotify Unlimited è un modo brillante per ascoltare tutta la musica che vuoi senza limiti. È come una persona speciale che ti compra da mangiare e da bere tutta la sera per non doverti preoccupare del conto. È come essere in grado di dormire nel weekend senza preoccuparsi del lavoro o se ...

I generi di Spotify - dummies

I generi di Spotify - dummies

Che si tratti di hard rock, techno, pop, jazz, industrial, indie pop, folk , classico, heavy metal, valzer o qualsiasi altra cosa ti piaccia, Spotify ha il genere o il tipo di musica coperto. Puoi cercare i generi comuni da Spotify. Sebbene Spotify abbia pubblicato un elenco di quasi 1, 000 generi noti, non tutti saranno in grado di offrire ...