Casa Finanza personale Importazione di dati con Sqoop - dummies

Importazione di dati con Sqoop - dummies

Video: Sqoop Import and Export data from RDMBS and HDFS 2025

Video: Sqoop Import and Export data from RDMBS and HDFS 2025
Anonim

Pronto per immergerti nell'importazione di dati con Sqoop? Inizia dando un'occhiata alla figura, che illustra i passaggi in una tipica operazione di importazione Sqoop da un RDBMS o un sistema di data warehouse. Niente di troppo complicato qui: solo una tipica tabella di dati dei prodotti di un'impresa fittizia (tipica) importata in un tipico cluster Apache Hadoop da un tipico sistema di gestione dei dati (DMS).

Durante il passaggio 1, Sqoop utilizza il connettore appropriato per recuperare i metadati della tabella Prodotti dal DMS di destinazione. (I metadati vengono utilizzati per associare i tipi di dati dalla tabella Prodotti ai tipi di dati nel linguaggio Java.)

Il passaggio 2 utilizza quindi questi metadati per generare e compilare una classe Java che verrà utilizzata da una o più attività della mappa per importa le righe effettive dalla tabella Prodotti. Sqoop salva la classe Java generata nello spazio temporaneo o in una directory specificata in modo da poterla sfruttare per l'elaborazione successiva dei record di dati.

Il codice Java generato da Sqoop che viene salvato per te è come il regalo che continua a dare! Con questo codice, Sqoop importa i record dal DMS e li archivia su HDFS utilizzando uno dei tre formati che è possibile selezionare: dati Avro binari, file di sequenza binaria o file di testo delimitati. Successivamente, questo codice è disponibile per la successiva elaborazione dei dati.

I file di sequenza sono una scelta naturale se stai importando tipi di dati binari e avrai bisogno della classe Java generata per serializzare e deserializzare i tuoi dati in un secondo momento, magari per l'elaborazione o l'esportazione di MapReduce. I dati Avro, basati sul framework di serializzazione di Apache, sono utili se è necessario interagire con altre applicazioni dopo l'importazione in HDFS.

Se si sceglie di memorizzare i dati importati in formato di testo delimitato, è possibile trovare il codice Java generato più prezioso successivamente mentre si analizzano e si eseguono le conversioni del formato dati sui nuovi dati. Vedrai che il codice generato ti aiuta anche a unire i set di dati dopo le operazioni di importazione di Sqoop e il codice Java generato può aiutare a evitare l'ambiguità durante l'elaborazione dei dati di testo delimitati.

Infine, durante il Passaggio 3, Sqoop divide i record di dati nella tabella Prodotti in una serie di attività della mappa (con il numero di mappatori facoltativamente specificati dall'utente) e importa i dati della tabella in HDFS, Hive o HBase.

Importazione di dati con Sqoop - dummies

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...