Casa Finanza personale I fondamenti dell'integrazione dei Big Data - dummies

I fondamenti dell'integrazione dei Big Data - dummies

Video: Algoritmi e struttura dati 2025

Video: Algoritmi e struttura dati 2025
Anonim

Gli elementi fondamentali della piattaforma di big data gestiscono i dati in modi nuovi rispetto al tradizionale database relazionale. Ciò è dovuto alla necessità di avere la scalabilità e le alte prestazioni richieste per gestire sia i dati strutturati che non strutturati.

I componenti del grande ecosistema di dati che vanno da Hadoop a NoSQL DB, MongoDB, Cassandra e HBase hanno tutti un proprio approccio per l'estrazione e il caricamento dei dati. Di conseguenza, i team potrebbero aver bisogno di sviluppare nuove competenze per gestire il processo di integrazione tra queste piattaforme. Tuttavia, molte delle best practice della gestione dei dati della tua azienda diventeranno ancora più importanti quando entrerai nel mondo dei big data.

Mentre i big data introducono un nuovo livello di complessità di integrazione, i principi fondamentali di base si applicano ancora. Il tuo obiettivo aziendale deve essere focalizzato sulla fornitura di dati affidabili e di qualità all'organizzazione nel momento giusto e nel contesto giusto.

Per garantire questa fiducia, è necessario stabilire regole comuni per la qualità dei dati con particolare attenzione all'accuratezza e alla completezza dei dati. Inoltre, è necessario un approccio completo allo sviluppo di metadati aziendali, tenendo traccia della discendenza e della governance dei dati per supportare l'integrazione dei dati.

Allo stesso tempo, gli strumenti tradizionali per l'integrazione dei dati si stanno evolvendo per gestire la crescente varietà di dati non strutturati e il crescente volume e velocità dei big data. Mentre le forme tradizionali di integrazione assumono nuovi significati in un mondo di big data, le vostre tecnologie di integrazione necessitano di una piattaforma comune che supporti la qualità e la profilazione dei dati.

Per prendere decisioni aziendali corrette basate sull'analisi dei big data, queste informazioni devono essere considerate attendibili e comprese a tutti i livelli dell'organizzazione. Anche se probabilmente non sarà il costo o il tempo effettivo per essere eccessivamente preoccupati per la qualità dei dati nella fase esplorativa di un'analisi di big data, alla fine la qualità e la fiducia devono giocare un ruolo se i risultati devono essere incorporati nel processo aziendale.

Le informazioni devono essere fornite all'azienda in un modo affidabile, controllato, coerente e flessibile all'interno dell'azienda, indipendentemente dai requisiti specifici dei singoli sistemi o applicazioni. Per raggiungere questo obiettivo, si applicano tre principi di base:

  • È necessario creare una comprensione comune delle definizioni dei dati. Nelle fasi iniziali dell'analisi dei Big Data, non è probabile che tu abbia lo stesso livello di controllo sulle definizioni dei dati come con i tuoi dati operativi.Tuttavia, una volta identificati i modelli che sono più rilevanti per la tua azienda, hai bisogno della capacità di mappare gli elementi dei dati a una definizione comune.

  • È necessario sviluppare un set di servizi dati per qualificare i dati e renderli coerenti e in definitiva affidabili. Quando le origini non strutturate e di grandi dimensioni sono integrate con dati operativi strutturati, è necessario essere certi che i risultati saranno significativi.

  • È necessario un modo semplificato per integrare le fonti di dati di grandi dimensioni e i sistemi di registrazione. Per prendere buone decisioni in base ai risultati dell'analisi dei Big Data, è necessario fornire le informazioni al momento giusto e con il contesto giusto. Il tuo processo di integrazione dei big data dovrebbe garantire coerenza e affidabilità.

Per integrare i dati in ambienti applicativi misti, ottenere dati da un ambiente dati (origine) a un altro ambiente dati (obiettivo). Le tecnologie di estrazione, trasformazione e caricamento (ETL) sono state utilizzate per realizzare questo negli ambienti di data warehouse tradizionali. Il ruolo di ETL si sta evolvendo per gestire nuovi ambienti di gestione dei dati come Hadoop.

In un ambiente big data, potrebbe essere necessario combinare strumenti che supportano i processi di integrazione batch (utilizzando ETL) con l'integrazione e la federazione in tempo reale su più origini. Ad esempio, un'azienda farmaceutica potrebbe aver bisogno di miscelare i dati memorizzati nel suo sistema Master Data Management (MDM) con grandi fonti di dati sui risultati medici dell'uso di droghe dei clienti.

Le aziende utilizzano MDM per facilitare la raccolta, l'aggregazione, il consolidamento e la distribuzione di dati coerenti e affidabili in modo controllato all'interno dell'azienda. Inoltre, nuovi strumenti come Sqoop e Scribe sono utilizzati per supportare l'integrazione di ambienti Big Data. Trovi inoltre un'enfasi crescente sull'uso delle tecnologie di estrazione, carico e trasformazione (ELT). Queste tecnologie sono descritte di seguito.

I fondamenti dell'integrazione dei Big Data - dummies

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...