Casa Finanza personale I fondamenti dell'integrazione dei Big Data - dummies

I fondamenti dell'integrazione dei Big Data - dummies

Video: Algoritmi e struttura dati 2024

Video: Algoritmi e struttura dati 2024
Anonim

Gli elementi fondamentali della piattaforma di big data gestiscono i dati in modi nuovi rispetto al tradizionale database relazionale. Ciò è dovuto alla necessità di avere la scalabilità e le alte prestazioni richieste per gestire sia i dati strutturati che non strutturati.

I componenti del grande ecosistema di dati che vanno da Hadoop a NoSQL DB, MongoDB, Cassandra e HBase hanno tutti un proprio approccio per l'estrazione e il caricamento dei dati. Di conseguenza, i team potrebbero aver bisogno di sviluppare nuove competenze per gestire il processo di integrazione tra queste piattaforme. Tuttavia, molte delle best practice della gestione dei dati della tua azienda diventeranno ancora più importanti quando entrerai nel mondo dei big data.

Mentre i big data introducono un nuovo livello di complessità di integrazione, i principi fondamentali di base si applicano ancora. Il tuo obiettivo aziendale deve essere focalizzato sulla fornitura di dati affidabili e di qualità all'organizzazione nel momento giusto e nel contesto giusto.

Per garantire questa fiducia, è necessario stabilire regole comuni per la qualità dei dati con particolare attenzione all'accuratezza e alla completezza dei dati. Inoltre, è necessario un approccio completo allo sviluppo di metadati aziendali, tenendo traccia della discendenza e della governance dei dati per supportare l'integrazione dei dati.

Allo stesso tempo, gli strumenti tradizionali per l'integrazione dei dati si stanno evolvendo per gestire la crescente varietà di dati non strutturati e il crescente volume e velocità dei big data. Mentre le forme tradizionali di integrazione assumono nuovi significati in un mondo di big data, le vostre tecnologie di integrazione necessitano di una piattaforma comune che supporti la qualità e la profilazione dei dati.

Per prendere decisioni aziendali corrette basate sull'analisi dei big data, queste informazioni devono essere considerate attendibili e comprese a tutti i livelli dell'organizzazione. Anche se probabilmente non sarà il costo o il tempo effettivo per essere eccessivamente preoccupati per la qualità dei dati nella fase esplorativa di un'analisi di big data, alla fine la qualità e la fiducia devono giocare un ruolo se i risultati devono essere incorporati nel processo aziendale.

Le informazioni devono essere fornite all'azienda in un modo affidabile, controllato, coerente e flessibile all'interno dell'azienda, indipendentemente dai requisiti specifici dei singoli sistemi o applicazioni. Per raggiungere questo obiettivo, si applicano tre principi di base:

  • È necessario creare una comprensione comune delle definizioni dei dati. Nelle fasi iniziali dell'analisi dei Big Data, non è probabile che tu abbia lo stesso livello di controllo sulle definizioni dei dati come con i tuoi dati operativi.Tuttavia, una volta identificati i modelli che sono più rilevanti per la tua azienda, hai bisogno della capacità di mappare gli elementi dei dati a una definizione comune.

  • È necessario sviluppare un set di servizi dati per qualificare i dati e renderli coerenti e in definitiva affidabili. Quando le origini non strutturate e di grandi dimensioni sono integrate con dati operativi strutturati, è necessario essere certi che i risultati saranno significativi.

  • È necessario un modo semplificato per integrare le fonti di dati di grandi dimensioni e i sistemi di registrazione. Per prendere buone decisioni in base ai risultati dell'analisi dei Big Data, è necessario fornire le informazioni al momento giusto e con il contesto giusto. Il tuo processo di integrazione dei big data dovrebbe garantire coerenza e affidabilità.

Per integrare i dati in ambienti applicativi misti, ottenere dati da un ambiente dati (origine) a un altro ambiente dati (obiettivo). Le tecnologie di estrazione, trasformazione e caricamento (ETL) sono state utilizzate per realizzare questo negli ambienti di data warehouse tradizionali. Il ruolo di ETL si sta evolvendo per gestire nuovi ambienti di gestione dei dati come Hadoop.

In un ambiente big data, potrebbe essere necessario combinare strumenti che supportano i processi di integrazione batch (utilizzando ETL) con l'integrazione e la federazione in tempo reale su più origini. Ad esempio, un'azienda farmaceutica potrebbe aver bisogno di miscelare i dati memorizzati nel suo sistema Master Data Management (MDM) con grandi fonti di dati sui risultati medici dell'uso di droghe dei clienti.

Le aziende utilizzano MDM per facilitare la raccolta, l'aggregazione, il consolidamento e la distribuzione di dati coerenti e affidabili in modo controllato all'interno dell'azienda. Inoltre, nuovi strumenti come Sqoop e Scribe sono utilizzati per supportare l'integrazione di ambienti Big Data. Trovi inoltre un'enfasi crescente sull'uso delle tecnologie di estrazione, carico e trasformazione (ELT). Queste tecnologie sono descritte di seguito.

I fondamenti dell'integrazione dei Big Data - dummies

Scelta dell'editore

Scattare foto digitali con uno zoom ottico - dummy

Scattare foto digitali con uno zoom ottico - dummy

La fotocamera digitale potrebbe avere uno zoom ottico, che è un Obiettivo zoom attuale vecchio stile (al contrario di uno zoom digitale). Per utilizzare lo zoom ottico della fotocamera digitale per scatti ravvicinati, segui questi passaggi di preparazione delle immagini prima di attivare il pulsante o lo switch di zoom:

La reflex digitale e la sensibilità alla luce - dummy

La reflex digitale e la sensibilità alla luce - dummy

La tua reflex digitale ha un'opzione per determinare la sensibilità del sensore della fotocamera è alla luce. Le fotocamere digitali sono le stesse delle fotocamere a pellicola in quanto la sensibilità alla luce è determinata dalla valutazione ISO. Il vantaggio di una fotocamera digitale è che non è necessario cambiare pellicola per modificare le valutazioni ISO. Quando aumenti ...

Scatti grandangolari con obiettivi standard - manichini

Scatti grandangolari con obiettivi standard - manichini

Fotografia grandangolare con un angolo di campo maggiore rispetto alla lunghezza focale normale o teleobiettivo. A volte si percepiscono le foto come molto espansive. Altre volte, a malapena lo si nota. Dipende tutto dal soggetto e da come si inquadra la scena. Questa figura mostra una scena di terreni agricoli che è stata scattata utilizzando un Sony APS-C ...

Scelta dell'editore

Come usare il meta tag DESCRIPTION - dummies

Come usare il meta tag DESCRIPTION - dummies

I meta tag sono tag HTML speciali che puoi utilizzare per trasportare informazioni, che i browser o altri programmi possono quindi leggere. Quando i motori di ricerca di Internet furono creati per la prima volta, i webmaster includevano i meta tag nelle loro pagine per rendere più facile per i motori di ricerca determinare le pagine. I motori di ricerca hanno utilizzato anche questi meta ...

Come scrivere un grande tag Title Web Marketing - dummies

Come scrivere un grande tag Title Web Marketing - dummies

Scrivere un tag title è fondamentale per il successo del web marketing e coinvolge più che mettere le parole chiave prima. I motori di ricerca mostrano il tag parola chiave nella parte superiore di ciascun elemento nelle pagine dei risultati dei motori di ricerca (SERP). Un tag del titolo ben scritto potrebbe aumentare le probabilità che un cliente in ricerca faccia clic sul tuo annuncio. Se ...

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

Quando le persone effettuano ricerche sul Web utilizzando Yahoo! , ottengono una combinazione di risultati organici e pagati. Se lavori per una società più grande, potresti provare Yahoo! La ricerca inoltra Pro per ottenere un vantaggio rispetto alla concorrenza e puoi persino registrare il tuo sito con Yahoo! Directory. Yahoo! I risultati di ricerca organica ...

Scelta dell'editore

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

ShareMyPlaylists (o SMP, in breve) è stato uno dei primi siti di condivisione di playlist Spotify e continua a innovare e offrire nuove funzionalità ai visitatori. Il mantra del sito è "Long Live the Mixtape", e qui troverai tantissime creazioni accuratamente compilate da migliaia di utenti. Dopo aver creato una playlist Spotify piena di ...

Spotify Unlimited - dummies

Spotify Unlimited - dummies

Spotify Unlimited è un modo brillante per ascoltare tutta la musica che vuoi senza limiti. È come una persona speciale che ti compra da mangiare e da bere tutta la sera per non doverti preoccupare del conto. È come essere in grado di dormire nel weekend senza preoccuparsi del lavoro o se ...

I generi di Spotify - dummies

I generi di Spotify - dummies

Che si tratti di hard rock, techno, pop, jazz, industrial, indie pop, folk , classico, heavy metal, valzer o qualsiasi altra cosa ti piaccia, Spotify ha il genere o il tipo di musica coperto. Puoi cercare i generi comuni da Spotify. Sebbene Spotify abbia pubblicato un elenco di quasi 1, 000 generi noti, non tutti saranno in grado di offrire ...