Casa Finanza personale Estrazione, spostamento e caricamento dei dati per Data Warehouse Deluxe - dummies

Estrazione, spostamento e caricamento dei dati per Data Warehouse Deluxe - dummies

Video: Come aggiornare le mappe del tuo navigatore Garmin [TUTORIAL] 2025

Video: Come aggiornare le mappe del tuo navigatore Garmin [TUTORIAL] 2025
Anonim

Le implementazioni deluxe del data warehouse sono grandi e crescono sempre di più. Le implementazioni che utilizzano centinaia di gigabyte (un gigabyte equivale a 1 miliardo di byte) e persino i terabyte (1 trilione di byte) sono sempre più comuni. Per gestire questo volume di dati e l'accesso degli utenti, è necessario un server e un database molto robusti.

Preparati per la sfida! Con un data warehouse di tipo lite, puoi gestire in genere i movimenti di dati da sorgente a magazzino in modo semplice e low-tech - ma con il data warehouse deluxe, stai entrando nella zona di difficoltà, dove molti progetti di data warehouse soddisfano i loro Waterloo.

È probabile che tu abbia difficoltà in questo dominio per diversi motivi:

  • Hai a che fare con molte diverse origini dati, alcune delle quali potrebbero contenere dati sovrapposti. Ad esempio, le informazioni dei fornitori potrebbero provenire da due diversi sistemi di acquisto e alcuni dei vostri fornitori hanno voci in entrambi i sistemi.

    Probabilmente incontrerai diversi insiemi di identificatori da convergere (per esempio, sei caratteri alfanumerici identificati come SUPPLIER_ID in uno dei sistemi e un intero unico conosciuto come SUP_NUM nell'altro).

  • Se il tuo data warehouse è di grandi dimensioni (misura oltre 250 gigabyte), è probabile che tu abbia difficoltà nell'estrarre, spostare e caricare le finestre batch. Batch windows , i tempi in cui gli aggiornamenti vengono apportati al magazzino, sono complicati dal numero di origini dati che devono essere gestite.

  • Le probabilità di avere un processo di estrazione, movimento, trasformazione e caricamento incasinato sono esponenzialmente legate al numero di elementi di dati da caricare nel data warehouse.

    Se potessi assegnare qualche fattore di difficoltà (un intero, ad esempio) al processo di acquisizione dei dati nel magazzino, le seguenti misure sarebbero vere: hai n dati elementi che si desidera includere nel data warehouse con un fattore di difficoltà di x. Se ora hai 2 n elementi di dati, il tuo fattore di difficoltà non è 2 x; al contrario, è x al quadrato.

    Per semplificare la comprensione di questo fattore di difficoltà, assegnare alcuni numeri a n e x. Supponi che il tuo data warehouse abbia 100 elementi (n) e che il fattore di difficoltà (x) sia 5. Se raddoppi il numero di elementi ( n > = 200), il tuo fattore di difficoltà è 25 (5 al quadrato), non 10 (5 x 2). Il processo di gestione di così tante fonti di dati, tutte dirette verso un unico luogo (il tuo data warehouse deluxe), ha tutti gli elementi di troppi cuochi in cucina, o qualsiasi cosa lo dica.

  • Per rendere fluidi i processi di estrazione, movimento, trasformazione e caricamento, probabilmente dovrai gestire molti proprietari di applicazioni diversi, i custodi ufficiali del database e altre persone appartenenti a una varietà di organizzazioni diverse, che devono tutti collaborare come se facessero parte di un'orchestra sinfonica professionale.

    La realtà, tuttavia, è che si comportano più come un gruppo di studenti della scuola materna che scelgono ciascuno uno strumento musicale dal cestino del giocattolo e gli viene detto, "Ora gioca qualcosa! "Sebbene il processo non sia necessariamente destinato a fallire, ci si aspetta un numero di iterazioni finché non si riesce a caricare correttamente il data warehouse deluxe.

    Un data warehouse deluxe può avere tre livelli (come un data warehouse lite), tranne che con più fonti di dati e forse più di un tipo di strumento utente che accede al magazzino. Ma l'architettura di un data warehouse deluxe probabilmente assomiglia più a ciò che viene mostrato in questa figura, con molti punti di raccolta diversi per i dati.

Oltre alle altre "stazioni di passaggio" necessarie per il tuo particolare ambiente, il tuo ambiente potrebbe avere questi elementi:

Data mart:

  • Riceve sottoinsiemi di informazioni dal data warehouse deluxe e funge da punto di accesso principale per utenti. Stazione di trasformazione temporanea:

  • Area in cui i set di dati estratti da alcune fonti vengono sottoposti a un tipo di processo di trasformazione prima di spostarsi lungo la pipeline verso il database del magazzino. Stazione di garanzia della qualità:

  • Un'area in cui i gruppi di dati vengono sottoposti a controlli intensivi di controllo qualità prima di consentire loro di spostarsi nel data warehouse.

Estrazione, spostamento e caricamento dei dati per Data Warehouse Deluxe - dummies

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...