Video: Очень ЭКОНОМИЧНЫЙ электродвигатель с карбоновым винтом 2024
I data warehouse sono ora sotto stress, cercando di far fronte aumento delle richieste sulle risorse limitate. Hadoop può fornire sollievo significativo in questa situazione di data warehouse.
Il rapido aumento della quantità di dati generati nel mondo ha influenzato anche i data warehouse perché i volumi di dati che gestiscono sono in aumento - in parte perché più strutturati dati, il tipo di dati che è fortemente tipizzato e inserito in righe e colonne - viene generato ma anche perché spesso devi gestire i requisiti normativi progettati per mantenere l'accesso interrogabile ai dati storici.
Inoltre, la potenza di elaborazione nei data warehouse viene spesso utilizzata per eseguire le trasformazioni dei dati relazionali quando entra nel magazzino stesso o viene caricata in un <700> data mart (un sottoinsieme separato del data warehouse) per un'applicazione di analisi specifica.
Inoltre, aumenta la necessità per gli analisti di emettere nuove query sui dati strutturati archiviati nei magazzini e queste query ad hoc possono spesso utilizzare risorse di elaborazione dei dati significative. A volte una relazione occasionale può essere sufficiente, e talvolta è necessaria un'analisi esplorativa per trovare domande che non sono state ancora poste e che potrebbero produrre un significativo valore aziendale.
La linea di fondo è che i data warehouse vengono spesso utilizzati per scopi che vanno oltre il loro design originale.
La figura mostra, utilizzando un'architettura di alto livello, come Hadoop può vivere insieme ai data warehouse e soddisfare alcuni degli scopi per cui non sono progettati.
Hadoop è un helper del magazzino , non è una sostituzione di magazzino. Hadoop può modernizzare un ecosistema di data warehousing in quattro modi; eccoli in sintesi:
-
Fornire una zona di atterraggio per tutti i dati.
-
Persistere i dati per fornire un archivio interrogabile di dati a freddo.
-
Sfrutta le efficienze di elaborazione batch su vasta scala di Hadoop per elaborare e trasformare i dati per il magazzino.
-
Abilita un ambiente per il rilevamento dei dati ad hoc.