Video: Common Design Flaws for Data Warehouses 2024
Ogni area della tecnologia cambia continuamente e il data warehousing non fa eccezione. data warehousing è sull'orlo di una nuova generazione di tecnologie, è necessario acquisire familiarità con alcune delle tendenze più significative.
I data warehouse in genere includono solo alcuni tipi diversi di dati: numeri, date e informazioni basate sui caratteri (come nomi, indirizzi, descrizioni dei prodotti e codici). La prossima ondata di data warehousing, in cui i dati non strutturati maturi con contenuti multimediali (immagini, immagini, video, audio e documenti) sono inclusi come parte di un data warehouse, è dettagliato qui.
Avvia il tuo browser Web. Passa qualche ora a curiosare su Internet, controllando tutti i tipi di siti interessanti. Puoi trovare immagini, clip video e audio, moduli di iscrizione per la compilazione di informazioni da inviare al database di un sito se, risultati tabulari in base alle richieste che potresti fare - quasi tutto.
Al giorno d'oggi, un'organizzazione archivia in genere una gran parte dei suoi dati in documenti creati utilizzando strumenti di produttività come Microsoft Excel e Word. Inoltre, i progressi della digitalizzazione in fotografia, scansione dei documenti, produzione video e formati audio hanno ampliato ulteriormente la gamma di formati di dati non strutturati che è possibile utilizzare per i dati aziendali.
Le linee tra i dati strutturati (tipi di dati tradizionali utilizzati da anni da applicazioni informatiche) e dati non strutturati (come i documenti multimediali) si sono offuscati. Non molto tempo fa, se volevi creare un ambiente multimediale che includesse sia i dati strutturati che non strutturati, segui vagamente questi passaggi:
-
Crea un database relazionale per i tuoi dati strutturati.
-
Utilizza un sistema di gestione dei documenti o un sistema di gestione delle immagini per i tuoi dati non strutturati.
-
Per gestire i collegamenti logici tra gli ambienti, mettere da parte in ciascuna riga del database relazionale una o più colonne che puntano a documenti o immagini correlati, a seconda dei casi.
Questi ambienti erano relativamente scomodi e inclini a problemi. Ad esempio, gli aggiornamenti software su un sistema hanno un effetto negativo sull'altro (i collegamenti che si interrompono, ad esempio).
L'emergenza di una nuova generazione di applicazioni aziendali che fonde strutture di dati relazionali tradizionali con contenuti digitali non strutturati è già iniziata. Questa profusione di contenuti digitali significa che le organizzazioni stanno ora cercando di gestire sia dati (strutturati) relazionali che dati non strutturati a livello aziendale.
Ad esempio, si consideri un'applicazione di documentazione medica. Quindici anni fa, l'applicazione avrebbe probabilmente mantenuto un elenco di cartelle cliniche archiviate come semplici righe e colonne.
Oggi e nel prossimo futuro, un'applicazione di registri medici è più probabile che gestisca una serie di record di visite che hanno immagini di riferimento, raggi X, scansioni CAT, prescrizioni e altri documenti di riferimento - e tali record potrebbero anche includere funzionalità di livello superiore come visualizzazione spaziale, reporting e analisi.
Molte aziende saranno (o sono attualmente) desiderose di trasformare questi dati non strutturati in informazioni utili, ma troveranno (o hanno scoperto) che la loro attuale tecnologia di data warehousing e business intelligence non può fornire un'analisi approfondita di questi dati. Le tecnologie e l'infrastruttura di data warehousing e business intelligence tradizionali presentano vincoli tecnologici intrinseci che limitano la loro capacità di indirizzare questi dati.