Video: ALBERTO BAGNAI - CE LO CHIEDE L'EUROPA 2024
Mentre l'informatica si spostava nel mercato commerciale, i dati venivano archiviati in file flat che non imponevano alcuna struttura. Oggi, i big data richiedono strutture dati gestibili. Quando le aziende dovevano raggiungere un livello di comprensione dettagliata dei clienti, dovevano applicare metodi a forza bruta, compresi modelli di programmazione molto dettagliati per creare un certo valore.
Più tardi negli anni '70, le cose cambiarono con l'invenzione del modello di dati relazionali e del sistema di gestione dei database relazionali (RDBMS) che impose la struttura e un metodo per migliorare le prestazioni. Ancora più importante, il modello relazionale ha aggiunto un livello di astrazione in modo che fosse più facile per i programmatori soddisfare le crescenti esigenze aziendali di estrarre valore dai dati.
Il modello relazionale ha offerto un ecosistema di strumenti da un gran numero di società di software emergenti. Ha colmato un crescente bisogno di aiutare le aziende a organizzare meglio i loro dati ed essere in grado di confrontare le transazioni da una geografia all'altra.
Inoltre, ha aiutato i dirigenti aziendali che volevano essere in grado di esaminare informazioni come l'inventario e confrontarlo con le informazioni sugli ordini dei clienti a fini decisionali. Ma da questa esplosione di richieste di risposte emergeva un problema: la memorizzazione di questo crescente volume di dati era costosa e l'accesso era lento. A peggiorare le cose, esistevano molte duplicazioni di dati e l'effettivo valore commerciale di quei dati era difficile da misurare.
Quando il volume di dati che le organizzazioni dovevano gestire crescevano senza controllo, il data warehouse forniva una soluzione. Il data warehouse ha consentito all'organizzazione IT di selezionare un sottoinsieme dei dati memorizzati, in modo che fosse più facile per l'azienda cercare di ottenere informazioni approfondite.
Il data warehouse aveva lo scopo di aiutare le aziende a gestire quantità sempre maggiori di dati strutturati che dovevano essere in grado di analizzare riducendo il volume dei dati a qualcosa di più piccolo e più focalizzato su una particolare area dell'azienda. Riempiva la necessità di separare l'elaborazione del supporto decisionale operativo e il supporto decisionale - per motivi di prestazioni.
I magazzini spesso memorizzano i dati degli anni precedenti per comprendere le prestazioni dell'organizzazione, identificare le tendenze e aiutare a esporre modelli di comportamento. Ha inoltre fornito una fonte integrata di informazioni provenienti da varie fonti di dati che potrebbero essere utilizzate per l'analisi. Oggi, sia i sistemi di gestione dei contenuti che i data warehouse sono in grado di trarre vantaggio dai miglioramenti nella scalabilità dell'hardware, dalle tecnologie di virtualizzazione e dalla capacità di creare sistemi hardware e software integrati.
A volte questi stessi data warehouse erano troppo complessi e grandi e non offrivano la velocità e l'agilità richieste dall'azienda. La risposta è stata un ulteriore perfezionamento dei dati gestiti tramite data mart. Questi data mart sono stati incentrati su specifici problemi di business e hanno supportato l'esigenza aziendale di query veloci. Il magazzino si è evoluto per supportare tecnologie emergenti come sistemi integrati e dispositivi dati.
I data warehouse e i data mart risolvono molti problemi per le aziende che necessitano di un modo coerente per gestire enormi dati transazionali. Ma quando si trattava di gestire enormi volumi di dati non strutturati o semi-strutturati, il magazzino non era in grado di evolvere abbastanza per soddisfare le mutevoli esigenze.
Per complicare le cose, i data warehouse vengono in genere alimentati a intervalli di lotti, di solito settimanali o giornalieri. Ciò va bene per la pianificazione, la rendicontazione finanziaria e le tradizionali campagne di marketing, ma è troppo lento per ambienti aziendali e di consumo sempre più in tempo reale.
In che modo le aziende sarebbero in grado di trasformare i loro tradizionali approcci di gestione dei dati per gestire il volume in espansione di elementi di dati non strutturati? La soluzione non è emersa da un giorno all'altro. Quando le aziende hanno iniziato a memorizzare dati non strutturati, i fornitori hanno iniziato ad aggiungere funzionalità come BLOB (oggetti binari di grandi dimensioni).
In sostanza, un elemento di dati non strutturati verrebbe archiviato in un database relazionale come una porzione contigua di dati. Questo oggetto potrebbe essere etichettato ma non è stato possibile vedere cosa c'era dentro quell'oggetto. Chiaramente, questo non avrebbe risolto le mutevoli esigenze del cliente o del business.
Inserire il sistema di gestione del database degli oggetti (ODBMS). Il database degli oggetti memorizzava il BLOB come un insieme indirizzabile di pezzi in modo da poter vedere cosa c'era dentro. A differenza del BLOB, che era un'unità indipendente aggiunta a un database relazionale tradizionale, il database degli oggetti forniva un approccio unificato per gestire i dati non strutturati.
I database di oggetti includono un linguaggio di programmazione e una struttura per gli elementi di dati in modo che sia più facile manipolare vari oggetti di dati senza programmazione e join complessi. I database degli oggetti hanno introdotto un nuovo livello di innovazione che ha contribuito a condurre alla seconda ondata di gestione dei dati.