Sommario:
- Nozioni di base
- C'è un limite al numero di dimensioni?
- Come dovresti scegliere i livelli in una gerarchia?
- Strutture di database fisiche in un MDDB
Video: Dan Blewett Speaking - Difficulty of Athletes Transitioning into the Real World 2024
I database multidimensionali (MDDB) eliminano le convenzioni dei loro antenati relazionali e organizzano i dati in un modo che è altamente favorevole all'analisi multidimensionale. Per comprendere i database multidimensionali, quindi, è necessario innanzitutto comprendere le basi delle funzioni analitiche eseguite con i dati memorizzati in esse.
L'analisi multidimensionale si basa su pochi semplici concetti di organizzazione dei dati, in particolare fatti e dimensioni:
-
Fatti: A infatti è un'istanza di qualche evento o evento particolare e le proprietà dell'evento tutte memorizzate in un database. Hai venduto un orologio a un cliente lo scorso venerdì pomeriggio? Questo è un fatto. Ieri il tuo negozio ha ricevuto una spedizione di 76 anelli di classe da un particolare fornitore? Questo è un altro fatto.
-
Dimensioni: Una dimensione è un descrittore di chiave, un indice, tramite il quale è possibile accedere ai fatti in base al valore (o ai valori) che si desidera. Ad esempio, è possibile organizzare i dati di vendita in base a queste dimensioni: tempo, cliente e prodotto.
Nozioni di base
In questi semplici esempi, è possibile organizzare e visualizzare i dati di vendita come una matrice tridimensionale, indicizzata in base all'ora, al cliente e alle dimensioni del prodotto:
-
In ottobre 2008 (la dimensione temporale), il cliente A (la dimensione del cliente) ha acquistato gli anelli di classe (la dimensione del prodotto) - 79 di questi per $ 8, 833.
-
Nel 2007 (la dimensione temporale), il cliente A (la dimensione del cliente) ha acquistato molti prodotti diversi (la dimensione del prodotto) - un totale di 3, 333 unità per $ 55, 905 (i fatti).
Notate il sottile differente tra il modo in cui le dimensioni sono usate in questi due esempi. Nella prima, la dimensione temporale si riferisce a un mese; la dimensione del cliente si riferisce a un cliente specifico; e la dimensione del prodotto è per un prodotto specifico.
Nel secondo esempio, tuttavia, il tempo è per un anno, non un mese; il cliente è sempre lo stesso (un singolo cliente); e il prodotto è per l'intera linea di prodotti.
L'analisi multidimensionale supporta la nozione di gerarchie nelle dimensioni. Ad esempio, è possibile organizzare il tempo in una gerarchia dell'anno → trimestre → mese. È possibile visualizzare i fatti (o il consolidamento dei fatti) nel database in uno qualsiasi di questi livelli: per anno, trimestre o mese.
Allo stesso modo, è possibile organizzare i prodotti in una gerarchia di famiglie di prodotti → tipo di prodotto → prodotti specifici. Gli anelli di classe potrebbero essere un tipo di prodotto; "Class ring, modern style, onyx stone" potrebbe essere un prodotto specifico.Inoltre, gli anelli di classe, gli orologi, gli altri anelli e altri oggetti sarebbero tutti arrotolati nella famiglia dei prodotti di gioielleria.
C'è un limite al numero di dimensioni?
In teoria, è possibile avere il numero di dimensioni nel modello multidimensionale necessario. La domanda esiste sempre, tuttavia, se il tuo prodotto di database multidimensionale può supportarli. Ma ecco una domanda più importante: anche se un prodotto consente un certo numero di dimensioni (15, ad esempio), ha senso creare un modello di quella dimensione?
Dovresti lavorare a stretto contatto con i tuoi utenti per determinare se il numero di dimensioni rende la tua soluzione troppo complessa - e quindi limitare la popolazione degli utenti - o migliora la facilità d'uso - e quindi espandendo la popolazione di utenti.
È possibile, ad esempio, aggiungere la geografia all'elenco di dimensioni che contiene tempo, cliente e prodotto in modo che sia possibile visualizzare e organizzare i fatti in base ai territori di vendita, agli stati, alle città e a negozi specifici.
Come dovresti scegliere i livelli in una gerarchia?
I livelli in una gerarchia consentono di eseguire la funzionalità drill-down . Inoltre, disponendo di più livelli all'interno di una gerarchia, è possibile ottenere rapidamente le risposte alle domande a causa delle informazioni che sono state impostate a ciascuno dei livelli specificati, in modo che le informazioni stiano semplicemente aspettando le vostre domande.
Perché i database multidimensionali hanno strutture abbastanza rigide costruite attorno al pre - calcolo dei fatti (creazione e memorizzazione di aggregati nel database, piuttosto che eseguire aggregazioni e calcoli in relazione al tempo), Maggiore è il numero di dimensioni e maggiore è il numero di livelli di ciascuna dimensione, maggiori saranno le esigenze di spazio di archiviazione e tempi di compilazione o di caricamento.
Strutture di database fisiche in un MDDB
Sebbene quasi tutti i prodotti MDDB siano costruiti attorno al concetto di fatti, dimensioni e gerarchie, nessuno ha ideato una definizione standard di MDDB. Nel mondo relazionale, anche la non standardizzazione è stata un po 'un problema, in particolare in relazione alle funzionalità a valore aggiunto, come i vincoli e le stored procedure.
La struttura relazionale di base della tabella-riga-colonna, tuttavia, è stata abbastanza facile da esportare o scaricare in un file flat di un certo tipo e quindi ricaricarla in un altro prodotto RDBMS.
Nel mondo MDDB, i venditori hanno adottato una varietà di approcci diversi per le rappresentazioni fisiche dei loro rispettivi prodotti. Stanno tutti cercando modi per superare i problemi di archiviazione e complessità causati da un numero elevato di dimensioni (ad esempio, più di 15) e livelli profondi di gerarchie (ad esempio, 20 livelli di profondità).
Quando stai valutando i prodotti, non preoccuparti delle tecniche di archiviazione fisica: assicurati che le rappresentazioni logiche fornite con i prodotti (come gerarchie, livelli e fatti) possano soddisfare le tue esigenze aziendali. Elimina i prodotti che sembrano clunky o che hanno, per esempio, un modello di gerarchia che non sembra del tutto corretto per i tuoi dati.
Poi, dopo aver trovato prodotti che sembrano adattarsi alla tua attività, calcola un po 'le gomme (per così dire) per vedere come funzionano all'interno.