Sommario:
- Conoscere la probabilità che si verifichi un evento
- Applicazione della varianza per mostrare la grandezza del cambiamento
- Previsione del futuro
Video: Introduction to the normal distribution | Probability and Statistics | Khan Academy 2024
La parola statistiche può suscitare paura in alcuni principianti alla visualizzazione dei dati, ma se ignori questo argomento, trascuri uno dei i modi più potenti per ottenere una vera intuizione e valore dai Big Data.
Statistiche è la pratica o la scienza della raccolta di dati numerici in grandi quantità. Non devi uscire e diventare uno scienziato dei dati (un termine usato per gli statistici che sono anche geek di dati in incognito e che di solito hanno un qualche tipo di laurea specialistica, come un dottorato di ricerca), ma potresti prendere in considerazione l'idea di raccogliere un libro o una classe di statistica 101 se hai qualche interesse.
Le formule statistiche come probabilità, varianza e previsione sono popolari oggi. Sono abbastanza facili da applicare a qualsiasi set di dati e la maggior parte dei lettori li capirà chiaramente. È possibile incorporare alcune di queste formule statistiche nelle visualizzazioni dei Big Data per fornire un vero valore agli utenti utilizzando le tecniche illustrate nelle sezioni seguenti.
Conoscere la probabilità che si verifichi un evento
Una formula statistica che potrebbe essere familiare è p robability - la probabilità o la possibilità che si verifichi un evento. La seguente formula calcola la probabilità di base per uno scenario lineare. (Gli scenari non lineari sono un po 'complessi e troppo di un'impresa per un principiante.)
Probabilità = Probabilità che si verifichi un evento / Numero di possibili risultati
La seguente figura mostra una probabilità con alcuni colori di avviso aggiunti per rendere messaggio di facile lettura e, cosa più importante, per indicare chiaramente che è necessaria un'azione immediata.
Le probabilità forniscono un rapido controllo della realtà e impostano il tono generale per la storia che la visualizzazione dei dati fornirà durante un dato periodo (giorno, settimana, trimestre e così via).
Applicazione della varianza per mostrare la grandezza del cambiamento
Un'altra misura statistica popolare è v ariance , che è la differenza tra un insieme di punti dati.
La formula più comunemente utilizzata per calcolare la varianza è
Varianza = Finale desiderato - Stato corrente
Se l'output visualizzato è un numero intero o percentuale, la formula mostra l'entità del cambiamento tra lo stato iniziale e finale di un punto dati.
La visualizzazione della varianza è sempre una vittoria rapida e un grande sostituto per il combo linea / grafico a barre, che è il modo in cui la relazione della varianza viene visualizzata nella maggior parte delle visualizzazioni.
Il grafico nella figura seguente mostra una combinazione di linee / grafici a barre che consente all'utente di decifrare la varianza per ogni mese.
Il secondo grafico, mostrato nella figura seguente, traccia chiaramente la varianza e prende tutte le congetture dall'aspetto visivo.
Previsione del futuro
Un'altra formula statistica popolare che potrebbe essere familiare è f orecast , che è l'atto di prevedere o stimare un evento o una tendenza.
Quando si calcola una previsione, si sta effettivamente utilizzando una certa quantità di dati storici per prevedere il comportamento, un evento specifico o una tendenza. Ad esempio, è possibile calcolare le vendite per l'anno in base al fatto storico che gennaio rappresenta generalmente il 5% delle vendite. Se hai effettuato $ 500 in vendite a gennaio, utilizzerai la seguente formula per prevedere quante vendite puoi anticipare per l'anno:
$ 500 /. 05 = $ 10, 000
In questa equazione, $ 500 sono le vendite di gennaio;. 05 è la percentuale storica delle vendite rappresentate da gennaio; e $ 10.000 sono le vendite previste per l'anno.
La figura seguente mostra come le previsioni vengono visualizzate nella maggior parte delle visualizzazioni dei dati come una semplice linea in un grafico. Le previsioni indicano come una determinata attività può essere eseguita in futuro.
Questa visualizzazione tipica di una linea di previsione mostra che il flusso di cassa alla fine diventerà un problema per questa organizzazione.