Video: Statistica: la scienza dei dati 2024
Le distribuzioni di probabilità sono una delle molte tecniche statistiche che possono essere utilizzate per analizzare i dati per trovare schemi utili. Si utilizza una distribuzione di probabilità per calcolare le probabilità associate agli elementi di un set di dati:
-
Distribuzione binomiale: Si utilizzerà la distribuzione binomiale per analizzare le variabili che possono assumere solo uno dei due valori. Ad esempio, è possibile determinare la probabilità che una determinata percentuale di membri di una società sportiva sia mancina.
-
Distribuzione di Poisson: Si utilizzerà la distribuzione di Poisson per descrivere la probabilità che un determinato numero di eventi si verifichi in un intervallo di tempo. Ad esempio, potrebbe essere utilizzato per descrivere la probabilità di un determinato numero di visite su un sito Web nell'ora successiva.
-
Distribuzione normale: La distribuzione normale è la distribuzione di probabilità più utilizzata nella maggior parte delle discipline, tra cui economia, finanza, marketing, biologia, psicologia e molti altri. Una delle caratteristiche della distribuzione normale è simmetria - la probabilità che una variabile sia una determinata distanza al di sotto della media della distribuzione equivale alla probabilità che si trovi alla stessa distanza sopra la media.
Per esempio, se l'altezza media di tutti gli uomini negli Stati Uniti è di 70 pollici, e le altezze sono normalmente distribuite, un uomo scelto a caso è ugualmente probabile che sia tra 68 e 70 pollici di altezza mentre deve essere tra 70 e 72 pollici di altezza.
La normale distribuzione funziona bene con molte applicazioni. Ad esempio, è spesso utilizzato nel campo della finanza per descrivere i rendimenti delle attività finanziarie. A causa della sua facilità di interpretazione e implementazione, la distribuzione normale viene talvolta utilizzata anche quando l'assunto di normalità è approssimativamente corretto.
-
La distribuzione t di Student: La distribuzione t di Student è simile alla distribuzione normale, ma con la distribuzione t di Student, è molto più probabile che si verifichino valori estremamente piccoli o estremamente grandi. Questa distribuzione viene spesso utilizzata in situazioni in cui una variabile presenta troppe variazioni per essere coerente con la distribuzione normale. Questo è vero quando vengono analizzate le proprietà di piccoli campioni. Con campioni piccoli, la variazione tra i campioni è probabile che sia abbastanza considerevole, quindi la distribuzione normale non dovrebbe essere utilizzata per descrivere le loro proprietà.
La distribuzione t di Student è stata sviluppata da W.S. Gosset mentre lavorava presso l'azienda produttrice di birra Guinness. Stava tentando di descrivere le proprietà di piccoli mezzi campione.
-
Distribuzione del chi quadrato: La distribuzione del chi quadrato è appropriata per diversi tipi di applicazioni. Ad esempio, puoi usarlo per determinare se una popolazione segue una particolare distribuzione di probabilità. È anche possibile utilizzarlo per verificare se la varianza di una popolazione è uguale a un valore specificato e per verificare l'indipendenza di due set di dati.
-
La distribuzione F: La distribuzione F è derivata dalla distribuzione chi-quadrato. Lo usi per verificare se le varianze di due popolazioni si equivalgono. La distribuzione F è utile anche in applicazioni come l'analisi di regressione.