Sommario:
Video: Riepilogo delle Tecniche di Analisi dei dati 2024
Sebbene l'EDA si basi principalmente su tecniche grafiche, esso comprende anche alcune tecniche quantitative. Questo articolo discute due di questi: stima di intervalli e test di ipotesi.
Stima dell'intervallo
La stima dell'intervallo è una tecnica utilizzata per costruire un intervallo di valori entro i quali è probabile che una variabile cada. Un esempio importante di questo è l'intervallo di confidenza. Un intervallo di confidenza è un intervallo di numeri che probabilmente contiene il valore di una misura della popolazione come la media. Un intervallo di confidenza è costruito come segue:
L'intervallo di confidenza è costituito da un limite inferiore uguale alla stima del punto meno margine di errore e un limite superiore uguale alla stima del punto più margine di errore.
La stima del punto è un singolo valore stimato da un campione. Ad esempio, la media campionaria è una stima puntuale della media della popolazione. Allo stesso modo, la deviazione standard del campione è una stima puntuale della deviazione standard della popolazione.
Il margine di errore riflette la quantità di incertezza associata alla stima puntuale. In altre parole, mostra quanto la stima del punto può cambiare da un campione all'altro. Il margine di errore si basa sulla deviazione standard e sulla dimensione del campione utilizzato. Il risultato di questi calcoli è un intervallo di valori che è probabile che contenga il valore reale della misura della popolazione.
Per esempio, supponiamo che un ricercatore determini che con il 95% di confidenza, l'intervallo (-2. 0 percento, +8. 0 percento) contiene il valore reale del rendimento medio dello S & P 500 successivo anno. La media campionaria è la media del limite inferiore e superiore di questo intervallo (cioè, 0% 0). Il margine di errore è quindi del 5 percento.
Test di ipotesi
Un'ipotesi statistica è un'affermazione che si presume essere vera a meno che non vi siano prove contraddittorie forti. Il test dell'ipotesi è ampiamente usato in molte discipline per determinare se una proposizione è vera o falsa. Ad esempio, il test di ipotesi potrebbe essere utilizzato per determinare se
-
L'età media dei residenti di uno stato è di 43 anni.
-
Il rendimento medio delle azioni in un portafoglio è 7,2 per cento.
-
L'ammontare delle precipitazioni annuali in una città segue la distribuzione normale.
Il test di ipotesi è un processo a più fasi che comprende quanto segue:
-
L'affermazione dell'ipotesi nulla: questa è l'affermazione che si presume vera.
-
La dichiarazione dell'ipotesi alternativa: questa è la dichiarazione che sarà accettata se l'ipotesi nulla viene respinta.
-
Il livello di significatività con cui verrà condotto il test di ipotesi: Questo equivale alla probabilità di rifiutare l'ipotesi nulla quando è falsa.
-
La statistica del test: questa è una misura numerica che mostra se i dati del campione sono coerenti con l'ipotesi nulla.
-
Il valore critico: se la statistica del test è più estrema del valore critico, l'ipotesi nulla viene rifiutata.
-
La decisione: in base alla relazione tra la statistica del test e il valore critico, si decide se l'ipotesi nulla debba essere rifiutata o meno.