Video: RedES™, a risk measure in a Pareto-Lévy Stable framework with clustering 2024
Per aiutarti a capire l'analisi statistica con Excel, aiuta a simulare il teorema del limite centrale. Quasi non suona bene. In che modo una popolazione non distribuita normalmente risulta in una distribuzione campionata normalmente distribuita?
Per darti un'idea di come funziona il Teorema del limite centrale, c'è una simulazione. Questa simulazione crea qualcosa come una distribuzione campionaria della media per un campione molto piccolo, basato su una popolazione che non è normalmente distribuita. Come vedrai, anche se la popolazione non è una distribuzione normale, e anche se il campione è piccolo, la distribuzione campionaria della media sembra abbastanza simile a una distribuzione normale.
Immagina un'enorme popolazione composta da soli tre punteggi - 1, 2 e 3 - e ognuno di essi ha la stessa probabilità di apparire in un campione. Immagina anche di poter selezionare casualmente un campione di tre punteggi da questa popolazione.
campione | media | campione | media | campione | Media |
1, 1, 1 | 1. 00 | 2, 1, 1 | 1. 33 | 3, 1, 1 | 1. 67 |
1, 1, 2 | 1. 33 | 2, 1, 2 | 1. 67 | 3, 1, 2 | 2. 00 |
1, 1, 3 | 1. 67 | 2, 1, 3 | 2. 00 | 3, 1, 3 | 2. 33 |
1, 2, 1 | 1. 33 | 2, 2, 1 | 1. 67 | 3, 2, 1 | 2. 00 |
1, 2, 2 | 1. 67 | 2, 2, 2 | 2. 00 | 3, 2, 2 | 2. 33 |
1, 2, 3 | 2. 00 | 2, 2, 3 | 2. 33 | 3, 2, 3 | 2. 67 |
1, 3, 1 | 1. 67 | 2, 3, 1 | 2. 00 | 3, 3, 1 | 2. 33 |
1, 3, 2 | 2. 00 | 2, 3, 2 | 2. 33 | 3, 3, 2 | 2. 67 |
1, 3, 3 | 2. 33 | 2, 3, 3 | 2. 67 | 3, 3, 3 | 3. 00 |
Se guardi da vicino il tavolo, puoi quasi vedere cosa sta per succedere nella simulazione. La media campionaria che appare più frequentemente è 2. 00. Il campione significa che appaiono meno frequentemente sono 1. 00 e 3. 00. Hmmm …
Nella simulazione, un punteggio è stato selezionato in modo casuale dalla popolazione e quindi selezionato in modo casuale due Di Più. Quel gruppo di tre punteggi è un campione. Quindi calcoli la media di quel campione. Questo processo è stato ripetuto per un totale di 60 campioni, risultando in 60 campioni. Infine, si traccia la distribuzione della media campionaria.
Che aspetto ha la distribuzione campionata simulata della media? L'immagine sotto mostra un foglio di lavoro che risponde a questa domanda.
Nel foglio di lavoro, ogni riga è un esempio.Le colonne etichettate x1, x2 e x3 mostrano i tre punteggi per ciascun campione. La colonna E mostra la media per il campione in ogni riga. La colonna G mostra tutti i valori possibili per la media campionaria e la colonna H mostra quanto spesso ogni media appare nei 60 campioni. Le colonne G e H e il grafico mostrano che la distribuzione ha la sua frequenza massima quando la media campionaria è 2. 00. Le frequenze si allontanano quando i mezzi campione si allontanano sempre di più da 2. 00.
Il punto di tutto questo è che la popolazione non assomiglia a una distribuzione normale e la dimensione del campione è molto piccola. Anche in presenza di questi vincoli, la distribuzione campionaria della media basata su 60 campioni inizia ad assomigliare molto ad una distribuzione normale.
E i parametri che il teorema del limite centrale predice per la distribuzione del campionamento? Inizia con la popolazione. La media della popolazione è 2. 00 e la deviazione standard della popolazione è. 67. (Questo tipo di popolazione richiede una matematica un po 'elaborata per capire i parametri.)
Attiva la distribuzione di campionamento. La media dei 60 mezzi è 1.98, e la loro deviazione standard (una stima dell'errore standard della media) è. 48. Questi numeri approssimano strettamente i parametri previsti dal teorema del limite centrale per la distribuzione campionaria della media, 2. 00 (uguale alla media della popolazione) e. 47 (la deviazione standard, 67, divisa per la radice quadrata di 3, la dimensione del campione).
Nel caso tu sia interessato a fare questa simulazione, ecco i passaggi:
- Seleziona una cella per il tuo primo numero selezionato a caso.
Seleziona la cella B2.
- Usa la funzione del foglio di lavoro
RANDBETWEEN
per selezionare 1, 2 o 3.Questo simula il disegno di un numero da una popolazione composta dai numeri 1, 2 e 3 in cui hai una probabilità uguale di selezionare ciascun numero. È possibile selezionare
FORMULAS | Math & Trig | RANDBETWEEN
e utilizzare la finestra di dialogo Argomenti funzione o digitare= RANDBETWEEN (1, 3)
in B2 e premere Invio. Il primo argomento è il numero più piccolo RANDBETWEEN restituisce, e il secondo argomento è il numero più grande. - Seleziona la cella a destra della cella originale e scegli un altro numero casuale compreso tra 1 e 3. Ripeti questa operazione per un terzo numero casuale nella cella a destra della seconda.
Il modo più semplice per farlo è compilare automaticamente le due celle a destra della cella originale. In questo foglio di lavoro, quelle due celle sono C2 e D2.
- Considera queste tre celle come un campione e calcola la loro media nella cella a destra della terza cella.
Il modo più semplice per farlo è digitare
= MEDIA (B2: D2)
nella cella E2 e premere Invio. - Ripetere questa procedura per tutti i campioni che si desidera includere nella simulazione. Ogni riga corrisponde ad un campione.
60 campioni sono stati usati qui. Il modo semplice e veloce per farlo è selezionare la prima riga di tre numeri selezionati a caso e la loro media, quindi compilare automaticamente le righe rimanenti. L'insieme di medie campionarie nella colonna E è la distribuzione campionata simulata della media.Utilizzare
MEDIO
e
STDEV. P
per trovare la sua media e deviazione standard.
Per vedere come si presenta questa distribuzione di campionamento simulata, utilizzare la funzione di matrice
FREQUENZA
sui mezzi di campionamento nella colonna E. Seguire questi passi:
- Immettere i possibili valori della media campionaria in una matrice.
Puoi usare la colonna G per questo. Puoi esprimere i possibili valori della media campionaria in forma frazionaria (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 e 9/3) come quelli inseriti nelle celle Da G2 a G8. Excel li converte in forma decimale. Assicurati che quelle celle siano in formato numerico.
- Seleziona una matrice per le frequenze dei possibili valori della media campionaria.
È possibile utilizzare la colonna H per mantenere le frequenze, selezionando le celle da H2 a H8.
- Dal menu Funzioni statistiche, selezionare
FREQUENZA
per aprire la finestra di dialogo Argomenti funzione perFREQUENZA
- Nella finestra di dialogo Argomenti funzione, immettere i valori appropriati per gli argomenti.
Nella casella Array di dati, inserisci le celle che contengono i mezzi di campionamento. In questo esempio, è E2: E61.
- Identifica la matrice che contiene i possibili valori della media campionaria.
FREQUENZA
mantiene questa matrice nella casella Bins_array. Per questo foglio di lavoro, G2: G8 entra nella casella Bins_array. Dopo aver identificato entrambi gli array, la finestra di dialogo Argomenti funzione mostra le frequenze all'interno di un paio di parentesi graffe. - Premere Ctrl + Maiusc + Invio per chiudere la finestra di dialogo Argomenti della funzione e mostrare le frequenze.
Utilizzare questa combinazione di tasti perché
FREQUENZA
è una funzione di matrice. - Infine, con H2: H8 evidenziato, selezionare
Inserisci | Grafici consigliati
e scegliere il layout a colonne in cluster per produrre il grafico delle frequenze. Il tuo grafico sarà probabilmente un po 'diverso dal mio, perché probabilmente finirai con un numero casuale diverso.
A proposito, Excel ripete il processo di selezione casuale ogni volta che fai qualcosa che fa ricalcolare Excel il foglio di lavoro. L'effetto è che i numeri possono cambiare mentre si lavora su questo. (Ovvero, si esegue nuovamente la simulazione.) Ad esempio, se si torna indietro e si riempie automaticamente una delle righe, i numeri cambiano e il grafico cambia.