Sommario:
- I quantili più utilizzati sono in realtà i quantili 0 percento e 100 percento. Potresti semplicemente chiamarli il minimo e il massimo, perché è quello che sono. È possibile ottenere entrambe le funzioni min () e max () insieme usando la funzione range (). Questa funzione ti fornisce comodamente l'intervallo di dati. Quindi, per sapere quali sono i due valori di tutti i chilometraggi, fai semplicemente quanto segue:
- quartile
- Tutte queste funzioni hanno un argomento na. rm che ti permette di rimuovere tutti i valori di NA prima di calcolare la rispettiva statistica. Se non lo fai, qualsiasi vettore contenente NA avrà NA come risultato. Questo funziona identicamente al na. argomento rm della funzione sum ().
Video: 07 Serie storiche: numeri indice 2024
Un singolo numero non ti dice molto sui tuoi dati. Spesso è altrettanto importante conoscere la diffusione dei tuoi dati. Puoi usare R per esaminare questo spread usando diversi approcci diversi.
Innanzitutto, è possibile calcolare la varianza o la deviazione standard per riepilogare lo spread in un singolo numero. Per questo, hai le comode funzioni var () per la varianza e sd () per la deviazione standard. Ad esempio, si calcola la deviazione standard della variabile mpg nelle macchine frame dati come questa:
Accanto alla media e alla variazione, puoi anche dare un'occhiata ai quantili. Un
quantile, o percentile, ti dice quanti dei tuoi dati si trovano al di sotto di un certo valore. Il quantile del 50 percento, per esempio, non è altro che la mediana. Di nuovo, R ha alcune funzioni utili per aiutarti a guardare i quantili. Come calcolare l'intervallo di dati in R
I quantili più utilizzati sono in realtà i quantili 0 percento e 100 percento. Potresti semplicemente chiamarli il minimo e il massimo, perché è quello che sono. È possibile ottenere entrambe le funzioni min () e max () insieme usando la funzione range (). Questa funzione ti fornisce comodamente l'intervallo di dati. Quindi, per sapere quali sono i due valori di tutti i chilometraggi, fai semplicemente quanto segue:
L'intervallo offre ancora solo informazioni limitate. Spesso gli statistici riportano il primo e il terzo
quartile
accanto all'intervallo e la mediana. Questi quartili sono, rispettivamente, i quantili del 25 percento e del 75 percento, che sono i numeri per i quali un quarto e tre quarti dei dati sono più piccoli. Ottieni questi numeri usando la funzione quantile (), come questa:
La funzione quantile () può darti qualunque quantile tu desideri. Per questo, si usa l'argomento probs. Tu dai i probs (o le probabilità) come un numero frazionario. Per il quantile del 20 percento, ad esempio, si usa 0. 20 come argomento per il valore.Questo argomento prende anche un vettore come valore, quindi puoi, per esempio, ottenere il quantile del 5% e del 95% come questo: >> quantile (auto $ mpg, probs = c (0, 05, 0. 95)) 5% 95% 11. 995 31. 300
Il valore predefinito per l'argomento probs è un vettore che rappresenta il minimo (0), il primo quartile (0. 25), la mediana (0. 5), il terzo quartile (0. 75) e il massimo (1).