Sommario:
- Significativo non sempre significa importante
- La regressione non è sempre lineare
- Estrapolare oltre un dispersione di campioni è una cattiva idea
- Esaminare la variabilità attorno a una linea di regressione
- Un campione può essere troppo grande
- Consumatori: conosci i tuoi assi
- La rappresentazione grafica di una variabile categoriale come se fosse una variabile quantitativa è semplicemente sbagliata
- Quando appropriato, includi la variabilità nel tuo grafico
- Fai attenzione quando parli di concetti di libri di testo sulle statistiche in Excel
Video: Excel 2016 - Tutorial 8: GRAFICI ( classici e sparkline ) Linee di tendenza e di proiezione 2024
Il mondo delle statistiche è pieno di insidie, ma è anche pieno di opportunità. Se sei un utente di statistiche o qualcuno che deve interpretarli, è possibile cadere nelle insidie. È anche possibile girarle intorno. Ecco dieci suggerimenti e trappole dalle aree di verifica delle ipotesi, regressione, correlazione e grafico.
Significativo non sempre significa importante
Il significato è, per molti versi, un termine scarsamente scelto. Quando un test statistico produce un risultato significativo e la decisione è di rifiutare H 0 , ciò non garantisce che lo studio dietro i dati sia importante. Le statistiche possono solo aiutare a prendere decisioni su numeri e inferenze sui processi che le hanno prodotte. Non possono rendere questi processi importanti o sconvolgenti. L'importanza è qualcosa che devi giudicare da solo - e nessun test statistico può farlo per te.
La regressione non è sempre lineare
Quando si tenta di adattare un modello di regressione a un grafico a dispersione, la tentazione è di usare immediatamente una linea. Questo è il modello di regressione meglio compreso e quando ci si impara, pendii e intercettazioni non sono poi così scoraggianti.
Ma la regressione lineare non è l'unico tipo di regressione. È possibile adattare una curva attraverso uno scatterplot. Non fatevi ingannare: i concetti statistici alla base della regressione curvilinea sono più difficili da comprendere rispetto ai concetti alla base della regressione lineare.
Tuttavia, vale la pena dedicare del tempo a padroneggiare questi concetti. A volte, una curva è molto più adatta di una linea.
Estrapolare oltre un dispersione di campioni è una cattiva idea
Sia che si lavori con regressione lineare o regressione curvilinea, tenere presente che è inappropriato generalizzare oltre i confini del grafico a dispersione.
Supponiamo di aver stabilito una solida relazione predittiva tra un test di attitudine matematica e prestazioni nei corsi di matematica, e il tuo grafico a dispersione copre solo una ristretta gamma di attitudini matematiche. Non hai modo di sapere se la relazione regge oltre questo intervallo. I pronostici al di fuori di tale intervallo non sono validi.
La soluzione migliore è espandere il diagramma di dispersione testando più persone. Potresti scoprire che la relazione originale racconta solo una parte della storia.
Esaminare la variabilità attorno a una linea di regressione
Un'attenta analisi dei residui (le differenze tra i valori osservati e quelli previsti) può dirvi molto su quanto bene la linea si adatta ai dati. Un presupposto fondamentale è che la variabilità attorno a una linea di regressione è la stessa su e giù per la linea.Se non lo è, il modello potrebbe non essere così predittivo come pensi. Se la variabilità è sistematica (maggiore variabilità a un'estremità rispetto all'altra), la regressione curvilinea potrebbe essere più appropriata della lineare. L'errore standard di stima non sarà sempre l'indicatore.
Un campione può essere troppo grande
Che ci crediate o no, questo a volte accade con coefficienti di correlazione. Un campione molto grande può rendere statisticamente significativo un piccolo coefficiente di correlazione.
Ma cosa significa davvero quel coefficiente di correlazione? Il coefficiente di determinazione -r 2 - è giusto. 038, il che significa che la SS Regressione è inferiore al 4 percento della SS Totale . Questa è un'associazione molto piccola.
Bottom line: quando si osserva un coefficiente di correlazione, si noti la dimensione del campione. Se è abbastanza grande, può rendere statisticamente significativa un'associazione banale. (Hmmm … significato - eccolo di nuovo!)
Consumatori: conosci i tuoi assi
Quando guardi un grafico, assicurati di sapere cosa c'è su ciascun asse. Assicurati di aver compreso le unità di misura. Capisci la variabile indipendente? Capisci la variabile dipendente? Puoi descrivere ognuno con le tue parole? Se la risposta a una di queste domande è "No", non capisci il grafico che stai guardando.
Quando guardi un grafico in un annuncio TV, fai molta attenzione se scompare troppo velocemente, prima di poter vedere cosa c'è sugli assi. L'inserzionista potrebbe provare a creare una falsa impressione persistente su una relazione fittizia all'interno del grafico. La relazione grafica potrebbe essere valida come quella dell'altro prodotto pubblicitario televisivo - prova scientifica tramite cartoni animati: minuscole spazzole di pulizia animate che puliscono i denti dei cartoni animati potrebbero non garantire necessariamente denti più bianchi per te se acquisti il prodotto.
La rappresentazione grafica di una variabile categoriale come se fosse una variabile quantitativa è semplicemente sbagliata
Quindi sei quasi pronto per competere nelle World Series di Rock-Paper-Scissors. In preparazione per questo torneo internazionale, hai raccontato tutte le tue partite degli ultimi dieci anni, elencando la percentuale di volte che hai vinto quando hai giocato ogni ruolo.
Per riassumere tutti i risultati, utilizzare le funzionalità grafiche di Excel per creare un grafico.
Così tante persone creano questo tipo di grafici - persone che dovrebbero conoscere meglio. La linea nel grafico implica continuità da un punto a un altro. Con questi dati, ovviamente, è impossibile. Cosa c'è tra il rock e la carta? Perché sono unità uguali a parte? Perché le tre categorie sono in questo ordine?
In parole povere, un grafico a linee non è il grafico corretto quando almeno una delle variabili è un insieme di categorie. Invece, crea un grafico a colonne. Un grafico a torta funziona anche qui, perché i dati sono percentuali e hai solo poche fette.
Quando appropriato, includi la variabilità nel tuo grafico
Quando i punti nel tuo grafico rappresentano i mezzi, assicurati che il grafico includa l'errore standard di ciascuna media.Ciò dà allo spettatore un'idea della variabilità dei dati - che è un aspetto importante dei dati.
I mezzi da soli non ti dicono sempre tutta la storia. Cogli tutte le opportunità per esaminare le varianze e le deviazioni standard. Potresti trovare alcune pepite nascoste. Variazione sistematica - alti valori di varianza associati a mezzi grandi, per esempio - potrebbe essere un indizio su una relazione che non vedevi prima.
Fai attenzione quando parli di concetti di libri di testo sulle statistiche in Excel
Se sei seriamente intenzionato a fare lavori statistici, probabilmente avrai l'occasione di esaminare un testo di statistiche o due. Ricordare che i simboli in alcune aree della statistica non sono standard.
Connettere concetti di libri di testo alle funzioni statistiche di Excel può essere una sfida a causa dei testi e di Excel. I messaggi nelle finestre di dialogo e nei file della Guida potrebbero contenere simboli diversi da quelli letti, oppure potrebbero utilizzare gli stessi simboli ma in modo diverso. Questa discrepanza potrebbe comportare l'inserimento errato di un parametro in una finestra di dialogo, causando un errore difficile da rintracciare.