Video: Quantum Computers Explained – Limits of Human Technology 2024
Nell'analisi dei dati per le tue infografiche, dovresti sapere che alcuni punti dati - noti come valori anomali - si trovavano così fuori dalla norma da richiamare l'attenzione su se stessi. Nei casi più gravi, possono persino distorcere i dati e creare un'immagine fuorviante del soggetto. Devi riconoscere quando hai un outlier e poi decidere cosa fare al riguardo.
Questa tabella contiene un semplice esempio per dimostrare questa idea. I due set di dati rappresentano i voti di uno studente, per otto settimane, su due esami settimanali; i numeri sono la percentuale corretta nell'esame. Il set di dati sulla sinistra (il primo esame) non contiene un outlier, ma il set di dati sulla destra (il secondo esame) lo fa. L'outlier è mostrato in grassetto.
Settimana | Gradi (nessun valore esterno) | Gradi (un valore anomalo) |
---|---|---|
1 | 90% | 90% |
2 | 88% | 88% |
3 | 90% | 90% |
4 | 85% | 50% |
5 | 86% | 86% |
6 | 87% | 87% |
7 | 85% | 85% |
8 | 84% | 84% |
media > 87% | 83% |
|
Che cosa fa un giornalista di dati in questo caso? Ecco alcune opzioni:
Elimina l'outlier.
-
Se si sta utilizzando solo la media nel grafico e si teme che sia fuorviante, eliminare l'anomalia come aberrazione e quindi calcolare la media senza quella settimana, come mostrato nella figura.
Se segui questa opzione, assicurati di aggiungere una nota a piè di pagina che spieghi tutto: in questo caso, la cancellazione di un punto dati. Sii sempre il più trasparente possibile.
Mostra i dati così come sono.
-
Sia che tu stia utilizzando solo la media del tuo grafico o tracciando tutti i dati in un grafico, puoi sempre presentare i dati esattamente come ti sono venuti, come mostrato nella figura seguente. In questo caso, dovresti aggiungere una nota che richiama l'outlier in modo che il tuo lettore ne sia pienamente consapevole.
Costruisci una "linea di miglior adattamento. "
-
Questa opzione si applica solo se hai intenzione di creare un grafico che mostri tutti i dati. Una linea di miglior adattamento - detta anche regressione lineare - è una media visiva dei tuoi dati: letteralmente la linea che rappresenta i punti dati sparsi meglio.