Sommario:
Video: USER BEHAVIOR ANALYTICS 2024
Un ge ggplot2 in R dice alla trama come vuoi visualizzare i tuoi dati. Ad esempio, si utilizza geom_bar () per creare un grafico a barre. In ggplot2, puoi utilizzare una varietà di geomi predefiniti per creare tipi di trama standard.
Una geom definisce il layout di un livello ggplot2. Ad esempio, ci sono geomi per creare grafici a barre, grafici a dispersione e diagrammi a linee (oltre a una varietà di altri grafici).
Ogni geom ha una statistica predefinita e ogni statistica ha una geom predefinita. In pratica, devi specificare solo uno di questi.
Geom | Descrizione | Stat predefinito |
---|---|---|
geom_bar () | Grafico a barre | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | Diagramma di linee, collegamento di osservazioni ordinate per
x -valore |
stat_identity () |
geom_boxplot | Trama box-e-whisker | stat_boxplot () |
geom_path | Diagramma a linee, che collega le osservazioni nell'ordine originale | stat_identity () |
geom_smooth | Aggiungi una media condizionata lisciata | stat_smooth () |
geom_histogram | An alias per geom_bar () e stat_bin () | stat_bin () |
Come creare un grafico a barre usando ggplot2 in R
Per creare un grafico a barre si usa la funzione geom_bar (). Tuttavia, si noti che la stat predefinita è stat_bin (), che viene utilizzata per tagliare i dati in contenitori. Pertanto, il comportamento predefinito di geom_bar () è quello di creare un istogramma.
Ad esempio, per creare un istogramma della profondità dei terremoti nel set di dati dei terremoti, fai quanto segue: >> ggplot (terremoti, aes (x = profondità)) + geom_bar ()> ggplot (terremoti, aes (x = profondità)) + geom_bar (binwidth = 50)
Si noti che la mappatura definisce solo la variabile di asse
x (in questo caso, scossa $ profondità). Un argomento utile per geom_bar () è binwidth, che controlla la dimensione dei bin in cui i dati vengono tagliati.
Nel prossimo esempio, si usa aggregate () per calcolare il numero di terremoti a diversi livelli di profondità: >> terremoti. agg nomi (terremoti. agg) <- c ("depth", "mag")
Ora puoi tracciare l'oggetto terremoti. agg con geom_bar (stat = "identità"): >> ggplot (terremoti. agg, aes (x = profondità, y = mag)) + + geom_bar (stat = "identità")
In sintesi, puoi usa geom_bar () per creare un istogramma e lascia che ggplot2 riepiloghi i tuoi dati, oppure puoi pre-riassumere i tuoi dati e poi usare stat = "identità" per tracciare un grafico a barre.
Come creare uno scatterplot in ggplot2
Per creare uno scatterplot, si usa la funzione geom_point ().Un grafico a dispersione crea punti (oa volte bolle o altri simboli) sul grafico. Ogni punto corrisponde a un'osservazione nei tuoi dati.
Probabilmente hai visto o creato questo tipo di grafica un milione di volte, quindi sai già che i grafici a dispersione usano il sistema di coordinate cartesiane, dove una variabile è mappata all'asse
x
e una seconda variabile è mappato all'asse
y . Nello stesso identico modo, in ggplot2 si crea una mappatura tra x -axis e
y variabili -axis. Quindi, per creare una trama dei dati dei terremoti, la mappa fa tremare $ long per x -assi e tremiti $ lat per y -assi: >> ggplot (terremoti, aes (x = long, y = lat)) + geom_point () Come creare grafici a linee ggplot2 Per creare un grafico a linee, utilizzare la funzione geom_line (). Usi questa funzione in modo molto simile a geom_point (), con la differenza che geom_line () disegna una linea tra i punti consecutivi nei tuoi dati. Questo tipo di grafico è utile per i dati delle serie temporali in frame di dati, come i dati della popolazione nel set di dati incorporato longley. Per creare un grafico a linee di cifre di disoccupazione, si utilizza quanto segue: >> ggplot (longley, aes (x = Anno, y = disoccupato)) + geom_line ()