Sommario:
Video: Retta in Geometria Analitica : Equazione e Rappresentazione 2025
Si usa toccly () per creare riepiloghi tabulari di dati in R. Con tapply (), è possibile creare facilmente riepiloghi di sottogruppi nei dati. Questa funzione accetta tre argomenti:
-
X : Un vettore
-
INDICE : Un fattore o un elenco di fattori
-
FUN : Una funzione < Ad esempio, calcola la lunghezza media sepale nell'iride del set di dati: >> tapply (iris $ Sepal. Lunghezza, iris $ Specie, media) setosa versicolor virginica 5. 006 5. 936 6. 588
Con questo una breve riga di codice, fai cose potenti. Dì a R di prendere il Sepal. Lunghezza colonna, dividerla in base a Specie, quindi calcolare la media per ciascun gruppo.
Questo è un idioma importante per scrivere codice in R, e di solito si chiama Split, Apply e Combine (SAC). In questo caso, dividi un vettore in gruppi, applica una funzione a ciascun gruppo e quindi combina il risultato in un vettore.
Ovviamente, usando la funzione with (), puoi scrivere la tua linea di codice in un modo leggermente più leggibile: >> con (iris, tapply (Sepal. Length, Species, mean)) setosa versicolor virginica 5. 006 5. 936 6. 588Utilizzando tapply (), è anche possibile creare tabelle più complesse per riepilogare i dati. Lo fai usando un elenco come argomento INDICE.
Come usare tapply () per creare tabelle con dimensioni più elevate
Ad esempio, prova a riepilogare il frame dei dati mtcars, un frame di dati incorporato con dati sui motori delle auto e le prestazioni. Come con qualsiasi oggetto, puoi usare str () per ispezionare la sua struttura: >> str (mtcars)
La variabile am è un vettore numerico che indica se il motore ha un automatico (0) o manuale (1) riduttore. Perché questo non è molto descrittivo, inizia creando un nuovo oggetto, le auto, che è una copia di mtcars, e cambia la colonna am per essere un fattore:
>> auto <- entro (mtcars, + am <- factor (am, levels = 0: 1, labels = c ("Automatic", "Manual")) +)
Ora usa tapply () per trovare le miglia medie per gallone (mpg) per ogni tipo di cambio: >> con (auto, tapply (mpg, am, mean)) Manuale automatico 17. 14737 24. 39231
Sì, hai ragione. Questa è ancora solo una tabella unidimensionale. Ora prova a creare un tavolo bidimensionale con il tipo di cambio (am) e il numero di marce (marcia): >> con (auto, tapply (mpg, lista (marcia, am), media)) Manuale automatico 3 16. 10667 NA 4 21. 05000 26. 275 5 NA 21. 380
Si usa toccly () per creare riepiloghi tabulari di dati. Questo è un po 'simile alla funzione table (). Tuttavia, table () può creare solo tabelle di contingenza (cioè tabelle di conteggi), mentre con tapply () è possibile specificare qualsiasi funzione come funzione di aggregazione.In altre parole, con tapply (), puoi calcolare conteggi, medie o qualsiasi altro valore.
Se si desidera riepilogare le statistiche su un singolo vettore, tapply () è molto utile e veloce da usare.Come usare aggregato ()
Un'altra funzione R che fa qualcosa di molto simile è aggregato (): >> con (auto, aggregato (mpg, lista (marcia = marcia, am = am), media)) gear am x 1 3 Automatic 16. 10667 2 4 Automatic 21. 05000 3 4 Manuale 26. 27500 4 5 Manuale 21. 38000
Quindi, si aggrega () a nuovi livelli usando l'interfaccia della formula.