Video: The secrets of learning a new language | Lýdia Machová 2025
Quando si lavora con il testo in R, potrebbe essere necessario trovare parole o motivi all'interno del testo. Immagina di avere una lista degli stati negli Stati Uniti e vuoi scoprire quali nomi di stato consistono in due parole.
Per trovare sottostringhe, è possibile utilizzare la funzione grep (), che utilizza due argomenti essenziali:
-
schema : Il modello che si desidera trovare.
-
x : Il vettore di caratteri che si desidera cercare.
Quindi, come trovi i nomi di tutti gli stati con più di una parola? Questo è facile quando ti rendi conto che puoi inquadrare la domanda trovando tutti quegli stati che contengono uno spazio: >> stato. nome [grep ("", stato. nome)] [1] "New Hampshire" "New Jersey" [3] "Nuovo Messico" "New York" [5] "North Carolina" "Dakota del Nord" [7] "Rhode Island "" South Carolina "[9]" South Dakota "" West Virginia "
I risultati includono tutti gli stati che hanno nomi di due parole, come New Jersey, New York, North Carolina, South Dakota e West Virginia.
Est. È possibile confermare questo facendo un'altra ricerca: >> stato. name [grep ("East", state. name)] character (0) Quando il risultato di un'operazione di carattere è un vettore vuoto (cioè, non c'è nulla in esso), R lo rappresenta come carattere (0). Allo stesso modo, un vettore numerico vuoto o di lunghezza zero viene rappresentato con numero intero (0) o numerico (0).
R fa una distinzione tra NULL e un vettore vuoto. Normalmente NULL significa che qualcosa non è definito. Questo è sottilmente diverso da qualcosa che è vuoto. Ad esempio, un vettore di caratteri che non ha elementi è ancora un vettore di caratteri, rappresentato dal carattere (0).
