Video: Decision Tree Learning - Python Machine Learning [ITALIANO] (Intelligenza Artificiale) 2024
Per eseguire un'analisi predittiva, è necessario ottenere i dati in un modulo che l'algoritmo può utilizzare per creare un modello. Per fare ciò, devi prendere un po 'di tempo per capire i dati e conoscerne la struttura. Digitare la funzione per scoprire la struttura dei dati. Ecco come appare: >> str (seeds) 'data. frame ': 210 obs. di 8 variabili: $ V1: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ V2: num 14. 8 14. 6 14. 1 13. 9 15 … $ V3: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ V4: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ V5: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ V6: numero 2. 22 1. 02 2. 7 2. 26 1. 35 … $ V7: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ V8: int 1 1 1 1 1 1 1 1 1 1 …
Dall'osservazione della struttura, è possibile affermare che i dati richiedono una fase di pre-elaborazione e una fase di comodità:
-
Questo non è strettamente necessario, ma ai fini di questo esempio, è più comodo usare i nomi delle colonne che è possibile capire e ricordare. Cambia l'attributo con valori categoriali in un fattore.
-
L'etichetta ha tre possibili categorie. Per rinominare le colonne, digitare il seguente codice: >> colnames (seeds) <-
c ("area", "perimeter", "compactness", "length", "width", " asimmetria "," lunghezza2 "," seedType ")
Successivamente, modificare l'attributo che ha valori categoriali su un fattore. Il seguente codice modifica il tipo di dati in un fattore:
>> seed $ seedType <- factor (seed $ seedType)
Questo comando termina la preparazione dei dati per il processo di modellazione. La seguente è una vista della struttura dopo il processo di preparazione dei dati: >> str (weeds) 'data. frame ': 210 obs. di 8 variabili: $ area: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ perimetro: num 14. 8 14. 6 14. 1 13. 9 15 … $ compattezza: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ lunghezza: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ larghezza: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ asimmetria: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ length2: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ seedType: Fattore w / 3 livelli "1", "2", "3": 1 1 1 1 1 1 1 1 1 1 …