Video: Cos'è il Machine Learning (Reti Neurali e A.I.) 2024
In analisi supervisionate, entrambi input e l'output preferito fa parte dei dati di allenamento. Il modello di analisi predittiva viene presentato con i risultati corretti come parte del suo processo di apprendimento. Tale apprendimento supervisionato presuppone esempi pre-classificati: l'obiettivo è quello di far imparare il modello dalla classificazione precedentemente nota, in modo che possa etichettare correttamente il prossimo dato sconosciuto in base a quanto appreso.
Una volta completato l'allenamento del modello, viene dedotta una funzione matematica esaminando i dati di allenamento. Questa funzione verrà utilizzata per etichettare nuovi punti dati.
Affinché questo approccio funzioni correttamente, i dati di allenamento, insieme ai dati di test, devono essere accuratamente selezionati. Il modello addestrato dovrebbe essere in grado di prevedere l'etichetta corretta per un nuovo punto dati in modo rapido e preciso, in base al tipo (i) di dati che il modello ha visto nei dati di addestramento.
L'analisi supervisionata offre alcuni vantaggi distinti:
-
L'analista è responsabile del processo.
-
L'etichettatura si basa su classificazioni conosciute.
-
Gli errori di etichettatura possono essere facilmente risolti.
Il rovescio della medaglia di questi vantaggi è un insieme altrettanto distinto di potenziali svantaggi:
-
Eventuali errori nella fase di addestramento verranno rinforzati in seguito.
-
La classificazione fornita dall'analista potrebbe non descrivere adeguatamente l'intera popolazione.
-
Il modello potrebbe non essere in grado di rilevare classi che si discostano dal set di allenamento originale.
-
L'ipotesi che i cluster all'interno dei dati non si sovrappongano e che possano essere facilmente separati potrebbe non essere valida.