Sommario:
Video: Cos'è il Machine Learning (Reti Neurali e A.I.) 2024
Apprendimento supervisionato
- Apprendimento non supervisionato
- Apprendimento rinforzato
- Apprendimento supervisionato
Apprendimento supervisionato
si verifica quando un algoritmo apprende dall'esempio i dati e le risposte target associate che possono essere costituite da valori numerici o etichette di stringhe, come classi o tag, al fine di prevedere in seguito la risposta corretta quando posti con nuovi esempi. L'approccio supervisionato è in effetti simile all'apprendimento umano sotto la supervisione di un insegnante. L'insegnante fornisce buoni esempi per lo studente da memorizzare e lo studente ricava le regole generali da questi esempi specifici.
Apprendimento senza supervisione
si verifica quando un algoritmo apprende da semplici esempi senza alcuna risposta associata, lasciando l'algoritmo per determinare da solo i modelli di dati. Questo tipo di algoritmo tende a ristrutturare i dati in qualcos'altro, come nuove funzionalità che possono rappresentare una classe o una nuova serie di valori non correlati. Sono abbastanza utili nel fornire agli umani intuizioni sul significato dei dati e nuovi utili input per gli algoritmi di apprendimento automatico supervisionati.
L'algoritmo di automazione del marketing trae i suoi suggerimenti da ciò che hai comprato in passato. Le raccomandazioni si basano su una stima di quale gruppo di clienti assomigli di più e quindi deduco le tue probabili preferenze in base a quel gruppo.
Apprendimento rinforzamento
Apprendimento rinforzamento
si verifica quando si presenta l'algoritmo con esempi privi di etichette, come nell'apprendimento non supervisionato. Tuttavia, è possibile accompagnare un esempio con feedback positivo o negativo in base alla soluzione proposta dall'algoritmo.L'apprendimento del rinforzo è collegato alle applicazioni per le quali l'algoritmo deve prendere decisioni (quindi il prodotto è prescrittivo, non solo descrittivo, come nell'apprendimento non supervisionato) e le decisioni hanno conseguenze. Nel mondo umano, è come imparare per tentativi ed errori. Gli errori ti aiutano a imparare perché hanno una penalità aggiunta (costo, perdita di tempo, rimpianti, dolore e così via), insegnandoti che una certa linea d'azione ha meno probabilità di successo di altre. Un interessante esempio di apprendimento di rinforzo si verifica quando i computer imparano a giocare ai videogiochi da soli.
In questo caso, un'applicazione presenta l'algoritmo con esempi di situazioni specifiche, come avere il giocatore bloccato in un labirinto evitando un nemico. L'applicazione consente all'algoritmo di conoscere l'esito delle azioni necessarie e l'apprendimento avviene durante il tentativo di evitare ciò che scopre essere pericoloso e perseguire la sopravvivenza. Puoi dare un'occhiata a come la società Google DeepMind ha creato un programma di apprendimento di rinforzo che riproduce i vecchi videogiochi di Atari. Quando guardi il video, nota come il programma è inizialmente maldestro e non qualificato, ma migliora costantemente con l'allenamento finché non diventa un campione.