Casa Finanza personale Training, convalida e testing in Machine Learning - dummies

Training, convalida e testing in Machine Learning - dummies

Video: K-Fold Cross Validation - Intro to Machine Learning 2025

Video: K-Fold Cross Validation - Intro to Machine Learning 2025
Anonim

In un mondo perfetto, puoi eseguire un test sui dati che il tuo algoritmo di apprendimento automatico non ha mai imparato prima. Tuttavia, l'attesa di nuovi dati non è sempre fattibile in termini di tempi e costi.

Come primo rimedio semplice, puoi dividere casualmente i tuoi dati in training e set di test. La suddivisione comune va dal 25 al 30 percento per i test e dal 75 al 70 percento per l'allenamento. Hai diviso i tuoi dati consistenti nella tua risposta e funzionalità allo stesso tempo, mantenendo la corrispondenza tra ogni risposta e le sue caratteristiche.

Il secondo rimedio si verifica quando è necessario regolare l'algoritmo di apprendimento. In questo caso, i dati di split test non sono una buona pratica perché causano un altro tipo di overfitting chiamato snooping. Per superare lo snooping, hai bisogno di un terzo split, chiamato un set di validazione. Una divisione suggerita è quella di avere gli esempi suddivisi in terze parti: 70% per la formazione, 20% per la convalida e il 10% per i test.

È necessario eseguire la suddivisione in modo casuale, ovvero indipendentemente dall'ordinamento iniziale dei dati. In caso contrario, il test non sarà affidabile, perché l'ordinamento potrebbe causare sovrastima (quando c'è qualche ordinamento significativo) o sottostima (quando la distribuzione differisce di troppo). Come soluzione, è necessario assicurarsi che la distribuzione del set di test non sia molto diversa dalla distribuzione dell'allenamento e che l'ordinamento sequenziale si verifichi nei dati suddivisi.

Ad esempio, controlla se i numeri di identificazione, quando disponibili, sono continui nei tuoi set. A volte, anche se si rispettano rigorosamente il campionamento casuale, non è sempre possibile ottenere distribuzioni simili tra le serie, specialmente quando il numero di esempi è piccolo.

Quando il numero di esempi n è alto, come n> 10.000, è possibile creare con sicurezza un set di dati suddivisi casualmente. Quando il set di dati è più piccolo, il confronto tra statistiche di base quali media, modalità, mediana e varianza tra la risposta e le caratteristiche nei set di training e test ti aiuterà a capire se il set di test non è adatto. Quando non sei sicuro che la divisione sia giusta, ricalcola una nuova.

Training, convalida e testing in Machine Learning - dummies

Scelta dell'editore

Come creare una casella di testo su una diapositiva di PowerPoint 2007 - dummies

Come creare una casella di testo su una diapositiva di PowerPoint 2007 - dummies

L'unica differenza tra Le caselle di testo di PowerPoint e le cornici segnaposto di testo sono quelle caselle di testo che non ereditano la loro formattazione da una diapositiva master di PowerPoint. Decidi come si presenta il testo nella casella di testo, quanto è grande, di che colore è e in che modo è allineato. Le caselle di testo non sono collegate alle diapositive master. ...

Come creare un font del tema in PowerPoint 2007 - dummies

Come creare un font del tema in PowerPoint 2007 - dummies

Un font del tema creato in PowerPoint diventa parte del tema su cui stai lavorando. Diventa disponibile per tutte le presentazioni PowerPoint che crei con il tema in seguito. Attenersi alla seguente procedura per creare una combinazione di caratteri del tema:

Come creare una casella di testo sulla diapositiva di PowerPoint 2007 - dummies

Come creare una casella di testo sulla diapositiva di PowerPoint 2007 - dummies

Una casella di testo di PowerPoint è un tipo speciale di forma progettato per contenere il testo sulle diapositive nelle presentazioni di PowerPoint. Per creare una casella di testo, segui questi passaggi:

Scelta dell'editore

Come sincronizzare le tracce Spotify locali tramite Wi-Fi - dummies

Come sincronizzare le tracce Spotify locali tramite Wi-Fi - dummies

Spotify ha una di quelle caratteristiche killer: la capacità di copiare le tracce locali memorizzate sul computer nell'app mobile, senza dover usare cavi. Queste tracce locali possono essere qualsiasi cosa sul tuo computer elencata nella cartella File locali. Potrebbero essere file estratti da un CD molto tempo fa o ...

Come tagga le tracce Spotify con le stelle - dummies

Come tagga le tracce Spotify con le stelle - dummies

In Spotify, tutte le tracce e gli album possono essere taggati con una stella: è un modo per aggiungere un segnalibro (o indicare un preferito) alle tracce o alle tracce preferite che si desidera tornare più tardi. Tutti gli oggetti che hai inserito sono elencati nella cartella Speciali. Puoi anche contrassegnare tutte le tracce di un album in ...

Come iscriversi alle playlist da Spotify - dummies

Come iscriversi alle playlist da Spotify - dummies

Cosa succede se hai fatto clic sul link di qualcuno a un playlist, si avvia all'interno di Spotify e hai voglia di iscriverti ad esso? Tutto ciò che devi fare è fare clic su Iscriviti accanto alla playlist. (Puoi anche vedere un link Iscriviti simile accanto a una playlist quando è elencato in un profilo pubblico.) Dopo aver fatto clic su Abbonati, ...

Scelta dell'editore

Sulla tua Canon EOS 77D - manichini

Sulla tua Canon EOS 77D - manichini

Se non hai familiarità con la fotocamera Canon EOS 77D, eccoti una guida rapida ai pulsanti, ai quadranti e ad altri controlli esterni. L'obiettivo mostrato qui è l'obiettivo del kit da 18-55 mm; altri obiettivi possono avere caratteristiche diverse.

Scelta di una modalità Esposizione su Canon EOS 70D - manichini

Scelta di una modalità Esposizione su Canon EOS 70D - manichini

La prima impostazione da prendere in considerazione sulla tua Canon EOS 70D è la modalità di esposizione, che selezioni tramite il quadrante di modalità, mostrato nella figura seguente. Ricordare che prima di poter ruotare il quadrante, è necessario premere e tenere premuto il pulsante di blocco al centro del quadrante. La scelta della modalità di esposizione determina come ...

Scegliendo Impostazioni di registrazione film su una fotocamera Canon Rebel serie T3 - manichini

Scegliendo Impostazioni di registrazione film su una fotocamera Canon Rebel serie T3 - manichini

Dopo aver impostato il Selettore di modalità su Film sulla fotocamera Canon EOS Rebel T3 o Canon EOS Rebel T3i, è possibile monitorare le impostazioni di registrazione più importanti tramite la schermata Impostazioni di ripresa. Se non vedi lo stesso tipo di dati sul monitor, premi il pulsante Info per scorrere tra diversi stili di visualizzazione. ...