Video: MasterExcel.it - Tutorial Gaussiana in Excel - Curva di Distribuzione Normale a campana 2024
Quando i tuoi dati sono pronti e stai per iniziare a costruire il tuo modello predittivo per l'analisi, è utile delineare la tua metodologia di test e redigere un piano di test. I test dovrebbero essere guidati dagli obiettivi aziendali che hai raccolto, documentato e raccolto tutti i dati necessari per aiutarti a raggiungere.
A prima vista, dovresti escogitare un metodo per verificare se un obiettivo aziendale è stato raggiunto con successo. Poiché l'analisi predittiva misura la probabilità di un risultato futuro - e l'unico modo per essere pronti a eseguire tale test è formando il modello sui dati passati, è ancora necessario vedere cosa può fare quando si confronta con i dati futuri.
Naturalmente, non è possibile correre un modello non sperimentato su dati reali futuri, quindi sarà necessario utilizzare i dati esistenti per simulare realisticamente i dati futuri. Per fare ciò, devi dividere i dati su cui stai lavorando in formazione e testare i set di dati.
Assicurati di selezionare questi due set di dati a caso e che entrambi i set di dati contengono e coprono tutti i parametri dei dati che stai misurando.
Quando si suddividono i dati in serie di dati di test e addestramento, si evita in modo efficace qualsiasi problema di overfitting che potrebbe derivare dal sovrallenamento del modello sull'intero set di dati e dalla raccolta di tutti i pattern di rumore o caratteristiche specifiche che appartengono solo all'insieme di dati di esempio e non sono applicabili ad altri set di dati.
La separazione dei dati in training e set di dati di test, circa il 70 percento e il 30 percento rispettivamente, assicura una misurazione accurata delle prestazioni del modello di analisi predittiva che state costruendo. Vuoi valutare il tuo modello rispetto ai dati del test perché è un modo semplice per misurare se le previsioni del modello sono precise.