Casa Finanza personale Come utilizzare l'adattamento della curva in Predictive Analytics - dummies

Come utilizzare l'adattamento della curva in Predictive Analytics - dummies

Sommario:

Video: 2017 Personality 01: Introduction 2024

Video: 2017 Personality 01: Introduction 2024
Anonim

Raccordo curva è un processo utilizzato nell'analisi predittiva in cui l'obiettivo è creare una curva che descrive la funzione matematica che si adatta meglio ai punti di dati effettivi (originali) in una serie di dati.

La curva può attraversare tutti i punti dati o rimanere all'interno della maggior parte dei dati, ignorando alcuni punti dati nella speranza di trarre le tendenze dai dati. In entrambi i casi, una singola funzione matematica viene assegnata all'intero corpo di dati, con l'obiettivo di adattare tutti i punti dati in una curva che delinea le tendenze e aiuta la previsione.

Il fitting della curva può essere ottenuto in tre modi:

  • Trovando una misura esatta per ogni punto di dati (un processo chiamato interpolazione )

  • Rimanendo all'interno la maggior parte dei dati mentre si ignorano alcuni dei punti dati nella speranza di trarre le tendenze dai dati

  • Utilizzando il livellamento dei dati per ottenere una funzione che rappresenta il grafico livellato

Il raccordo della curva può essere usato per riempire i possibili punti dati per sostituire i valori mancanti o consentire agli analisti di visualizzare i dati.

Quando lavori per generare un modello di analisi predittiva, evita di personalizzare il tuo modello per adattarlo perfettamente al tuo campione di dati. Un tale modello fallirà - miseramente - per predire dataset simili ma variabili al di fuori del campione di dati. Adattare un modello a un particolare campione di dati è un errore classico chiamato sovradattamento .

I problemi di overfitting

In sostanza, l'overfitting di un modello è ciò che accade quando si trascina il modello per rappresentare solo i dati campione - che non è una buona rappresentazione dei dati nel loro complesso. Senza un set di dati più realistico, il modello può essere afflitto da errori e rischi quando diventa operativo e le conseguenze per la tua azienda possono essere gravi.

Il sovradimensionamento di un modello è una trappola comune perché le persone vogliono creare modelli che funzionano - e quindi sono tentati di mantenere variabili e parametri di tweaking fino a quando il modello non esegue perfettamente - su dati troppo piccoli. Errare è umano. Fortunatamente, è anche umano creare soluzioni realistiche.

Per evitare il sovradattamento del modello al set di dati campione, assicurarsi di disporre di una serie di dati di test disponibili separati dai dati di esempio. Quindi è possibile misurare le prestazioni del modello in modo indipendente prima di rendere operativo il modello.

Pertanto, una protezione generale contro il sovradattamento consiste nel dividere i dati in due parti: dati di addestramento e dati di test. Le prestazioni del modello rispetto ai dati del test ti diranno molto sul fatto che il modello sia pronto per il mondo reale.

Un'altra best practice è fare in modo che i tuoi dati rappresentino la popolazione più ampia del dominio per cui stai modellando. Tutto ciò che un modello sovrallenato conosce sono le caratteristiche specifiche del set di dati campione per cui è stato addestrato. Se si allena il modello solo sulle vendite (per esempio) di ciaspole in inverno, non sorprenderti se fallisce miseramente quando viene eseguito di nuovo su dati di qualsiasi altra stagione.

Come evitare di sovralimentare

Vale la pena ripeterlo: troppi ritocchi del modello possono comportare un sovradattamento. Uno di questi tweak include troppe variabili nell'analisi. Mantieni quelle variabili al minimo. Includere solo le variabili che consideri assolutamente necessarie - quelle che ritieni possano fare una differenza significativa per il risultato.

Questa intuizione deriva solo dalla conoscenza approfondita del dominio aziendale in cui ti trovi. È qui che l'esperienza degli esperti di dominio può aiutarti a evitare di cadere nella trappola del sovradattamento.

Ecco un elenco di best practice per aiutarti a evitare il sovradattamento del tuo modello:

  • Scegli un set di dati con cui lavorare è rappresentativo della popolazione nel suo insieme.

  • Dividi il set di dati in due parti: dati di addestramento e dati di test.

  • Mantenere le variabili analizzate a un minimo salutare per l'attività in corso.

  • Supporta l'aiuto di esperti di conoscenza del dominio.

Nel mercato azionario, ad esempio, una tecnica analitica classica è back-testing - eseguendo un modello contro i dati storici per cercare la migliore strategia di trading.

Supponiamo che, dopo aver eseguito il suo nuovo modello contro i dati generati da un recente mercato rialzista, e modificando il numero di variabili utilizzate nella sua analisi, l'analista crei quella che sembra una strategia di trading ottimale - che produrrebbe i rendimenti più alti < se potrebbe tornare indietro e scambiare solo durante l'anno in cui sono stati prodotti i dati di test. Sfortunatamente, non può. Se cerca di applicare quel modello in un mercato orso attuale, guarda sotto: Incorrerà perdite applicando un modello troppo ottimizzato per un periodo di tempo ristretto e un insieme di condizioni che non si adattano alle realtà attuali. (Tanto per i profitti ipotetici.)

Il modello ha funzionato solo per quel mercato toro scomparso perché era sovrallenato, con gli indizi del contesto che ha prodotto i dati campione - completo di dettagli, valori anomali e carenze. Tutte le circostanze che circondano quel set di dati probabilmente non si ripeteranno in futuro, o in una vera rappresentazione dell'intera popolazione - ma sono tutte presenti nel modello sovralimentato.

Se l'output di un modello è troppo accurato, considera un suggerimento per dare un'occhiata più da vicino. Chiedete l'aiuto degli esperti di conoscenza del dominio per vedere se i vostri risultati sono davvero troppo belli per essere veri, ed eseguite quel modello su più dati di test per ulteriori confronti.

Come utilizzare l'adattamento della curva in Predictive Analytics - dummies

Scelta dell'editore

Scattare foto digitali con uno zoom ottico - dummy

Scattare foto digitali con uno zoom ottico - dummy

La fotocamera digitale potrebbe avere uno zoom ottico, che è un Obiettivo zoom attuale vecchio stile (al contrario di uno zoom digitale). Per utilizzare lo zoom ottico della fotocamera digitale per scatti ravvicinati, segui questi passaggi di preparazione delle immagini prima di attivare il pulsante o lo switch di zoom:

La reflex digitale e la sensibilità alla luce - dummy

La reflex digitale e la sensibilità alla luce - dummy

La tua reflex digitale ha un'opzione per determinare la sensibilità del sensore della fotocamera è alla luce. Le fotocamere digitali sono le stesse delle fotocamere a pellicola in quanto la sensibilità alla luce è determinata dalla valutazione ISO. Il vantaggio di una fotocamera digitale è che non è necessario cambiare pellicola per modificare le valutazioni ISO. Quando aumenti ...

Scatti grandangolari con obiettivi standard - manichini

Scatti grandangolari con obiettivi standard - manichini

Fotografia grandangolare con un angolo di campo maggiore rispetto alla lunghezza focale normale o teleobiettivo. A volte si percepiscono le foto come molto espansive. Altre volte, a malapena lo si nota. Dipende tutto dal soggetto e da come si inquadra la scena. Questa figura mostra una scena di terreni agricoli che è stata scattata utilizzando un Sony APS-C ...

Scelta dell'editore

Come usare il meta tag DESCRIPTION - dummies

Come usare il meta tag DESCRIPTION - dummies

I meta tag sono tag HTML speciali che puoi utilizzare per trasportare informazioni, che i browser o altri programmi possono quindi leggere. Quando i motori di ricerca di Internet furono creati per la prima volta, i webmaster includevano i meta tag nelle loro pagine per rendere più facile per i motori di ricerca determinare le pagine. I motori di ricerca hanno utilizzato anche questi meta ...

Come scrivere un grande tag Title Web Marketing - dummies

Come scrivere un grande tag Title Web Marketing - dummies

Scrivere un tag title è fondamentale per il successo del web marketing e coinvolge più che mettere le parole chiave prima. I motori di ricerca mostrano il tag parola chiave nella parte superiore di ciascun elemento nelle pagine dei risultati dei motori di ricerca (SERP). Un tag del titolo ben scritto potrebbe aumentare le probabilità che un cliente in ricerca faccia clic sul tuo annuncio. Se ...

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

Quando le persone effettuano ricerche sul Web utilizzando Yahoo! , ottengono una combinazione di risultati organici e pagati. Se lavori per una società più grande, potresti provare Yahoo! La ricerca inoltra Pro per ottenere un vantaggio rispetto alla concorrenza e puoi persino registrare il tuo sito con Yahoo! Directory. Yahoo! I risultati di ricerca organica ...

Scelta dell'editore

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

ShareMyPlaylists (o SMP, in breve) è stato uno dei primi siti di condivisione di playlist Spotify e continua a innovare e offrire nuove funzionalità ai visitatori. Il mantra del sito è "Long Live the Mixtape", e qui troverai tantissime creazioni accuratamente compilate da migliaia di utenti. Dopo aver creato una playlist Spotify piena di ...

Spotify Unlimited - dummies

Spotify Unlimited - dummies

Spotify Unlimited è un modo brillante per ascoltare tutta la musica che vuoi senza limiti. È come una persona speciale che ti compra da mangiare e da bere tutta la sera per non doverti preoccupare del conto. È come essere in grado di dormire nel weekend senza preoccuparsi del lavoro o se ...

I generi di Spotify - dummies

I generi di Spotify - dummies

Che si tratti di hard rock, techno, pop, jazz, industrial, indie pop, folk , classico, heavy metal, valzer o qualsiasi altra cosa ti piaccia, Spotify ha il genere o il tipo di musica coperto. Puoi cercare i generi comuni da Spotify. Sebbene Spotify abbia pubblicato un elenco di quasi 1, 000 generi noti, non tutti saranno in grado di offrire ...