Casa Finanza personale Come preparare i dati per un modello di analisi predittiva - dummies

Come preparare i dati per un modello di analisi predittiva - dummies

Sommario:

Video: MasterExcel.it | Regressione Lineare su Excel - Grafico Formula e Analisi di una regressione lineare 2025

Video: MasterExcel.it | Regressione Lineare su Excel - Grafico Formula e Analisi di una regressione lineare 2025
Anonim

Quando hai definito gli obiettivi del modello per l'analisi predittiva, il passo successivo è identificare e preparare i dati che utilizzerai per costruire il tuo modello. La sequenza generale di passaggi è la seguente:

  1. Identifica le tue origini dati.

    I dati potrebbero essere in diversi formati o risiedere in varie posizioni.

  2. Identifica come accederai a quei dati.

    A volte, è necessario acquisire dati di terze parti o dati di proprietà di una divisione diversa nella propria organizzazione, ecc.

  3. Considera quali variabili includere nella tua analisi.

    Un approccio standard prevede di iniziare con una vasta gamma di variabili ed eliminare quelle che non offrono valori predittivi per il modello.

  4. Determina se utilizzare le variabili derivate.

    In molti casi, una variabile derivata (come il rapporto prezzo / guadagno utilizzato per analizzare i prezzi delle azioni) avrebbe un impatto diretto maggiore sul modello rispetto alla variabile grezza.

  5. Esplora la qualità dei tuoi dati, cercando di capire sia il suo stato che i suoi limiti.

    La precisione delle previsioni del modello è direttamente correlata alle variabili selezionate e alla qualità dei dati. A questo punto, vorrai rispondere ad alcune domande specifiche:

    • I dati sono completi?

    • Ha qualche outlier?

    • I dati necessitano di pulizia?

    • Hai bisogno di inserire i valori mancanti, tenerli così come sono o eliminarli del tutto?

La comprensione dei dati e delle sue proprietà può aiutarti a scegliere l'algoritmo che sarà più utile nella costruzione del tuo modello. Ad esempio:

  • Gli algoritmi di regressione possono essere utilizzati per analizzare i dati delle serie temporali.

  • Gli algoritmi di classificazione possono essere utilizzati per analizzare dati discreti.

  • Gli algoritmi di associazione possono essere utilizzati per dati con attributi correlati.

Il set di dati utilizzato per addestrare e testare il modello deve contenere informazioni aziendali pertinenti per rispondere al problema che si sta tentando di risolvere. Se il tuo obiettivo è (ad esempio) per determinare quale cliente è probabile che abbandoni, allora il set di dati che scegli deve contenere informazioni sui clienti che hanno agitato in passato oltre ai clienti che non lo hanno fatto.

Alcuni modelli creati per estrarre dati e dare un senso alle sue relazioni sottostanti - ad esempio, quelli costruiti con algoritmi di clustering - non hanno bisogno di avere un particolare risultato finale in mente.

Due problemi sorgono quando si hanno a che fare con i dati mentre si sta costruendo il modello: underfitting e overfitting.

Underfitting

Underfitting è quando il tuo modello non è in grado di rilevare alcuna relazione nei tuoi dati.Questo di solito indica che le variabili essenziali - quelle con potere predittivo - non sono state incluse nella tua analisi. Ad esempio, un'analisi delle scorte che include solo i dati provenienti da un mercato rialzista (dove i prezzi generali delle azioni stanno salendo) non tiene conto di crisi o bolle che possono apportare correzioni importanti al rendimento complessivo degli stock.

La mancata inclusione di dati che abbracciano i mercati di tori e (quando i prezzi complessivi delle azioni stanno calando) impedisce al modello di produrre la migliore selezione di portafoglio possibile.

Overfitting

Overfitting è quando il modello include dati che non hanno potenza predittiva ma sono specifici solo per il set di dati che si sta analizzando. Rumore - variazioni casuali nel set di dati - possono trovare la sua strada nel modello, in modo tale che l'esecuzione del modello su un set di dati diverso produce un notevole calo nelle prestazioni predittive e accuratezza del modello. La barra laterale di accompagnamento fornisce un esempio.

Se il tuo modello si comporta bene su un set di dati particolare e presenta solo prestazioni inferiori quando lo provi su un set di dati diverso, sospetti un sovradattamento.

Come preparare i dati per un modello di analisi predittiva - dummies

Scelta dell'editore

Vantaggi di base della rete - manichini

Vantaggi di base della rete - manichini

Se la verità viene detta, le reti di computer sono un problema da impostare. Perché i vantaggi di avere una rete rendono la pena di crearne uno utile. Non è necessario essere un dottorato di ricerca per comprendere i vantaggi del networking. Le reti riguardano esclusivamente la condivisione. Nello specifico, le reti riguardano la condivisione di tre elementi: informazioni, risorse, ...

Biometria L'accettazione, la privacy e la legge - manichini

Biometria L'accettazione, la privacy e la legge - manichini

La tecnologia biometrica non è affatto universalmente accettata da tutti gli utenti. Ci sono una serie di considerazioni sociali e legali che danno ad ogni organizzazione una pausa prima di fare il salto a capofitto nell'implementazione di un sistema biometrico. Le persone sono più a loro agio con i sistemi di raccolta biometrici che sono i meno intrusivi. Scanner per retina e nasi elettronici sono ...

Biometria Nozioni di base - manichini

Biometria Nozioni di base - manichini

La biometria non è roba da fantascienza. Puoi trovare una dozzina di modi più o meno efficaci per utilizzare la biometria per identificare qualcuno, ognuno dei quali si divide in due classi: la biometria fisiologica misura una parte specifica della struttura o della forma di una porzione del corpo di un soggetto. La biometria comportamentale è più interessata a come ...

Scelta dell'editore

Come creare un nuovo dizionario personalizzato in Excel 2007 - dummies

Come creare un nuovo dizionario personalizzato in Excel 2007 - dummies

In Excel 2007, è possibile creare dizionari personalizzati da utilizzare quando si esegue il controllo ortografico dei fogli di lavoro. Utilizzare il pulsante Aggiungi al dizionario nella finestra di dialogo Controllo ortografico per aggiungere parole sconosciute a un dizionario personalizzato. Per impostazione predefinita, Excel aggiunge queste parole a un file dizionario personalizzato denominato CUSTOM. DIC, ma è possibile creare una nuova personalizzazione ...

Come creare un componente aggiuntivo da un file di cartella di lavoro Excel Excel normale in VBA - modi di dire

Come creare un componente aggiuntivo da un file di cartella di lavoro Excel Excel normale in VBA - modi di dire

Sebbene sia possibile convertire qualsiasi cartella di lavoro di Excel in un componente aggiuntivo, non tutte le cartelle di lavoro traggono vantaggio da questa conversione. Una cartella di lavoro senza macro rende un componente aggiuntivo inutile. In effetti, gli unici tipi di cartelle di lavoro che traggono vantaggio dall'essere convertiti in un componente aggiuntivo sono quelli con macro. Ad esempio, una cartella di lavoro costituita da macro generiche (Sub ...

Come creare una nuova cartella di lavoro in Excel 2010 - dummy

Come creare una nuova cartella di lavoro in Excel 2010 - dummy

Se si lavora in Microsoft Excel 2010 e vuoi iniziare a lavorare in un nuovo file di cartella di lavoro di Excel, puoi facilmente creare una nuova cartella di lavoro. Per fare ciò, puoi usare un comando nella scheda File o una scorciatoia da tastiera. Fare clic sulla scheda File. Excel visualizza la visualizzazione Backstage, in cui è possibile accedere ai comandi relativi ai file. ...

Scelta dell'editore

Usa lo strumento Gomma in Adobe Illustrator CS5 - manichini

Usa lo strumento Gomma in Adobe Illustrator CS5 - manichini

Adobe Illustrator Creative Suite 5 (Adobe CS5) Illustrator è utilizzato per rimuovere rapidamente aree di grafica con la stessa facilità con cui si cancellano i pixel in Photoshop, accarezzando con il mouse su qualsiasi forma o gruppo di forme. Facendo doppio clic sullo strumento Gomma, è possibile definire il diametro, l'angolo e la rotondità della gomma. Se stai usando un ...

Trasforma gli strumenti in Adobe Illustrator CS5 - dummies

Trasforma gli strumenti in Adobe Illustrator CS5 - dummies

I più popolari strumenti di trasformazione in Adobe Creative Suite 5 (Adobe CS5) Illustrator - Rifletti, scala, inclina, rimodella e Trasformazione libera: sono facili da usare e modificano rapidamente la tua illustrazione. Lo strumento Rifletti Niente è simmetrico, giusto? Forse no, ma gli oggetti non creati simmetricamente in Illustrator possono sembrare off-kilter. Utilizzando lo strumento Rifletti, si ...

Quando utilizzare Adobe CS5 Illustrator - dummies

Quando utilizzare Adobe CS5 Illustrator - dummies

Utilizzando Adobe Creative Suite 5 (Adobe CS5) Illustrator anziché Photoshop , ottieni diversi benefici. Potresti aver sentito che Illustrator è migliore per la grafica vettoriale, ma perché e che altro porta? Illustrator può salvare ed esportare immagini nella maggior parte dei formati di file. Scegliendo di salvare o esportare, è possibile creare un ...