Casa Finanza personale Come generare dati derivati ​​e ridurne la dimensionalità per Predictive Analytics - dummies

Come generare dati derivati ​​e ridurne la dimensionalità per Predictive Analytics - dummies

Sommario:

Video: La sovranità appartiene al popolo o allo spread? Antonio Maria Rinaldi e Scenari Economici a Milano 2025

Video: La sovranità appartiene al popolo o allo spread? Antonio Maria Rinaldi e Scenari Economici a Milano 2025
Anonim

In questa fase di esplorazione dell'analisi predittiva, acquisirai una conoscenza approfondita dei tuoi dati, che a sua volta ti aiuteranno a scegliere le variabili rilevanti da analizzare. Questa comprensione ti aiuterà anche a valutare i risultati del tuo modello. Ma prima devi identificare e pulire i dati per l'analisi.

Come generare i dati derivati ​​

Gli attributi derivati ​​ sono record interamente nuovi costruiti da uno o più attributi esistenti. Un esempio potrebbe essere la creazione di documenti che identificano libri che sono bestseller nelle fiere del libro. I dati grezzi non possono acquisire tali record, ma a fini di modellazione, questi record derivati ​​possono essere importanti. Il rapporto prezzo / guadagno e la media mobile a 200 giorni sono due esempi di dati derivati ​​ampiamente utilizzati nelle applicazioni finanziarie.

Gli attributi derivati ​​possono essere ottenuti da semplici calcoli come dedurre l'età dalla data di nascita. Gli attributi derivati ​​possono anche essere calcolati riassumendo le informazioni da più record.

Ad esempio, la conversione di una tabella di clienti e dei libri acquistati in una tabella può consentire di tenere traccia del numero di libri venduti tramite un sistema di raccomandazione, attraverso il marketing mirato e una fiera del libro e identificare la fascia demografica dei clienti che comprato quei libri.

La generazione di tali attributi aggiuntivi porta ulteriore potenza predittiva all'analisi. In effetti, molti di questi attributi sono creati in modo da sondare il loro potenziale potere predittivo. Alcuni modelli predittivi possono utilizzare più attributi derivati ​​rispetto agli attributi nel loro stato grezzo. Se alcuni attributi derivati ​​si rivelano particolarmente predittivi e il loro potere è dimostrato pertinente, allora ha senso automatizzare il processo che li genera.

I record derivati ​​sono nuovi record che portano nuove informazioni e forniscono nuovi modi di presentare dati grezzi; possono essere di enorme valore per la modellazione predittiva.

Come ridurre la dimensionalità dei dati

I dati utilizzati nei modelli predittivi sono generalmente raggruppati da più fonti. L'analisi può trarre da dati sparsi su più formati di dati, file e database o più tabelle all'interno dello stesso database. Raggruppare i dati insieme e combinarli in un formato integrato per i modellatori di dati da utilizzare è essenziale.

Se i tuoi dati contengono contenuti gerarchici, potrebbe essere necessario appiattito . Alcuni dati hanno alcune caratteristiche gerarchiche come le relazioni genitore-figlio o un record composto da altri record.Ad esempio, un prodotto come un'auto può avere più produttori; appiattendo i dati, in questo caso, significa includere ciascun produttore come caratteristica aggiuntiva del record che stai analizzando.

L'appiattimento dei dati è essenziale quando viene unito da più record correlati per formare un'immagine migliore.

Ad esempio, l'analisi degli eventi avversi per diversi farmaci fatti da diverse aziende potrebbe richiedere che i dati vengano appiattiti a livello di sostanza. In questo modo, si finisce per rimuovere le relazioni uno-a-molti (in questo caso, molti produttori e molte sostanze per un prodotto) che possono causare troppe duplicazioni di dati ripetendo più voci di sostanze che si ripetono informazioni su prodotti e produttori ad ogni voce.

L'appiattimento riduce la dimensionalità dei dati, che è rappresentata dal numero di funzioni di un record o di un'osservazione.

Ad esempio, un cliente può avere le seguenti caratteristiche: nome, età, indirizzo, articoli acquistati. Quando inizi la tua analisi, potresti trovarti a valutare i record con molte funzionalità, solo alcune delle quali sono importanti per l'analisi. Quindi dovresti eliminare tutte le funzionalità tranne quelle che hanno il potere più predittivo per il tuo progetto specifico.

La riduzione della dimensionalità dei dati può essere ottenuta inserendo tutti i dati in un'unica tabella che utilizza più colonne per rappresentare gli attributi di interesse. All'inizio dell'analisi, ovviamente, l'analisi deve valutare un numero elevato di colonne, ma tale numero può essere ridotto man mano che l'analisi procede.

Questo processo può essere aiutato ricostituendo i campi, ad esempio raggruppando i dati in categorie con caratteristiche simili.

Il set di dati risultante - il set di dati pulito - viene solitamente inserito in un database separato per gli analisti da utilizzare. Durante il processo di modellazione, questi dati dovrebbero essere facilmente accessibili, gestiti e aggiornati.

Come generare dati derivati ​​e ridurne la dimensionalità per Predictive Analytics - dummies

Scelta dell'editore

Soluzioni software per i tuoi bisogni fotografici digitali - manichini

Soluzioni software per i tuoi bisogni fotografici digitali - manichini

Il software fotografico che usi è fondamentale per il tuo successo la camera oscura digitale come l'hardware. La buona notizia è che se le tue esigenze sono basilari - vuoi solo visualizzare e organizzare le tue foto e magari ritagliare un'immagine o due - potresti non dover pagare una monetina per ...

Prendi Great Nature Photographs - dummies

Prendi Great Nature Photographs - dummies

Quando fotografi un posto bellissimo, il tuo obiettivo dovrebbe essere per qualcuno di dire "I vorrei essere lì. "In una fotografia di grande natura, il tuo obiettivo non è quello di inviare l'immagine a qualcuno e dire:" Ero qui. "Quando visiti un bellissimo paesaggio o vedi un fiore colorato o un animale che vuoi ...

Scattare una foto di un soggetto in movimento con la tua fotocamera digitale - dummies

Scattare una foto di un soggetto in movimento con la tua fotocamera digitale - dummies

Probabilmente vorresti scatta foto sulla tua fotocamera digitale di persone o cose che si muovono. Quando scatti foto di soggetti in movimento, utilizza questi trucchi per fermare un oggetto in movimento nelle sue tracce:

Scelta dell'editore

Personalizza le fatture di QuickBooks 2014 con lo Strumento di progettazione layout - dummy

Personalizza le fatture di QuickBooks 2014 con lo Strumento di progettazione layout - dummy

Forse hai utilizzato QuickBooks 2014 di base Finestra di dialogo Personalizzazione per apportare alcune modifiche all'aspetto della fattura e non sono stati soddisfatti. Forse hai fatto il miglio in più e ti sei gingillato con la finestra di dialogo Personalizzazione aggiuntiva per apportare ulteriori modifiche, e forse anche questo non ti ha lasciato felice con l'aspetto della tua fattura. ...

Debito Rapporto di equità in QuickBooks 2012 - dummies

Debito Rapporto di equità in QuickBooks 2012 - dummies

Il rapporto di indebitamento è uno dei rapporti di leva che è possibile utilizzare in QuickBooks 2012. Un indice di equity debt confronta il debito a lungo termine di un'impresa con il patrimonio netto di un azionista o il patrimonio netto del proprietario. In sostanza, il rapporto tra indebitamento e debito esprime il debito a lungo termine dell'impresa come percentuale del capitale proprio del proprietario. L'equity azionario è sinonimo di proprietario ...

Debito Rapporto di equità in QuickBooks 2014 - manichini

Debito Rapporto di equità in QuickBooks 2014 - manichini

Puoi tenere traccia del tuo rapporto di indebitamento in QuickBooks. Un rapporto di indebitamento di debito confronta il debito a lungo termine di un'impresa con il patrimonio netto di un azionista o il patrimonio netto del proprietario. In sostanza, il rapporto tra indebitamento e debito esprime il debito a lungo termine dell'impresa come percentuale del capitale proprio del proprietario. L'equity azionario è sinonimo di equità del proprietario e, nel caso di ...

Scelta dell'editore

Come gestire i consigli di LinkedIn che hai ricevuto - dummies

Come gestire i consigli di LinkedIn che hai ricevuto - dummies

Ogni volta che ricevi una raccomandazione da qualcun altro, vedi un messaggio nella tua casella di posta in arrivo su LinkedIn. Dovrai gestirli per tenere d'occhio ciò che appare sul tuo profilo in un dato momento. Quando ricevi una raccomandazione, hai queste opzioni: Accetta e mostralo sul tuo profilo. Fai clic su ...

Come unire un gruppo LinkedIn - dummies

Come unire un gruppo LinkedIn - dummies

Quando guardi i gruppi di LinkedIn là fuori, uno dei le cose più importanti da tenere a mente è che dovresti unirti solo a quei gruppi che sono rilevanti per te. Anche se potresti pensare che sia divertente entrare in un altro gruppo di associazioni di alunni oltre alla tua alma mater, non ti sarà di grande aiuto nel ...

Come commercializzare il tuo business tramite LinkedIn - dummies

Come commercializzare il tuo business tramite LinkedIn - dummies

LinkedIn può giocare un ruolo significativo nell'efficace marketing di i tuoi affari. Il valore di LinkedIn come strumento di marketing ottiene un sacco di interesse dai dipartimenti finanziari della maggior parte delle aziende, soprattutto perché vedono LinkedIn come un modo libero di commercializzare il business. Anche se non devi pagare nulla in termini di denaro per prendere ...