Casa Finanza personale Limitazioni dei dati in Predictive Analytics - dummies

Limitazioni dei dati in Predictive Analytics - dummies

Video: Free Webinar - Big data e gestione del personale: il quadro normativo della workforce analytics 2025

Video: Free Webinar - Big data e gestione del personale: il quadro normativo della workforce analytics 2025
Anonim

Come per molti aspetti di qualsiasi sistema aziendale, i dati sono una creazione umana - quindi è probabile che abbia dei limiti alla sua usabilità quando si inizia ottenerlo Ecco una panoramica di alcune limitazioni che potresti incontrare:

  • I dati potrebbero essere incompleti. I valori mancanti, anche la mancanza di una sezione o di una parte sostanziale dei dati, potrebbero limitare la sua usabilità.

    Ad esempio, i tuoi dati potrebbero riguardare solo una o due condizioni di un set più grande che stai cercando di modellare - come quando un modello costruito per analizzare le performance del mercato azionario ha solo i dati disponibili degli ultimi 5 anni, che distorce entrambi i dati e il modello verso l'assunzione di un mercato toro.

    Nel momento in cui il mercato subisce una correzione che porta a un mercato ribassista, il modello non si adatta - semplicemente perché non è stato addestrato e testato con dati che rappresentano un mercato ribassista.

    Assicurati di guardare un periodo di tempo che ti dia un'immagine completa delle naturali fluttuazioni dei tuoi dati; i tuoi dati non dovrebbero essere limitati da stagionalità .

  • Se utilizzi i dati dei sondaggi, tieni presente che le persone non sempre forniscono informazioni accurate. Non tutti risponderanno in modo veritiero (diciamo) quante volte esercitano - o quante bevande alcoliche consumano - a settimana. Le persone potrebbero non essere disoneste quanto autocoscienti, ma i dati sono ancora distorti.

  • I dati raccolti da fonti diverse possono variare in termini di qualità e formato. I dati raccolti da fonti così diverse come sondaggi, e-mail, moduli per l'immissione dei dati e il sito Web della società avranno attributi e strutture diversi. I dati provenienti da varie fonti potrebbero non avere molta compatibilità tra i campi di dati. Tali dati richiedono una preprocessazione prima che sia pronto per l'analisi. La barra laterale di accompagnamento fornisce un esempio.

I dati raccolti da più fonti possono presentare differenze nella formattazione, nei record duplicati e nelle incoerenze tra i campi di dati uniti. Aspettatevi di dedicare molto tempo alla pulizia di tali dati e ancora più a convalidarne l'affidabilità.

Per determinare i limiti dei tuoi dati, assicurati di:

  • Verifica tutte le variabili che utilizzerai nel tuo modello.

  • Valuta l'ambito dei dati, soprattutto nel tempo, in modo che il tuo modello possa evitare la trappola della stagionalità.

  • Controlla i valori mancanti, identificali e valuta il loro impatto sull'analisi complessiva.

  • Fai attenzione ai valori estremi (valori anomali) e decidi se includerli nell'analisi.

  • Confermare che il pool di dati di addestramento e test è sufficientemente grande.

  • Assicurarsi che tipo di dati (numeri interi, valori decimali o caratteri e così via) sia corretto e impostare i limiti superiore e inferiore dei valori possibili.

  • Prestare particolare attenzione all'integrazione dei dati quando i dati provengono da più fonti.

Assicurati di comprendere le tue origini dati e il loro impatto sulla qualità complessiva dei tuoi dati.

  • Scegli un set di dati pertinente che sia rappresentativo dell'intera popolazione.

  • Scegli i parametri corretti per la tua analisi.

Anche dopo tutta questa cura e attenzione, non sorprenderti se i tuoi dati necessitano ancora di pre-elaborazione prima di poterli analizzare in modo accurato. La preelaborazione richiede spesso molto tempo e uno sforzo significativo perché deve affrontare diversi problemi relativi ai dati originali, tra cui:

  • Qualsiasi valore mancante dai dati.

  • Eventuali incongruenze e / o errori esistenti nei dati.

  • Eventuali duplicati o valori anomali nei dati.

  • Qualsiasi normalizzazione o altra trasformazione dei dati.

  • Qualsiasi dato derivato necessario per l'analisi.

Limitazioni dei dati in Predictive Analytics - dummies

Scelta dell'editore

Come leggere dal file in PHP per la programmazione HTML5 e CSS3 - manichini

Come leggere dal file in PHP per la programmazione HTML5 e CSS3 - manichini

Se puoi scrivere dati in un file in PHP, sarebbe logico che tu possa leggere da quel file anche per la programmazione HTML5 e CSS3. Il readContact. programma php recupera i dati salvati nel programma precedente e li visualizza sullo schermo. Non è difficile scrivere un programma per leggere ...

Come usare una classe PHP in uno script - dummy

Come usare una classe PHP in uno script - dummy

Il codice classe PHP deve essere inserito lo script che usa la classe. Più comunemente, la classe viene archiviata in un file di inclusione separato ed è inclusa in qualsiasi script che utilizza la classe. Per usare un oggetto, devi prima creare l'oggetto dalla classe. Quindi quell'oggetto può eseguire qualsiasi metodo che ...

Scelta dell'editore

Come usare lo strumento Timbro clone di Photoshop - manichini

Come usare lo strumento Timbro clone di Photoshop - manichini

Puoi usare lo strumento Timbro clone in Photoshop per rimuovere gli angoli e altri difetti copiando una porzione dei pixel circostanti, che dovrebbero avere un colore e una consistenza simili, sopra la parte malata dell'immagine. Per utilizzare lo strumento Timbro clone, attenersi alla seguente procedura: Selezionare lo strumento Timbro clone dallo strumento ...

Come disinstallare e reinstallare Photoshop Lightroom - dummies

Come disinstallare e reinstallare Photoshop Lightroom - dummies

Se si nota un problema con Lightroom la prima volta che si avvia esso, qualcosa potrebbe essere andato storto durante il processo di installazione. Disinstallare e quindi reinstallare potrebbe essere tutto ciò che è necessario per correggere il problema. Il processo è diverso per ogni sistema operativo, quindi ecco i passaggi separati per ciascuno. Su Windows: Chiudi tutto ...

Fotografia For Dummies Cheat Sheet - dummies

Fotografia For Dummies Cheat Sheet - dummies

La fotografia è un hobby divertente e gratificante che può renderti molto popolare tra la gente nelle tue foto - o molto impopolare. Per ottenere il massimo da una fotocamera "inquadra e scatta", digitale o meno, la prima abilità da padroneggiare è bloccare l'attenzione. Puoi perfezionare le tue abilità fotografiche in modo che le tue foto siano ...

Scelta dell'editore

Agire per aumentare le emozioni edificanti - manichini

Agire per aumentare le emozioni edificanti - manichini

Al fine di elevare le tue emozioni, il primo passo è diventare consapevoli di quale emozioni che hai Diventa consapevole di ciò che ti innesca: cosa ti mette in agitazione e ti fa arrabbiare e ciò che ti rende molto eccitato. Un trigger sta guardando alcuni programmi televisivi e consente alle emozioni di questi programmi di permeare ...

Come le aziende ti convincono ad acquistare i loro prodotti - manichini

Come le aziende ti convincono ad acquistare i loro prodotti - manichini

Quasi tutti i media commerciali destinati alle donne ottengono la loro pubblicità entrate dalle industrie del cibo, della bellezza, della dieta e della moda. Solo l'industria della dieta stessa è un'impresa commerciale da 33 miliardi di dollari l'anno. E, naturalmente, queste industrie hanno bisogno di clienti in modo continuativo per continuare a avere successo. È nel loro interesse per ...

Come si forma l'immagine del corpo nella tua gioventù - dummies

Come si forma l'immagine del corpo nella tua gioventù - dummies

In generale, ciò che hai vissuto con la tua famiglia quando stavano crescendo ha avuto un effetto diretto sui pensieri e le sensazioni che hai avuto sul tuo corpo. Ripensa ai tuoi anni più giovani. Quanto attentamente le seguenti affermazioni descrivono la tua famiglia? Nessuno ha esercitato. L'auto è stata utilizzata anche per viaggi brevi. Cibo pesante e da ingrasso ...