Casa Finanza personale Valori mancanti nei dati dell'utente - manichini

Valori mancanti nei dati dell'utente - manichini

Sommario:

Video: EM 64 Cerca il valore mancante con Excel Formula matrice e AGGREGA 2024

Video: EM 64 Cerca il valore mancante con Excel Formula matrice e AGGREGA 2024
Anonim

Uno dei problemi di dati più frequenti e laboriosi da affrontare è la mancanza di dati. I file possono essere incompleti perché i record sono stati eliminati o è stato riempito un dispositivo di archiviazione. O alcuni campi di dati potrebbero non contenere dati per alcuni record. Il primo di questi problemi può essere diagnosticato semplicemente verificando il conteggio dei record per i file. Il secondo problema è più difficile da affrontare.

Per dirla in termini semplici, quando trovi un campo contenente valori mancanti, hai due scelte:

  • Ignora.

  • Metti qualcosa nel campo.

Ignorare il problema

In alcuni casi, si può semplicemente trovare un singolo campo con un gran numero di valori mancanti. Se è così, la cosa più semplice da fare è ignorare il campo. Non includerlo nella tua analisi.

Un altro modo per ignorare il problema è ignorare il record. Basta cancellare il record contenente i dati mancanti. Questo può avere senso se ci sono solo pochi record canaglia. Ma se ci sono più campi di dati contenenti un numero significativo di valori mancanti, questo approccio può ridurre il numero di record a un livello inaccettabile.

Un'altra cosa a cui prestare attenzione prima di cancellare semplicemente i record è un segno qualsiasi di un pattern. Ad esempio, si supponga di analizzare un set di dati relativo ai saldi di carte di credito a livello nazionale. Potresti trovare un sacco di dischi che mostrano $ 0. 00 saldi (forse circa la metà dei record). Questo non è di per sé un'indicazione di dati mancanti. Tuttavia, se tutti i record, ad esempio, della California mostrano $ 0. 00 saldi, che indica un potenziale problema di valori mancanti. E non è uno che sarebbe risolto utilmente cancellando tutti i record dal più grande stato del paese. In questo caso, è probabilmente un problema di sistema e indica che dovrebbe essere creato un nuovo file.

In generale, l'eliminazione dei record è una soluzione facile, ma non ideale, ai problemi con valori mancanti. Se il problema è relativamente piccolo e non vi è alcun modello riconoscibile per le omissioni, allora può essere ok per gettare le registrazioni offensive e andare avanti. Ma spesso è giustificato un approccio più intellettuale.

Compilare i dati mancanti

Compilare i dati mancanti equivale a fare un'ipotesi plausibile su cosa sarebbe stato in quel campo. Ci sono buoni e cattivi modi per farlo. Un approccio semplice (ma negativo) è quello di sostituire i valori mancanti con la media di quelli non mancanti. Nei campi non numerici, potresti essere tentato di popolare i record mancanti con il valore più comune negli altri record (la modalità).

Questi approcci sono, purtroppo, ancora frequentemente utilizzati in alcune applicazioni aziendali.Ma sono considerati dagli statistici come idee sbagliate. Per prima cosa, l'intero punto di fare analisi statistiche è quello di trovare dati che differenziano un risultato da un altro. Sostituendo tutti i record mancanti con lo stesso valore, non hai differenziato nulla.

L'approccio più intellettuale è cercare di trovare un modo per prevedere in modo significativo quale valore deve essere inserito in ogni record che manca un valore. Ciò comporta la visualizzazione dei record completi e il tentativo di trovare indizi su quale potrebbe essere il valore mancante.

Supponiamo che stiate analizzando un file demografico per prevedere i probabili acquirenti di uno dei vostri prodotti. In questo file hai, tra gli altri campi, informazioni sullo stato civile, il numero di bambini e il numero di automobili. Per qualche motivo, il numero di campi di automazione non è presente in un terzo dei record.

Analizzando gli altri due campi - stato civile e numero di bambini - potresti scoprire alcuni modelli. Le persone singole tendono ad avere una macchina. Le persone sposate senza figli tendono ad avere due macchine. Le persone sposate con più di un figlio potrebbero avere più probabilità di avere tre auto. In questo modo, puoi indovinare i valori mancanti in un modo che differenzi effettivamente i record. Altro su questo approccio a venire.

Esiste un termine generale nelle statistiche e nell'elaborazione dei dati che fa riferimento a dati discutibili. Il termine rumoroso è usato per descrivere dati che sono inaffidabili, corrotti, o comunque meno pristine. I dati mancanti sono solo un esempio di ciò. Una descrizione dettagliata delle tecniche per la pulizia dei dati rumorosi in generale va oltre lo scopo di questo libro. In effetti, questa è un'area di ricerca attiva nella teoria statistica. Il fatto che tutto il rumore non sia facile da individuare come valori mancanti rende problematico affrontare.

Valori mancanti nei dati dell'utente - manichini

Scelta dell'editore

Scattare foto digitali con uno zoom ottico - dummy

Scattare foto digitali con uno zoom ottico - dummy

La fotocamera digitale potrebbe avere uno zoom ottico, che è un Obiettivo zoom attuale vecchio stile (al contrario di uno zoom digitale). Per utilizzare lo zoom ottico della fotocamera digitale per scatti ravvicinati, segui questi passaggi di preparazione delle immagini prima di attivare il pulsante o lo switch di zoom:

La reflex digitale e la sensibilità alla luce - dummy

La reflex digitale e la sensibilità alla luce - dummy

La tua reflex digitale ha un'opzione per determinare la sensibilità del sensore della fotocamera è alla luce. Le fotocamere digitali sono le stesse delle fotocamere a pellicola in quanto la sensibilità alla luce è determinata dalla valutazione ISO. Il vantaggio di una fotocamera digitale è che non è necessario cambiare pellicola per modificare le valutazioni ISO. Quando aumenti ...

Scatti grandangolari con obiettivi standard - manichini

Scatti grandangolari con obiettivi standard - manichini

Fotografia grandangolare con un angolo di campo maggiore rispetto alla lunghezza focale normale o teleobiettivo. A volte si percepiscono le foto come molto espansive. Altre volte, a malapena lo si nota. Dipende tutto dal soggetto e da come si inquadra la scena. Questa figura mostra una scena di terreni agricoli che è stata scattata utilizzando un Sony APS-C ...

Scelta dell'editore

Come usare il meta tag DESCRIPTION - dummies

Come usare il meta tag DESCRIPTION - dummies

I meta tag sono tag HTML speciali che puoi utilizzare per trasportare informazioni, che i browser o altri programmi possono quindi leggere. Quando i motori di ricerca di Internet furono creati per la prima volta, i webmaster includevano i meta tag nelle loro pagine per rendere più facile per i motori di ricerca determinare le pagine. I motori di ricerca hanno utilizzato anche questi meta ...

Come scrivere un grande tag Title Web Marketing - dummies

Come scrivere un grande tag Title Web Marketing - dummies

Scrivere un tag title è fondamentale per il successo del web marketing e coinvolge più che mettere le parole chiave prima. I motori di ricerca mostrano il tag parola chiave nella parte superiore di ciascun elemento nelle pagine dei risultati dei motori di ricerca (SERP). Un tag del titolo ben scritto potrebbe aumentare le probabilità che un cliente in ricerca faccia clic sul tuo annuncio. Se ...

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

In che modo Yahoo! Cerca negli elenchi di Internet e dei ranghi - dummies

Quando le persone effettuano ricerche sul Web utilizzando Yahoo! , ottengono una combinazione di risultati organici e pagati. Se lavori per una società più grande, potresti provare Yahoo! La ricerca inoltra Pro per ottenere un vantaggio rispetto alla concorrenza e puoi persino registrare il tuo sito con Yahoo! Directory. Yahoo! I risultati di ricerca organica ...

Scelta dell'editore

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

Di Spotify su ShareMyPlaylists. it Funzionalità del sito - dummies

ShareMyPlaylists (o SMP, in breve) è stato uno dei primi siti di condivisione di playlist Spotify e continua a innovare e offrire nuove funzionalità ai visitatori. Il mantra del sito è "Long Live the Mixtape", e qui troverai tantissime creazioni accuratamente compilate da migliaia di utenti. Dopo aver creato una playlist Spotify piena di ...

Spotify Unlimited - dummies

Spotify Unlimited - dummies

Spotify Unlimited è un modo brillante per ascoltare tutta la musica che vuoi senza limiti. È come una persona speciale che ti compra da mangiare e da bere tutta la sera per non doverti preoccupare del conto. È come essere in grado di dormire nel weekend senza preoccuparsi del lavoro o se ...

I generi di Spotify - dummies

I generi di Spotify - dummies

Che si tratti di hard rock, techno, pop, jazz, industrial, indie pop, folk , classico, heavy metal, valzer o qualsiasi altra cosa ti piaccia, Spotify ha il genere o il tipo di musica coperto. Puoi cercare i generi comuni da Spotify. Sebbene Spotify abbia pubblicato un elenco di quasi 1, 000 generi noti, non tutti saranno in grado di offrire ...