Casa Finanza personale Come visualizzare i dati grezzi di Predictive Analysis - dummies

Come visualizzare i dati grezzi di Predictive Analysis - dummies

Sommario:

Video: Visualizzare, riorganizzare e ripulire i dati 2025

Video: Visualizzare, riorganizzare e ripulire i dati 2025
Anonim

Un'immagine vale più di mille parole, specialmente quando si sta tentando di ottenere una buona gestione dei dati di analisi predittiva. Durante la fase di pre-elaborazione, mentre stai preparando i tuoi dati, è prassi comune visualizzare ciò che hai in mano prima di continuare con il passaggio successivo.

Si inizia utilizzando un foglio di calcolo come Microsoft Excel per creare una matrice di dati, che consiste di dati candidati caratteristiche (anche denominati attributi ). Diversi pacchetti software di business intelligence (come Tableau) possono fornire una panoramica preliminare dei dati a cui si sta applicando l'analisi.

Come utilizzare le visualizzazioni tabulari per l'analisi predittiva

Le tabelle sono la rappresentazione pittorica dei dati più semplice e basilare. Le tabelle (anche note come fogli di calcolo ) sono costituite da righe e colonne, che corrispondono, rispettivamente, agli oggetti e ai loro attributi menzionati in precedenza come componenti dei dati. Ad esempio, considera i dati dei social network online. Un oggetto dati potrebbe rappresentare un utente. Gli attributi di un utente (oggetto dati) possono essere intestazioni di colonne: genere, codice postale o data di nascita.

Le celle in una tabella rappresentano valori. La visualizzazione nelle tabelle consente di individuare facilmente i valori degli attributi mancanti degli oggetti dati.

Le tabelle possono anche fornire la flessibilità di aggiungere nuovi attributi che sono combinazioni di altri attributi. Ad esempio, nei dati dei social network, è possibile aggiungere un'altra colonna denominata Age, che può essere facilmente calcolata, come attributo derivato, dall'attributo Date of Birth esistente. I dati tabulari sui social network mostrano una nuova colonna, Età, creata da un'altra colonna esistente (Data di nascita).

I grafici a barre utilizzati nell'analisi predittiva

I grafici a barre possono essere utilizzati per individuare picchi o anomalie nei dati. Puoi usarlo per ogni attributo per visualizzare rapidamente i valori minimi e massimi. I grafici a barre possono anche essere utilizzati per iniziare una discussione su come normalizzare i dati.

Normalizzazione è la regolazione di alcuni o tutti i valori di attributo su una scala che rende i dati più utilizzabili. Ad esempio, puoi facilmente vedere che c'è un errore nei dati: la barra Età su un record è negativa. Quell'anomalia è più facilmente rappresentata da un grafico a barre che da una tabella di dati.

Nozioni di base sui grafici a torta per l'analisi predittiva

I grafici a torta vengono utilizzati principalmente per mostrare le percentuali. Possono facilmente illustrare la distribuzione di diversi articoli e evidenziare i più dominanti. I dati grezzi del social network sono rappresentati secondo l'attributo Age.Si noti che il grafico mostra non solo una chiara distribuzione dei maschi rispetto alle femmine, ma anche un probabile errore: R come valore per il genere di genere eventualmente creato quando i dati sono stati raccolti.

Come utilizzare i grafici grafici per l'analisi predittiva

La teoria dei grafi fornisce una serie di potenti algoritmi in grado di analizzare i dati strutturati e rappresentati come un grafico. In informatica, un grafico è la struttura dei dati, un modo per organizzare i dati che rappresentano le relazioni tra coppie di oggetti dati. Un grafico è costituito da due parti principali:

  • Vertici, noti anche come nodi

  • Bordi, che collegano coppie di nodi

I bordi possono essere orientati (disegnati come frecce) e possono avere pesi. Puoi decidere di posizionare un bordo (freccia) tra due nodi (cerchi) - in questo caso, i membri del social network che sono collegati ad altri membri come amici:

La direzione della freccia indica chi "amici" quali primi o chi inizia le interazioni il più delle volte.

Nozioni di base sulle nuvole di parole per l'analisi predittiva

Considera un elenco di parole o concetti disposti come un word cloud - una rappresentazione grafica di tutte le parole nell'elenco, che mostra la dimensione di ogni parola come proporzionale a una metrica specificata dall'utente. Ad esempio, se si dispone di un foglio di calcolo di parole e occorrenze e si desidera identificare le parole più importanti, provare una nuvola di parole.

Le nuvole di parole funzionano perché i dati della maggior parte delle organizzazioni sono di testo; un esempio comune è l'uso dei termini di tendenza da parte di Twitter. Ogni termine in questa rappresentazione ha un peso che influenza le sue dimensioni come un indicatore della sua importanza relativa.

Un modo per definire che il peso potrebbe essere il numero di volte in cui una parola appare nella tua collezione di dati. Più frequentemente appare una parola, più "pesante" è il suo peso - e più grande appare nella nuvola.

Come utilizzare la rappresentazione degli uccelli floccati per l'analisi predittiva

Il comportamento naturale del floccaggio in generale è un sistema auto-organizzante in cui gli oggetti (in particolare, gli esseri viventi) tendono a comportarsi in accordo con (a) l'ambiente a cui appartengono (b) le loro risposte ad altri oggetti esistenti. Il comportamento floccaggio delle società naturali come quelle di api, mosche, uccelli, pesci e formiche - o, peraltro, le persone - è anche noto come intelligenza di scia .

Gli uccelli seguono le regole naturali quando si comportano come un gregge. I compagni di gruppo sono uccelli situati a una certa distanza l'uno dall'altro; quegli uccelli sono considerati simili. Ogni uccello si muove secondo le tre regole principali che organizzano il comportamento di floccaggio.

  • Separazione: I compagni di stallo non devono scontrarsi tra loro.

  • Allineamento: I compagni di campo si muovono nella stessa direzione media dei loro vicini.

  • Coesione: I compagni di floccaggio si muovono in base alla posizione o alla posizione media dei loro compagni di gregge.

La modellazione di queste tre regole può consentire a un sistema analitico di simulare i comportamenti di floccaggio. Usando il comportamento naturale auto-organizzato degli uccelli che si affollano, puoi convertire un semplice foglio di calcolo in una visualizzazione.La chiave è definire la nozione di similarità come parte dei tuoi dati. Inizia con un paio di domande:

  • Cosa rende simili due oggetti dati nei tuoi dati?

  • Quali attributi possono guidare al meglio la somiglianza tra due record di dati?

Ad esempio, nei dati dei social network, i record di dati rappresentano singoli utenti; gli attributi che li descrivono possono includere Età, Codice postale, Stato delle relazioni, Elenco di amici, Numero di amici, Abitudini, Eventi

Come visualizzare i dati grezzi di Predictive Analysis - dummies

Scelta dell'editore

Vantaggi di base della rete - manichini

Vantaggi di base della rete - manichini

Se la verità viene detta, le reti di computer sono un problema da impostare. Perché i vantaggi di avere una rete rendono la pena di crearne uno utile. Non è necessario essere un dottorato di ricerca per comprendere i vantaggi del networking. Le reti riguardano esclusivamente la condivisione. Nello specifico, le reti riguardano la condivisione di tre elementi: informazioni, risorse, ...

Biometria L'accettazione, la privacy e la legge - manichini

Biometria L'accettazione, la privacy e la legge - manichini

La tecnologia biometrica non è affatto universalmente accettata da tutti gli utenti. Ci sono una serie di considerazioni sociali e legali che danno ad ogni organizzazione una pausa prima di fare il salto a capofitto nell'implementazione di un sistema biometrico. Le persone sono più a loro agio con i sistemi di raccolta biometrici che sono i meno intrusivi. Scanner per retina e nasi elettronici sono ...

Biometria Nozioni di base - manichini

Biometria Nozioni di base - manichini

La biometria non è roba da fantascienza. Puoi trovare una dozzina di modi più o meno efficaci per utilizzare la biometria per identificare qualcuno, ognuno dei quali si divide in due classi: la biometria fisiologica misura una parte specifica della struttura o della forma di una porzione del corpo di un soggetto. La biometria comportamentale è più interessata a come ...

Scelta dell'editore

Come creare un nuovo dizionario personalizzato in Excel 2007 - dummies

Come creare un nuovo dizionario personalizzato in Excel 2007 - dummies

In Excel 2007, è possibile creare dizionari personalizzati da utilizzare quando si esegue il controllo ortografico dei fogli di lavoro. Utilizzare il pulsante Aggiungi al dizionario nella finestra di dialogo Controllo ortografico per aggiungere parole sconosciute a un dizionario personalizzato. Per impostazione predefinita, Excel aggiunge queste parole a un file dizionario personalizzato denominato CUSTOM. DIC, ma è possibile creare una nuova personalizzazione ...

Come creare un componente aggiuntivo da un file di cartella di lavoro Excel Excel normale in VBA - modi di dire

Come creare un componente aggiuntivo da un file di cartella di lavoro Excel Excel normale in VBA - modi di dire

Sebbene sia possibile convertire qualsiasi cartella di lavoro di Excel in un componente aggiuntivo, non tutte le cartelle di lavoro traggono vantaggio da questa conversione. Una cartella di lavoro senza macro rende un componente aggiuntivo inutile. In effetti, gli unici tipi di cartelle di lavoro che traggono vantaggio dall'essere convertiti in un componente aggiuntivo sono quelli con macro. Ad esempio, una cartella di lavoro costituita da macro generiche (Sub ...

Come creare una nuova cartella di lavoro in Excel 2010 - dummy

Come creare una nuova cartella di lavoro in Excel 2010 - dummy

Se si lavora in Microsoft Excel 2010 e vuoi iniziare a lavorare in un nuovo file di cartella di lavoro di Excel, puoi facilmente creare una nuova cartella di lavoro. Per fare ciò, puoi usare un comando nella scheda File o una scorciatoia da tastiera. Fare clic sulla scheda File. Excel visualizza la visualizzazione Backstage, in cui è possibile accedere ai comandi relativi ai file. ...

Scelta dell'editore

Usa lo strumento Gomma in Adobe Illustrator CS5 - manichini

Usa lo strumento Gomma in Adobe Illustrator CS5 - manichini

Adobe Illustrator Creative Suite 5 (Adobe CS5) Illustrator è utilizzato per rimuovere rapidamente aree di grafica con la stessa facilità con cui si cancellano i pixel in Photoshop, accarezzando con il mouse su qualsiasi forma o gruppo di forme. Facendo doppio clic sullo strumento Gomma, è possibile definire il diametro, l'angolo e la rotondità della gomma. Se stai usando un ...

Trasforma gli strumenti in Adobe Illustrator CS5 - dummies

Trasforma gli strumenti in Adobe Illustrator CS5 - dummies

I più popolari strumenti di trasformazione in Adobe Creative Suite 5 (Adobe CS5) Illustrator - Rifletti, scala, inclina, rimodella e Trasformazione libera: sono facili da usare e modificano rapidamente la tua illustrazione. Lo strumento Rifletti Niente è simmetrico, giusto? Forse no, ma gli oggetti non creati simmetricamente in Illustrator possono sembrare off-kilter. Utilizzando lo strumento Rifletti, si ...

Quando utilizzare Adobe CS5 Illustrator - dummies

Quando utilizzare Adobe CS5 Illustrator - dummies

Utilizzando Adobe Creative Suite 5 (Adobe CS5) Illustrator anziché Photoshop , ottieni diversi benefici. Potresti aver sentito che Illustrator è migliore per la grafica vettoriale, ma perché e che altro porta? Illustrator può salvare ed esportare immagini nella maggior parte dei formati di file. Scegliendo di salvare o esportare, è possibile creare un ...