Casa Finanza personale Distribuzione di Analytics e Wrangling dati per convertire dati grezzi in informazioni utili - dummies

Distribuzione di Analytics e Wrangling dati per convertire dati grezzi in informazioni utili - dummies

Sommario:

Video: Developer Keynote: Get to the Fun Part (Cloud Next '19) 2025

Video: Developer Keynote: Get to the Fun Part (Cloud Next '19) 2025
Anonim

Trasformare i dati grezzi in informazioni utili è il primo passo nella progressione dai dati che hai raccolti per qualcosa che ti avvantaggia. Gli scienziati dei dati incentrati sul business utilizzano analisi dei dati per generare informazioni dai dati grezzi.

Identificazione dei tipi di analisi

Di seguito sono elencate, in ordine crescente di complessità, i quattro tipi di analisi dei dati che è più probabile incontrare:

  • Analisi descrittiva: Questo tipo di analisi risponde alla domanda: "Che cosa è successo? "L'analisi descrittiva si basa su dati storici e attuali. Un analista di business o uno scienziato di dati business-centric basa la business intelligence moderna sull'analisi descrittiva.

  • Analisi diagnostica: Si utilizza questo tipo di analisi per trovare le risposte alla domanda, "perché è successo qualcosa in particolare? "O" cosa è andato storto? "Le analisi diagnostiche sono utili per dedurre e inferire il successo o il fallimento di sottocomponenti di qualsiasi iniziativa guidata dai dati.

  • Analisi predittiva: Sebbene questo tipo di analisi sia basato su dati storici e attuali, l'analisi predittiva fa un passo in più rispetto all'analisi descrittiva. L'analisi predittiva implica la costruzione e l'analisi di modelli complessi al fine di prevedere un evento o una tendenza futura. In un contesto aziendale, queste analisi sarebbero eseguite dallo scienziato dei dati business-centric.

  • Analisi prescrittiva: Questo tipo di analisi mira a ottimizzare processi, strutture e sistemi attraverso un'azione informata basata su analisi predittiva, che essenzialmente ti dice cosa dovresti fare basandoti su una stima informata di ciò che accadrà. Sia gli analisti di business che i ricercatori di dati business-centric possono generare analisi prescrittive, ma i loro metodi e fonti di dati differiscono.

Idealmente, un'azienda dovrebbe impegnarsi in tutti e quattro i tipi di analisi dei dati, ma l'analisi prescrittiva è il mezzo più diretto ed efficace con il quale generare valore dalle informazioni dei dati.

Identificazione delle sfide comuni in analytics

Le analisi comunemente pongono almeno due sfide nell'azienda aziendale. Innanzitutto, le organizzazioni spesso hanno difficoltà a trovare nuovi assunti con set di competenze specifiche che includono l'analisi. In secondo luogo, anche gli esperti analisti hanno spesso difficoltà a comunicare informazioni complesse in un modo comprensibile per i responsabili delle decisioni del management.

Per superare queste sfide, l'organizzazione deve creare e coltivare una cultura che valorizzi e accetti i prodotti di analisi. L'azienda deve lavorare per educare tutti i livelli dell'organizzazione, in modo tale che la gestione abbia un concetto base di analisi e il successo che può essere ottenuto implementandoli.

Al contrario, gli scienziati dei dati incentrati sul business devono avere una solida conoscenza del business in generale e, in particolare, una solida conoscenza del business in questione. Una solida conoscenza del business è uno dei tre requisiti principali di qualsiasi scienziato di dati business-centrico: gli altri due sono un forte acume di codice e forti capacità di analisi quantitativa tramite modelli matematici e statistici.

Combattere i dati grezzi con le informazioni utilizzabili

La suddivisione dei dati è un'altra parte importante del lavoro necessario per convertire i dati in analisi. Per creare analisi dai dati grezzi, è quasi sempre necessario utilizzare wrangling - i processi e le procedure che utilizzi per pulire e convertire i dati da un formato e struttura a un altro in modo che i dati siano accurati e nel formato strumenti di analisi e script richiedono per il consumo.

Il seguente elenco evidenzia alcune delle pratiche e dei problemi più rilevanti per la discussione dei dati:

  • Estrazione dati: Lo scienziato dei dati business-centric deve innanzitutto identificare quali set di dati sono rilevanti per il problema in questione, quindi estrarre quantità sufficienti dei dati necessari per risolvere il problema. (Questo processo di estrazione è comunemente chiamato data mining.)

  • Data munging: Il data munging comporta la pulizia dei dati grezzi estratti attraverso il data mining, quindi la conversione in un formato che consente un consumo più conveniente dei dati. (Mung ha iniziato la vita come un processo distruttivo, dove converti qualcosa riconoscibile in qualcosa che era irriconoscibile, quindi la frase Mash Until No Good, o MUNG.)

  • Governance dei dati: Gli standard di governance dei dati sono standard utilizzati come misura di controllo della qualità per garantire che le fonti di dati manuali e automatizzate siano conformi agli standard dei dati del modello in questione. Gli standard di governance dei dati devono essere applicati in modo tale che i dati siano nella giusta granularità quando sono archiviati e resi pronti per l'uso.

    Granularità è una misura del livello di dettaglio di un set di dati. La granularità dei dati è determinata dalla dimensione relativa dei sottogruppi in cui sono suddivisi i dati.

  • Architettura dei dati: L'architettura IT è la chiave. Se i tuoi dati sono isolati in repository separati e fissi - quei famigerati silos di dati tutti si lamentano - allora è disponibile solo a poche persone all'interno di una particolare linea di business. Le strutture dati silenziate determinano scenari in cui la maggior parte dei dati di un'organizzazione non è semplicemente disponibile per l'utilizzo da parte dell'organizzazione in generale. (Inutile dire che le strutture di dati silenziate sono incredibilmente dispendiose e inefficienti.)

Se il tuo obiettivo è quello di ricavare il maggior valore e intuizione dai dati aziendali della tua organizzazione, devi assicurarti che i dati siano archiviati in un data warehouse centrale e non in sili separati.

Distribuzione di Analytics e Wrangling dati per convertire dati grezzi in informazioni utili - dummies

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...