Sommario:
- Identificazione dei tipi di analisi
- Identificazione delle sfide comuni in analytics
- Combattere i dati grezzi con le informazioni utilizzabili
Video: Developer Keynote: Get to the Fun Part (Cloud Next '19) 2024
Trasformare i dati grezzi in informazioni utili è il primo passo nella progressione dai dati che hai raccolti per qualcosa che ti avvantaggia. Gli scienziati dei dati incentrati sul business utilizzano analisi dei dati per generare informazioni dai dati grezzi.
Identificazione dei tipi di analisi
Di seguito sono elencate, in ordine crescente di complessità, i quattro tipi di analisi dei dati che è più probabile incontrare:
-
Analisi descrittiva: Questo tipo di analisi risponde alla domanda: "Che cosa è successo? "L'analisi descrittiva si basa su dati storici e attuali. Un analista di business o uno scienziato di dati business-centric basa la business intelligence moderna sull'analisi descrittiva.
-
Analisi diagnostica: Si utilizza questo tipo di analisi per trovare le risposte alla domanda, "perché è successo qualcosa in particolare? "O" cosa è andato storto? "Le analisi diagnostiche sono utili per dedurre e inferire il successo o il fallimento di sottocomponenti di qualsiasi iniziativa guidata dai dati.
-
Analisi predittiva: Sebbene questo tipo di analisi sia basato su dati storici e attuali, l'analisi predittiva fa un passo in più rispetto all'analisi descrittiva. L'analisi predittiva implica la costruzione e l'analisi di modelli complessi al fine di prevedere un evento o una tendenza futura. In un contesto aziendale, queste analisi sarebbero eseguite dallo scienziato dei dati business-centric.
-
Analisi prescrittiva: Questo tipo di analisi mira a ottimizzare processi, strutture e sistemi attraverso un'azione informata basata su analisi predittiva, che essenzialmente ti dice cosa dovresti fare basandoti su una stima informata di ciò che accadrà. Sia gli analisti di business che i ricercatori di dati business-centric possono generare analisi prescrittive, ma i loro metodi e fonti di dati differiscono.
Idealmente, un'azienda dovrebbe impegnarsi in tutti e quattro i tipi di analisi dei dati, ma l'analisi prescrittiva è il mezzo più diretto ed efficace con il quale generare valore dalle informazioni dei dati.
Identificazione delle sfide comuni in analytics
Le analisi comunemente pongono almeno due sfide nell'azienda aziendale. Innanzitutto, le organizzazioni spesso hanno difficoltà a trovare nuovi assunti con set di competenze specifiche che includono l'analisi. In secondo luogo, anche gli esperti analisti hanno spesso difficoltà a comunicare informazioni complesse in un modo comprensibile per i responsabili delle decisioni del management.
Per superare queste sfide, l'organizzazione deve creare e coltivare una cultura che valorizzi e accetti i prodotti di analisi. L'azienda deve lavorare per educare tutti i livelli dell'organizzazione, in modo tale che la gestione abbia un concetto base di analisi e il successo che può essere ottenuto implementandoli.
Al contrario, gli scienziati dei dati incentrati sul business devono avere una solida conoscenza del business in generale e, in particolare, una solida conoscenza del business in questione. Una solida conoscenza del business è uno dei tre requisiti principali di qualsiasi scienziato di dati business-centrico: gli altri due sono un forte acume di codice e forti capacità di analisi quantitativa tramite modelli matematici e statistici.
Combattere i dati grezzi con le informazioni utilizzabili
La suddivisione dei dati è un'altra parte importante del lavoro necessario per convertire i dati in analisi. Per creare analisi dai dati grezzi, è quasi sempre necessario utilizzare wrangling - i processi e le procedure che utilizzi per pulire e convertire i dati da un formato e struttura a un altro in modo che i dati siano accurati e nel formato strumenti di analisi e script richiedono per il consumo.
Il seguente elenco evidenzia alcune delle pratiche e dei problemi più rilevanti per la discussione dei dati:
-
Estrazione dati: Lo scienziato dei dati business-centric deve innanzitutto identificare quali set di dati sono rilevanti per il problema in questione, quindi estrarre quantità sufficienti dei dati necessari per risolvere il problema. (Questo processo di estrazione è comunemente chiamato data mining.)
-
Data munging: Il data munging comporta la pulizia dei dati grezzi estratti attraverso il data mining, quindi la conversione in un formato che consente un consumo più conveniente dei dati. (Mung ha iniziato la vita come un processo distruttivo, dove converti qualcosa riconoscibile in qualcosa che era irriconoscibile, quindi la frase Mash Until No Good, o MUNG.)
-
Governance dei dati: Gli standard di governance dei dati sono standard utilizzati come misura di controllo della qualità per garantire che le fonti di dati manuali e automatizzate siano conformi agli standard dei dati del modello in questione. Gli standard di governance dei dati devono essere applicati in modo tale che i dati siano nella giusta granularità quando sono archiviati e resi pronti per l'uso.
Granularità è una misura del livello di dettaglio di un set di dati. La granularità dei dati è determinata dalla dimensione relativa dei sottogruppi in cui sono suddivisi i dati.
-
Architettura dei dati: L'architettura IT è la chiave. Se i tuoi dati sono isolati in repository separati e fissi - quei famigerati silos di dati tutti si lamentano - allora è disponibile solo a poche persone all'interno di una particolare linea di business. Le strutture dati silenziate determinano scenari in cui la maggior parte dei dati di un'organizzazione non è semplicemente disponibile per l'utilizzo da parte dell'organizzazione in generale. (Inutile dire che le strutture di dati silenziate sono incredibilmente dispendiose e inefficienti.)
Se il tuo obiettivo è quello di ricavare il maggior valore e intuizione dai dati aziendali della tua organizzazione, devi assicurarti che i dati siano archiviati in un data warehouse centrale e non in sili separati.