Casa Finanza personale 9 Leggi di Data Mining - dummies

9 Leggi di Data Mining - dummies

Sommario:

Video: Safe and Sorry – Terrorism & Mass Surveillance 2025

Video: Safe and Sorry – Terrorism & Mass Surveillance 2025
Anonim

Ogni professione ha i suoi principi guida, idee che forniscono struttura e guida nel lavoro quotidiano. Il data mining non fa eccezione. Di seguito sono elencate nove idee fondamentali per guidarti mentre ti metti al lavoro e diventi un minatore di dati. Queste sono le 9 leggi del data mining, come originariamente dichiarato dal minatore pionieristico dei dati, Thomas Khabaza.

1a legge: obiettivi aziendali

Ecco la prima legge sull'estrazione dei dati, o "Legge sugli obiettivi aziendali": Gli obiettivi aziendali sono all'origine di ogni soluzione di data mining.

Esplora i dati per trovare informazioni che ti aiutino a gestire meglio l'azienda. Non dovrebbe questo essere il mantra di tutte le analisi dei dati aziendali? Certo che dovrebbe! Tuttavia, i minatori di dati alle prime armi si concentrano spesso sulla tecnologia e su altri dettagli, che possono essere interessanti, ma non allineati con le esigenze e gli obiettivi dei decisori esecutivi.

Devi sviluppare l'abitudine di identificare gli obiettivi di business prima di fare qualsiasi altra cosa e concentrarti su quegli obiettivi in ​​ogni fase del processo di data mining. È significativo che questa legge venga prima di tutto. Tutti dovrebbero capire che il data mining è un processo con uno scopo.

2a legge: Conoscenza del business

Ecco la seconda legge del data mining o "Business Knowledge Law": La conoscenza aziendale è fondamentale in ogni fase del processo di data mining.

Il data mining dà potere alle persone - uomini d'affari - che usano le loro conoscenze, esperienze e intuizioni aziendali, insieme ai metodi di data mining, per trovare significato nei dati.

Non devi essere un esperto di statistica per fare il data mining, ma devi sapere qualcosa su cosa significano i dati e come funziona l'azienda. Solo quando comprendi i dati e il problema che devi risolvere i processi di data mining ti aiutano a scoprire informazioni utili e a metterli in pratica.

3a legge: preparazione dei dati

Ecco la 3a legge sull'estrazione dei dati, o "Legge sulla preparazione dei dati": La preparazione dei dati è più della metà di ogni processo di data mining.

Gli statistici tradizionali hanno spesso l'opportunità di raccogliere nuovi dati per rispondere a domande di ricerca specifiche. Possono utilizzare processi rigorosi per pianificare esperimenti, progettare questionari di ricerca del sondaggio o altrimenti raccogliere dati di alta qualità che siano ben mirati a specifici obiettivi di ricerca. Dopo tutto ciò, passano ancora molto tempo a pulire e preparare i dati per l'analisi.

I minatori di dati, d'altra parte, quasi sempre devono lavorare con qualsiasi dato disponibile. Usano record aziendali esistenti, dati pubblici o dati che possono acquistare.È probabile che tutti i dati siano stati raccolti per scopi diversi dal data mining e senza alcun piano rigoroso o accurato processo di raccolta dei dati. Quindi i data minerers dedicano molto tempo alla preparazione dei dati.

4a legge: modello giusto

Ecco la quarta legge del data mining o "NFL-DM": Il modello giusto per una data applicazione può essere scoperto solo per esperimento.

Questa legge è anche nota con la stenografia NFL-DM, il che significa che non esiste un pranzo gratis per il minatore di dati.

Primo, cos'è una modella? È un'equazione che rappresenta uno schema osservato nei dati. Almeno, rappresenta il modello in modo approssimativo. I modelli matematici delle cose reali non sono mai perfetti! Questo è un dato di fatto, ed è altrettanto vero per i fisici nucleari quanto per i minatori di dati.

Nel data mining, i modelli vengono selezionati per tentativi ed errori. Sperimenterai con diversi tipi di modelli.

Quinta legge: schema

Ecco la quinta legge sull'estrazione dei dati: Ci sono sempre schemi.

Come minatore di dati, esplorerai i dati alla ricerca di modelli utili. In altre parole, cercherete relazioni significative tra le variabili nei dati. Comprendere queste relazioni fornisce una migliore comprensione del business e migliori previsioni su ciò che accadrà in futuro. Soprattutto, la comprensione dei modelli nei dati consente di influenzare ciò che accadrà in futuro.

Trovi sempre i modelli. I dati hanno sempre qualcosa da dirti. A volte, conferma che quello che hai fatto è giusto. Potrebbe non sembrare eccitante, ma almeno ti dice che sei stato sulla strada giusta. Altri giorni, i dati potrebbero dirti che le tue attuali pratiche commerciali non funzionano. È eccitante, e anche se potrebbe non essere piacevole nel breve periodo, conoscere la verità è un passo importante verso il miglioramento.

6a legge: Amplificazione

Ecco la sesta legge del data mining o "Insight Law": Il data mining amplifica la percezione nel dominio aziendale.

I metodi di data mining ti consentono di comprendere meglio la tua attività rispetto a quella che avresti potuto fare senza di essi. I metodi di data mining ti aiutano come una lente d'ingrandimento o un microscopio, consentendo la scoperta di effetti che sarebbero difficili o impossibili da rilevare attraverso la normale segnalazione.

Il data mining non è istantaneo.

La scoperta e l'apprendimento tramite il data mining è un processo interattivo. Farai scoperte, scoprirai un po 'da ognuna di esse e userai ciò che hai scoperto per agire. I risultati di ogni azione che proverai produrranno più dati e quei dati ti permetteranno di capire qualcosa di più. È un ciclo di scoperte e il ciclo continua finché continui a esplorare e sperimentare.

7th law: Prediction

Ecco la settima legge del data mining o "Prediction Law": La predizione aumenta le informazioni localmente per generalizzazione.

Il data mining ti aiuta a usare ciò che sai per fare previsioni migliori (o stime) di cose che non conosci. Il data mining utilizza i dati e i metodi di modellazione per sostituire le aspettative informali con stime guidate dai dati, coerenti e più accurate.

8 ° legge: valore

Ecco l'ottava legge sull'estrazione dei dati, o "Legge sul valore": Il valore dei risultati dell'estrazione dei dati non è determinato dall'accuratezza o dalla stabilità dei modelli predittivi.

I minatori di dati non si preoccupano della teoria. Come minatore di dati, potresti non conoscere nemmeno la teoria che sta dietro ai modelli statistici che utilizzi. Forse è altrettanto positivo, perché nel data mining, userai quei modelli in modi che non necessariamente si allineano con la teoria che li sta dietro.

Cercherete modelli che producano previsioni corrette (e userete test, piuttosto che teoria statistica, per giudicare ciò). Ma potresti essere più interessato ad altri problemi, ad esempio se il modello ha un senso del business, ti illumina su fattori predittivi inaspettati o è pratico da usare nel tuo posto di lavoro.

9th Law: Change

Ecco la 9a legge di Data Mining, o "Law of Change": Tutti i pattern sono soggetti a modifiche.

Il mondo sta cambiando continuamente. Il modello che ti dà grandi previsioni oggi potrebbe essere inutile domani. Questo è un dato di fatto per tutti gli analisti di dati, non solo per i data miner.

9 Leggi di Data Mining - dummies

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...