Casa Finanza personale 9 Leggi di Data Mining - dummies

9 Leggi di Data Mining - dummies

Sommario:

Video: Safe and Sorry – Terrorism & Mass Surveillance 2025

Video: Safe and Sorry – Terrorism & Mass Surveillance 2025
Anonim

Ogni professione ha i suoi principi guida, idee che forniscono struttura e guida nel lavoro quotidiano. Il data mining non fa eccezione. Di seguito sono elencate nove idee fondamentali per guidarti mentre ti metti al lavoro e diventi un minatore di dati. Queste sono le 9 leggi del data mining, come originariamente dichiarato dal minatore pionieristico dei dati, Thomas Khabaza.

1a legge: obiettivi aziendali

Ecco la prima legge sull'estrazione dei dati, o "Legge sugli obiettivi aziendali": Gli obiettivi aziendali sono all'origine di ogni soluzione di data mining.

Esplora i dati per trovare informazioni che ti aiutino a gestire meglio l'azienda. Non dovrebbe questo essere il mantra di tutte le analisi dei dati aziendali? Certo che dovrebbe! Tuttavia, i minatori di dati alle prime armi si concentrano spesso sulla tecnologia e su altri dettagli, che possono essere interessanti, ma non allineati con le esigenze e gli obiettivi dei decisori esecutivi.

Devi sviluppare l'abitudine di identificare gli obiettivi di business prima di fare qualsiasi altra cosa e concentrarti su quegli obiettivi in ​​ogni fase del processo di data mining. È significativo che questa legge venga prima di tutto. Tutti dovrebbero capire che il data mining è un processo con uno scopo.

2a legge: Conoscenza del business

Ecco la seconda legge del data mining o "Business Knowledge Law": La conoscenza aziendale è fondamentale in ogni fase del processo di data mining.

Il data mining dà potere alle persone - uomini d'affari - che usano le loro conoscenze, esperienze e intuizioni aziendali, insieme ai metodi di data mining, per trovare significato nei dati.

Non devi essere un esperto di statistica per fare il data mining, ma devi sapere qualcosa su cosa significano i dati e come funziona l'azienda. Solo quando comprendi i dati e il problema che devi risolvere i processi di data mining ti aiutano a scoprire informazioni utili e a metterli in pratica.

3a legge: preparazione dei dati

Ecco la 3a legge sull'estrazione dei dati, o "Legge sulla preparazione dei dati": La preparazione dei dati è più della metà di ogni processo di data mining.

Gli statistici tradizionali hanno spesso l'opportunità di raccogliere nuovi dati per rispondere a domande di ricerca specifiche. Possono utilizzare processi rigorosi per pianificare esperimenti, progettare questionari di ricerca del sondaggio o altrimenti raccogliere dati di alta qualità che siano ben mirati a specifici obiettivi di ricerca. Dopo tutto ciò, passano ancora molto tempo a pulire e preparare i dati per l'analisi.

I minatori di dati, d'altra parte, quasi sempre devono lavorare con qualsiasi dato disponibile. Usano record aziendali esistenti, dati pubblici o dati che possono acquistare.È probabile che tutti i dati siano stati raccolti per scopi diversi dal data mining e senza alcun piano rigoroso o accurato processo di raccolta dei dati. Quindi i data minerers dedicano molto tempo alla preparazione dei dati.

4a legge: modello giusto

Ecco la quarta legge del data mining o "NFL-DM": Il modello giusto per una data applicazione può essere scoperto solo per esperimento.

Questa legge è anche nota con la stenografia NFL-DM, il che significa che non esiste un pranzo gratis per il minatore di dati.

Primo, cos'è una modella? È un'equazione che rappresenta uno schema osservato nei dati. Almeno, rappresenta il modello in modo approssimativo. I modelli matematici delle cose reali non sono mai perfetti! Questo è un dato di fatto, ed è altrettanto vero per i fisici nucleari quanto per i minatori di dati.

Nel data mining, i modelli vengono selezionati per tentativi ed errori. Sperimenterai con diversi tipi di modelli.

Quinta legge: schema

Ecco la quinta legge sull'estrazione dei dati: Ci sono sempre schemi.

Come minatore di dati, esplorerai i dati alla ricerca di modelli utili. In altre parole, cercherete relazioni significative tra le variabili nei dati. Comprendere queste relazioni fornisce una migliore comprensione del business e migliori previsioni su ciò che accadrà in futuro. Soprattutto, la comprensione dei modelli nei dati consente di influenzare ciò che accadrà in futuro.

Trovi sempre i modelli. I dati hanno sempre qualcosa da dirti. A volte, conferma che quello che hai fatto è giusto. Potrebbe non sembrare eccitante, ma almeno ti dice che sei stato sulla strada giusta. Altri giorni, i dati potrebbero dirti che le tue attuali pratiche commerciali non funzionano. È eccitante, e anche se potrebbe non essere piacevole nel breve periodo, conoscere la verità è un passo importante verso il miglioramento.

6a legge: Amplificazione

Ecco la sesta legge del data mining o "Insight Law": Il data mining amplifica la percezione nel dominio aziendale.

I metodi di data mining ti consentono di comprendere meglio la tua attività rispetto a quella che avresti potuto fare senza di essi. I metodi di data mining ti aiutano come una lente d'ingrandimento o un microscopio, consentendo la scoperta di effetti che sarebbero difficili o impossibili da rilevare attraverso la normale segnalazione.

Il data mining non è istantaneo.

La scoperta e l'apprendimento tramite il data mining è un processo interattivo. Farai scoperte, scoprirai un po 'da ognuna di esse e userai ciò che hai scoperto per agire. I risultati di ogni azione che proverai produrranno più dati e quei dati ti permetteranno di capire qualcosa di più. È un ciclo di scoperte e il ciclo continua finché continui a esplorare e sperimentare.

7th law: Prediction

Ecco la settima legge del data mining o "Prediction Law": La predizione aumenta le informazioni localmente per generalizzazione.

Il data mining ti aiuta a usare ciò che sai per fare previsioni migliori (o stime) di cose che non conosci. Il data mining utilizza i dati e i metodi di modellazione per sostituire le aspettative informali con stime guidate dai dati, coerenti e più accurate.

8 ° legge: valore

Ecco l'ottava legge sull'estrazione dei dati, o "Legge sul valore": Il valore dei risultati dell'estrazione dei dati non è determinato dall'accuratezza o dalla stabilità dei modelli predittivi.

I minatori di dati non si preoccupano della teoria. Come minatore di dati, potresti non conoscere nemmeno la teoria che sta dietro ai modelli statistici che utilizzi. Forse è altrettanto positivo, perché nel data mining, userai quei modelli in modi che non necessariamente si allineano con la teoria che li sta dietro.

Cercherete modelli che producano previsioni corrette (e userete test, piuttosto che teoria statistica, per giudicare ciò). Ma potresti essere più interessato ad altri problemi, ad esempio se il modello ha un senso del business, ti illumina su fattori predittivi inaspettati o è pratico da usare nel tuo posto di lavoro.

9th Law: Change

Ecco la 9a legge di Data Mining, o "Law of Change": Tutti i pattern sono soggetti a modifiche.

Il mondo sta cambiando continuamente. Il modello che ti dà grandi previsioni oggi potrebbe essere inutile domani. Questo è un dato di fatto per tutti gli analisti di dati, non solo per i data miner.

9 Leggi di Data Mining - dummies

Scelta dell'editore

Come salvare le immagini in un file immagine in R - dummies

Come salvare le immagini in un file immagine in R - dummies

Se vuoi pubblicare le tue risultati, è necessario salvare la trama in un file in R e quindi importare questo file grafico in un altro documento. Tuttavia, per la maggior parte del tempo, potresti semplicemente voler utilizzare la grafica R in modo interattivo per esplorare i tuoi dati. Per salvare un grafico su un'immagine ...

Come cercare più parole in R - dummies

Come cercare più parole in R - dummies

Quando si lavora con il testo in R, potrebbe essere necessario per trovare parole o motivi all'interno del testo. Immagina di avere una lista degli stati negli Stati Uniti e vuoi scoprire quali nomi di stato consistono in due parole. Per trovare sottostringhe, è possibile utilizzare la funzione grep (), che prende due argomenti essenziali: ...

Come cercare le singole parole in R - dummies

Come cercare le singole parole in R - dummies

Quando lavori con il testo, spesso tu può risolvere i problemi se riesci a trovare parole o motivi all'interno del testo. R rende questo facile da fare. Immagina di avere una lista degli stati negli Stati Uniti e vuoi scoprire quale di questi stati contiene la parola Nuovo. Per indagare su questo ...

Scelta dell'editore

Come calcolare le detrazioni e i crediti di imposta sugli investimenti immobiliari per l'esame di licenza immobiliare

Come calcolare le detrazioni e i crediti di imposta sugli investimenti immobiliari per l'esame di licenza immobiliare

Una detrazione fiscale è qualcosa che puoi vedere nell'esame di licenza immobiliare che puoi detrarre dal reddito di un investimento immobiliare per ridurre le tasse. Un credito d'imposta è qualcosa che puoi detrarre dalle tasse dovute. I governi federali e talvolta statali creano programmi che consentono crediti d'imposta o detrazioni per ...

Fattori economici che influenzano il valore per l'esame di licenza immobiliare - dummies

Fattori economici che influenzano il valore per l'esame di licenza immobiliare - dummies

Valore doesn ' semplicemente succede; le persone devono crearlo. La maggior parte di queste azioni personali che saranno trattate durante l'esame di licenza immobiliare, di solito chiamate influenze economiche, non sono altro che normali comportamenti umani. Il test pone due tipi di domande su questi principi o fattori economici. Vedrai domande sulle definizioni e ...

Come calcolare le aliquote fiscali per l'esame di licenza immobiliare - dummy

Come calcolare le aliquote fiscali per l'esame di licenza immobiliare - dummy

Pur calcolando la tassa le tariffe non sono qualcosa che devi sapere esattamente come fare per l'esame di licenza immobiliare, è qualcosa che devi capire in generale per rispondere a domande di non-matematica sul processo. Sapere come calcolare le tasse non è una cosa brutta da sapere, perché probabilmente si pagano le tasse di proprietà e ...

Scelta dell'editore

Suggerimenti per la registrazione Regole di gioco logiche sull'LSAT - manichini

Suggerimenti per la registrazione Regole di gioco logiche sull'LSAT - manichini

La maggior parte dei giochi di logica sull'LSAT hanno tre, quattro o cinque condizioni o regole che limitano il modo in cui giochi con i pezzi. Per ordinare i giochi, le restrizioni forniscono indizi su come i pezzi possono essere posizionati in relazione l'uno con l'altro. I tipi comuni di regole di ordinazione sono obiettivi, distanziatori e arrangiatori. Regole di destinazione I bersagli danno ...

Come gestire il tuo tempo con saggezza sul TASC - dummies

Come gestire il tuo tempo con saggezza sul TASC - dummies

Perché ogni sezione del TASC, oppure Prova l'esame di completamento secondario, ha un limite di tempo, vorrai essere consapevole di quanto tempo è passato mentre stai facendo il test. Un modo per gestire efficacemente il tuo tempo è semplicemente indossando un orologio. I centri di test potrebbero non avere sempre un orologio disponibile e ...

Rendendo più semplice il giorno di prova SSAT o ISEE - manichini

Rendendo più semplice il giorno di prova SSAT o ISEE - manichini

Non è possibile effettuare SSAT o ISEE più facile, ma puoi iniziare la giornata di test correttamente e renderlo più semplice e meno stressante, il che può portare a risultati migliori durante l'esame di ammissione. Ecco alcuni suggerimenti da tenere a mente al giorno del test SSAT o ISEE: riposati molto. La ...