Sommario:
- 1a legge: obiettivi aziendali
- 2a legge: Conoscenza del business
- 3a legge: preparazione dei dati
- 4a legge: modello giusto
- Quinta legge: schema
- 6a legge: Amplificazione
- 7th law: Prediction
- 8 ° legge: valore
- 9th Law: Change
Video: Safe and Sorry – Terrorism & Mass Surveillance 2024
Ogni professione ha i suoi principi guida, idee che forniscono struttura e guida nel lavoro quotidiano. Il data mining non fa eccezione. Di seguito sono elencate nove idee fondamentali per guidarti mentre ti metti al lavoro e diventi un minatore di dati. Queste sono le 9 leggi del data mining, come originariamente dichiarato dal minatore pionieristico dei dati, Thomas Khabaza.
1a legge: obiettivi aziendali
Ecco la prima legge sull'estrazione dei dati, o "Legge sugli obiettivi aziendali": Gli obiettivi aziendali sono all'origine di ogni soluzione di data mining.
Esplora i dati per trovare informazioni che ti aiutino a gestire meglio l'azienda. Non dovrebbe questo essere il mantra di tutte le analisi dei dati aziendali? Certo che dovrebbe! Tuttavia, i minatori di dati alle prime armi si concentrano spesso sulla tecnologia e su altri dettagli, che possono essere interessanti, ma non allineati con le esigenze e gli obiettivi dei decisori esecutivi.
Devi sviluppare l'abitudine di identificare gli obiettivi di business prima di fare qualsiasi altra cosa e concentrarti su quegli obiettivi in ogni fase del processo di data mining. È significativo che questa legge venga prima di tutto. Tutti dovrebbero capire che il data mining è un processo con uno scopo.
2a legge: Conoscenza del business
Ecco la seconda legge del data mining o "Business Knowledge Law": La conoscenza aziendale è fondamentale in ogni fase del processo di data mining.
Il data mining dà potere alle persone - uomini d'affari - che usano le loro conoscenze, esperienze e intuizioni aziendali, insieme ai metodi di data mining, per trovare significato nei dati.
Non devi essere un esperto di statistica per fare il data mining, ma devi sapere qualcosa su cosa significano i dati e come funziona l'azienda. Solo quando comprendi i dati e il problema che devi risolvere i processi di data mining ti aiutano a scoprire informazioni utili e a metterli in pratica.
3a legge: preparazione dei dati
Ecco la 3a legge sull'estrazione dei dati, o "Legge sulla preparazione dei dati": La preparazione dei dati è più della metà di ogni processo di data mining.
Gli statistici tradizionali hanno spesso l'opportunità di raccogliere nuovi dati per rispondere a domande di ricerca specifiche. Possono utilizzare processi rigorosi per pianificare esperimenti, progettare questionari di ricerca del sondaggio o altrimenti raccogliere dati di alta qualità che siano ben mirati a specifici obiettivi di ricerca. Dopo tutto ciò, passano ancora molto tempo a pulire e preparare i dati per l'analisi.
I minatori di dati, d'altra parte, quasi sempre devono lavorare con qualsiasi dato disponibile. Usano record aziendali esistenti, dati pubblici o dati che possono acquistare.È probabile che tutti i dati siano stati raccolti per scopi diversi dal data mining e senza alcun piano rigoroso o accurato processo di raccolta dei dati. Quindi i data minerers dedicano molto tempo alla preparazione dei dati.
4a legge: modello giusto
Ecco la quarta legge del data mining o "NFL-DM": Il modello giusto per una data applicazione può essere scoperto solo per esperimento.
Questa legge è anche nota con la stenografia NFL-DM, il che significa che non esiste un pranzo gratis per il minatore di dati.
Primo, cos'è una modella? È un'equazione che rappresenta uno schema osservato nei dati. Almeno, rappresenta il modello in modo approssimativo. I modelli matematici delle cose reali non sono mai perfetti! Questo è un dato di fatto, ed è altrettanto vero per i fisici nucleari quanto per i minatori di dati.
Nel data mining, i modelli vengono selezionati per tentativi ed errori. Sperimenterai con diversi tipi di modelli.
Quinta legge: schema
Ecco la quinta legge sull'estrazione dei dati: Ci sono sempre schemi.
Come minatore di dati, esplorerai i dati alla ricerca di modelli utili. In altre parole, cercherete relazioni significative tra le variabili nei dati. Comprendere queste relazioni fornisce una migliore comprensione del business e migliori previsioni su ciò che accadrà in futuro. Soprattutto, la comprensione dei modelli nei dati consente di influenzare ciò che accadrà in futuro.
Trovi sempre i modelli. I dati hanno sempre qualcosa da dirti. A volte, conferma che quello che hai fatto è giusto. Potrebbe non sembrare eccitante, ma almeno ti dice che sei stato sulla strada giusta. Altri giorni, i dati potrebbero dirti che le tue attuali pratiche commerciali non funzionano. È eccitante, e anche se potrebbe non essere piacevole nel breve periodo, conoscere la verità è un passo importante verso il miglioramento.
6a legge: Amplificazione
Ecco la sesta legge del data mining o "Insight Law": Il data mining amplifica la percezione nel dominio aziendale.
I metodi di data mining ti consentono di comprendere meglio la tua attività rispetto a quella che avresti potuto fare senza di essi. I metodi di data mining ti aiutano come una lente d'ingrandimento o un microscopio, consentendo la scoperta di effetti che sarebbero difficili o impossibili da rilevare attraverso la normale segnalazione.
Il data mining non è istantaneo.
La scoperta e l'apprendimento tramite il data mining è un processo interattivo. Farai scoperte, scoprirai un po 'da ognuna di esse e userai ciò che hai scoperto per agire. I risultati di ogni azione che proverai produrranno più dati e quei dati ti permetteranno di capire qualcosa di più. È un ciclo di scoperte e il ciclo continua finché continui a esplorare e sperimentare.
7th law: Prediction
Ecco la settima legge del data mining o "Prediction Law": La predizione aumenta le informazioni localmente per generalizzazione.
Il data mining ti aiuta a usare ciò che sai per fare previsioni migliori (o stime) di cose che non conosci. Il data mining utilizza i dati e i metodi di modellazione per sostituire le aspettative informali con stime guidate dai dati, coerenti e più accurate.
8 ° legge: valore
Ecco l'ottava legge sull'estrazione dei dati, o "Legge sul valore": Il valore dei risultati dell'estrazione dei dati non è determinato dall'accuratezza o dalla stabilità dei modelli predittivi.
I minatori di dati non si preoccupano della teoria. Come minatore di dati, potresti non conoscere nemmeno la teoria che sta dietro ai modelli statistici che utilizzi. Forse è altrettanto positivo, perché nel data mining, userai quei modelli in modi che non necessariamente si allineano con la teoria che li sta dietro.
Cercherete modelli che producano previsioni corrette (e userete test, piuttosto che teoria statistica, per giudicare ciò). Ma potresti essere più interessato ad altri problemi, ad esempio se il modello ha un senso del business, ti illumina su fattori predittivi inaspettati o è pratico da usare nel tuo posto di lavoro.
9th Law: Change
Ecco la 9a legge di Data Mining, o "Law of Change": Tutti i pattern sono soggetti a modifiche.
Il mondo sta cambiando continuamente. Il modello che ti dà grandi previsioni oggi potrebbe essere inutile domani. Questo è un dato di fatto per tutti gli analisti di dati, non solo per i data miner.