Video: Basic Machine Learning Algorithms Overview - Data Science Crash Course Mini-series 2024
di Meta S. Brown
Il data mining è il modo in cui gli uomini d'affari ordinari utilizzano una gamma di tecniche di analisi dei dati per scoprire utili informazioni dai dati e metterle in pratica. I minatori di dati non si preoccupano della teoria e delle ipotesi. Convalidano le loro scoperte testando. E capiscono che le cose cambiano, quindi quando la scoperta che ha funzionato come un fascino ieri non regge oggi, si adattano.
Le 9 leggi del data mining: una guida di riferimento
Il minatore dei dati pionieristici Thomas Khabaza ha sviluppato le sue "Nine Laws of Data Mining" per guidare i nuovi minatori di dati mentre si mettono al lavoro. Questa guida di riferimento mostra ciò che ciascuna di queste leggi significa per il tuo lavoro quotidiano.
-
Prima legge del data mining o "legge sugli obiettivi aziendali": Gli obiettivi aziendali sono all'origine di ogni soluzione di data mining.
Un minatore di dati è una persona che scopre informazioni utili dai dati per supportare specifici obiettivi di business. Il data mining non è definito dallo strumento che usi.
-
2nd Law of Data Mining, o "Business Knowledge Law": Business Knowledge è fondamentale in ogni fase del processo di data mining .
Non devi essere un esperto di statistica per fare il data mining, ma devi sapere qualcosa su cosa significano i dati e come funziona l'azienda.
-
3a legge del data mining o "legge sulla preparazione dei dati": La preparazione dei dati è più della metà di ogni processo di data mining .
Quasi tutti i data miner dedicheranno più tempo alla preparazione dei dati che all'analisi.
-
4a legge del data mining, o "Nessun pranzo gratuito per il data miner": Il modello giusto per una data applicazione può essere scoperto solo dall'esperimento .
Nel data mining, i modelli vengono selezionati per tentativi ed errori.
-
5 ° legge del data mining: Ci sono sempre modelli nei dati .
Come minatore di dati, esplori i dati alla ricerca di modelli utili. La comprensione dei pattern nei dati consente di influenzare ciò che accade in futuro.
-
Sesta legge sul data mining o "Insight Law": Il data mining amplifica la percezione nel dominio aziendale .
I metodi di data mining ti consentono di comprendere meglio la tua attività rispetto a quella che avresti potuto fare senza di loro.
-
7 ° Legge di Data Mining o "Prediction Law": La predizione aumenta le informazioni localmente per generalizzazione.
Il data mining ci aiuta a utilizzare ciò che sappiamo per fare previsioni migliori (o stime) di cose che non conosciamo.
-
ottava legge del data mining o "legge del valore": Il valore dei risultati del data mining non è determinato dall'accuratezza o dalla stabilità dei modelli predittivi .
Il tuo modello deve produrre buone previsioni, in modo coerente. Questo è tutto.
-
9 ° legge del data mining, o "Legge del cambiamento": Tutti i modelli sono soggetti a modifiche.
Qualsiasi modello che ti dia grandi previsioni oggi potrebbe essere inutile domani.
Fasi del processo di data mining
Il Processo standard intersettoriale per il data mining ( CRISP-DM ) è il framework del processo di data mining dominante. È uno standard aperto; chiunque può usarlo. Il seguente elenco descrive le varie fasi del processo.
-
Comprensione aziendale: Ottieni una comprensione chiara del problema che stai cercando di risolvere, dell'impatto che la tua organizzazione ha avuto e dei tuoi obiettivi per affrontarlo. Le attività in questa fase includono:
-
Identificazione degli obiettivi aziendali
-
Valutazione della situazione
-
Definizione degli obiettivi di data mining
-
Produzione del piano di progetto
-
-
Comprensione dei dati: Rivedi i dati che hai, documentarlo, identificare la gestione dei dati e problemi di qualità dei dati. Le attività per questa fase includono:
-
Raccolta dati
-
Descrizione
-
Esplorazione
-
Verifica qualità
-
-
Preparazione dati: Prepara i dati per la modellazione. Le attività per questa fase includono:
-
Selezione dei dati
-
Pulizia dei dati
-
Costruzione
-
Integrazione della
-
Formattazione
-
-
Modellazione: Utilizzare le tecniche matematiche per identificare i modelli all'interno dei dati. Le attività per questa fase includono:
-
Selezione delle tecniche
-
Progettazione di test
-
Modelli di edifici
-
Valutazione dei modelli
-
-
Valutazione: Rivedere i modelli che hai scoperto e valutare il loro potenziale per uso aziendale. Le attività per questa fase includono:
-
Valutazione dei risultati
-
Revisione del processo
-
Determinazione dei passi successivi
-
-
Distribuzione: Metti in pratica le tue scoperte nel mondo degli affari. Le attività per questa fase includono:
-
Pianificazione dell'implementazione (i metodi per l'integrazione delle rilevazioni di data mining in uso)
-
Segnalazione dei risultati finali
-
Revisione dei risultati finali
-