Casa Finanza personale Fase 4 del modello di processo CRISP-DM: modellazione - dummies

Fase 4 del modello di processo CRISP-DM: modellazione - dummies

Sommario:

Video: Alfa Romeo Giulia + Alfa Stelvio CAR Factory HOW IT'S MADE Production Plant Cassino 2025

Video: Alfa Romeo Giulia + Alfa Stelvio CAR Factory HOW IT'S MADE Production Plant Cassino 2025
Anonim

La modellazione è la parte del modello di processo Cross-Industry Standard per il data mining (CRISP-DM) che la maggior parte dei dati i minatori preferiscono I tuoi dati sono già in buone condizioni e ora puoi cercare modelli utili nei tuoi dati.

La fase di modellazione comprende quattro compiti. Questi sono

  • Selezione delle tecniche di modellazione

  • Esecuzione di test (s)

  • Modelli di costruzione

  • Valutazione del / i modello / i

Compito: selezione delle tecniche di modellazione

Il meraviglioso mondo del data mining offre una gran quantità di tecniche di modellazione, ma non tutte si adattano alle tue esigenze. Limita l'elenco in base al tipo di variabili coinvolte, alla selezione delle tecniche disponibili nei tuoi strumenti e a tutte le considerazioni di business che sono importanti per te.

Ad esempio, molte organizzazioni preferiscono i metodi con output facilmente interpretabili, quindi gli alberi decisionali o la regressione logistica potrebbero essere accettabili, ma le reti neurali probabilmente non saranno accettate.

I risultati per questa attività includono due rapporti:

  • Tecnica di modellazione: Specificare la tecnica (o le tecniche) che si utilizzerà.

  • Assunzioni di modellazione: Molte tecniche di modellazione si basano su determinati presupposti. Ad esempio, un tipo di modello può essere inteso per l'uso con dati che hanno uno specifico tipo di distribuzione. Documenta questi presupposti in questo rapporto.

Gli statistici sono ben informati, severi e pignoli sulle ipotesi. Questo non è necessariamente vero per i minatori di dati, e non è un requisito diventare un minatore di dati. Se hai una profonda conoscenza statistica e capisci le ipotesi dietro i modelli che selezioni, puoi essere severo e pignolo sulle ipotesi.

Ma molti minatori di dati, in particolare i minatori di dati inesperti, non si agitano troppo sulle ipotesi. L'alternativa è testare - molti e molti test - dei tuoi modelli.

Attività: progettazione di test

Il test in questa attività è il test che verrà utilizzato per determinare il funzionamento del modello. Potrebbe essere semplice come dividere i dati in un gruppo di casi per l'addestramento del modello e un altro gruppo per il test del modello.

I dati di allenamento vengono utilizzati per adattare i moduli matematici al modello di dati e i dati di test vengono utilizzati durante il processo di addestramento del modello per evitare un overfitting : creare un modello perfetto per un set di dati, ma nessun altro. È inoltre possibile utilizzare dati di holdout, dati che non vengono utilizzati durante il processo di addestramento del modello, per un test aggiuntivo.

Il deliverable per questa attività è il tuo progetto di test. Non è necessario che sia elaborato, ma dovresti almeno fare attenzione che i tuoi dati di addestramento e test siano simili e che tu eviti di introdurre pregiudizi nei dati.

Compito: Costruire i modelli

La modellazione è ciò che molte persone immaginano di essere l'intero lavoro del minatore di dati, ma è solo un compito di dozzine! Ciononostante, la modellazione per indirizzare obiettivi aziendali specifici è il cuore della professione di data mining.

I deliverable per questa attività includono tre voci:

  • Impostazioni parametri: Quando si creano i modelli, la maggior parte degli strumenti offre la possibilità di regolare una varietà di impostazioni e queste impostazioni hanno un impatto sulla struttura del modello finale. Documentare queste impostazioni in un report.

  • Descrizione del modello: Descrivi i tuoi modelli. Indicare il tipo di modello (come la regressione lineare o la rete neurale) e le variabili utilizzate. Spiega come viene interpretato il modello. Documentare eventuali difficoltà incontrate nel processo di modellazione.

  • Modelli: Questo deliverable sono i modelli stessi. Alcuni tipi di modelli possono essere facilmente definiti con una semplice equazione; altri sono troppo complessi e devono essere trasmessi in un formato più sofisticato.

Attività: valutazione dei modelli

Ora esaminerai i modelli che hai creato, da un punto di vista tecnico e anche da un punto di vista aziendale (spesso con il contributo di esperti aziendali del tuo team di progetto).

I risultati per questa attività includono due rapporti:

  • Valutazione del modello: Riepiloga le informazioni sviluppate nella revisione del modello. Se sono stati creati diversi modelli, è possibile classificarli in base alla valutazione del loro valore per un'applicazione specifica.

  • Impostazioni dei parametri riveduti: È possibile scegliere di ottimizzare le impostazioni utilizzate per creare il modello e condurre un altro ciclo di modellazione e provare a migliorare i risultati.

Il data mining, come una cipolla, una torta Dobos o una roccia sedimentaria, ha molti strati. Quando inizi a utilizzare il data mining, puoi iniziare lasciando le impostazioni dei parametri ai valori predefiniti (in effetti potresti non notare le opzioni a meno che non ti sforzi di cercarle).

Quando ti sentirai a tuo agio nella tua nuova carriera di data mining, avrà senso scoprire i parametri del modello e sapere come utilizzarli. Le opzioni variano ampiamente con il tipo di modello e lo strumento specifico che si sta utilizzando.

Fase 4 del modello di processo CRISP-DM: modellazione - dummies

Scelta dell'editore

Tasti di scelta rapida per Microsoft Office 2007 - dummies

Tasti di scelta rapida per Microsoft Office 2007 - dummies

Microsoft Office 2007 è pieno di scorciatoie da tastiera per risparmiare tempo. Comprimi i componenti di Office 2007 - Word, Excel, Outlook, PowerPoint e Access - utilizzando i tasti di scelta rapida utili della seguente tabella. Con poco sforzo, puoi aprire file, trovare contenuti, modificare quel contenuto e altro! Funzione Ctrl Copia Ctrl + C Taglia Ctrl + X Trova Ctrl + F Vai ...

Vantaggi di Lync Online - dummies

Vantaggi di Lync Online - dummies

Lync Online è disponibile sia in ambito professionale sia in piccole imprese (P) e aziendali (E ) piani in Office 365. Le funzionalità includono messaggistica istantanea (IM), chiamate audio e video, presenza, riunioni online, presentazioni online e la possibilità di connettersi con i contatti di Windows Live Messenger e altri utenti esterni che eseguono Lync. La tecnologia è integrata in tutto ...

Come avviare una conversazione con Lync Online - dummies

Come avviare una conversazione con Lync Online - dummies

La scheda di contatto di Lync Online è un ottimo modo per avviare una conversazione con un collega o i membri del tuo team. Oltre alle note personali, alla presenza e alla posizione, vengono visualizzate anche le informazioni sulla tua organizzazione come il titolo e i numeri di telefono. Per visualizzare la scheda di contatto, passa con il mouse sopra l'immagine di una persona e fai clic sul gallone ...

Scelta dell'editore

Come scegliere un'immagine di sfondo Twitter per Visual Social Marketing - dummies

Come scegliere un'immagine di sfondo Twitter per Visual Social Marketing - dummies

Quando si imposta su un account Twitter per il social marketing visivo, un tipo di immagine che è richiesto per il tuo profilo è l'immagine di sfondo - viene visualizzata dietro il profilo Twitter. Nella parte superiore della schermata Impostazioni disegno, Twitter ti consente di scegliere tra una serie di temi premade. Un tema premade applica un ...

Come scegliere un buon nome utente Twitter - dummy

Come scegliere un buon nome utente Twitter - dummy

Su Twitter, il tuo nome utente, o handle, è il tuo identità. Se puoi, iscriviti a Twitter usando il tuo nome o una variante di esso come nome utente (supponendo che qualcun altro non lo stia già utilizzando). Ad esempio, se il tuo nome è John Ira, potresti scegliere un nome utente Twitter come @johnira o ...

Come personalizzare il tuo profilo Twitter - dummies

Come personalizzare il tuo profilo Twitter - dummies

La tua pagina pubblica su Twitter, noto anche come profilo, è la prima impressione che gli altri utenti di Twitter hanno di te, e può fare una grande differenza nel decidere se seguirti. Personalizzare la tua pagina del profilo Twitter in modo che rifletta te o la tua azienda fa la differenza quando si tratta di persone ...

Scelta dell'editore

Perché avresti bisogno di più profili utente per Dragon Professional Individuale - manichini

Perché avresti bisogno di più profili utente per Dragon Professional Individuale - manichini

Drago Individuo professionale capisce solo quelli che si sono presentati ufficialmente come utenti e hanno creato un profilo utente. Ecco quattro motivi per cui potresti voler creare più di un profilo utente: usi diversi vocabolari o stili di scrittura per compiti diversi. Si utilizzano diversi microfoni per compiti diversi. Volete ...

Lavorare con fogli di calcolo Usare NaturallySpeaking - dummies

Lavorare con fogli di calcolo Usare NaturallySpeaking - dummies

Utilizzando fogli di calcolo con versioni precedenti di NaturallySpeaking era difficile perché non si poteva indirizzare direttamente i nomi delle celle. Volevi dire qualcosa come "Cella A5" o "Seleziona Colonna C." Ma (sospiro), niente dado. Il tuo assistente non aveva idea di cosa stavi parlando. Bene, il tuo assistente ha "up-leveled" le sue abilità! Ora è possibile ...

Su Evernote's Passcode Lock - dummies

Su Evernote's Passcode Lock - dummies

Abbonati premium e business che utilizzano determinati dispositivi ora possono bloccare l'app Evernote con un blocco Passcode . Ogni volta che torni all'app, ti viene chiesto di inserire il tuo codice. Un blocco passcode è un'ottima opzione se condividi il tuo telefono o tablet con altre persone e vuoi impedire loro di accedere a ...