Casa Finanza personale Basi del processo di classificazione dei dati di Predictive Analytics - manichini

Basi del processo di classificazione dei dati di Predictive Analytics - manichini

Video: The wonderful and terrifying implications of computers that can learn | Jeremy Howard | TEDxBrussels 2025

Video: The wonderful and terrifying implications of computers that can learn | Jeremy Howard | TEDxBrussels 2025
Anonim

A livello di chiodi di bronzo, la classificazione dei dati analitici predittivi si compone di due fasi: la fase di apprendimento e la fase di predizione. La fase di apprendimento comporta la formazione del modello di classificazione eseguendo un set designato di dati passati attraverso il classificatore. L'obiettivo è insegnare al modello a estrarre e scoprire relazioni e regole nascoste - le regole di classificazione dai dati storici (di allenamento). Il modello lo fa utilizzando un algoritmo di classificazione.

Lo stadio di predizione che segue lo stadio di apprendimento consiste nel fare in modo che il modello pronostichi nuove etichette di classe o valori numerici che classificano i dati che non ha mai visto prima (cioè dati di test).

Per illustrare queste fasi, supponiamo che tu sia il proprietario di un negozio online che vende orologi. Hai posseduto il negozio online per un po 'di tempo e hai raccolto molti dati transazionali e dati personali sui clienti che acquistavano gli orologi dal tuo negozio. Supponiamo che tu abbia acquisito tali dati attraverso il tuo sito fornendo moduli web, oltre ai dati transazionali raccolti attraverso le operazioni.

Potresti anche acquistare dati da una terza parte che ti fornisce informazioni sui tuoi clienti al di fuori del loro interesse per gli orologi. Non è così difficile come sembra; ci sono aziende il cui modello di business è quello di tenere traccia dei clienti online e raccogliere e vendere informazioni preziose su di loro.

La maggior parte di queste società di terze parti raccoglie dati dai siti di social media e applica metodi di data mining per scoprire la relazione dei singoli utenti con i prodotti. In questo caso, come proprietario di un negozio di orologi, ti interesserebbe il rapporto tra i clienti e il loro interesse all'acquisto di orologi.

È possibile dedurre questo tipo di informazioni dall'analisi, ad esempio, del profilo di un social network di un cliente o di un commento di microblog del tipo che si trova su Twitter.

Per misurare il livello di interesse di un individuo negli orologi, è possibile applicare uno qualsiasi dei diversi strumenti di analisi del testo in grado di scoprire tali correlazioni nel testo di un individuo (stati di social network, tweet, post di blog e così via) o attività online (come interazioni sociali online, caricamenti di foto e ricerche).

Dopo aver raccolto tutti i dati sulle transazioni passate e gli interessi correnti dei tuoi clienti - i dati di allenamento che mostrano il tuo modello cosa cercare - dovrai organizzarlo in una struttura che lo renda facile accesso e utilizzo (come un database).

A questo punto, hai raggiunto la seconda fase della classificazione dei dati: la fase di predizione, che riguarda esclusivamente la verifica del modello e l'accuratezza delle regole di classificazione che ha generato. A tal fine, avrai bisogno di ulteriori dati storici sui clienti, indicati come dati di test (che è diverso dai dati di addestramento).

Si alimentano questi dati di test nel modello e si misura l'accuratezza delle previsioni risultanti. Conti le volte in cui il modello ha previsto correttamente il comportamento futuro dei clienti rappresentati nei dati di test. Conti anche le volte in cui il modello ha fatto previsioni sbagliate.

A questo punto, hai solo due possibili risultati: o sei soddisfatto dell'accuratezza del modello o non lo sei:

  • Se sei soddisfatto, allora puoi iniziare a preparare il tuo modello a fare previsioni come parte di un sistema di produzione.

  • Se non sei soddisfatto del pronostico, dovrai riqualificare il tuo modello con un nuovo set di dati di addestramento.

Se i tuoi dati di allenamento originali non erano abbastanza rappresentativi del gruppo dei tuoi clienti o contenevano dati rumorosi che hanno allontanato i risultati del modello introducendo segnali falsi, allora c'è ancora molto lavoro da fare per far funzionare il tuo modello. O l'esito è utile a suo modo.

Basi del processo di classificazione dei dati di Predictive Analytics - manichini

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...