Sommario:
- Visualizzazione dei raggruppamenti nascosti nei dati
- Visualizzazione dei risultati della classificazione dei dati
- Visualizzazione di valori anomali nei dati
- Visualizzazione degli alberi decisionali
- Visualizzazione delle previsioni
Video: Visualizing the Riemann hypothesis and analytic continuation 2025
Spesso, è necessario essere in grado di mostrare i risultati delle analisi predittive a coloro che contano. Ecco alcuni modi per utilizzare le tecniche di visualizzazione per riportare i risultati dei tuoi modelli agli stakeholder.
Visualizzazione dei raggruppamenti nascosti nei dati
Il clustering dei dati è il processo di individuazione di gruppi nascosti di elementi correlati all'interno dei dati. Nella maggior parte dei casi, un cluster (raggruppamento) è costituito da oggetti dati dello stesso tipo come utenti di social network, documenti di testo o e-mail. Di seguito viene mostrato un modo per visualizzare i risultati di un modello di cluster di dati, in cui il grafico rappresenta le comunità sociali (cluster) che sono state scoperte nei dati raccolti dagli utenti dei social network.
I dati sui clienti sono stati raccolti in un formato tabulare; poi è stato applicato un algoritmo di clustering ai dati e sono stati scoperti i tre cluster (gruppi): clienti fedeli, clienti erranti e clienti scontati. Supponiamo che l'asse X e Y rappresentino i due componenti principali generati dai dati originali. L'analisi delle componenti principali (PCA) è una tecnica di riduzione dei dati.
Qui la relazione visiva tra i tre gruppi suggerisce già dove gli sforzi di marketing potenziati e mirati potrebbero fare il meglio.
Visualizzazione dei risultati della classificazione dei dati
Un modello di classificazione assegna una classe specifica a ogni nuovo punto dati esaminato. Le classi specifiche, in questo caso, potrebbero essere i gruppi risultanti dal lavoro di clustering. L'output evidenziato nel grafico può definire i set di target. Per ogni nuovo cliente, un modello di classificazione predittivo tenta di prevedere a quale gruppo apparterrà il nuovo cliente.
Dopo aver applicato un algoritmo di clustering e scoperto i raggruppamenti nei dati del cliente, si giunge a un momento di verità: ecco che arriva un nuovo cliente - si desidera che il modello preveda quale tipo di cliente o lei lo sarà.
L'immagine mostra come le informazioni di un nuovo cliente vengono fornite al tuo modello di analisi predittiva, che a sua volta predice quale gruppo di clienti è questo nuovo cliente. I nuovi clienti A, B e C stanno per essere assegnati ai cluster secondo il modello di classificazione. L'applicazione del modello di classificazione ha portato a prevedere che il cliente A sarebbe appartenuto ai clienti fedeli, il cliente B sarebbe un vagabondo e il cliente C si sarebbe presentato solo per lo sconto.
Visualizzazione di valori anomali nei dati
Nel corso del clustering o della classificazione di nuovi clienti, di tanto in tanto si verificano valori anomali (casi speciali che non si adattano alle divisioni esistenti).
Di seguito, vengono visualizzati alcuni valori anomali che non si adattano bene ai cluster predefiniti. Sei clienti anomali sono stati rilevati e visualizzati. Si comportano in modo abbastanza diverso che il modello non può dire se appartengono a una delle categorie definite di clienti.
Visualizzazione degli alberi decisionali
Molti modelli usano alberi decisionali come loro output: Questi diagrammi mostrano i possibili risultati di corsi d'azione alternativi, disposti come i rami di un albero.
L'immagine sotto mostra un esempio di albero usato come classificatore: classifica gli appassionati di baseball sulla base di alcuni criteri, principalmente l'importo speso per i biglietti e le date di acquisto. Da questa visualizzazione, puoi prevedere il tipo di fan che un nuovo acquirente di biglietti sarà: casuale, fedele, carrozzone, irriducibile o un altro tipo.
Gli attributi di ciascun tifoso sono menzionati ad ogni livello nell'albero (numero totale di partite frequentate, importo totale speso, stagione); puoi seguire un percorso da una particolare "radice" a una "foglia" specifica sull'albero, dove colpisci una delle classi di ventaglio (c1, c2, c3, c4, c5).
Supponiamo di voler determinare il tipo di fan del baseball di un cliente in modo da poter determinare il tipo di annunci di marketing da inviare al cliente. Supponiamo che tu ipotizzi che i fan del baseball e i fan del carrozzone possano essere persuasi a comprare una macchina nuova quando la loro squadra sta andando bene e si dirigono verso i playoff.
Potresti voler inviare annunci di marketing e sconti per persuaderli a effettuare l'acquisto. Supponiamo inoltre che ipotizzi che i fan del carrozzone possano essere persuasi a votare a sostegno di alcune questioni politiche. È possibile inviare loro annunci di marketing chiedendo loro per tale supporto. Se sai quale tipo di base di fan hai, utilizzare gli alberi decisionali può aiutarti a decidere come affrontarlo come una gamma di tipi di clienti.
Visualizzazione delle previsioni
Supponiamo di aver eseguito una serie di modelli di analisi predittiva, inclusi alberi decisionali, foreste casuali e algoritmi di floccaggio. È possibile combinare tutti questi risultati e presentare una narrativa coerente supportata da tutti. Qui la confidenza è una percentuale numerica che può essere calcolata usando una funzione matematica. Il risultato del calcolo incapsula un punteggio di quanto probabile sia un possibile evento.
Sull'asse x, l'evidenza di supporto rappresenta la fonte di contenuto che è stata analizzata con i modelli di analisi del contenuto che identificavano i possibili risultati. Nella maggior parte dei casi, il modello predittivo avrebbe elaborato un set di dati di grandi dimensioni, utilizzando dati provenienti da varie fonti, per ricavarne i possibili risultati. Quindi è necessario mostrare solo la prova di supporto più importante nella visualizzazione.
In alto, un riepilogo dei risultati ottenuti dall'applicazione dell'analisi predittiva viene presentato come una visualizzazione che illustra i possibili risultati, insieme a un punteggio di confidenza e prove a supporto per ciascuno di essi. Vengono mostrati tre possibili scenari:
- L'inventario dell'articolo A non manterrà la domanda se non si effettuano spedizioni settimanali da almeno 100 unità a magazzino S. (Punteggio di confidenza: 98%.)
- Il numero di vendite aumenterà del 40% se aumenti la produzione dell'articolo A di almeno il 56%. (Punteggio di confidenza: 83 percento.)
- Una campagna di marketing in California aumenterà le vendite degli Articoli A e D ma non l'Articolo K. (Punteggio di confidenza: 72 percento).
Il punteggio di confidenza rappresenta la probabilità che ogni scenario succede, secondo il tuo modello di analisi predittiva. Si noti che sono elencati qui in ordine decrescente di probabilità.
Qui la prova di supporto più importante consiste nel modo in cui gli estratti da diverse fonti di contenuto vengono presentati sull'asse x. Puoi fare riferimento a loro se devi spiegare come sei arrivato a un particolare scenario possibile e trottare le prove che lo supportano.
Il potere dietro questa visualizzazione è la sua semplicità. Immagina, dopo mesi di applicazione dell'analisi predittiva ai tuoi dati, aprendo la strada a diverse iterazioni, che entri in contatto con un decisore. Sei armato con una visualizzazione a scorrimento di tre possibili scenari che potrebbero avere un impatto enorme sul business. Tale visualizzazione crea discussioni efficaci e può condurre la gestione a momenti "aha".
