Casa Finanza personale Nozioni di base su K-Means e DBSCAN Modelli di clustering per predittività Analytics - dummies

Nozioni di base su K-Means e DBSCAN Modelli di clustering per predittività Analytics - dummies

Video: Integrali : Introduzione e Primi Esempi 2024

Video: Integrali : Introduzione e Primi Esempi 2024
Anonim

L'apprendimento senza supervisione ha molte sfide per l'analisi predittiva, incluso non sapere cosa aspettarsi quando si esegue un algoritmo. Ogni algoritmo produrrà risultati diversi; non sarai mai sicuro se un risultato è migliore dell'altro o se il risultato è di qualsiasi valore.

Quando sai quali dovrebbero essere i risultati, puoi modificare gli algoritmi per produrre i risultati desiderati. Nei set di dati del mondo reale, non avrai questo lusso. Dovrai dipendere da una conoscenza preliminare dei dati - o intuizione - per decidere quali parametri di inizializzazione e algoritmi utilizzare mentre crei il tuo modello.

Nelle attività di apprendimento reali non supervisionate, tuttavia, questa conoscenza precedente non è disponibile e il risultato desiderato è difficile da trovare. La scelta del numero giusto di cluster è il problema chiave. Se ti capita di imbatterti nel giusto numero di cluster, i tuoi dati produrranno intuizioni che ti permetteranno di fare previsioni molto accurate. Il rovescio della medaglia, indovinare il numero sbagliato di cluster può dare risultati subpar.

K-significa che l'algoritmo è una buona scelta per i dataset che hanno un piccolo numero di cluster con dimensioni proporzionali e dati separabili linearmente - e puoi ridimensionarlo per usare l'algoritmo su dataset molto grandi.

Pensa a linearmente separabili dati come una serie di punti in un grafico che può essere separato usando una linea retta. Se i dati non sono separabili linearmente, dovranno essere impiegate versioni più avanzate di K - che diventeranno più dispendiose dal punto di vista computazionale e potrebbero non essere adatte a dataset di grandi dimensioni. Nella sua implementazione standard, la complessità per calcolare i centri di cluster e le distanze è bassa.

K-means è ampiamente utilizzato per risolvere problemi di big data perché è semplice da utilizzare, efficace e altamente scalabile. Non c'è da stupirsi che la maggior parte dei venditori commerciali utilizzi l'algoritmo K-means come componente chiave dei propri pacchetti di analisi predittiva.

L'implementazione di DBSCAN (Density-Based Spatial Clustering of Applications with Noise) in scikit-learn non richiede alcun parametro di inizializzazione definito dall'utente per creare un'istanza. È possibile sovrascrivere i parametri predefiniti durante l'inizializzazione, se lo si desidera. Sfortunatamente, se si utilizzano i parametri predefiniti, l'algoritmo non può fornire una corrispondenza esatta con il risultato desiderato.

DBSCAN è più adatto per i set di dati che hanno dimensioni di cluster sproporzionate e i cui dati possono essere separati in modo non lineare.Come K-means, DBSCAN è scalabile, ma usarlo su dataset di grandi dimensioni richiede più memoria e potenza di calcolo.

Nozioni di base su K-Means e DBSCAN Modelli di clustering per predittività Analytics - dummies

Scelta dell'editore

Comprensione dei livelli di accesso e dei ruoli in Microsoft CRM - dummies

Comprensione dei livelli di accesso e dei ruoli in Microsoft CRM - dummies

I privilegi che vi sono assegnati regolano le funzioni che è possibile eseguire su particolari record o oggetti. I tuoi livelli di accesso determinano a quale record si applicano questi privilegi. In altre parole, sebbene i tuoi privilegi possano includere la possibilità di eliminare i record account, è il tuo livello di accesso che determina esattamente quali record puoi eliminare. ...

Scegli o cambia utenti in NaturallySpeaking - dummies

Scegli o cambia utenti in NaturallySpeaking - dummies

Quando lanci Dragon NaturallySpeaking, potrebbe chiederti di scegliere un utente . Se non ti chiede, non ti preoccupare. Probabilmente hai un solo utente: tu. Ricorda che quando hai configurato NaturallySpeaking per la prima volta, hai creato e nominato un profilo utente e poi hai addestrato NaturallySpeaking su come l'utente (tu) ha suonato. Ora, quando avvii ...

Aggiungi una fonte di dettatura al tuo profilo corrente - dummies

Aggiungi una fonte di dettatura al tuo profilo corrente - dummies

La tua voce registrata è così diversa dalla tua voce dal vivo che devi addestrare Dragon NaturallySpeaking a riconoscerlo. Allenarsi NaturallySpeaking per capire la tua voce registrata è come allenarlo per dettatura diretta, con una differenza: leggi il materiale di allenamento nel tuo registratore, trasferisci il dettato sul PC e poi ...

Scelta dell'editore

Mantieni il tuo cervello affilato disegnando - manichini

Mantieni il tuo cervello affilato disegnando - manichini

Se non hai mai pensato a te stesso come una persona creativa, è tempo per un cambio di pensiero. Ogni persona ha il potenziale per sbloccare un aspetto della creatività. Ecco alcuni suggerimenti per aiutarti ad andare avanti. Includono suggerimenti su semplici attività di disegno per iniziare - ma se ritieni che ...

Come usare la tolleranza come tecnica di gestione della rabbia - manichini

Come usare la tolleranza come tecnica di gestione della rabbia - manichini

La rabbia è l'emozione dell'intolleranza che può essere gestito attraverso la pratica della tolleranza. Intolleranza significa che non accetti il ​​punto di vista o il comportamento di un'altra persona. La rabbia dice che pensi di avere ragione e che l'altra persona ha torto. Non può essere più semplice di così. La rabbia difende l'ascoltatore da qualsiasi cambiamento nel suo modo di pensare. ...

Migliorare la gestione della rabbia con l'esercizio - manichini

Migliorare la gestione della rabbia con l'esercizio - manichini

Una quantità di prove scientifiche supporta il fatto che l'esercizio fisico regolare migliora gli stati d'animo e può aiutarti a ridurre la tua rabbia. Se scegli di allenarti regolarmente, puoi aspettarti di Concentrare meglio Dormire meglio Mostra un maggiore interesse per il sesso Avere più energia Sii meno teso Goditi la vita più in generale Sento meno alienato ...

Scelta dell'editore

Caratteristiche della Canon Digital Rebel XTi / 400D - manichini

Caratteristiche della Canon Digital Rebel XTi / 400D - manichini

La tua nuova Canon Digital Rebel XTi / 400D ha una serie di funzioni e le seguenti figure le indicano una ad una. Un asterisco indica che un pulsante o un controllo ha più funzioni. Verificando la Canon XTi / 400D dal punto di vista del fotografo. Osservando alcuni dei pulsanti e dei quadranti principali. Trovare la messa a fuoco e ...

Caratteristiche della Canon EOS Digital Rebel XSi / 450D - manichini

Caratteristiche della Canon EOS Digital Rebel XSi / 450D - manichini

Le seguenti figure offrono una comoda guida ai pulsanti, ai quadranti e ad altre funzioni esterne della tua Canon EOS Digital Rebel XSi / 450D. Si noti che l'obiettivo mostrato è il modello Canon EF-S 18-55mm IS (Image Stabilization) venduto con XSi / 450D; altri obiettivi potrebbero non avere le stesse caratteristiche. Dal punto di vista del fotografo. Guardando verso il basso ...

Controlli esterni della fotocamera sulla Canon EOS Rebel T3 / 1100D - manichini

Controlli esterni della fotocamera sulla Canon EOS Rebel T3 / 1100D - manichini

Sparsi per l'esterno della tua Canon EOS Rebel T3 / 1100D sono un numero di pulsanti, quadranti e interruttori che usi per cambiare le impostazioni di ripresa delle foto, rivedere e modificare le tue foto ed eseguire varie altre operazioni. Ecco una introduzione di base ai controlli esterni. Controlli Topside sulla Canon EOS Rebel T3 / 1100D Il tour virtuale inizia ...