Video: Tutorial Numbers per Mac - Parte 2 - I grafici e funzioni varie 2024
Il primo passo verso la modellazione predittiva è correlare le variabili l'una con l'altra. Uno strumento semplice e notevole per questo è lo scatterplot. È usato per mettere in relazione una misura continua con un'altra. I minatori di dati a volte estendono le regole e le usano anche con variabili categoriali.
L'asse orizzontale ( x ) del grafico rappresenta i valori di una variabile; l'asse verticale ( y ) rappresenta una seconda variabile. Potresti non avere il senso di quale variabile è indipendente e quale dipende da ogni coppia di variabili.
Se lo fai, la variabile indipendente dovrebbe essere sull'asse orizzontale. Ogni punto sul grafico rappresenta le coordinate, la coppia di valori per le due variabili all'interno di un singolo caso. (Queste coppie sono talvolta denominate coppie xy ).
Trova lo strumento scatterplot e imposta uno strumento scatterplot di base selezionando due variabili da utilizzare. La seguente figura mostra questo strumento nel menu di Orange; la posizione dello strumento varia in base al prodotto.
L'esempio nella prossima immagine mostra un display interattivo; lo scatterplot appare immediatamente. In un altro strumento, potresti aver bisogno di ulteriori passaggi per eseguire e creare il grafico.
L'esempio dello scatterplot riporta il chilometraggio automatico alla potenza del motore. La bassa potenza è associata a un elevato chilometraggio, e maggiore è la potenza, minore è il chilometraggio. Puoi facilmente vedere questo pattern nei dati. Potresti notare una forma, non lineare ma un po 'curva. Questo potrebbe fornire suggerimenti su quali tipi di modelli provare più tardi.
Le applicazioni di data mining spesso hanno alcune funzionalità interattive nelle visualizzazioni dei grafici. Ad esempio, la figura successiva mostra che il passaggio del mouse su un punto rivela i valori esatti delle due variabili per quel punto. È più facile che cercare di leggere i valori dagli assi!