Video: Come Formattare un Mac (tutte le versioni) 2024
Gli umani usano l'esperienza quando interpretano i dati che vedono, ma i computer non possono. Il tuo software di data mining farà del suo meglio per identificare il tipo di dati in ogni colonna, ma i tipi di dati sono spesso ambigui.
Quando vedi un elenco di CAP, non provi ad aggiungerli e a sottrarli. Sai che rappresentano luoghi. Lo capisci perché hai molta esperienza nel vedere e riconoscere i CAP. Un computer potrebbe interpretare un codice di avviamento postale come un numero intero o una misura continua. Alla fine, spetta a te definire il formato corretto.
Le funzioni per l'impostazione di formati e ruoli dei dati (come ad esempio la variabile dipendente per la modellazione) possono essere sepolte in una varietà di punti nell'applicazione di data mining. È possibile definire i formati e il ruolo delle variabili all'interno di un file di dati prima ancora di aprire un'applicazione di data mining (i formati di dati nativi per Orange e Weka consentono questo), come parte dell'importazione o in un secondo momento nel processo.
Potresti avere strumenti costruiti per questo scopo, come gli strumenti mostrati nelle figure seguenti, oppure puoi definire queste proprietà all'interno di altre procedure.
Ogni applicazione di data mining ha il proprio set di tipi di variabili e i propri limiti su come ogni tipo può essere utilizzato. Alcuni di questi limiti sono basati sulla teoria. Ad esempio, puoi solo aggiungere e sottrarre numeri, non lettere. Ma altri potrebbero essere solo una questione di come è stata progettata l'applicazione.
Quindi, ad esempio, potreste scoprire che un particolare strumento di modellazione in un'applicazione consente di prevedere sia le variabili categoriali che quelle continue, ma uno strumento simile in un'altra applicazione può consentire la modellazione di una sola o dell'altra.