Video: 31/07/2019 - SemplifiSco – L’aggregazione delle banche dati per la riscossione locale 2024
Riassumere i dati, trovare i totali e calcolare le medie e altre misure descrittive probabilmente non sono nuovi per te. Quando hai bisogno dei tuoi riepiloghi sotto forma di nuovi dati, piuttosto che di rapporti, il processo è chiamato aggregazione. I dati aggregati possono diventare la base per calcoli aggiuntivi, uniti con altri set di dati, utilizzati in qualsiasi modo che altri dati vengano utilizzati.
Ecco un esempio di un processo di aggregazione dei dati. Un set di dati contiene informazioni generali su oltre 160.000 pacchi di proprietà immobiliari. Questi dati includono una varietà di usi del suolo. Cosa succede se ti piacerebbe vedere il valore medio valutato per la terra in ogni categoria di uso del suolo? Ecco come lo faresti.
È possibile trovare lo strumento di aggregazione dei dati nell'applicazione di data mining. Potresti usare la ricerca per trovarlo.
Dovresti aggiungere lo strumento a un processo e collegarlo a un set di dati di origine.
Nello strumento di aggregazione dei dati, scegli una variabile di raggruppamento. In questo caso, è la variabile Land Use, C_A_CLASS.
Quindi definirai i riepiloghi che desideri. Per ottenere un valore medio stimato del terreno, dovrai selezionare la variabile con le valutazioni da riepilogare e scegliere la funzione media.
Quando viene eseguita l'aggregazione, il risultato è un nuovo set di dati, con una riga per ogni tipo di uso del suolo e una nuova variabile per le medie calcolate.
Prima o poi, dovrai aggregare un intero set di dati. Ma quando vuoi totalizzare o calcolare la media di tutti i dati in un set di dati, potresti avere un problema: qual è la tua variabile di raggruppamento? Il trucco è usare una variabile con un valore costante per l'intero set di dati. Quindi, crea una variabile in cui ogni valore è lo stesso, quindi utilizzalo come variabile di raggruppamento.