Video: Database VS Data Warehouse 2024
I dati raccolti dalle grandi organizzazioni nel corso delle attività quotidiane vengono solitamente archiviati in database, ma gli amministratori dei database potrebbero non essere disposti a consentire l'accesso diretto a questi le fonti di dati e l'accesso diretto potrebbero non essere l'opzione migliore dal tuo punto di vista: l'accesso diretto ai database operativi (usati per operazioni di routine) può essere una cattiva idea perché
-
I data miner utilizzano molti dati. > È possibile bloccare involontariamente risorse e interferire con le normali operazioni commerciali.
-
Si potrebbe involontariamente violare una legge sulla privacy dei dati o altra gestione dei dati requisito se l'accesso ai dati non è controllato in modo appropriato. I database operativi non sono organizzati per il data mining.
-
È possibile impiegare molto tempo per ottenere i dati necessari e non essere ancora sicuro di farlo correttamente. Quando hai bisogno di dati da un database operativo (e hai l'approvazione appropriata per utilizzare i dati), dovresti discutere le tue esigenze con l'amministratore responsabile di tali dati. Dovrai spiegare esattamente di quali dati hai bisogno, il formato necessario per il data mining e se hai bisogno dei dati solo una volta o su base continuativa.
L'accesso ai dati in corso è un'altra questione. L'amministratore potrebbe non voler fornire più volte gli estratti di dati e fornire un accesso diretto ai sistemi aziendali è rischioso. Una soluzione comune è creare un database analitico
. Questo è un database relazionale ordinario separato dai sistemi aziendali convenzionali. I dati vengono regolarmente trasferiti (e automaticamente) dai sistemi aziendali al database analitico e i minatori di dati possono accedervi in qualsiasi momento.
Se l'amministratore del database insiste che i dati non possono essere memorizzati in questo modo, chiedere se è possibile creare una
vista (una query memorizzata che può essere interrogata come se fosse una tabella dati convenzionale) con l'organizzazione di cui hai bisogno. Molti prodotti di data mining sono in grado di leggere i dati dai database. I passaggi richiesti variano in base alla
Progettazione dell'applicazione di data mining
-
Struttura del database di origine
-
Middleware, solitamente chiamato
-
driver ( Driver ODBC, driver JDBC <), software speciale che media tra il database e il software applicativo La documentazione per l'applicazione di data mining dovrebbe dirti se può leggere i dati da un database e, in tal caso, quale strumento o funzione usare e come.L'amministratore che imposta il database di analisi può fornire dettagli sull'accesso al database. Se hai già dimestichezza con i database e altre applicazioni, non troverai nulla di sorprendente nel fare le stesse cose con un'applicazione di data mining. Se i database sono nuovi per te, chiedi a una persona esperta della tua organizzazione di guidarti attraverso il processo con il tuo database e l'applicazione di data mining.