Video: Data Warehouse appliances revealed - IBM PureData 2024
Come i jeans a campana, i database assistiti dall'hardware sono sulla via del ritorno. Microsoft, Oracle e Netezza sono di gran moda nei seminari di database in tutto il mondo. Verso la metà e la fine degli anni '80, i venditori Britton Lee e Teradata (che alla fine si fusero) erano di gran moda.
Fornivano macchine dedicate che ottimizzavano l'elaborazione del database: le prime macchine utilizzate dai consumatori di dati pesanti, comprese molte delle aziende di beni di consumo confezionati.
L'obiettivo di queste scatole era di dedicare tutti gli aspetti di un computer per ottenere più velocemente i dati agli utenti. Questa macchina dedicata includeva un database centrato su query, memoria, CPU e operazioni su disco. Alla fine, tali prodotti sono usciti fuori moda e i sistemi di gestione del database sono stati migrati verso un'architettura più aperta, run-on-any-box.
Ora sono tornati!
Una appliance di data warehouse è un set integrato di server, storage, sistema operativo, DBMS e software specificamente preinstallati e pre-ottimizzati per il data warehousing. Le appliance di data warehouse forniscono soluzioni per il mercato del data warehouse di medie e grandi dimensioni, offrendo prestazioni a basso costo sui volumi di dati nell'intervallo da terabyte a petabyte (sono molti dati!).
La maggior parte dei fornitori di appliance di data warehouse utilizza architetture di elaborazione in parallelo (MPP) per fornire elevate prestazioni di query e scalabilità della piattaforma. Le architetture MPP sono composte da processori o server indipendenti che eseguono in parallelo.
La maggior parte delle architetture MPP implementano un'architettura nulla condivisa , in cui ogni server è autosufficiente e controlla la propria memoria e il proprio disco. Le architetture condivise non hanno una comprovata esperienza di elevata scalabilità e poca contesa.
La maggior parte delle appliance di data warehouse distribuisce i dati su unità di archiviazione disco dedicate collegate a ciascun server nell'appliance. Questa distribuzione consente alle appliance di risolvere una query relazionale analizzando i dati su ciascun server in parallelo. L'approccio divide et impera offre elevate prestazioni e scalabilità lineare quando si aggiungono nuovi server nell'architettura.
E, dal punto di vista del prezzo, la maggior parte dei venditori in questa arena sta tentando una strategia di plug-and-play. Ad esempio, Netezza generalmente vende a un nuovo utente il proprio prodotto come plug-compatibile con Teradata per meno del costo di manutenzione di Teradata. Questo punto di prezzo rende i prodotti molto attraenti, dando loro un tasso di adozione in crescita.