Casa Finanza personale Hadoop come archivio interrogabile di dati di magazzino freddi - manichini

Hadoop come archivio interrogabile di dati di magazzino freddi - manichini

Video: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2025

Video: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2025
Anonim

Numerosi studi mostrano che la maggior parte dei dati in un data warehouse aziendale viene interrogata raramente. I fornitori di database hanno risposto a tali osservazioni implementando i propri metodi per l'individuazione dei dati da inserire.

Un metodo ordina l'universo dati in design di caldo, caldo o freddo, dove caldo dati (a volte chiamato attivo dati) è usato spesso, caldo i dati sono usati di volta in volta, e i dati a freddo sono usati raramente.La soluzione proposta per molti fornitori è per archiviare i dati a freddo su dischi più lenti all'interno dei contenitori del data warehouse o per creare intelligenti strategie di memorizzazione nella cache per mantenere in memoria i dati più caldi, tra gli altri.

Il problema con questo approccio è che anche se viene utilizzata una memoria più lenta, è ancora costoso archiviare i dati freddi e raramente usati in un magazzino. licenze hardware e software. Allo stesso tempo, i dati a freddo e in sospeso vengono spesso archiviati su nastro.

Questo modello tradizionale di archiviazione dei dati si interrompe quando si desidera interrogare tutti i dati a freddo in modo economico e relativamente efficiente, in altre parole, senza richiedere vecchi nastri.

Se si considerano i costi e le caratteristiche operative di Hadoop, sembra che sia destinato a diventare il nuovo nastro di backup. Hadoop è economico in gran parte perché i sistemi Hadoop sono progettati per utilizzare un hardware di livello inferiore rispetto a quello normalmente utilizzato nei sistemi di data warehouse. Un altro significativo risparmio sui costi è la concessione di licenze software.

Le licenze di distribuzione commerciali Hadoop richiedono una frazione del costo delle licenze di software di data warehouse relazionale, notoriamente costose. Dal punto di vista operativo, Hadoop è progettato per scalare facilmente semplicemente aggiungendo ulteriori nodi slave a un cluster esistente. E man mano che i nodi slave vengono aggiunti e gli insiemi di dati crescono di volume, i framework di elaborazione dei dati di Hadoop consentono alle applicazioni di gestire senza problemi l'aumento del carico di lavoro.

Hadoop rappresenta un modo semplice, flessibile ed economico per spingere l'elaborazione su letteralmente migliaia di server.

Con la sua architettura scalabile ed economica, Hadoop sembra essere una scelta perfetta per l'archiviazione dei dati di magazzino … tranne che per una piccola questione: la maggior parte del mondo IT funziona su SQL e SQL da solo non funziona bene con Hadoop.

Certo, il movimento NoSQL più Hadoop-friendly è vivo e vegeto, ma la maggior parte degli utenti esperti ora usa SQL tramite set di strumenti comuni e pronti all'uso che generano query SQL sotto il cofano - prodotti come Tableau, Microsoft Excel e IBM Cognos BI.

È vero che l'ecosistema Hadoop include Hive, ma Hive supporta solo un sottoinsieme di SQL e, sebbene le prestazioni stiano migliorando (insieme al supporto SQL), non è altrettanto veloce nel rispondere alle query più piccole come lo sono i sistemi relazionali. Recentemente, ci sono stati importanti progressi nell'accesso SQL a Hadoop, che ha spianato la strada a Hadoop per diventare la nuova destinazione per gli archivi di data warehouse online.

A seconda del fornitore Hadoop, le API SQL (o simili a SQL) stanno diventando disponibili in modo che i più comuni strumenti di reporting e analisi off-the-shelf possano emettere senza problemi l'SQL che viene eseguito sui dati archiviati in Hadoop. Ad esempio, IBM ha la sua API Big SQL, Cloudera ha Impala e Hive stesso, tramite l'iniziativa Hortonworks Stinger, sta diventando sempre più conforme a SQL.

Esistono diversi punti di vista (alcuni mirano a migliorare Hive, altri a estendere Hive e altri a fornire un'alternativa), tutte queste soluzioni tentano di affrontare due problemi: MapReduce è una soluzione scadente per l'esecuzione di query più piccole, e l'accesso SQL è - per ora - la chiave per consentire agli operatori IT di utilizzare le loro competenze SQL esistenti per ottenere valore dai dati archiviati in Hadoop.

Hadoop come archivio interrogabile di dati di magazzino freddi - manichini

Scelta dell'editore

Soluzioni software per i tuoi bisogni fotografici digitali - manichini

Soluzioni software per i tuoi bisogni fotografici digitali - manichini

Il software fotografico che usi è fondamentale per il tuo successo la camera oscura digitale come l'hardware. La buona notizia è che se le tue esigenze sono basilari - vuoi solo visualizzare e organizzare le tue foto e magari ritagliare un'immagine o due - potresti non dover pagare una monetina per ...

Prendi Great Nature Photographs - dummies

Prendi Great Nature Photographs - dummies

Quando fotografi un posto bellissimo, il tuo obiettivo dovrebbe essere per qualcuno di dire "I vorrei essere lì. "In una fotografia di grande natura, il tuo obiettivo non è quello di inviare l'immagine a qualcuno e dire:" Ero qui. "Quando visiti un bellissimo paesaggio o vedi un fiore colorato o un animale che vuoi ...

Scattare una foto di un soggetto in movimento con la tua fotocamera digitale - dummies

Scattare una foto di un soggetto in movimento con la tua fotocamera digitale - dummies

Probabilmente vorresti scatta foto sulla tua fotocamera digitale di persone o cose che si muovono. Quando scatti foto di soggetti in movimento, utilizza questi trucchi per fermare un oggetto in movimento nelle sue tracce:

Scelta dell'editore

Personalizza le fatture di QuickBooks 2014 con lo Strumento di progettazione layout - dummy

Personalizza le fatture di QuickBooks 2014 con lo Strumento di progettazione layout - dummy

Forse hai utilizzato QuickBooks 2014 di base Finestra di dialogo Personalizzazione per apportare alcune modifiche all'aspetto della fattura e non sono stati soddisfatti. Forse hai fatto il miglio in più e ti sei gingillato con la finestra di dialogo Personalizzazione aggiuntiva per apportare ulteriori modifiche, e forse anche questo non ti ha lasciato felice con l'aspetto della tua fattura. ...

Debito Rapporto di equità in QuickBooks 2012 - dummies

Debito Rapporto di equità in QuickBooks 2012 - dummies

Il rapporto di indebitamento è uno dei rapporti di leva che è possibile utilizzare in QuickBooks 2012. Un indice di equity debt confronta il debito a lungo termine di un'impresa con il patrimonio netto di un azionista o il patrimonio netto del proprietario. In sostanza, il rapporto tra indebitamento e debito esprime il debito a lungo termine dell'impresa come percentuale del capitale proprio del proprietario. L'equity azionario è sinonimo di proprietario ...

Debito Rapporto di equità in QuickBooks 2014 - manichini

Debito Rapporto di equità in QuickBooks 2014 - manichini

Puoi tenere traccia del tuo rapporto di indebitamento in QuickBooks. Un rapporto di indebitamento di debito confronta il debito a lungo termine di un'impresa con il patrimonio netto di un azionista o il patrimonio netto del proprietario. In sostanza, il rapporto tra indebitamento e debito esprime il debito a lungo termine dell'impresa come percentuale del capitale proprio del proprietario. L'equity azionario è sinonimo di equità del proprietario e, nel caso di ...

Scelta dell'editore

Come gestire i consigli di LinkedIn che hai ricevuto - dummies

Come gestire i consigli di LinkedIn che hai ricevuto - dummies

Ogni volta che ricevi una raccomandazione da qualcun altro, vedi un messaggio nella tua casella di posta in arrivo su LinkedIn. Dovrai gestirli per tenere d'occhio ciò che appare sul tuo profilo in un dato momento. Quando ricevi una raccomandazione, hai queste opzioni: Accetta e mostralo sul tuo profilo. Fai clic su ...

Come unire un gruppo LinkedIn - dummies

Come unire un gruppo LinkedIn - dummies

Quando guardi i gruppi di LinkedIn là fuori, uno dei le cose più importanti da tenere a mente è che dovresti unirti solo a quei gruppi che sono rilevanti per te. Anche se potresti pensare che sia divertente entrare in un altro gruppo di associazioni di alunni oltre alla tua alma mater, non ti sarà di grande aiuto nel ...

Come commercializzare il tuo business tramite LinkedIn - dummies

Come commercializzare il tuo business tramite LinkedIn - dummies

LinkedIn può giocare un ruolo significativo nell'efficace marketing di i tuoi affari. Il valore di LinkedIn come strumento di marketing ottiene un sacco di interesse dai dipartimenti finanziari della maggior parte delle aziende, soprattutto perché vedono LinkedIn come un modo libero di commercializzare il business. Anche se non devi pagare nulla in termini di denaro per prendere ...