Casa Finanza personale NoSQL Data Stores contro Hadoop - dummies

NoSQL Data Stores contro Hadoop - dummies

Video: Next-Generation Access Control for Hadoop, HBase and other NoSQL Databases 2025

Video: Next-Generation Access Control for Hadoop, HBase and other NoSQL Databases 2025
Anonim

I data store NoSQL originariamente sottoscrivevano la nozione "Just Say No to SQL" (per parafrasare da un campagna pubblicitaria anti-droga negli anni '80), ed erano una reazione ai limiti percepiti dei database relazionali (basati su SQL). Non è che queste persone odiassero SQL, ma erano stanchi di forzare i pioli quadrati in fori rotondi risolvendo problemi per i quali non erano stati progettati database relazionali.

Un database relazionale è uno strumento potente, ma per alcuni tipi di dati (come coppie di valori-chiave o grafici) e alcuni schemi di utilizzo (come l'archiviazione su larga scala) un database relazionale non è t pratico. E quando si tratta di archiviazione ad alto volume, il database relazionale può essere costoso, sia in termini di costi di licenza del database che di costi hardware. (I database relazionali sono progettati per funzionare con hardware di livello enterprise.)

Quindi, con il movimento NoSQL, i programmatori creativi hanno sviluppato dozzine di soluzioni per diversi tipi di problemi spinosi di archiviazione e elaborazione dei dati. Questi database NoSQL in genere forniscono una scalabilità enorme tramite clustering e sono spesso progettati per consentire un throughput elevato e bassa latenza.

Il nome NoSQL è in qualche modo fuorviante perché molti database che si adattano alla categoria fanno hanno supporto SQL (piuttosto che supporto "NoSQL"). Pensa al suo nome come "Non solo SQL". “

Le offerte NoSQL disponibili oggi possono essere suddivise in quattro categorie distinte, in base al loro design e scopo:

  • Punti vendita chiave: Questa offerta offre un modo per memorizzare qualsiasi tipo di dati senza dover utilizzare uno schema. Ciò è in contrasto con i database relazionali, in cui è necessario definire lo schema (la struttura della tabella) prima di inserire qualsiasi dato. Poiché gli archivi di valori-chiave non richiedono uno schema, si ha una grande flessibilità per archiviare i dati in molti formati.

    In un archivio di valori-chiave, una riga consiste semplicemente in una chiave (un identificatore) e un valore, che può essere qualsiasi cosa, da un valore intero a una grande stringa di dati binari. Molte implementazioni di negozi con valore chiave si basano sulla carta Dynamo di Amazon.

  • Depositi famigliari di colonne: Qui si hanno database in cui le colonne sono raggruppate in famiglie di colonne e memorizzate insieme su disco.

    Strettamente parlando, molti di questi database non sono orientati alle colonne, perché sono basati sulla carta BigTable di Google, che memorizza i dati come una mappa ordinata multidimensionale.

  • Archivio documenti: Questa offerta si basa su raccolte di documenti con codifica e formattazione simile per migliorare l'efficienza.Gli archivi di documenti consentono ai singoli documenti di una raccolta di includere solo un sottoinsieme di campi, quindi vengono memorizzati solo i dati necessari. Per i set di dati sparsi, dove molti campi spesso non sono popolati, questo può tradursi in significativi risparmi di spazio.

    Al contrario, le colonne vuote nelle tabelle del database relazionale occupano spazio. Gli archivi di documenti consentono anche la flessibilità dello schema, poiché vengono memorizzati solo i campi necessari e possono essere aggiunti nuovi campi. Ancora una volta, a differenza dei database relazionali, le strutture delle tabelle sono definite in anticipo prima che i dati vengano archiviati e la modifica delle colonne è un compito noioso che influisce sull'intero set di dati.

  • Database di grafici: Qui sono presenti database che memorizzano strutture di grafici - rappresentazioni che mostrano raccolte di entità (vertici o nodi) e le loro relazioni (bordi) tra loro. Queste strutture consentono ai database di grafi di essere estremamente adatti per l'archiviazione di strutture complesse, come le relazioni di collegamento tra tutte le pagine Web conosciute. (Ad esempio, le singole pagine Web sono nodi, e gli spigoli che li collegano sono collegamenti da una pagina all'altra.)

    Google, ovviamente, utilizza tutta la tecnologia grafica e ha inventato un motore di elaborazione grafico chiamato Pregel per alimentare il suo PageRank algoritmo. (E sì, c'è un white paper su Pregel.) Nella comunità Hadoop, c'è un progetto Apache chiamato Giraph (basato sulla carta Pregel), che è un motore di elaborazione grafica progettato per elaborare grafici memorizzati in HDFS.

Le opzioni di archiviazione e elaborazione dei dati disponibili in Hadoop sono in molti casi implementazioni delle categorie NoSQL elencate qui. Questo ti aiuterà a valutare meglio le soluzioni a tua disposizione e vedere come Hadoop può integrare i tradizionali data warehouse.

NoSQL Data Stores contro Hadoop - dummies

Scelta dell'editore

Vantaggi di base della rete - manichini

Vantaggi di base della rete - manichini

Se la verità viene detta, le reti di computer sono un problema da impostare. Perché i vantaggi di avere una rete rendono la pena di crearne uno utile. Non è necessario essere un dottorato di ricerca per comprendere i vantaggi del networking. Le reti riguardano esclusivamente la condivisione. Nello specifico, le reti riguardano la condivisione di tre elementi: informazioni, risorse, ...

Biometria L'accettazione, la privacy e la legge - manichini

Biometria L'accettazione, la privacy e la legge - manichini

La tecnologia biometrica non è affatto universalmente accettata da tutti gli utenti. Ci sono una serie di considerazioni sociali e legali che danno ad ogni organizzazione una pausa prima di fare il salto a capofitto nell'implementazione di un sistema biometrico. Le persone sono più a loro agio con i sistemi di raccolta biometrici che sono i meno intrusivi. Scanner per retina e nasi elettronici sono ...

Biometria Nozioni di base - manichini

Biometria Nozioni di base - manichini

La biometria non è roba da fantascienza. Puoi trovare una dozzina di modi più o meno efficaci per utilizzare la biometria per identificare qualcuno, ognuno dei quali si divide in due classi: la biometria fisiologica misura una parte specifica della struttura o della forma di una porzione del corpo di un soggetto. La biometria comportamentale è più interessata a come ...

Scelta dell'editore

Come creare un nuovo dizionario personalizzato in Excel 2007 - dummies

Come creare un nuovo dizionario personalizzato in Excel 2007 - dummies

In Excel 2007, è possibile creare dizionari personalizzati da utilizzare quando si esegue il controllo ortografico dei fogli di lavoro. Utilizzare il pulsante Aggiungi al dizionario nella finestra di dialogo Controllo ortografico per aggiungere parole sconosciute a un dizionario personalizzato. Per impostazione predefinita, Excel aggiunge queste parole a un file dizionario personalizzato denominato CUSTOM. DIC, ma è possibile creare una nuova personalizzazione ...

Come creare un componente aggiuntivo da un file di cartella di lavoro Excel Excel normale in VBA - modi di dire

Come creare un componente aggiuntivo da un file di cartella di lavoro Excel Excel normale in VBA - modi di dire

Sebbene sia possibile convertire qualsiasi cartella di lavoro di Excel in un componente aggiuntivo, non tutte le cartelle di lavoro traggono vantaggio da questa conversione. Una cartella di lavoro senza macro rende un componente aggiuntivo inutile. In effetti, gli unici tipi di cartelle di lavoro che traggono vantaggio dall'essere convertiti in un componente aggiuntivo sono quelli con macro. Ad esempio, una cartella di lavoro costituita da macro generiche (Sub ...

Come creare una nuova cartella di lavoro in Excel 2010 - dummy

Come creare una nuova cartella di lavoro in Excel 2010 - dummy

Se si lavora in Microsoft Excel 2010 e vuoi iniziare a lavorare in un nuovo file di cartella di lavoro di Excel, puoi facilmente creare una nuova cartella di lavoro. Per fare ciò, puoi usare un comando nella scheda File o una scorciatoia da tastiera. Fare clic sulla scheda File. Excel visualizza la visualizzazione Backstage, in cui è possibile accedere ai comandi relativi ai file. ...

Scelta dell'editore

Usa lo strumento Gomma in Adobe Illustrator CS5 - manichini

Usa lo strumento Gomma in Adobe Illustrator CS5 - manichini

Adobe Illustrator Creative Suite 5 (Adobe CS5) Illustrator è utilizzato per rimuovere rapidamente aree di grafica con la stessa facilità con cui si cancellano i pixel in Photoshop, accarezzando con il mouse su qualsiasi forma o gruppo di forme. Facendo doppio clic sullo strumento Gomma, è possibile definire il diametro, l'angolo e la rotondità della gomma. Se stai usando un ...

Trasforma gli strumenti in Adobe Illustrator CS5 - dummies

Trasforma gli strumenti in Adobe Illustrator CS5 - dummies

I più popolari strumenti di trasformazione in Adobe Creative Suite 5 (Adobe CS5) Illustrator - Rifletti, scala, inclina, rimodella e Trasformazione libera: sono facili da usare e modificano rapidamente la tua illustrazione. Lo strumento Rifletti Niente è simmetrico, giusto? Forse no, ma gli oggetti non creati simmetricamente in Illustrator possono sembrare off-kilter. Utilizzando lo strumento Rifletti, si ...

Quando utilizzare Adobe CS5 Illustrator - dummies

Quando utilizzare Adobe CS5 Illustrator - dummies

Utilizzando Adobe Creative Suite 5 (Adobe CS5) Illustrator anziché Photoshop , ottieni diversi benefici. Potresti aver sentito che Illustrator è migliore per la grafica vettoriale, ma perché e che altro porta? Illustrator può salvare ed esportare immagini nella maggior parte dei formati di file. Scegliendo di salvare o esportare, è possibile creare un ...