Gestione di diversi tipi di dati con NoSQL - dummies
I database noSQL non sono limitati a un approccio di righe e colonne . Sono progettati per gestire una grande varietà di dati, compresi i dati la cui struttura cambia nel tempo e le cui interrelazioni non sono ancora note. I database NoSQL sono disponibili in quattro tipi principali: uno per ogni tipo di dati che il database deve gestire: Colonna: estensione al tradizionale ...
Corrispondenza di dati per algoritmi da varie fonti - manichini
L'interazione con i dati da una singola fonte è un problema; interagire con i dati di diverse fonti è tutt'altra cosa. Tuttavia, i set di dati oggi provengono generalmente da più di una fonte, quindi è necessario comprendere le complicazioni che possono derivare dall'utilizzo di più origini dati. Quando si lavora con più origini dati, è necessario effettuare le seguenti operazioni: Determinare ...
Gestione delle chiavi in NoSQL - dummies
Le capacità di lettura veloce dei negozi di valori-chiave derivano dal loro uso di chiavi ben definite. Queste chiavi sono tipicamente hash, il che fornisce all'archivio dei valori-chiave un modo molto prevedibile per determinare su quale partizione (e quindi sul server) risiedono i dati. Un server particolare gestisce una o più partizioni. Una buona chiave ti consente di identificare in modo univoco il singolo record ...
Gestione dei dati in NoSQL - dummies
Una volta gestite le chiavi in modo appropriato, sei pronto per progettare come archiviare i dati con NoSQL e assicurarsi che sia sicuro e sempre accessibile per il lavoro che devi fare. Tipi di dati negli archivi di valori-chiave In genere gli archivi di valori-chiave funzionano come & ldquo; secchi & rdquo; per dati binari. Alcuni database forniscono una forte digitazione interna dei dati e persino ...
Apache Zookeeper e NoSQL Databases - dummies
Un grosso cluster di database NoSQL è una cosa ingombrante da gestire. Apache Zookeeper in soccorso! Tenendo traccia di quali nodi si trovano nel cluster, quali sono i dati gestiti da ciascuno e assicurando che i nuovi master siano selezionati quando un master ha esito negativo non sono compiti facili. Il coordinamento di grandi sistemi distribuiti è quindi molto difficile. Entrambi Hadoop ...
Gestione delle informazioni utente con NoSQL - dummies
Ci sono dati mission-critical e ci sono dati di supporto. Va bene se i dati mission-critical appaiono un po 'lentamente, perché vuoi essere sicuro che sia sicuro e gestito correttamente. Ma non vuoi che i dati di supporto della tua applicazione ostacolino le transazioni complessive e le esperienze degli utenti. Sebbene i dati di supporto possano avere un valore inferiore, il suo ...
Document NoSQL Versus ECM - dummies
I sistemi di gestione dei contenuti aziendali (ECM) esistono da oltre dieci anni. Il documento NoSQL potrebbe offrire una certa concorrenza. Esempi di ECM includono IBM FileNet, DB2 Content Manager e EMC Documentum. Molte aziende più piccole, come Stellent (ora Oracle), sono state incorporate in offerte più ampie. Un sistema ECM semplificato, chiamato Basic Content Services, è anche apparso ...
Triple e Graph Stores - dummies
Sembrano rompere con le convenzioni associate a NoSQL. Per prima cosa, sono tutti compatibili con ACID. A differenza della maggior parte dei database NoSQL correnti, molti negozi tripli sono solo proprietari. Inoltre, esistono standard aperti per le applicazioni semantiche in un modo che non è il caso per gli archivi di valore-chiave, gli archivi a colonne Bigtable / wide e i database NoSQL del documento. Totalmente dipendenti da ...
Altri database NoSQL ibridi - dummies
Ci sono alcuni database NoSQL che probabilmente sentirai nominare spesso - OrientDB e MarkLogic e forse, ArangoDB. Tuttavia, ci sono altri database ibridi NoSQL di interesse. FoundationDB FoundationDB è un archivio di valori-chiave compatibile con ACID open-source. La particolarità di FoundationDB è che è progettato per consentire agli sviluppatori di collegare in modo efficiente i propri dati ...
NoSQL Funzioni di ricerca da considerare - dummies
Molti database NoSQL supportano funzionalità di query e determinate funzionalità di ricerca. Scegliere quello giusto spesso si riduce alla comprensione delle funzionalità che è necessario supportare. Sebbene siano correlati, query e ricerca sono piuttosto diversi. Una query restituisce solo i risultati che corrispondono a tutti i termini in esso contenuti. La ricerca, d'altra parte, può includere facoltativo ...
Microtargeting per Win Elezioni - manichini
La maggior parte delle campagne politiche dipendono dai consulenti per fornire ricerche sugli elettori, oppure cavarsela con molto informale valutazioni degli atteggiamenti degli elettori e interesse a votare per un particolare candidato (o votare a tutti). Ma negli ultimi anni, alcune campagne politiche, tra cui campagne di candidati e di emissioni, hanno iniziato a utilizzare il microtargeting, programmi organizzati di indagine ...
NoSQL e motori di ricerca - dummies
Può sembrare strano parlare di motori di ricerca e NoSQL insieme, ma molti dei motori di ricerca odierni utilizzare un'architettura molto simile ai database NoSQL. I loro indici e l'elaborazione delle query sono altamente distribuiti. Molti motori di ricerca sono persino in grado di agire come un valore chiave o un negozio di documenti a pieno titolo. I database NoSQL sono spesso ...
L'organizzazione di dati per Mining - manichini
Di data mining ha requisiti molto rigorosi per l'organizzazione dei dati. Non sono requisiti esotici, complessi o difficili da soddisfare, ma sono rigorosi. La figura mostra un campione di dati visualizzati come una tabella nel software di data mining. Ogni riga rappresenta un pacco di beni immobili. Informazioni sui pacchi immobiliari sono organizzate in ...
10 Applicazioni NoSQL killer - manichini
Spesso le persone acquistano una piattaforma particolare a causa delle app killer che vengono eseguite su di essa. Molte applicazioni basate su NoSQL rientrano nella categoria dell'app killer. Queste applicazioni non avrebbero potuto diventare realtà utilizzando le tecnologie di database relazionali esistenti. La piattaforma di messaggistica di Facebook Apache Cassandra è stata creata da Facebook per potenziare la Posta in arrivo. Lo ha fatto per un ...
Funzioni non comuni di NoSQL - dummies
Anche se alcune funzionalità sono abbastanza comuni ai database NoSQL ( ad esempio, l'agnosticismo dello schema e la struttura non relazionale), non è raro che un database manchi di una o più delle seguenti funzionalità e si qualifichi ancora come un moderno database NoSQL. Il software open source NoSQL è unico perché il movimento open source ha guidato lo sviluppo piuttosto che seguire un ...
Prestazioni e Big Data - dummies
Avere un computer più veloce non è sufficiente per garantire il giusto livello di prestazioni da gestire grandi dati Devi essere in grado di distribuire componenti del tuo servizio Big Data attraverso una serie di nodi. Nel calcolo distribuito, un nodo è un elemento contenuto all'interno di un cluster di sistemi o all'interno di un rack. A ...
Superamento della carenza di competenze in materia di grandi quantità di dati - manichini
Capacità di grandi quantità di dati scarseggiano. Poiché la quantità di informazioni digitali generate dalle aziende è cresciuta in modo esponenziale, è sorta una sfida (alcuni la chiamano addirittura una crisi): non ci sono abbastanza persone con le competenze necessarie per analizzare e interpretare tutti questi grandi dati. In un recente sondaggio, più della metà di ...
Fase 5 del modello di processo CRISP-DM: valutazione - manichini
Nei primi quattro fasi del modello di processo Cross-Industry Standard for Data Mining (CRISP-DM), hai esplorato i dati e hai trovato dei pattern, e ora devi chiedere: i risultati sono buoni? Valuterai non solo i modelli che hai creato, ma anche il processo che hai utilizzato per crearli e il loro potenziale ...
NoSQL Termini e definizioni - dummies
Avere la testa attorno a NoSQL può essere un po 'difficile. Se hai studiato database a scuola, potresti essere stato indottrinato in un modo relazionale di pensare. Dire database alla maggior parte delle persone e pensano al sistema di gestione dei database relazionali. Questo è naturale perché negli ultimi 30 anni, il RDBMS è stato così dominante. Per ...
NoSQL For Dummies Cheat Sheet - dummies
Come sviluppatore NoSQL, selezionando la giusta categoria di prodotto e il prodotto giusto è il primo passo. Queste guide confrontano le funzionalità più importanti in alcuni dei più popolari database NoSQL.
Per garantire la governance dei Big Data - manichini
Con le sfide di governance presentate dai big data, è saggio e assolutamente necessario disporre di pratiche per garantire la protezione delle informazioni dell'utente. Anche se il grado in cui lo fai varia a seconda della tua attività, assicurati di adottare le necessarie precauzioni. Controlla il tuo processo Big Data Al ...
Mettere in pratica le nozioni fondamentali sul modellamento delle informazioni di edifici - manichini
Ma ottenere i fondamenti giusti è tutto nella preparazione. BIM ti consente di creare nuovi processi e flussi di lavoro e di lavorare in modo collaborativo sui tuoi progetti. Il BIM è utile per tutta la cronologia del progetto dalla fase di progettazione, costruzione e poi oltre ...
Metti insieme i tuoi Big Data - manichini
Come saprai mettere insieme tutti i tuoi dati? Con un progetto di Big Data, quello che vuoi fare con i tuoi dati strutturati e non strutturati indica perché potresti scegliere un pezzo di tecnologia rispetto a un altro. Determina anche la necessità di comprendere le strutture di dati in entrata per inserire questi dati in ...
Fase 6 del modello di processo CRISP-DM: Deployment - dummies
La distribuzione è dove i dati l'attività mineraria paga. In questa fase finale del processo Cross-Industry Standard Process for Data Mining (CRISP-DM), non importa quanto siano brillanti le tue scoperte, o quanto perfettamente i tuoi modelli si adattino ai dati, se non li usi effettivamente cose per migliorare il modo in cui fai affari. La distribuzione ...
Fase 3 del modello di processo CRISP-DM: preparazione dati - manichini
Data miners trascorrono la maggior parte del loro tempo nella terza fase del modello di processo Cross-Industry Standard Process for Data Mining (CRISP-DM): preparazione dei dati. La maggior parte dei dati utilizzati per il data mining è stata originariamente raccolta e conservata per altri scopi e necessita di alcuni perfezionamenti prima che sia pronta per l'uso per la modellazione. La fase di preparazione dei dati comprende ...
Fase 4 del modello di processo CRISP-DM: modellazione - dummies
La modellazione è la parte del modello di processo Cross-Industry Standard per il data mining (CRISP-DM) che la maggior parte dei minatori di dati preferiscono. I tuoi dati sono già in buone condizioni e ora puoi cercare modelli utili nei tuoi dati. La fase di modellazione comprende quattro compiti. Questi sono Selezione delle tecniche di modellazione Esecuzione di test Esecuzione di modelli di costruzione ...
Fase 1 del modello di processo CRISP-DM: Business Understanding - dummies
The Cross -Industry Process standard per Data Mining (CRISP-DM) è la struttura di processo dominante per il data mining. Nella prima fase di un progetto di data mining, prima di accedere a dati o strumenti, si definisce ciò che si è in procinto di realizzare e si definiscono i motivi per cui si desidera raggiungere questo obiettivo. La fase di comprensione aziendale comprende quattro attività (primaria ...
Metti in atto la struttura organizzativa dei Big Data giusta - dummies
Tipicamente, le aziende iniziano il loro viaggio verso la grande dati iniziando con un esperimento organizzativo per vedere se i big data possono avere un ruolo importante nella definizione e nell'impatto della strategia aziendale. Tuttavia, dopo che è diventato chiaro che i big data avranno un ruolo strategico come parte dell'ambiente di gestione delle informazioni, devi assicurarti che ...
Fase 2 del modello di processo CRISP-DM: comprensione dei dati - dummies
Nel seconda fase del modello di processo Cross-Industry Standard per il data mining (CRISP-DM), si ottengono i dati e si verifica che sia appropriato per le proprie esigenze. Potresti identificare problemi che ti inducono a tornare alla comprensione del business e a rivedere il tuo piano. Potresti persino scoprire difetti nella comprensione della tua azienda, un altro motivo per ...
Riduzione del Time to Value in NoSQL - dummies
Time to value è la quantità di tempo richiesta dall'avvio di un progetto IT per essere in grado di realizzare benefici commerciali. Questo può essere un vantaggio tangibile nella riduzione dei costi o nella possibilità di effettuare nuove transazioni o vantaggi intangibili come fornire un servizio clienti migliore o prodotti. Gli archivi a valore-chiave sono i database NoSQL più semplici per quanto riguarda ...
Ricerca di dati personali - dummy
Ora che sei un minatore di dati, sei anche un ricercatore principale. Sembra più scientifico, vero? La tua ricerca è primaria perché inizierai da dati grezzi (di base, non elaborati) e li analizzerai per aggiungere qualcosa di nuovo alla conoscenza del mondo. Probabilmente integrerai anche alcune ricerche secondarie nel tuo lavoro. In altre parole, ...
Controllo degli accessi basato sui ruoli in NoSQL - dummies
Uno dei metodi più comuni di protezione dei dati in NoSQL è per assegnare ogni record (o documento o grafico, a seconda del tipo di database) con una serie di autorizzazioni collegate ai ruoli. Questo è il controllo degli accessi basato sui ruoli, o RBAC in breve. Considera un comunicato stampa per un sito web che viene archiviato in ...
Ridimensionamento NoSQL - dummies
Una caratteristica comune dei sistemi NoSQL è la loro capacità di scalare su molti server commodity. Queste piattaforme relativamente economiche ti consentono di scalare i database aggiungendo un nuovo server piuttosto che sostituire il vecchio hardware con un nuovo hardware più potente in una singola operazione. Ci sono casi d'uso di volume elevato che ti costringono a forzare rapidamente ...
Fogli di calcolo, XML e formati di dati speciali - dummy
Potrebbe essere necessario utilizzare i dati contenuti in un foglio di calcolo , XML (linguaggio di markup estensibile) o una dozzina di formati meno comuni. La domanda chiave sarà sempre: l'applicazione di data mining importa i dati in quel formato? Finché l'applicazione di data mining ha uno strumento per leggere il formato dei dati di cui hai bisogno, il processo ...
Imposta la giusta base per i Big Data - manichini
Così, come inizi il tuo viaggio verso la creazione l'ambiente giusto in modo che tu sia pronto sia a sperimentare con i big data sia a prepararti ad espandere l'uso dei big data quando sei pronto? Dovrai investire in nuove tecnologie per il tuo data center? Puoi sfruttare il cloud ...
Considerazioni sulla sicurezza con i Big Data - manichini
Mentre le aziende sono molto preoccupate per la sicurezza e la governance dei dati in generale, le iniziative sui big data arrivano con certe complessità e problemi imprevisti che molte aziende non sono pronte a gestire. Spesso l'analisi dei big data è condotta con una vasta gamma di fonti di dati che potrebbero provenire da molte fonti non violate. Inoltre, il tuo ...
Simulando l'uso di macchine astratte con algoritmi - dummies
Più operazioni richiede un algoritmo, più è complesso. La complessità è una misura dell'efficienza dell'algoritmo in termini di utilizzo del tempo poiché ogni operazione richiede del tempo. Dato lo stesso problema, gli algoritmi complessi sono generalmente meno favorevoli rispetto agli algoritmi semplici perché gli algoritmi complessi richiedono più tempo. Pensa a quei tempi in cui la velocità di ...
Setacciare i dati necessari - dummies
Quando si esegue il data mining, a volte si avranno più dati di hai bisogno di un determinato progetto. Ecco come ridimensionare ciò di cui hai bisogno. Limitazione dei campi Quando si hanno molte variabili in un set di dati, può essere difficile trovare o vedere quelli che ti interessano. E se i tuoi set di dati ...
Perché l'ordinamento dei dati è importante per gli algoritmi - dummies
Immagina di cercare un elemento in una lista senza ordinarlo primo. Ogni ricerca diventa una ricerca sequenziale che richiede tempo. Ma, può essere fatto un caso per non ordinare i dati per gli algoritmi. Dopo tutto, i dati sono ancora accessibili, anche se non lo si ordina, e l'ordinamento richiede tempo. Naturalmente, il problema con ...
Archivia Big Data con HBase - dummies
HBase è un database distribuito non correlato (colonnare) che utilizza HDFS come sua persistenza negozio per progetti di big data. È modellato su Google BigTable ed è in grado di ospitare tabelle molto grandi (miliardi di colonne / righe) perché è stratificato su cluster Hadoop di hardware commodity. HBase fornisce accesso in lettura / scrittura casuale e in tempo reale ai big data. HBase ...