Sommario:
- Grande virtualizzazione dei server di dati
- Virtualizzazione delle applicazioni Big Data
- Grande virtualizzazione della rete di dati
- Grande processore di dati e virtualizzazione della memoria
- Big data e virtualizzazione dello storage
Video: PERCHÉ RUBANO I DATI DAL TUO SMARTPHONE (e cosa ci fanno) - Ugo Mattei 2024
La soluzione delle sfide dei big data richiede la gestione di grandi volumi di archivi di dati altamente distribuiti insieme all'uso di e applicazioni ad alta intensità di dati. La virtualizzazione fornisce il livello aggiuntivo di efficienza per trasformare le piattaforme di big data in realtà. Sebbene la virtualizzazione non sia tecnicamente un requisito per l'analisi dei big data, i framework software sono più efficienti in un ambiente virtualizzato.
La virtualizzazione ha tre caratteristiche che supportano la scalabilità e l'efficienza operativa richieste per ambienti Big Data:
-
Partizionamento: Nella virtualizzazione, molte applicazioni e sistemi operativi sono supportati in un singolo sistema fisico da partizionamento delle risorse disponibili.
-
Isolamento: Ogni macchina virtuale è isolata dal suo sistema fisico host e da altre macchine virtualizzate. A causa di questo isolamento, se un'istanza virtuale si arresta in modo anomalo, le altre macchine virtuali e il sistema host non sono interessati. Inoltre, i dati non vengono condivisi tra un'istanza virtuale e un'altra.
-
Incapsulamento: Una macchina virtuale può essere rappresentata come un singolo file, quindi è possibile identificarlo facilmente in base ai servizi che fornisce.
Grande virtualizzazione dei server di dati
Nella virtualizzazione dei server, un server fisico è suddiviso in più server virtuali. L'hardware e le risorse di una macchina, tra cui la memoria ad accesso casuale (RAM), CPU, disco rigido e controller di rete, possono essere virtualizzati in una serie di macchine virtuali che eseguono ciascuna le proprie applicazioni e il proprio sistema operativo.
Una macchina virtuale (VM) è una rappresentazione software di una macchina fisica che può eseguire o eseguire le stesse funzioni della macchina fisica. Un sottile strato di software viene effettivamente inserito nell'hardware che contiene un monitor della macchina virtuale o hypervisor .
La virtualizzazione del server utilizza l'hypervisor per fornire efficienza nell'uso delle risorse fisiche. Naturalmente, l'installazione, la configurazione e le attività amministrative sono associate alla configurazione di queste macchine virtuali.
La virtualizzazione dei server aiuta a garantire che la piattaforma possa scalare in base alle esigenze per gestire i grandi volumi e i vari tipi di dati inclusi nell'analisi dei big data. Potresti non conoscere l'entità del volume necessario prima di iniziare l'analisi. Questa incertezza rende ancora più necessaria la virtualizzazione dei server, fornendo all'ambiente la capacità di soddisfare la richiesta inaspettata per l'elaborazione di set di dati di grandi dimensioni.
Inoltre, la virtualizzazione dei server fornisce la base che consente a molti servizi cloud utilizzati come origini dati in un'analisi di grandi quantità di dati. La virtualizzazione aumenta l'efficienza del cloud che rende più facili da ottimizzare molti sistemi complessi.
Virtualizzazione delle applicazioni Big Data
La virtualizzazione dell'infrastruttura delle applicazioni offre un modo efficiente di gestire le applicazioni nel contesto della domanda dei clienti. L'applicazione è incapsulata in un modo che rimuove le sue dipendenze dal sistema del computer fisico sottostante. Questo aiuta a migliorare la gestibilità generale e la portabilità dell'applicazione.
Inoltre, il software di virtualizzazione dell'infrastruttura applicativa consente in genere la codifica delle politiche aziendali e di utilizzo tecnico per garantire che ciascuna delle vostre applicazioni sfrutti risorse virtuali e fisiche in modo prevedibile. Le efficienze si ottengono perché è possibile distribuire più facilmente le risorse IT in base al valore aziendale relativo delle applicazioni.
La virtualizzazione dell'infrastruttura applicativa utilizzata in combinazione con la virtualizzazione dei server può aiutare a garantire il rispetto degli accordi a livello di servizio aziendale. La virtualizzazione del server monitora l'utilizzo della CPU e della memoria, ma non tiene conto delle variazioni nella priorità aziendale durante l'allocazione delle risorse.
Grande virtualizzazione della rete di dati
La virtualizzazione della rete fornisce un modo efficiente per utilizzare la rete come un pool di risorse di connessione. Invece di affidarsi alla rete fisica per gestire il traffico, è possibile creare più reti virtuali utilizzando la stessa implementazione fisica. Questo può essere utile se è necessario definire una rete per la raccolta dei dati con un determinato insieme di caratteristiche e capacità di rendimento e un'altra rete per applicazioni con prestazioni e capacità diverse.
La virtualizzazione della rete consente di ridurre questi colli di bottiglia e migliorare la capacità di gestire i grandi dati distribuiti necessari per l'analisi dei big data.
Grande processore di dati e virtualizzazione della memoria
La virtualizzazione del processore consente di ottimizzare il processore e massimizzare le prestazioni. La virtualizzazione della memoria disaccoppia la memoria dai server.
Nell'analisi dei big data, potresti aver ripetuto query di set di dati di grandi dimensioni e la creazione di algoritmi analitici avanzati, tutti progettati per cercare modelli e tendenze non ancora compresi. Queste analisi avanzate possono richiedere molta potenza di elaborazione (CPU) e memoria (RAM). Per alcuni di questi calcoli, può richiedere molto tempo senza sufficienti risorse di CPU e memoria.
Big data e virtualizzazione dello storage
La virtualizzazione dei dati può essere utilizzata per creare una piattaforma per servizi dati dinamici collegati. Ciò consente di ricercare e collegare facilmente i dati tramite una fonte di riferimento unificata. Di conseguenza, la virtualizzazione dei dati fornisce un servizio astratto che fornisce dati in una forma coerente indipendentemente dal database fisico sottostante. Inoltre, la virtualizzazione dei dati espone i dati memorizzati nella cache a tutte le applicazioni per migliorare le prestazioni.
La virtualizzazione dello storage combina le risorse di storage fisico in modo che siano condivise in modo più efficace. Ciò riduce il costo dello storage e semplifica la gestione degli archivi dati necessari per l'analisi dei big data.