Video: Unifying the Cloud with Pure Cloud Data Services 2024
Esistono numerose combinazioni di modelli di implementazione e distribuzione per i big data nel cloud. Ad esempio, è possibile utilizzare un cloud pubblico IaaS o un cloud privato IaaS. Quindi, cosa significa questo per i big data e perché il cloud è adatto per questo? Bene, i big data richiedono cluster distribuiti di potenza di calcolo, che è il modo in cui il cloud è architettato.
In effetti, una serie di caratteristiche del cloud ne fanno una parte importante dell'ecosistema dei big data:
-
Scalabilità: La scalabilità per quanto riguarda l'hardware si riferisce alla capacità di passare da piccole a grandi quantità di potenza di elaborazione con la stessa architettura. Per quanto riguarda il software, si riferisce alla coerenza delle prestazioni per unità di potenza all'aumentare delle risorse hardware. Il cloud può adattarsi a grandi volumi di dati.
Il calcolo distribuito, parte integrante del modello cloud, funziona davvero su un piano "divide et impera". Quindi, se disponi di enormi volumi di dati, questi possono essere partizionati attraverso i server cloud. Una caratteristica importante di IaaS è che può scalare in modo dinamico. Ciò significa che se si richiedono più risorse del previsto, è possibile ottenerle. Questo si lega al concetto di elasticità.
-
Elasticità: L'elasticità si riferisce alla capacità di espandere o ridurre la richiesta di risorse in tempo reale, in base alle necessità. Uno dei vantaggi del cloud è che i clienti hanno il potenziale per accedere a un gran numero di servizi di cui hanno bisogno. Ciò può essere utile per i progetti di Big Data in cui potrebbe essere necessario espandere la quantità di risorse di calcolo necessarie per gestire i dati.
-
Pool di risorse: Le architetture cloud consentono la creazione efficiente di gruppi di risorse condivise che rendono il cloud economicamente sostenibile.
-
Self-service: Con il self-service, l'utente di una risorsa cloud è in grado di utilizzare un browser o un'interfaccia portale per acquisire le risorse necessarie, ad esempio, per eseguire un enorme predittivo modello. Questo è radicalmente diverso da come si potrebbero ottenere risorse da un centro dati, dove si dovrebbero richiedere le risorse dalle operazioni IT.
-
Spesso costi iniziali bassi: Se si utilizza un provider cloud, i costi iniziali possono essere spesso ridotti perché non si acquistano enormi quantità di hardware o si noleggia un nuovo spazio per gestire i big data. Sfruttando le economie di scala associate agli ambienti cloud, il cloud può sembrare attraente.
-
Pagamento anticipato: Un'opzione di fatturazione tipica per un fornitore cloud è Pay as You Go, il che significa che ti vengono addebitate le risorse utilizzate in base al prezzo dell'istanza.Questo può essere utile se non sei sicuro di quali risorse hai bisogno per il tuo progetto Big Data.
-
Fault tolerance: I provider di servizi cloud devono avere una tolleranza ai guasti integrata nella loro architettura, fornendo servizi ininterrotti nonostante il guasto di uno o più componenti del sistema.
Chiaramente, la natura stessa del cloud lo rende un ambiente di calcolo ideale per i big data. Quindi, come potresti utilizzare i big data insieme al cloud? Ecco alcuni esempi:
-
IaaS in un cloud pubblico: In questo scenario, utilizzerai l'infrastruttura di un fornitore di cloud pubblico per i tuoi servizi Big Data perché non vuoi utilizzare la tua infrastruttura fisica. IaaS può fornire la creazione di macchine virtuali con capacità di archiviazione e calcolo quasi illimitate. È possibile scegliere il sistema operativo desiderato e disporre della flessibilità necessaria per scalare in modo dinamico l'ambiente in base alle proprie esigenze.
-
PaaS in un cloud privato: PaaS è un'intera infrastruttura pacchettizzata in modo che possa essere utilizzata per progettare, implementare e distribuire applicazioni e servizi in un ambiente cloud pubblico o privato. PaaS consente a un'organizzazione di sfruttare i principali servizi middleware senza dover affrontare le complessità della gestione di singoli componenti hardware e software.
I venditori PaaS stanno iniziando a incorporare tecnologie di big data come Hadoop e MapReduce nelle loro offerte PaaS. Ad esempio, potresti voler creare un'applicazione specializzata per analizzare vaste quantità di dati medici. L'applicazione farebbe uso di dati in tempo reale e non in tempo reale. Richiederà Hadoop e MapReduce per l'archiviazione e l'elaborazione.
-
SaaS in un cloud ibrido: Qui potresti voler analizzare i dati di "voce del cliente" da più canali. Molte aziende hanno capito che una delle fonti di dati più importanti è ciò che il cliente pensa e dice della propria azienda. Ottenere l'accesso alla voce dei dati del cliente può fornire informazioni preziose sui comportamenti e le azioni. Sempre più spesso, i clienti "vocalizzano" su siti pubblici.
Il valore dell'input dei clienti può essere notevolmente migliorato incorporando questi dati pubblici nella tua analisi.