Sommario:
- Interfacce e feed per i big data
- Infrastruttura fisica per big data ridondante
- Infrastruttura per la sicurezza dei Big Data
- Fonti operative di grandi quantità di dati
Video: ? Documental - Secretos de la Arqueologia Bíblica,VIDEO,DOCUMENTALES,DOCUMENTALES DE HISTORIA,2017 2025
È importante gettare una solida base architettonica se vuoi avere successo con i big data. Oltre a supportare i requisiti funzionali, è importante supportare le prestazioni richieste. Le tue esigenze dipenderanno dalla natura dell'analisi che stai sostenendo. Avrai bisogno della giusta quantità di potenza e velocità computazionale.
La tua architettura deve anche avere la giusta quantità di ridondanza in modo da essere protetta da latenze e tempi di inattività imprevisti.
Inizia facendoti le seguenti domande:
-
Quanti dati dovrà gestire la tua organizzazione oggi e in futuro?
-
Quante volte la tua organizzazione avrà bisogno di gestire i dati in tempo reale o quasi in tempo reale?
-
Quanto rischio la tua organizzazione può permettersi? Il vostro settore è soggetto a severi requisiti di sicurezza, conformità e governance?
-
Quanto è importante la velocità per il tuo bisogno di gestire i dati?
-
Quanto devono essere certi o precisi i dati?
Interfacce e feed per i big data
Per capire come funzionano i big data nel mondo reale, è importante iniziare comprendendo la necessità di interfacce e feed. In effetti, ciò che rende grandi i big data è il fatto che si basa sulla raccolta di molti dati da molte fonti.
Pertanto, le API (Application Programming Interface) aperte saranno fondamentali per qualsiasi architettura di big data. Inoltre, tieni presente che le interfacce esistono a ogni livello e tra ogni livello della pila. Senza servizi di integrazione, i big data non possono accadere.
Infrastruttura fisica per big data ridondante
L'infrastruttura fisica di supporto è fondamentale per il funzionamento e la scalabilità di un'architettura di big data. In effetti, senza la disponibilità di solide infrastrutture fisiche, i grandi dati probabilmente non sarebbero emersi come una tendenza così importante. Per supportare un volume di dati imprevisto o imprevedibile, un'infrastruttura fisica per i big data deve essere diversa da quella dei dati tradizionali.
L'infrastruttura fisica si basa su un modello di calcolo distribuito. Ciò significa che i dati possono essere archiviati fisicamente in molti luoghi diversi e possono essere collegati tra loro tramite reti, l'uso di un file system distribuito e vari strumenti e applicazioni di analisi dei big data.
La ridondanza è importante perché hai a che fare con così tanti dati provenienti da tante fonti diverse. La ridondanza si presenta in molte forme. Se la tua azienda ha creato un cloud privato, vorrai avere la ridondanza costruita all'interno dell'ambiente privato in modo che possa scalare per supportare il cambiamento dei carichi di lavoro.
Se la tua azienda vuole contenere la crescita interna dell'IT, può utilizzare servizi cloud esterni per aumentare le sue risorse interne. In alcuni casi, questa ridondanza può presentarsi sotto forma di un'offerta Software as a Service (SaaS) che consente alle società di eseguire analisi di dati sofisticate come servizio. L'approccio SaaS offre costi inferiori, avvio più rapido e evoluzione senza interruzioni della tecnologia sottostante.
Infrastruttura per la sicurezza dei Big Data
L'analisi dei big data più importante diventa per le aziende, più importante sarà la sicurezza di tali dati. Ad esempio, se sei un'azienda sanitaria, probabilmente vorrai utilizzare applicazioni di big data per determinare i cambiamenti demografici o i cambiamenti nelle esigenze dei pazienti. Questi dati sui componenti dell'utente devono essere protetti sia per soddisfare i requisiti di conformità sia per proteggere la privacy dei pazienti.
Dovrai prendere in considerazione chi è autorizzato a vedere i dati e in quali circostanze sono autorizzati a farlo. Dovrai essere in grado di verificare l'identità degli utenti e proteggere l'identità dei pazienti.
Fonti operative di grandi quantità di dati
È importante capire che è necessario incorporare tutte le fonti di dati che ti forniranno un quadro completo della tua attività e vedere come i dati influiscono sul modo in cui gestisci la tua attività. Mentre il mondo cambia, è importante capire che i dati operativi devono ora comprendere un insieme più ampio di fonti di dati, comprese fonti non strutturate come i dati dei social media in tutte le sue forme.
Trovi nuovi approcci emergenti alla gestione dei dati nel mondo dei big data, tra cui architetture di database di documenti, grafici, colonne e geospaziali. Collettivamente, questi sono indicati come NoSQL, o non solo SQL, database. In sostanza, è necessario mappare le architetture dei dati per i tipi di transazioni.
Facendo ciò contribuirai a garantire che i dati a destra siano disponibili quando ti servono. Sono inoltre necessarie architetture di dati che supportano contenuti non strutturati complessi. È necessario includere sia i database relazionali che i database non relazionali nel tuo approccio per sfruttare i big data. È inoltre necessario includere fonti di dati non strutturate, come i sistemi di gestione dei contenuti, in modo da poter avvicinarsi alla visione aziendale a 360 gradi.
Tutte queste fonti di dati operativi hanno diverse caratteristiche in comune:
-
Rappresentano sistemi di registrazione che tengono traccia dei dati critici richiesti per l'attività quotidiana in tempo reale dell'azienda.
-
Vengono continuamente aggiornati in base alle transazioni avvenute all'interno delle business unit e dal web.
-
Affinché queste fonti forniscano una rappresentazione accurata dell'azienda, devono fondere dati strutturati e non strutturati.
-
Anche questi sistemi devono essere in grado di scalare per supportare migliaia di utenti su base coerente. Questi potrebbero includere sistemi di e-commerce transazionale, sistemi di gestione delle relazioni con i clienti o applicazioni per call center.
