Casa Finanza personale Come utilizzare Data Streaming per Big Data - dummies

Come utilizzare Data Streaming per Big Data - dummies

Video: Kafka Tutorial | Apache Kafka Tutorial For Beginners | Kafka Architecture |What Is Kafka|Simplilearn 2025

Video: Kafka Tutorial | Apache Kafka Tutorial For Beginners | Kafka Architecture |What Is Kafka|Simplilearn 2025
Anonim

A volte, quando ci si avvicina ai big data, le aziende devono affrontare enormi quantità di dati e poca idea di dove andare dopo. Inserisci lo streaming dei dati. Quando una quantità significativa di dati deve essere elaborata rapidamente quasi in tempo reale per ottenere informazioni approfondite, i dati in movimento sotto forma di dati in streaming sono la risposta migliore.

Che cosa sono i dati non a riposo? Si tratterebbe di sistemi che gestiscono transazioni attive e che pertanto richiedono persistenza. In questi casi, i dati verranno archiviati in un archivio dati operativo. Tuttavia, in altre situazioni, tali transazioni sono state eseguite ed è ora di analizzare tali dati in genere in un data warehouse o data mart.

Ciò significa che le informazioni vengono elaborate in batch e non in tempo reale. Quando le organizzazioni pianificano il proprio futuro, devono essere in grado di analizzare molti dati, dalle informazioni su ciò che i clienti stanno acquistando e perché. È importante comprendere i principali indicatori del cambiamento. In altre parole, in che modo i cambiamenti influiranno sui prodotti e servizi che un'organizzazione offrirà in futuro?

Molte organizzazioni di ricerca utilizzano questo tipo di analisi dei big data per scoprire nuovi farmaci. Una compagnia di assicurazioni potrebbe voler confrontare i modelli di incidenti stradali in un'ampia area geografica con le statistiche meteorologiche. In questi casi, non esiste alcun vantaggio per gestire queste informazioni a velocità in tempo reale. Chiaramente, l'analisi deve essere veloce e pratica. Inoltre, le organizzazioni analizzeranno i dati per vedere se emergono nuovi modelli.

Lo streaming di dati è una piattaforma di analisi analitica focalizzata sulla velocità. Questo perché queste applicazioni richiedono un flusso continuo di dati spesso non strutturati da elaborare. Pertanto, i dati vengono continuamente analizzati e trasformati in memoria prima di essere memorizzati su un disco. L'elaborazione dei flussi di dati funziona elaborando "finestre temporali" di dati in memoria attraverso un cluster di server.

Questo è simile all'approccio nella gestione dei dati a riposo sfruttando Hadoop. La principale differenza è la questione della velocità. Nel cluster Hadoop, i dati vengono raccolti in modalità batch e quindi elaborati. La velocità conta meno in Hadoop che nello streaming di dati. I principi chiave che definiscono quando utilizzare gli stream è il più appropriato:

  • Quando è necessario determinare un'opportunità di acquisto al dettaglio nel punto di coinvolgimento, tramite social media o tramite messaggistica basata su autorizzazioni

  • Raccolta di informazioni sul movimento attorno a un sito sicuro

  • Per essere in grado di reagire a un evento che richiede una risposta immediata, come un'interruzione del servizio o un cambiamento delle condizioni mediche del paziente

  • Calcolo in tempo reale dei costi che dipendono da variabili come l'utilizzo e risorse disponibili

I dati di streaming sono utili quando l'analisi deve essere eseguita in tempo reale mentre i dati sono in movimento.Infatti, il valore dell'analisi (e spesso dei dati) diminuisce nel tempo. Ad esempio, se non è possibile analizzare e agire immediatamente, è possibile che si perda un'opportunità di vendita o che una minaccia non venga rilevata.

Di seguito sono riportati alcuni esempi che possono aiutare a spiegare come ciò sia utile.

Una centrale elettrica deve essere un ambiente altamente sicuro in modo che le persone non autorizzate non interferiscano con l'erogazione di energia ai clienti. Le aziende spesso posizionano sensori attorno al perimetro di un sito per rilevare i movimenti. Ma potrebbe esistere un problema. Esiste un'enorme differenza tra un coniglio che si muove furiosamente attorno al sito e un'auto che guida velocemente e deliberatamente. Pertanto, la grande quantità di dati provenienti da questi sensori deve essere analizzata in tempo reale in modo che venga emesso un allarme solo quando esiste una minaccia reale.

Una società di telecomunicazioni in un mercato altamente competitivo vuole assicurarsi che le interruzioni siano attentamente monitorate in modo che un calo rilevato dei livelli di servizio possa essere aumentato al gruppo appropriato. I sistemi di comunicazione generano enormi volumi di dati che devono essere analizzati in tempo reale per intraprendere le azioni appropriate. Un ritardo nella rilevazione di un errore può avere un serio impatto sulla soddisfazione del cliente.

Inutile dire che le aziende hanno a che fare con molti dati che devono essere elaborati e analizzati in tempo reale. Pertanto, l'ambiente fisico che supporta questo livello di reattività è fondamentale. Gli ambienti di dati in streaming richiedono in genere una soluzione hardware in cluster e, a volte, per gestire l'analisi è necessario un approccio di elaborazione in parallelo.

Un fattore importante nello streaming dell'analisi dei dati è il fatto che si tratta di un'analisi a passaggio singolo. In altre parole, l'analista non può rianalizzare i dati dopo che è stato trasmesso in streaming. Questo è comune nelle applicazioni in cui si sta cercando l'assenza di dati.

Se sono necessari più passaggi, i dati dovranno essere inseriti in una sorta di magazzino in cui è possibile eseguire analisi aggiuntive. Ad esempio, è spesso necessario stabilire un contesto. In che modo questi dati di streaming si confrontano con i dati storici? Questa correlazione può dirti molto su cosa è cambiato e cosa potrebbe significare questo cambiamento per la tua azienda.

Come utilizzare Data Streaming per Big Data - dummies

Scelta dell'editore

Come utilizzare i sottodomini per il proprio host Web - dummies

Come utilizzare i sottodomini per il proprio host Web - dummies

Il file di zona DNS detenuto dal Il server dei nomi autorevole per un dominio è in realtà piuttosto esteso e puoi manipolarlo in qualche modo usando i sottodomini. Considera il lato di Internet visibile agli utenti web e mostra come funzionano i sottodomini (e può migliorare il tuo sito Web. Diventa creativo con i sottodomini per il tuo DNS Un FQDN richiede un ...

Server privati ​​virtuali e server dedicati per host Web - manichini

Server privati ​​virtuali e server dedicati per host Web - manichini

Maggior parte degli host web iniziare su un server condiviso, che è un server web che ospita più siti Web, potenzialmente da decine o addirittura centinaia di client diversi. I server condivisi sono un buon punto di partenza ma, a volte, possono essere scarsi in termini di servizio, a seconda dell'host specifico, dei siti che si trovano ...

Dieci Free Web Hosting Apps - dummies

Dieci Free Web Hosting Apps - dummies

Ci sono centinaia di applicazioni di hosting web gratuite e gratuite che sono progettati per rendere la vita più facile. Non limitarti a fare una ricerca su Google per le app FTP gratuite e installare ciò che viene visualizzato senza sapere nulla sulla reputazione di un'app. Ci sono un certo numero di app FTP là fuori che sono lupi in pecore ...

Scelta dell'editore

Come creare una tabella in Excel 2010 - dummies

Come creare una tabella in Excel 2010 - dummies

È Possibile creare una tabella in Excel 2010 per aiutare gestisci e analizzi i dati correlati. Lo scopo di una tabella Excel non è tanto calcolare valori nuovi, ma piuttosto memorizzare molte informazioni in modo coerente, semplificando la formattazione, l'ordinamento e il filtraggio dei dati del foglio di lavoro. Una tabella Excel è ...

Come creare una tabella in Excel 2007 - dummies

Come creare una tabella in Excel 2007 - dummies

È Possibile creare una tabella in Excel 2007 (a elenco o database nelle precedenti versioni di Excel) per aiutarti a gestire e analizzare i dati correlati. Lo scopo di una tabella Excel non è tanto calcolare valori nuovi, ma piuttosto memorizzare molte informazioni in modo coerente, rendendo più semplice la formattazione, l'ordinamento, ...

Come creare una tabella di dati a variabile singola in Excel 2016 - dummies

Come creare una tabella di dati a variabile singola in Excel 2016 - dummies

Tabelle di dati ti consente di inserire una serie di possibili valori che Excel 2016 quindi inserisce in un'unica formula. Una tabella di dati a una variabile sostituisce una serie di valori possibili per un singolo valore di input in una formula. La seguente figura mostra un foglio di calcolo delle proiezioni di vendita 2017 per il quale una tabella di dati a una variabile è ...

Scelta dell'editore

Connessioni Wi-Fi per dispositivi mobili aziendali: Blackberry - dummies

Connessioni Wi-Fi per dispositivi mobili aziendali: Blackberry - dummies

Gli utenti aziendali possono configurare facilmente i propri dispositivi BlackBerry aziendali per connettersi a reti Wi-Fi pubbliche e sicure. Come i dispositivi Apple iOS e Google Android, i dispositivi BlackBerry possono offrire gli stessi servizi dati tramite Wi-Fi come nella rete cellulare dell'utente e velocità di download potenzialmente più elevate. Ciò significa che gli utenti possono accedere alla loro posta elettronica e navigare ...

Wi-Fi Protected Setup e Hacking Attacks - dummies

Wi-Fi Protected Setup e Hacking Attacks - dummies

Wi-Fi Protected Setup (WPS) è un standard wireless che consente una semplice connettività per gli AP wireless "sicuri". Il problema con WPS è che l'implementazione dei PIN registrar facilita la connessione al wireless e può facilitare gli attacchi alle stesse chiavi pre-condivise WPA / WPA2 utilizzate per bloccare il sistema nel suo complesso. Con sicurezza, tutto è un ...

Perché Hackers Hack - dummies

Perché Hackers Hack - dummies

Hackerano hackerare perché possono. Periodo. Ok, va un po 'più in profondità. L'hacking è un hobby occasionale per alcuni hacker: si scervellano solo per vedere ciò che possono e non possono intrufolarsi, testando di solito solo i propri sistemi. Alcuni sono ossessionati dall'ottenere notorietà o sconfiggere i sistemi informatici, e alcuni hanno criminali ...