Casa Finanza personale Concesso Nozioni di base sui computer per i Big Data - manichini

Concesso Nozioni di base sui computer per i Big Data - manichini

Sommario:

Video: [PyCon Italy 2014] V. Maggio - Machine Learning Parallelo (e Distribuito) con Scikit-Learn 2025

Video: [PyCon Italy 2014] V. Maggio - Machine Learning Parallelo (e Distribuito) con Scikit-Learn 2025
Anonim

Se la tua azienda sta considerando un progetto di grandi quantità, è importante comprendere alcune nozioni di base di calcolo distribuito primo. Non esiste un singolo modello di calcolo distribuito perché le risorse di calcolo possono essere distribuite in molti modi.

Ad esempio, è possibile distribuire un set di programmi sullo stesso server fisico e utilizzare i servizi di messaggistica per consentire loro di comunicare e trasmettere informazioni. È anche possibile avere diversi sistemi o server, ognuno con la propria memoria, che può lavorare insieme per risolvere un problema.

Perché il calcolo distribuito è necessario per i big data

Non tutti i problemi richiedono l'elaborazione distribuita. Se non esiste un vincolo di tempo elevato, l'elaborazione complessa può essere eseguita tramite un servizio specializzato in remoto. Quando le aziende dovevano eseguire analisi complesse dei dati, l'IT trasferiva i dati a un servizio esterno o entità in cui erano disponibili molte risorse di riserva per l'elaborazione.

Non era che le aziende volessero aspettare per ottenere i risultati di cui avevano bisogno; semplicemente non era economicamente fattibile acquistare abbastanza risorse di calcolo per gestire questi requisiti emergenti. In molte situazioni, le organizzazioni acquisiscono solo selezioni di dati anziché cercare di acquisire tutti i dati a causa dei costi. Gli analisti desideravano tutti i dati, ma dovevano accontentarsi delle istantanee, sperando di acquisire i dati giusti al momento giusto.

Le principali innovazioni hardware e software hanno rivoluzionato il settore della gestione dei dati. Innanzitutto, l'innovazione e la domanda hanno aumentato la potenza e ridotto il prezzo dell'hardware. È emerso un nuovo software che ha compreso come sfruttare questo hardware automatizzando processi come bilanciamento del carico e ottimizzazione attraverso un enorme cluster di nodi.

Il software includeva regole integrate che capivano che determinati carichi di lavoro richiedevano un certo livello di prestazioni. Il software ha trattato tutti i nodi come se fossero semplicemente un grande pool di risorse di elaborazione, archiviazione e networking e ha spostato i processi su un altro nodo senza interruzioni in caso di guasto di un nodo, utilizzando la tecnologia della virtualizzazione.

L'evoluzione dell'economia dei computer e dei big data

Avanti e molto è cambiato. Negli ultimi anni, il costo per l'acquisto di risorse informatiche e di archiviazione è diminuito drasticamente. Aiutati dalla virtualizzazione, i server di merci che potevano essere raggruppati e i blade che potevano essere collegati in rete in un rack hanno cambiato l'economia dell'informatica. Questo cambiamento ha coinciso con l'innovazione nelle soluzioni di automazione del software che ha notevolmente migliorato la maneggevolezza di questi sistemi.

La capacità di sfruttare il calcolo distribuito e le tecniche di elaborazione parallela ha drasticamente trasformato il panorama e ridotto drasticamente la latenza. Ci sono casi speciali, come il trading ad alta frequenza (HFT), in cui la latenza bassa può essere raggiunta solo localizzando fisicamente i server in un'unica posizione.

Il problema con la latenza dei big data

Uno dei perenni problemi con la gestione dei dati, in particolare grandi quantità di dati, è stato l'impatto della latenza. Latenza è il ritardo all'interno di un sistema basato su ritardi nell'esecuzione di un'attività. La latenza è un problema in ogni aspetto dell'informatica, comprese le comunicazioni, la gestione dei dati, le prestazioni del sistema e altro.

Se hai mai usato un telefono senza fili, hai sperimentato la latenza in prima persona. È il ritardo nelle trasmissioni tra te e il tuo interlocutore. A volte, la latenza ha un impatto limitato sulla soddisfazione del cliente, ad esempio se le aziende hanno bisogno di analizzare i risultati dietro le quinte per pianificare una nuova release di prodotto. Questo probabilmente non richiede risposta o accesso immediato.

Tuttavia, più la risposta è vicina a un cliente al momento della decisione, più la latenza è importante.

Le tecniche di elaborazione distribuita e elaborazione parallela possono fare una differenza significativa nella latenza vissuta da clienti, fornitori e partner. Molte applicazioni di big data dipendono dalla bassa latenza a causa dei grandi requisiti di dati per la velocità e il volume e la varietà dei dati.

Potrebbe non essere possibile costruire un'applicazione big data in un ambiente ad alta latenza se sono necessarie alte prestazioni. Anche la necessità di verificare i dati in tempo quasi reale può essere influenzata dalla latenza. Quando si hanno a che fare con dati in tempo reale, un alto livello di latenza indica la differenza tra successo e fallimento.

La domanda di big data incontra le soluzioni

La crescita di Internet come piattaforma per tutto, dal commercio alla medicina, ha trasformato la domanda di una nuova generazione di gestione dei dati. Alla fine degli anni '90, le società di motori e Internet come Google, Yahoo! e Amazon. com è stata in grado di espandere i propri modelli di business, sfruttando l'hardware economico per l'elaborazione e l'archiviazione.

Successivamente, queste aziende necessitavano di una nuova generazione di tecnologie software che consentissero loro di monetizzare le enormi quantità di dati che stavano catturando dai clienti. Queste aziende non potevano aspettare i risultati dell'elaborazione analitica. Avevano bisogno della capacità di elaborare e analizzare questi dati quasi in tempo reale.

Concesso Nozioni di base sui computer per i Big Data - manichini

Scelta dell'editore

Il programma in cinque passaggi per superare la menopausa - dummy

Il programma in cinque passaggi per superare la menopausa - dummy

Alcune donne capiscono a malapena che la menopausa è loro. Altre donne, tuttavia, sono meno fortunate. Se sei uno di questi, prendi in mano questi pochi modi per rendere la tua esperienza più facile per te stesso: capisci e accetta che stai attraversando una transizione naturale, proprio come la pubertà. Fortunatamente, sei più vecchio e più saggio di te ...

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa For Dummies Cheat Sheet (edizione UK) - dummies

Menopausa segna la fine della fase riproduttiva della tua vita e così è un momento significativo di cambiamento fisico, emotivo e mentale per molte donne ma, per generazioni, donne di tutte le età hanno vagato alla cieca in menopausa senza sapere cosa aspettarsi. Qui puoi scoprire alcune delle nozioni di base.

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Perimenopausa: facilitare la transizione dalle mestruazioni alla menopausa - manichini

Mestruazioni e menopausa sono ben noti biologici pietre miliari nella vita di una femmina. Contrariamente al pensiero popolare, la menopausa non è il periodo di mesi o anni in cui una donna sta "attraversando il cambiamento". "Questo lasso di tempo è chiamato perimenopausa. La menopausa è una data effettiva nel tempo. In particolare, è il 12 ° anniversario dell'ultimo ciclo mestruale di una donna. ...

Scelta dell'editore

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

Come utilizzare il filtro automatico personalizzato su una tabella di Excel - dummies

È Possibile creare un filtro automatico personalizzato . Per fare ciò, seleziona il comando Filtro testo dal menu della tabella e scegli una delle opzioni di filtro del testo. Indipendentemente dall'opzione di filtro del testo selezionata, Excel visualizza la finestra di dialogo Filtro automatico personalizzato. Questa finestra di dialogo consente di specificare con estrema precisione quali record si desidera ...

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

Come utilizzare la funzione DPRODUCT in un database Excel - dummies

DPRODUCT moltiplica i valori che corrispondono al criterio in un database Excel. Questo è potente ma anche in grado di produrre risultati che non sono l'intenzione. In altre parole, è una cosa da aggiungere e ricavare una somma. Questa è un'operazione comune su un set di dati. Osservando la seguente figura, è possibile ...

Come utilizzare la funzione DPRODUCT in Excel - dummy

Come utilizzare la funzione DPRODUCT in Excel - dummy

La funzione DPRODUCT in Excel è strana. La funzione DPRODUCT moltiplica i valori nei campi da un elenco di database in base ai criteri di selezione. Perché vorresti farlo? Chissà. La funzione utilizza la sintassi = DPRODUCT (database, campo, criteri) in cui il database è un riferimento all'intervallo alla tabella di Excel che contiene il valore desiderato ...

Scelta dell'editore

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Programmazione con Java: riutilizzo dei nomi nella tua app per Android - dummies

Ci sono un paio di cose a cui vuoi pensare quando riutilizzi i nomi nella tua app per Android. È possibile dichiarare due variabili Java - bag1 e bag2 - per fare riferimento a due diversi oggetti BagOfCheese. Va bene. Ma a volte, avere solo una variabile e riutilizzarla per il secondo oggetto funziona altrettanto bene, ...

Java: Mettere a frutto l'uso della classe - dummies

Java: Mettere a frutto l'uso della classe - dummies

La classe Employee nell'elenco non ha alcun metodo principale , quindi non c'è un punto di partenza per l'esecuzione del codice. Per risolvere questo problema, il programmatore scrive un programma separato con un metodo principale e utilizza tale programma per creare istanze Employee. Questo elenco di codici mostra una classe con un metodo principale - uno che inserisce il ...

Classi wrapper java - dummies

Classi wrapper java - dummies

La differenza tra tipi primitivi e tipi di riferimento è una delle funzionalità più controverse di Java e gli sviluppatori si lamentano spesso sulle differenze tra valori primitivi e valori di riferimento. Ogni tipo primitivo viene cotto nella lingua. Java ha otto tipi primitivi. Ogni tipo di riferimento è una classe o un'interfaccia. È possibile definire il proprio ...