Casa Finanza personale Streaming Algorithms e Bloom Filters - dummies

Streaming Algorithms e Bloom Filters - dummies

Video: Bloom Filters 2025

Video: Bloom Filters 2025
Anonim

Il cuore di molti algoritmi di streaming sono i filtri Bloom. Creato quasi 50 anni fa da Burton H. Bloom, in un periodo in cui l'informatica era ancora piuttosto giovane, l'intento originale del creatore di questo algoritmo era di scambiare spazio (memoria) e / o tempo (complessità) con quello che chiamava errori consentiti. Il suo documento originale è intitolato Complessioni spazio / tempo nella codifica hash con errori consentiti.

Potresti chiederti dello spazio e del tempo che Bloom considera motivatori per il suo algoritmo. Immagina di dover determinare se un elemento è già apparso in uno stream utilizzando una struttura di dati precedentemente discussa. Trovare qualcosa in un flusso implica che la registrazione e la ricerca siano veloci, quindi una tabella hash sembra una scelta ideale. Le tabelle hash richiedono semplicemente di aggiungere gli elementi che si desidera registrare e archiviarli. Recuperare un elemento da una tabella hash è veloce perché la tabella hash utilizza i valori facilmente manipolati per rappresentare l'elemento, piuttosto che l'elemento stesso (che potrebbe essere piuttosto complesso). Tuttavia, la memorizzazione di entrambi gli elementi e un indice di tali elementi presenta limitazioni. Se una tabella hash ha più elementi di quanti ne possa gestire, come gli elementi in un flusso continuo e potenzialmente infinito, a un certo punto finirai per incorrere in problemi di memoria.

Una considerazione essenziale per i filtri Bloom è che possono verificarsi falsi positivi, ma i falsi negativi non possono. Ad esempio, un flusso di dati potrebbe contenere dati di monitoraggio in tempo reale per una centrale elettrica. Quando si utilizza un filtro Bloom, l'analisi del flusso di dati mostrerebbe che le letture previste sono probabilmente parte dell'insieme di letture consentite, con alcuni errori consentiti. Tuttavia, quando si verifica un errore nel sistema, la stessa analisi mostra che le letture non fanno parte dell'insieme delle letture consentite. È improbabile che i falsi positivi causino problemi, ma l'assenza di falsi negativi significa che tutti restano al sicuro. A causa del potenziale di falsi positivi, i filtri come il filtro Bloom sono strutture dati probabilistiche, che non forniscono una risposta certa ma probabile.

Gli hash, le singole voci in una tabella hash, sono veloci perché si comportano come l'indice di un libro. Si utilizza una funzione di hash per produrre l'hash; l'input è un elemento contenente dati complessi e l'output è un numero semplice che funge da indice per quell'elemento. Una funzione di hash è deterministica perché produce lo stesso numero ogni volta che lo si alimenta con uno specifico input di dati.Usi l'hash per localizzare le complesse informazioni di cui hai bisogno. I filtri Bloom sono utili perché sono un modo parsimonioso per registrare tracce di molti elementi senza doverli archiviare come fa una tabella hash. Funzionano in modo semplice e usano i seguenti ingredienti principali:

  • Un vettore di bit: Un elenco di elementi di bit, in cui ogni bit nell'elemento può avere un valore di 0 o 1. L'elenco è lungo numero di bit chiamati m. La m maggiore è, meglio è, anche se ci sono modi per definire in modo ottimale le sue dimensioni.
  • Una serie di funzioni hash: Ogni funzione di hash rappresenta un valore diverso. Le funzioni di hash possono scricchiare rapidamente i dati e produrre risultati uniformemente distribuiti, che sono risultati che vanno ugualmente dal minimo al massimo dei valori di uscita dell'hash.
Streaming Algorithms e Bloom Filters - dummies

Scelta dell'editore

Come salvare le immagini in un file immagine in R - dummies

Come salvare le immagini in un file immagine in R - dummies

Se vuoi pubblicare le tue risultati, è necessario salvare la trama in un file in R e quindi importare questo file grafico in un altro documento. Tuttavia, per la maggior parte del tempo, potresti semplicemente voler utilizzare la grafica R in modo interattivo per esplorare i tuoi dati. Per salvare un grafico su un'immagine ...

Come cercare più parole in R - dummies

Come cercare più parole in R - dummies

Quando si lavora con il testo in R, potrebbe essere necessario per trovare parole o motivi all'interno del testo. Immagina di avere una lista degli stati negli Stati Uniti e vuoi scoprire quali nomi di stato consistono in due parole. Per trovare sottostringhe, è possibile utilizzare la funzione grep (), che prende due argomenti essenziali: ...

Come cercare le singole parole in R - dummies

Come cercare le singole parole in R - dummies

Quando lavori con il testo, spesso tu può risolvere i problemi se riesci a trovare parole o motivi all'interno del testo. R rende questo facile da fare. Immagina di avere una lista degli stati negli Stati Uniti e vuoi scoprire quale di questi stati contiene la parola Nuovo. Per indagare su questo ...

Scelta dell'editore

Come calcolare le detrazioni e i crediti di imposta sugli investimenti immobiliari per l'esame di licenza immobiliare

Come calcolare le detrazioni e i crediti di imposta sugli investimenti immobiliari per l'esame di licenza immobiliare

Una detrazione fiscale è qualcosa che puoi vedere nell'esame di licenza immobiliare che puoi detrarre dal reddito di un investimento immobiliare per ridurre le tasse. Un credito d'imposta è qualcosa che puoi detrarre dalle tasse dovute. I governi federali e talvolta statali creano programmi che consentono crediti d'imposta o detrazioni per ...

Fattori economici che influenzano il valore per l'esame di licenza immobiliare - dummies

Fattori economici che influenzano il valore per l'esame di licenza immobiliare - dummies

Valore doesn ' semplicemente succede; le persone devono crearlo. La maggior parte di queste azioni personali che saranno trattate durante l'esame di licenza immobiliare, di solito chiamate influenze economiche, non sono altro che normali comportamenti umani. Il test pone due tipi di domande su questi principi o fattori economici. Vedrai domande sulle definizioni e ...

Come calcolare le aliquote fiscali per l'esame di licenza immobiliare - dummy

Come calcolare le aliquote fiscali per l'esame di licenza immobiliare - dummy

Pur calcolando la tassa le tariffe non sono qualcosa che devi sapere esattamente come fare per l'esame di licenza immobiliare, è qualcosa che devi capire in generale per rispondere a domande di non-matematica sul processo. Sapere come calcolare le tasse non è una cosa brutta da sapere, perché probabilmente si pagano le tasse di proprietà e ...

Scelta dell'editore

Suggerimenti per la registrazione Regole di gioco logiche sull'LSAT - manichini

Suggerimenti per la registrazione Regole di gioco logiche sull'LSAT - manichini

La maggior parte dei giochi di logica sull'LSAT hanno tre, quattro o cinque condizioni o regole che limitano il modo in cui giochi con i pezzi. Per ordinare i giochi, le restrizioni forniscono indizi su come i pezzi possono essere posizionati in relazione l'uno con l'altro. I tipi comuni di regole di ordinazione sono obiettivi, distanziatori e arrangiatori. Regole di destinazione I bersagli danno ...

Come gestire il tuo tempo con saggezza sul TASC - dummies

Come gestire il tuo tempo con saggezza sul TASC - dummies

Perché ogni sezione del TASC, oppure Prova l'esame di completamento secondario, ha un limite di tempo, vorrai essere consapevole di quanto tempo è passato mentre stai facendo il test. Un modo per gestire efficacemente il tuo tempo è semplicemente indossando un orologio. I centri di test potrebbero non avere sempre un orologio disponibile e ...

Rendendo più semplice il giorno di prova SSAT o ISEE - manichini

Rendendo più semplice il giorno di prova SSAT o ISEE - manichini

Non è possibile effettuare SSAT o ISEE più facile, ma puoi iniziare la giornata di test correttamente e renderlo più semplice e meno stressante, il che può portare a risultati migliori durante l'esame di ammissione. Ecco alcuni suggerimenti da tenere a mente al giorno del test SSAT o ISEE: riposati molto. La ...