Sommario:
- Estrazione e arricchimento di entità
- Ricerca e avvisi
- Funzioni aggregate
- Creazione di grafici e business intelligence
Video: Qual è il database e SQL? 2024
La memorizzazione e il recupero di grandi quantità di dati e la velocità è ottima, e una volta che i dati sono stati appena gestiti in NoSQL, puoi fare grandi cose.
Estrazione e arricchimento di entità
È possibile utilizzare trigger di database, azioni di avviso e sistemi esterni per analizzare i dati di origine. Forse è per lo più testo libero, ma menziona argomenti noti. Questi trigger e azioni di avviso potrebbero evidenziare il testo come persona o organizzazione, tagliando efficacemente il contenuto stesso e il documento in esso contenuto.
Un buon esempio è il contenuto di un articolo di notizie. È possibile utilizzare uno strumento come Apache Stanbol o OpenCalais per identificare i termini chiave. Questi strumenti potrebbero vedere "il presidente Putin" e decidere che questo si riferisce a una persona chiamata Vladimir Putin, che è russo, ed è l'attuale presidente della Federazione russa.
Altri esempi includono nomi di malattie e farmaci, organizzazioni, argomenti di conversazione, prodotti menzionati e se un commento è stato positivo o negativo.
Questi sono tutti esempi di entità di estrazione (che è il processo di estrazione automatica di tipi di oggetti dai loro nomi testuali) . Identificando i termini chiave, puoi taggarli o racchiuderli in un elemento XML, che ti aiuta a cercare i contenuti in modo più efficace.
L'arricchimento di entità significa aggiungere informazioni basate sul testo originale oltre a identificarlo. Nell'esempio di Putin, puoi trasformare la parola in chiaro "Putin" nel Presidente Putin. In alternativa, puoi trasformare "Londra" a Londra.
È possibile visualizzare questi dati in un'interfaccia utente come testo evidenziato con un collegamento a ulteriori informazioni su ciascun argomento.
È possibile fornire l'arricchimento utilizzando la ricerca di testo libero, avvisi, trigger di database e integrazioni a software esterni come TEMIS Luxid e SmartLogic.
Ricerca e avvisi
Una volta memorizzate le informazioni, è possibile cercarle. La ricerca di testo libero è semplice, ma dopo aver eseguito l'estrazione di entità, hai più opzioni. Puoi cercare specificamente una persona chiamata "Orange" (come in Guglielmo d'Orange) piuttosto che i record di ricerca che menzionano il termine arancione - che, ovviamente, è anche un colore e un frutto.
In questo modo si ottiene una ricerca più granulare. Permette anche la navigazione sfaccettata. Se vai in Amazon e cerchi Harry Potter, vedrai categorie di libri, film, giochi e così via. La categoria di prodotto è un esempio di facet , che mostra un aspetto dei dati all'interno dei risultati della ricerca, ovvero i valori più comuni di ogni sfaccettatura tra tutti i risultati di ricerca, anche quelli non sulla pagina corrente.
Le interfacce utente possono supportare ricche esplorazioni nei dati (oltre alle ricerche base di Google). Gli utenti possono anche utilizzarli per salvare e caricare ricerche precedenti.
È possibile impostare i criteri di ricerca salvati in modo che gli avvisi vengano attivati quando i nuovi record aggiunti corrispondono a tali criteri. Quindi, se arriva un nuovo record che corrisponde ai tuoi criteri di ricerca, si verifica un'azione. Forse "Putin" diventa Putin
Non tutti i motori di ricerca sono in grado di rendere ogni termine di ricerca un avviso. Alcuni sono limitati ai campi di testo; gli altri non possono fare criteri geospaziali. Assicurati che il tuo sia in grado di gestire gli avvisi che devi configurare.
Funzioni aggregate
Una volta trovate le informazioni pertinenti, potresti voler scavare più a fondo. A seconda della fonte, potresti chiedere quanti paesi hanno un PIL superiore a $ 400 miliardi, o qual è l'età media di tutti i membri del tuo albero genealogico, o dove si verificano i morsi più serpenti in Australia. Questi esempi illustrano come vengono eseguite le analisi su una serie di risultati di ricerca. Questi sono i calcoli di conteggio, media media e geospaziale della mappa di calore, rispettivamente.
Essere in grado di eseguire tali calcoli accanto ai dati offre diversi vantaggi. Il primo vantaggio è che puoi usare gli indici per velocizzare le cose. In secondo luogo, è probabile che questi indici vengano memorizzati nella cache, rendendoli ancora più veloci. In terzo luogo, gli indici di memoria sono particolarmente utili per un database NoSQL che utilizza l'archiviazione Hadoop File System (HDFS). HDFS non esegue l'indicizzazione nativa o gli archivi di colonne in memoria per calcoli di aggregazione rapidi, richiede un database NoSQL in alto per farlo.
La navigazione con sfaccettatura laterale è un esempio di aggregazioni basate sui conteggi rispetto ai risultati di ricerca visualizzati in un'interfaccia utente. Lo stesso vale per una linea temporale che mostra il numero di record che menzionano un particolare momento nel tempo. Ad esempio, vuoi mostrare i risultati di quest'anno, questo mese o questa ora?
Se si desidera questa funzionalità, assicurarsi che il database abbia la capacità di calcolare gli aggregati in modo efficiente accanto ai dati. La maggior parte dei database NoSQL lo fa, ma alcuni no.
Creazione di grafici e business intelligence
La prossima ovvia estensione dell'interfaccia utente include la creazione di grafici e la visualizzazione di riepiloghi della tabella per le informazioni sulla gestione live e l'analisi storica della business intelligence.
La maggior parte dei database NoSQL fornisce un'API REST facile da integrare nei loro database. Ciò significa che è possibile collegare una gamma di livelli applicativi o persino collegare direttamente applicazioni JavaScript a questi database. Una varietà di librerie di grafici eccellenti sono disponibili per JavaScript. È anche possibile utilizzare l'Ecosistema R per creare grafici basati sui dati contenuti in questi database, dopo aver installato un connettore di database appropriato.
Alcuni database NoSQL forniscono anche un plug-in di database relazionale ODBC o JDBC. La creazione di indici all'interno di un dato record e la loro visualizzazione come vista a-vista è un modo semplice per trasformare i dati non strutturati in un database di documenti NoSQL in dati che possono essere analizzati con uno strumento di business intelligence.
Verifica se il tuo fornitore di database NoSQL fornisce strumenti di visualizzazione o ha partner commerciali con strumenti che possono connettersi a questi database. Gli strumenti innovativi includono Tableau Server, un moderno server di business condiviso che supporta la pubblicazione di report interattivi sui dati in una varietà di database, inclusi i database NoSQL.