Casa Finanza personale Strumenti di analisi del testo per i Big Data - manichini

Strumenti di analisi del testo per i Big Data - manichini

Sommario:

Video: Maurizio Atzori: Tecnologie semantiche per Big Data e applicazioni 2024

Video: Maurizio Atzori: Tecnologie semantiche per Big Data e applicazioni 2024
Anonim

Ecco una panoramica di alcuni dei giocatori nel mercato dei big data dell'analisi del testo. Alcuni sono piccoli mentre altri sono nomi familiari. Alcuni chiamano ciò che fanno analytics del testo dei dati di grandi dimensioni , mentre alcuni si riferiscono ad esso come analisi del testo.

Attensity for big data

Attensity è una delle aziende di analisi del testo originali che ha iniziato a sviluppare e vendere prodotti più di dieci anni fa. In questo momento, ha oltre 150 clienti aziendali e uno dei più grandi gruppi di sviluppo NLP del mondo. L'attitudine offre diversi motori per l'analisi del testo. Questi includono Auto-Classification, Entity Extraction ed Exhaustive Extraction. Exhaustive Extraction è la tecnologia di punta di Attensity che estrae automaticamente i fatti dal testo analizzato e organizza queste informazioni.

La società si concentra sull'analisi e sull'impegno sociale e multicanale analizzando il testo per la segnalazione da fonti interne ed esterne e quindi indirizzandolo agli utenti aziendali per il coinvolgimento. Recentemente ha acquistato Biz360, una società di social media che aggrega enormi flussi di social media. Ha sviluppato un sistema di grid computing che offre funzionalità ad alte prestazioni per l'elaborazione di enormi quantità di testo in tempo reale.

Attensity utilizza un framework Hadoop per archiviare i dati. Dispone inoltre di un sistema di accodamento dei dati che crea un processo di orchestrazione che riconosce i picchi nei dati in entrata e regola l'elaborazione su più / meno server in base alle esigenze.

Clarabridge per i big data

Un altro fornitore di analisi del testo puro, Clarabridge è in realtà uno spin-off di una società di consulenza di business intelligence (chiamata Claraview) che ha compreso la necessità di gestire i dati non strutturati. Il suo obiettivo è quello di aiutare le aziende a generare valore di business misurabile guardando al cliente in modo olistico, individuando le principali esperienze e problemi e aiutando tutti in un'organizzazione a intraprendere azioni e collaborare in tempo reale.

Ciò include la determinazione in tempo reale del sentimento e la classificazione dei dati / testo di feedback dei clienti e la messa in scena del verbo per l'elaborazione futura nel sistema Clarabridge.

In questo momento, Clarabridge offre ai suoi clienti alcune funzionalità sofisticate e interessanti, tra cui l'analisi della causa root single-click per identificare cosa sta causando un cambiamento nel volume di feed di testo, sentimento o soddisfazione associati a problemi emergenti. Offre anche la sua soluzione come Software as a Service (SaaS).

IBM per big data

gigante del software IBM offre diverse soluzioni nello spazio di analisi del testo con il suo ombrello strategico Smarter Planet.Oltre a Watson e IBM SPSS, IBM offre anche IBM Content Analytics con Enterprise Search. IBM Content Analytics è stato sviluppato sulla base del lavoro svolto presso IBM Research.

IBM Content Analytics viene utilizzato per trasformare il contenuto in informazioni analizzate e questo è disponibile per analisi dettagliate simili al modo in cui i dati strutturati verranno analizzati in un set di strumenti BI. IBM Content Analytics e Enterprise Search erano una volta due prodotti separati.

La soluzione convergente ha come obiettivo sia la ricerca aziendale avanzata che utilizza l'analisi del testo, sia le esigenze di analisi del contenuto autonomo. ICAES ha una stretta integrazione con la piattaforma IBM InfoSphere BigInsights, consentendo raccolte di analisi dei contenuti e di ricerca molto ampie.

OpenText per big data

OpenText, una società con sede in Canada, è probabilmente meglio conosciuta per la sua leadership nelle soluzioni di gestione delle informazioni aziendali. La sua visione ruota attorno alla gestione, alla protezione e all'estrazione di valore dai dati non strutturati delle imprese. Fornisce ciò che definisce "middleware semantico". "

Secondo la società, la sua evoluzione tecnologica semantica è radicata nella sua capacità" di consentire analisi in tempo reale con elevata accuratezza su grandi set di dati attraverso linguaggi, formati e domini industriali. "L'idea alla base del middleware semantico è che la semantica può essere esposta a diversi livelli e lavorare con tecnologie diverse per affrontare i problemi aziendali.

In altre parole, l'analisi del testo può essere abilitata e utilizzata dove necessario.

SAS per big data

SAS ha risolto a lungo problemi complessi di big data. Diversi anni fa, acquistò il fornitore di analisi del testo Teragram per migliorare la sua strategia di utilizzare i dati strutturati e non strutturati in analisi e di integrare questi dati per la modellazione descrittiva e predittiva. Ora, le sue capacità di analisi del testo fanno parte della sua piattaforma di analisi complessiva e i dati testuali sono considerati semplicemente un'altra fonte di dati.

SAS continua a innovare nel settore delle analisi ad alte prestazioni per garantire che le prestazioni soddisfino le aspettative dei clienti. L'obiettivo è quello di risolvere i problemi che in passato richiedevano settimane per risolverli e risolverli in giorni o problemi che in passato richiedevano giorni per risolverli e risolverli in pochi minuti.

Ad esempio, SAS High Performance Analytics Server è una soluzione in-memory che consente di sviluppare modelli analitici utilizzando dati completi, non solo un sottoinsieme di dati aggregati. SAS afferma che è possibile utilizzare migliaia di variabili e milioni di documenti come parte di questa analisi. La soluzione viene eseguita su appliance EMC Greenplum o Teradata e su hardware di base utilizzando Hadoop Distributed File System (HDFS).

Strumenti di analisi del testo per i Big Data - manichini

Scelta dell'editore

Come aggiungere titoli e etichette di assi a un grafico in R - dummies

Come aggiungere titoli e etichette di assi a un grafico in R - dummies

È Possibile aggiungere facilmente il titolo principale e le etichette degli assi con argomenti alla funzione plot () in R per migliorare la qualità della grafica. main: Titolo della trama principale xlab: etichetta dell'asse x ylab: etichetta dell'asse y Per aggiungere un titolo e le etichette degli assi alla trama dei fedeli, provare quanto segue:> plot (fedele, + main = ...

Come aggiungere linee di tendenza a reticoli di reticolo in R - dummies

Come aggiungere linee di tendenza a reticoli di reticolo in R - dummies

È Possibile creare linee di tendenza o linee di regressione attraverso i dati. Questi possono essere utili quando si usano trame a reticolo in R. Quando si dice a reticolo di calcolare una linea di miglior adattamento, lo fa per ciascun pannello nella trama. Questo è semplice usando xyplot (), perché è semplice come aggiungere un argomento di tipo. In ...

Come aggiungere punti a un grafico in R - dummies

Come aggiungere punti a un grafico in R - dummies

Per illustrare alcune diverse opzioni e tipi di grafico , come punti e linee, in R, usa il set di dati integrato fedele. Questa è una cornice di dati con le osservazioni delle eruzioni del geyser Old Faithful nel Parco Nazionale di Yellowstone negli Stati Uniti. I set di dati R incorporati sono documentati allo stesso modo delle funzioni. Quindi, ...

Scelta dell'editore

Come mantenere un diario in Outlook - dummy

Come mantenere un diario in Outlook - dummy

Per ottenere un buon uso dal diario di Outlook, hai per usarlo (dettagli, dettagli ...). È possibile impostare Outlook per rendere le voci di diario praticamente per tutto ciò che si fa o è possibile chiudere completamente il diario e non inserire alcuna voce in esso. Se non inserisci nulla nel Diario, ottieni ...

Come gestire la posta in arrivo in Outlook 2013 - dummies

Come gestire la posta in arrivo in Outlook 2013 - dummies

Se si riceve un sacco di e-mail Outlook 2013, potresti voler installare alcuni sistemi per mantenerlo organizzato. Il sistema può includere la creazione di cartelle per archiviare la posta elettronica che si desidera conservare per riferimento futuro, spostare i messaggi da una cartella a un'altra, eliminare la posta elettronica non più necessaria e contrassegnare ...

Come gestire attività ricorrenti in Outlook 2013 - dummies

Come gestire attività ricorrenti in Outlook 2013 - dummies

Outlook 2013 può ricordarti ogni volta che viene un compito ricorrente in giro. Un sacco di compiti affiorano su base regolare. Sai come va - stessa roba, giorno diverso. Per risparmiarti lo sforzo di inserire un'attività, ad esempio un rapporto sulle vendite mensili o un pagamento delle imposte trimestrale, più e più volte, solo ...

Scelta dell'editore

Esportare documenti InDesign come file EPUB - dummies

Esportare documenti InDesign come file EPUB - dummies

Libri visualizzati utilizzando iBook, dispositivi Nook, lettori Kobo o eReader Sony tutti usano il formato di file EPUB. I libri visualizzati sul Kindle iniziano come file di e-pub ma subiscono un ulteriore processo di conversione nel formato Kindle di Amazon. La linea di fondo: se vuoi creare libri elettronici, devi sapere come creare EPUB ...

Esportare documenti PDF da InDesign Creative Suite 5 - dummies

Esportare documenti PDF da InDesign Creative Suite 5 - dummies

Esportare un file PDF da InDesign CS5 per distribuire i documenti creato con InDesign CS5 per gli utenti che non dispongono di Creative Suite 5 o che si trovano su computer e sistemi operativi diversi. Ecco come esportare in PDF:

Esportare file di testo da InDesign Creative Suite 5 - dummy

Esportare file di testo da InDesign Creative Suite 5 - dummy

Da Adobe InDesign CS5, è possibile estrarre testo da un documento InDesign in modo che possa essere modificato o utilizzato altrove. I formati di testo variano leggermente a seconda del testo nel documento. Per esportare il testo, attenersi alla seguente procedura: