Sommario:
- Attensity for big data
- Clarabridge per i big data
- IBM per big data
- OpenText per big data
- SAS per big data
Video: Maurizio Atzori: Tecnologie semantiche per Big Data e applicazioni 2024
Ecco una panoramica di alcuni dei giocatori nel mercato dei big data dell'analisi del testo. Alcuni sono piccoli mentre altri sono nomi familiari. Alcuni chiamano ciò che fanno analytics del testo dei dati di grandi dimensioni , mentre alcuni si riferiscono ad esso come analisi del testo.
Attensity for big data
Attensity è una delle aziende di analisi del testo originali che ha iniziato a sviluppare e vendere prodotti più di dieci anni fa. In questo momento, ha oltre 150 clienti aziendali e uno dei più grandi gruppi di sviluppo NLP del mondo. L'attitudine offre diversi motori per l'analisi del testo. Questi includono Auto-Classification, Entity Extraction ed Exhaustive Extraction. Exhaustive Extraction è la tecnologia di punta di Attensity che estrae automaticamente i fatti dal testo analizzato e organizza queste informazioni.
La società si concentra sull'analisi e sull'impegno sociale e multicanale analizzando il testo per la segnalazione da fonti interne ed esterne e quindi indirizzandolo agli utenti aziendali per il coinvolgimento. Recentemente ha acquistato Biz360, una società di social media che aggrega enormi flussi di social media. Ha sviluppato un sistema di grid computing che offre funzionalità ad alte prestazioni per l'elaborazione di enormi quantità di testo in tempo reale.
Attensity utilizza un framework Hadoop per archiviare i dati. Dispone inoltre di un sistema di accodamento dei dati che crea un processo di orchestrazione che riconosce i picchi nei dati in entrata e regola l'elaborazione su più / meno server in base alle esigenze.
Clarabridge per i big data
Un altro fornitore di analisi del testo puro, Clarabridge è in realtà uno spin-off di una società di consulenza di business intelligence (chiamata Claraview) che ha compreso la necessità di gestire i dati non strutturati. Il suo obiettivo è quello di aiutare le aziende a generare valore di business misurabile guardando al cliente in modo olistico, individuando le principali esperienze e problemi e aiutando tutti in un'organizzazione a intraprendere azioni e collaborare in tempo reale.
Ciò include la determinazione in tempo reale del sentimento e la classificazione dei dati / testo di feedback dei clienti e la messa in scena del verbo per l'elaborazione futura nel sistema Clarabridge.
In questo momento, Clarabridge offre ai suoi clienti alcune funzionalità sofisticate e interessanti, tra cui l'analisi della causa root single-click per identificare cosa sta causando un cambiamento nel volume di feed di testo, sentimento o soddisfazione associati a problemi emergenti. Offre anche la sua soluzione come Software as a Service (SaaS).
IBM per big data
gigante del software IBM offre diverse soluzioni nello spazio di analisi del testo con il suo ombrello strategico Smarter Planet.Oltre a Watson e IBM SPSS, IBM offre anche IBM Content Analytics con Enterprise Search. IBM Content Analytics è stato sviluppato sulla base del lavoro svolto presso IBM Research.
IBM Content Analytics viene utilizzato per trasformare il contenuto in informazioni analizzate e questo è disponibile per analisi dettagliate simili al modo in cui i dati strutturati verranno analizzati in un set di strumenti BI. IBM Content Analytics e Enterprise Search erano una volta due prodotti separati.
La soluzione convergente ha come obiettivo sia la ricerca aziendale avanzata che utilizza l'analisi del testo, sia le esigenze di analisi del contenuto autonomo. ICAES ha una stretta integrazione con la piattaforma IBM InfoSphere BigInsights, consentendo raccolte di analisi dei contenuti e di ricerca molto ampie.
OpenText per big data
OpenText, una società con sede in Canada, è probabilmente meglio conosciuta per la sua leadership nelle soluzioni di gestione delle informazioni aziendali. La sua visione ruota attorno alla gestione, alla protezione e all'estrazione di valore dai dati non strutturati delle imprese. Fornisce ciò che definisce "middleware semantico". "
Secondo la società, la sua evoluzione tecnologica semantica è radicata nella sua capacità" di consentire analisi in tempo reale con elevata accuratezza su grandi set di dati attraverso linguaggi, formati e domini industriali. "L'idea alla base del middleware semantico è che la semantica può essere esposta a diversi livelli e lavorare con tecnologie diverse per affrontare i problemi aziendali.
In altre parole, l'analisi del testo può essere abilitata e utilizzata dove necessario.
SAS per big data
SAS ha risolto a lungo problemi complessi di big data. Diversi anni fa, acquistò il fornitore di analisi del testo Teragram per migliorare la sua strategia di utilizzare i dati strutturati e non strutturati in analisi e di integrare questi dati per la modellazione descrittiva e predittiva. Ora, le sue capacità di analisi del testo fanno parte della sua piattaforma di analisi complessiva e i dati testuali sono considerati semplicemente un'altra fonte di dati.
SAS continua a innovare nel settore delle analisi ad alte prestazioni per garantire che le prestazioni soddisfino le aspettative dei clienti. L'obiettivo è quello di risolvere i problemi che in passato richiedevano settimane per risolverli e risolverli in giorni o problemi che in passato richiedevano giorni per risolverli e risolverli in pochi minuti.
Ad esempio, SAS High Performance Analytics Server è una soluzione in-memory che consente di sviluppare modelli analitici utilizzando dati completi, non solo un sottoinsieme di dati aggregati. SAS afferma che è possibile utilizzare migliaia di variabili e milioni di documenti come parte di questa analisi. La soluzione viene eseguita su appliance EMC Greenplum o Teradata e su hardware di base utilizzando Hadoop Distributed File System (HDFS).