Casa Finanza personale Analisi e tecniche di estrazione per i Big Data - manichini

Analisi e tecniche di estrazione per i Big Data - manichini

Sommario:

Video: Un tipo di analisi dati su Google Analytics (base, ma efficace) - Tutorial GA e GTM 7 2024

Video: Un tipo di analisi dati su Google Analytics (base, ma efficace) - Tutorial GA e GTM 7 2024
Anonim

In generale, le soluzioni di analisi del testo per i big data utilizzano una combinazione di tecniche di elaborazione del linguaggio naturale e di statistica (NLP) per estrarre informazioni da dati non strutturati. La PNL è un campo ampio e complesso che si è sviluppato negli ultimi 20 anni.

Un obiettivo principale della PNL è derivare il significato dal testo. L'elaborazione del linguaggio naturale generalmente fa uso di concetti linguistici come strutture grammaticali e parti del discorso. Spesso, l'idea alla base di questo tipo di analisi è determinare chi ha fatto cosa a chi, quando, dove, come e perché.

NLP esegue analisi sul testo a diversi livelli:

  • Analisi lessicale / morfologica esamina le caratteristiche di una singola parola - inclusi prefissi, suffissi, radici e parti del discorso (sostantivo, verbo, aggettivo e così via) - informazioni che contribuiranno a capire cosa significa la parola nel contesto del testo fornito. L'analisi lessicale dipende da un dizionario, un dizionario dei sinonimi o qualsiasi elenco di parole che fornisce informazioni su tali parole.

  • L'analisi sintattica usa la struttura grammaticale per sezionare il testo e mettere le singole parole nel contesto. Qui stai allargando lo sguardo da una singola parola alla frase o alla frase completa. Questo passaggio potrebbe schematizzare la relazione tra le parole (la grammatica) o cercare sequenze di parole che formano frasi corrette o per sequenze di numeri che rappresentano date o valori monetari.

  • Analisi semantica determina i possibili significati di una frase. Questo può includere l'esame dell'ordinamento delle parole e della struttura delle frasi e delle parole disambiguanti mettendo in relazione la sintassi trovata nelle frasi, nelle frasi e nei paragrafi.

  • Analisi a livello di discorso tenta di determinare il significato del testo oltre il livello della frase.

Comprendere le informazioni estratte dai big data

Alcune tecniche, combinate con altre tecniche statistiche o linguistiche per automatizzare il tagging e il markup dei documenti di testo, possono estrarre i seguenti tipi di informazioni:

  • Termini: Altro nome per parole chiave.

  • Entità: Spesso chiamate denominate entità , sono esempi specifici di astrazioni. Esempi sono nomi di persone, nomi di aziende, posizioni geografiche, informazioni di contatto, date, orari, valute, titoli e posizioni, e così via. Ad esempio, il software di analisi del testo può estrarre l'entità Jane Doe come una persona a cui si fa riferimento nel testo analizzato. L'entità 3 marzo 2007 può essere estratta come data e così via.

  • Fatti: Anche detti relazioni , indicano le relazioni who / what / where tra due entità. John Smith è il CEO della società Y e Aspirina riduce la febbre sono esempi di fatti.

  • Eventi: Mentre alcuni esperti usano i termini fatto , relazione , e evento in modo intercambiabile, altri distinguono tra eventi e fatti, affermando che gli eventi di solito contengono una dimensione temporale e spesso causano cambiamenti di fatti. Gli esempi includono un cambiamento nella gestione all'interno di un'azienda o lo stato di un processo di vendita.

  • Concetti: Si tratta di insiemi di parole e frasi che indicano una particolare idea o argomento con cui l'utente è interessato. Ad esempio, il concetto cliente infelice potrebbe includere le parole arrabbiato, deluso, e confuso e le frasi disconnettere il servizio, non richiamare, e spreco di denaro - tra molti altri. Così il concetto cliente infelice può essere estratto senza che le parole infelice o cliente appaiano nel testo.

  • Sentimenti: L'analisi del sentimento viene utilizzata per identificare punti di vista o emozioni nel testo sottostante. Alcune tecniche lo fanno classificando il testo come, per esempio, soggettivo (opinione) o oggettivo (fatto), usando tecniche di apprendimento automatico o PNL. L'analisi del sentiment è diventata molto popolare nel tipo di applicazioni "voce del cliente".

Tassonomie dei Big Data

Le tassonomie sono spesso fondamentali per l'analisi del testo. Una tassonomia è un metodo per organizzare le informazioni in relazioni gerarchiche. A volte viene indicato come un modo di organizzare le categorie. Perché una tassonomia definisce le relazioni tra i termini utilizzati da un'azienda, rende più facile trovare e quindi analizzare il testo.

Ad esempio, un fornitore di servizi di telecomunicazione offre sia un servizio cablato che un servizio wireless. All'interno del servizio wireless, l'azienda può supportare telefoni cellulari e accesso a Internet. La società può quindi avere due o più modi di categorizzare il servizio di telefonia cellulare, come piani e tipi di telefono. La tassonomia potrebbe arrivare fino alle parti di un telefono stesso.

Le tassonomie possono anche utilizzare sinonimi ed espressioni alternative, riconoscendo che cellulare, telefono cellulare e telefono cellulare sono tutti uguali. Queste tassonomie possono essere piuttosto complesse e può richiedere molto tempo per svilupparsi.

Analisi e tecniche di estrazione per i Big Data - manichini

Scelta dell'editore

Comprensione dei livelli di accesso e dei ruoli in Microsoft CRM - dummies

Comprensione dei livelli di accesso e dei ruoli in Microsoft CRM - dummies

I privilegi che vi sono assegnati regolano le funzioni che è possibile eseguire su particolari record o oggetti. I tuoi livelli di accesso determinano a quale record si applicano questi privilegi. In altre parole, sebbene i tuoi privilegi possano includere la possibilità di eliminare i record account, è il tuo livello di accesso che determina esattamente quali record puoi eliminare. ...

Scegli o cambia utenti in NaturallySpeaking - dummies

Scegli o cambia utenti in NaturallySpeaking - dummies

Quando lanci Dragon NaturallySpeaking, potrebbe chiederti di scegliere un utente . Se non ti chiede, non ti preoccupare. Probabilmente hai un solo utente: tu. Ricorda che quando hai configurato NaturallySpeaking per la prima volta, hai creato e nominato un profilo utente e poi hai addestrato NaturallySpeaking su come l'utente (tu) ha suonato. Ora, quando avvii ...

Aggiungi una fonte di dettatura al tuo profilo corrente - dummies

Aggiungi una fonte di dettatura al tuo profilo corrente - dummies

La tua voce registrata è così diversa dalla tua voce dal vivo che devi addestrare Dragon NaturallySpeaking a riconoscerlo. Allenarsi NaturallySpeaking per capire la tua voce registrata è come allenarlo per dettatura diretta, con una differenza: leggi il materiale di allenamento nel tuo registratore, trasferisci il dettato sul PC e poi ...

Scelta dell'editore

Mantieni il tuo cervello affilato disegnando - manichini

Mantieni il tuo cervello affilato disegnando - manichini

Se non hai mai pensato a te stesso come una persona creativa, è tempo per un cambio di pensiero. Ogni persona ha il potenziale per sbloccare un aspetto della creatività. Ecco alcuni suggerimenti per aiutarti ad andare avanti. Includono suggerimenti su semplici attività di disegno per iniziare - ma se ritieni che ...

Come usare la tolleranza come tecnica di gestione della rabbia - manichini

Come usare la tolleranza come tecnica di gestione della rabbia - manichini

La rabbia è l'emozione dell'intolleranza che può essere gestito attraverso la pratica della tolleranza. Intolleranza significa che non accetti il ​​punto di vista o il comportamento di un'altra persona. La rabbia dice che pensi di avere ragione e che l'altra persona ha torto. Non può essere più semplice di così. La rabbia difende l'ascoltatore da qualsiasi cambiamento nel suo modo di pensare. ...

Migliorare la gestione della rabbia con l'esercizio - manichini

Migliorare la gestione della rabbia con l'esercizio - manichini

Una quantità di prove scientifiche supporta il fatto che l'esercizio fisico regolare migliora gli stati d'animo e può aiutarti a ridurre la tua rabbia. Se scegli di allenarti regolarmente, puoi aspettarti di Concentrare meglio Dormire meglio Mostra un maggiore interesse per il sesso Avere più energia Sii meno teso Goditi la vita più in generale Sento meno alienato ...

Scelta dell'editore

Caratteristiche della Canon Digital Rebel XTi / 400D - manichini

Caratteristiche della Canon Digital Rebel XTi / 400D - manichini

La tua nuova Canon Digital Rebel XTi / 400D ha una serie di funzioni e le seguenti figure le indicano una ad una. Un asterisco indica che un pulsante o un controllo ha più funzioni. Verificando la Canon XTi / 400D dal punto di vista del fotografo. Osservando alcuni dei pulsanti e dei quadranti principali. Trovare la messa a fuoco e ...

Caratteristiche della Canon EOS Digital Rebel XSi / 450D - manichini

Caratteristiche della Canon EOS Digital Rebel XSi / 450D - manichini

Le seguenti figure offrono una comoda guida ai pulsanti, ai quadranti e ad altre funzioni esterne della tua Canon EOS Digital Rebel XSi / 450D. Si noti che l'obiettivo mostrato è il modello Canon EF-S 18-55mm IS (Image Stabilization) venduto con XSi / 450D; altri obiettivi potrebbero non avere le stesse caratteristiche. Dal punto di vista del fotografo. Guardando verso il basso ...

Controlli esterni della fotocamera sulla Canon EOS Rebel T3 / 1100D - manichini

Controlli esterni della fotocamera sulla Canon EOS Rebel T3 / 1100D - manichini

Sparsi per l'esterno della tua Canon EOS Rebel T3 / 1100D sono un numero di pulsanti, quadranti e interruttori che usi per cambiare le impostazioni di ripresa delle foto, rivedere e modificare le tue foto ed eseguire varie altre operazioni. Ecco una introduzione di base ai controlli esterni. Controlli Topside sulla Canon EOS Rebel T3 / 1100D Il tour virtuale inizia ...