Casa Finanza personale Analisi e tecniche di estrazione per i Big Data - manichini

Analisi e tecniche di estrazione per i Big Data - manichini

Sommario:

Video: Un tipo di analisi dati su Google Analytics (base, ma efficace) - Tutorial GA e GTM 7 2025

Video: Un tipo di analisi dati su Google Analytics (base, ma efficace) - Tutorial GA e GTM 7 2025
Anonim

In generale, le soluzioni di analisi del testo per i big data utilizzano una combinazione di tecniche di elaborazione del linguaggio naturale e di statistica (NLP) per estrarre informazioni da dati non strutturati. La PNL è un campo ampio e complesso che si è sviluppato negli ultimi 20 anni.

Un obiettivo principale della PNL è derivare il significato dal testo. L'elaborazione del linguaggio naturale generalmente fa uso di concetti linguistici come strutture grammaticali e parti del discorso. Spesso, l'idea alla base di questo tipo di analisi è determinare chi ha fatto cosa a chi, quando, dove, come e perché.

NLP esegue analisi sul testo a diversi livelli:

  • Analisi lessicale / morfologica esamina le caratteristiche di una singola parola - inclusi prefissi, suffissi, radici e parti del discorso (sostantivo, verbo, aggettivo e così via) - informazioni che contribuiranno a capire cosa significa la parola nel contesto del testo fornito. L'analisi lessicale dipende da un dizionario, un dizionario dei sinonimi o qualsiasi elenco di parole che fornisce informazioni su tali parole.

  • L'analisi sintattica usa la struttura grammaticale per sezionare il testo e mettere le singole parole nel contesto. Qui stai allargando lo sguardo da una singola parola alla frase o alla frase completa. Questo passaggio potrebbe schematizzare la relazione tra le parole (la grammatica) o cercare sequenze di parole che formano frasi corrette o per sequenze di numeri che rappresentano date o valori monetari.

  • Analisi semantica determina i possibili significati di una frase. Questo può includere l'esame dell'ordinamento delle parole e della struttura delle frasi e delle parole disambiguanti mettendo in relazione la sintassi trovata nelle frasi, nelle frasi e nei paragrafi.

  • Analisi a livello di discorso tenta di determinare il significato del testo oltre il livello della frase.

Comprendere le informazioni estratte dai big data

Alcune tecniche, combinate con altre tecniche statistiche o linguistiche per automatizzare il tagging e il markup dei documenti di testo, possono estrarre i seguenti tipi di informazioni:

  • Termini: Altro nome per parole chiave.

  • Entità: Spesso chiamate denominate entità , sono esempi specifici di astrazioni. Esempi sono nomi di persone, nomi di aziende, posizioni geografiche, informazioni di contatto, date, orari, valute, titoli e posizioni, e così via. Ad esempio, il software di analisi del testo può estrarre l'entità Jane Doe come una persona a cui si fa riferimento nel testo analizzato. L'entità 3 marzo 2007 può essere estratta come data e così via.

  • Fatti: Anche detti relazioni , indicano le relazioni who / what / where tra due entità. John Smith è il CEO della società Y e Aspirina riduce la febbre sono esempi di fatti.

  • Eventi: Mentre alcuni esperti usano i termini fatto , relazione , e evento in modo intercambiabile, altri distinguono tra eventi e fatti, affermando che gli eventi di solito contengono una dimensione temporale e spesso causano cambiamenti di fatti. Gli esempi includono un cambiamento nella gestione all'interno di un'azienda o lo stato di un processo di vendita.

  • Concetti: Si tratta di insiemi di parole e frasi che indicano una particolare idea o argomento con cui l'utente è interessato. Ad esempio, il concetto cliente infelice potrebbe includere le parole arrabbiato, deluso, e confuso e le frasi disconnettere il servizio, non richiamare, e spreco di denaro - tra molti altri. Così il concetto cliente infelice può essere estratto senza che le parole infelice o cliente appaiano nel testo.

  • Sentimenti: L'analisi del sentimento viene utilizzata per identificare punti di vista o emozioni nel testo sottostante. Alcune tecniche lo fanno classificando il testo come, per esempio, soggettivo (opinione) o oggettivo (fatto), usando tecniche di apprendimento automatico o PNL. L'analisi del sentiment è diventata molto popolare nel tipo di applicazioni "voce del cliente".

Tassonomie dei Big Data

Le tassonomie sono spesso fondamentali per l'analisi del testo. Una tassonomia è un metodo per organizzare le informazioni in relazioni gerarchiche. A volte viene indicato come un modo di organizzare le categorie. Perché una tassonomia definisce le relazioni tra i termini utilizzati da un'azienda, rende più facile trovare e quindi analizzare il testo.

Ad esempio, un fornitore di servizi di telecomunicazione offre sia un servizio cablato che un servizio wireless. All'interno del servizio wireless, l'azienda può supportare telefoni cellulari e accesso a Internet. La società può quindi avere due o più modi di categorizzare il servizio di telefonia cellulare, come piani e tipi di telefono. La tassonomia potrebbe arrivare fino alle parti di un telefono stesso.

Le tassonomie possono anche utilizzare sinonimi ed espressioni alternative, riconoscendo che cellulare, telefono cellulare e telefono cellulare sono tutti uguali. Queste tassonomie possono essere piuttosto complesse e può richiedere molto tempo per svilupparsi.

Analisi e tecniche di estrazione per i Big Data - manichini

Scelta dell'editore

Tasti di scelta rapida per Microsoft Office 2007 - dummies

Tasti di scelta rapida per Microsoft Office 2007 - dummies

Microsoft Office 2007 è pieno di scorciatoie da tastiera per risparmiare tempo. Comprimi i componenti di Office 2007 - Word, Excel, Outlook, PowerPoint e Access - utilizzando i tasti di scelta rapida utili della seguente tabella. Con poco sforzo, puoi aprire file, trovare contenuti, modificare quel contenuto e altro! Funzione Ctrl Copia Ctrl + C Taglia Ctrl + X Trova Ctrl + F Vai ...

Vantaggi di Lync Online - dummies

Vantaggi di Lync Online - dummies

Lync Online è disponibile sia in ambito professionale sia in piccole imprese (P) e aziendali (E ) piani in Office 365. Le funzionalità includono messaggistica istantanea (IM), chiamate audio e video, presenza, riunioni online, presentazioni online e la possibilità di connettersi con i contatti di Windows Live Messenger e altri utenti esterni che eseguono Lync. La tecnologia è integrata in tutto ...

Come avviare una conversazione con Lync Online - dummies

Come avviare una conversazione con Lync Online - dummies

La scheda di contatto di Lync Online è un ottimo modo per avviare una conversazione con un collega o i membri del tuo team. Oltre alle note personali, alla presenza e alla posizione, vengono visualizzate anche le informazioni sulla tua organizzazione come il titolo e i numeri di telefono. Per visualizzare la scheda di contatto, passa con il mouse sopra l'immagine di una persona e fai clic sul gallone ...

Scelta dell'editore

Come scegliere un'immagine di sfondo Twitter per Visual Social Marketing - dummies

Come scegliere un'immagine di sfondo Twitter per Visual Social Marketing - dummies

Quando si imposta su un account Twitter per il social marketing visivo, un tipo di immagine che è richiesto per il tuo profilo è l'immagine di sfondo - viene visualizzata dietro il profilo Twitter. Nella parte superiore della schermata Impostazioni disegno, Twitter ti consente di scegliere tra una serie di temi premade. Un tema premade applica un ...

Come scegliere un buon nome utente Twitter - dummy

Come scegliere un buon nome utente Twitter - dummy

Su Twitter, il tuo nome utente, o handle, è il tuo identità. Se puoi, iscriviti a Twitter usando il tuo nome o una variante di esso come nome utente (supponendo che qualcun altro non lo stia già utilizzando). Ad esempio, se il tuo nome è John Ira, potresti scegliere un nome utente Twitter come @johnira o ...

Come personalizzare il tuo profilo Twitter - dummies

Come personalizzare il tuo profilo Twitter - dummies

La tua pagina pubblica su Twitter, noto anche come profilo, è la prima impressione che gli altri utenti di Twitter hanno di te, e può fare una grande differenza nel decidere se seguirti. Personalizzare la tua pagina del profilo Twitter in modo che rifletta te o la tua azienda fa la differenza quando si tratta di persone ...

Scelta dell'editore

Perché avresti bisogno di più profili utente per Dragon Professional Individuale - manichini

Perché avresti bisogno di più profili utente per Dragon Professional Individuale - manichini

Drago Individuo professionale capisce solo quelli che si sono presentati ufficialmente come utenti e hanno creato un profilo utente. Ecco quattro motivi per cui potresti voler creare più di un profilo utente: usi diversi vocabolari o stili di scrittura per compiti diversi. Si utilizzano diversi microfoni per compiti diversi. Volete ...

Lavorare con fogli di calcolo Usare NaturallySpeaking - dummies

Lavorare con fogli di calcolo Usare NaturallySpeaking - dummies

Utilizzando fogli di calcolo con versioni precedenti di NaturallySpeaking era difficile perché non si poteva indirizzare direttamente i nomi delle celle. Volevi dire qualcosa come "Cella A5" o "Seleziona Colonna C." Ma (sospiro), niente dado. Il tuo assistente non aveva idea di cosa stavi parlando. Bene, il tuo assistente ha "up-leveled" le sue abilità! Ora è possibile ...

Su Evernote's Passcode Lock - dummies

Su Evernote's Passcode Lock - dummies

Abbonati premium e business che utilizzano determinati dispositivi ora possono bloccare l'app Evernote con un blocco Passcode . Ogni volta che torni all'app, ti viene chiesto di inserire il tuo codice. Un blocco passcode è un'ottima opzione se condividi il tuo telefono o tablet con altre persone e vuoi impedire loro di accedere a ...