Il tuo nome file Infographic può generare traffico - manichini
Cosa c'è in un nome? Quando si tratta della tua infografica, scegliere il nome giusto può anche aiutare a indirizzare il traffico verso il tuo lavoro. Vuoi che qualcuno veda il post per sapere entro uno o due secondi di cosa tratta il post. Imparare a dare un nome alla tua grafica richiede una conoscenza di base dell'ottimizzazione dei motori di ricerca ...
Funzionalità bigtable / Wide Column Store nei database NoSQL - dummies
Cloni bigtables sono un tipo di database NoSQL che è emerso dalla carta semestrale di Google. I Bigtables sono un modo altamente distribuito per gestire i dati tabulari. Queste tabelle di dati non sono correlate tra loro come se fossero in un tradizionale sistema di gestione dei database relazionali (RDBMS). Ecco le caratteristiche più importanti della popolare ...
Funzioni aziendali o mission-critical di NoSQL - dummies
Tutti i sistemi IT sofisticati hanno caratteristiche che diventano estremamente importanti se vengono utilizzati per lavoro o lavori mission-critical. Se la reputazione della tua organizzazione o la sua situazione finanziaria ne risentirebbero se il tuo sistema dovesse fallire, allora il tuo sistema è, per definizione, un sistema di classe enterprise. Un buon esempio di un simile sistema nel mondo dei servizi finanziari ...
Clustering in NoSQL - dummies
I database noSQL sono adatti a dataset di grandi dimensioni. I cloni Bigtable come HBase non fanno eccezione. Probabilmente vorrai utilizzare diversi server di prodotti economici in un singolo cluster piuttosto che una macchina molto potente. Questo perché è possibile ottenere prestazioni complessive per dollaro in generale utilizzando molti server commodity, piuttosto che un vasto ...
Sfide della virtualizzazione per i Big Data - manichini
Ambienti virtualizzati di big data devono essere adeguatamente gestiti e governati per realizzare costi risparmio ed efficienza Se ti affidi ai servizi di big data per risolvere i tuoi problemi di analisi, devi essere certo che l'ambiente virtuale è altrettanto ben gestito e sicuro dell'ambiente fisico. Alcuni dei vantaggi della virtualizzazione, ...
Alberi binari e alberi di ricerca binaria utilizzati negli algoritmi - manichini
Un tipo speciale di struttura ad albero è il heap binario, che colloca ciascuno degli elementi del nodo in un ordine speciale. Gli alberi di ricerca ti consentono di cercare rapidamente i dati. Ottenere gli elementi di dati, ordinarli in un albero e poi cercarli è uno dei modi più rapidi per trovare informazioni. ...
Build su Basic Scatterplots - dummies
I minatori di dati spesso sfruttano funzioni speciali per inserire più informazioni in grafici semplici. Etichette, sovrapposizioni e selezione interattiva sono le caratteristiche distintive delle applicazioni di data mining, caratteristiche speciali che ti consentono di essere più produttivo. Il chilometraggio diminuisce all'aumentare della potenza, come mostrato nella figura seguente. Il chilometraggio aumenta col passare del tempo, come puoi vedere, un grafico a dispersione ...
Sorgenti dati commerciali - manichini
Puoi imparare di più sull'utilizzo di dati disponibili in commercio per il marketing aziendale e consumer collegandoti con marketer e market ricercatori che condividono i tuoi interessi, così come i fornitori di dati. Queste associazioni professionali sono un buon punto di partenza per i contatti: American Marketing Association Associazione di marketing diretto Advertising Research Foundation Anche se questo elenco rappresenta solo ...
Controllo dell'ordine caso - manichini
I minatori di dati spesso ordinano i casi (cambia l'ordine delle righe) per ottenere un'organizzazione più chiara per la visualizzazione dei dati o esportare. Oppure, potresti avere un motivo funzionale per ordinare. Ad esempio, alcune applicazioni richiedono l'ordinamento dei dati prima della fusione (unione di colonne da diverse origini dati). I passaggi per l'ordinamento variano molto da un'applicazione all'altra. ...
Contando gli oggetti in un flusso di dati - dummies
Imparando a contare gli oggetti in un flusso può aiutarti a trovare il più frequente oggetti o classifica eventi normali e insoliti. Questo algoritmo sfrutta le funzioni hash e gli schizzi approssimativi. Lo fa dopo aver filtrato gli oggetti duplicati e contato gli elementi distinti che sono comparsi nel flusso di dati. Utilizzi questa tecnica per risolvere problemi come ...
Dati disponibili oltre i dati dei consumatori - dummies
Non tutti i dati di cui potresti aver bisogno riguardano le persone. Forse sei più interessato a imprese o organizzazioni non profit. Forse hai un interesse per temporali, ananas o ponti. Nessun problema. Le fonti commerciali possono fornire dati per tutte queste cose e molte altre. Se i dati sono disponibili hai un valore sufficiente per considerare il pagamento per ...
I dati colonna in NoSQL - dummies
In NoSQL sono simili alla prima apparizione al DBMS relazionale tradizionale. I concetti di righe e colonne sono ancora lì. Si definiscono anche le famiglie di colonne prima di caricare i dati nel database, il che significa che la struttura dei dati deve essere conosciuta in anticipo. Tuttavia, i negozi di colonne organizzano i dati in modo diverso rispetto ai database relazionali. Invece ...
Data Aggregation - dummies
Che riassume i dati, trova i totali e calcola le medie e altre misure descrittive probabilmente non sono nuove per te. Quando hai bisogno dei tuoi riepiloghi sotto forma di nuovi dati, piuttosto che di rapporti, il processo è chiamato aggregazione. I dati aggregati possono diventare la base per calcoli aggiuntivi, fusi con altri set di dati, utilizzati in qualsiasi modo che ...
Raggruppamento di reti sociali nei gruppi - manichini
Le persone tendono a formare comunità - gruppi di altre persone che hanno idee e sentimenti simili . Studiando questi cluster, l'attribuzione di determinati comportamenti al gruppo nel suo insieme diventa più semplice (sebbene attribuire il comportamento a un individuo sia pericoloso e inaffidabile). L'idea dietro lo studio dei cluster è che se una connessione ...
Data mining testing online - dummies
Gli ambienti online presentano minatori di dati con un mix unico di sfide e vantaggi per la raccolta e l'analisi dei dati . Ecco le cattive notizie: i formati di dati Web possono essere difficili da importare e manipolare in applicazioni di data mining. I sistemi che servono le pagine Web sono spesso scarsamente integrati con i sistemi di tracciamento delle vendite, rendendo difficile identificare le connessioni tra ...
Database e data mining - dummies
I dati raccolti dalle grandi organizzazioni nel corso delle attività quotidiane vengono solitamente archiviati in database. Ma gli amministratori di database potrebbero non essere disposti a consentire ai minatori di dati l'accesso diretto a queste fonti di dati, e l'accesso diretto potrebbe non essere l'opzione migliore dal tuo punto di vista. Accesso diretto all'operativo (utilizzato per la routine ...
Dati di consumo disponibili per Data Miners - dummies
Per presentare all'utente i tipi di informazioni sui consumatori disponibili attraverso fornitori commerciali, guarda un esempio dettagliato. La tabella include tutti i dati raccolti su un consumatore da Axciom, un importante fornitore di dati di marketing dei consumatori. Questo fornitore fornisce dati di marketing sui singoli consumatori e le famiglie in cui vivono questi consumatori, come segue: ...
Gestione dati per Big Data - dummies
I big data sono davvero nuovi o sono un'evoluzione nel percorso di gestione dei dati? In realtà è entrambi. Come con altre ondate nella gestione dei dati, i big data si basano sull'evoluzione delle pratiche di gestione dei dati negli ultimi cinquant'anni. La novità è che per la prima volta, il costo ...
10 Errori di data mining comuni (che non farai) - dummies
Il data mining viene eseguito per tentativi ed errori, quindi, per i data miners, commettere errori è naturale. Gli errori possono essere preziosi, in altre parole, almeno in determinate condizioni. Tuttavia, non tutti gli errori sono uguali. Alcuni sono semplicemente meglio evitati. Il seguente elenco offre dieci errori di questo tipo. Se li leggi attentamente, ...
Data mining massimizza i profitti del magazzino Warehouse - dummies
Forse hai acquistato in uno dei club del magazzino, catene di negozi al dettaglio che offrono shopping solo per membri in grandi negozi senza fronzoli. I club del magazzino dispongono di pavimenti in cemento nudo, scaffalature semplici e funzionali e una scelta limitata di prodotti e confezioni. Le loro corsie di check-out non offrono borse, figuriamoci bagger, per imballare i tuoi acquisti. I club del magazzino impostano ...
Dati Opzioni di protezione per Big Data - dummies
Alcuni esperti di big data credono che diversi tipi di dati richiedano forme diverse di protezione e che, in alcuni casi in un ambiente cloud, la crittografia dei dati potrebbe, in effetti, essere eccessiva. Potresti criptare tutto. È possibile crittografare i dati, ad esempio, quando lo si scrive sul proprio disco rigido, quando lo si invia a ...
Caratteristiche comuni di NoSQL - dummies
Libri e blog noSQL offrono opinioni diverse su cosa sia un database NoSQL. Le quattro funzioni principali di NoSQL, riportate nell'elenco seguente, si applicano alla maggior parte dei database NoSQL. L'elenco confronta NoSQL con DBMS relazionale tradizionale: agnostico dello schema: uno schema di database è la descrizione di tutti i possibili dati e strutture di dati in un database relazionale. ...
Sono gli elementi nel set di dati non corretti? - dummies
Per un set di dati costituito da osservazioni eseguite in diversi momenti nel tempo (ovvero dati di serie temporali), è importante determinare se le osservazioni siano o meno correlate l'una con l'altra. Ciò è dovuto al fatto che molte tecniche per la modellazione dei dati delle serie temporali si basano sul presupposto che i dati non sono correlati l'uno con l'altro ...
3 Tipi di Machine Learning - dummies
L'apprendimento automatico ha molte varianti, a seconda dell'algoritmo e dei suoi obiettivi. È possibile dividere gli algoritmi di apprendimento automatico in tre gruppi principali in base al loro scopo: Apprendimento supervisionato Apprendimento non supervisionato Apprendimento rinforzato Apprendimento supervisionato L'apprendimento supervisionato si verifica quando un algoritmo apprende dai dati di esempio e dalle risposte target associate che possono essere numeriche ...
Nozioni di base sui modelli di classificazione per previsioni analitiche - dummies
Una volta disponibili tutti gli strumenti e i dati necessari per iniziare a creare un modello predittivo, inizia il divertimento. In generale, la creazione di un modello di apprendimento per le attività di classificazione comporterà i seguenti passaggi: Caricare i dati. Scegli un classificatore. Allenare il modello. Visualizza il modello. Prova il modello Valuta il modello. Sia la regressione logistica che ...
Applicazione dell'analisi dei componenti principali a Predictive Analytics - dummies
Analisi delle componenti principali (PCA) è una tecnica valida che è ampiamente utilizzato nell'analisi predittiva e nella scienza dei dati. Studia un set di dati per apprendere le variabili più rilevanti responsabili della massima variazione in quell'insieme di dati. PCA è usato principalmente come tecnica di riduzione dei dati. Mentre si costruiscono modelli predittivi, potrebbe essere necessario ridurre ...
10 Raccolte di risorse di Data Science essenziali da utilizzare con Python - dummies
C'è davvero un sacco di informazioni disponibili per gli scienziati che usano Python. Queste informazioni ti introducono in una vasta gamma di raccolte di risorse per la scienza dei dati che devi assolutamente conoscere. Approfondimenti con Data Science Weekly Il Data Science Weekly è una newsletter gratuita che puoi iscriverti per ottenere ...
8 Best practice nella preparazione dei dati - dummies
I pacchetti software statistici sono estremamente potenti in questi giorni, ma non possono superare i poveri dati di qualità. Di seguito è riportata una lista di cose che devi fare prima di iniziare a costruire modelli statistici. Verifica i formati dei dati L'analisi inizia sempre con un file di dati non elaborati. I file di dati grezzi sono disponibili in diverse forme e dimensioni. Mainframe ...
Evitando Sample Bias e Leakage Traps in Machine Learning - dummies
L'approccio di validazione all'apprendimento automatico è un esame di un possibile rimedio al bias nel campionamento. Il bias nel campionamento può capitare ai tuoi dati prima che l'apprendimento automatico venga messo in atto e provoca un'alta varianza delle seguenti stime. Inoltre, è necessario essere consapevoli delle trappole di perdita che possono verificarsi quando alcune informazioni da ...
Grafici di autocorrelazione: tecnica grafica per dati statistici - dummies
Un grafico di autocorrelazione mostra le proprietà di un tipo di dati noti come serie temporali. Una serie temporale si riferisce alle osservazioni di una singola variabile su un orizzonte temporale specificato. Ad esempio, il prezzo giornaliero del magazzino Microsoft durante l'anno 2013 è una serie storica. I dati cross-sectional si riferiscono alle osservazioni su molte variabili ...
10 Risorse gratuite per Data Science - dummies
Una cosa eccellente della scienza dei dati è che non è necessario spendere un sacco di soldi per le applicazioni software e i dati di origine per iniziare a raccogliere i suoi benefici. Puoi iniziare semplicemente con i tuoi dati e iniziare a utilizzare applicazioni open source o linguaggi di programmazione per iniziare a ricavare preziose informazioni. Even ...
Nozioni di base su K-Means e DBSCAN Modelli di clustering per predittività Analytics - dummies
Apprendimento non supervisionato ha molte sfide per l'analisi predittiva - incluso non sapere cosa aspettarsi quando si esegue un algoritmo. Ogni algoritmo produrrà risultati diversi; non sarai mai sicuro se un risultato è migliore dell'altro o se il risultato è di qualsiasi valore. Quando sapete quali sono i risultati dovrebbero ...
Soluzioni di Big Data alternative - dummies
Guardando oltre Hadoop, è possibile vedere soluzioni alternative di big data all'orizzonte. Queste soluzioni consentono di lavorare con i big data in tempo reale o di utilizzare tecnologie di database alternative per gestirli ed elaborarli. Qui, vengono introdotti i framework di elaborazione in tempo reale, poi le piattaforme MPP (Massively Parallel Processing) e infine NoSQL ...
Nozioni di base sui dati statici e in streaming in Predictive Analyics - dummies
I dati nell'analisi predittiva possono essere identificati come in streaming, statico o un mix dei due. I dati in streaming cambiano continuamente; gli esempi includono il flusso costante di aggiornamenti di Facebook, i tweet su Twitter e i prezzi delle azioni in costante evoluzione mentre il mercato è ancora aperto. I dati in streaming cambiano continuamente; i dati statici sono autonomi e chiusi. Il ...
Nozioni di base su Tipi di dati e strutture nella Programmazione R per Predictive Analytics - dummies
In R programmazione per l'analisi predittiva, i tipi di dati sono a volte confusi con le strutture dati. Ogni variabile nella memoria del programma ha un tipo di dati. Certo, puoi farcela con diverse variabili nel tuo programma ed essere ancora gestibile. Ma probabilmente non funzionerà così bene se hai centinaia (o migliaia) di variabili; ...
10 Modi per migliorare i modelli di apprendimento automatico - dummies
Ora che l'algoritmo di apprendimento automatico è terminato imparando dai dati ottenuti usando Python o R, stai riflettendo sui risultati del tuo set di prova e ti chiedi se puoi migliorarli o se hai davvero raggiunto il miglior risultato possibile. Ci sono una serie di controlli e azioni che suggeriscono metodi che puoi usare ...
Migliorare il mondo attraverso Data Science - dummies
Perché la scienza dei dati implica metodi, approcci e risultati complessi, è possibile facilmente perdere di vista l'obiettivo per ogni progetto dato - guardando così da vicino la corteccia degli alberi che si dimentica di trovare la via d'uscita dalla foresta, in altre parole. Molti scienziati hanno sprecato un sacco di tempo ...
Nozioni di base di R Programming for Predictive Analytics - dummies
R è un linguaggio di programmazione scritto originariamente per gli statistici per fare statistiche analisi, compresa l'analisi predittiva. È un software open source, ampiamente utilizzato in ambito accademico per insegnare discipline come la statistica, la bioinformatica e l'economia. Fin dalle sue umili origini, è stato successivamente esteso alla modellazione dei dati, al data mining e all'analisi predittiva. R ha un molto attivo ...
Nozioni di base di filtri predittivi basati sui contenuti - dummies
Sistemi di raccomandazione predittivi basati sul contenuto (parole chiave taggate) tra articoli simili e il profilo dell'utente per dare consigli. Quando un utente acquista un articolo con caratteristiche taggate, gli articoli con caratteristiche corrispondenti a quelli dell'articolo originale saranno consigliati. Più le caratteristiche corrispondono, più alta è la probabilità che l'utente vorrà ...
Basi del processo di classificazione dei dati di Predictive Analytics - manichini
A livello di puntine di bronzo, dati di previsione predittivi la classificazione consiste di due fasi: la fase di apprendimento e la fase di predizione. La fase di apprendimento comporta la formazione del modello di classificazione eseguendo un set designato di dati passati attraverso il classificatore. L'obiettivo è insegnare al tuo modello ad estrarre e scoprire relazioni e regole nascoste - il ...