Sommario:
- Scienza dei dati e l'ingegneria dei dati non è la stessa
- Anche la scienza dei dati e la business intelligence non sono gli stessi
Video: CraftUniversity [FILM COMPLETO] - Minecraft ITA Roleplay 2024
Parte di Data Science For Dummies Cheat Sheet
Tradizionalmente, big data è il termine per dati con volume, velocità e varietà incredibili. Le tradizionali tecnologie di database non sono in grado di gestire i big data - sono necessarie più soluzioni innovative progettate per i dati. Per valutare il progetto per stabilire se si qualifica come un progetto di grandi quantità di dati, considerare i seguenti criteri:
-
Volume: Tra 1 terabyte / anno e 10 petabyte / anno
-
Velocità: Tra 30 kilobyte / secondo e 30 gigabyte / secondo
-
Varietà: Fonti combinate di dati non strutturati, semi-strutturati e strutturati
Scienza dei dati e l'ingegneria dei dati non è la stessa
I responsabili delle assunzioni tendono a confondere i ruoli di data scientist e data engineer. Mentre è possibile trovare qualcuno che fa un po 'di entrambi, ogni campo è incredibilmente complesso. È improbabile che troverai qualcuno con solide capacità ed esperienza in entrambe le aree. Per questo motivo, è importante essere in grado di identificare quale tipo di specialista è più appropriato per aiutarti a raggiungere i tuoi obiettivi specifici. Le descrizioni di seguito dovrebbero aiutarti a farlo.
-
Scienziati di dati: Gli scienziati di dati utilizzano la codifica, metodi quantitativi (matematici, statistici e di apprendimento automatico) e competenze altamente specializzate nella loro area di studio per ricavare soluzioni a complessi problemi aziendali e scientifici.
-
Ingegneri informatici: I tecnici informatici utilizzano competenze in informatica e ingegneria del software per progettare sistemi, risolvere problemi, gestire e manipolare grandi set di dati.
Anche la scienza dei dati e la business intelligence non sono gli stessi
Gli scienziati di dati business-centric e gli analisti di business che fanno business intelligence sono come i cugini. Entrambi i tipi di specialista utilizzano i dati per raggiungere gli stessi obiettivi di business, ma i loro approcci, tecnologie e funzioni sono diversi. Le descrizioni sottostanti spiegano le differenze tra i due ruoli.
-
Business intelligence (BI): Le soluzioni BI vengono generalmente create utilizzando set di dati generati internamente, in altre parole da un'organizzazione piuttosto che dall'esterno. Gli strumenti e le tecnologie comuni includono l'elaborazione analitica online, la trasformazione e il caricamento dell'estrazione e il data warehousing. Sebbene la BI a volte implichi metodi lungimiranti come la previsione, questi metodi si basano su semplici deduzioni matematiche da dati storici o attuali.
-
Scienza dei dati incentrati sulle imprese: Le soluzioni di data science incentrate sulle aziende sono create utilizzando dataset interni ed esterni a un'organizzazione. Strumenti, tecnologie e skillset comuni includono piattaforme di analisi basate su cloud, programmazione statistica e matematica, machine learning, analisi dei dati con Python e R e visualizzazione avanzata dei dati. Gli scienziati dei dati incentrati sul business utilizzano metodi matematici o statistici avanzati per analizzare e generare previsioni da grandi quantità di dati aziendali.