10 Hadoop Risorse Degno di un segnalibro - manichini

Di seguito sono elencate dieci risorse Hadoop formidabili che meritano la creazione di un segnalibro nel browser. Queste risorse ti aiutano a creare un piano di apprendimento permanente per Hadoop.

Sistema nervoso centrale: Apache. org

Apache Software Foundation (ASF) è la comunità centrale per progetti di software open source. Non tutti i progetti possono essere un progetto Apache - molti processi basati sul consenso convertono un software dal suo design iniziale e dal codice beta (il suo stato incubatore ) a un software completo, generalmente disponibile.

L'ASF non è solo la gestione di progetti come Hadoop: è lì che "vivono e respirano". "Oggi ci sono centinaia di progetti Apache. Con questo in mente, dovresti aggiungere la pagina di Apache Hadoop come una delle tue principali risorse di apprendimento. Questo sito è importante perché puoi accedere al codice sorgente lì.

Twitter non è il posto giusto per imparare Hadoop di per sé - dopotutto, non puoi facilmente padroneggiare la programmazione di MapReduce in lezioni che coprono solo 140 caratteri. Sia come sia, un bel po 'di guru dei big data sono su Twitter, e esprimono opinioni e puntano a risorse che possono renderti un utente Hadoop più intelligente.

Un certo numero di elenchi di influencer top nel panorama di Twitter copre Hadoop e big data, ed è il modo migliore per trovare queste personalità Hadoop e aggiungerle agli elenchi di Twitter.

Hortonworks University

Hortonworks University offre formazione e certificazioni Hadoop. Il sito offre corsi Hadoop costruiti per amministratori o professionisti dello sviluppatore con la possibilità di un rigoroso programma di certificazione. Hortonworks si avvale di alcuni degli esperti di Hadoop più profondi e noti al mondo, quindi sei certo delle competenze di qualità che stanno dietro al corso.

Cloudera University

Cloudera University è simile nel suo modello di business e charter alla Hortonworks University, fornendo una serie di percorsi di apprendimento che vanno dal tradizionale testo al video. Cloudera è un evento di spicco nel mondo Hadoop. (Doug Cutting, il "padre" di Hadoop è il suo capo architetto.) Il sito offre una vasta gamma di corsi, e altro ancora, che si basano sulla distribuzione di Cloudera per Hadoop (CDH).

BigDataUniversity. com

BigDataUniversity. com (il caso non importa quando inserisci l'URL nel tuo browser) è una risorsa fantastica per conoscere - hai indovinato - i big data. Ovviamente, i big data non sono solo Hadoop, quindi in questo sito troverai più risorse di Hadoop.Questa università ha oltre 100.000 studenti iscritti e apprende Hadoop e big data ogni giorno.

pianeta Big Data Blog Aggregator

È fantastico quando il nome di un sito ti dice esattamente quello che fa, ad esempio il pianeta Big Data Blog Aggregator: è un aggregatore di blog sui big data, Hadoop e altri argomenti correlati sul pianeta (beh, sul pianeta Terra comunque).

Sia i grandi nomi che i non-nomi compaiono sul sito, ma ciò è utile: sebbene ci sia indubbiamente un impegno per Hadoop da parte di Cloudera, Hortonworks, IBM e altri, è spesso rinfrescante e prezioso per ottenere l'esposizione ai pensieri e alle opinioni di radici di base, professionisti non affiliati da comunità non legate a un fornitore specifico nella tua roadmap di apprendimento.

Il forum di Quora Apache Hadoop

Il forum di Quora Apache Hadoop è la pietra angolare di chiunque desideri saperne di più su Hadoop, o sui big data in generale, se è per questo.

Come in qualsiasi forum, la gamma di domande e risposte che puoi trovare su questo sito è vertiginosa, ma tutte ti portano a ciò che stai cercando: la conoscenza. Il sito ha collegamenti a Hadoop e ai suoi singoli componenti - ad esempio, ha forum specifici per MapReduce, HDFS, Pig, HBase e altro.

Il sito ha anche forum Hadoop associati; ad esempio, Cloudera e Hortonworks hanno gruppi di discussione specifici per le loro distribuzioni - una testimonianza di quanto sia popolare questo forum.

IBM Big Data Hub

IBM Big Data Hub è un luogo eccellente per conoscere Hadoop e il suo ecosistema. Nonostante sia di proprietà e gestito da IBM, il contenuto di questo sito non è sempre collegato ai prodotti IBM.

IBM Big Data Hub fornisce a tutti i visitatori una conoscenza sufficiente a placare la sete di big data di chiunque. Troverai tutti i tipi di blog, video, articoli degli analisti, casi d'uso, infografiche, presentazioni e altro ancora. È davvero un tesoro di grandi risorse di dati.

Conferenze da non perdere

Ci sono molte conferenze Hadoop e ancora più grandi conferenze di dati: il Summit Hadoop e Strata Hadoop World come le conferenze per eccellenza da non perdere. In genere, un fornitore di distribuzione co-sponsorizza queste conferenze. Ad esempio, Yahoo! e Hortonworks sponsorizzano il Summit Hadoop e Cloudera è il co-sponsor di Strata Hadoop World.

Sia Strata Hadoop World che Hadoop Summit sono i luoghi di incontro delle menti più brillanti di Hadoop nel mondo degli affari; queste conferenze attirano una vasta gamma di professionisti interessati a Hadoop, inclusi decision maker, architetti, sviluppatori, analisti e altro ancora.

I documenti Google che hanno iniziato tutto

Ciò che è ora noto come Hadoop ha la sua genesi in una serie di articoli scritti da dipendenti di Google che si sono concentrati sul problema dell'indicizzazione del Web.

Mentre il progetto Apache Nutch (una tecnologia open source per la scansione del Web) si stava concentrando sul ridimensionamento verso l'esterno al fine di indicizzare maggiori volumi di dati web, Google ha pubblicato un documento, "The Google File System" (ottobre 2003), che ha notevolmente influenzato Doug Cutting e il suo cofondatore di Nutch, Mike Cafarella.Poco dopo, Google ha pubblicato il suo documento "MapReduce: semplificazione dell'elaborazione dei dati su cluster di grandi dimensioni" (dicembre 2004).

Insieme, il concetto di un file system distribuito e una struttura di elaborazione parallela su larga scala sono stati presi da Cutting e Cafarella per sviluppare Apache Hadoop. Ovviamente, Cutting ha commercializzato questo lavoro mentre era su Yahoo! e il resto, come si suol dire, è storia.