Ako jeden z najvýkonnejších programovacích rámcov s otvoreným zdrojovým kódom je Hadoop dôležitým nástrojom pre každého, kto dúfa, že nájde prácu s veľkými dátami. Ak chcete oprášiť svoje schopnosti Hadoop alebo sa ich naučiť ovládať, je vašou najlepšou možnosťou absolvovať online kurz. Ak to nemáte k dispozícii, pozrite si bezplatné online návody a pri riešení konkrétnych problémov použite referenčné materiály. Hneď ako získate základy, precvičte si malé sady údajov z reálneho sveta, aby ste si zdokonalili svoje schopnosti.
Kroky
Metóda 1 z 2: Absolvovanie kurzov a používanie návodov
Krok 1. Prihláste sa do Cloudera na 6-dielny kurz a interaktívne návody
Cloudera vám ponúka príklady zo skutočného sveta, v ktorých si ich môžete precvičiť v prostredí iba na čítanie, takže si nemusíte robiť starosti, že by ste urobili veľké chyby. Ponúkajú tiež analytické nástroje, ktoré vám pomôžu experimentovať s dotazovaním na údaje, a tiež bezplatné živé demo s názvom Cloudera Live, ktoré vám pomôže naučiť sa prostredie Hadoop.
Napriek tomu, že kompletný a hĺbkový kurz s certifikáciou vás bude stáť 295 dolárov, určite bude stáť za to, ak tieto schopnosti využijete pri svojej práci. Používanie kurzu Cloudera vám pomôže chytiť chyby a ušetrí čas, vďaka ktorému sa rýchlo zaplatí
Krok 2. Ak už poznáte základy, vyskúšajte bezplatné online kurzy prostredníctvom služby Cloudera
Ak máte skúsenosti s Hadoopom a chcete sa len osviežiť, možno nebudete potrebovať peniaze na 6-dielny kurz. Namiesto toho si pozrite bezplatné online kurzy na webových stránkach Univerzity Cloudera.
K dispozícii sú zdroje pre správcov, vývojárov a analytikov údajov, takže bez ohľadu na to, akú úlohu hráte, mali by ste nájsť vhodný kurz
Krok 3. Ak chcete viac teórie, absolvujte univerzitný kurz Coursera
Coursera je známy a rešpektovaný zdroj kurzov programovania. Aj keď sú pokyny vo všeobecnosti teoretickejšie a neobsahujú toľko bežiacich príkladov, môžete si ich precvičiť spolu s návodom a využiť projekty v rámci kurzu na získanie praktických skúseností.
- Tento kurz nájdete online na
- Náklady sa medzi kurzami líšia, ale Coursera ponúka aj možnosť finančnej pomoci tým, ktorí sa kvalifikujú.
Krok 4. Nasledujte bezplatný kurz na univerzite Big Data University a získajte cenovo výhodnú možnosť
Ak nechcete platiť za online kurz, Big Data University je skvelou voľbou. Majú dvojdielny kurz, ktorý sa zameriava najskôr na základy Hadoop, potom na programovanie s Hadoop a online formát uľahčuje ísť vlastným tempom.
- Tieto kurzy nájdete na
- Ponúkame mnoho návodov v angličtine, japončine, španielčine, portugalčine a ruštine.
Krok 5. Ak potrebujete bezplatné špecifické školenie, vyhľadajte na YouTube návody
Existujú tisíce videí vysvetľujúcich Hadoop a spôsob jeho použitia. Široká škála videí vám poskytuje flexibilitu a navyše je zadarmo. Ak narazíte na konkrétny problém, vyhľadajte na YouTube video, ktoré vás prevedie týmto procesom.
Návody pre Hadoop by mali byť tiež pomerne ľahko dostupné, pretože „hadoop“je jedinečný hľadaný výraz
Krok 6. Ak si chcete precvičiť virtuálny príklad, použite bezplatné návody Yahoo
Tieto návody sú rozdelené do 7 modulov a od začiatku vás poučia o inštalácii a prevádzke Hadoopu. Je to skvelá voľba na zdokonalenie konkrétnych schopností, ak sú trochu hrdzaví.
Krok 7. Podrobné a bezplatné pokyny nájdete v dokumente IBM Open Source
Toto je neuveriteľne dôkladný dokument PDF s otvoreným zdrojovým kódom vytvorený školiacou iniciatívou IBM. Prevedie vás Hadoopom opatrne, krok za krokom a poskytne jasné písomné pokyny.
Tieto pokyny tiež fungujú dobre, keď sú spárované so živou ukážkou, ako je Cloudera
Metóda 2 z 2: Prechod na aplikáciu v reálnom svete
Krok 1. Opýtajte sa, či môžete implementovať Hadoop v práci na precvičovanie so skutočnými údajmi
Požiadajte svojho šéfa alebo nadriadeného alebo sa s nimi osobne porozprávajte o zavedení týchto nových zručností na pracovisko. Toto je obzvlášť dôležité, ak vaša spoločnosť zaplatila za akékoľvek školenie alebo online kurzy.
Čím skôr začnete implementovať znalosti, ktoré ste sa naučili, tým skôr ich budete schopní zvládnuť
Krok 2. Hľadaj jednoduché projekty, na ktorých si precvičíš svoje schopnosti
Vyberte si projekty, ktoré sú relatívne jednoduché a nízkorizikové, napríklad počítanie a hodnotenie počtu interakcií na jedného zástupcu zákazníka, ako sú e-maily a chatové relácie.
- Niektoré ďalšie aplikácie so skutočnými údajmi zahŕňajú skenovanie webových blogov, či neobsahujú chyby, alebo sledovanie sentimentu značky na sociálnych sieťach.
- Môžete tiež cvičiť so vzorovými údajmi z webov, ako sú https://www.kaggle.com/datasets alebo
Krok 3. Pravidelne kontrolujte svoj kód pomocou malých podmnožín, aby ste vyriešili prípadné chyby
Pred spustením celého súboru údajov vezmite menší testovací súbor údajov na svoj lokálny počítač a spustite ho v niekoľkých rôznych režimoch. Môžete ho napríklad iteratívne spustiť v režime Local Jobrunner, potom v režime pseudo-distribúcie a potom v režime plne distribuovaného systému.
- To vám umožní rozpoznať všetky chyby alebo chyby skôr, ako sa zosilnia v celom súbore údajov.
- Miestny režim Jobrunner vám umožňuje lokálne testovať a ladiť mapu a redukovať kód, pseudodistribuovaný režim napodobňuje produkčné prostredie a plne distribuovaný režim sa zameriava na váš skutočný produkčný klaster.
Krok 4. Na vyskúšanie v prostredí virtuálneho počítača použite ročnú bezplatnú skúšobnú verziu
Spoločnosti ako Amazon a Microsoft ponúkajú platené predplatné pre svoje cvičné služby Hadoop. Virtuálny počítač Amazonu sa nazýva Amazon Web Service (AWS) a služba spoločnosti Microsoft sa nazýva Microsoft Azure. Pri oboch službách je váš prvý rok bezplatný, keď zadáte informácie o svojej kreditnej karte.
Nezabudnite zrušiť predplatné po 1 roku, aby ste sa vyhli účtovaniu poplatkov
Tipy
- Majte na pamäti, že Hadoop je špecializovanejší programovací jazyk s úzkym použitím. Určite vám to poskytne výhodu vo svete veľkých dát, ale nie vždy je potrebné stať sa programátorom.
- Môžete si tiež prečítať knihy a články o Hadoopovi, napríklad Hadoop: The Definitive Guide, 3. vydanie od Toma Whitea.