Potrebujete stroj, ktorý dokáže dodať stovky biliónov výpočtov s pohyblivou rádovou čiarkou za sekundu? Alebo potrebujete barový príbeh o tom, ako superpočítač vo vašom suteréne preklopil istič? Vybudovanie vlastného klastra High Performance Compute, známeho tiež ako superpočítač, je výzvou, s ktorou sa dokáže vyrovnať každý skúsený geek s víkendom voľného času a peňazí na spálenie. Technicky povedané, moderný viacprocesorový superpočítač je sieť počítačov, ktoré na vyriešení problému spolupracujú paralelne. Tento článok stručne popíše každý krok v tomto procese so zameraním na hardvér a softvér.
Kroky
Krok 1. Najprv určte potrebné hardvérové komponenty a zdroje
Budete potrebovať jeden hlavný uzol, najmenej tucet rovnakých výpočtových uzlov, ethernetový prepínač, jednotku distribúcie energie a stojan. Určte potrebnú elektrickú energiu, chladenie a priestor. Tiež sa rozhodnite, akú IP adresu chcete pre svoje súkromné siete, ako pomenovať uzly, aké softvérové balíky chcete mať nainštalované a akú technológiu chcete poskytovať možnosti paralelného výpočtu (viac o tom neskôr).
- Aj keď je hardvér drahý, všetok softvér uvedený v tomto návode je bezplatný a väčšina z nich je open source.
- Ak by ste chceli vidieť, ako by bol váš superpočítač teoreticky rýchly, použite tento nástroj:
Krok 2. Vybudujte výpočtové uzly
Budete musieť zostaviť výpočtové uzly alebo získať vopred pripravené servery.
- Vyberte šasi počítačového servera, ktoré maximalizuje priestor, chladenie a energetickú účinnosť.
- Alebo môžete použiť asi tucet použitých, zastaraných serverov - ktorých celok preváži súčet ich častí, ale ušetrí vám značnú časť peňazí. Všetky procesory, sieťové adaptéry a základné dosky by mali byť identické, aby mohol celý systém pekne hrať spoločne. Samozrejme nezabudnite na RAM a úložisko pre každý uzol a aspoň jednu optickú mechaniku pre hlavný uzol.
Krok 3. Nainštalujte servery do stojana
Začnite zdola, aby stojan nebol ťažký. Budete potrebovať priateľa, ktorý vám s tým pomôže - husté servery môžu byť veľmi ťažké a viesť ich do koľajníc, ktoré ich držia v stojane, je ťažké.
Krok 4. Nainštalujte prepínač Ethernet nad šasi servera
Nájdite si chvíľu a nakonfigurujte prepínač: povoľte jumbo veľkosti rámcov 9 000 bajtov, nastavte IP adresu na statickú adresu, pre ktorú ste sa rozhodli v kroku 1, a vypnite nepotrebné smerovacie protokoly, ako napríklad SMTP Snooping.
Krok 5. Nainštalujte PDU (jednotka distribúcie energie)
V závislosti od toho, koľko prúdu môžu vaše uzly potrebovať pri maximálnom zaťažení, budete na vysokovýkonné výpočty potrebovať 220 voltov.
Krok 6. Keď je všetko nainštalované, môžete začať proces konfigurácie
Linux je de facto OS pre klastre HPC - nielenže je ideálnym prostredím pre vedecké výpočty, ale jeho inštalácia na stovky alebo dokonca tisíce uzlov nestojí nič za to. Predstavte si, koľko by stála inštalácia systému Windows na všetky tieto uzly!
- Začnite inštaláciou najnovšej verzie systému BIOS a firmvéru základnej dosky, ktorá by mala byť rovnaká vo všetkých uzloch.
- Nainštalujte si preferované linuxové distro na každý uzol s grafickým používateľským rozhraním pre hlavný uzol. Medzi obľúbené možnosti patria CentOS, OpenSuse, Scientific Linux, RedHat a SLES.
- Tento autor dôrazne odporúča používať distribúciu klastrov Rocks. Okrem inštalácie všetkých nástrojov potrebných na fungovanie výpočtového klastra, Rocks používa aj skvelú metódu na „rýchle distribúciu“mnohých svojich inštancií do uzlov pomocou bootovania PXE a postupu Red Hat „Kick Start“.
Krok 7. Nainštalujte rozhranie na odosielanie správ, správcu zdrojov a ďalšie potrebné knižnice
Ak ste v predchádzajúcom kroku nenainštalovali Rocks, budete musieť manuálne nastaviť potrebný softvér, aby boli povolené paralelné počítačové mechanizmy.
- Najprv budete potrebovať prenosný systém správy bash, ako napríklad Torque Resource Manager, ktorý vám umožní rozdeliť a distribuovať úlohy na viacero počítačov.
- Na dokončenie nastavenia spárujte krútiaci moment s plánovačom klastrov Maui.
- Ďalej budete musieť nainštalovať rozhranie na odosielanie správ, potrebné pre zdieľanie rovnakých údajov pre jednotlivé procesy na oddelených výpočtových uzloch. OpenMP je samozrejmosť.
- Nezabudnite na viacvláknové matematické knižnice a kompilátory na vytváranie paralelných počítačových programov. Spomenul som, že by ste si mali nainštalovať iba Rocks?
Krok 8. Spojte výpočtové uzly dohromady
Hlavný uzol posiela výpočtové úlohy výpočtovým uzlom, ktoré zase musia odoslať výsledok späť a tiež si navzájom odosielať správy. Čím rýchlejšie, tým lepšie.
- Na prepojenie všetkých uzlov v klastri použite súkromnú sieť ethernet.
- Hlavný uzol môže tiež fungovať ako server NFS, PXE, DHCP, TFTP a NTP v sieti Ethernet.
- Túto sieť musíte oddeliť od verejných sietí, čím sa zaistí, že pakety vysielania nebudú interferovať s inými sieťami vo vašej sieti LAN.
Krok 9. Otestujte klaster
Posledná vec, ktorú by ste mohli chcieť urobiť predtým, ako uvoľníte všetok tento výpočtový výkon svojim používateľom, je otestovať jeho výkon. Benchmark HPL (High Performance Lynpack) je populárnou voľbou na meranie výpočtovej rýchlosti klastra. Budete ho musieť skompilovať zo zdroja so všetkými možnými optimalizáciami, ktoré váš kompilátor ponúka pre architektúru, ktorú ste si vybrali.
- Musíte samozrejme kompilovať zo zdroja so všetkými možnými možnosťami optimalizácie pre vašu platformu. Ak napríklad používate procesory AMD, kompilujte s Open64 s -0 rýchlou úrovňou optimalizácie.
- Porovnajte svoje výsledky na stránke TOP500.org a porovnajte svoj klaster s 500 najrýchlejšími superpočítačmi na svete!
Video - Používaním tejto služby môžu byť niektoré informácie zdieľané so službou YouTube
Tipy
- Skutočne vysoké rýchlosti siete nájdete v sieťových rozhraniach InfiniBand. Buďte však pripravení zaplatiť prémiové ceny.
- Vďaka IPMI môže správa veľkého klastra byť hračkou, pretože poskytuje KVM-over-IP, vzdialené napájanie a ďalšie.
- Použite Gangliu na monitorovanie výpočtového zaťaženia uzlov.