3-minútové čítanie
Tlačová správa
Bratislava, 30. júla, 2024 – Spoločnosť Tachyum® dnes oznámila, že úspešne otestovala a overila funkčnosť dátového typu BF16 na hardvérovom prototype Prodigy® FPGA. Znamená to zabezpečenie zvýšenej priepustnosti pre potreby používateľov vysokovýkonných výpočtov.
BF16, alebo bfloat16, je skrátený dátový typ s pohyblivou rádovou čiarkou založený na 32-bitovom normovanom IEEE dátovom type (f32) s jednoduchou presnosťou a pohyblivou rádovou čiarkou (single-precision floating point). Používa sa na zrýchlenie strojového učenia (machine learning, ML) znížením požiadaviek na pamäť a zvýšením rýchlosti výpočtov ML algoritmov. Spoločnosť Tachyum už pripravila podporu BF16 pre použitie s GCC 13.2 (GNU Compiler Collection) a testovala softvérovú integráciu BF16. Tachyum podporuje rovnaké operácie BF16 s pohyblivou rádovou čiarkou ako dátové typy FP32 a FP64 podľa štandardu IEEE v hardvéri. IEEE (Institute of Electrical and Electronics Engineers) je najväčšia technická odborná organizácia na svete v oblasti rozvoja elektroniky.
Čip Prodigy od spoločnosti Tachyum bol navrhnutý tak, aby priamo zvládal maticové a vektorové operácie a nie ako dodatočné funkcie. Medzi vektorové a maticové funkcie Prodigy patrí podpora celého radu dátových typov (FP64, FP32, TF32, BF16, Int8, FP8, FP4 a TAI); 2 x 1024-bitové vektorové jednotky na každom jadre; podpora AI sparsity a supersparsity; a absencia penalizácie za načítanie alebo ukladanie nezarovnaných vektorov pri výpadkoch vyrovnávacej pamäte. Táto zabudovaná podpora ponúka vysoký výkon pre tréning umelej inteligencie (AI) a záťaže inferencie, zvyšuje výkon a znižuje využitie pamäte.
“Pred dvomi mesiacmi Tachyum úspešne integrovalo dátový typ BF16 do kompilátora GCC svojho čipu Prodigy a softvérovej distribúcie,“ povedal Dr. Radoslav Danilák, zakladateľ a CEO spoločnosti Tachyum. “Keďže neexistuje žiadny štandardný aplikačný test, vyvinuli sme testovaciu aplikáciu BF16 pre AI inferenciu, ktorá bola spoľahlivo preverená pre použitie na Prodigy FPGA. Testovacia aplikácia BF16 na FPGA ukazuje, že funguje optimálne ako súčasť AI maticových operácií s tenzormi.”
Maticové operácie BF16 s tenzormi budú predstavené na hardvérovom prototype Prodigy FPGA budúci mesiac, potom budú nasledovať FP8, FP4 a dátové typy s nízkou presnosťou.
Keďže univerzálny procesor ponúka špičkový výkon pre všetky pracovné zaťaženia, môžu servery dátových centier postavených na Prodigy plynule a dynamicky prepínať medzi výpočtovými doménami (ako sú AI/ ML, HPC a cloud) s jednou architektúrou. Odstránením potreby drahého špecializovaného hardvéru pre AI a výrazným zvýšením využitia serverov, Prodigy signifikantne znižuje CAPEX a OPEX a zároveň poskytuje bezprecedentný výkon, spotrebu a ekonomiku dátového centra. Prodigy integruje 192 vysokovýkonných na mieru navrhnutých 64-bitových výpočtových jadier, čo mu umožňuje dosahovať až 4,5-násobný výkon v porovnaní s najvýkonnejšími x86 procesormi pre cloudové záťaže, a v porovnaní s najvýkonnejším GPU až trojnásobný výkon pre HPC a šesťnásobný výkon pre AI aplikácie.
Video s ukážkou BF16 testovacích aplikácií na Prodigy FPGA si možno pozrieť nižšie.
https://www.linkedin.com/company/tachyum
https://www.facebook.com/Tachyum/
Spoločnosť Tachyum so svojím vlajkovým produktom Prodigy, prvým univerzálnym procesorom na svete, transformuje ekonomiku pracovných záťaží v oblasti umelej inteligencie (AI), vysokovýkonných výpočtov (HPC) a verejných i súkromných dátových centier. Prodigy spája funkcie CPU, GPGPU a TPU do jediného procesora, aby poskytoval špičkový výkon pri najnižších nákladoch a spotrebe energie pre špeciálne aj univerzálne výpočty. Keďže emisie svetových dátových centier naďalej prispievajú k zmene klímy a podľa prognóz budú spotrebovávať 10 percent elektrickej energie na svete do roku 2030, procesor Prodigy s veľmi nízkou spotrebou energie je v pozícii pomôcť vyvážiť globálny dopyt po výpočtovom výkone pri nižšej environmentálnej záťaži. Tachyum prijala významnú objednávku od americkej spoločnosti na vybudovanie rozsiahleho systému, ktorý poskytne počítačový výkon viac ako 50 exaflopov, čo exponenciálne prevýši výpočtovú kapacitu najrýchlejších superpočítačov pre inferenciu alebo generatívnu AI, ktoré sú dnes dostupné kdekoľvek na svete. Po dokončení v roku 2026 bude systém postavený na čipoch Prodigy poskytovať 25-násobný multiplikátor v porovnaní so svetovo najrýchlejším konvenčným superpočítačom, ktorý bol postavený iba tento rok, a bude dosahovať 25 000-krát väčšiu kapacitu pre AI ako modely pre ChatGPT4. Spoločnosť Tachyum má pobočky v Spojených štátoch a na Slovensku. Pre viac informácií navštívte https://www.tachyum.com/.