Tisková zpráva

4-minutové čtení

Tachyum demonštruje plnú podporu BF16 AI v GCC a PyTorch

Bratislava, 28. mája, 2024 – Spoločnosť Tachyum® dnes oznámila, že úspešne integrovala dátový typ BF16 do kompilátora svojho čipu Prodigy® a softvérovej distribúcie, ktorá je teraz k dispozícii pre prvých používateľov a zákazníkov ako predinštalovaný obraz v rámci beta fázy testovania.

BF16, alebo bfloat16, je skrátený dátový typ s pohyblivou rádovou čiarkou založený na 32-bitovom normovanom IEEE dátovom type (f32) s jednoduchou presnosťou a pohyblivou rádovou čiarkou (single-precision floating point). Používa sa na zrýchlenie strojového učenia (machine learning, ML) znížením požiadaviek na pamäť a zvýšením rýchlosti výpočtov ML algoritmov. Tachyum teraz plne podporuje BF16 pre použitie s GCC 13.2 (GNU Compiler Collection); knižnicou Eigen pre HPC/ lineárnu algebru optimalizovanou pre univerzálny procesor Prodigy; a PyTorch AI frameworkom. IEEE (Institute of Electrical and Electronics Engineers) je najväčšia technická odborná organizácia na svete v oblasti rozvoja elektroniky.

Čip Prodigy od spoločnosti Tachyum bol navrhnutý tak, aby priamo zvládal maticové a vektorové operácie a nie ako dodatočné funkcie. Medzi vektorové a maticové prednosti Prodigy patrí podpora celého radu dátových typov (FP64, FP32, TF32, BF16, Int8, FP8, FP4 a TAI); 2 x 1024-bitové vektorové jednotky na každom jadre; AI sparsity a supersparsity podpora; a absencia penalizácie za načítanie alebo ukladanie nezarovnaných vektorov pri výpadkoch vyrovnávacej pamäte. Táto zabudovaná podpora ponúka vysoký výkon pre tréning umelej inteligencie a záťaže inferencie, zvyšuje výkon a znižuje využitie pamäte.

“Pokračujeme v posilňovaní nášho softvérového distribučného balíku, aby sme zabezpečili čo najširšiu podporu aplikácií, frameworkov a knižníc pre Prodigy ešte pred jeho uvedením na trh,” povedal Dr. Radoslav Danilák, zakladateľ a CEO spoločnosti Tachyum. “Použitie BF16 zlepšuje efektivitu hardvéru tým, že zvyšuje výkon. Podpora tohto formátu je v súlade s našimi cieľmi, aby Prodigy poskytoval výkon požadovaný pre hyperškálovanie, vysokovýkonné výpočty a záťaže umelej inteligencie bez modifikácií a potvrdzuje náš záväzok transformovať dátové centrá po celom svete.”

Keďže univerzálny procesor ponúka špičkový výkon pre všetky pracovné zaťaženia, môžu servery dátových centier postavených na Prodigy plynule a dynamicky prepínať medzi výpočtovými doménami (ako sú AI/ ML, HPC a cloud) s jednou architektúrou. Odstránením potreby drahého špecializovaného hardvéru pre AI a výrazným zvýšením využitia serverov, Prodigy signifikantne znižuje CAPEX a OPEX a zároveň poskytuje bezprecedentný výkon, spotrebu a ekonomiku dátového centra. Prodigy integruje 192 vysokovýkonných na mieru navrhnutých 64-bitových výpočtových jadier, čo mu umožňuje dosahovať až 4,5-násobný výkon v porovnaní s najvýkonnejšími x86 procesormi pre cloudové záťaže, a v porovnaní s najvýkonnejším GPU až trojnásobný výkon pre HPC a šesťnásobný výkon pre AI aplikácie.

Video s ukážkou klasifikácie obrázkov pomocou modelu ResNet, ktorý využíva natívnu implementáciu PyTorch na Tachyum Linux na emulačnom systéme Prodigy, si možno pozrieť nižšie. Predvedený model ResNet bol kvantovaný pomocou dátového typu BF16, aby sa využil vektor Prodigy BF16, najmä aktivačné, stratové a redukčné funkcie. V nasledujúcom videu Tachyum ukáže dokončenie testovania dátového typu FP8.

Sledujte Tachyum

https://twitter.com/tachyum

https://www.linkedin.com/company/tachyum

https://www.facebook.com/Tachyum/

O spoločnosti Tachyum

Spoločnosť Tachyum so svojím vlajkovým produktom Prodigy, prvým univerzálnym procesorom na svete, transformuje ekonomiku pracovných záťaží v oblasti umelej inteligencie (AI), vysokovýkonných výpočtov (HPC) a verejných i súkromných dátových centier. Prodigy spája funkcie CPU, GPGPU a TPU do jediného procesora, aby poskytoval špičkový výkon pri najnižších nákladoch a spotrebe energie pre špeciálne aj univerzálne výpočty. Keďže emisie svetových dátových centier naďalej prispievajú k zmene klímy a podľa prognóz budú spotrebovávať 10 percent elektrickej energie na svete do roku 2030, procesor Prodigy s veľmi nízkou spotrebou energie je v pozícii pomôcť vyvážiť globálny dopyt po výpočtovom výkone pri nižšej environmentálnej záťaži. Tachyum nedávno prijala významnú objednávku od americkej spoločnosti na vybudovanie rozsiahleho systému, ktorý poskytne počítačový výkon viac ako 50 exaflopov, čo exponenciálne prevýši výpočtovú kapacitu najrýchlejších superpočítačov pre inferenciu alebo generatívnu AI, ktoré sú dnes dostupné kdekoľvek na svete. Po dokončení v roku 2025 bude systém postavený na čipoch Prodigy poskytovať 25-násobný multiplikátor v porovnaní so svetovo najrýchlejším konvenčným superpočítačom, ktorý bol postavený iba tento rok, a bude dosahovať 25 000-krát väčšiu kapacitu pre AI ako modely pre ChatGPT4. Spoločnosť Tachyum má pobočky v Spojených štátoch a na Slovensku. Pre viac informácií navštívte https://www.tachyum.com/.