4-minútové čítanie
Tlačová správa
Bratislava, 6. decembra, 2023 – Spoločnosť Tachyum®, tvorca Prodigy®, prvého univerzálneho procesora na svete, dnes oznámila, že úspešne dokončila testovanie s vektorovým HPL (High-Performance LINPACK) s použitím 1kb vektorov na hardvérovom emulátore Prodigy postavenom na programovateľných hradlových poliach (Field Programmable Gate Array, FPGA).
Súbory knižníc LINPACK sa používajú na hodnotenie výkonu superpočítačov. Určujú výpočtový výkon systému s pohyblivou rádovou čiarkou. Merajú, ako rýchlo a s akou presnosťou počítač rieši náhodný hustý systém lineárnych rovníc. Po spustení skalárnych benchmarkov LINPACK pomocou IEEE kompatibilnej skalárnej FPU jednotky čipu Prodigy firma Tachyum teraz pokročila k vektorovému benchmarku LINPACK.
IEEE (Institute of Electrical and Electronics Engineers) je najväčšia technická odborná organizácia na svete v oblasti rozvoja elektroniky. FPU (Floating-Point Unit) jednotka slúži na vykonávanie číselných operácií s pohyblivou rádovou čiarkou.
Vektorová jednotka pre Prodigy bola navrhnutá s celým radom inovatívnych funkcií, aby poskytovala špičkový výkon. Prodigy má dve vektorové sady inštrukcií (pipelines) so 1024b-širokým súborom funkčných jednotiek (data path). Vykonaním 2x1K operácií SIMD (Single Instruction/Multiple Data) za cyklus Prodigy prináša 32 operácií s dvojitou presnosťou FMA (Fused IEEE floating-point multiply-add, technický výraz reprezentujúci operácie s pohyblivou rádovou čiarkou, ktoré vykonávajú násobenie a sčítanie v jednom kroku) za cyklus, čo prináša 64 operácií s pohyblivou rádovou čiarkou s dvojitou presnosťou, pretože jednotka FMA pozostáva z násobenia a sčítania na cyklus a na jadro.
Mikroarchitektúra prístupu do pamäte čipu Prodigy využíva inovatívny prístup k podpore nezarovnaných údajov, čo znamená, že nezarovnané operácie sa spracúvajú bez straty výkonu, s ktorou sa stretávajú mnohé iné architektúry na trhu. Tieto funkcie spolu s vysokými taktovacími frekvenciami umožňujú firme Tachyum poskytovať najvyšší výkon spracovania vektorizovaných dát v tomto odvetví. Ďalšie funkcie v architektúre čipu Prodigy ako maskovanie, nezarovnaný prístup k pamäti a operácie pre systém riadenia slučky (loop control operations) umožňujú efektívnu automatickú vektorizáciu v kompilátoroch. Kompilátory zo softvérového ekosystému Tachyum už tieto funkcie plne využívajú.
Vektorové inštrukcie už boli overené, fungujú bezproblémovo na Prodigy FPGA, vrátane vektorizácie v GNU Compiler Collection (GCC), knižníc, vektorov podporujúcich Linux, ako aj bežiacich aplikácií a poskytovania správnych výsledkov.
Po dokončení vektorového benchmarku LINPACK sa spoločnosť Tachyum teraz sústreďuje na záverečnú fázu overovania a testovania vektorových jednotiek pomocou FPU: AI maticové operácie.
“Superpočítač je viac než len rozšírenie štandardných výpočtových systémov. Existujú zložité procesy na meranie výkonu a schopností: zabezpečenie správneho zapojenia všetkých bitov vo vektoroch, správneho hlásenia príznakov IEEE a veľa prípadov vektorových operácií s prehadzovaním údajov, a my sme sa k tomu dostali,” povedal Dr. Radoslav Danilák, zakladateľ a CEO spoločnosti Tachyum. “Vidíme svetlo na konci tunela, keď sa v roku 2024 posunieme k masovej výrobe a k naplneniu nášho mnohomiliardového predajného plánu.”
Ako univerzálny procesor ponúkajúci špičkový výkon pre všetky pracovné zaťaženia, môžu servery dátových centier plynule a dynamicky prepínať medzi výpočtovými doménami (ako sú AI/ ML, HPC a cloud) s jednou architektúrou. Odstránením potreby drahého špecializovaného hardvéru pre AI a výrazným zvýšením využitia serverov, Prodigy signifikantne znižuje CAPEX a OPEX a zároveň poskytuje bezprecedentný výkon, spotrebu a ekonomiku dátového centra. Prodigy integruje 192 vysokovýkonných na mieru navrhnutých 64-bitových výpočtových jadier, čo mu umožňuje dosahovať až 4,5-násobný výkon v porovnaní s najvýkonnejšími x86 procesormi pre cloudové záťaže, a v porovnaní s najvýkonnejším GPU až trojnásobný výkon pre HPC a šesťnásobný výkon pre AI aplikácie.
Video s ukážkou testu vektorového benchmarku LINPACK na Prodigy FPGA si možno pozrieť nižšie.
https://www.linkedin.com/company/tachyum
https://www.facebook.com/Tachyum/
Spoločnosť Tachyum so svojím vlajkovým produktom Prodigy, prvým univerzálnym procesorom na svete, transformuje ekonomiku pracovných záťaží v oblasti umelej inteligencie (AI), vysokovýkonných výpočtov (HPC) a verejných i súkromných dátových centier. Prodigy spája funkcie CPU, GPGPU a TPU do jediného procesora, aby poskytoval špičkový výkon pri najnižších nákladoch a spotrebe energie pre špeciálne aj univerzálne výpočty. Keďže emisie svetových dátových centier naďalej prispievajú k zmene klímy a podľa prognóz budú spotrebovávať 10 percent elektrickej energie na svete do roku 2030, procesor Prodigy s veľmi nízkou spotrebou energie je v pozícii pomôcť vyvážiť globálny dopyt po výpočtovom výkone pri nižšej environmentálnej záťaži. Tachyum nedávno prijala významnú objednávku od americkej spoločnosti na vybudovanie rozsiahleho systému, ktorý poskytne počítačový výkon viac ako 50 exaflopov, čo exponenciálne prevýši výpočtovú kapacitu najrýchlejších superpočítačov pre inferenciu alebo generatívnu AI, ktoré sú dnes dostupné kdekoľvek na svete. Po dokončení v roku 2025 bude systém postavený na čipoch Prodigy poskytovať 25-násobný multiplikátor v porovnaní so svetovo najrýchlejším konvenčným superpočítačom, ktorý bol postavený iba tento rok, a bude dosahovať 25 000-krát väčšiu kapacitu pre AI ako modely pre ChatGPT4. Spoločnosť Tachyum má pobočky v Spojených štátoch a na Slovensku. Pre viac informácií navštívte https://www.tachyum.com/.