Tlačová správa

4-minútové čítanie

Spoločnosť Tachyum predviedla hardvér so spusteným tokom optimalizácie AutoFDO

Bratislava, 12. novembra 2024 – Spoločnosť Tachyum® dnes oznámila, že na emulačnom systéme univerzálneho procesora Prodigy úspešne predviedla vylepšené hardvérom podporované vzorkovanie (sampling). Znamená to prelom v aplikácii pokročilých optimalizácií v kompilátore.

Optimalizácie v kompilátore sú rozhodujúce pre zvýšenie výkonu, skrátenie doby odozvy, minimalizáciu úložného priestoru a zlepšenie celkových nákladov na vlastníctvo (total cost of ownership, TCO) v rámci širokej škály moderných výpočtových úloh. Medzi najvýkonnejšie techniky používané modernými kompilátormi patria optimalizácia v čase prepojenia (link-time optimizations, LTO), optimalizácia riadená profilom (profile-guided optimization, PGO) a optimalizácia riadená spätnou väzbou (feedback-directed optimizations, AutoFDO). Tieto techniky využívajú údaje získané za behu programu na ladenie výkonu softvéru a dosahujú výsledky nad rámec toho, čo môže priniesť statická optimalizácia.

Tachyum v najnovšom videu ukazuje, že pokročilé optimalizácie AutoFDO – umožnené prostredníctvom hardvérovej platformy Prodigy – prinášajú zlepšenie výkonu približne o 10 – 15 %. Zhromažďovaním údajov počas vykonávania programu umožňujú PGO a AutoFDO s LTO kompilátorom upravovať kód v reálnom čase, optimalizovať fungovanie softvéru a zvyšovať jeho efektivitu.

PGO zvyčajne zahŕňa úpravu generovaného kódu na zhromažďovanie podrobných informácií o výpočte, čo umožňuje úplné profilovanie, ale za cenu zvýšenej zložitosti. Na rozdiel od toho AutoFDO využíva praktickejší prístup pomocou špecializovaných hardvérových blokov v rámci procesora Prodigy na zber údajov o výkone s minimálnou réžiou. Táto metóda umožňuje spätnú väzbu z produkčných binárnych súborov bez potreby úpravy kódu, čím poskytuje flexibilné a efektívne riešenie pre aplikácie v reálnom svete. AutoFDO môže mať mierne nižšiu presnosť profilu v porovnaní s PGO, čo je však možné zmierniť zvýšením času vzorkovania a zlúčením údajov z viacerých inštancií.

PGO aj AutoFDO vyžadujú opätovnú kompiláciu, aby bolo možné použiť poznatky zo zhromaždených profilov. Zatiaľ čo výsledky oboch techník sú zvyčajne podobné, hardvérový prístup AutoFDO ponúka významné výhody z hľadiska ľahkej implementácie a škálovateľnosti. Platforma univerzálneho procesora Prodigy od spoločnosti Tachyum podporuje prednastavený tok AutoFDO pre hardvérovo podporované zhromažďovanie profilov, čím ponúka zákazníkom možnosť výberu optimalizačných techník v závislosti od ich špecifických potrieb.

“Tento najnovší míľnik je dôkazom nášho záväzku posúvať hranice výpočtového výkonu,” povedal Dr. Radoslav Danilák, zakladateľ a CEO spoločnosti Tachyum. “Tým, že umožňujeme hardvérovo podporovaný sampling, nielen že zjednodušujeme proces pokročilých optimalizácií v kompilátore, ale prinášame aj hmatateľné vylepšenia výkonu softvéru, vďaka čomu môžu vývojári ľahšie dosahovať rýchlejšie a efektívnejšie aplikácie.”

Keďže univerzálny procesor ponúka špičkový výkon pre všetky pracovné zaťaženia, môžu servery dátových centier postavených na Prodigy plynule a dynamicky prepínať medzi výpočtovými doménami (ako sú AI/ ML, HPC a cloud) s jednou architektúrou. Odstránením potreby drahého špecializovaného hardvéru pre AI a výrazným zvýšením využitia serverov, Prodigy signifikantne znižuje CAPEX a OPEX a zároveň poskytuje bezprecedentný výkon, spotrebu a ekonomiku dátového centra. Prodigy integruje 192 vysokovýkonných na mieru navrhnutých 64-bitových výpočtových jadier, čo mu umožňuje dosahovať až 4,5-násobný výkon v porovnaní s najvýkonnejšími x86 procesormi pre cloudové záťaže, a v porovnaní s najvýkonnejším GPU až trojnásobný výkon pre HPC a šesťnásobný výkon pre AI aplikácie.

Video s ukážkou hardvérovej podpory pre zhromažďovanie profilov používanej pre AutoFDO si možno pozrieť nižšie.

Sledujte Tachyum

https://x.com/tachyum

https://www.linkedin.com/company/tachyum

https://www.facebook.com/Tachyum/

O spoločnosti Tachyum

Spoločnosť Tachyum so svojím vlajkovým produktom Prodigy, prvým univerzálnym procesorom na svete, transformuje ekonomiku pracovných záťaží v oblasti umelej inteligencie (AI), vysokovýkonných výpočtov (HPC) a verejných i súkromných dátových centier. Prodigy spája funkcie CPU, GPGPU a TPU do jediného procesora, aby poskytoval špičkový výkon pri najnižších nákladoch a spotrebe energie pre špeciálne aj univerzálne výpočty. Keďže emisie svetových dátových centier naďalej prispievajú k zmene klímy a podľa prognóz budú spotrebovávať 10 percent elektrickej energie na svete do roku 2030, procesor Prodigy s veľmi nízkou spotrebou energie je v pozícii pomôcť vyvážiť globálny dopyt po výpočtovom výkone pri nižšej environmentálnej záťaži. Tachyum prijala významnú objednávku od americkej spoločnosti na vybudovanie rozsiahleho systému, ktorý poskytne počítačový výkon viac ako 50 exaflopov, čo exponenciálne prevýši výpočtovú kapacitu najrýchlejších superpočítačov pre inferenciu alebo generatívnu AI, ktoré sú dnes dostupné kdekoľvek na svete. Po dokončení v roku 2026 bude systém postavený na čipoch Prodigy poskytovať 25-násobný multiplikátor v porovnaní so svetovo najrýchlejším konvenčným superpočítačom, ktorý bol postavený iba tento rok, a bude dosahovať 25 000-krát väčšiu kapacitu pre AI ako modely pre ChatGPT4. Spoločnosť Tachyum má pobočky v Spojených štátoch, na Slovensku a v Česku. Pre viac informácií navštívte https://www.tachyum.com/.