Startup belooft 100x snellere CPU's voor datacenter servers
Terwijl momenteel de meeste aandacht uitgaat naar chips die geoptimaliseerd zijn voor AI, lijken algemene Central Processing Units of CPU’s minder het nieuws te halen. "Als je naar de ontwikkeling van CPU’s kijkt, zie je generatie op generatie slechts incrementele verbeteringen," zegt Timo Valtonen, CEO en mede-oprichter van het Finse Flow Computing. Zijn doel is om CPU’s terug te brengen naar hun 'centrale' rol in de wereld van server- en andere hardware. Om dit te bereiken, stelt hij samen met zijn team een nieuwe aanpak voor: de introductie van zogenaamde Parallel Processing Units (PPU's).
In plaats van te proberen de rekenkracht te vergroten door meerdere identieke CPU-kernen in een apparaat te plaatsen, stelt Flow Computing voor om een mix van traditionele CPU-kernen en hun innovatieve PPU-kernen te gebruiken. Bijvoorbeeld, in plaats van 16 identieke CPU-kernen in een laptop, zouden fabrikanten 4 CPU-kernen kunnen combineren met 64 PPU-kernen. Dit zou volgens Valtonen tot 100 keer betere prestaties opleveren, vooral bij taken die parallel uitgevoerd kunnen worden. Deze aanpak werd gepresenteerd tijdens de Hot Chips-conferentie in augustus.
De PPU biedt snelheidsvoordelen bij parallelle rekenprocessen, waar traditionele CPU's minder goed in zijn, en waar offloading naar een GPU te duur zou zijn. Parallelisatie is vaak alleen de moeite waard bij grote workloads, omdat de overhead bij kleinere taken de voordelen teniet kan doen. De introductie van PPU's verandert dit beeld, omdat het parallelle verwerking mogelijk maakt, zelfs bij kleinere workloads.
Computertaken kunnen grofweg in twee categorieën worden ingedeeld: sequentiële taken, waarbij elke stap afhankelijk is van de vorige, en parallelle taken, die onafhankelijk van elkaar kunnen worden uitgevoerd. Volgens Flow Computing is het onmogelijk om een architectuur te optimaliseren voor beide soorten taken. Het idee is daarom om aparte eenheden te gebruiken die geoptimaliseerd zijn voor elk type taak. De CPU kan de sequentiële delen van een code uitvoeren, terwijl de parallelle delen worden toegewezen aan de PPU, wat resulteert in een optimale combinatie.
Flow Computing heeft inmiddels een proof-of-concept ontwikkeld op basis van een FPGA-implementatie van hun ontwerp, die identiek presteerde aan hun simulator. Met andere woorden: de verwachte resultaten werden in de praktijk ook gerealiseerd. Uit vergelijkende studies blijkt dat dit PPU-ontwerp tot 100 keer betere prestaties kan leveren dan bestaande CPU’s. Momenteel werkt het team aan een compiler voor hun PPU waarmee software geschikt kan worden gemaakt voor deze manier van werken. Ook zoekt men samenwerking met grote CPU-fabrikanten om de technologie verder te ontwikkelen.