Britse startup Callosum wil afrekenen met GPU-monocultuur in datacenters

AI datacenter

In veel AI-datacenters is de situatie overzichtelijk: één dominant type GPU, één bijbehorende set aan vermogens- en koelingsspecificaties, één architectuur die de standaard bepaalt. Die uniformiteit heeft voordelen. Ontwerp, inkoop, powerdistributie en koeling zijn relatief voorspelbaar. Maar volgens de Britse startup Callosum kan juist die uniformiteit in de nabije toekomst een beperking blijken.

Het in Londen gevestigde bedrijf, opgericht door twee neurowetenschappers uit Cambridge, is recent uit stealth-modus gekomen en haalde ruim 10 miljoen dollar aan financiering op. Investeerders zijn onder meer Plural en Advanced Research and Invention Agency (ARIA), de Britse overheidsorganisatie die zich richt op wetenschappelijke en technologische doorbraken.

Van één GPU-type naar een heterogene infrastructuur

De kern van Callosum’s boodschap is dat de AI-wereld te veel inzet op wat het bedrijf een ‘monocultuur’ noemt: het idee dat steeds krachtigere, bijna allesomvattende AI-modellen zullen draaien op identieke chips in grootschalige clusters. Dat model vraagt om enorme investeringen in energie, koeling en hardware en concentreert technologische macht bij een beperkt aantal leveranciers.

Voor menig datacenter manager is dit natuurlijk herkenbaar. Veel AI-omgevingen zijn vandaag sterk geoptimaliseerd rond één GPU-platform, met bijbehorende racks, vermogensdichtheden en koelconcepten. power provisioning, hot aisle/cold aisle-configuraties en vloeistofkoeling, worden afgestemd op de thermische eigenschappen van die specifieke accelerators.

Callosum gaat uit van een andere aanpak: een infrastructuur waarin meerdere typen chips – van verschillende fabrikanten – naast elkaar functioneren. Niet als noodoplossing, maar als bewuste architectuurkeuze. Hun softwareplatform moet verschillende AI-modellen laten samenwerken over uiteenlopende hardware heen. In plaats van elke taak op identieke GPU’s te forceren, wordt de workload verdeeld over gespecialiseerde componenten die onderling communiceren en samenwerken.

Dat heeft directe implicaties voor datacenters. Een dergelijke aanpak betekent mogelijk verschillende vermogensprofielen binnen één cluster, uiteenlopende koelstrategieën en variabele latency- en bandbreedte-eisen tussen nodes. Waar nu vaak wordt geoptimaliseerd voor maximale schaal van één type accelerator, verschuift de focus dan naar orkestratie en systeemoptimalisatie over een heterogene infrastructuur.

Oprichters Danyal Akarca en Jascha Achterberg ontmoetten elkaar tijdens hun promotieonderzoek aan de Universiteit van Cambridge. Hun werk lag op het snijvlak van neurowetenschap, computing en AI. Hun onderzoek verscheen in meerdere Nature-tijdschriften en ze werkten samen met onderzoekers van Google DeepMind.

Volgens Akarca is de huidige AI-strategie te eenzijdig. “Grote labs wedden erop dat één model alles zal domineren. Wij denken dat dit niet klopt. In de natuur ontstaat intelligentie uit meerdere systemen die samenwerken”, vertelde hij in een interview met TechEU. Het menselijk brein is daarbij hun referentiepunt: het is geen verzameling identieke neuronen die op schaal zijn gekopieerd, maar een complex netwerk van gespecialiseerde cellen en circuits.

Die metafoor vertaalt zich naar infrastructuur. In plaats van steeds grotere modellen te draaien op steeds grotere aantallen van dezelfde chip, ziet Callosum een ecosysteem van gespecialiseerde modellen die elk geoptimaliseerd zijn voor specifieke taken en draaien op verschillende typen hardware.

Impact op power en cooling

Voor datacenterprofessionals is dit zeker geen abstracte discussie. Een heterogene AI-omgeving betekent dat het ontwerp van power- en koelarchitecturen flexibeler moet worden. Verschillende chips kunnen uiteenlopende TDP’s (Thermal Design Power), spanningsvereisten en koelmethoden hebben – variërend van traditionele luchtkoeling tot directe vloeistofkoeling of immersie.

Ook capaciteitsplanning verandert. In plaats van uniforme racks met voorspelbare vermogensdichtheid, kunnen clusters bestaan uit combinaties van high-density accelerators en energiezuinigere, taakgerichte chips. Dat vraagt om dynamischer energiemanagement, fijnmazige monitoring en mogelijk modulaire uitbreidingsstrategieën.

Callosum positioneert zijn software als de laag die deze complexiteit beheersbaar maakt. In plaats van hardwarediversiteit te zien als een risico, beschouwt het bedrijf die diversiteit juist als een optimalisatiekans. “Iedereen ging ervan uit dat chipdiversiteit een nadeel was dat gemanaged moest worden”, stelt Achterberg in hetzelfde artikel. “Wij zagen het tegenovergestelde: een voordeel dat benut kan worden.”

Soevereiniteit en minder afhankelijkheid

Naast technische argumenten speelt ook geopolitiek een rol. In de mondiale AI-race groeit de zorg over afhankelijkheid van een klein aantal Amerikaanse technologiebedrijven en chipfabrikanten. Door modellen over verschillende chiptypes en leveranciers te laten draaien, wil Callosum de afhankelijkheid van één partij verkleinen.

Het Britse Advanced Research and Invention Agency ondersteunt die ambitie met concrete infrastructuur. De startup zal gebruikmaken van het nieuwe Scaling Inference Lab van ARIA, waarvoor 50 miljoen pond is gereserveerd. Dit testlab moet startups helpen hun AI-chips en -technologieën sneller te commercialiseren en te bewijzen dat ze kunnen concurreren met gevestigde namen.

Voor datacenter managers betekent dit dat de huidige standaardisatie rond één GPU-platform mogelijk niet het eindpunt is. Als de AI-markt zich ontwikkelt richting gespecialiseerde modellen en diverse chiparchitecturen, zal ook de onderliggende fysieke infrastructuur mee moeten bewegen. De vraag verschuift dan van “hoe schaal ik dit ene platform maximaal op?” naar “hoe ontwerp ik een flexibel ecosysteem waarin verschillende accelerators efficiënt samenwerken?”

Meer over
Lees ook
Motie Grinwis c.s. over datacenters en hyperscalers legt zwakte bloot

Motie Grinwis c.s. over datacenters en hyperscalers legt zwakte bloot

De Tweede Kamer heeft dinsdag een groot aantal moties aangenomen en in ieder geval twee daarvan hebben betrekking op datacenters en hyperscalers. De motie Grinwis c.s., ingediend op 12 februari, is de meest in het oog springende.

Free ICT Europe: Circulaire IT levert kostenvoordeel en vraagt om steviger EU-beleid

Free ICT Europe: Circulaire IT levert kostenvoordeel en vraagt om steviger EU-beleid

Een recente position paper van Free ICT Europe stelt dat circulaire strategieën in zakelijke IT aantoonbare kostenbesparingen opleveren. De auteurs baseren hun analyse op resultaten uit het Interreg North West Europe-project Circular Economy for the Data Centre Industry.

Motie Tweede Kamer pleit voor beteugeling groei datacenters

Motie Tweede Kamer pleit voor beteugeling groei datacenters

Motie Tweede Kamer verzoekt de regering om de huidige juridische criteria voor hyperscale datacenters aan te scherpen en tevens te verkennen welke nieuwe effectieve (wettelijke) voorwaarden gesteld kunnen worden aan datacenters om de groei te beteugelen