Druk zijn met niets doen

De vorige keer heb ik uitgelegd waarom ik zo geschrokken was van de ‘thermodynamische’ efficiëntie van IT-systemen. Ik kwam tot kleiner dan 0,1% en de net afgeschafte gloeilamp had 10%.

Ook had ik ene Harry ontmoet, een IT-specialist, en die kon mij er veel meer over vertellen. Dat heb ik inmiddels gedaan. Ik blijf hem voor mijn gemak maar Harry noemen. Hij bleek mij al te ‘kennen’ van Kyoto­Cooling, want dat had hij voor een klant helemaal geanalyseerd. Het gesprek ging als vanzelf en in het kort: Ik denk mijn IT ‘soulmate’ te hebben gevonden.

Mijn verhaal naar u moet u dus ook zien als ons verhaal.

Hij begon meteen met: die IT-efficiëntie is wellicht nog veel lager, want mijn output van 10W per fiber is te hoog ingeschat. Harry, ik laat het maar zo, kleiner dan 0,1% is al ‘erg’ genoeg… 😉

Ik was al geschokt, u wellicht ook, maar het wordt allemaal nog veel ‘erger’.

Mijn insteek was: Harry, waarom is de elektrische belasting van een DC toch zo constant, terwijl je variatie zou verwachten? Immers de vraag naar IT is echt afhankelijk van de tijd van de dag of weekend. Toch? Klopt helemaal Mees.

Laten we het verbruik en de belasting van netwerk en disks als constant beschouwen en alleen de CPU’s van de servers variabel. Variabel in de IT-belasting en dus ook variabel in het stroomverbruik.

Als je naar servers kijkt, zo sprak hij mij toe, wordt door allen het idle percentage gelogd. Helemaal idle betekent zoiets van wachten op werk door de CPU. De CPU heeft niets te doen, behalve ‘warm’ blijven. Het operating systeem draait immers altijd 24/7.

De inschatting is dat het idle percentage van de gemiddelde server
lager is dan 50%! Dat komt onder andere door variatie in het aanbod van echt – CPU – werk. Daarnaast is er ook de angst voor het ‘overloaden’ van de CPU’s, dat tot data uitval kan leiden. Het idle % wordt kunstmatig en bewust hooggehouden om deze risico’s te voorkomen.

Prima Harry, maar dan gaat het stroomverbruik toch wel naar beneden, als de CPU’s meer dan 50% van de tijd niets te doen hebben? Nou blijkbaar niet. Of maar een heel klein beetje. Het stroomverbruik van de IT-hardware krijgt helemaal geen aandacht. Ja dat ‘wist’ ik ook. Ik heb zelf een keer een beheerder de Eco knoppen van een nieuwe machine zien ‘uitzetten’. Alles naar de ‘snelste’ stand.

De leveranciers van de hardware zijn door de Amerikaanse EPA al jaren gewezen op hun verantwoordelijkheid en hebben allerlei slimme stroombesparende functies ingebouwd. Maar die worden nauwelijks of helemaal niet gebruikt. Ja maar Harry, dat is toch bizar (1)??? Hij had nog veel meer te vertellen, maar we laten het voor nu.

Idle betekent eigenlijk niets te doen hebben, dus dat is iets van: de auto staat geparkeerd. Deze ‘auto’ staat echter nog gewoon te draaien.
Laten we het stationair noemen. Het verbruik is echter wel gelijk alsof je er mee aan het rijden bent… bizar (2) toch?

Als het idle, het niks-te-doen-hebben, percentage gemiddeld boven de 50% is en het stroomverbruik constant hoog blijft en niet naar ‘stationair’ gaat, dan is dat dus meer dan 50% van al het IT-energieverbruik. Bizar (3) toch?

Nee, nou wordt het ‘leuk’(4) … dit leidt tot de conclusie:
IT-hardware verbruikt meer energie met niets doen,
dan met actief zijn!

Dat kan toch gewoon niet? Nee, dat kan niet waar zijn. Ik vertrouw die Harry helemaal niet. Ik denk dat we er helemaal naast zitten…
Misschien wel zelfs met wel 50%.

Tot de volgende keer. Maar ik schrijf jullie pas als ik het echt begrijp, want dit kan toch niet waar zijn.

Mees Lodder, WCooliT

2 Responses to Druk zijn met niets doen

  1. Niek van der Pas schreef:

    Beste Mees,
    Ja ik verbaas me ook over het energieverbruik van datacenters terwijl er ogenschijnlijk geen werk wordt verzet. In mijn White Paper over energie-efficiency in datacenter en standaarden (https://www.minkels.com/whitepapers/how-to-use-the-en-50600-to-design-an-energy-efficient-data-centre) op blz. 19 stel ik voor om een nieuwe KPI te introduceren de PTR, ofwel de Power Trafic Ratio. Deze geeft de verhouding van de fluctuatie van het netwerkverkeer in relatie met de fluctuatie van het gebruikte elektrische vermogen. In het in het WP aangehaalde voorbeeld varieert het dagelijks netwerkverkeer met een factor 2,42 tussen 1,9 en 4,6 Tb/s en het 24 uurs stroomverbruik met een factor 1,01 tussen 460 en 466 kW. De PTR is dan 2,42/1,01=2,39. Ideaal is een PTR van 1. Netwerkverkeer is lang niet altijd de beste maatstaf voor nuttig werk maar wel een waarde die vaak goed te meten is. Een andere “proxy” zoals CPU gebruik kan ook gebruikt worden maar is niet altijd voorhanden.Met een KPI kunnen dan verbeteringen inzichtelijk gemaakt worden. Hoe dichter de PTR tot 1 nadert hoe dynamischer het datacenter reageert op fluctuaties. Een datacenter waar processen draaien met een grote wisseling in capaciteit kunnen dan alleen efficiënt draaien met een laag idle verbruik.

  2. Robert schreef:

    Beste Mees, helaas klopt het wel redelijk wat die Harry zegt. De beheerders van de IT-systemen hebben geen enkele incentive om de systemen te tunen naar Energieverbruik. Ik heb eens aan de hand gehad dat de systeembeheerders weigerden om een blade center met VM-ware omgeving (al snel 5kW), zo te configureren dat het aantal active blades zich aanpastte aan de feitelijke workload (dus in de nacht naar 1). Snel op en afschalen was mijn devies, scheelt duizenden euro’s per jaar.
    Wat blijkt: “En als het opschalen niet werkt hebben wij het gedaan en gaat onze KPI naar de knoppen” (tsja, als je daar op wordt afgerekend, dan is dit gedrag prima te verklaren).

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.