Proactief beheer kan niet zonder geïntegreerde managementaanpak

Delta 1

De tools voor het automatiseren van controle- en bewakingstaken in datacenters zijn relatief nieuw op de markt. De eerste producten van dit type boden verschillende functies, waaronder het bijhouden van een registratie van de apparatuur en het controleren van de verplaatsingen van apparaten en het onderhoud ervan. Vandaag de dag is het niet alleen een kwestie van het tekenen van mooie diagrammen van serverruimtes. Moderne systemen maken het inmiddels mogelijk om een breed scala aan taken met betrekking tot de werking van een datacenter in realtime op te lossen. In dit artikel kijken we naar de problemen die zich in deze industrie voordoen en proberen manieren te vinden om deze issues op te lossen.

In de technische infrastructuur van een datacenter zijn twee regelkringen te onderscheiden. De ene regelkring heeft betrekking op koeling en stroomverdeling op rack-niveau, terwijl de andere op het niveau van de ­gehele faciliteit werkt en zich niet alleen ­bezighoudt met stroom en airconditioning, maar ook met diverse hulpsubsystemen (brandblussing, toegangscontrole, en andere). Vaak zijn deze lussen en zelfs hun componenten onafhankelijk van elkaar en worden ze door verschillende teams van operators bediend.

Bedrijven zijn niet altijd bereid om geïntegreerde oplossingen voor het beheer van de technische infrastructuur aan te schaffen. Denk bijvoorbeeld aan commerciële datacenters. In de enterprise-wereld is het echter niet ongewoon dat het management van het bedrijf probeert geld te besparen en ermee instemt om alleen gefragmenteerde systemen voor airconditioners en UPS te kopen. Gebrek aan communicatie tussen deze ­besturingscircuits, verschillende automati­seringsniveaus van de subsystemen van het datacenter en een hele reeks aan leveranciers van apparatuur bemoeilijken het ­gecoördineerd beheren en besturen van alle onderdelen van de faciliteit, waardoor optimalisatie onmogelijk is.

Bedieningswijzen

In het ergste geval worden datacenter-subsystemen handmatig aangestuurd en wordt de installatie en verplaatsing van apparatuur gedocumenteerd met behulp van Microsoft Excel. Vaak is het papierwerk een - zeg maar - ‘puinhoop’. Dat is op zich heel natuurlijk, omdat het bijhouden van een correcte database met behulp van spreadsheets een zeer uitdagende taak is. Wanneer het gaat om tientallen racks of meer zijn problemen met een handmatige boekhouding onvermijdelijk. Vervanging van apparatuur in zo’n faciliteit vindt alleen plaats als er een storing ­optreedt, waardoor de overheadkosten en downtime in het geval van een ongeval toenemen.

Als het minimaliseren van downtime van ­cruciaal belang is voor eigenaren van een ­datacenter, wordt veelal het reactieve besturingsmodel toegepast. In dit geval wordt de procedure voor het oplossen van problemen strak geregeld en wordt het bijbehorende papierwerk onderhouden. Het proces is ­echter gebaseerd op de ervaring van medewerkers en hun kennis van een specifiek ­datacenter. In het geval van een incident wordt het probleem veelal snel opgelost maar er ontstaan serieuze uitdagingen als het gaat om preventie. Dit is een gevolg van het gebrek aan mogelijkheden voor een ­uitgebreide analyse van de oorzaken van de storing. In een situatie waarin slechts een paar experts weten hoe om te gaan met alle processen van facility management, ­ontstaan er al snel problemen. Zeker als bijvoorbeeld een van deze experts vertrekt. 

Een meer geavanceerd managementmodel is altijd servicegericht. Het gaat uit van de aanwezigheid van volledig papierwerk voor alle subsystemen van een faciliteit. Het definieert duidelijk de regels en procedures voor vervanging en preventief onderhoud van ­apparatuur en houdt een grondige boekhouding bij van de installatie en de beweging van apparaten ervan, terwijl de operationele diensten rapporten opstellen over de parameters van technische systemen, ongevallen en acties van het personeel om deze te ­elimineren.

Het belangrijkste kenmerk van de service­gerichte benadering van datacenterbeheer is de proactiviteit. Dit model staat niet alleen een analyse van de oorzaken van fouten toe, maar ook omdat wordt geanticipeerd op problemen voordat ze zich voordoen. Er kunnen gemakkelijk workarounds worden gecreëerd om snel de beschikbaarheid van diensten te herstellen. Een dergelijke aanpak valt uiteraard niet te realiseren zonder de introductie van een geïntegreerd en geautomatiseerd bewakings- en dispatching-systeem voor alle belangrijke subsystemen in het datacenter. De praktijk leert dat acties van werknemers vaak de oorzaak zijn van fouten. Er is altijd een tekort aan hoogopgeleide experts, maar als het dispatching-centrum is geautomatiseerd en alle regels en voorschriften voor het onderhoud van de faciliteit zijn geformaliseerd, heeft het meeste personeel slechts basiskennis nodig.

DCIM-oplossingen

Zo’n tien jaar geleden verschenen er DCIM-oplossingen (Data Center Infrastructure Management) op de markt, die alle engineering-subsystemen combineerden tot één logische structuur. De eerste versies van DCIM maakten het mogelijk om schema’s en plannen van objecten op te stellen en papierwerk te onderhouden. Maar inmiddels is hun functionaliteit aanzienlijk veranderd. Moderne oplossingen kunnen samenwerken met de monitoring-tools die in de apparatuur van verschillende fabrikanten zijn ingebouwd. Ook kunnen extra sensoren, controllers, ­signaalomzetters en dataverzamelingssystemen worden aangesloten. Meestal wordt informatie verzameld over het energieverbruik op alle niveaus, tot en met het niveau van de racks, evenals de temperatuur en vochtigheidsgraad in racks, koelsystemen en ducts, alsmede gegevens over vloeistoflekken. Het is het minimum dat nodig is om het beoogde doel te bereiken. Zodra DCIM is ­geïnstalleerd, ontvangt de klant een geïntegreerde bewakings- en besturingsomgeving die alle kritische subsystemen en in sommige gevallen zelfs IT-apparatuur omvat. De ­belangrijkste taak is het combineren van de datastromen die afkomstig zijn van alle ­beschikbare bronnen. De informatie wordt in realtime verzameld en verwerkt, wat de ­medewerkers een volledig beeld geeft van de werking van alle subsystemen van het ­datacenter, inclusief - indien nodig - IT-systemen. Hier zien we nog een ander voordeel van DCIM, namelijk dat de impact van menselijke factoren op de prestaties van datacenter-subsystemen wordt verminderd.

Het probleem van keuzevrijheid

Er kunnen verschillende scenario’s zijn voor de invoering ervan, maar het is het beste om al met DCIM te starten in de ontwerpfase van de faciliteit. Er zijn ook mogelijkheden om bestaande stand-alone subsystemen te integreren met apparatuur van verschillende ­fabrikanten. De keuze voor een oplossing in de ontwerpfase van het datacenter levert geen problemen op. Dit wordt meestal gedaan door een systeemintegrator die helpt bij het kiezen van de benodigde hardware en software.

De situatie met een bestaand datacenter is veel ingewikkelder. In dit geval is het noodzakelijk om een werkgroep samen te stellen met vertegenwoordigers van alle betrokken afdelingen. Het is ook nodig om een lijst te maken van alle parameters en knooppunten van de te bewaken infrastructuur en deze in volgorde van belangrijkheid te rangschikken. Vervolgens is het noodzakelijk om de protocollen en communicatiemiddelen die door de infrastructuurapparatuur worden ondersteund, te controleren en na te gaan welke extra sensoren en controllers moeten worden geïnstalleerd.

Aan de hand van al deze informatie kunnen we de nodige softwareoplossingen selecteren, een lijst met extra apparatuur maken en het projectbudget berekenen. Het is een ­uitstekend idee om de introductie van DCIM in het bestaande object volledig uit te besteden. Aanvankelijk waren DCIM-systemen ­lokaal, maar nu beginnen veel ontwikkelaars DCIM als een dienst (SaaS) aan te bieden. Deze aanpak zorgt voor een aanzienlijke ­vermindering van de investeringsuitgaven.

Optimalisatiepunten

De belangrijkste post in de operationele uitgaven van een datacenter zijn de kosten van elektriciteit. Daarom is het optimaliseren van het energieverbruik een belangrijke prioriteit. Het hangt af van een groot aantal externe en interne factoren. Klimaat- en weersomstandigheden, inclusief seizoensgebonden veranderingen, hebben bijvoorbeeld een directe invloed op koelsystemen. Men kan ook pieken en dalen in de belasting van computer- en telecommunicatieapparatuur en tientallen andere factoren toevoegen. Het is onmogelijk om deze allemaal handmatig in rekening te brengen, maar het DCIM-systeem maakt het mogelijk om goede bedrijfsstatistieken te verzamelen en te analyseren en probleemgebieden in de infrastructuur van de faciliteit te identificeren.

Een van de belangrijkste indicatoren voor een datacenter is de Power Usage Effectiveness (PUE) coëfficiënt, die laat zien hoeveel stroom wordt besteed aan de werking van de IT-belasting en hoeveel wordt besteed aan hulpbehoeften, zoals koeling en UPS-­gebruik, evenals verliezen in het distributiesysteem. Het wordt berekend door het totale energieverbruik te delen door het verbruik van IT-apparatuur. Tot voor kort werd de PUE-factor van 1,6 tot 2,0 aanvaardbaar geacht. De markt vraagt nu echter om efficiëntere datacenters, dus de strijd om de waarden vanaf 1,1 tot 1,2 is begonnen. Meestal wordt het verbruik gemeten aan de uitgang van de UPS, aan de uitgang van de stroomverdelingseenheid en voor het daadwerkelijke ­gebruik van IT-apparatuur.

Op basis van de verkregen gegevens is het mogelijk om de energie-efficiëntie van het datacenter vrij nauwkeurig te bepalen. De PUE geeft echter niet alle nuances weer. Deze factor is nog steeds belangrijk, maar laat bijvoorbeeld niet toe om rekening te houden met de downtime van servers of om problematische hotspots te identificeren. ­Bovendien gaat het verlagen van de PUE tot waarden die dicht bij één liggen vaak ten koste van de maatregelen die nodig zijn om incidenten in een datacenter te voorkomen. Daarnaast geldt dat het inkorten van de ­levensduur van apparatuur het effect van energiebesparing teniet kan doen.

Visualiseren

Moderne beheersystemen verzamelen gegevens over het energieverbruik van servers, racks en distributieapparatuur. Het is zelfs mogelijk om elk individueel stopcontact te controleren. Statistieken over het verbruik van kritische hulpbronnen kunnen in een eenvoudig te begrijpen vorm worden gevisualiseerd, wat het gemakkelijker maakt om de meest energie-intensieve gebieden te vinden en de kosten te optimaliseren. Er kunnen ook periodes van lagere ‘loads’ worden ­geïdentificeerd om het onderhoud tijdens deze periodes te plannen. Een analyse van verbruikspieken maakt het mogelijk om de vermogensreserve in een bandbreedte van 10-15% te houden in plaats van 30-40%, zoals het geval is bij handmatige regeling. Bovendien levert dit ook een aanzienlijke besparing op.

Delta 2

DCIM-achtige oplossingen bewaken ook ­andere technische subsystemen. Ze helpen bijvoorbeeld bij het in kaart brengen van de luchtstroom om problematische gebieden van het airconditioning- en klimaatregelsysteem te identificeren, dat op de tweede plaats komt voor IT-apparatuur wat betreft het elektriciteitsverbruik in het datacenter. Kijk ook naar de voordelen die ontstaan op het gebied van pro-actief beheer, preventie en snelle eliminatie van problemen. De ­betrouwbaarheid van de infrastructuur gaat hierdoor omhoog, terwijl de kosten omlaag kunnen. Handmatige controle is alleen ­mogelijk in het geval van een kleine serverruimte, maar wanneer er tientallen of zelfs honderden racks in de faciliteit aanwezig zijn, wordt de introductie van DCIM pure noodzaak.

Toekomst

Tot nu toe hebben we alleen gesproken over de technische infrastructuur, omdat het beheer van de IT-infrastructuur als een aparte taak wordt beschouwd. Meestal wordt dit gedaan met systemen die niet gerelateerd zijn aan DCIM. Als het gaat om commerciële datacenters valt het werk van IT-apparatuur onder de verantwoordelijkheid van klanten. De ontwikkeling van virtualisatie en geconvergeerde of hyperconverged architectuur verandert echter geleidelijk aan de situatie. Tegenwoordig ontwikkelen developers oplossingen die realtime monitoring van de status van virtuele servers op individuele ­fysieke apparaten mogelijk maken. IT-leveranciers integreren op hun beurt een groot aantal sensoren in hun producten om het stroomverbruik en de temperatuur te bewaken.

Effectieve planning van systeembelastingen in virtuele omgevingen moet alle niveaus ­bestrijken: besturingssystemen en toepassingen, servers, opslagsystemen, telecommunicatieapparatuur en communicatiekanalen. En natuurlijk fysieke middelen, zoals stroom, koeling, bevochtiging en andere. DCIM-oplossingen zijn niet langer een ‘op zichzelf staand ding’ in grote bedrijfsdatacenters. Hun integratie met virtualisatieplatforms en beheersystemen voor IT-infrastructuren is slechts een kwestie van tijd.

Darren Cater is sales manager bij Delta Electronics in Hoofddorp