Filter resources

Blog

Wat is IT-monitoring?

Eenvoudig gezegd verwijst de term “IT-monitoring” naar alle processen en tools die je gebruikt om vast te stellen of de IT-infrastructuur en digitale diensten van je organisatie correct functioneren. Monitoring helpt bij het detecteren en oplossen van allerlei soorten problemen. Tegenwoordig is monitoring complexer geworden. Dat komt doordat onze systemen en architecturen steeds ingewikkelder zijn — net […]

5 minutes read

Wat is IT-monitoring? – featured image

Eenvoudig gezegd verwijst de term “IT-monitoring” naar alle processen en tools die je gebruikt om vast te stellen of de IT-infrastructuur en digitale diensten van je organisatie correct functioneren. Monitoring helpt bij het detecteren en oplossen van allerlei soorten problemen.

Tegenwoordig is monitoring complexer geworden. Dat komt doordat onze systemen en architecturen steeds ingewikkelder zijn — net als de mensen waarmee we samenwerken zijn de IT-omgevingen vaak gedistribueerd.

Laten we eens kijken naar enkele formele definities.

Het SRE-boek van Google beschrijft monitoring als het “verzamelen, verwerken, aggregeren en visualiseren van real-time kwantitatieve gegevens over je systeem”. Deze gegevens kunnen bestaan uit query-aantallen en -types, foutaantallen en -types, verwerkingstijden en de levensduur van servers.

Volgens ITIL® 4 valt informatie over de gezondheid en prestaties van services onder de praktijk Monitoring en Eventbeheer. Daarin wordt monitoring omschreven als een capaciteit die organisaties in staat stelt om:

  • Geschikt te reageren op gebeurtenissen die eerder impact hadden op de service.
  • Proactieve maatregelen te nemen om toekomstige negatieve gebeurtenissen te voorkomen.

Monitoring staat in nauw verband met veel andere IT Service Management (ITSM)-praktijken, zoals:

  • Incidentmanagement
  • Probleembeheer
  • Beschikbaarheidsbeheer
  • Capaciteits- en prestatiebeheer
  • Informatiebeveiligingsbeheer
  • Servicecontinuïteitsbeheer
  • Configuratiebeheer
  • Implementatiebeheer

Wat moet je monitoren in IT-systemen?

Bij het monitoren van IT-systemen draait het in de kern om het beantwoorden van twee fundamentele vragen:
Wat gebeurt er en waarom gebeurt het?

Dit gebeurt vaak reactief: een systeemstoring triggert een waarschuwing, die wordt weergegeven zodat een engineer actie kan ondernemen.

Metrics zijn de bron van ruwe meetgegevens die worden verzameld, samengevoegd en geanalyseerd door monitoringsystemen. IT-systeemmetriek kan op verschillende lagen worden gemeten, waaronder:

  • Infrastructuur-metrics op laag niveau:
    Deze worden gemeten op host-, server-, netwerk- en faciliteitenniveau, en omvatten zaken zoals CPU-gebruik, schijfruimte, stroomverbruik en de status van netwerkinterfaces.
  • Applicatie-metrics:
    Deze worden op softwareniveau gemeten en omvatten zaken als responstijden, foutpercentages en gebruik van systeembronnen.
  • Metrics op service-niveau:
    Deze combineren gegevens van infrastructuur, connectiviteit, applicaties en serviceactiviteiten waar van toepassing.

Monitoring gebaseerd op infrastructuurgegevens wordt ook wel “black-box monitoring” genoemd. Dit valt meestal onder de verantwoordelijkheid van systeembeheerders en DevOps-engineers. Voor applicatieniveau monitoring gebruiken we de term “white-box monitoring”, en dit wordt doorgaans uitgevoerd door ontwikkelaars en applicatieondersteunende engineers.

De meetgegevens komen doorgaans uit native monitoringfunctionaliteit die is ingebouwd in de IT-componenten zelf. Daarnaast maken sommige IT-monitoringsystemen gebruik van aangepaste instrumentatie, zoals lichtgewicht softwareagenten, die in staat zijn om meer gedetailleerde serviceniveaugegevens te verzamelen.

De vier gouden signalen

Volgens Google zijn er vier gouden signalen waarop IT-monitoring zich zou moeten richten:

  1. Vertraging:
    De tijd die nodig is om een verzoek af te handelen, bijvoorbeeld de round-trip-tijd, meestal gemeten in milliseconden. Hoe hoger de latentie, hoe slechter het serviceniveau — dit leidt vaak tot klachten van gebruikers over traagheid of gebrek aan responsiviteit.
  2. Verkeer:
    Een maat voor hoeveel belasting op je systeem wordt uitgeoefend, zoals het aantal verwerkte aanvragen of sessies binnen een bepaalde tijd. Toenemend verkeer legt meer druk op IT-systemen, wat invloed kan hebben op de gebruikerservaring.
  3. Fouten:
    Het aantal mislukte verzoeken — expliciet (zichtbare foutmeldingen), impliciet (stil falen) of veroorzaakt door beleidsregels. Fouten kunnen wijzen op configuratieproblemen of storingen binnen het servicemodel.
  4. Verzadiging:
    Een maat voor hoe vol het systeem is, met nadruk op de meest beperkte middelen. Zodra het gebruiksniveau wordt overschreden, nemen de prestaties vaak af.

Best practices: waarschuwingsmoeheid voorkomen

Wanneer systeembeheerders monitoringsystemen configureren om meer data te verzamelen, lopen ze het risico overweldigd te worden door:

  • Het grote aantal gegenereerde waarschuwingen;
  • De complexiteit van het interpreteren van waarschuwingen en loggegevens.

Een goede praktijk is om eenvoudige, voorspelbare en betrouwbare regels te hanteren die in de meeste gevallen echte problemen correct signaleren, en zo waarschuwingsmoeheid helpen voorkomen.

Toekomstige trends in IT-monitoring

1. De impact van AI en machine learning (ML)

De invloed van AI en ML op IT-monitoring blijft toenemen, vooral dankzij de opkomst van krachtige taalmodellen (LLM’s – Large Language Models). Moderne tools met geïntegreerde AI kunnen nu de volledige procesketen aan — van detectie tot respons — met name voor:

  • Het analyseren van grote hoeveelheden eventdata;
  • Het afhandelen van repetitieve taken zoals eventcorrelatie en loganalyse op gedistribueerde systemen.

Met de juiste training kunnen deze tools effectiever en sneller door ruis en fout-positieven/-negatieven heen filteren dan welk menselijk team dan ook. Dat betekent echter niet dat menselijke betrokkenheid verdwijnt: de rol verschuift juist naar het ontwikkelen van betere orkestratie- en automatiseringstools om alerts af te handelen en incidenten op te lossen.

2. Unified observability

Een andere belangrijke trend is de opkomst van unified observability: platformen die één gecentraliseerd overzicht bieden over infrastructuur, applicaties en gebruikerservaring. Door logs, metriek en traces te combineren, krijg je een krachtig vergrootglas voor diepteanalyse. Dit maakt het eenvoudiger om precies te bepalen welke problemen gebruikers ervaren in complexe, moderne IT-omgevingen.

Lees ook onze blogs over Observability: Van Monitoren naar Begrijpen.

(Met dank aan Splunk en Google)

Recent Blog posts

Gerelateerd

Resources