Full Stack Observability (FSO)

Et nyt tre-bogstavs-akronym er begyndt at fylde i IT-verdenen; FSO. Men hvad ligger der egentlig i Full Stack Observability, og hvordan er det anderledes, end det IT ’plejer at gøre’?

Hvis vi skal svare på spørgsmålet, om hvad der ligger i FSO, giver det mening at starte med at betragte ’problemet’ en smule historisk.

FSO - Full Stack Observability

Monitoreringsæraen

En IT-driftsorganisation har altid haft behov for at kunne holde øje med om de systemer, der var under deres ansvar, fungerede efter hensigten. Til dette formål opfandt de historisk MONITORING, hvilket i essensen var den berømte rød/grøn overvågning. Grøn betød at alt er godt, vi kan forsætte med at drikke kaffe med fødderne på bordet. Rød derimod betød ALARM, og at alle smed papirer op i luften og aflyste alle øvrige aftaler for at finde ud af, hvad der var gået galt med en specifik dims indenfor deres ansvarsområde. Dette var typisk fra et teknisk perspektiv drevet af alarmer og events.
Opsummeret var monitoreringsæraen kendetegnet ved, at vores hoved-KPI var availability indenfor et organisatorisk domæne/silo.

FSO dashboard

Klassisk rød/gul/grøn overvågning kan fortælle noget omkring de enkeltstående enheders helbred. I beskedenhed er IT-operations ofte blevet ret gode til at bygge rød/grøn dashboards, og det er til stadighed et væsentligt element i eksempelvis en NOC.atoriske domæne/silo.

Visibility/observability-perioden

Efterhånden som organisationer blev mere modne, og krav og SLA’er til IT-leverancerne steg, opstod behovet for at kunne gå et spadestik dybere i sin monitorering, således at man kunne sige noget mere intelligent omkring performance. Derfor blev telemetri og log-teknologier koblet til den eksisterende monitorering. Nu kunne de forskellige driftsenheder eksempelvis pludselig fortælle, hvorvidt WAN-linjen var 97% belastet, eller hvorvidt en server havde brugt alt sin memory.
Dette gav det første fodaftryk ind i en ’root cause identification’-verden, og er nok her de fleste virksomheder er i dag.

Med den spæde observability bevægede hoved KPI’en sig således over i Performance, men stadig indenfor den enkelte organisatoriske domæne/silo.

FSO dashboard

Med observability bevægede vi os over i en performance-tænkning – igen ud fra perspektivet af den enkelte enhed. Med performance metrikker var det nemmere at begynde at skimte nogle former for problem root causes.

Full Stack Observability som det fremtidige paradigme

IT har til tider været beskyldt for at bygge løsninger, der var mere for ITs egen skyld end for forretningen. Skønt dette udsagn er lidt unuanceret, så er det nok ikke uden et gran af sandhed, at ting ofte bliver bygget ud fra det verdensbillede bygherren har. Det vil sige at fokus ift. overvågning har været meget fokuseret på drift af et specifikt ansvarsområde. Dvs. at man typisk ikke har sammenkoblede diskrete løsninger til hhv. netværk, server, applikationsdrift m.m.

FSO dashboard

FSO kigger på hele ’stacken’ ud fra et brugeroplevelsesperspektiv. Tesen er, at en bruger i bund og grund er ligeglad med, hvilke komponenter der ligger i bunden, så længe vedkommendes service bliver leveret. Man afstemmer således kerneforretningen med ens overvågning, da det er denne, der i sidste ende er interessant for virksomheden.

FSO-tanken vender det lidt på hovedet og tager som udgangspunkt fat i modtagerens perspektiv. Leverer IT den end-user service, som er forventet af forretningen og i hvilken kvalitet? For at det kan lade sig gøre at sige noget intelligent om dette, er man nødt til at fusionere indsigten fra de forskellige enkeltstående domæner/siloer og berige dette med forretningsindsigt.

Gartner definerer observability som “the evolution of monitoring into a process that offers insight into digital business applications, speeds innovation and enhances customer experience”. Tilføjelsen af “Full Stack” betyder i praksis, at man nu også betragter observability på tværs af operationelle domæner.
FSO’s hoved-KPI er således brugeroplevelsen på tværs af domæner.

Hvorfor så FSO nu?

Den stærke digitaliseringstransformation, der er sket over de sidste år, har kun forstærket vigtigheden af ’oppetid’. Specielt ift. de ofte relativt få virkelig forretningskritiske applikationer eller assets. Men det er også blevet sværere at skulle overvåge services, idet man er gået fra traditionelle monolitiske on-prem only, der er leveret ud af samme fysiske, klassiske infrastruktur, til at det ofte er en større mosaik. En moderne applikation har ofte diverse mikroservices, med cloud API-integrationer, blandet infrastruktur, database backends, SaaS afhængigheder med mere. Løbende overvågning og fejlsøgning på et sådan inhomogent setup kan være vanskeligt, medmindre man bevæger sig mod et FSO mindset.

Hos Conscia følger vi med i denne udvikling og rådgiver vores kunder i, hvordan man kan få sin klassiske overvågning bevæget over i et FSO-paradigme. Vi er bl.a. enabled af tooling fra en vores strategiske partnere Cisco (https://www.cisco.com/c/en/us/solutions/full-stack-observability.html), hvilket kan give en god bund ift. FSO.

Bliv klogere på FSO på siden her