Den bild som kommer fram i internutredningen om mejlhaveriet är en kedja av olyckliga händelser som hänger samman. Hade inte den ena inträffat skulle den andra inte fått så allvarliga följder.
– Ja tyvärr är det så. Det man kan tänka är att man måste lära av hela förloppet. Det är det viktigaste, säger Sören Ehrnberg, it-chef vid Göteborgs universitet, GU.
I rapporten rekommenderar internrevisionen att rektor skyndsamt ska utreda ansvarsfrågan.
– Rapporten beskriver en tidsaxel av vad som hänt, men ytterligare svar kommer att finnas när man gräver djupare i händelseförloppet och utreder ansvarsfrågan, säger Sören Ehrnberg.
Han menar att utredningen konstaterar att saker har hänt, men inte exakt hur och av vem.
”En robust lösning”
Den första händelsen i kedjan som utredningen tar upp är att Göteborgs universitet på rekommendation av Microsoft valde en lösning där mejlen fanns på två uppsättningar hårddiskar som speglade varandra, men att det inte fanns någon ytterligare backup. En lösning som Microsoft ansåg vara ”bästa praxis”.
– Det är en robust lösning, och jag tror att Microsoft själva har den. Men det bygger ju på att det inte uppstår den här typen av bugg som vi råkade ut för.
Den bugg som han talar om är den så kallade 40k-buggen, som innebär att en typ av Dells hårddiskar slutar fungera efter 40 000 timmar i drift. I februari 2020 hade Dell tagit fram en uppdatering av mjukvaran till hårddiskarna som avhjälpte felet. Men uppdateringen installerades inte på GU:s hårddiskar.
I rapporten skriver interrevisionen att orsaken till att uppdateringen inte skedde var att ett serviceavtal för hårddiskarna inte hade uppdaterats. Avsaknaden av serviceavtal ledde till att information om 40k-buggen inte gick fram till ansvariga på GU.
Hur kom det sig att ni missade den informationen?
– Ja, buggar finns ju på olika ställen, men de är olika farliga. Om man ska reagera förutsätter det ju att informationen om konsekvenserna framgår. Om så skedde är något som får utredas vidare. Men jag är osäker på vilken roll serviceavtalen spelat för haveriet.
I augusti förra året havererade den ena uppsättningen hårddiskar för mejlen på GU, till följd av 40k-buggen. Den andra uppsättningen hårddiskar fungerade fortfarande. En underleverantör informerade GU om att mjukvaran i den andra uppsättningen hårddiskar hade blivit uppdaterad. Men enligt rapporten gjordes uppdateringen aldrig eller så misslyckades den.
Nu undrar man, vad hände egentligen?
– Den frågan har vi inte svaret på. Den är kanske den viktigaste att få klarhet i.
Sören Ehrnberg påpekar att nu fungerar mejlen till slut för nästan alla.
– Där står vi i dag, vi har kämpat hårt. Vi har kontaktat slutanvändare, jagat data och pusslat ihop det. Det vi ser nu är att de allra flesta som är aktiva har fått tillbaka sin e-post.
Efter haveriet har ni lagt över mejlen ”i molnet” via Office 365. Hur fungerar backupen nu?
– Vi har en separat säkerhetskopiering som också ligger i våra datahallar. Vi förlitade oss förut på Microsofts ”bästa praxis” men fick erfara att den inte funkar i alla lägen. Så det är ett värde att ha den extra tryggheten med ytterligare en backup.
En slutsats i rapporten är att en grundläggande orsak till mejlhaveriet var just bristen på traditionell backup. Nu har ni alltså det?
– Ja, med tanke på att det otänkbara faktiskt kunde hända så tar vi inga risker.
Sören Ehrnberg påpekar:
– Hade vi tidigare haft en traditionell backup hade vi kommit igång på kortare tid, och inte riskerat dataförlust, men vi hade ändå haft ett stillestånd när hårddiskarna havererade.
När jag intervjuade dig förra gången om mejlhaveriet sa du att detta var det värsta du råkat ut för. Hur är det nu?
– Det är fortsatt det värsta jag varit med om. Det har tagit mycket kraft för alla medarbetare på GU, säger Sören Ehrnberg.