Angående driftstörning på SSL-certifikat via Let’s Encrypt

SSL

Bakgrund
Uppdatering:
Nu har Let’s Encrypt gått ut med sin analys om vad som skedde och vilka åtgärder som tas för att minimera liknande händelser i framtiden. Analysen återfinns här.

Vi har alla varit med om en och annan driftstörning på olika tjänster.

Webbsidan har för många besökare, det är något trubbel med databasen
eller att sidan helt enkelt inte svarar.

En mindre känd typ av driftstörning är när det krånglar med tekniken
bakom SSL-certifikaten.

Varje certifikatsutgivare har en egen infrastruktur för att webbläsare
skall kunna fråga om sidan de besöker har ett giltigt certifikat.
Tekniken i sig kallas OCSP. Vi underlättar för utgivarna genom att ta
över ansvaret för att fråga om giltigheten. Det blir en fråga istället
för att varje webbläsare frågar dem varje besök. Detta snabbar upp
sidladdningar och bidrar till en bättre upplevelse.

När vi får in en förfrågan mot en sida som använder SSL kollar vi även om
certifikatet är giltigt enligt utgivaren. Sedan sparar vi detta svar under en
viss tid. När vi får tillbaka ett fel eller när det inte går att nå
utgivaren väntar vi en kortare stund för att sedan fråga igen.
Om vi inte hade sparat svaret och det tar en stund att fråga blir
resultatet att sidan går långsamt att ladda.

Händelseförlopp

Under fredagen hade Let’s Encrypt en driftstörning i sin OCSP-tjänst.
Detta medförde att det sidorna laddade långsamt, samt att vissa
servrar blev överbelastade av förfrågningar ibland.

Just nu förs en dialog om hur vi kan förbättra situationen för våra kunder
som drabbades av Let’s Encrypts driftstörning under fredagen. Denna typ av problem
händer extrem sällan, men vi kommer ändå att göra allt vi kan för att förbättra
situationen när det väl sker.

Tidslinje

2017-05-19 09:14
Vi får in en första notisen om att sidor är påverkade,
det kännetecknas som ett OCSP-problem. Vi börjar undersöka hur stort
problemet är och vilka som påverkas. Det ser ut att vara begränsat
till Let’s Encrypt. Vi håller koll på servrar som får för mycket
väntande förfrågningar och startar om vid behov.

2017-05-19 09:44
Informationen tillgänglig på nätet säger inte så mycket, men vi får
bekräftat att det är problem med just Let’s Encrypt och vi börjar
följa deras statusuppdateringar. De har ännu inte bekräftat att det är
problem med OCSP.

2017-05-19 10:30
Vi ser flera larm om att det är mer problem än tidigare, det är fler
som hör av sig om att de har problem att surfa till sina sidor.

2017-05-19 13:00
Let’s Encrypt har bekräftat att det är ett problem med deras OCSP-servrar
samt att de arbetat med en lösning ett tag tillbaka.

2017-05-19 14:00
Let’s Encrypt har åtgärdat problemet och det trycks ut till alla deras noder.

2017-05-19 15:38 – 2017-05-20 01:08
Let’s Encrypt övervakar tjänsterna och ser till att alla deras noder blir åtgärdade.