mboost-dp1
Shutterstock
- Forside
- ⟨
- Forum
- ⟨
- Nyheder
De har offentliggjordt så meget som de nok vil gøre.
https://www.fastly.com/blog/summary-of-june-8-outa...
https://www.fastly.com/blog/summary-of-june-8-outa...
What happened?
On May 12, we began a software deployment that introduced a bug that could be triggered by a specific customer configuration under specific circumstances.
Early June 8, a customer pushed a valid configuration change that included the specific circumstances that triggered the bug, which caused 85% of our network to return errors.
Here’s a timeline of the day’s activity (all times are in UTC):
09:47 Initial onset of global disruption
09:48 Global disruption identified by Fastly monitoring
09:58 Status post is published
10:27 Fastly Engineering identified the customer configuration
10:36 Impacted services began to recover
11:00 Majority of services recovered
12:35 Incident mitigated
12:44 Status post resolved
17:25 Bug fix deployment began
Once the immediate effects were mitigated, we turned our attention to fixing the bug and communicating with our customers. We created a permanent fix for the bug and began deploying it at 17:25.
#3
Ja.
Men det er ikke helt nemt at gardere sig mod.
Chef til udviklere: I må ikke lave fejl
Udviklere tænker: idiot - tror han at vi laver fejl med vilje
Chef til testere: I skal sikre jer at intet input kan ligge systemet ned
Testere til chef: umuligt - der er et uendeligt antal forkerte input og det vil tage uendeligt tid at teste dem alle
Chef til udviklere: jeg ønsker alle kritiske kode ændringer reviewet af 2 uafhængige teams, hvis der er 80% change for at sådanne fejl bliver fundet af et review så vil 2 reviews finde 96%
Udviklere: det er nok nødvendigt men suk
Chef til udviklere: vi køber dette her avancerede statiske kode analyse værktøj og vi forventer at det vil fange 95% af sådanne fejl
Udviklere til chef: OK
Ja.
Men det er ikke helt nemt at gardere sig mod.
Chef til udviklere: I må ikke lave fejl
Udviklere tænker: idiot - tror han at vi laver fejl med vilje
Chef til testere: I skal sikre jer at intet input kan ligge systemet ned
Testere til chef: umuligt - der er et uendeligt antal forkerte input og det vil tage uendeligt tid at teste dem alle
Chef til udviklere: jeg ønsker alle kritiske kode ændringer reviewet af 2 uafhængige teams, hvis der er 80% change for at sådanne fejl bliver fundet af et review så vil 2 reviews finde 96%
Udviklere: det er nok nødvendigt men suk
Chef til udviklere: vi køber dette her avancerede statiske kode analyse værktøj og vi forventer at det vil fange 95% af sådanne fejl
Udviklere til chef: OK
On May 12, we began a software deployment that introduced a bug that could be triggered by a specific customer configuration under specific circumstances.
Early June 8, a customer pushed a valid configuration change that included the specific circumstances that triggered the bug, which caused 85% of our network to return errors.
Det lyder jo næsten som om de var bevidst om der var et hul...
CSR CI kontrol siger jo intet om bugs en bruger kan introducere - kun om man overholder en kodestandard. Og hvis de 2 teams så endelig laver manuelt review, har de formenligt ikke forudsætninger for at forstå præcis hvad der skal foregå, og hvad deres change request har rødder i.
Men igen, lur mig om ikke det har været en fejl der været virkelig uheldig ikke at spotte.
En logisk fejl i noget kode som ellers lever op til alle kvalitetscheck, og som kun viser sig i under særlige omstændigheder/konfigurationer, er nok blandt de sværeste typer af fejl at gardere sig imod. Det kunne være flere komponenter der hver især opfører sig som planlagt, men som tilsammen ender med at gøre noget utilsigtet pga. en fejl i systemdesignet.
Jeg er ikke overrasket over at problemet var i denne kategori. Tvivler stærkt på at de allerede var bekendt med det.
Jeg er ikke overrasket over at problemet var i denne kategori. Tvivler stærkt på at de allerede var bekendt med det.
Opret dig som bruger i dag
Det er gratis, og du binder dig ikke til noget.
Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.