Prečo je testovanie katastrofického scenára mimo výroby nevyhnutné pre bezpečnosť kritickej infraštruktúry

Bezprecedentný výpadok FAA, ktorý viedol k zastaveniu všetkých vnútroštátnych letov, si každý kladie otázky:

Ako sa to stalo?

Kto je zodpovedný?

Ako zabránime tomu, aby sa niečo podobné zopakovalo?

Tento výpadok nás upozornil a zdôraznil, že aj systémy, ktoré považujeme za najbezpečnejšie, najdôveryhodnejšie a overené, môžu zlyhať.

Zatiaľ čo tento typ výpadku, ktorý dosahuje úroveň povedomia verejnosti, je zriedkavý, ak k nemu dôjde v životne kritickom systéme, môže to viesť k lavíne katastrofálnych následkov ovplyvňujúcich bezpečnosť, ochranu a ekonomiku. Vidíme to teraz s prerušením dopravy a následkami preťaženia webových/aplikačných služieb zaplavených tisíckami cestujúcich, ktorí sa snažia dostať do svojich destinácií.

Zatiaľ čo dnešný výpadok FAA sa považuje za zlyhanie systému, bolo to elegantné zlyhanie degradácie. To znamená, že našťastie nedošlo k žiadnym úmrtiam v dôsledku zlyhania a systém sa efektívne vypol skôr, ako došlo k väčšiemu poškodeniu.

To je šťastné, ale nie povzbudzujúce.

Testovanie sa vo výrobe vždy využívalo na zisťovanie defektov – simulácia porúch bola napríklad metódou umelého „rozbitia“ zariadenia, aby sa zistilo, či diagnostické testy odhalia a izolujú zlyhania až po ich základné príčiny. Pri navrhovaní softvéru sa inžinieri učia navrhovať podľa špecifikácie toho, čo by mal funkčne robiť. Oveľa menej úsilia sa vynaložilo na hľadanie katastrofických scenárov alebo „dokonalej búrky“ podmienok, ktoré musia nastať a ktoré vedú k zlyhaniu systému. Predvídanie týchto podmienok nám môže pomôcť s proaktívnym budovaním mechanizmov na proaktívne zisťovanie a prevenciu katastrofického zlyhania.

Predchádzanie budúcim výpadkom a iným kritickým zlyhaniam infraštruktúry

S rozšírením cloud computingu a riešení umelej inteligencie máme teraz dostatočne efektívny výpočtový výkon na vyhodnotenie miliónov prevádzkových scenárov, aby sme zistili, aké prípady môžu vyústiť do katastrofických scenárov.

Pre FAA by teraz malo byť možné proaktívne analyzovať podmienky a údaje zo všetkých domácich letísk, lietadiel na oblohe a na zemi, ako aj tých, ktoré sú plánované na budúce použitie, komunikácie riadiacej veže a súvisiacej infraštruktúry, cestujúcich, počasia, a bezpečnosť na hranie scenárov, ktoré môžu viesť k zlyhaniu systému.

Ak vezmeme do úvahy zložitosť interakcií a vzájomných závislostí tohto systému, je jasné, že pohľad na všetky body zlyhania je skľučujúci.

Umelá inteligencia môže pomôcť analyzovať toto obrovské množstvo údajov a proaktívne hľadať vzorce a správanie, ktoré by mohli predstavovať výzvy pre systémy FAA.

Nie je to bezprecedentné, pretože umelá inteligencia bola využitá na lepšie preskúmanie vzorcov premávky pre optimalizované plánovanie a logistiku.

Táto technológia môže byť tiež nasadená ako výkonný obranný mechanizmus na zabezpečenie včasnej detekcie kybernetických útokov a/alebo abnormálneho správania v systémoch. Kľúčom k efektívnemu nasadeniu takýchto systémov bude izolácia týchto špecifických odľahlých hodnôt a podmienok, aby ich mohli preveriť odborníci.

Z výpadku FAA sa treba poučiť a časom budeme mať jasnejší obraz o tom, čo sa stalo. Nateraz je však zrejmé, že nové technológie, ako je umelá inteligencia, ktoré umožňujú proaktívne zisťovanie systémových zlyhaní a iných problémov, ktoré môžu nastať, zohrávajú významnú úlohu pri udržiavaní našej kritickej infraštruktúry.

Zdroj: https://www.forbes.com/sites/karenpanetta/2023/01/11/the-perfect-storm-of-the-faa-outage-why-catastrophic-scenario-testing-beyond-manufacturing-is- nevyhnutné-pre-bezpečnosť-kritickej-infraštruktúry/