A Facebook kudarca megmutatja, miért nem hagyatkozhatunk rá mindenben

Tartalomjegyzék:

A Facebook kudarca megmutatja, miért nem hagyatkozhatunk rá mindenben
A Facebook kudarca megmutatja, miért nem hagyatkozhatunk rá mindenben
Anonim

A legfontosabb elvitelek

  • A Facebook technikai problémái sajnálatosak voltak, de a probléma valószínűleg sokkal gyorsabban megoldódott volna, ha nem támaszkodik ennyi összekapcsolt rendszerre.
  • Nincs mód a rendszerhibák teljes megelőzésére, de vannak módok arra, hogy csökkentsük azok valószínűségét.
  • Ha van biztonsági mentési terv arra vonatkozóan, hogy mikor (nem ha, mikor) a rendszer meghibásodik, az különbséget tehet a „bosszantó” és a „katasztrófa” között.
Image
Image

A Facebook közelmúltbeli összeomlása megmutatja, hogy az egymással összekapcsolt rendszerek mennyire meghibásodnak, és miért ne használjuk őket mindenre.

A Facebook, a WhatsApp és az Instagram több órára tartó elvesztése hétfőn kényelmetlen volt, kárt okozott a vállalkozásoknak, és bizonyos esetekben szinte katasztrofális volt. A Facebook szerint mindez a hálózatot koordináló útválasztók konfigurációs változásainak köszönhető.

Ez egy ésszerű magyarázat, de az a tény, hogy egy ilyen hiba nem csak a Facebook, hanem más Facebook-tulajdonú rendszerek őrlődését is leállíthatja, kissé riasztó.

Egy hibás router-konfiguráció megváltoztatása miatt több szolgáltatás, sőt a VR headset is teljesen leállt. Ráadásul – a Facebook saját bevallása szerint – a vállalat adatközpontjainak kommunikációjára is lépcsőzetes hatást gyakorolt, és minden szolgáltatásukat leállította.

"Az összekapcsolt rendszerekre való támaszkodás magában hordozza a rendszer vagy akár a szolgáltatás meghibásodásának eredendő kockázatát" - mondta Francesco Altomare, a GlobalDots vezető műszaki értékesítési mérnöke a Lifewire-nek adott e-mail-interjújában, "E ijesztő kockázat leküzdésére a vállalatok az SRE (System Reliability Engineering) elvét, valamint más eszközöket alkalmaznak, amelyek mindegyike a rendszer infrastruktúrájának minden rétegébe beépített redundancia különböző szintjével foglalkozik."

Image
Image

Mi romolhat el

Érdemes megjegyezni, hogy ha egy ilyen rendszer meghibásodik, általában tökéletes viharra van szükség a rossz dolgokra. Ez kevésbé olyan, mint egy kártyavár, amely arra vár, hogy leessen, és inkább olyan, mint egy kis hold méretű űrállomás fedetlen hőelvezető nyílása.

A legtöbb vállalat lépéseket tesz annak biztosítására, hogy az egyetlen dolog, ami mindent káoszba sodorhat, soha ne történjen meg – de ettől függetlenül megtörténhet.

"A váratlan hibák az üzlet részét képezik, és a dolgozók hanyagságából, az internetszolgáltató hálózatának hibáiból vagy akár a felhőalapú tárolási szolgáltatásokból eredhetnek" - mondta Sally Stevens, a FastPeopleSearch társalapítója. e-mail interjú.

"…Amíg megtörténik a rendszer védelméhez szükséges lépések – például biztonsági mentések, helyszíni útválasztó és többszintű hozzáférés – megtörténik, ezek a hibák meglehetősen valószínűtlenek." Bár még egy sereg hibabiztosítóval is előfordulhat, hogy a kulcs meghibásodik.

Ha az olyan dolgokat vezérlő rendszer, mint az elsődleges érintkezési formák, készülékek, ajtók stb., meghibásodik, az eredmények jelentősek lehetnek. Az enyhe kényelmetlenségtől a teljes katasztrofálisig, attól függően, hogy az egyének és a vállalatok mennyire számítanak rájuk.

Image
Image

"Fennáll annak a veszélye is, hogy a hackerek a legkevésbé védett eszközökről, például hűtőszekrényekről és kenyérpirítókról bejutnak a rendszerbe" - tette hozzá Stevens -, ami adatlopáshoz és zsarolóprogramokhoz vezethet."

Hogyan készülhetünk?

Nem garantálható, hogy egy rendszer soha nem fog meghibásodni, de vannak olyan lépések, amelyekkel csökkenthető a meghibásodás valószínűsége, vagy zökkenőmentesen kezelhető a hiba. Ideális lenne a két megközelítés kombinációja, amely ötvözi a hibabiztosítókat és az ellenintézkedéseket készenléti tervekkel és tartalékrendszerekkel.

"A hatékonyan kezelt harmadik felek termékei és szolgáltatásai által okozott veszélyek kiküszöbölése érdekében szigorúan meg kell határozni a harmadik fél kockázatkezelésével kapcsolatos szerepeket és kötelezettségeket" - mondta Daniela Sawyer, a FindPeopleFast alapítója és technológiai igazgatója. egy e-mail interjúban: "Ahhoz, hogy ebben az új környezetben virágozzanak, a kockázatkezelőknek meg kell érteniük egy ilyen kifinomult ökoszisztéma lényeges részeit."

A Facebookkal, a WhatsApp-pal és az Instagrammal történt sajnálatos volt, de remélhetőleg fel is nyitotta a szemet. Az összekapcsolt rendszerekre támaszkodó embereknek meg kell érteniük, hogy a megfelelő dolog, ami rosszul megy, mindent megzavarhat. És intézkedéseket kell bevezetni (vagy alaposan meg kell vizsgálni és finomítani kell), hogy az ilyen zavarok kevésbé valószínűek és kevésbé legyenek hatással.

A Facebook esetében nem a router-problémák okozták a problémát, hanem az, hogy szinte a teljes ökoszisztémája minden máshoz csatlakozik. Így a Facebook (a szolgáltatás) megszűnésével a Facebooknak (a cégnek) sokkal több időt és energiát kellett fordítania a probléma egyszerű megszervezésére és megoldására. Ha nem használna ilyen mélyen gyökerező, összekapcsolt rendszert, vagy ha biztonsági mentési tervei vannak egy ilyen leállás kezelésére, akkor valószínűleg sokkal kevesebb időbe telt volna a javítás.

Ajánlott: