Basamaklı başarısızlık - Cascading failure

Tek bir arızanın ağ genelinde başka arızalara nasıl yol açabileceğini gösteren bir animasyon.

Bir basamaklı başarısızlık bir sistemde bir süreçtir birbirine bir veya birkaç parçadan başarısızlığı vb diğer parçaların başarısızlığı tetikleyen ve hangi parçaların. Böyle bir arıza, güç iletimi, bilgisayar ağları, finans, ulaşım sistemleri, organizmalar, insan vücudu ve ekosistemler dahil olmak üzere birçok sistem türünde meydana gelebilir.

Sistemin bir parçası arızalandığında basamaklı arızalar meydana gelebilir. Bu olduğunda, diğer parçalar arızalı bileşeni telafi etmelidir. Bu da bu düğümleri aşırı yükleyerek onların da başarısız olmasına neden olarak ek düğümlerin birbiri ardına başarısız olmasına neden olur.

Güç aktarımında

Güç şebekelerinde elemanlardan biri (tamamen veya kısmen) arızalandığında ve yükünü sistemdeki yakındaki elemanlara kaydırdığında kademeli arıza yaygındır . Bu yakındaki elemanlar daha sonra kapasitelerinin ötesine itilir, böylece aşırı yüklenirler ve yüklerini diğer elemanlara kaydırırlar. Kademeli arıza, tam yüklü veya hafif aşırı yüklenmiş bir sistemdeki tek bir arıza noktasının (SPF) sistemin tüm düğümlerinde ani bir artışa neden olduğu yüksek voltajlı sistemlerde görülen yaygın bir etkidir . Bu aşırı akım, zaten aşırı yüklenmiş düğümleri arızaya sevk edebilir, daha fazla aşırı yüklenmeye neden olabilir ve böylece tüm sistemi çok kısa sürede çökertebilir.

Bu başarısızlık süreci, bir havuzdaki bir dalgalanma gibi sistemin elemanları arasında kademeli olarak ilerler ve esas olarak sistemdeki tüm elemanlar tehlikeye girene ve/veya sistem, yük kaynağından işlevsel olarak ayrılana kadar devam eder. Örneğin, belirli koşullar altında, tek bir transformatörün arızalanmasından sonra büyük bir elektrik şebekesi çökebilir.

Bir sistemin çalışmasının gerçek zamanlı olarak izlenmesi ve parçaların makul bir şekilde ayrılması, bir kaskadın durdurulmasına yardımcı olabilir. Diğer bir yaygın teknik, olası arızaların bilgisayar simülasyonu yoluyla sistem için bir güvenlik marjı hesaplamak, altında hesaplanan senaryoların hiçbirinin kademeli arızaya neden olmayacağının tahmin edildiği güvenli çalışma seviyeleri oluşturmak ve ağın en olası parçalarını belirlemektir. basamaklı arızalara neden olur.

Elektrik şebekesi arızalarının önlenmesiyle ilgili birincil sorunlardan biri, kontrol sinyalinin hızının yayılan güç aşırı yükünün hızından daha hızlı olmamasıdır, yani hem kontrol sinyali hem de elektrik gücü aynı hızda hareket ettiğinden, elemanı izole etmek için önceden bir uyarı göndererek kesintiyi izole etmek mümkündür.

Elektrik şebekesi arızalarının ilişkili olup olmadığı sorusu Daqing Li ve ark. yanı sıra Paul DH Hines ve ark.

Örnekler

Basamaklı arıza aşağıdaki elektrik kesintilerine neden oldu :

bilgisayar ağlarında

Bilgisayar ağlarında ( İnternet gibi ), donanım veya yazılımın arızalanması veya bağlantısının kesilmesi nedeniyle ağ trafiğinin ciddi şekilde bozulduğu veya ağın büyük bölümleri arasında veya bunlar arasında durdurulduğu bilgisayar ağlarında da kademeli arızalar meydana gelebilir . Bu bağlamda, basamaklı yetmezliği terimi ile bilinen kademeli yetmezliği . Bir kademeli arıza, büyük insan gruplarını ve sistemleri etkileyebilir.

Kademeli arızanın nedeni genellikle tek, çok önemli bir yönlendiricinin veya düğümün aşırı yüklenmesidir ve bu da düğümün kısa bir süreliğine bile olsa çökmesine neden olur. Ayrıca, bakım veya yükseltmeler için bir düğümün devre dışı bırakılmasından da kaynaklanabilir. Her iki durumda da, trafik edilir yönlendirilmiş veya başka (alternatif) yolundan. Sonuç olarak, bu alternatif yol aşırı yüklenerek aşağı inmesine neden olur vb. Ayrıca, düzenli çalışma için düğüme bağlı olan sistemleri de etkileyecektir.

Belirtiler

Kademeli bir arızanın belirtileri şunları içerir: paket kaybı ve yüksek ağ gecikmesi , yalnızca tek sistemler için değil, bir ağın veya internetin tüm bölümleri için. Yüksek gecikme süresi ve paket kaybı, tıkanıklık çökmesi nedeniyle çalışamayan düğümlerden kaynaklanır, bu da düğümlerin ağda hala var olmalarına, ancak aralarından çok fazla veya herhangi bir yararlı iletişim geçmemesine neden olur. Sonuç olarak, yollar aslında iletişim sağlamadan hala geçerli olarak kabul edilebilir.

Kademeli bir arıza nedeniyle yeterli sayıda rota kesilirse, ağın veya internetin tam bir bölümüne erişilemez hale gelebilir. İstenmemesine rağmen, bağlantılar zaman aşımına uğrayacağından ve diğer düğümler, kesilen bölüm(ler)le bağlantı kurmaya çalışmaktan vazgeçerek ilgili düğümlerdeki yükü azaltacağından, bu hatadan kurtulmanın hızlandırılmasına yardımcı olabilir.

Bir kademeli arıza sırasında yaygın bir durum , bölümlerin aşağı indiği ve bir sonraki bölümün başarısız olmasına neden olduğu ve ardından ilk bölümün geri geldiği bir yürüme arızasıdır . Bu dalgalanma , kararlılık geri yüklenmeden önce aynı bölümlerden veya bağlantı düğümlerinden birkaç geçiş yapabilir.

Tarih

Kademeli arızalar, trafikteki büyük artış ve sistemler ile ağlar arasındaki yüksek ara bağlantı ile nispeten yeni bir gelişmedir. Terim bu bağlamda ilk kez 1990'ların sonlarında Hollandalı bir BT uzmanı tarafından uygulandı ve yavaş yavaş bu tür büyük ölçekli başarısızlıklar için nispeten yaygın bir terim haline geldi.

Örnek

Ağ hataları genellikle tek bir ağ düğümü başarısız olduğunda başlar. Başlangıçta, normalde düğümden geçecek olan trafik durdurulur. Sistemler ve kullanıcılar, ana bilgisayarlara ulaşamama konusunda hatalar alıyor. Genellikle, bir ISP'nin yedekli sistemleri, farklı bir omurga üzerinden başka bir yol seçerek çok hızlı yanıt verir. Bu alternatif rotadan geçen rota daha uzundur, daha fazla atlama ve ardından normalde aniden sunulan trafik miktarını işlemeyen daha fazla sistemden geçer.

Bu, alternatif rota boyunca bir veya daha fazla sistemin çökmesine ve kendi benzer problemlerini yaratmasına neden olabilir.

Bu durumda ilgili sistemler de etkilenir. Örnek olarak, DNS çözümlemesi başarısız olabilir ve normalde sistemlerin birbirine bağlanmasına neden olan şey, çöken gerçek sistemlere doğrudan dahil olmayan bağlantıları bile bozabilir. Bu da, görünüşte alakasız düğümlerin, kendi başına başka bir kademeli başarısızlığa neden olabilecek sorunlar geliştirmesine neden olabilir.

Aralık 2012'de, Gmail hizmetinde küresel olarak 18 dakika boyunca kısmi bir kayıp (%40) meydana geldi. Bu hizmet kaybına, hatalı mantık içeren yük dengeleme yazılımının rutin bir güncellemesi neden oldu - bu durumda hata, mantığın daha uygun "bazıları" yerine uygun olmayan "tümü" kullanmasından kaynaklanıyordu. Basamaklı hata, tüm düğümleri bir kerede kısmen güncellemek yerine ağdaki tek bir düğümü tamamen güncelleyerek düzeltildi.

Kademeli yapısal başarısızlık

Ayrı yapısal bileşenlere sahip belirli yük taşıyan yapılar, tek bir yapısal elemanın arızalanmasının bitişik elemanlar üzerindeki yükü arttırdığı "fermuar etkisine" tabi olabilir. Durumunda Regency geçit çökmesi tek bir dikey süspansiyon kolu başarısız olduğunda, (daha önce inşaat nedeniyle bir hata overstressed edilmiştir) bir asma geçit sırayla başarısız komşu çubuklar (yani bir gibi aşırı yükleme, başarısız fermuar ). Böyle bir başarısızlığa sahip olabilen bir köprüye kritik kırılma denir ve tek bir parçanın başarısızlığından çok sayıda köprü çökmesine neden olmuştur. Düzgün tasarlanmış yapılar , bu tür mekanik kademeli arızayı önlemek için yeterli bir güvenlik faktörü ve/veya alternatif yük yolları kullanır.

Diğer örnekler

Biyoloji

Biyolojide, küçük bir reaksiyonun sistem çapında etkileri olabileceği biyokimyasal basamaklar vardır. Bir negatif örnek iskemik kaskad küçük olan, iskemik atak bültenleri toksinler daha toksinler ile sonuçlanan başlangıç hasar çok daha fazla hücrelerini yok serbest bırakılır. Mevcut araştırmalar, hasarı en aza indirmek için inme hastalarında bu çağlayanı engellemenin bir yolunu bulmaktır .

Nesli tükenme araştırmasında, bazen bir türün neslinin tükenmesi, diğer birçok neslin tükenmesine neden olur. Böyle bir tür, kilit taşı türü olarak bilinir .

Elektronik

Başka bir örnek, başarısız bir diyotun tüm diyotların bir saniyenin çok kısa bir sürede arızalanmasına neden olabileceği kademeli arızalar da yaşayabilen Cockcroft-Walton jeneratörüdür .

Oysa bilimsel deneyde bu etkinin başka örneğiydi implosion kullanılan birkaç bin kırılgan cam fotoçoklayıcı tup 2001 yılında Super-Kamiokande ait patlamadan tetiklemiş için tek dedektör arızası nedeniyle şok dalgası görünür deneyde, zincirleme reaksiyondaki diğer dedektörler.

finans

In finans , finansal kurumların başarısızlıkları basamaklı riski olarak adlandırılır sistemik riskin : diğer mali kurumlar (onun neden olabilir tek finans kurumunun başarısızlık karşıtarafın sistem boyunca basamaklı) başarısız. Sistemik risk oluşturduğuna inanılan kurumlar , neden tehdit oluşturduklarına bağlı olarak ya " başarısız olmak için çok büyük " (TBTF) ya da "başarısız olmak için çok birbirine bağlı" (TICTF) olarak kabul edilir.

Bununla birlikte, sistemik riskin tek tek kurumlardan değil, ara bağlantılardan kaynaklandığını unutmayın. Araştırma literatüründe basamaklı arızaların etkilerini incelemek ve tahmin etmek için çerçeveler geliştirilmiştir. Politika yapıcılar ve makroihtiyati dinamik stresi test etmek için yararlı araçlar sağlayan ağ teorisine ve basamaklı arızalara dayalı bir çerçeve geliştirilmiştir.

Finansta ilgili (farklı olsa da) bir tür basamaklı başarısızlık, 2010 Flash Crash tarafından örneklenen borsada meydana gelir .

Birbirine bağlı basamaklı hatalar

Şekil 1: Farklı altyapılar arasındaki karşılıklı bağımlı ilişkinin gösterimi
Şekil 2. Birinci ve ikinci dereceden süzülme geçişlerinin şematik gösterimi. İkinci dereceden durumda, dev bileşen, p = süzülme eşiğinde sürekli olarak sıfıra yaklaşmaktadır . Birinci mertebeden durumda, dev bileşen süreksiz olarak sıfıra yaklaşır.

Çeşitli altyapı gibi su tedarik , taşıma , yakıt ve enerji santralleri birbirine bağlanmış ve işleyişi için birbirlerine bağlıdırlar, bu bağlantı için Şek. 1. sayesinde bkz birbirine ağlar rastgele hataları, son derece hassas olan ve özellikle de hedef saldırılar , öyle ki, bir ağdaki düğümlerin küçük bir bölümünün arızalanması, birbirine bağlı birkaç ağda yinelemeli bir arıza dizisini tetikleyebilir. Elektrik kesintileri sıklıkla birbirine bağlı ağlar arasındaki bir dizi arızadan kaynaklanır ve sorun, son yıllarda meydana gelen birkaç büyük ölçekli elektrik kesintisi ile çarpıcı bir şekilde örneklenmiştir. Kesintiler, ağlar arasındaki bağımlılıkların oynadığı önemli rolün büyüleyici bir göstergesidir. Örneğin, 2003 İtalya elektrik kesintisi , demiryolu ağının , sağlık sistemlerinin ve finansal hizmetlerin yaygın bir şekilde başarısız olmasına neden oldu ve buna ek olarak, telekomünikasyon ağlarını ciddi şekilde etkiledi . İletişim sisteminin kısmi arızası, elektrik şebekesi yönetim sistemini daha da bozarak, elektrik şebekesi üzerinde olumlu bir geri bildirim üretti. Bu örnek, karşılıklı bağımlılığın, etkileşimli bir ağ sistemindeki hasarı nasıl önemli ölçüde büyütebileceğini vurgulamaktadır. Sızma teorisine dayalı birleştirilmiş ağlar arasındaki basamaklı arızaları incelemek için bir çerçeve yakın zamanda geliştirilmiştir. Şebeke kesintisinin sürekli olduğu tek bir ağdaki sızma ile karşılaştırıldığında, basamaklı arızalar ani çökmeye neden olabilir, bkz. Şekil 2. Mekansal olarak gömülü sistemlerde basamaklı arızaların aşırı güvenlik açığına yol açtığı gösterilmiştir. Basamaklı arızaların dinamik süreci için bkz. Di Muro ve diğerleri tarafından basamaklı arızalardan kaçınmak için arızaları onarmak için bir model geliştirilmiştir.

Ayrıca, bu tür birbirine bağlı sistemlerin, uzaya gömülü olduklarında, yerel saldırılara veya arızalara karşı son derece savunmasız olduğu gösterilmiştir. Kritik bir hasar yarıçapının üzerinde, arıza tüm sisteme yayılabilir.

Yerelleştirilmiş saldırıların topluluk yapısına sahip uzamsal çoğul ağlara yayılmasındaki ardışık başarısızlıklar Vaknin ve diğerleri tarafından incelenmiştir. Birbirine bağlı ağlardaki basamaklı arızaların evrensel özellikleri Duan ve ark. Smolyak ve diğerleri tarafından yerelleştirilmiş bilgiler kullanılarak ağlarda kademeli arızaları azaltmak için bir yöntem geliştirilmiştir.

Karmaşık ağlardaki basamaklı arızalar hakkında kapsamlı bir inceleme için bkz. Valdez ve ark.

Aşırı yükleme basamaklı arızalar için model

Motter-Lai modeli, aşırı yük yayılımından kaynaklanan ardışık arızalar için bir modeldir. Bu tür başarısızlıkların zamansal-mekansal yayılımı Jichang Zhao ve diğerleri tarafından incelenmiştir.

Ayrıca bakınız

Referanslar

daha fazla okuma

Dış bağlantılar