Yorumları:4.308
Konuları:585
Kayıt Tarihi:11-01-2020
Merhabalar, durum üzerinden uzun süre geçti ancak son durum hakkında tam bilgi vermedik. Son durum şu şekildedir,
Ana kartı yenisi ile değişmemize rağmen cihaz üzerinde +10 defa ilk süreçte anlam verilemeyen hatalar ile karşılaştık bunlar belli sürede bir kendini restartlama ve benzer sorunlardı. Cihaz üzerinde çok yüklü bir donanım olmasından ötürü riske atmayarak yedek olarak beklettiğimiz diğer cihazlarımızı up konuma getirerek sorunlu G8 deki tüm alt sanal sunucu ve hizmetleri bir gece kimse fark etmeden özel yapımız ile sorunlu cihazın disklerinden yedek sunuculara klonlarla ilettik. Sorunların düzelmesinin sebebi yedek sunucuları up konuma getirip tüm hizmetleri onlara taşımamızdan ötürü çözümlenmişti. Taşıma sonrasındaki gün ana kartını değiştirdiğimiz G8 cihazı verimerkezinden aldırıp detaylı inceleme ve tamir için sektörde bilinen tamirci ile anlaştık. Sorunları detaylı bakıma soktuğumuz zaman anlamaya başladık. Cihaz üzerinde bulunan fanların 3 tanesi hatalı çalıştığı için ram ve işlemcilerin ısısı 120° ulaştığını tespit ettik ve cihaz koruma moduna girerek sunucuya durmadan restart atmaya başladığını fark ettik tahminimizde ilk ana kartın yanması bu restartları fark ettiğimiz gibi acil olarak bakım talebimizden oluştu. Cihazda ilk sorunu fark edince bakım içinden kabinden çıkartıp verimerkezi tarafından ard arda bir den fazla kez güç verilip kesildiği için ilk ana kartın yandığını düşünüyoruz. Hatalı olan 3 fanın yeni fanlar ile değiştirdik ve raid kart üzerinde bulunan özel pildede bir sorun olduğunu fark ettik bu şuan için sorun oluşturacak bir durum değildi ancak bu durumdan ötürü yeni özel pil alınıp raid kart üzerindede değişim sağlandı. Cihazı verimerkezindeki kabinlere götürüp aktif etmeden önce cihazı zorlamak için cihazı 4 gündür aktif olarak sınıyoruz bu sınama cihazı yorarak sıcaklık değerlerini incelemek içindir ortalama +350GB aktif ram kullanımı ve 2697v2x2 işlemcilerin %100 bir çalışma ile tam enerji tüketim modunda testler gerçekleştirdik. 4 Gündür bir sorun oluşmadı ve cihazı ILO ve fiziksel olarak 7/24 takibe aldık ve şuandada hiç bir arzasının kalmadığını görüyoruz. 48 Saat içersinde cihazı tekrar verimerkezi üzerinde up konuma getirip yedek sunucuları tekrar G8 cihazına aktarmayı planlıyoruz altını çizerek demek isteriz tüm hizmetlerimiz tek cihazda değildir ilk ana kart yanması mevzusundan etkilenen sayılı hizmetlerimiz G8 cihazı üzerinde olduğu için etkilendi. Süreci en şeffaf şekilde sizlere bildirmek istedim. Sorunun tekrar yaşanmaması için verimerkezi üzerindeki diğer cihazlarımızada yatırım yaparak olası durumlarda direkt yedekli sunuculara taşımalar ile kısa sürelerde aktif etmek için planlar oluşturduk ve tekrar durumun yaşanmaması için sırasıyla tüm cihazlarımızda kontroller gerçekleştirdik.
MawiŞ*