2004'nin temmuz ayiydi. Henuz TR'den tatilden gelmis, birbiri ardina gelen projelere yetismeye calisiyordum. Musterileri etkilememek icin projenin ilk safhasi gunduz, ikinci safhasi ertesi gunun gecesi oluyor bizde. Sabah 5:00-6:00AM gibi biten projeden 10 gun sonra farkedildi ki, server'lardan ikisinin anahtar prozisyonu secure degil. Yani disardan birisi maintenance mode'una girebilir ki, bu da guvenlik acisindan tehlikeli. Yapilmasi gereken sey, uzerindeki anahtari saat yonunde dikey pozisyona getirmek.
Isguzarlik bu ya, o gun sabah "once dedim eve yakin ofise gideyim bu sorunu halledeyim, sonra kendi ofisime giderim". Ise gittim, teknisyenlerden birisi backup'lari aliyor. Proje bitmis ve ilk backup henuz yapiliyor. Birgun onceki haftalik toplantida backup'lardan sorumlu manager'i uyarmistim, backup'lari almayi ihmal etmeyin diye. Neyse ofisteyim anahtari 2 tik'la secure pozisyona getirecegim ya, once sundan basliyim diye makinalardan birini gozume kestirdim. Gittim, cevirdim anahtari sonra iceriye geldim, o sirada bizim teknisyen dedi ki "ben de backup'i o senin anahtari cevirdigin makina baslattim". "Tamam iyi ben anahtari guvenli konuma getirdim sadece" dedim. Sonra diger makinaya gittim onu da cevirdim iceriye geldim, cantami alip cikacagim. Is bu kadar basit aslinda. Ama o da ne... Anthony dedi ki, "backup window kayboldu", gittik baktik ki meger 2 makinayi da ben secure mode'a getireyim derken shutdown etmisim. Aman Allah'im dunya basima yikildi ama icimden pozitif bir ses, "tamam en kotu ihtimal simdi reboot olur, makina ayaga kalkar" diye de kendime telkin ediyorum.
Makinalari simdi secure mode'a getirdim ama birisi reboot olmuyor, cunku gracefully shutdown olmadigindan uzerindeki data corrupt olmus. Simdi bu durumun Turkcesi soyle, makina incelikle kapatilmadigi icin database ve isletim sisteminde halihazirda memory ve cache'de olan transaction'lar disk'e yazilamamis (pek Turkce olmadi ama her terimin Turkcesini bulmak zor). Eee ne olacak, Motorola'ya haber verdik hemen. Malum kendileri bizim vendor'imiz olup aramizdaki anlasmaya gore sorunu cozmeleri lazim.
Adamlarin ilk sorduklari "upgrade'den sonra backup aldiniz mi". "Bugun ben tam da o makinayi backupliyordum ama bu gorunmez kaza oldu kem kum....". Bu Anthony'nin cevabi.
Bridge'ler acildi, conference call'lar devam ediyor Tanrim bu makina bir turlu ayaga kalkmiyor. Kendimi acayip suclu hissediyorum. Yemeden icmeden kesildim, napacagimi bilmiyorum. Eve gidiyorum call'dayim, gece uyuyacagim hala devam ediyor bridge. Sabah kalkiyorum durum bilgisi almak icin, elim varmaya varmaya telefonu ceviriyorum, iiihhh hala kotu durumdayiz. Ve 3. gunun sonunda makina ayaga kalkti, ustundeki data, binbir turlu takla atilarak kurtarildi. Tabii 3 gun boyunca islemesi gereken workorder'lar, process'ler, datafill'ler durdu, diger gruplar kizgin ne zaman bu alet calismaya baslayacak diye sorup duruyor. Yani 3 gun boyunca dunya benim icin ters dondu, gittim geldim, dersimi aldim.....
Simdi ne zaman keyswitch cevrilecek olsa binbir dikkat, gozlerimi acip, elime resimleri alip, tek tek ne kadar hangi yone cevirecegimi sayip yapiyorum. Bu aletler bu kadar hassas yani. Ya da ben hardware konusunda o kadar tedirginim.
Minik bir anahtarin basima actigi dert sonucunda bazi prosedurlerimizi gozden gecirip, diger gruplari da uyardik backup'lari proje ertesinde hemen almalari konsunda filan. Ama dersini almayan, ya da isini ciddiye almayan ya da yapma dedigin zamanda ustuste backup alan arkadaslar hala mevcut. Dun de -yine proje ortasindayim da, hem de hemen Almanya seyahati sonrasi- backup alinmamasi gerekirken (ozellikle belirtilmesine ragmen) teknisyen arkadas database backup'i alinca bir tam gun boyunca makinaya yuklenen tum yeni data silinip bizi sabah 8'den aksam 7'ye kadar bu sorunu cozmek icin telefona ve bilgisayara bagladi. En sonunda sorun cozuldu, olan benim hesapta bos kalacagini umdugum gune oldu :(
Siz siz olun backup'siz kalmayin, data'nizi yedekleyin. Bilmedigiz anahtarlari da kurcalamayin.
Hiç yorum yok:
Yorum Gönder