Forum
Merhaba;
Bir süredir misafir olarak takip ettiğim forumu bu kez üye olarak ve bir problemime yardımcı olmanız dileğiyle takip etmek istiyorum.
Kasım 2015 'te satın alıp kurulumunu yaptığımız Windows 2012 sunucumuz belirli bir şarta bağlı olmaksızın ve rastgele zamanlarda kendiliğinden reboot ediyor. Sunucu HP Proliant Gen9 ML350 Server. Windows 2012 R2 Standart,Datacenter Edition 64 bit. Ayrıca sistemde MS SQL 2014 Server kurulu. ERP olarak Promaks adı verilen (32 bit) yazılım çalışıyor. DNS Server, Active Directory yapısı kurulu. Bağlı kullanıcı sayısı 6. Remote Desktop yapan kullanıcı sayısı maksimum 3. IIS Server aktif. ASP ile çalışan birkaç kuruma özel sayfa var. Stok sorgulamsı dışında yoğun bir işlem yapma durumu olmuyor.
Yüklü Bellek kapasitesi 32 GB. (16 GB Kingston ram ilave olarak sunucu ilk satın alınırken beraberinde yüklendi.)
Sunucunun bulunduğu odada daha önce IBM X3200 Type sunucu üstelik klima çalışmamasına rağmen yıllarca sorunsuz çalışmasına rağmen HP Gen9'un aynı şartlarda reboot etmesi üzerine önce sunucu kabininin ön ve yan kapaklarını sonra da sunucu makinenin yan kapağını sökmeme rağmen hala reboot etmeye devam ediyor. Sözgelimi Cumartesi günü (16-04-2016) 2 kez Pazar günü (17-04-2016) 1 kez reboot etti. Öncesinde geçen hafta reboot etmişti. Belirli bir zamanı olmaması sorunu tesbit etmemde sıkıntı çıkartıyor. Ben öncelikle ısınma probleminin bu soruna yol açtığını düşünüyordum ama reset zamanları sıcaklığın arttığı öğle saatleri değil de akşam saatleri de olabiliyor. Orası tuhaflaştırıyor problemi.
Konuyla ilgili yerli-yabancı bir çok sayfayı gezdim ama net bir çözüm bulamadım.
HP Destek merkezinden aldığım destekte HP Diagnostics Tool logunu kendilerine göndermeme rağmen donanım kaynaklı bir sorun göremediklerini sadece Firmware Update yapmam gerektiğini belirttiler. Bu da bana garip geliyor. FW update etmedim henüz. Ancak FW update i yapmış olanların da hala benzer problemle karşılaştıklarını okudum. İşin ilginç tarafı FW update DVD'si kendi makinemde (HP Notebook) boot edebiliyorken Server'da ısrarla DVD'den boot edemiyor. Bu da ayrı bir nokta.Belki DVD iso dosyasını yazmamla alakalı bir durum olabilir.
RAM ile ilgili bir kuşkum daha var. Task Manager kısmından Bellek kullanım oranı %94.4 düzeyinde gösteriyor ki eski sunucu Windows 2003,SQL 2000 iken 3 GB ram ile bu problemi yaşamıyordum. SQL 2014+Win 2012 yüksek ram kullanım problemi mi doğuruyor?
Bu konuda ekte bellek,CPU kullanım oranlarını görebilirsiniz. Yine tuhaf bir şekilde gece 02 sularında bellek kullanım oranı %17 iken sabah saatlerine doğru yaptığım bazı test programları sayesinde bu oranına yavaş yavaş %30-%56 ve en sonunda %95 seviyesine çıktığını görebildim.
RAMMAP uygulamasını çalıştırdığımda ortaya çıkan görüntüyü de paylaştım. RAMMAP64.exe uygulaması ilk çalıştığında Task Manager'de 200 MB ram kullanırken sonra biranda 976 MB ram kullanım değerine yükseliyor. Acaba Win 2012 uygulamaları 3-4 kat fazlasıyla mı çarpıp gösteriyor?
OpenHardwareMonitor uygulamasıyla online olarak verilerini gözlemeye çalışıyorum. CPU package değerleri 35-45 santigrat derece arasında seyrediyor.
Server kasa kapağını açtıktan sonra USB den çalışan masaüstü pervanesiyle CPU+Board kısmına hava akımı sağlamaya bie çalıştım. Ama yine de faydalı olduğu söylenemez.
windows Memory Diagnostics tool ile bellekleri test ettim. Yaklaşık 1.5 saat test sonucunda makine loglarında Bellek Hatası Bulunamadı mesajını da gördüm.
Gelelim Olay Görüntüleyicisine. Sistem reboot ettiğinde Sistem loglarında Kernel-Power Olay Kimliği 41 numaralı hata mesajında
"Sistem düzgün kapatılmadan yeniden başlatılmış. Bu hatanın nedeni sistemin yanıt vermeyi durdurması, kilitlenmesi veya beklenmeyen bir şekilde güç kaybına uğramış olması olabilir."
<Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331C3B3A-2005-44C2-AC5E-77220C37D6B4}" />
<EventID>41</EventID>
<Version>3</Version>
<Level>1</Level>
<Task>63</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000002</Keywords>
<TimeCreated SystemTime="2016-04-17T16:10:09.022370500Z" />
<EventRecordID>3094391</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="8" />
<Channel>System</Channel>
<Computer>tokasrv02.TOKAGUNLAL.LOCAL</Computer>
<Security UserID="S-1-5-18" />
</System>
- <EventData>
<Data Name="BugcheckCode">0</Data>
<Data Name="BugcheckParameter1">0x0</Data>
<Data Name="BugcheckParameter2">0x0</Data>
<Data Name="BugcheckParameter3">0x0</Data>
<Data Name="BugcheckParameter4">0x0</Data>
<Data Name="SleepInProgress">0</Data>
<Data Name="PowerButtonTimestamp">0</Data>
<Data Name="BootAppStatus">0</Data>
</EventData>
Görüldüğü gibi Bugcheck Code ve PowerButton kodları 0. Bir açıklama da yok.
Technet ve Microsoft sitelerinde gezinmeme rağmen olayın işletim sistemiyle bir bağlantısını bulabilecek bir şey de göremedim. Geriye bir Clean Boot kaldı ki onu da yapsam bile gündüz herkes çalışırken yapamam.Çünkü Promax ve SQL çalışmazsa millet boş oturacak.
Gece yapsam bu işi reboot edeceği zamanı veya ortamı bilemediğim için bir anlam ifade etmeyecek.
Şu an sfc /scannow işlemini de yapıyorum ki yapmadığım birşey kalmamış olsun.
Task Manager Genel Görünümü şu şekilde:
CPU Genel Görünüm şu şekilde:
RAM Genel Görünüm Şu Şekilde:
Konuyla ilgili istediğiniz daha detaylı ve ayrıntılı görüntüler olursa paylaşabilirim de. Donanım sorunu mu yazılım sorunu mu anlayamadım.
Bellek kullanımının bu kadar yüksek olması virüs vb uygulama olabilir diyebilirsiniz. Exchange kurulu değil, Ofis kurulu değil, Mail Client yok, Mail alan bir makine değil bu. USB disklerle bulaşabilen bir virüs olsa benzeri hem kendi makineme bulaşırdı hem de Task Manager'de en azından bir görüntüsü düşerdi diye tahmin ediyorum. RAMMAP'de de görülen anormal bir aktivite yok. Malwarebytes ile taratmış olmama rağmen temiz çıktığını da ifade etmeliyim. ESET başlangıçtan beri çalışır halde zaten.
RAMMAP Ekran Görüntüsü:
AWE den kasıt büyük ihtimalle SQL 2014 db. SQL 2014 bu kadar belleği nasıl kullanabilir anlamıyorum. Dahası belleğin bu kadar yüksek kullanımı Event Loglara hiçbir şey yazmaksızın makineyi Reboot ettirebilir mi? SQL bellek ayarını nasıl kısacağımı da tam bilemediğimi ifade etmeliyim.
İşin bir başka ilginç noktası RAMMAP File Summary kısmında Active kısmında görünen bellek size'ı 5332 K. Yani Use Counts kısmında görünen 25 GB tan eser yok. Bu belki de Win 2012 nin belleği ayırma ve kullandırma oranlamasının farklılığından kaynaklanıyor olabilir. Dahası bu kadar yüksek bellek kullanımında tipik bir makine nasıl donma, yavaşlama geç cevap verme tepkileri verirse ben de öyle tepki vermesini beklerim Server'dan ama öyle bir şey de yok. Server normal çalışıyor.
Evet değerli arkadaşlar elimdeki tüm veriyi sizinle paylaştığımı sanıyorum. Bu konuda yardımlarınıza ihtiyacım var.
Teşekkür eder iyi çalışmalar dilerim hepinize.
Eveet tespit edilmesi zor bir problemle karşılaşmışsınız Benim de aynı sıkıntım var nadiren oluyor ama oluyor. En son antivirüsten şüpheleniyorum ama henüz bakamadım başka da bir şey kalmadı zaten.
Sql memory ayarını da linkte bulabilirsiniz.
Teşekkürler paylaşım için. Sql Server bellek ayarını bir miktar kısmayı düşünüyorum. Bu cevapla deneyebilirim.
Bir sitede memory kullanım oranının yüksek oluşuyla ilgili "memory leak" kavramını gördüm. Belki bellekteki bir arıza bu tip soruna yol açıyor olabilir. Ramleri çıkarıp (sonradan takılan HP 16GB 2Rx4 Kit) sabit bellekle serverın tepkisini ölçmek istiyorum.
Ancak memory leak denilen şey serverı durduk yerde reboot ettirir mi bilemiyorum.
hocam bu nedir ya fanrika göçse bu kadar yazarmıydım bilmiyorum. sabırlıımışsınız
Dün itibariyle yüklü 32 GB ramden son takılan 16 GB rami çıkarıp makineyi boot ettim. 1 gündür makine eskisi gibi çalışıyor. Yani ram kullanım miktarı oran olarak yüksek ama eskiden 32 GB yüklüyken 30 GB kullanımda diyordu. Şimdi 14 GB kullanımda diyor. Bir tuhaflık var.
Sanki sistemde bir şey toplam bellek kapasitesinin büyük çoğunluğunu kullanacak şekilde bir alan kaplıyor bellekte. Bu ister 32 olsun isterse 16 farketmiyor.
Hala çözüm aramaya devam ediyorum.
Tuhaflık yok aslında, Sql servere ne kadar ram verirseniz o kadar kullanır, üstü kalsın demez. 🙂 Şu an 16 gb kaldığı için haliyle elinde olanı kullaıyor.
Peki üstadım bu yüksek bellek kullanımı reboot ile alakalı bir probleme sebep olabilir mi?
Zaman zaman Görev Yöneticisini izlerken SQL'in CPU'yu %100 kullandığını görüyorum. Gerçi kısa süreli oluyor bu. Belki bu da rebootla alakalı olabilir.
Bir yabancı sitede şöyle bir cevap geldi.Sunucunda 2 tane power suplly yoksa bir tane daha eklemelisin dedi. Sunucuda kendi haliyle 1 tane PS ünite var. İlave olarak 16 GB ram eklendi. USB 2.5'' flaş disk bağlı başka bağlı bir çevre birimi yok. 2.5'' USB disk + 16 GB sonradan ilave Ram serverda güç eksilmesi ve ardından Reboot sorunu çıkartabilir mi diye düşünmeye başladım.
3 tane fan var. Hepsi de çalışıyor. Acaba CPU çok yüklü olduğunda sistem cevap veremediğinde veya CPU aşırı ısınma yaptığında reboot ettirebilir mi diye düşünüyorum ama ona da eski sunucum çok daha yüksek sıcaklıklarda iş yükü de benzerken problem çıkartmıyordu.
Dün server normal çalıştı ama bugün yine Reboot etti. Otomatik yeniden başlatma seçeneğini kapattım bakalım mavi ekranda hangi görüntü gelecek onu bekliyorum bir sonraki reboot anında.
Isletim sistemi icin 2-3 gb ram birak sql serverda yukaridaki linkte sql serveri sinirlamayi gosteeiyordu. cpu arada %100 kullanmasi normal, cpuda asiri isinma soz konusu degilse resetlemez. Bir sonuca ulasamazsaniz bemce serveri degistirin. Bu arada bu sunucuda ne gibi roller ve progeamlar calisiyor?
SQL 2014 Server Memory kısmında 9 GB'a kadar maksimum kullanımı ayarladım. RamMap ile bellek kullanımından SQL in 9 GB ı kendisine ayırdığını da gördüm. Kalan bellekte 2.5 GB a yakını non-paged pool olarak geçiyor. Sonra da diğerleri.Toplam kullanım oranı %82. Tabii 16 GB lık son aldığım rami söktüğüm için böyle bir ayarlama yaptığımı söylemeliyim. 16 GB rami takınca SQL için kapasiteyi 16 GB a çekmeyi düşünüyorum.
CPU zaman zaman dediğiniz gibi yüksek oranlara çıkabiliyor. Ancak serverda zaman zaman ağırlaşma meydana geliyor. Özellikle Remote Desktop yaparken. 2 ay önce olmayan bir durum.Dediğiniz gibi ortamın ısısı yükselince CPU üstündeki alüminyum soğutucu ısınmasa bile PU resetliyor olabilir mi onu düşünüyorum.
Serverı değiştirin demişsiniz.Kasım ayında aldığım server bu.HP yerinde destek garantisini 6 ay boyunca vereceğini ve bunun da ancak anakart,işlemci,bellek,power supplu değişiminde (illa ki yanması,patlaması gerkeiyor demek ki) olacağını belirtti.
Bugün yine bir kavga edip eleman getirtmeye çalışacağım. Serverı değiştirin derken anakartı mı işlemciyi mi neyi kastettiniz? Komple makineyi mi?
Cevap yazmayı unutmuştum. Hemen tamamlayayım.
HP sunucunun rastgele reset atma olayı çözüldü. Sorun HP Smart Array Raid Kontrol karttan kaynaklanıyormuş. Kart değişimi yapıldı ve sorun çözüldü.
Sorunun buradan kaynaklanma durumunu da Windows işletim sisteminin özelliklerinde herhangi bir donanımsal sorun çıktığında yeniden başlat seçeneğini kapatıp makinenin çakılmasını beklerken tesbit ettik. Mavi ekranda doğrudan kartla ilgili hata uyarısı verdi.
Bir nevi şanslıydık yani.
Herkese fikirleri için teşekkürler.