Merhaba,
Bu makalemizde serimize kaldığımız yerden devam ediyoruz. Artık alarm üretme konusunu ele alıyor olacağız. Yani sistemde bizim için anormal olan tüm durumları belirleyip bunların meydana gelmesi halinde Zabbix sunucumuz bize bu durumu e-mail olarak bildirecek.
Sözü fazla uzatmadan işlemlerimize geçelim. Daha önce sistemimize SNMP protokolünü kullanarak Kamera ve Switch cihazlarını eklemiştik ve bu cihazlarımızın takibini SNMP protokolünün sağladığı veriler ile yapmıştık. Şimdi bu protokolün sağladığı Trigger’ları kullanarak alarm üretmeye başlayalım.
Configuration sekmesinin altından Hosts sekmesine tıklıyorum ve eklediğim tüm kamera’ların başına KAMERA yazdığım için Name yazan kısma bunu yazarak filtreliyorum. Gelen listeden herhangi birisine tıklıyorum.
Kamera’ları ve Switch’leri Network Generic Device SNMP template’i ile izlemiştik.
Şimdi bu Template’in yerine ulaşalım. Configuration sekmesinin altından Templates kısmına tıklıyorum ve Name yazan kısma Network Generic Device SNMP yazarak template ulaşıyorum.
İlgili Template’in Trigger sekmesine tıkladığımda 6 adet Trigger olduğunu görüyorum. Biz kameraları izlerken zaten SNMP protokolü üzerinden temel ICMP protokolü kullanarak cihaz ayakta mı değil mi ? bunu bilelim bu kontrol bizim için yeterli diyerek izliyorduk. Bunun ötesinde pek bir beklentimiz (kamera) için yoktu. O yüzden ilgili “ICMP Ping Unavailable by ICMP ping” yazan trigger bizim aslında kameranın ayakta olup olmadığını kontrol ettiğimiz Trigger’ımız bu Trigger adını kopyalıyorum.
Ardından Configuration sekmesinin altında bulunan Actions sekmesine tıklıyorum ve Create Trigger actions diyerek yeni bir Action tanımlamaya başlıyorum.
Karşıma 2 sekmeden oluşan bir ayar menüsü geliyor. İlk olarak oluşturacağım Alarm’a bir isim veriyorum.
· Name: SNMP ERISIM YOK olarak belirliyorum.
Altında bulunan Conditions yazan kısımdan Add diyerek yeni bir ekleme yapıyorum.
· Type: Trigger Name ( Biz trigger adına göre alarm üreteceğiz )
· Operator: contains ( Bizim belirttiğimiz Trigger adını içermesi halinde Alarm oluşacak )
· Value: Buraya adını kopyaladığım “ICMP Ping Unavailable by ICMP ping” Trigger’ının sadece name kısmını yapıştırıyorum ve Add diyerek ekliyorum.
Burada bir Trigger adını belirtmiş olduk ve bu adı içeren Trigger’ı kullanan Host’lardan herhangi birisinde ping erişimi kesilirse Alarm devreye girsin diye ayarlamış olduk.
Şimdi ikinci sekmeden bu Alarm’ın oluşması halinde nasıl bir aksiyon alacağımızı ayarlamaya geçelim. Öncelikle burada 2 kısım var;
· Operations: ( Burası Alarm oluşunca ilk olarak alınacak aksiyon )
· Recovery Operations: ( Alarm oluştu bir hata meydana geldi ardından bu durum normale dönünce olay normale döndü durumunun bildirildiği kısım )
“Operation: Send Message” seçiyorum. Biz daha önce bir Operator grubu tanımlamıştık (bir önceki makalede detayları mevcut ) onu şimdi burada kullanacağız yani Trigger tetiklenince sistemde bu Alarm (Action) üretilince ilk olarak Operatorler grubuna mail atsın diyorum.
Burada alttaki kısımdan ayrıca belirlediğimiz yani bu Operatorler grubu dışında başka bir user ayrıca eklemek istersek onu da ekleyip bildirim gönderebiliriz ancak ben grup üzerinden devam ediyorum kafamdaki yapıyı bu şekilde kurgulamıştım.
Recovery Operations kısmından da yine Send Message seçiyorum ve Operatorler grubumu seçiyorum yani problemin düzeldiğini de bu gruba mail olarak gönder demiş oluyorum. Add diyerek ekliyorum.
Görüldüğü gibi sarı ile belirli kısımda bu aksiyonun oluşmasında ve aksiyonun düzelmesi halinde hangi gruba ne şekilde bilgi verileceğini belirlemiş olduk. Add diyerek bu SNMP ERISIM YOK Action’nunu tamamlıyorum.
İlk Trigger Aciton burada oluştu, Operations yazan sekmede detayları da yazıyor. Biz “ICMP Ping Unavailable by ICMP ping” Trigger’ını kullanarak bir Alarm yazdık yani bunu kullanan tüm Host’lar üzerinde erişim kesilmesi halinde bize e-mail ile bildirim gelmesi gerekiyor. Şimdi bunu test etmek için sahadaki Switch’lerden bir tanesini kapatıyorum.
Deneme amacı ile bir Switch’i kapatınca 12 kamera Down oldu bu kameralar kapattığım Switch üzerinden POE ile çalışmaktaydı. 1 tane de Switch kapattık toplamda 13 cihaz Down konumda tüm bunlar “ICMP Ping Unavailable by ICMP ping” Trigger’ını kullanıyordu. Yani bize 13 cihaz için e-mail düşmesi gerekiyor.
Mail adresime girip baktığımda 13 adet mail gelmiş durumda. Alarm başarılı bir şekilde çalışıyor. Şimdi mail içeriğinde neler var bir bakalım.
Gelen mail içeriğinde Host: SW-4_MAL_KABUL yazan mail bizim kapattığımız Switch’imiz. Yani 13 mailden bir tanesi Switch cihazın DOWN olduğu için gelmiş, mailin en üst kısımda ise problemin başlangıç saati yazıyor. Bu çok güzel açıklamalı kısa net bir Action bildirimi.
Diğerlerinde ise yine Host: yazan kısımlarda KAMERA’ların adları ve DOWN oldukları saat ve tarihler yazıyor. Bu Switch’e bağlı toplam 12 kameranın tamamı için ayrı ayrı mail gelmiş durumda. Bu şekilde hangi Switch’e hangi Kameralar bağlı tespit etmesi de kolay oldu ?
Şimdi ilgili Switch’i tekrar çalıştırıyorum ve hatanın düzeldiğine dair e-mail bildiriminin geldiğini de kontrol ediyorum. Aynı şekilde 13 tane Resolved yazan e-mail geldi ve problemin hangi tarih ve saatte düzeldiğini bize bildirdi.
Bu Action bildirimlerinin loglarına Reports sekmesi altındaki Action log yazan kısımdan detaylı olarak bakabiliriz. Yani herhangi bir problem meydana geldiğinde Action devreye girdi mi ? hangi kullanıcı gruplarına yada kullanıcılara mail gitti yada gitmedi gibi tüm detayları görmek mümkün.
İlgili logları filtre ile de kolayca arayabiliriz.
Evet bir makalenin daha sonuna geldik. Bu makalemizde ICMP ( Internet Control Message Protokol, IT sektöründe ping olarak geçen ) protokolü kullanan Trigger ile bir Alarm ürettik ve bu alarm sonunda belirlediğimiz bir Operator grubumuza mail ile bildirim yaptık.
Bir önceki makalemizde bu Operator grubunun içine kullanıcı ve mail adresleri tanımlamıştık. Bu gruba mail atınca o gruptaki tüm kullanıcılara mail gitmiş oldu. Yapıyı bu şekilde kurgulamamın sebebi büyük organizasyonlarda bu işler planlı yapıldığı için bir Action tanımlandığında belli ekip üyelerine mail atılması gerektiğinde tek tek uğraşmak yerine ilgili üyeleri gruba dahil ederek topluca bildirim yapmış oluruz ve bu hem organizasyonun yönetimini kolaylaştırır hem de hata çözmek noktasında olayı basitleştirir.
Ayrıca farklı gruplar yaparak hatanın meydana geldiğini Operator grubuna bildirip düzeldiğinde ise ayrıca operator gurubunun üstünde bulunan yöneticilere de sorunun çözüldüğünü bildirebiliriz. Bu tamamen sizin organizasyon yapınıza bağlı olarak yapacağınız planlama ile alakalıdır. Sözü burada fazla uzattım ?
Umarım faydalı olmuştur.