Forum

Clusterda 2. Node o...
 
Bildirimler
Hepsini Temizle

Clusterda 2. Node oluşturma Hatası

8 Yazılar
3 Üyeler
0 Reactions
1,101 Görüntüleme
(@Anonim)
Gönderiler: 0
Konu başlatıcı
 

Merhaba,

2 adet Server 2003 Ent.R2 64 bit işletim sistemli Server üzerine daha önceden yapılmış Cluster mevcuttu. Bu Cluster bir şekilde çökmüş ve domainide kaldırıldı ve yeni bir domain oluşturulup bu iki bilgisayar bu domaine dahil edildi. Node 1 üzerinden başlayarak Cluster'ı tekrar oluşturmak istedik. Bu arada Quorum IBM Storage üzerinde. Node 1 de Clusterı tekrar oluşturmak çok zorladı. Oluşturma aşamasında devamlı hatalar verdi, "cluster node /forcecleanup" komutu sorun çıkardı. Cluster servisi envai çeşit sorunlar çıkardı. Sonunda Registry içinden oynamalar yapılarak Node 1 ayağa kaldırıldı. Node 2 ye gelindiğinde bundada ilk olarak deminki komut kullanılarak eski clusterdan çıkartmak istedik. Komut hata vermedi (Başka yerlerden hatalar verdi). Registry içinden (Önceden oynadığımız yerlerin yedeğini aldık) HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\ClusDisk, Clusnet ve Clussvc içindekileri, HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Cluster Server  key içeriğinin bir kısmını temizledik (ClusterInstallationState kısmını 0,1 olarak denedik ama bunu silmedik) . Bunun yanında Clusdisk ve Clussvc key'lerini komple silerekde denedik ama Node 2 yi eklemek istediğimizde hatadan kurtulamadık. Ayrıca Registry içinden herhangi bir müdahalede bulunmadan önce Node2 yi Node1 in bulunduğu Clustera katmak istediğimizde "Bu makine zaten bir Cluster üyesi" şeklinde hata veriyordu. /Forcecleanup bu konuda işe yaramadı. Registry içindeki eski girdileri silince bu hatadan kurtulduk, tabiki Cluster serviside ortadan kalktı. SOnuçta sıfır makinedede Cluster servisi yok ve Cluster kurulumu sırasında Cluster servisi (Clussvc) oluşturuluyor ve otomatik başlatılıyordu. Node1'i bu şekilde ayağa kaldırdık. Ama Node2'de hiç bir şey yemedi. Tabiki Node2'yi Clustera dahil ederken Quorumu tespit edememesi (Unknown Quorum) ve bu işlem için Advanced (Minimum) Konfigürasyonu seçmek zorunda kalmamız ayrı bir konu. Aşağıda kurulum sırasında oluşturulan logun bir kısmını veriyorum ve varsa tavsiyeleriniz sevinirim (Format atmak istemiyorum). Sihirbazdaki hataların log'u :

[INFO] [MT] [CTaskCommitClusterChanges] Beginning task...
[INFO] Node 2: (null) (hr=00000000, {FDC75680-7DBB-42CA-8003-E4CDB01FF062}, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, 1, 1, 1), (null)
[INFO] [OM] Found an existing cookie for object 'node2.domain.local'
[INFO] [TaskCommitClusterChanges] Setting completion cookie 50 at array index 0 into the compare and push information task for node Node2.domain.local
[INFO] [TaskCommitClusterChanges] Setting completion cookie 51 at array index 1 into the compare and push information task for node Node1.domain.local
[INFO] [MT] [CTaskCompareAndPushInformation] Beginning task for node Node2.domain.local l...
[INFO] [MT] [CTaskCompareAndPushInformation] Beginning task for node Node1.domain.local ...
[INFO] Node2: Comparing cluster and node configurations... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, 0, 1, 0), (null)
[INFO] Node1: Comparing cluster and node configurations... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, 0, 1, 0), (null)
[INFO] Node2: Validating credentials... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {58902BD5-3F45-4626-A667-8433A5D7A6DC}, 0, 1, 0), (null)
[INFO] Node1: Validating credentials... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {58902BD5-3F45-4626-A667-8433A5D7A6DC}, 0, 1, 0), (null)
 [INFO] Node2: Validating credentials... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {58902BD5-3F45-4626-A667-8433A5D7A6DC}, 0, 1, 1), (null)
 [INFO] Node1: Validating credentials... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {58902BD5-3F45-4626-A667-8433A5D7A6DC}, 0, 1, 1), (null)
 [INFO] Node2: Collecting managed resources... (hr=00000000, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, {01297D4D-0C7C-44B1-AECE-604C710A65CC}, 0, 2, 0), (null)
 [INFO] Node1: Collecting managed resources... (hr=00000000, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, {01297D4D-0C7C-44B1-AECE-604C710A65CC}, 0, 2, 0), (null)
[INFO] [SRV] The cluster service is not running.  Creating a dummy Local Quorum resource.
[INFO] Node2: Found SCSI disk '\\.\PHYSICALDRIVE2' on Bus '0' and Port '3'; at TID '1' and LUN '1' (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Physical disk PHYSICALDRIVE2 has signature 0. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[WARN] Node2: The physical disk '\\.\PHYSICALDRIVE2' does not have any partitions and will not be managed (hr=0x000001, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Found SCSI disk '\\.\PHYSICALDRIVE1' on Bus '0' and Port '3'; at TID '1' and LUN '0' (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Physical disk PHYSICALDRIVE1 has signature 0. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[WARN] Node2: The physical disk '\\.\PHYSICALDRIVE1' does not have any partitions and will not be managed (hr=0x000001, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Found SCSI disk '\\.\PHYSICALDRIVE0' on Bus '4' and Port '2'; at TID '0' and LUN '0' (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Physical disk PHYSICALDRIVE0 has signature a914e07a. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Found physical disk "\\.\PHYSICALDRIVE0" with partition "Disk #0, Partition #0" which has the logical disk "C:". (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] [SRV] The disks on SCSI port 2 are cluster capable.
[INFO] [SRV] Didn't find the ManageDisksOnSystemBuses value in the registry. (hr = 0x00000001)
[INFO] Node2: Looking for disks on the same storage bus as the boot disk... (hr=00000000, {036BF567-2377-4BB3-8AE1-E4104E2EB3C5}, {13E84779-125E-4B76-8C0D-1F5DB92EFE0F}, 1, 1, 1), (null)
[INFO] Node2: Looking for disks on the same storage bus as the boot disk... (hr=00000000, {036BF567-2377-4BB3-8AE1-E4104E2EB3C5}, {13E84779-125E-4B76-8C0D-1F5DB92EFE0F}, 1, 1, 1), (null)
[INFO] Node2: Pruning SCSI disk '\\.\PHYSICALDRIVE0', on Bus '4' and Port '2'; at 'SCSI Tid 0, SCSI Lun 0' (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: The physical disk "Disk C:" cannot be managed because it is on the same storage bus as the boot disk. (hr=00000000, {13E84779-125E-4B76-8C0D-1F5DB92EFE0F}, {E8F0C5B0-B319-412F-8806-1FD665145410}, 1, 1, 1), The cluster cannot manage physical disks that are on the same storage bus as the volume that contains the operating system because other nodes connected to the storage bus cannot distinguish between these volumes and volumes used for data.
[INFO] Node2: The physical disk "Disk C:" cannot be managed because it is on the same storage bus as the boot disk. (hr=00000000, {13E84779-125E-4B76-8C0D-1F5DB92EFE0F}, {E8F0C5B0-B319-412F-8806-1FD665145410}, 1, 1, 1), The cluster cannot manage physical disks that are on the same storage bus as the volume that contains the operating system because other nodes connected to the storage bus cannot distinguish between these volumes and volumes used for data.
[WARN] Node2: Physical disk 'PHYSICALDRIVE2' is NOT quorum capable. (hr=0x000001, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[WARN] Node2: Physical disk 'PHYSICALDRIVE1' is NOT quorum capable. (hr=0x000001, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] [SRV] The cluster service is not running.  Creating a dummy Majority Node Set resource.
[WARN] Node2: [SRV] Enumerating resources. Total Requested:10; Current enum index:0; Total Enums:4. (hr=0x000001, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] Node2: Setting local quorum 'to not be' the quorum device. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] [MT] The cluster managed resource has no support for IClusCfgManagedResourceData.
[INFO] [MT] TaskCompareAndPushInformation: failed to match node resource with UID 'SCSI Tid 1, SCSI Lun 0'.
[WARN] Node2: Comparing cluster and node configurations... (hr=0x00138f, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, 0, 1, 1), (null)
 [INFO] Node1: Looking for disks on the same storage bus as the boot disk... (hr=00000000, {036BF567-2377-4BB3-8AE1-E4104E2EB3C5}, {13E84779-125E-4B76-8C0D-1F5DB92EFE0F}, 1, 1, 1), (null)
[INFO] [TaskCompareAndPushInformation] Sending the completion cookie 50 for node Node2.domain.local to the notification manager because this task is complete.
[INFO] [TaskCommitClusterChanges] Looking for the completion cookie 50.
[INFO] [TaskCommitClusterChanges] Clearing completion cookie 50 at array index 0
[INFO] [MT] [CTaskCompareAndPushInformation] Exiting task.  The task was not cancelled. (hr = 0x00138f)
[INFO] Node1: The physical disk "Disk C:" cannot be managed because it is on the same storage bus as the boot disk. (hr=00000000, {13E84779-125E-4B76-8C0D-1F5DB92EFE0F}, {13ED7A9C-D8D0-4BEA-A4DD-4E0F6B7B6FD8}, 1, 1, 1), The cluster cannot manage physical disks that are on the same storage bus as the volume that contains the operating system because other nodes connected to the storage bus cannot distinguish between these volumes and volumes used for data.
[INFO] [MT] The cluster managed resource has no support for IClusCfgManagedResourceData.
[INFO] [MT] The cluster managed resource has no support for IClusCfgManagedResourceData.
[INFO] [MT] The cluster managed resource has no support for IClusCfgManagedResourceData.
[INFO] [MT] The cluster managed resource has no support for IClusCfgManagedResourceData.
[INFO] Node1: Collecting managed resources... (hr=00000000, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, {01297D4D-0C7C-44B1-AECE-604C710A65CC}, 0, 2, 1), (null)
[INFO] Node1: Collecting managed resources... (hr=00000000, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, {01297D4D-0C7C-44B1-AECE-604C710A65CC}, 0, 2, 2), (null)
[INFO] Node1: Comparing cluster and node configurations... (hr=00000000, {E25968DA-9C7B-42DB-ADA9-BC4E34F17E6E}, {07D8047B-01FD-40DC-9132-4B535A77CDE4}, 0, 1, 1), (null)
[INFO] [TaskCompareAndPushInformation] Sending the completion cookie 51 for node Node1.domain.local to the notification manager because this task is complete.
[INFO] [TaskCommitClusterChanges] Looking for the completion cookie 51.
[INFO] [TaskCommitClusterChanges] Clearing completion cookie 51 at array index 1
[INFO] [MT] Cluster binding string is {10.0.0.250}.
[INFO] [MT] [CTaskCompareAndPushInformation] Exiting task.  The task was not cancelled. (hr = 00000000)
[INFO] Node2: Adding this node to the cluster. (hr=00000000, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3222E708-EEF3-4667-8CCE-BB0C9223130E}, 0, 2, 0), (null)
[INFO] [SRV] CClusCfgNodeInfo::GetClusterConfigInfo() skipped object creation.
[INFO] Node2: GetClusterConfigInfo() completed. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {B460EA73-6223-44FA-84E0-DE7EC069DDD4}, 1, 1, 1), (null)
[INFO] Node2: (null) (hr=00000000, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3222E708-EEF3-4667-8CCE-BB0C9223130E}, 0, 2, 1), (null)
[INFO] [SRV] CClusCfgNodeInfo::GetClusterConfigInfo() skipped object creation.
[INFO] Node2: GetClusterConfigInfo() completed. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {B460EA73-6223-44FA-84E0-DE7EC069DDD4}, 1, 1, 1), (null)
[INFO] [BC] Progress messages will be sent.
[INFO] Node2: CClusCfgClusterInfo::GetClusterServiceAccountCredentials() skipping object creation. (hr=00000000, {05AA0768-5F49-49CD-AFDC-96F9D51802D4}, {00000000-0000-0000-0000-000000000000}, 1, 1, 1), (null)
[INFO] [BC] Initializing add nodes to cluster.
[INFO] [BC] The cluster installation directory is 'C:\WINDOWS\Cluster'. The localquorum directory is 'C:\WINDOWS\Cluster\MSCS'.
[INFO] [BC] The INF file 'C:\WINDOWS\Cluster\ClCfgSrv.INF' has been opened.
[INFO] [BC] Directory id 32768 associated with 'C:\WINDOWS\Cluster'.
[INFO] [BC] Directory id 32769 associated with 'C:\WINDOWS\Cluster\MSCS'.
[INFO] [BC] Cluster Name => 'CLUSTER.domain.local'
[INFO] [BC] Cluster Service Account  => 'domain.local\domaincluster'
[INFO] [BC] Current install state = 1. Required 1.
[INFO] [BC] The cluster installation state is correct. Configuration can proceed.
[INFO] [BC] Computer Name = 'NODE1' (Length 8), NodeHighestVersion = 0x040ece, NodeLowestVersion = 0x030893.
INFO] [BC] The current cluster configuration task is: Add Nodes to Cluster.
[INFO] Node2: Initializing a cluster add node operation (hr=00000000, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3ABE1500-7E05-402C-81AA-1C3F1D782031}, 0, 1, 0), (null)
[INFO] Node2: Initializing a cluster add node operation (hr=00000000, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3ABE1500-7E05-402C-81AA-1C3F1D782031}, 0, 1, 0), (null)
[INFO] [BC] Appending action (paNewActionIn = 00000000001B20E0) to list.
[INFO] [BC] Error 0x000424 occurred trying to open a handle to the ClusDisk service. Throwing an exception.
[INFO] [BC] A runtime error has occurred in file 'd:\nt\base\cluster\mgmt\cluscfg\basecluster\cclusdisk.cpp', line 108. Error code is 0x80070424.
  The error string is 'A problem occurred when the wizard attempted to contact the ClusDisk service.'.
[ERR ] Node2: A problem occurred when the wizard attempted to contact the ClusDisk service. (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3ABE1494-7E05-402C-81AA-1C3F1D782031}, 1, 1, 1), 
[ERR ] Node2: A problem occurred when the wizard attempted to contact the ClusDisk service. (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3ABE1494-7E05-402C-81AA-1C3F1D782031}, 1, 1, 1), 
[ERR ] Node2: Initializing a cluster add node operation (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3ABE1500-7E05-402C-81AA-1C3F1D782031}, 0, 1, 1), (null)
[ERR ] Node2: Initializing a cluster add node operation (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3ABE1500-7E05-402C-81AA-1C3F1D782031}, 0, 1, 1), (null)
[ERR ] Node2: The changes to the cluster configuration cannot be saved. (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {03D177A6-2AE5-429E-B7FE-1A7D1C98A44B}, 1, 1, 1), Cluster configuration cannot continue because of an error during the saving of the cluster configuration. Restart the cluster configuration application and try again.
[ERR ] Node2: The changes to the cluster configuration cannot be saved. (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {03D177A6-2AE5-429E-B7FE-1A7D1C98A44B}, 1, 1, 1), Cluster configuration cannot continue because of an error during the saving of the cluster configuration. Restart the cluster configuration application and try again.
[ERR ] Node2: (null) (hr=0x80070424, {7C5F0774-1611-42B5-AF3C-6E124AC4D36B}, {3222E708-EEF3-4667-8CCE-BB0C9223130E}, 0, 2, 2), (null)
[INFO] [MT] [CTaskCommitClusterChanges] Exiting task.  The task was not cancelled. (hr = 0x80070424)

 

Ayrıca sihirbazın içindeki hatada , 0x80070424 :The specified service does not exist as an installed service.  (Hata belli servis yok demeyin.Servisi kendisi kurması gerekiyor. Cluster servisinin yüklenmesini, Device Manager içindeki Non-Plug and Play sürücülerin yüklenmesini engelleyen bir şey var. Bunu bulamadım. Eski Clusterdan kalan bir artık ama ne?)

 Sabırla okuduğunuz için teşekkürler.

 
Gönderildi : 29/05/2010 03:53

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 33367
Illustrious Member Yönetici
 

Merhaba


Cluster mimarisinin amacım yüksek erişilebilirlik ( high availability ) olduğu için bu kadar sorun ile kurulan bir cluster mimarisi bence çok doğru bir yapı olmayacaktır. sorun araştırırlır ve sizinde yaptığınız gibi belki ikinci node da ayağa kalkar. sonra ilerleyen günlerde bir node değişimi veya başka bir durumda bize veya google a bir soru sorarsınız ve aldığınız cevaba göre hareket etmeye kalkerken bir bakmışsınız cluster down olmuş.. henüz çalışmıyorken ve üzerinizde baskı yokken bence hepsini temiz bir şekilde kurun.

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 29/05/2010 12:13

(@cozumpark)
Gönderiler: 16307
Illustrious Member Yönetici
 

Merhaba;


The physical disk "Disk C:" cannot be managed because it is on the same storage bus as the boot disk.


İlk dikkatimi çeken şey bu oldu. Dikkat ederseniz altında


The cluster cannot manage physical disks that are on the same storage bus as the volume that contains the operating system because other nodes connected to the storage bus cannot distinguish between these volumes and volumes used for data.


yazısı var ki bu yazı der ki cluster storage'ı olarak işletim sistemini barındıran bir bölümü seçemezsiniz ki sanırım siz böyle yapmaya çalışıyorsunuz ve bu hata kendini 3 defa tekrar etmiş.


[WARN] Node2: Physical disk 'PHYSICALDRIVE1' is NOT quorum capable


[WARN] Node2: Physical disk 'PHYSICALDRIVE2' is NOT quorum capable


Bu da bu disklerle quorum oluşturulamayacağını belirtiyor ki dikkat ederseniz yine storage sorunumuz var.


  The error string is 'A problem occurred when the wizard attempted to contact the ClusDisk service.


Yine disk yani tine storage


Sanırım sizin storage yapılandırmanızda problem var.


Kolay gelsin.

 
Gönderildi : 29/05/2010 12:36

(@Anonim)
Gönderiler: 0
Konu başlatıcı
 

İlginiz ve sabrınız için teşekkürler. Mevcut clusterda quorum P: üzerinde (IBM Storage). Cluster active-passive olarak çalışıyor. Node 1 ayağa kaldırıldı ve P: bu node'da. Node 2 de bir seçim şansım yok zaten. Node2 üzerinde, Quorum diğer node'da olduğu için görünmüyor. Node 2 üzerinden mevcut clustera ekleme yaparken ilk analiz kısmından "Unknown Quorum" ibaresi geçiyor. Bunu internette araştırdığımda Sihirbazda Node ismini domainden seçim yaptığımız bölümde Advanced butonundan Advanced (Minimum) Configuration seçeneğini seçin deniyor. Bunun nedeni olarakda farklı storage teknolojileri gösteriliyor. Tamam dedik bunu işaretleyip devam ettik ve ilk analiz kısmını geçebildik. En son kısımdaki reanalyze kısmında Clusdik servisinin yüklenememesi sorunu ve bununla ilgili sorunlar çıkartıyor. Bu sorunun ilk analiz kısmındaki sorunla ilgili olmadığını düşünüyorum. Yine registry içinden kaynaklanabilir diye düşünüyorum. Node 1 şu an sorunsuz çalışıyor ve Node1'de de benzer registry sorunları yaşamıştık ve yaklaşık 3 günlük bir uğraştan sonra Clusterı oluşturabilmiştik.

 
Gönderildi : 29/05/2010 13:06

(@Anonim)
Gönderiler: 0
Konu başlatıcı
 


Merhaba


Cluster mimarisinin amacım yüksek erişilebilirlik ( high availability ) olduğu için bu kadar sorun ile kurulan bir cluster mimarisi bence çok doğru bir yapı olmayacaktır. sorun araştırırlır ve sizinde yaptığınız gibi belki ikinci node da ayağa kalkar. sonra ilerleyen günlerde bir node değişimi veya başka bir durumda bize veya google a bir soru sorarsınız ve aldığınız cevaba göre hareket etmeye kalkerken bir bakmışsınız cluster down olmuş.. henüz çalışmıyorken ve üzerinizde baskı yokken bence hepsini temiz bir şekilde kurun.



 


Hakan bey merhaba, evet bu konuda haklısınız ama, genelde bir sorun ile karşılaşıldığında insanların ilk yaptığı işlem olmasa bile 2. veya 3. adımda uyguladıkları şey sisteme format çekmektir. Sorunun çözümünü zorlamak istedik. 3 gün emek verdikten sonra Node 1 ayakta ve sorunsuz çalışıyor şimdilik. Eğer ilerde dediğiniz gibi benzer sorunu çıkartırsa bu yöntemlerin işe yaramadığını sistemin sakat olduğunu düşünür ve format atıp temiz bir şekilde Cluster oluşturma yoluna gidilir (Bu şekilde bir çözümün sistemde stabilite sorunu yaşatıp yaşatmıyacağını bilmediğimiz için şansımızıda denemek istedik). Ayrıca bu bizim için iyi bir Case olduğu gibi amacım sizlerle de paylaşıp böyle bir sorunda neler yapılabilir fikrini tartışmaktı.

 
Gönderildi : 29/05/2010 13:24

(@cozumpark)
Gönderiler: 16307
Illustrious Member Yönetici
 

Sorununuzun çözüldüğüne sevindim.


İyi çalışmalar diliyorum.

 
Gönderildi : 29/05/2010 13:41

(@Anonim)
Gönderiler: 0
Konu başlatıcı
 

Yok sorun çözülmedi daha. Node 2'yi hala dahil edemedik. Node 1 üzerinde Cluster oluşturduk. Ama buda 3 gün falan sürdü. Hala devam ediyoruz Node 2 üzerinde çalışmaya. Fikirleriniz varsa uygulayabilirim. Gözümden kaçmış şeyler mutlaka vardır ve Cluster konusundada engin tecrübelerim yok. Sağolsun google destek oluyor biraz.

 
Gönderildi : 29/05/2010 13:44

(@cozumpark)
Gönderiler: 16307
Illustrious Member Yönetici
 

Yok sorun çözülmedi daha. Node 2'yi hala dahil edemedik. Node 1 üzerinde Cluster oluşturduk. Ama buda 3 gün falan sürdü. Hala devam ediyoruz Node 2 üzerinde çalışmaya. Fikirleriniz varsa uygulayabilirim. Gözümden kaçmış şeyler mutlaka vardır ve Cluster konusundada engin tecrübelerim yok. Sağolsun google destek oluyor biraz.


WARN ve ERR yazan satırları dikkate alıp bunları kaldırma yolunda ilerlerseniz ancak ilerleme katedebilirsiniz.


Aksi halde gerekli yedeklemeleri yapıp baştan yapıyı kurmaktan başka mantıklı bir çözüm görünmüyor. Belki bir şekilde sistemi ayağa kaldıracaksınız ancak 3 gündür bu iş için uğraş verdiğinizi düşünürsek yedek alıp yapıyı baştan kurmanızın çok çok daha kısa süreceğini de göz önünde bulundurduğumuzda yanlış yolu seçtiğinizi söyleyebiliriz.


İyi çalışmalar.

 
Gönderildi : 29/05/2010 14:03

Paylaş: