Microsoft MVPs inside





 MCSEboard.de – IT Pro Forum zu Windows Server 2008 R2 / 2008 / 2003 & Windows 7 / Vista / XP
Registrieren Hilfe Regeln Benutzerliste Suchen Heutige Beiträge Alle Foren als gelesen markieren

Windows Server Forum


Alles zum Thema Windows Server sowie Windows IT Pro Themen — Q & A zu den Windows Server Versionen NT / 2000 / 2003 / 2003 R2 / 2008 / 2008 R2: Rollen, Features, Konfiguration, Troubleshooting


Antwort
     
Themen-Optionen
Alt 25.02.2008, 13:00   #1
Gast
 
Offline
Registriert seit: 08-2003
Beiträge: 272
2K3 - 4 Node Cluster macht ohne Grund einen Failover....

Hi,

ich hab seit ein paar tagen folgendes Problem und ich hoffe das jemand von euch mir da vielleicht etwas support geben kann.

Wir haben hier einen 4 Node Cluster, 3 sind aktive Cluster Nodes und 1 ist Standby.
Windows 2003 Sp2 ist auf den Servern installiert.

Es gibt eine C Partition also eine Physikalische Platte in den Servern auf denen das OS ist und eine D:\ Partition die über SAN angebunden ist.

Jetzt ist es wohl so das zu völlig unterschiedlichen Zeiten einer der Nodes einen Failover auf den Standby macht. Gründe dafür gibt es leider nicht. Es ist sonst keine Software auf den Clustern installiert, diese sind reine FileCluster.

Im Eventlog bekomm ich nur die Meldung das angeblich die SAN Platte nicht da wäre und aus diesem Grund der Failover gemacht wird was aber nicht stimmt.

Es sind ca 3000 Leute auf dem Cluster System unterwegs. Die Auslastung der Paltten haben wir schon untersucht doch dort ist nicht wirklich viel los zumal der Failover auch Nachts einfach passiert wo kein Mensch drauf ist.

Hatte jemand von euch schonmal so einen Fall ?? Oder kann mir dazu was sagen ?
    Mit Zitat antworten
Alt 25.02.2008, 13:15   #2
Board Veteran
 
Benutzerbild von Rudman
 
Offline
Registriert seit: 04-2005
Ort: 04779
Beiträge: 1.237
Und was steht in der Cluster.LOG.

Signatur
Wenn Sie zustimmen, machen Sie bitte ein versteinertes Gesicht.

    Mit Zitat antworten
Alt 28.02.2008, 08:12   #3
Moderator
 
Benutzerbild von Lian
 
Offline
Registriert seit: 11-2000
Beiträge: 16.069
Zitat von Gismo79
Wir haben hier einen 4 Node Cluster, 3 sind aktive Cluster Nodes und 1 ist Standby. Windows 2003 Sp2 ist auf den Servern installiert.
Seit wann ist das SP2 installiert und ist das vorher schon aufgetreten?

Im Eventlog bekomm ich nur die Meldung das angeblich die SAN Platte nicht da wäre und aus diesem Grund der Failover gemacht wird was aber nicht stimmt.
Welche Events hast Du? 9,11,15 & 50/51 oder andere?

zumal der Failover auch Nachts einfach passiert wo kein Mensch drauf ist.
Sicher, daß es ein Failover ist und kein Failback?
Es gibt Einstellungen in den Properties, die den Failback regeln, typischerweise zu Off Peak Zeiten.

Signatur
MVP [Data & Storage - Cluster]

Two hours of trial and error can save ten minutes of manual reading.

    Mit Zitat antworten
Alt 28.02.2008, 08:54   #4
Gast
 
Offline
Registriert seit: 08-2003
Beiträge: 272
Hi,

sorry das ich mich so lange nicht gemeldet hab, ich bin mir noch nicht ganz sicher, ich bin heute dabei erstmal die Cluster.Log zu analysieren, ich kann sie ja dann gerne mal hier posten, vielleicht seht ihr was.

Zu dem Failback, wo stellt man das denn ganu ein !?

Danke für die Antworten !!!
    Mit Zitat antworten
Alt 28.02.2008, 11:12   #5
Gast
 
Offline
Registriert seit: 08-2003
Beiträge: 272
Hi,

also folgendes kommt:

Event Log:

Source: ClusSvc
Category: Ressource für Dateifreigaben
Message: Für die Clusterdateifreigabe "XXXXXX" konnte keine Statusüberprüfung durchgeführt werden. Fehlercode: 53

Diese Meldung kommt auf allen Resourcen die wir eingerichtet haben. Das sind so 30 Stück.

Dann hier das Clusterlog dazu:

WARN [EVT] ElfWriteClusterEvents failed: status = 3221225864

WARN [FM] FmpHandleResourceTransition: Resource Name = XXXXXXXX [Cluster-IP-Adresse] old state=2 new state=4

WARN [FM] FmpHandleResourceTransition: Resource Name = XXXXXXXXXXXXX [Cluster-IP-Adresse] old state=129 new state=4

WARN [FM] FmpHandleResourceTransition: Resource failed, post a work item

WARN [FM] FmpHandleResourceTransition: Resource Name =XXXXXXXXXXXXXXX [Cluster-IP-Adresse] old state=129 new state=4

WARN [EVT] ElfWriteClusterEvents failed: status = 3221225864

ERR File Share <XXXXX>: Share has gone offline, Error=53 !

INFO [FM] NotifyCallBackRoutine: enqueuing event
INFO [FM] Calling RmNotifyChanges in monitor 0b9c.

WARN [FM] FmpHandleResourceTransition: Resource Name = XXXXXXXXXXXXXXX [xxxxx] old state=2 new state=4


Das ist jetzt nur ein auszug der Cluster.log.... Aber os sieht es im allgemeinen da aus. Der Rest sind nur Infos usw.....

Vielleicht kann mal einer zu den Fehler Codes was posten ?

Geändert von Gismo79 (28.02.2008 um 11:49 Uhr).
    Mit Zitat antworten
Alt 28.02.2008, 12:51   #6
Board Veteran
 
Offline
Registriert seit: 02-2004
Ort: Pratteln
Beiträge: 1.637
Hallo

Abgehesehen zu den Fragen von Lian ... hast Du mal ein checkdisk (im lesemode) auf den SAN Disks gemacht ... dauert der Clusterswitch "normal lange" .... ich hatte da mal was ganz hässliches erlebt ... wir hatten Monate mit HP und Ms vertrödelt ... letztendlich war es ein Problem, dass das Dateisystem (NTFS) auf der SAN Disk korrupt war.

War das schon immer so, oder anders rum bis wann ging es ?

Gruss
Matthias

Signatur
MSFT

    Mit Zitat antworten
Alt 28.02.2008, 14:13   #7
Gast
 
Offline
Registriert seit: 08-2003
Beiträge: 272
Das Problem ist erst seit ein paar Wochen da, das mit dem Checkdsk ist ne gute idee, werd ich mal machen. Vielleicht bringt es was. Meine Vermutung ist das die Quorum disk ein problem hat und das er aus dem grund nen Switch macht....
    Mit Zitat antworten
Alt 28.02.2008, 15:05   #8
Board Veteran
 
Offline
Registriert seit: 02-2004
Ort: Pratteln
Beiträge: 1.637
Hallo

Ne ich denk nicht, dass es das Quorum ist, sondern die Datendisk.

Gruss
Matthias

Signatur
MSFT

    Mit Zitat antworten
Alt 28.02.2008, 19:13   #9
Moderator
 
Benutzerbild von Lian
 
Offline
Registriert seit: 11-2000
Beiträge: 16.069
Zitat von Gismo79
ERR File Share <XXXXX>: Share has gone offline, Error=53 !

Vielleicht kann mal einer zu den Fehler Codes was posten ?
Der Fehler besagt:
The network path was not found.
Die Einstellungen für den Failback triffst Du in den Einstellungen einer Gruppe:


Was nutzt Ihr für eine SAN und wie ist diese angebunden?

Seit wann tritt der Fehler auf?

Ein chkdsk kann nicht schaden, prüfe vorher mittels nhkntfs ob das dirty bit gesetzt ist.

Ist das ein reiner Fileshare-Cluster?

Signatur
MVP [Data & Storage - Cluster]

Two hours of trial and error can save ten minutes of manual reading.

    Mit Zitat antworten
Alt 28.02.2008, 19:38   #10
Expert Member
 
Benutzerbild von NorbertFe
 
Offline
Registriert seit: 07-2007
Beiträge: 15.999
Zitat von Lian
Ein chkdsk kann nicht schaden, prüfe vorher mittels nhkntfs ob das dirty bit gesetzt ist.

Ist das ein reiner Fileshare-Cluster?
Da das hier W2k3 Cluster sind, auch nicht vergessen das Volume vor Checkdisk in den maintenance mode zu schalten. Sonst klappt das nicht.

Bye
Norbert

Signatur
Frank, I never thought I'd say this again. I'm getting the pig!

    Mit Zitat antworten
Antwort


Themen-Optionen


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
SQL - Mehr-Node-Cluster disi77 MS SQL Server Forum 0 04.06.2009 13:17
EXCH - 3 Node A/A/P Cluster Daniel84 MS Exchange Forum 10 13.04.2009 23:33
Cluster für Failover und Loadbalance (mein erster Cluster) slowjoe Windows Server Forum 9 27.01.2006 11:39
2K3 - 2 Node Cluster ohne externes Storage Device schnarchzapfen Windows Forum — LAN & WAN 10 25.05.2005 10:16
Cluster - Node 1 zerschossen msteinlein Windows Forum — Allgemein 2 03.02.2005 09:55


Alle Zeitangaben in MEZ/CET. Es ist jetzt 14:43 Uhr. Seite generiert in 0,042 Sekunden.

- Unsere Partner -

Copyright © 2000 – 2012 MCSEboard.de

Sprung zum Seitenanfang