Jump to content

Cluster Node Switch


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo Zusammen,

 

nach Jahren des Stillen mitlesens (übrigens Bravo für die tolle Arbeit hier, fast zu jedem Problem kriegt man noch einen Implus welcher meist zu einer Lösung führt) habe ich nun mal eine Frage, die ich mit der Suchfunktion nicht finden konnte.

 

Kurz zu mir selber:

Ich heiße Ralph, bin 28 Jahre und studierter Informatiker (noch Diplom, juhu ;-) )

Ich arbeite bei einem großen Konzern in der Lebensmittelbranche.

 

 

zum Problem:

 

Wir setzen hier noch einen kleinen Windows 2003 Cluster ein.

 

2x HP ProLiant DL360 G5 an einer MSA

 

Dort laufen für eine separate Domäne ein SQL, ein Print, ein Exchange und ein Fileserver. Wir setzen zur Sicherung ArcServe 12.5 ein.

Das erste Problem ist, der Aufruf des Cluster Managers. Dieser Aufruf dauert ewig. Er versucht die Ressource "CA ArcServe Exchange Agent Notifier" zu lesen und dies dauert bis zu 30s bevor der Cluster Manager irgendetwas anzeigt.

Das schwerwiegende Problem ist jedoch, dass ziemlich genau nach einer Woche laufzeit das Exchange Node switcht. vom aktiven Node auf den passiven. Ich kann ab und zu feststellen, dass das Windows Defrag Interface den Cluster nahzu komplett auslastet. Ich tippe daher das die Exchange Gruppe deswegen switcht, weil sie auf dem aktiven Node nicht mehr erreicht werden kann.

Gibts da Erfahrungswerte oder Tips woran es liegen könnte, dass zum einen der Cluster bei der Defragmentation (der MSA Platten) so stark ausgelastet wird (ist sicherlich die Defragmentation der Exchange Datenbank??? ) und deswegen ein Switch erfolgt und warum der ArcServe Agent den Clustermanager so sehr ausbremst?

 

Ich danke euch im vorraus und freue mich auf eine rege Diskussion in meinem ersten eigenen Beitrag.

 

VG,

 

Ralph

Link zu diesem Kommentar

Hallo Ralph und Willkommen "an board",

 

welche HP MSA wird im Detail verwendet?

In der Regel bietet eine flotte Storage schnelle Failoverzeiten, je nachdem was verwendet wird.

 

Verbindest Du Dich unter Verwendung des Netzwerknamen des Clusters mit der Cluster Verwaltung oder verwendest Du den '.' (Punkt)?

Eine Verbindung über den LPC anstatt RPC ist immer die schnellste Möglichkeit ;)

Siehe: Cluadmin.de Windows Cluster Blog Blog Archiv Cluster Administrator ohne Verbindungsversuch starten

 

Wenn die Cluster Verwaltung bei einem bestimmten Ressourcen Typ hängen bleibt, reagiert diese Komponente nicht schnell genug. In Deinem Fall (CA ArcServe Exchange Agent Notifier) reagiert die Ressource DLL nicht innerhalb des Timeouts, so daß es zu einem Failover kommt - richtig?

Da hilft nur ein Trouble Shooting dieser Komponente, sprich: Aktualisieren oder via CA Support einen Patch anfragen oder Konfigurationsparameter ändern...

 

Mal abgesehen von Deinem Problem mit dieser Ressource: Du hast da etwas zuviele Dienste auf dem einen Cluster laufen und auch Anwendungen, die sich gegenseitig beißen.

Manche Anwendungsarten vertragen sich gar nicht gut: Exchange allokiert User Mode RAM (Stichwort /3GB switch) und Fileserver typischerweise Kernel Mode RAM. Man kann einen Cluster nicht in beide Richtungen optimieren...

Da noch SQL on top ist für einen DL360 mit 1 Höheneinheit sportlich.

 

Sind die Anwendungen auf verschiedene Clustergruppen aufgeteilt, damit ein Failover wenigstens Applikations-unabhängig abläuft?

Link zu diesem Kommentar

Hallo Lian,

 

vielen Dank für deine ausführliche Antwort.

Ich verbinde mich über den Netzwerknamen mit dem Cluster bzw. der Clusterverwaltung.

Die Idee mit dem Punkt werde ich aufgreifen, vielen Dank für den Tip.

 

Es ist nicht richtig, dass es zu einem Failover kommt, wenn ich den Cluster Administrator aufrufe und der Aufruf bei der besagten Komponente hängen bleibt. Wahrscheinlich wartet er nur einen Timeout ab und läuft dann weiter normal durch und zeigt schießlich die gewünschte GUI an. --> Alle Ressourcen und Groups sind nach wie vor auf einer Node. Wir haben schon seit Tagen einen Call bei CA offen...das übliche Hin und Her leider. Wir nutzen ArcServe Backup 12.5 SP1 Build 5860...von daher ist der von uns gewünschte Fix bzw. die Fixbeschreibung wohl schon in dem Servicepack enthalten. Doof. Somit ist CA als auch der Cluster an sich auf dem neuesten Stand.

 

Wir verwenden MSA2000 in voller Ausbaustufe. Die beiden DL360G5 sind auch recht gut bestückt. File (nur für eine bestimmte Nutzergruppe) und Exchange sowie Print haben gut zu tun, jedoch ist der SQL nur ein "Testsystem". Hauptfileserver und SQL liegen auf weitaus leistungsfähigeren Maschinen. Wir sind mit der Performance des Clusters an sich zufrieden.

Anbindung haben wir übrigens auch gecheckt und die HBA's auch testweise auf 2Gbit runtergedreht.

Anwendungen laufen natürlich in Clustergruppen. Wie gesagt es kommt auch nur zum Switch der Exchange Clustergruppe, alles weitere läuft normal auf der Ausgangsnode.

Mal gucken was CA noch so von sich zu geben hat.

Stand heute ist, dass sie uns ein Unistalltool basteln, welches die Agents und ArcServe komplett (inkl. Registry) vom Cluster entfernt. Dann sollen sie neu installiert und konfiguriert werden.

 

Sorry falls Rechtschreibfehler drin sind, wollte nur schnell antworten. Sind gerade in einer sehr stressigen Projektphase (irgendwie sag ich das das ganze Jahr über ;-) )

 

Vielen Dank schonmal und schönes Wochenende,

 

Ralph

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...