Jump to content

Virtuelle IP vom Cluster nicht erreichbar


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Moin,

 

ich habe ein kleines Problem mit meinem neu installierten File Server Cluster.

 

Der Cluster funktioniert soweit einbandfrei, auch beim Failover. Wenn man aber die Virtuelle IP oder den Clusternamen pingt,

dann bekommt man von einigen Servern eine Antwort und von einigen Servern nicht.

Teilweise ist die Virtuelle IP nach x Std. plötzlich nicht mehr erreichbar.

 

Beide Nodes sind erreichbar und antworten durchgehend.

DNS Einträge, Netzwerkeinstellungen stimmen und es wird innerhalb des Supnetzes nichts durch die Firewall verboten oder geblockt.

 

OS:

Windows Enterprise Server 2003 R2

SP2,alle Security Patche und Hotfixe

 

System:

2x Dell 2950

1x MD3000 SCSI Storage

 

Hat jemand ne Idee woran das liegen könnte? Gibts da noch nen Trick beim Einrichten?

 

Vorab schon mal viel Dank für die Antworten.

 

Andy

Link zu diesem Kommentar

Moin Lian,

 

danke für deine Antwort.

 

Der Cluster wurde mit dem Assistenten aufgesetzt nicht per cmd.

Es sollen 2 Nodes werden (die 2. werden ich morgen hinzufügen), auch den Befehl werde ich mal ausführen und morgen posten.

Interessant ist, dass es anscheinend nur Schwierigkeiten im gleichen IP-Adressbereich gibt. Von nem anderen IP-Adressbereich scheint es ohne Problem zu funktionieren...

Link zu diesem Kommentar

Moin,

 

also ich habe den Cluster heute noch mal neu aufgesetzt, aber das Problem besteht immer noch.

Leider habe ich es auch Zeitgründen noch nicht geschafft die 2. Note hinzuzufügen, sollte allerdings auch nicht im Zusammenhang mit dem Problem stehen.

 

 

Hier das Resultat aus cluster res

 

Resource Group Node Status

-------------------- -------------------- --------------- ------

Disk E: Cluster Group Clusterserver02 Online

Cluster IP Address Cluster Group Clusterserver02 Online

Cluster Name Cluster Group Clusterserver02 Online

 

 

 

Clustername: Clusterserver01

Viruelle IP: 162.23.22.100

Subnetmask: 255.255.254.0

 

1. Node: Clusterserver02

NIC1: 162.23.22.101

Subnetmask: 255.255.254.0

Gateway: 162.23.22.1

NIC2: 192.168.22.101

Subnetmask: 255.255.255.0

Gateway: 192.168.22.1

 

2. Node: Clusterserver02

NIC1: 162.23.22.102

Subnetmask: 255.255.254.0

Gateway: 162.23.22.1

NIC2: 192.168.22.102

Subnetmask: 255.255.255.0

Gateway: 192.168.22.1

 

Der Switch ist per LWL mit einen LWL Verteiler angeschlossen, der wiederum an alle ander Schränke verteilt. Die anderen Server inkl. der Nodes sind ohne Probleme zu erreichen.

Auch aus einem anderen Netz ist der Cluster immer erreichbar.

 

Danke für Infos!

bearbeitet von Andy_Ladde
Link zu diesem Kommentar

Sieht soweit richtig aus, zumindest was die Cluster Gruppe "Cluster Group" angeht.

Sieht so aus, daß Du eine NIC für den Client Access (Public NIC) und eine für die interne Cluster Kommunikation (Heartbeat NIC) hast - passt auch.

Für die Heartbeat NIC gibt MS folgende Empfehlungen: http://support.microsoft.com/kb/258750/en-us

 

Sicher, daß das Routing und die Netzwerk-Anbindung physikalisch absolut sauber ist?

 

Schau Dir auch mal die cluster.log an (%systemroot%\Cluster), ob Fehler vom Typ ERR oder WARN geloggt sind.

Link zu diesem Kommentar

Ich habe jetzt die Empfehlungen mal nachvollzogen, aber es klappt nicht. Ich denke schon das der Switch und die Anbindung funktioniert, denn es sind noch 10 andere Server im Schrank die keine Probleme haben. Auch die Nodes ist ja von allen Servern aus ohne Probleme erreichbar. Nur halt eben die Virtulle IP nicht.

 

Hab mal nen Teil des Logs rein kopiert, die meisten errors wiederholen sich. Vielleicht sollte ich den Cluster noch mal per cmd erstellen und nicht per wizzard..

 

Der Cluster wurde mit nen DomainAdmin ACC erstellt.

 

 

Windows IP Configuration

 

Host Name . . . . . . . . . . . . : clusterserver02

Primary Dns Suffix . . . . . . . : mydomain.net

Node Type . . . . . . . . . . . . : Hybrid

IP Routing Enabled. . . . . . . . : No

WINS Proxy Enabled. . . . . . . . : No

DNS Suffix Search List. . . . . . : mydomain.net

 

Ethernet adapter Puplic Connection:

 

Connection-specific DNS Suffix . :

Description . . . . . . . . . . . : Broadcom BCM5708C NetXtreme II GigE

Physical Address. . . . . . . . . : 00-18-8B-82-23-71

DHCP Enabled. . . . . . . . . . . : No

IP Address. . . . . . . . . . . . : 162.23.22.100

Subnet Mask . . . . . . . . . . . : 255.255.254.0

IP Address. . . . . . . . . . . . : 162.23.22.101

Subnet Mask . . . . . . . . . . . : 255.255.254.0

Default Gateway . . . . . . . . . : 162.23.22.1

DNS Servers . . . . . . . . . . . : 162.23.22.60

162.23.22.61

Primary WINS Server . . . . . . . : 162.23.22.61

Secondary WINS Server . . . . . . : 162.23.22.60

 

Ethernet adapter Internal Connection:

 

Connection-specific DNS Suffix . :

Description . . . . . . . . . . . : Broadcom BCM5708C NetXtreme II GigE #2

Physical Address. . . . . . . . . : 00-18-8B-82-23-73

DHCP Enabled. . . . . . . . . . . : No

IP Address. . . . . . . . . . . . : 10.10.10.10

Subnet Mask . . . . . . . . . . . : 255.0.0.0

Default Gateway . . . . . . . . . :

NetBIOS over Tcpip. . . . . . . . : Disabled

Link zu diesem Kommentar

00000df8.00000dac::2010/06/09-15:47:01.316 INFO [CS] Cluster Service started - Cluster Node Version 4.3790

00000df8.00000dac::2010/06/09-15:47:01.316 INFO OS Version 5.2.3790 - Service Pack 2 (ADS 03000112L)

00000df8.00000dac::2010/06/09-15:47:01.316 INFO Local Time is 2010/06/09-17:47:01.316

00000df8.00000900::2010/06/09-15:47:01.316 INFO [CS] Service Starting...

00000df8.00000900::2010/06/09-15:47:01.316 INFO [iNIT] ClusterInitialize called to start cluster.

00000df8.00000900::2010/06/09-15:47:01.316 INFO [EP] Initialization...

00000df8.00000900::2010/06/09-15:47:01.316 INFO [DM] Initialization

00000df8.00000900::2010/06/09-15:47:01.316 ERR [DM] DmInitialize: The hive was loaded- rollback, unload and reload again

 

00000df8.00000900::2010/06/09-15:47:01.925 WARN [NM] Failed to open cluster parameters key, status 2.

00000df8.00000bcc::2010/06/09-15:47:35.972 WARN [JOIN] JoinVersion data for sponsor 172.24.32.100 is invalid, status 1722.

00000df8.00000900::2010/06/09-15:47:35.972 INFO [JOIN] Got out of the join wait, CsJoinThreadCount = 1.

00000df8.00000900::2010/06/09-15:47:35.972 ERR [JOIN] Unable to connect to any sponsor node.

00000df8.00000900::2010/06/09-15:47:35.972 WARN [iNIT] Failed to join cluster, status 53

00000df8.00000900::2010/06/09-15:47:35.972 INFO [iNIT] Attempting to form cluster Clusterserver01

 

00000df8.00000900::2010/06/09-15:47:35.972 INFO [API] Online read only

00000df8.00000900::2010/06/09-15:47:35.972 ERR [FM] Failed to get quorum disk signature, error 2.

00000df8.00000900::2010/06/09-15:47:36.128 WARN [DM] DmpGetRegistrySequence failed 2

00000df8.00000900::2010/06/09-15:47:36.394 WARN [NMJOIN] Cluster Instance ID not found in cluster database, status 2.

00000df8.00000900::2010/06/09-15:47:38.378 ERR [FM] FmpSetGroupEnumOwner:: MM returned MM_INVALID_NODE, chose the default target

00000e00.00000e58::2010/06/09-15:47:38.378 ERR IP Address <Cluster IP Address>: Unable to open node parameters key, status 2.

00000e00.00000efc::2010/06/09-15:47:38.378 WARN Network Name <Cluster Name>: Unable to read ResourceData parameter, error=2

00000e00.00000efc::2010/06/09-15:47:38.378 WARN Network Name <Cluster Name>: Unable to read CreatingDC parameter, error=2

00000e00.00000b5c::2010/06/09-15:47:38.519 WARN IP Address <Cluster IP Address>: Patch with network GUID 5f5086a2-b62a-4845-a8d5-cdbab79d67c1, status 0.

00000e00.00000b5c::2010/06/09-15:47:38.519 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry.

00000df8.00000dec::2010/06/09-15:47:38.894 WARN [NM] Network 5f5086a2-b62a-4845-a8d5-cdbab79d67c1 (Local Area Connection) is up.

00000df8.00000dd8::2010/06/09-15:47:38.894 WARN [NM] Network e9d85338-4ed2-4780-a3f6-0f415e2162c7 (Custer-intern) is up.

Link zu diesem Kommentar

00000794.000007a0::2010/06/10-07:35:16.224 WARN [MM] MmQuorumArbitrationTimeout 60.

00000c0c.00000c1c::2010/06/10-07:35:16.698 INFO IP Address <Cluster IP Address>: Resource open, resource ID = 680656.

00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] FmpRmCreateResource: created resource d8961702-bc3c-45db-8076-59a5772899dc, resid 1064112

00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] Initializing resource c7e3670e-86dc-4824-9335-0cbbc9d28c70 from the registry.

00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] Name for Resource c7e3670e-86dc-4824-9335-0cbbc9d28c70 is 'Cluster Name'.

00000794.000007a0::2010/06/10-07:35:16.698 INFO [FM] FmpRmCreateResource: creating resource c7e3670e-86dc-4824-9335-0cbbc9d28c70 in shared resource monitor

00000c0c.00000c24::2010/06/10-07:35:16.698 WARN Network Name <Cluster Name>: Unable to read ResourceData parameter, error=2

00000c0c.00000c24::2010/06/10-07:35:16.698 WARN Network Name <Cluster Name>: Unable to read CreatingDC parameter, error=2

00000c0c.00000c24::2010/06/10-07:35:16.698 INFO Network Name <Cluster Name>: Successful open of resid 690344

00000c0c.00000c50::2010/06/10-07:35:16.714 INFO IP Address <Cluster IP Address>: Checking for network match: network masks 00FEFFFF=00FEFFFF and addresses 642018AC^002018AC, role 2.

00000c0c.00000c50::2010/06/10-07:35:16.714 INFO IP Address <Cluster IP Address>: Online: Opened object handle for netinterface be63cf25-1157-4009-bbbc-6f5516e706c3.

00000c0c.00000c50::2010/06/10-07:35:16.714 INFO IP Address <Cluster IP Address>: Online: Registered notification for netinterface be63cf25-1157-4009-bbbc-6f5516e706c3.

00000c0c.00000c50::2010/06/10-07:35:16.714 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry.

00000c0c.00000c50::2010/06/10-07:35:17.727 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry.

00000c0c.00000c50::2010/06/10-07:35:18.739 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry.

00000794.000007a4::2010/06/10-07:35:18.755 INFO [NM] Interface be63cf25-1157-4009-bbbc-6f5516e706c3 is up (node: Clusterserver02, network: Puplic Connection).

00000794.000007a4::2010/06/10-07:35:18.755 WARN [NM] Network 5f5086a2-b62a-4845-a8d5-cdbab79d67c1 (Puplic Connection) is up.

00000794.00000c40::2010/06/10-07:35:18.755 WARN [NM] Network b6ab46c9-64fd-4a1e-9e49-88931c2d3707 (Internal Connection) is up.

00000c0c.00000c5c::2010/06/10-07:35:22.805 WARN IP Address <Cluster IP Address>: WorkerThread: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 changed to state 3.

Link zu diesem Kommentar

00000c0c.00000c9c::2010/06/10-07:35:22.805 WARN Network Name <Cluster Name>: Unable to read ResourceData parameter, error=2

00000c0c.00000c9c::2010/06/10-07:35:22.884 INFO Network Name <Cluster Name>: Replaced DNS name Clusterserver01.mydomain.net with IP Address 162.23.22.100 over adapter 'Puplic Connection'.

00000c0c.00000c9c::2010/06/10-07:35:22.884 INFO Network Name <Cluster Name>: Registered DNS PTR record 100.22.23.162.in-addr.arpa. for host Clusterserver01.mydomain.net over adapter 'Puplic Connection'

00000c0c.00000c9c::2010/06/10-07:35:22.884 INFO Network Name <Cluster Name>: Modified DNS name Clusterserver01.mydomain.net with IP Address 162.23.22.100 over adapter 'Puplic Connection'.

00000c0c.00000c9c::2010/06/10-07:35:23.137 INFO Network Name <Cluster Name>: Registered server name Clusterserver01 on transport \Device\NetBt_If1.

00000c0c.00000c9c::2010/06/10-07:35:27.701 INFO Network Name <Cluster Name>: Registered workstation name Clusterserver01 on transport \Device\NetBt_If1.

00000c0c.00000c9c::2010/06/10-07:35:27.701 INFO Network Name <Cluster Name>: Network Name Clusterserver01 is now online

00000794.000007c8::2010/06/10-07:35:36.940 WARN [FM] FmDeleteResourceType: Resource type Microsoft Message Queue Server does not exist...

00000794.000007a0::2010/06/10-07:35:36.956 WARN [EVT] Set propagation state to 0001

00000794.00000c90::2010/06/10-07:35:37.699 WARN [FM] FmDeleteResourceType: Resource type IIS Server Instance does not exist...

00000794.000007c8::2010/06/10-07:35:37.793 WARN [FM] FmDeleteResourceType: Resource type SMTP Server Instance does not exist...

00000794.000007c0::2010/06/10-07:35:37.904 WARN [FM] FmDeleteResourceType: Resource type NNTP Server Instance does not exist...

00000794.00000c90::2010/06/10-07:35:37.999 WARN [FM] FmDeleteResourceType: Resource type IIS Virtual Root does not exist...

00000794.000007c8::2010/06/10-07:35:38.093 WARN [FM] FmDeleteResourceType: Resource type Time Service does not exist...

Link zu diesem Kommentar
Ich denke schon das der Switch und die Anbindung funktioniert, denn es sind noch 10 andere Server im Schrank die keine Probleme haben.

 

Die haben aber auch keine virtuellen IP Adressen. ;) Was für ein Switch hängt denn nun im Netz an der Cluster hängt?

 

Hab mal nen Teil des Logs rein kopiert, die meisten errors wiederholen sich. Vielleicht sollte ich den Cluster noch mal per cmd erstellen und nicht per wizzard..

 

Wenns dich beruhigt, ich habe bisher noch nie einen Windows 2003 Cluster per cmd erstellt und es hat trotzdem immer funktioniert.

 

Tippfehler kannst du ausschliessen?

 

Bye

Norbert

Link zu diesem Kommentar

Im Log ist sichtbar, daß die Netzwerkverbindungen umbenannt wurden auf "Puplic Connection" und "Internal Connection", das ist aber kein Problem.

Ansonsten sind die letzten beiden Startvorgänge und Logeinträge weitestgehend sauber.

 

Die beiden Einträge vom Typ Warning machen mich stutzig:

00000c28.00000c70::2010/06/10-07:06:40.925 WARN IP Address <Cluster IP Address>: NetInterface be63cf25-1157-4009-bbbc-6f5516e706c3 is not available. Wait & retry.

 

Deine NetInterfaces sind

5f5086a2-b62a-4845-a8d5-cdbab79d67c1 (Puplic Connection).

b6ab46c9-64fd-4a1e-9e49-88931c2d3707 (Internal Connection).

 

Was ist die be63cf25-1157-4009-bbbc-6f5516e706c3?

 

Hast Du noch eine dritte Netzwerkverbindung/NIC?

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...