Jump to content

System stürzt immer wieder ab.


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo,

 

Hier in unserer Firma steht ein Dual-Opteron-Server mit Windows 2k3, der seit gestern immer wieder abstürzt. Die Abstürze sind so dramatisch, dass nicht einmal der Reset-Button den Server wieder zum Leben erweckt, es hilft also nur noch "Strom weg".

 

Nach dem Neustart erhalte ich immer 4 Ereignisse 107 von WMIxWDM ("Das gemeldete Computerüberprüfungsereignis ist ein schwerwiegender Fehler").

 

Vor dem Crash erhalte ich insgesamt 5 Warnungen:

1. Quelle: Server, ID: 2504, Beschreibung: Der Server konnte zu der Transportschicht \Device\Nwlnklpx keine Verbindung herstellen.

 

2. Quelle: LsaSrv, ID: 40960, Beschreibung: Das Sicherheitssystem hat einen Authentifizierungsfehler für den Server <host>@<domäne> festgestellt ...

 

3. Quelle: LsaSrv, ID: 40961, Beschreibung: Das Sicherheitssystem konnte keine sichere Verbindung mit dem Server <host>@<domäne> herstellen. ...

 

4. wie 2.

 

5. wie 3.

 

Davor meldet eventlog im Event 6008 wann das System zuletzt unerwartet heruntergefahren wurde.

 

Die WMI-Logdatei wmiprov.log enthält für die Ausfallzeiten immer immer 6 Einträge:

 

1. WDM call returned error: 4200

2.-5. Received Event

6. WDM call returned error: 4200

 

Ich vermute nun ein Netzwerkproblem, möglicherweise Netzwerkkarte defekt. Da ich aber auch schon in einem anderen Forum gelesen habe, dass evtl. das Netzteil hinüber ist, will ich nicht auf gut Glück irgendwelche Hardware auswechseln, an der es am Ende vielleicht garnicht lag.

 

Jetzt meine Fragen:

 

Weiß jemand, wovon die Abstürze kommen können?

Wie kann ich das Problem eingrenzen oder gar die Ursache sicher finden?

Hat sonst jemand nen Rat für mich?

 

Beste Grüße und vielen Dank im Voraus.

 

Falk

Link zu diesem Kommentar

Hallo und willkommen im Board!

 

Ich würde die Events mal auswerten, und zwar folgendermasen:

 

http://www.microsoft.com/technet/support/eventserrors.mspx

http://www.eventid.net/

 

 

Ich denke auch, dass es von der Hardware kommt. Schon alleine das Steckerziehen deutet schwer darauf hin.

Ansonsten mit dem Hersteller sich in Verbindung setzen. ;)

 

Greetz

Velius

Link zu diesem Kommentar

@Velius:

 

Danke für den Tipp, auch wenn ich schon bei eventid.net war.

 

 

Mittlerweile weiß ich, dass die Abstürze immer mit einer Datenbanksicherung des Sybase ASA zusammenfallen. Die DB-Sicherung kann jedoch selbst kaum das Problem sein, denn diese läuft stündlich, also in ca. 90 % aller Fälle ohne Absturz.

 

Ich vermute nun, dass während der Sicherung aufgrund der hohen Last für das System auf RAM-Speicherbereiche zugegriffen wird, die fehlerhaft sind, also werde ich als nächstes den RAM testen.

 

Kann mir diesbezüglich jemand sagen, welches Tool dafür in Frage kommt? Ich habe gelesen, dass Memtest86 nicht mit einem Opteron klarkommt. Weiß jemand, ob das Microsoft-RAM-Diagnosetool funktioniert?

 

Beste Grüße

 

Falk

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...