Jump to content
Sign in to follow this  
Peter Diebold

Täglicher 03 Serverabsturz mit Neustart

Recommended Posts

Hallo zusammen,

 

ich habe auf unserem SBS2003 Server seit Monaten jede nacht um 00:29:xxh einen Serverneustart. Leider ist es uns nicht gelungen den Fehler bzw die Ursache dafür herauszufinden. Auch das Debugging des Memory.dmp ist wenig aufschlussreich. Zumindest wissen wir das aus welchen gründen auch immer csrss.exe mit am STOP beteiligt ist. Ich habe den Debugging-Bericht mal hier drangehängt.

Wer kann mir da helfen?

 

Microsoft ® Windows Debugger Version 6.6.0003.5

Copyright © Microsoft Corporation. All rights reserved.

 

*******************************************************************************

* *

* Bugcheck Analysis *

* *

*******************************************************************************

 

CRITICAL_OBJECT_TERMINATION (f4)

A process or thread crucial to system operation has unexpectedly exited or been

terminated.

Several processes and threads are necessary for the operation of the

system; when they are terminated (for any reason), the system can no

longer function.

Arguments:

Arg1: 00000003, Process

Arg2: 89c4d020, Terminating object

Arg3: 89c4d184, Process image file name

Arg4: 80965a86, Explanatory message (ascii)

 

Debugging Details:

------------------

 

PROCESS_OBJECT: 89c4d020

 

IMAGE_NAME: csrss.exe

 

DEBUG_FLR_IMAGE_TIMESTAMP: 0

 

MODULE_NAME: csrss

 

FAULTING_MODULE: 00000000

 

EXCEPTION_RECORD: b99d09dc -- (.exr ffffffffb99d09dc)

ExceptionAddress: 7597b705

ExceptionCode: c0000006 (In-page I/O error)

ExceptionFlags: 00000000

NumberParameters: 3

Parameter[0]: 00000000

Parameter[1]: 7597b705

Parameter[2]: c000009d

Inpage operation failed at 7597b705, due to I/O error c000009d

 

EXCEPTION_CODE: (NTSTATUS) 0xc000009d - STATUS_DEVICE_NOT_CONNECTED

 

DEFAULT_BUCKET_ID: DRIVER_FAULT

 

PROCESS_NAME: csrss.exe

 

CURRENT_IRQL: 0

 

ERROR_CODE: (NTSTATUS) 0xc0000006 - Die Anweisung "0x%08lx" verweist auf Speicher bei "0x%08lx". Die Daten wurden wegen eines E/A-Fehlers in "0x%08lx" nicht in den Arbeitsspeicher bertragen.

 

IO_ERROR: (NTSTATUS) 0xc000009d - STATUS_DEVICE_NOT_CONNECTED

 

EXCEPTION_STR: 0xc0000006_c000009d

 

FAULTING_IP:

+7597b705

7597b705 ?? ???

 

BUGCHECK_STR: 0xF4_IOERR_C000009D

 

STACK_TEXT:

b99d0528 809a222d 000000f4 00000003 89c4d020 nt!KeBugCheckEx+0x1b

b99d054c 80965a3c 80965a86 89c4d020 89c4d184 nt!PspCatchCriticalBreak+0x75

b99d057c 80834d3f ffffffff c0000006 b99d09b4 nt!NtTerminateProcess+0x7a

b99d057c 8083d3a9 ffffffff c0000006 b99d09b4 nt!KiFastCallEntry+0xfc

b99d05fc 8085b4a1 ffffffff c0000006 b99d09fc nt!ZwTerminateProcess+0x11

b99d09b4 8087d22d b99d09dc 00000000 b99d0d64 nt!KiDispatchException+0x390

b99d0d34 8083869f 0068fbb0 0068fbd0 00000000 nt!KiRaiseException+0x120

b99d0d50 80834d3f 0068fbb0 0068fbd0 00000000 nt!NtRaiseException+0x33

b99d0d50 7597b705 0068fbb0 0068fbd0 00000000 nt!KiFastCallEntry+0xfc

WARNING: Frame IP not in any known module. Following frames may be wrong.

0068feb8 00000000 00000000 00000000 00000000 0x7597b705

 

STACK_COMMAND: kb

 

FOLLOWUP_NAME: MachineOwner

 

FAILURE_BUCKET_ID: 0xF4_IOERR_C000009D_IMAGE_csrss.exe

 

BUCKET_ID: 0xF4_IOERR_C000009D_IMAGE_csrss.exe

 

Followup: MachineOwner

---------

Share this post


Link to post
Share on other sites

also wenn mein server jeden tag um die gleiche zeit abstürzt bzw. neu startet dann würde ich mal zuerst schauen ob es für 0:30 einen geplanten task oder at gibt. evtl löst ja ein task genau um die uhrzeit den fehler aus! hast du das schon kontrolliert?

Share this post


Link to post
Share on other sites

Kuckst du hier:

 

 

http://support.microsoft.com/kb/228753/en-us

 

0xC000009D, or STATUS_DEVICE_NOT_CONNECTED: bad cabling, non-termination, or the controller is not able to obtain access to the hard disk.

 

 

Klingt als müsste man mal Checkdisk laufen lassen, oder die physische Konsistenz der Sektoren auf den Platten prüfen.

 

 

Gruss

Velius

Share this post


Link to post
Share on other sites

Es geht ja nicht um den Controller, der Mist baut, sondern um einen Sektor der möglicherwiese defekt ist. Kann gut sein, dass dieser bei einem wiederholten Vorgang abgefragt wird (z.B.: Exchange maintenance...).

 

 

Einfach mal ausführen, dann wisst ihr mehr. ;)

Share this post


Link to post
Share on other sites

Prüft doch mal ob um 00.30 zufällig Windows update läuft.

Oder eine tägliche Sicherung?

 

Ich hatte ein ähnliches Problem mit einem SBS2003, die Sicherung (orig. backup) wurde auf einer anderen Partition gemacht, hier schlug die Größenbegrenzung (4GB) zu, da diese Partition dummerweise FAT statt NTFS war.

 

Vielleicht hilft es ja.

Share this post


Link to post
Share on other sites

Nachdem wir unsere Platten schon mehrmals auch mit Systemstart auf fehler geprüft haben, habe ich Velius Ratschlag befolgt und den möglichen Start der Exchange maintenance überprüft und mit 00:00h - 04:00h festgestellt. Da ich jetzt zur Bürozeit nichts von Hand starten kann habe ich mal zum Test die Startzeit für heute Nacht um 30min verzögert.

Wenn hier der Fehler liegen sollte, dürfte der Server erst um 0:59:xxh stehenbleiben.

 

buiton meinte Sicherung, ist es nicht, die läuft früher am Vorabend, Datensicherung auf externe Platten mit NTFS :)

 

Santiago meint, Defragmentierung, die läuft aber erst nach 1:30h :)

Share this post


Link to post
Share on other sites

Also, mein Problem ist leider nicht um 30min. nach hinten gerutscht. Der Exchange Server maintenance task hat wohl auch nichts mit dem abschmieren des Servers zu tun.

Um auch Plattenfehler nochmal auszuschliessen habe ich nach Büroschluss chckdisk für alle Platten bei Systemstart laufen lassen. Kein Problem erkannt.

 

Wer hat noch Ideen?

 

Danke

Peter

Share this post


Link to post
Share on other sites

Hast du auch das RAID Toll des Herstellers laufen lassen? Wenn du mit einem Hardware RAID arbeitest kann Chkdsk lediglich die logische Integrität des Datenträgers überprüfen, nicht die physische.

Share this post


Link to post
Share on other sites

Danke Velius,

das habe ich in der tat noch nicht gemacht. Aber da das natürlich wiederum beim Booten gemacht wird, muss ich wieder mal Überstunden machen.

Ergebnis wird morgen bekannt gemacht.

 

Danke einstweile!

Peter

Share this post


Link to post
Share on other sites

Danke Maverice, werde das noch mal überprüfen.

 

Also meine Raid- Disk Verify gestern Abend hat leider auch kein Ergebnis gebracht. Wieder 3h umsonst im Büro verbracht.

 

Was könnte ich noch tun um dem Auslöser auf die Spur zu kommen?

 

Danke

Peter

Share this post


Link to post
Share on other sites

Im Klartext heißt das, dass die csrss.exe eine Seite in den Speicher einlagern wollte, dies ist jedoch fehlgeschlagen (Status 0xc0000006), weil ein E/A (Ein/Ausgabe) Fehler aufgetreten ist. Als Hauptfehler wird der Status DEVICE_NOT_CONNECTED (Gerät nicht angeschlossen) ausgegeben.

 

Das führte dazu, dass die csrss.exe beendet wurde (BugCheck 0xF4 CRITICAL_OBJECT_TERMINATION). Normalerweise führt das in Deinem Falle auch noch oder nur zu BugCheck 0xC000021A. In beiden Fällen wird das System aber heruntergefahren.

 

Das Problem ist jetzt, dass man herrausfinden muss, welches Gerät sich unplanmäßig vom System trennt und vorallem, warum es sich trennt. Leider läßt sich das aus dem .log nicht wirklich entnehmen. Als Hauptursache für einen Einlagerungsfehler kommen in Frage: Speicher, Memory Controller (CPU), ATA Controller, Festplatte oder die Treiber für die Komponenten. Timing Fehler in Verbindung mit der Festplatte können auch dafür verantwortlich sein (Nach einer gewissen Häuffigkeit an Fehlern trennt das System die Platte ab). Spannungsschwankungen auf der +12V/+5V Leitung konnen auch zum abtrennen eines Laufwerkes führen (von daher Netzteil nicht ausgeschlossen).

 

http://support.microsoft.com/kb/130801/de

 

Kabel wechseln incl. terminierung

Controller-Fehler oder defekt (Firmware update auf die HW)

 

http://searchwinit.techtarget.com/tip/0,289483,sid1_gci841587,00.html

Share this post


Link to post
Share on other sites
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte überlege Dir, ob es nicht sinnvoller ist ein neues Thema zu erstellen.

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this  

Werbepartner:



×
×
  • Create New...