Jump to content

Rechner stürzt alle 1-2 Wochen ab


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Ich habe einen neuen Server (Win2008 SBS), der ca. 1 mal pro Woche abstürzt. Die Hardware ist umfangreich getestet. Der Rechner stürzt ab, wenn er eine Woche unter Volllast läuft aber genau so, wenn er gar nichts macht.

Der Rechner ist noch via IPMI erreichbar.

 

Hardware

Board: Supermicro X8SIE-F Rev. 1.02 (Firmware Revision : 02.01)

Ram: 4 x 4GB Kingston KVR1333D3D8R9S

Festplatten: 3 x WD3202ABYS 7200U/m 16MB 3,5" (8,9cm) SATA II

(als Raid 5)

Netzteil: be quiet! 550W System Power BN091 / 80+

DVD: Toshiba SH-D163

CPU: INTEL XEON X3430 2400MHz 8MB LGA1156 BX80605X3430

 

 

Ram

Kingston Technology Company - Kingston Memory Search - Search Results for: KVR1333D3D8R9S/4GHB

 

- Das Mainboard habe ich bereits getauscht

- Ram Module sind getestet (OK)

- HDD sind getestet (OK)

- CPU Stresstest 3 Tage (OK)

Link zu diesem Kommentar

Hallo Thi013

Ich habe einen neuen Server (Win2008 SBS), der ca. 1 mal pro Woche abstürzt

Das Problem gab es schon häufiger. Hättest Du die Forensuche angestrengt, dann wüstest Du schon vorher, welche Fragen ich Dir nun stelle:

 

Gibt es Fehler im Ereignisprotokoll?

 

Blauer Bildschirm oder andere Meldung?

 

NW-Karte von Intel?

 

Welche Software ist noch installiert?

Link zu diesem Kommentar
Hallo Thi013

1. Gibt es Fehler im Ereignisprotokoll?

2. Blauer Bildschirm oder andere Meldung?

3. NW-Karte von Intel?

4. Welche Software ist noch installiert?

 

1. Ereignisprotokoll "System" 2 Fehler

- "Das System wurde zuvor am ... um ... unerwartet herunter gefahren"

- "Das Laden folgender Systemstarttreiber ist fehlgeschlagen: storflt"

 

2. Kein Blauer Bildschirm. Der Bildschirm hat kein Signal. (schwarz) Der Rechner läuft aber.

 

3. Intel® 82574L Gigabit Ethernet Controller

 

4. Bis jetzt läuft nur der SBS 2008 auf dem Server.

Link zu diesem Kommentar

Hallo Thi013,

 

den storflt-Fehler kannst Du ignorieren oder damit weg bekommen:

Event logged reporting storflt driver failed to load on restart after you install Windows Server 2008 SP2

 

Board: Supermicro X8SIE-F Rev. 1.02 (Firmware Revision : 02.01)

Bezieht sich das nicht auf die IPMI-Firmware?

 

Hier mal das, was ich auf der Hersteller-Website gefunden haben:

 

X8SIE-F IPMI_8SI6 R 2.01 SMT_201_0721.zip IPMI Firmware

Und:

X8SIE-F: 8SIE R 1.0c x8sie0.zip x8sie0.exe Intel 3420 chipset ECC DDR3 support

 

R 1.02 konnte ich gar nicht finden :confused:

 

Kontrolliere besser noch mal, ob Du wirklich die aktuellste Firmware verwendest.

 

Bei der INTEL Netzwerkkarte würde ich auf jeden Fall die Treiber von Microsoft nehmen. Die Intel-Treiber (zumindest die Älteren) mancher NW-Karten haben sich schon für manches Fehlverhalten verantwortlich gezeigt.

 

Da gibt es auch noch einige Hotfixes, die den Systemtreiber TCPIP.sys ersetzen. Allerdings gibt es dort immer einen STOP-Fehler, was ja bei Dir nicht der Fall ist :suspect:

 

Wenn der Bildschirm schwarz wird, würde ich vom Gefühl her auch die Grafikkarte verdächtigen.

Link zu diesem Kommentar

Mein Server ist nun gerade wieder abgestürzt. Ich habe nun die Möglichkeit, den Zustand noch einmal zu testen:

- Der Server ist via IPMI erreichbar

- IPMI sagt zum Power Status "Host is currently on".

- ein Ping auf die Netzwerkkarte geht nicht

- Der Monitor bekommt kein Signal

- Es gibt keinen Bluescreen (der Bildschirm ist schwarz)

- Der Server reagiert nicht auf die Tastatur (bspw. NUM on/off hat keine Reaktion)

- Das IPMI Event Log ist leer.

- Die IPMI Sensoren (Spannung, Temperatur usw.) zeigen alle den Status "normal" an.

 

1. was kann ich noch testen?

2. was kann abgestürzt sein? Wäre ein Programm abgestürzt, hätte ich eine Exception erhalten und der Server würde noch reagieren. Sollte ein Treiber den Fehler verursacht haben, ist dies natürlich anders. Treiber laufen in einer tieferen Schicht. Treiber werden aber von Microsoft zertifiziert um genau das zu vermeiden. Und das DDK erhällt nicht jeder.

3. Warum ist der Server nicht aus oder startet neu? In welchem Zustand ist der Server jetzt?

Link zu diesem Kommentar

Moin,

 

wenn ein Treiber auf Kernelebene einen Fehler verursacht, gibt es einen Bluescreen. Dein Phänomen ist also entweder ganz anders gelagert, oder es ist so tiefgreifend, dass es das Betriebssystem sogar am Auslösen des Stop-Mechanismus hindert, der den Bluescreen erzeugt. Das nur zur Einordnung. Weitere zielführende Hinweise habe ich aus der Ferne leider nicht.

 

Bei einem Markenserver würde ich raten, den Herstellersupport einzuschalten. Das wird hier mangels Markenhersteller nicht gehen. Vielleicht ein Hinweis für die nächste Hardwareauswahl ...

 

Gruß, Nils

Link zu diesem Kommentar
Moin,

 

wenn ein Treiber auf Kernelebene einen Fehler verursacht, gibt es einen Bluescreen. Dein Phänomen ist also entweder ganz anders gelagert, oder es ist so tiefgreifend, dass es das Betriebssystem sogar am Auslösen des Stop-Mechanismus hindert, der den Bluescreen erzeugt. Das nur zur Einordnung. Weitere zielführende Hinweise habe ich aus der Ferne leider nicht.

Bei einem Markenserver würde ich raten, den Herstellersupport einzuschalten. Das wird hier mangels Markenhersteller nicht gehen. Vielleicht ein Hinweis für die nächste Hardwareauswahl ...

Gruß, Nils

 

Danke für die Info. Das würde bedeuten, dass elementare Systeme den Fehler verursachen, die im Normalfall alle auf dem Meinboard sein sollten (Speichercontroller, SATA Controller, Southbridge, Northbridge...)

Damit würde ein Mainboardwechsel mit hoher Wahrscheinlichkeit das Problem beheben?

 

Bisher habe ich mit Supermicro gute Erfahrungen gemacht. Das X8SIE-F wäre das erste Board, das Probleme bereitet. Könnt Ihr ein Board empfehlen?

 

Den Ram habe ich getestet. Die Frage wäre hier, in wie weit man sich auf den Ram Test verlassen kann. Habt Ihr da Erfahrungen?

Link zu diesem Kommentar

Moinm

 

Das würde bedeuten, dass elementare Systeme den Fehler verursachen, die im Normalfall alle auf dem Meinboard sein sollten

[...]

Damit würde ein Mainboardwechsel mit hoher Wahrscheinlichkeit das Problem beheben?

 

das habe ich beides nicht behauptet. Es wäre Spekulation.

 

Könnt Ihr ein Board empfehlen?

 

Für Produktionsserver empfehle ich ausschließlich Marken-Hardware, bei denen sich im Zweifel der Hersteller mit solchen Problemdetails herumschlagen muss und nicht ich ...

 

Gruß, Nils

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...