Jump to content

Unerwarteter Reboot - WHEA-Logger-Eintrag


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Hallo zusammen

 

Hab hier einen Server der unerwartete beendet wurde am Wochenende.

Neben diesem Eintrag ist noch folgendes nach dem Neustart zu finden:

 

Protokollname: System

Quelle: Microsoft-Windows-WHEA-Logger

Datum: 04.04.2009 15:03:47

Ereignis-ID: 19

Aufgabenkategorie:Keine

Ebene: Warnung

Schlüsselwörter:

Benutzer: LOKALER DIENST

Computer: ************

Beschreibung:

Behobener Hardwarefehler.

Fehlerquelle: Behobene Computerüberprüfung

Fehlertyp: Bus-/Verbindungsfehler

Prozessor-ID gültig: Ja

Prozessor-ID: 0x2

Steckplatznummer: 0

Transaktionstyp: Nicht zutreffend

Prozessorteilnahme: Lokaler Knoten ist Ursprung der Anforderung

Anforderungstyp: Generischer Fehler

Arbeitsspeicher/EA: Arbeitsspeicher

Arbeitsspeicher-Hierarchieebene: Ebene 0

Zeitlimit: Nein

Ereignis-XML:

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">

<System>

<Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" />

<EventID>19</EventID>

<Version>0</Version>

<Level>3</Level>

<Task>0</Task>

<Opcode>0</Opcode>

<Keywords>0x8000000000000000</Keywords>

<TimeCreated SystemTime="2009-04-04T13:03:47.718Z" />

<EventRecordID>16320</EventRecordID>

<Correlation ActivityID="{03D560C6-2E65-4CF3-AF99-326F0ABC3885}" />

<Execution ProcessID="1064" ThreadID="1528" />

<Channel>System</Channel>

<Computer>************</Computer>

<Security UserID="S-1-5-19" />

</System>

<EventData>

<Data Name="ApicIdValid">1</Data>

<Data Name="ApicId">0x2</Data>

<Data Name="MCABank">0</Data>

<Data Name="MciStat">0xd200084000000800</Data>

<Data Name="MciAddr">0x0</Data>

<Data Name="MciMisc">0x0</Data>

<Data Name="ErrorType">10</Data>

<Data Name="TransactionType">256</Data>

<Data Name="Participation">0</Data>

<Data Name="RequestType">0</Data>

<Data Name="MemorIO">0</Data>

<Data Name="MemHierarchyLvl">0</Data>

<Data Name="Timeout">0</Data>

<Data Name="Length">1730</Data>

Link zu diesem Kommentar

Raw datan hab ich mal nicht mitgeposted. die Einträge sind sonst bei weitem zu lange.

Die restlichen auch noch in kurzer Form:

 

 

Protokollname: System

Quelle: Microsoft-Windows-WHEA-Logger

Datum: 04.04.2009 15:04:45

Ereignis-ID: 19

Aufgabenkategorie:Keine

Ebene: Warnung

Schlüsselwörter:

Benutzer: LOKALER DIENST

Computer: ***********

Beschreibung:

Behobener Hardwarefehler.

Fehlerquelle: Behobene Computerüberprüfung

Fehlertyp: Bus-/Verbindungsfehler

Prozessor-ID gültig: Ja

Prozessor-ID: 0x2

Steckplatznummer: 5

Transaktionstyp: Nicht zutreffend

Prozessorteilnahme: Generisch

Anforderungstyp: Generischer Fehler

Arbeitsspeicher/EA: Generisch

Arbeitsspeicher-Hierarchieebene: Generisch

Zeitlimit: Nein

 

 

Protokollname: System

Quelle: Microsoft-Windows-WHEA-Logger

Datum: 04.04.2009 15:05:46

Ereignis-ID: 19

Aufgabenkategorie:Keine

Ebene: Warnung

Schlüsselwörter:

Benutzer: LOKALER DIENST

Computer: ***********

Beschreibung:

Behobener Hardwarefehler.

Fehlerquelle: Behobene Computerüberprüfung

Fehlertyp: Bus-/Verbindungsfehler

Prozessor-ID gültig: Ja

Prozessor-ID: 0x3

Steckplatznummer: 5

Transaktionstyp: Nicht zutreffend

Prozessorteilnahme: Generisch

Anforderungstyp: Generischer Fehler

Arbeitsspeicher/EA: Generisch

Arbeitsspeicher-Hierarchieebene: Generisch

Zeitlimit: Nein

 

 

Hab bis jetzt leider keine Infos gefunden was der WHEA-Logger eigentlich ist und wie man die Einträge interpretiert. Jemand von euch ne Ahnung?

Link zu diesem Kommentar
  • 3 Monate später...

Hallo Deatheye,

 

wir haben einen Server, bei dem dasselbe Problem auftritt.

 

2x Intel Xeon W5580 auf Supermicro X8DTN+ mit 6x8 GB DDR-3 PC3-8500 Reg. ECC

 

Der Fehler tritt sowohl auf Prozessor-ID 0x0 als auch 0x10 auf:

 

Protokollname: System

Quelle: Microsoft-Windows-WHEA-Logger

Datum: 03.08.2009 16:09:16

Ereignis-ID: 19

Aufgabenkategorie:Keine

Ebene: Warnung

Schlüsselwörter:

Benutzer: LOKALER DIENST

Computer: XXXXXXXXXXX.YY.ZZ.de

Beschreibung:

Behobener Hardwarefehler.

 

Fehlerquelle: Behobene Computerüberprüfung

 

Fehlertyp: Speichercontrollerfehler

 

Prozessor-ID gültig: Ja

Prozessor-ID: 0x10

Steckplatznummer: 8

Transaktionstyp: Nicht zutreffend

Prozessorteilnahme: Nicht zutreffend

Anforderungstyp: Nicht zutreffend

Arbeitsspeicher/EA: Nicht zutreffend

Arbeitsspeicher-Hierarchieebene: Nicht zutreffend

Zeitlimit: Nicht zutreffend

 

Habt Ihr mittlerweile eine Lösung des Problems gefunden? Wenn ja: Woran lag es?

 

Wie sah Eure System-Konfiguration aus?

 

Grüße

 

JHD

Link zu diesem Kommentar
Die W-CPUs sind für Workstations gedacht, nicht für Server.

 

Nebenbei: Guckt in das Management-Log des Serviceprozessors (ILO/RSA/IMM/DRAC) - dort sollte sich wesentlich bessere Fehlermeldungen finden lassen.

 

Das ist bekannt. Allerdings haben wir CPUs mit einer hohen Integer-Leistung pro Kern benötigt. Und da konnten die Schleicher aus der 7000er-Reihe nicht mithalten... Aus diesem Grund sind sie nun in einem Server gelandet.

 

Supermicro-Boards unterstützen den offenen Standard "IPMI". Da werden wir jetzt in der Tat noch mal zur Analyse einsteigen, bevor wir das Board tauschen... Kann m. E. nur an einem defekten RAM-Slot liegen...

 

Grüße

 

JHD

Link zu diesem Kommentar
  • 3 Monate später...

Doh, musste gerade intern nach schauen was das genau war, gerade zufällig hier drüber gestolpert. Wir hatten das damals nur einmal. Nach zwei weitern Monaten ohne jemals nochmal einen unerwarteten reboot zu haben haben wir den Fall intern abgeschlossen.

Wir haben also nie wirklich herausgefunden was da genau passiert ist und es passierte bei uns nur einmal.

 

Bei Euch das Problem öfters aufgetretten? Inzwischen behoben? Oder wie bei uns nicht öfter aufgetretten?

Ich kann nur noch nachschauen was das System im moment für ne Hardware hat. Falls allerdings seit dem die HDDs in ein anderes Server gehäuse eingebaut wurden sehe ich das nicht. Könnte also sein, dass zum damaligen Zeitpunkt auch andere Hardware war.

 

Supermicro X7DWN+

1x Intel Xeon E5405

4 x 2 GB DDR 2 ECC PC2-5300

Link zu diesem Kommentar

Bei Euch das Problem öfters aufgetretten? Inzwischen behoben? Oder wie bei uns nicht öfter aufgetretten?

Ich kann nur noch nachschauen was das System im moment für ne Hardware hat. Falls allerdings seit dem die HDDs in ein anderes Server gehäuse eingebaut wurden sehe ich das nicht. Könnte also sein, dass zum damaligen Zeitpunkt auch andere Hardware war.

 

Supermicro X7DWN+

1x Intel Xeon E5405

4 x 2 GB DDR 2 ECC PC2-5300

 

 

Jo, ist bei uns ständig aufgetreten. Dasselbe Problem hatten wir mit einem Austausch-Board der Firma Tyan, mit einer alternativen CPU sowie mit anderen Speichermodulen. Die Maschine war mittlerweile bei Supermicro, wo sie wochenlang nach der Ursache gesucht haben. Mittlerweile gibt es eine Lösung: Im BIOS den C1-State bei den CPU-Einstellungen disablen. Danach tritt der Fehler, der zu dem WHEA-Logger-Eintrag führt, nicht mehr auf... Ist vorerst wohl nur ein Workaround, aber eine endgültige Lösung scheint es noch nicht zu geben. (Wie gesagt: Scheint ein grundsätzliches Problem zu sein, da bei einem Tyan-Board derselbe Fehler aufgetreten ist.)

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...