Hallo!
Ich habe seit geraumer Zeit ein HEFTIGES Problem mit einem unserer DCs und habe inzwischen keine Ideen zur Problemlösung mehr. Ich hoffe ihr könnt mir ein bisschen helfen:
-----
Zunächst zum Server:
Windows Server 2003, 5.2 (3790), alle Updates installiert
Antivirus-Software von Panda
SharePointTeamServices 2 inkl. MS SQL-Server, IIS, ...
VERITAS Netbackup Client Software
DNS
Der Server ist der einzige DC der Domäne, hat aber eine nichttransitive Vertrauensstellung zu einer Windows 2K-Domäne, die wiederum in einen großen 2K-Forest eingebunden ist.
Es ist kein DHCP installiert, sondern es wird der DHCP der vertrauten Domäne benutzt.
----
Nun zum Problem:
Der Server friert in Abständen von ungefähr 4 bis 8 Tagen ein. Leider kann ich nicht weiter beschreiben, wie sich das Problem äußert, weil es immer über Nacht eintritt (fast immer kurz nach Mitternacht) und am nächsten Morgen der Rechner mit dem Reset-Knopf neu gestartet werden muss, weil er nicht mehr reagiert.
Das Ereignisprotokoll füllt sich in dieser Zeit mit vielen Ereignissen:
-Anwendung:
Userenv: Fehler 1058, 1030, 1053, 1054 (in der Reihenfolge in der sie auftreten)
APCPBEAgent (das ist das UPS): Fehler 3000: "Lost Communication With UPS"
W3SVC-WP: Fehler 2269
Zwischen den Abstürzen treten keine Fehlermeldungen auf!
-Sicherheit:
Hier tritt etwas Interessantes auf, das ich nicht richtig deuten kann:
Ereignistyp: Fehlerüberw.
Ereignisquelle: Security
Ereigniskategorie: An-/Abmeldung
Ereigniskennung: 537
Fehlgeschlagene Anmeldung:
Grund: Während der Anmeldung ist ein Fehler aufgetreten.
Benutzername: kkaufmann
Domäne: GENETIK
Anmeldetyp: 3
Anmeldevorgang: NtLmSsp
Authentifizierungspaket: NTLM
Name der Arbeitsstation: ROSE
Statuscode: 0xC0000017
Substatuscode: 0x0
Dabei ist kkaufmann ein Benutzerkonto der vertrauten Domäne! Nicht der Domäne in der das Problem auftritt. Gleiches gilt für die Arbeitsstation ROSE!
Vorher tritt Security, Fehler 673 auf, den ich auch nicht einordnen kann. Da ist aber kein signifikanter Zusammenhang zum Absturzzeitpunkt zu sehen.
- System
Im Wesentlichen scheinen die Fehlermeldungen aus irgendwelchen Ressource-Problemen zu entstehen...
Hier kommen jetzt lauter Meldungen, dass irgendwelche Dienste nicht mehr erreicht werden können oder herunter gefahren werden aus Ressourceprobelemen... z.B.:
Netlogon Fehler 5719: "Der Computer konnte eine sichere Sitzung mit einem Domänencontroller in der Domäne GENETIK *vertraute Domäne* aufgrund der folgenden Ursache:
Für diesen Befehl ist nicht genügend Speicher verfügbar. nicht einrichten. [...]
- Verzeichnisdienst
Auch hier Meldungen. Aber erst etwa eine Stunde nachdem die ersten Meldungen woanders aufgetreten sind...
- DNS:
Etwa 10 Minuten nach den ersten Fehlermeldungen:
Ereignistyp: Fehler
Ereignisquelle: DNS
Ereigniskennung: 4015
Beschreibung:
DNS-Server hat einen kritischen Fehler im Active Directory ermittelt. Stellen Sie sicher, dass das Active Directory ordnungsgemäß funktioniert. [...]
und
Ereignistyp: Fehler
Ereignisquelle: DNS
Ereigniskennung: 4004
Beschreibung:
Der DNS-Server konnte die Aufzählung der Verzeichnisdienste der Zone "_msdcs.mikrobio.aem" nicht vollständig durchführen. Dieser DNS-Server ist so konfiguriert, dass [...]
---
Ich habe auch schon mal versucht ein Leistungsprotokoll mitlaufen zu lassen. Allerdings hat das auch keine Ergebnisse gebracht, da Arbeitsspeicherauslastung und RAM als "normal" aufgenommen wurden in dieser Zeit. Das Problem bei den Leistungsprotokollen ist, dass ich nicht weiß wann der Fehler auftritt...
Da der Fehler immer nachts auftritt wäre es vielleicht interessant welche Dienste oder Prozeduren nachts aktiv werden. Leider kenne ich mich da nicht aus.
Ich wäre da über Hinweise und Tipps SEHR dankbar!!!
Schöne Grüße und vielen Dank schon einmal!
P.S. Wenn Bedarf besteht, kann ich auch noch mal die gesamte Ereignisprotokoll-Log online stellen.