Jump to content

SBS08 - Wiederholte Probleme mit dem DC


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Ich habe vor ca. 2 Wochen einen Thread gestartet wegen einem seltsamen Problem mit einem SBS 2008:

 

http://www.mcseboard.de/windows-forum-ms-backoffice-31/sbs-2008-findet-selbst-dc-mehr-145325.html

 

Heute ist dieses Problem wieder aufgetaucht, und ich habe mir vor dem Neustart des Servers etwas mehr Zeit gelassen - ebenfalls habe ich einen Case mit MS PSS eröffnet, will aber trotzdem hier nochmal posten, vielleicht gibts ja sonst noch Ideen.

 

Neben dem obigen kann ich noch folgendes festhalten:

 

* Logon via remote.domain.ch ist nicht mehr möglich

* Login aus dem LAN via RDP ist Problemlos möglich

* Die Fehler begannen heute morgen um ca. 10:00

* DNS Einträge stimmten (dnsmgmt.msc)

* DNS Auflösung der SRV Records etc. funktionierte

 

Im Eventlog habe ich von ein paar Diensten (Netlogon z.B.) folgende Fehlermeldung gefunden:

 

An operation on a socket could not be performed because the system lacked sufficient buffer space or because a queue was full.

 

dcdiag lieferte folgende Meldung:

 

Auf dem Server CUSTSBS01 ist beim Suchen der LDAP-Suchfunktionsattribute ein Fehler aufgetreten. Rückgabewert = 81

 

Google suchen indizieren ein Problem mit Adressierungsgrösse - das ist aber eine x64 Maschine mit 10GB, die Limiten auf dieser sollten eigentlich astronomisch sein. Alle Probleme die ich so gefunden habe beziehen sich auch auf 32bit Maschinen und Spielereien mit /USERVA und /3GB.

 

Das einzige was mir aufgefallen ist: Die Handle-Anzahl des Kernels mit 131'000 ist ein bisschen viel - auf meinem Test-SBS in einer ESX VM sieht das viel harmloser aus, unsere produktiven WS08 Kisten (kein SBS) haben nochmal niedrigere Zahlen.

 

sbs08taskmgr.jpg

 

Meine Vermutung gehen in Richtung Treiber- oder OS Bug. Die Hardware ist ein System x3500, mit den neuesten IBM Update-Packs.

 

Allerdings habe ich keine Anhaltspunkte. Das Problem ist bisjetzt immer nach ca. 2 Wochen Betrieb aufgetreten. Ich habe jetzt mal einen Job eingerichtet der dne Server jeden Sonntag neustartet. Kann man bei einem SBS zum Glück so machen. Und eben, ein MS Case ist auch offen - aber falls jemand noch eine Idee hat bin ich froh :)

Link zu diesem Kommentar

Hi Lukas

 

Hast du denn den /3GB oder /PAE Switch in der Boot.ini gesetzt? Ich hab grade ebenfalls nochmal nach der Fehlermeldung gegooglet, weil sie mir irgendwie bekannt vorkam.

 

An operation on a socket could not be performed because the system lacked sufficient buffer space or because a queue was full.
Den habe ich schonmal bei SQL Servern gesehen, wo es auch wie an einigen Stellen im Netz Abhilfe gebracht hat, die entsprechenden Switches in der Boot.ini zu entfernen.

 

U.U. ist da ein steinaltes Problem mit Nonpaged Pool Memory verschleppt worden... nix genaues weiß man atm....

 

Wobei die massive Handleanzahl des Kernelthreads doch ein wenig heftig ist...

Link zu diesem Kommentar

Hi phoenixcp,

 

Hast du denn den /3GB oder /PAE Switch in der Boot.ini gesetzt?

 

SBS 08 basiert auf WS 08 x64 - was diese Flicks eben ausschliessen lässt.

 

Ask the Performance Team : Memory Management - Understanding Pool Resources

 

Die meisten der Dinge die ich gefunden haben weisen eben auch in Richtung x86 Paged Pool/Nonpaged Pool.

 

Ich hasse es wenn ich ratlos vor einem Problem stehe :(

 

Danke & Gruss,

 

Lukas

Link zu diesem Kommentar
Sagt die IBM-Monitoring-SW etwas dazu (wahrscheinlich nicht)?

 

Nein, auch die RSA Karte nicht.

 

Welches AV-System ist im Einsatz? Gerade Probleme mit den Nonepaged Pools waren in der Vergangenheit Spezialitäten von diversen AV-Systemen.

 

McAfee VirusScan Enterprise 8.7 - hab ich bei uns intern auch am laufen, soweit problemlos. ForeFront for Exchange für den Exchange-Teil, wobei der damit kaum was zutun haben wird.

Link zu diesem Kommentar

Sofern sich nichts neues ergibt kannst Du im Fehlerfall manuell einen Crash Dump erzeugen und diesen debuggen:

 

Windows feature lets you generate a memory dump file by using the keyboard

 

Mal schauen, was das Inet noch hergibt, der Fall ist auf jeden Fall interessant.

 

Im McAfee-Support-Forum gibt es mehrere Meinungen die Version 8.7 erst mit dem kommenden SP1 (02/2009) einzusetzen, wobei die o.g. Problamit bisher nicht beschrieben wurde.

 

Was läuft an Backup-SW auf dem Server? Hast Du sonst noch 3rd-Party-Storage-Management-SW am laufen Stichwort: Filtertreiber)?

 

Off-Topic:

 

 

EDIT: Vielleicht hat der Kunde sich auch einen 32 Bit Virus eingefangen der unsauber programmiert ist. :-)

Link zu diesem Kommentar
Im McAfee-Support-Forum gibt es mehrere Meinungen die Version 8.7 erst mit dem kommenden SP1 (02/2009) einzusetzen, wobei die o.g. Problamit bisher nicht beschrieben wurde.

 

Ja, und ich hier intern die Probleme auch hätte. Die Unkenrufe was neue Versionen angeht gibts eh immer - ich setze auch Vista ein ;)

 

Was läuft an Backup-SW auf dem Server? Hast Du sonst noch 3rd-Party-Storage-Management-SW am laufen Stichwort: Filtertreiber)?

 

BackupExec 12.5 (mit allen Updates), Storage-Management SW nur der ServeRAID Agent, der bringt meines Wissens aber keine Filter-Treiber mit.

 

Danke auf jeden Fall fürs Interesse...

Link zu diesem Kommentar
Ein Schuss in Blaue:

 

Applications or services that use sockets may stop responding in Windows Server 2008 or Windows Vista SP1

 

(Der ist neu und liest sich passend zu Deinem fehler ("becomes unresponsive to LDAP requests")

 

Ja, das hört sich wirklich sehr passend an. Wie hast du das nur gefunden? Auf jeden Fall mal besten Dank im voraus - ich werde Microsoft auf den KB Artikel ansprechen, und auf jeden Fall ausprobieren.

 

Ich denke auch das die massiv ansteigende Handle-Zahl des Kernels mit der Problembeschreibung gut übereinpasst - ein TCP Socket ist ja ein Handle.

 

McAfee läuft auf meinem Vista x64 als x86 Applikation (VSE 8.7). Und McAfee bringt definitiv Filtertreiber mit (läuft auf meinem System aber klaglos, allerdings keine 24h / Tag).

 

Ich glaub da haben wir irgendwie aneinander vorbeigeredet - natürlich bringt McAfee Filtertreiber mit. Die Scanengine gibts aber als 64bit Version, der Rest der Applikationen ist aber normal 32bit.

Link zu diesem Kommentar
  • 1 Monat später...

Wir haben hier genau das selbe Problem

 

SBS2008 auf einer Dell PowerEdge 2900 Maschine mit Backup Veritas 12.5, TrendMicro Worry-Free Business Security und GFI Faxmaker 14.3.

 

Nach 2 Wochen ohne Probleme reagieren zuerst die Drucker langsam, anschließend findet Outlook den Exchange Server nicht mehr und die Domäne ist am Boden.

 

Und auch hier sind die Handles ungewöhnlich hoch:

sbsak9.jpg

 

Hat schon jemand den Hofix probiert?

Link zu diesem Kommentar

Hallo,

 

Ich habe den Thread lange nicht updated weil ich keine definitive Lösung habe...

 

Mein Case bei Microsoft hat damit geendet das ich den Server wöchentlich rebooten soll, und dann mit SP2 sei das Problem gefixt. Elegant ist anders, aber das ganze funktioniert jetzt schon länger Problemlos mit einem Reboot jeweils am Sonntag Abend.

 

Mittlerweile bin ich über das hier gestossen:

The Official SBS Blog : You May Lose Network Connectivity on SBS 2008 When Using a Driver Which Utilizes TDI (Mit einem anderen Hotfix)

 

Erst ein paar Tage alt.

 

Den Hotfix habe ich nicht eingespielt, weil mir PSS davon abgeraten hat.

 

Das Problem scheint aber WS08 generell zu betreffen, aber bei unserer internen Umgebung sind die WS08 Kisten seperat, tun sonst garnichts, und werden all 4 Wochen rebooted (Updates...). Deswegen fällt das Problem vorallem auf SBS auf.

Link zu diesem Kommentar
  • 1 Monat später...

Bin auch ein Betroffener, aber das Verhalten ist ein bisschen anders.

 

die Handles sind bei mir inzwischen bei knapp 300.000 angekommen. Alle anderen 2008er Server liegen bei unter 30.000.

 

Funktionieren tut der Server noch halbwegs, alle 400 User können ohne Probleme auf ihre Home Laufwerke zugreifen, damit fällt zwar das Problem was er hat nicht auf aber ändert nichts daran das so fast alles andere nicht mehr geht.

 

Der Server löst über Nslookup ebenfalls alle Namen auf, aber im IE z.B. ist es nicht Möglich eine Seite anzeigen zu lassen, weder über Name noch über IP-Adresse

.

Rücksicherungen mit TSM sind nicht mehr möglich daher er Verbindungsprobleme hat.

LDAP Verbindungen sind ebenfalls gestört.

Fehler in der Ereignisanzeige sind die selben wie die Fehler die du gepostet hast.

 

Bei einer neuen Sicherheitsberechtigung kann ich ebenfalls keinen Benutzer hinzufügen, er findet in der Domäne einfach keinen. Der Server bringt bei der Suche nach einen Benutzer die Meldung „Der Server ist nicht funktionstüchtig“

Interessanterweise kann ich von einem anderen Server aus über das Netzwerk einen Benutzer hinzufügen, aber nur einen alten Benutzer keinen neu angelegten Benutzer in der Domäne.

 

Der Server ist zusätzlich ein sekundärer Domänencontroller, aus irgendeinem Grund läuft aber noch alles rund, was nicht geht ist auf dem Server das AD Snapin starten, kommt ebenfalls Fehler mit „der Server ist nicht funktionstüchtig“

 

Ich gehe mal von aus es geht nur das was er in seiner Kopie des AD gespeichert hat seitdem der Fehler besteht.

 

 

Langsam geht mit der 2008er Server auf die Nerven, erst das lächerliche Problem das Ordner die Freigegeben wurden nicht gelöscht werden können, dann jetzt dieses Problem. Ich meine das ist nen Server für Unternehmen, das kann ich mir ja vielleicht noch bei nen Client BS eingehen lassen, aber doch ganz bestimmt nicht für nen Serverbetriebsystem. Ich kann nicht einfach nen Server auf den rund 400 Personen arbeiten Neustarten.

 

Ach vielleicht noch eines, der TSM Client alleine hat schon 220.000 der gesamten 285.000 Handles verbraucht. Ich habe die Möglichkeit die Sicherung noch auf einem anderen Wege u machen. Meint ihr das Problem tritt zumindest Zeitlich später auf wenn ich den TSM Client Deinstalliere? Ich denke schon, es ist zwar keine Lösung aber eine Verbesserung, jemand anderer Meinung? Oder kann meine Meinung bestätigen?

 

Wenn ich dran denke wie die Einführung vom 2003er Server ablief, da gab’s solche Probleme nie. Ich kann mich nicht im Entferntesten daran erinnern das auch nur einer meiner über 30 2003er Server irgend so ein Problem hatte.

 

Als dann der 2008er kam dachte ich mir die 5 Jahre alten Server müssen eh ausgetauscht werden, also kommen auf die neuen Server gleich mal die 2008er Versionen drauf. Jetzt habe ich fünf 2008er Server inzwischen im Echtbetrieb laufen, vier davon laufen 1A, einer macht ärger, erst mit dem Freigabe Problem, jetzt das hier. Ich habe so langsam das Gefühl das die Code Zusammenlegung des Client OS und des Server OS nur nen Fehlschlag war. Konsequenzen habe ich aber bereits daraus gezogen. Dadurch das 2003er Server ersetzt wurden sind 2003er Lizenzen übrig, ich werde erstmal alle neuen Server wieder auf 2003er laufen lassen bis die Lizenzen Verbraucht sind und dann noch mal überlegen ob der Einsatz von 2008er Server wirklich sinnvoll ist.

 

 

Naja jetzt weiß ich an was es liegt, deswegen vielen vielen Dank für diesen Thread, hoffen wir mal das das SP2 schnell kommt.

 

 

PS: Wenn jemand etwas zu meiner Einschätzung mit den Handles sagen wäre das Super.

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...