GTRDRIVER 17 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 Hallo zusammen ich habe hier ein Problem das ich nicht verstehe: Wir hatten vorher folgende Konstellation: VM-WARE ESXI5 - Virtuelle Maschine SErver 2003 als Datei und SQL Datenbankserver (Firebird) - 2 Virtuelle Maschinen als RDS Terminalserver Das ganze hat über Jahre problemlos funktioniert ! Im Zuge von Support Ende 2003 hatte ich dann entschieden auf 2012R2 zu gehen. Habe auch noch mit dem Hersteller Der Brahnchensoftware abgeklärt ob Freigegeben JA - ok dann los. Neue Konstellation: - 2 Hardware Hosts (identsiche Hardware) mit jeweils Server 2012R2 und Hyper-V - Host1: VM1 RDS Server 1 und VM2 Datei/Datenbankserver - Host2: VM1 RDS Server 2 und VM2 RDS Server für Buchhaltung (hat jetzt mit dem Rest nix zu tun) Prinzipiell funktioniert auch alles ganz wunderbar - es ist alles SEHR Performant ! Aber - in untergelmäßigen Abständen meldet die Branchensoftware (besteht aus verschiedenen Einzelprogrammen und einem Menüprogramm) dass diese die Verbindung zum SQL Server verloren hat. Leider hat der Hersteller der Sotware auch keine vernünftige Fehlerbehandlung in der Software daher führt das zu 40 Fehlermeldungen auf dem Benutzerbildschirm und irgendwann killt Windows dann die Anwendung. Das ganze passiert wie gesagt unregelmäßig und kann auch nicht auf Host1 oder Host2 eingegrenzt werden. Mal 1x am Tag - mal 5x am Tag - mal 4 Tage garnicht ... Was ich bisher unternommen habe: - Kontakt Hersteller Software - "man weiss von nix" - austausch Netzwerkkarten beider Hosts - Austausch Switch - verschiedene Versionen des SQL Servers Aktuell weiß ich nicht so recht weiter und würde mich über alle Hilfen freuen ! Zitieren Link zu diesem Kommentar
testperson 1.660 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 Hi, alle System haben die Energiesparfunktionen deaktiviert bzw. laufen auf Höchstleistung? Auch wenn es keine Broadcom NICs sind: https://support.microsoft.com/en-us/kb/2986895 Alles (OS / Treiber / Firmware) aktuell gepatched? Gruß Jan Zitieren Link zu diesem Kommentar
GTRDRIVER 17 Geschrieben 29. August 2016 Autor Melden Teilen Geschrieben 29. August 2016 Hallo Ist ein IBM System - ja - alle treiber - die IBM Firmware usw... ist alles auf dem aktuellen Stand. Sämtliche Energiespar Optionen sind aus. Der Treiber für die NIC´s (onboard Intel 1GBE) und PCIE 10GBE auch INtel sind ebenfalls auf dem aktuellen stand. Was ich nicht verstehe - ich habe auf den diversen VM´s Pings laufen lassen - ich habe keinen einzigen Packet lost ... CU GTR Zitieren Link zu diesem Kommentar
Sanches 22 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 Hi, das "spricht" den das jew. Eventlog des Servers zum Zeitpunkt des Problems? Gruß, Sebastian Zitieren Link zu diesem Kommentar
Sunny61 806 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 Den Hersteller der Branchensoftware sollte von eurer GF schriftlich in die Verantwortung genommen werden. Bei 40 Meldungen pro Abbruch könnte Access im Spiel sein, ist das so? Kannst Du eine oder mehrere FM als Screenshot posten? Zitieren Link zu diesem Kommentar
GTRDRIVER 17 Geschrieben 29. August 2016 Autor Melden Teilen Geschrieben 29. August 2016 (bearbeitet) Hallo zusammen ja - access ist auch im Spiel - aber das läuft stabil :-) - zumindest wenn nicht die ODBC VErbindung zum besagten Firebird Server abbricht ... Nein - die Branchensoftware ist nicht auf Access Basis - keine Ahnung welche Programmiersprache das ist - jedenfalls nicht Access oder Access Runtime ... Eventlog: HIer ist eigentlich nur dann der eigentliche Programm Absturz zu sehen: Name der fehlerhaften Anwendung: Service.exe, Version: 16.8.4.1, Zeitstempel: 0x57a353ba Name des fehlerhaften Moduls: KERNELBASE.dll, Version: 6.3.9600.18264, Zeitstempel: 0x56e1b34d Ausnahmecode: 0x0eedfade oder Name der fehlerhaften Anwendung: Service.exe, Version: 16.8.4.1, Zeitstempel: 0x57a353ba Name des fehlerhaften Moduls: ntdll.dll, Version: 6.3.9600.18233, Zeitstempel: 0x56bb4e1d Ausnahmecode: 0xc0000005 Der Absturz erfolgt aber offenbar weil die Anwendung den Connect zum SQL Server verliert (siehe Anhang) Ich bin momentan auch schon am überlegen, den SERVER mal auf einer daneben stehenden Maschine auf "Hardware" zu installieren um mal rauszufinden ob es am HYPVERV liegt oder ob die Programme in den RdS Sitzungen die Verbindungen verlieren... Die Branchen Software alleine kann es aber auch nicht sein denn wie gesagt greifen wir auf den Firebird Server auch per ODBC und ACCESS zu und auch hier brechen dann die ODBC Verbindungen weg sofern diese offen sind. bearbeitet 29. August 2016 von GTRDRIVER Zitieren Link zu diesem Kommentar
NorbertFe 2.013 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 deine Screenshots hättest du ja wenigstens noch etwas mehr anonymisieren können. ;) Zitieren Link zu diesem Kommentar
GTRDRIVER 17 Geschrieben 29. August 2016 Autor Melden Teilen Geschrieben 29. August 2016 Stimmt - erledigt ... Zitieren Link zu diesem Kommentar
Doso 77 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 ODBC hat einen Debugmodus den man sich anschauen kann, evtl. lässt sich da etwas erkennen. Aber Firebird Datenbank, und die Oberfläche sieht mir irgendwie schwer nach Gebastel aus. Zitieren Link zu diesem Kommentar
Sunny61 806 Geschrieben 29. August 2016 Melden Teilen Geschrieben 29. August 2016 Bei den Screenshots tippe ich trotzdem auf Access als FE. Die Fehlerbehandlung hat auf jeden Fall Luft nach oben, auch wenn es kein Access-FE sein sollte. Zitieren Link zu diesem Kommentar
Sanches 22 Geschrieben 30. August 2016 Melden Teilen Geschrieben 30. August 2016 Welche Version der Firebird Engine läuft bei dir? Ich nehme an 64Bit? Findest du ggf. im Log des Firebird Service einen Hinweis? Liegt im Normalfall im Install-Verzeichnis von Firebird (= firebird.log).... Genügend RAM haben die Server (DB sowie TS)? Wie wurde die DB vom Altsystem auf das neue System übernommen? (hoffentlich) Per Backup-Restore-Verfahren oder "nur" DB-Datei auf neuen Server kopiert? Wenn die Applikation den/die Fehler meldet, reicht es dann aus, "nur" das Frontend-Programm beim betroffenen User neu zu starten? Gruß Sebastian Zitieren Link zu diesem Kommentar
Jim di Griz 13 Geschrieben 30. August 2016 Melden Teilen Geschrieben 30. August 2016 (bearbeitet) Hallo, connection shutdown finde ich hier mehrdeutig, es bleibt unklar ob das nicht die Applikation selber war. Fehler 0xC0000005 haben wir hier auch in einer Applikation, ist wohl ein Programmierfehler, welcher hier nicht mehr macht als die Applikation abzuschiessen. Interessant waere vielleicht, mal im Eventlog zu sammeln wie oft der Fehler auftritt (sollte im Eventlog stehen, vielleicht sind ja noch eventlogs von den alten Servern da). Dies nur um zu prüfen ob der Fehler neu ist uund ob ueberhaupt ein Zusammenhang besteht. Bei uns sitzt der Entwickler der SW praktisch im haus, da aber niemand sich beschwert passiert nix. Die Applikation kachelt bei ca. 200 Usern auf ca. 10 TS 1-2 mal pro Woche ab. Gibt es den alten DB Server noch? Liesse sich ein umschaltbarer Paralellbetrieb mit gespiegelter DB zum Testen realisieren? und nachdem ich nachgelesen habe was Firebird ist: https://de.wikipedia.org/wiki/Firebird_(Datenbank) Was ist aus der Kiste geworden? Wenn ich das alles lese wundere ich mich ueberhaupt nicht mehr das ihr nach der Mig von 2003 auf 2012 Probleme habt. Nach dem was ich hier sehe glaube ich eher an Connection Probleme der Applikation als an Stress der neuen HW/SW. Was für eine Firebird Version war vorher im Einsatz? bearbeitet 30. August 2016 von Jim di Griz Zitieren Link zu diesem Kommentar
GTRDRIVER 17 Geschrieben 31. August 2016 Autor Melden Teilen Geschrieben 31. August 2016 Hi erstmal danke für die konstruktiven Posts... Ich versuche mal Punkt für Punkt abzuarbeiten: - RAM Resourcen - der Host hat 64GB RAM - darauf laufen 2 VM´s - ich habe der RDS VM 32GB zugewiesen und dem FB Server 12GB - beide hatte ich die letzten Tage in Beobachtung - der FB Server war maximal mal bei 6GB - der RDS bei 18GB - der 2. Host hat eine ähnliche Aufteilung für beide VM´s - Die Applikation ist für FB 2.5.x ausgelegt - FB3.0 erfordert offenbar änderungen in der Programmierung was bisher vom Anbieter noch nicht angegangen wurde. - Auf dem alten Server (unter VMWARE) setzten wir Win2003ServerR2 ein und FB Version 2.5.1 (vom Anbieter empfohlen) - Auf dem neuen Server setzten wir in einem 1. Versuch 2.5.6 ein - nach diesen Problemen der Versuch auf ein Downgrade auf 2.5.1 - aber ohne Verbesserung - Die "alte Kiste" läuft noch und ja - ein "umschalten" wäre möglich wenn auch für einen begrenzten Zeitraum da aufgrund der DB Größe und der veralterten Hardware ist das inzwischen echt Zäh... - Ich habe die betroffene Datenbank testweise sowohl per backup Restore (DB Modus) kopiert - aber auch per Datei wenn man voher den FB beendet sollte das auch kein Problem sein - defekte FB Datenbanken auf Dateibasis passieren eigentlich nur wenn der FB noch läuft - aber ich habe die DB inzwischen auch 3x manuell "reorganisiert" und hier läuft alles sauber durch - es werden im Prinzip anhand der Schema alle Tabellen neu erzeugt - alle Indexes und schlüssel neu geschrieben - ich denke nicht dass es das ist - auch hat der Dienstleister die DB gecheckt und für gut befunden. - Das mit dem Logfile des FB war eine gute Idee - hier sind in der Tat einträge zu finden - diese passen vom Zetstempel her auch zu den Fehlern: W2012HVHOST Wed Aug 31 08:05:55 2016 INET/inet_error: read errno = 10054 W2012HVHOST Wed Aug 31 08:05:55 2016 Unable to complete network request to host "W2012HVHOST". Error reading data from the connection. Zitieren Link zu diesem Kommentar
testperson 1.660 Geschrieben 31. August 2016 Melden Teilen Geschrieben 31. August 2016 Hi, das kommt mir irgendwie bekannt vor. Firebird DB und Wechsel von 2003 R2 auf neues OS. Ich meine, da hatte einer unserer Kunden seinerzeit ebenfalls Probleme und der Hersteller gab dann die "Empfehlung" am Highspeed Networking anzusetzen. Der Link hat jetzt nichts mit Firebird zu tun, aber da steht drin, was testweise (!) zu deaktivieren wären. Was auch noch möglich ist, dass wir da testweise (!) SMB2/3 deaktiviert hatten. Schlussendlich "lief" das. Der Kunde und Hersteller sind dann irgendwann in die große Diskussion gegangen und fortan war es nicht mehr unser Kunde ;) Gruß Jan Zitieren Link zu diesem Kommentar
Jim di Griz 13 Geschrieben 31. August 2016 Melden Teilen Geschrieben 31. August 2016 (bearbeitet) https://www.google.de/search?q=10054+inet_error&ie=utf-8&oe=utf-8&client=firefox-b&gfe_rd=cr&ei=TofGV4eWBKOK8QfN_p3QCQ zu firebird und diesem fehler gibts viele Hits, Anzahl der connections ist nach Überfliegen ab und zu Grund für Probleme dieser Art. Manche Applikationen sind sehr merkwuerdig geschrieben, Einmal abspeichern aktualisiert alle verbundenen Clients! Wieviel Kerne haben die Systeme, real und VMs zugewiesen? habe deine Texte nu mehrfach durchgesehen und nichts dazu gefunden. Wieviele User? Die Lösung im Hauptthread zu dem Fehler war lapidar: neuer performanterer Rechner. Ich meine, netzwerkseitig hast du ja schon alles getauscht. Es wird auch ueber netzkartentreiber gesprochen. Was mir aber insgesamt auffällt: das Design der Anwendung enthaelt doch eine Art Lotus-Organizer Elemente, die Diskussionen reichen zurück bis zu Borland/Delphi-Entwicklung auf Win 95. Das ist wirklich oller Kram. "Error 10054 is a connection reset by peer. It is usually a sign that theapplication does not correctly close connections. Make sure that yourapplication calls Connection.close() after it is done with a connection." Offloading wuerde ich mal deaktivieren, wie im Link zuvor geraten. bearbeitet 31. August 2016 von Jim di Griz Zitieren Link zu diesem Kommentar
Empfohlene Beiträge
Schreibe einen Kommentar
Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.