Jump to content

Eine HD geht kaputt, während die andere rebuilded. Ist doch seltsam oder?


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

AN ALLE, die sich interessieren.

 

Ich bin Dienstleister. U.a. administriere ich Systeme für KMUs, die sich

keinen eigenen Admin leisten können oder wollen. Ich handele weder mit

HW noch mit SW. Das wird über Vor-Ort-Systemhäuser beschafft. Also

reiner Dienstleister. Ich komme ziemlich rum und habe schon viel gesehen.

Ich bin seit ca. 16 Jahren in der IT tätig. Heute ist etwas passiert,

dass ich nur vom Hörensagen kenne.

 

Mein Problem:

 

Am Freitag 07.10 ist in einem 1/2 Jahr alten Rackmount-Server

eine Festplatte in einem 3-Platten Raid5 System mit Adaptec-Controller

kaputt gegangen. Diese wurde heute vom Hardwarelieferanten getauscht.

Ich war dabei nicht vor Ort. Wozu auch.

 

Heute morgen rief mich der Angestellte des Hardwarelieferanten an und

behauptete, er bräuchte Treiber, um das System im laufenden Betrieb

wieder zu rebuilden. Bisher dachte ich immer, man steckt im laufenden

Betrieb die neue Festplatte in ihrem Gehäusekäfig rein und der Rebuild

läuft auf der Basis des Controllers von alleine

(Das habe ich übrigens auch schon mehrfach gemacht!)

 

1. FRAGE also an das Forum. Stimmt es dass man für bestimmte (auch

moderne) Geräte zusätzliche Treibersoftware braucht, um im laufenden

Betrieb zu rebuilden? (W 2003 Server. Reiner File- und Print-Server,

kein SQL, kein Exchange, nix sonst)

 

Vor zwei Stunden ruft mich der Angestellte des Hardwarelieferanten nun

erneut an und erzählt mir, dass sich eine zweite Festplatte während des

Rebuilds der ersten (getauschten) verabschiedet hat. Das heisst:

Stripe-Set und Paritätsinformationen zerstört. Server und Domain neu

aufsetzen.

 

2. Frage an das Forum? Wie wahrscheinlich ist es, dass der Mann

irgendeinen Fehler gemacht hat im Vergleich zur Wahrscheinlichkeit,

dass sich eine x-beliebige, ein halbes Jahr alte Festplatte genau in

dem schmalen Zeitrahmen verabschiedet, in dem eine andere neue einen

Rebuild des Arrays fährt? Und wenn ein Fehler nicht unwahrscheinlich

ist, welcher könnte es gewesen sein?

 

Natürlich habe ich dazu meine Meinung, aber ich bin grundsätzlich

sachorientiert und werde niemandem ohne Begründung an die Karre fahren.

 

Ich möchte aber unbedingt Eure Erfahrungen kennenlernen, denn ich

selbst habe in all meiner Zeit so einen Fall noch nie erlebt, habe also

gerade diese Erfahrung noch nicht gemacht. (und ich habe schon soooooo

viel mit IT erlebt).

 

Wer hat obigen Fall auch schon erlebt? Was waren die Ursachen?

Bitte helft mir. Telegrammstil völlig o.k.

Link zu diesem Kommentar

Hi,

 

Also zu 1,

 

Wäre mir neu das man für´s rebuilden einen extra Treiber benötigt?

 

Klingt irgendwie für mich nach Unsinn. Entweder die Hardware (also der Controller) kümmert sich um das rebuilden dann sind die Rebiuld Funktionalitäten in der Firmware implementiert oder man macht ein Software RAID per Windows. Dann braucht´s aber auch keinen Treiber.

 

Sollte hier tatsächlich ein Treiber notwendig sein dann dürfte sich ja das RAID garn nicht ohne Treiber erstellen lassen.

 

Zu 2,

 

Ja das kann vorkommen und ist eigentlich gar nicht mal so selten wie immer angenommen. Ich hatte den Fall erst Gottseidank einmal.

 

Besonders bei HDD´s aus der selben Charge kann es schon vorkommen das diese dann "gemeinsam" oder in kurzen Abständen den Geist aufgeben.

 

Es gibt da auch Berechnungen z.B. das ab einer bestimmten Anzahl an HDD´s ein Multi HDD´s Ausfall immer wahrscheinlicher wird.

 

Siehe hier:

 

http://docs.hp.com/en/J6369-90011/apcs01.html?btnPrev=%AB%A0prev

 

Deshalb gibt´s hier verschiedene Möglichkeiten z.B: Online Spare Platten die sofort einspringen wenn eine andere Ausfällt und mit dem Rebuilden beginnt oder RAID ADG das den gleichzeitigen Ausfall von 2 HDD´s verkraftet.

 

Und nochwas: So schmal ist die Zeitspanne die das Rebuild nicht benötigt. Im Extrmfall kann es sein das bei sehr hoher Auslastung und je nach Controller das Rebuild nicht mehr als 1 GB pro Stunde schafft.

 

Mein Rekord liegt hier bei ca. 48 Stunden für ca. 70 GB Daten.

 

 

 

lg

 

Fantafisch

Link zu diesem Kommentar

der einzige fehler, den der mann gemacht haben könnte ist folgender:

 

wenn dei defekte platte gezogen ist, muss man ca. 2-3 minuten warten, bis die neue platte eingesetzt werden darf, da der controller das ansonsten nicht mitbekommt. dann wird auch der rebuild nicht automatisch gestartet, sieht ganz danach aus, dass der techniker die wartezeit nicht eingehlaten hat. dann ist es in der tat möglich, dass der controller sich aufhängt und eine andere platte in mitleidenschaft gezogen wird.

Link zu diesem Kommentar

Moin,

 

meine Meinung zu den Fragen:

 

zu 1:

Treiber werden definitiv nicht benötigt, da wir von einem HW-RAID sprechen, welches vom Controller gemanged wird. Treiber für Controller -> ok, aber die sind ja drauf. Treiber für HDs :confused: oder gar für ein RAID :confused:

 

Ich vermute, er meint eine Windows-Konfigurationsoberfläche zur Bedienung des Controllers von Windows aus. Nur wenn man diese installiert hat, kann man Konfigurationen von Windows aus anstoßen. Eben auch ein Rebuild. Ansonsten bleibt ja nur der Weg, das über das Controller-BIOS zu machen.

 

zu 2.

Kenne ich "ähnlich". Bei einem unserer Server hat sich im 2 Wochen Rhytmus eine Platte nach der anderen verabschiedet. Hier lag es daran, das die Platten (auch die Ersatzplatten) aus einer Charge bzw. aus einem Werk kamen. Macht man nix dran.

 

Ach ja, ein Rebuild kann wirklich seeehhhhrrrr lange dauern.

 

Ich bin insgsamt aber über einen Unstand verwundert, an dem Du ja auch nix ändern kannst:

 

Wieso tauscht ein "Techniker" eine Platte erst nach knapp einer Woche, fragt nach Treibern und zerlegt dabei das System?? :confused: :suspect:

 

Scheint mir persönlich ein nicht wirklich empfehlenswertes Systemhaus zu sein.

 

grüße

 

dippas

Link zu diesem Kommentar

Vielen Dank für Euren kompetenten Beiträge.

 

@Dippas

zu 1.

Du hast vollkommen recht. Er hat Intel StorCon+ aufgespielt.

Demzufolge handelt es sich also auch um einen Intel Controller

und nicht, wie von mir zuvor behauptet, um einen Adaptec.

Ich denke ich werde nach dem Neuaufsetzen einen kompletten

Systemcheck wegspeichern, damit man mal einen Überblick hat.

Selbst mit SIW bekommt man schon aussagekräftige Infos.

 

Ich muss dazu sagen. Ich darf als Freelancer nichts machen,

was mein Kunde nicht haben will. Ich kann nur beratend auf

ihn einwirken. Ein Systemreport war für ihn uninteressant.

Jetzt, nach dem "Unfall" wird eine IDR-Lizenz für

BackupEexec 10 erworben oder es kommt TrueImage für

Server drauf und ein paar zusätzliche Wartungssachen darf

ich auch noch machen. Aber das kennt ihr Kollegen ja,

dass das Kind erst in den Brunnen fallen muss.

 

zu 2.

Man hat uns vom Systemhaus grosszügige Regelungen

angeboten und hat auch prophylaktisch alle Platten aus-

getauscht. Auch die verbliebene intakte Platte. Auf einmal

waren die Sachen in Stunden per Kurier da, auf die mein

Kunde (und ich im Hintergrund) zuvor 5 Tage warten mussten.

 

Wer sich aber auskennt, weiss, dass es nicht immer

so einfach ist zu sagen. "Tja, das Systemhaus tauschen wir

jetzt oder wir holen alles von DELL, HP, etc." Die Kunden-

beziehung ist oft etwas komplexer. Zum Beispiel haben

wir von diesem Systemhaus sehr gute Leasingkonditionen

bekommen (und dahingehend berate ich meine Kunden

auch und schlage was raus für sie).

 

Wer von Euch hat schon das perfekte Systemhaus im Rücken

und was heisst dann perfekt?

 

Auch @ wirtnix

Vielleicht haben sie ja doch ein schlechtes Gewissen.

Sie stehen ja jetzt auf einmal nicht nur für die schlechte Qualität

der Festplatten gerade, sondern haben auch die Domain

wieder neu aufgesetzt und die Kopplung an den Kommunikations-

Server (Email, Firewall, etc.) durchgeführt.

 

Nochmal vielen Dank für Eure Beiträge. Ihr habt mir geholfen.

 

Vedette

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...