Archiv SCSI 2.798 Themen, 12.895 Beiträge

Server Probleme mit SCSI RAID 5

eberhard5 / 6 Antworten / Baumansicht Nickles

Hallo Kollegen,

ich habe einen Server mit folgenden Komponenten im Einsatz:

- Betriebssystem Windows Small Business Server 2003
- XEON 2,8 GHz auf Tyan 2735 Mainboard mit 3 Gb RAM
- Netzteil 460 W
- Adaptec 2 kanaliger U320 SCSI Controller 39320
- an 1. SCSI Kanal: 1x Maxtor HD 36,7 GB U320 mit Betriebssystem
- an 2. SCSI Kanal: 4x Maxtor HD 36,7 GB U320 als RAID 5 mit Daten
- Adaptec SCSI Controller 19160 mit DAT Streamer

Der Server ist seit ca April/05 im Einsatz und läuft an sich einwandfrei. Seit Anfang August ist es bisher 3x vorgekommen, das sich das RAID 5 verabschiedet, zuletzt am vergangenen Samstag. Die virtuelle Platte aus 4 einzelnen Festplatten ist dann nicht mehr ansprechbar und so langsam wird´s beunruhigend. In der Datenträgerverwaltung wird bei mindestens einer Platte OFFLINE bzw. fehlgeschlagen angegeben und das RAID 5 wird als fehlerhaft gekennzeichnet.

Ein offensichtliches Defekt, z.B. kaputte Platte ist nicht erkennbar

Durch reaktivieren und Neusynchronisieren konnte das RAID jedesmal wieder aktiviert werden und es gingen Gottseidank auch keine Daten verloren

In der Ereignisanzeige werden verschiedene Fehlermeldungen angegeben, z.B. Fehlernummern 11 und 15 und den Hinweis auf Probleme mit adpu3202. Diese Fehlermeldungen sind aber leider unzureichend, um den Fehler exakt zu lokalisieren.

mögliche Ursachen können sein:

- der Controller
- das SCSI kabel
- die Terminierung
- eine Festplatte

Wahrscheinlich muss ich einzelne Komponenten nach und nach austauschen, um den Fehler wegzubringen

Hat jemand spezielle Erfahrungen mit ähnlichen Systemen und kann vielleicht einen Tip geben?

Besten Dank im Voraus!

eberhard

InvisibleBot eberhard5 „Server Probleme mit SCSI RAID 5“
Optionen

Glaube nicht dass das ein Hardwarefehler ist. Ich hatte mal genau dasselbe Problem, aber mit IBM-Platten. Da lag es an der Firmware der Festplatten - hast Du mal nachgesehen ob es Updates für Deine Platten gibt?

Alternativ kannst Du dich auhc mal nach einem neuen Treiber für Deinen Controller umsehen, die Fehlermeldungen in der Ereignisanzeige deuten darauf hin dass der Treiber nicht sauber läuft.

eberhard5 InvisibleBot „Glaube nicht dass das ein Hardwarefehler ist. Ich hatte mal genau dasselbe...“
Optionen

Danke für deine Nachricht!

Die Firmware der Platten ist bei allen die gleiche, auf der Maxtor Seite hab ich nix gefunden über andere Firmware. Einen neueren Treiber für den Controller von adaptec gibt es leider nicht.

Das Problem tritt halt sehr unregelmässig auf. Ich werde nach und nach Komponenten tauschen in der Hoffnung das der Fehler beseitigt wird. Mein erster Verdacht richtet sich an das SCSI Kabel und den Terminator. Da hab ich was neues bestellt und dann schaun mer mal

MfG eberhard

hexagon eberhard5 „Server Probleme mit SCSI RAID 5“
Optionen

Hallo,
boote mal den Server neu und gehe dann in das RAID Bios. Wenn da alle Platten als online markiert sind, hast Du Glück gehabt. Sollte da eine Platte als "fail" markiert sein, hat sich wahrscheinlich eine Platte verabschiedet. Wechsele nun die Platte im laufenden Betrieb. Die meisten RAID Controller machen Auto Rebuild. Man merkt das daran, dass alle Platten losrattern um einen Datenabgleich zu machen. Sollte das nicht erfolgen, gibt es in dem RAID Bios sicherlich einen Punkt wo man das Rebuild manuell auslösen kann.

Ein Tipp:
Bevor Du den Server neu bootest, mache Dir eine Datensicherung. Ich habe mal erlebt, dass ich nachdem ich meinen Raid Sever neu booten wollte eine Fehlermeldung bekam "No operating system found". Wenn das passiert, hast Du in der Tat ein Problem.

MfG. Hexagon


eberhard5 hexagon „Hallo, boote mal den Server neu und gehe dann in das RAID Bios. Wenn da alle...“
Optionen

Danke für deine Nachricht!

ich habe aus dem Controller BIOS bis jetzt zweimal VERIFY für alle Platten durchgeführt, dabei wird kein Fehler gefunden.

Das Problem tritt halt sehr unregelmässig auf. Ich werde nach und nach Komponenten tauschen in der Hoffnung das der Fehler beseitigt wird. Mein erster Verdacht richtet sich an das SCSI Kabel und den Terminator. Da hab ich was neues bestellt und dann schaun mer mal

MfG eberhard

hexagon eberhard5 „Danke für deine Nachricht! ich habe aus dem Controller BIOS bis jetzt zweimal...“
Optionen

Hallo,
auch denkbar wäre, das haben wir mal in unserer Firma gehabt, dass die Batterie auf dem Raid Controller leer ist. Beachte aber bitte, dass nicht jeder Raid Controller eine Batteie hat.

MfG. Hexagon

eberhard5 hexagon „Hallo, auch denkbar wäre, das haben wir mal in unserer Firma gehabt, dass die...“
Optionen

Hi,

ist auch in guter Hinweis, aber der adaptec 39320 hat keine Batterie

mfg eberhard