Linux 15.070 Themen, 107.540 Beiträge

Möglicherweise den Fehler gefunden

Hausmeister Krause / 3 Antworten / Baumansicht Nickles

Update zu meinem Thread

http://www.nickles.de/static_cache/538334812.html

bzgl. der Abstürze meines kleinen Linux Servers.

Die LogDatei /var/log/warn ist vollgestopft mit den Meldungen:

Feb 1 16:38:42 lx01 kernel: ide: failed opcode was: unknown
Feb 1 16:38:42 lx01 kernel: end_request: I/O error, dev hda, sector 79934168
Feb 1 16:38:42 lx01 kernel: ReiserFS: hda2: warning: vs-13070: reiserfs_read_locked_inode: i/o failure
occurred trying to find stat data of [147226 147230 0x0 SD]
Feb 1 16:38:42 lx01 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Feb 1 16:38:42 lx01 kernel: hda: dma_intr: error=0x40 { UncorrectableError }, LBAsect=79934171, sector
=79934168

Und das über mehrere Wochen hinweg.

Ich bin kein Linux-Fachmann, aber für mich klingt das nach einem Festplattenproblem...

Wenn Du Sorgen hast, dann erzähle sie nicht Deinen Freunden, sondern Deinen Feinden, denn die freuen sich darüber. - Harald Lesch
bei Antwort benachrichtigen
uscos Hausmeister Krause „Möglicherweise den Fehler gefunden“
Optionen

goldrichtig anaylsiert. Ich tippe sogar mal so aus dem Bauch herraus auf ein Elektronikproblem. Ansonsten einfach mal mit Spinrite drüberbügeln - sollte ja jede größere Firma mittlerweile haben :-)

bei Antwort benachrichtigen
KarstenW Hausmeister Krause „Möglicherweise den Fehler gefunden“
Optionen

Das ist ein Treiberproblem. Mit ReiserFS gab es früher schon Probleme. Bei meinem Debian wird deshalb immer noch ext3 verwendet, da es für die meisten Einsätze vollkommen ausreicht.

"kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Feb 1 16:38:42 lx01 kernel: hda: dma_intr: error=0x40 { UncorrectableError }, LBAsect=79934171, sector
=79934168"

Diesen Fehler kenne ich. Da funktioniert der UDMA Modus deiner Festplatte nicht richtig.
Entweder sind die Kabel von deiner Festplatte zu lang oder nicht gut genug, oder der Linuxtreiber funktioniert nicht richtig.
Man kann den UDMA Modus einer Festplatte mit dem Programm hdparm ein-und ausschalten.
hdparm kommuniziert mit dem entsprechenden Treiber im Linuxkernel.
Bei den meisten Distributionen gibt es ein Script in dem hdparm aufgerufen wird.

Ob der UDMA Modus der Festplatte eingeschaltet ist kannst du auch mit hdparm überprüfen:

hdparm -d /dev/hda

/dev/hda:
using_dma = 1 (on)

UDMA ist hier eingeschaltet. UDMA kannst du mit "hdparm -d0 /dev/hda" ausschalten und einschalten kannst du UDMA mit "hdparm -d1 /dev/hda"
Es gibt aber auch die Möglichkeit den Linuxkernel selbst zu übersetzen und die Option "USE DMA BY DEFAULT" zu aktivieren um UDMA für alle IDE Geräte einzuschalten.
In diesem Fall funktioniert aber der Linuxtreiber nicht, oder es gibt keinen passenden Linuxtreiber (oder die Festplattenkabel taugen nichts).
Was fü ein Chipsatz ist denn im Server verbaut ?
Was gibt lspci aus ?

Deaktiviere erstmal den UDMA Modus deiner Festplatte. SUSE hat bestimmt ein Script dafür vorgesehen.
Du kannst aber auch einen eigenen Linuxkernel übersetzen und den UDMA Treiber deaktivieren.

PS: Das hier sind bei einem Linuxkernel 2.6.18 alle Linuxtreiber für UDMA:
AEC62XX chipset support
ALI M15x3 chipset support │ │
│ │ [ ] ALI M15x3 WDC support (DANGEROUS) │ │
│ │ AMD and nVidia IDE support │ │
│ │ ATI IXP chipset IDE support │ │
│ │ CMD64{3|6|8|9} chipset support │ │
│ │ Compaq Triflex IDE support │ │
│ │ CY82C693 chipset support │ │
│ │ Cyrix CS5510/20 MediaGX chipset support (VERY EXPERIMENTAL) │ │
│ │ Cyrix/National Semiconductor CS5530 MediaGX chipset support │ │
│ │ AMD CS5535 chipset support │ │
│ │ HPT34X chipset support │ │
│ │ HPT36X/37X chipset support │ │
│ │ JMicron JMB36x support │ │
│ │ National SCx200 chipset support │ │
│ │ Intel PIIXn chipsets support │ │
│ │ IT821X IDE support │ │
│ │ NS87415 chipset support │ │
│ │ PROMISE PDC202{46|62|65|67} support │ │
│ │ PROMISE PDC202{68|69|70|71|75|76|77} support │ │
│ │ ServerWorks OSB4/CSB5/CSB6 chipsets support │ │
│ │ Silicon Image chipset support │ │
│ │ SiS5513 chipset support │ │
│ │ SLC90E66 chipset support │ │
│ │ Tekram TRM290 chipset support │ │
│ │ VIA82CXXX chipset support

Wenn du dir mal einen neuen Rechner kaufst , dann nimm am besten ein Motherboard mit nForce 4 /490/ 590 (oder neuer) Chipsatz. Da funktioniert UDMA, Sound, Netzwerk und SATA mit Sicherheit.

PPS: Wenn du den UDMA Modus eingeschaltet hast und du willst wissen ob UDMA auch funktioniert, dann kannst du mal testweise ein großes Verzeichnis wie /usr mehrmals kopieren.
Sollte wieder diese Fehlermeldung dma_intr... auftreten , dann funktioniert UDMA von deiner Festplatte nicht richtig.
Ob es einen Zusammenhang mit ReiserFS gibt , kann ich nicht beurteilen.
Ich habe aber über ReiserFs nichts gutes gehört was die Fehlerfreiheit und Stabilität angeht. Ich würde im Serverbereich ext3 nutzen. Der Programmcode von ext3 ist ausgetestet und fehlerfrei.









Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
the_mic Hausmeister Krause „Möglicherweise den Fehler gefunden“
Optionen

Tönt nicht wirklich gut... Was meinen Smart-Tests (smartmontools installieren)?

Badblocks kannst du auch mal drüberlaufen lassen, aber wie uscos schon sagt, sieht das eher wie ein Elektronikproblem aus. Sektorenfehler geben üblicherweise andere Meldungen aus.

cat /dev/brain > /dev/null
bei Antwort benachrichtigen