Festplatte verschwindet im Betrieb

Hallo erstmal :smile:

Ich bin seit knapp 2 Jahren stolzer Besitzer von einem Linuxserver. Durch jede Menge Daten sind mittlerweile 6 Festplatten am rödeln (knapp 2 TB). Jedoch setzt seit einigen Wochen eine der Festplatten einfach nach 3 oder 4 Wochen mitten im Betrieb aus und wenn ich das ganze neustarte ist sie wieder da. Es müsste doch eine Möglichkeit geben diese auch wieder im Betrieb wieder zum laufen zu bringen. Die Festplatte taucht jedoch nicht mehr unter fdisk auf.

Ich geb hier noch einige Daten über das System:
Distrubtion: Zenwalk 4.6 (Ich weiß etwas alt aber NTARS! :smiley:)
Linux Kernel: 2.6.19.7-grsec

Sowie ein Auschnitt von dmesg

TCP: Treason uncloaked! Peer 77.180.156.124:4003/1285 shrinks window 4259319625:4259324125. Repaired. EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 TCP: Treason uncloaked! Peer 85.176.158.173:55577/1285 shrinks window 297825090:297828930. Repaired. TCP: Treason uncloaked! Peer 85.176.158.173:55577/1285 shrinks window 297825090:297828930. Repaired. TCP: Treason uncloaked! Peer 85.176.158.173:55577/1285 shrinks window 297825090:297828930. Repaired. EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1 EXT3-fs error (device sdb1): ext3\_find\_entry: reading directory #2 offset 0 Buffer I/O error on device sdb1, logical block 0 lost page write due to I/O error on sdb1
und fdisk -l

[code]root[pserver]# fdisk -l

Platte /dev/hda: 160.0 GByte, 160041885696 Byte
255 Köpfe, 63 Sektoren/Spuren, 19457 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Gerät boot. Anfang Ende Blöcke Id System
/dev/hda1 1 608 4883728+ 83 Linux
/dev/hda2 1222 19457 146480670 83 Linux
/dev/hda3 609 1155 4393777+ 83 Linux
/dev/hda4 1156 1221 530145 5 Erweiterte
/dev/hda5 1156 1221 530113+ 82 Linux Swap

Partitionstabelleneinträge sind nicht in Platten-Reihenfolge

Platte /dev/hdc: 300.0 GByte, 300069052416 Byte
255 Köpfe, 63 Sektoren/Spuren, 36481 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Gerät boot. Anfang Ende Blöcke Id System
/dev/hdc1 1 36481 293033601 83 Linux

Platte /dev/hdd: 300.0 GByte, 300090728448 Byte
255 Köpfe, 63 Sektoren/Spuren, 36483 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Gerät boot. Anfang Ende Blöcke Id System
/dev/hdd1 1 36483 293049666 83 Linux

Platte /dev/hdg: 400.0 GByte, 400088457216 Byte
255 Köpfe, 63 Sektoren/Spuren, 48641 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Gerät boot. Anfang Ende Blöcke Id System
/dev/hdg1 1 48641 390708801 83 Linux

Platte /dev/sda: 400.0 GByte, 400088457216 Byte
255 Köpfe, 63 Sektoren/Spuren, 48641 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Gerät boot. Anfang Ende Blöcke Id System
/dev/sda1 1 48641 390708801 83 Linux
[/code]
und hier die fstab wo alle Laufwerke so eingehängt werden wie sie dastehen.

root[pserver]# cat /etc/fstab /dev/hda5 swap swap defaults 0 0 /dev/hda1 / xfs defaults,noatime 1 1 /dev/hda2 /mnt/150GBi ext3 defaults,noatime 1 2 /dev/hda3 /home ext3 defaults,noatime 1 2 /dev/hdc1 /mnt/300GBi\_I ext3 defaults,noatime 1 2 /dev/hdd1 /mnt/300GBi\_II ext3 defaults,noatime 1 2 /dev/hdg1 /mnt/400GBi\_I ext3 defaults,noatime 1 2 /dev/sda1 /mnt/400GBi\_II ext3 defaults,noatime 1 2 /dev/sdb1 /mnt/400GBi\_III ext3 defaults,noatime 1 2 /dev/hdb /mnt/dvd iso9660 noauto,user,ro 0 0 /dev/fd0 /mnt/floppy auto noauto,user 0 0 devpts /dev/pts devpts gid=5,mode=620 0 0 proc /proc proc defaults 0 0

etwas mit df

root[pserver]# df Dateisystem 1K-Blöcke Benutzt Verfügbar Ben% Eingehängt auf /dev/hda1 4873488 1098164 3775324 23% / /dev/hda2 144181460 137654636 6526824 96% /mnt/150GBi /dev/hda3 4256080 347824 3688568 9% /home /dev/hdc1 288435168 267669224 6114264 98% /mnt/300GBi\_I /dev/hdd1 288451232 247732952 26065800 91% /mnt/300GBi\_II /dev/hdg1 384578164 355704652 28873512 93% /mnt/400GBi\_I /dev/sda1 378473076 360874100 0 100% /mnt/400GBi\_II /dev/sdb1 384578164 384577660 504 100% /mnt/400GBi\_III

und noch dmesg | tail

root[pserver]# dmesg | tail  
Buffer I/O error on device sdb1, logical block 5  
Buffer I/O error on device sdb1, logical block 6  
Buffer I/O error on device sdb1, logical block 7  
Buffer I/O error on device sdb1, logical block 8  
printk: 131 messages suppressed.  
Buffer I/O error on device sdb1, logical block 0  
Buffer I/O error on device sdb1, logical block 1  
Buffer I/O error on device sdb1, logical block 2  
Buffer I/O error on device sdb1, logical block 3  
EXT3-fs: unable to read superblock  

Ich bedanke mich schoneinmal im vorraus :smile:[/code]

Hallo Planlos,

Jedoch setzt seit einigen
Wochen eine der Festplatten einfach nach 3 oder 4 Wochen
mitten im Betrieb aus und wenn ich das ganze neustarte ist sie
wieder da. Es müsste doch eine Möglichkeit geben diese auch
wieder im Betrieb wieder zum laufen zu bringen.

Würde es nicht Sinn machen, anstatt die Platte immer wieder anzuschubsen, sie langsam mal auszutauschen? Sieht doch so aus, als ob sie langsam vor’m Abkratzen ist. Kannst ja mal badblocks drüberjagen.

Viele Grüße
Marvin

Naja dieses anschubsen läuft bereits seit einem halben jahr nur regt mich das ganze immer wieder auf weil die kiste gut und gerne mal eine halbe Stunde hochfährt bis ssh funktioniert *g*.
Aber das scheint also eine Alterserscheinung zu sein? Da die Platte lediglich 2 Jahre alt ist dürfte der MBA eigentlich noch nciht ganz erreicht sein (ich weiß ist eh kein verlässiger Wert).

mfg

Hallo Planlos,

Aber das scheint also eine Alterserscheinung zu sein? Da die
Platte lediglich 2 Jahre alt ist dürfte der MBA eigentlich
noch nciht ganz erreicht sein (ich weiß ist eh kein
verlässiger Wert).

Genau, ich habe Platten schon früher sterben sehen…
Aber aus der Ferne lässt sich das eh schlecht feststellen (aus der Nähe sicher auch nicht so sehr). Aber deshalb auch meine Anregung, mal mit dem Befehl

badblocks

festzustellen, wie es um den Zustand der Platte bestellt ist:
http://www.fibel.org/linux/lfo-0.6.0/node287.html
(aber pass auf die Option -w auf, wenn dir deine Daten lieb sind)
Je nachdem kannst Du ja anschliessend entscheiden, ob Du die Platte austauschst oder nicht.
Wenn Du es gar nicht so genau wissen willst, kannst Du auch

e2fsck -c

machen, das ist relativ schweigsam und trägt einfach die schlechten Blöcke in eine Tabelle ein, auf das sie nicht mehr zum Beschreiben benutzt werden. Aber irgendwann ist dann eben doch Schluß…

Das sind meine Vorschläge, wenn ich mir so deine Logfiles ansehe. Vielleicht hat ja jemand eine andere Interpretation.

Viele Grüße
Marvin

Hallo erstmal :smile:

Ich bin seit knapp 2 Jahren stolzer Besitzer von einem
Linuxserver. Durch jede Menge Daten sind mittlerweile 6
Festplatten am rödeln (knapp 2 TB). Jedoch setzt seit einigen
Wochen eine der Festplatten einfach nach 3 oder 4 Wochen
mitten im Betrieb aus und wenn ich das ganze neustarte ist sie
wieder da. Es müsste doch eine Möglichkeit geben diese auch
wieder im Betrieb wieder zum laufen zu bringen.

scsi_rescan könnte das Symptom überdecken.

Ich geb hier noch einige Daten über das System:
Distrubtion: Zenwalk 4.6 (Ich weiß etwas alt aber NTARS! :smiley:)
Linux Kernel: 2.6.19.7-grsec

Aug wei!

Sowie ein Auschnitt von dmesg

[code]TCP: Treason uncloaked! Peer 77.180.156.124:4003/1285
shrinks window 4259319625:4259324125. Repaired.

[…]

Platte /dev/hdc: 300.0 GByte, 300069052416 Byte
255 Köpfe, 63 Sektoren/Spuren, 36481 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Du schreibst über alle möglichen Platten, aber /dev/sdb hast Du scheinbar ausgelassen.

Buffer I/O error on device sdb1, logical block 5

Kaputte Platte. Nein, eher ranzlige Kabel (was ist das für eine Anbindung? USB?) oder ein murxiger Controller?

Ich hatte sowas mal mit einem billigen VIA-USB-Controller (vielleicht war es auch nur eine schlechte chinesische Fälschuhg), ein anderer („NEC“-) Controller brachte Linderung.

[/code]

Das ist Code, der hier nicht tut. Nimm’

Gruß,


Sebastian

Hallo erstmal :smile:

Ich bin seit knapp 2 Jahren stolzer Besitzer von einem
Linuxserver. Durch jede Menge Daten sind mittlerweile 6
Festplatten am rödeln (knapp 2 TB). Jedoch setzt seit einigen
Wochen eine der Festplatten einfach nach 3 oder 4 Wochen
mitten im Betrieb aus und wenn ich das ganze neustarte ist sie
wieder da. Es müsste doch eine Möglichkeit geben diese auch
wieder im Betrieb wieder zum laufen zu bringen.

scsi_rescan könnte das Symptom überdecken.

Das programm gibts einfach nicht unter slackware nur scsi_id aber ich glaube das ist was anderes der manpage zufolge

Ich geb hier noch einige Daten über das System:
Distrubtion: Zenwalk 4.6 (Ich weiß etwas alt aber NTARS! :smiley:)
Linux Kernel: 2.6.19.7-grsec

Aug wei!

Was?

Sowie ein Auschnitt von dmesg

[code]TCP: Treason uncloaked! Peer 77.180.156.124:4003/1285
shrinks window 4259319625:4259324125. Repaired.

[…]

gut das hätte ich nciht unbedingt schreiben müssen xD

Platte /dev/hdc: 300.0 GByte, 300069052416 Byte
255 Köpfe, 63 Sektoren/Spuren, 36481 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Du schreibst über alle möglichen Platten, aber /dev/sdb hast
Du scheinbar ausgelassen.

nein sie taucht einfach nicht mehr auf!

Buffer I/O error on device sdb1, logical block 5

Kaputte Platte. Nein, eher ranzlige Kabel (was ist das für
eine Anbindung? USB?) oder ein murxiger Controller?

könnte ein murxiger Controller sein alle Festplatten sind Intern. aber soweit ich es in erinnerung habe sind die alle an einem Asrock MB angechlossen. -> gut hab mich getäuscht

Ich hatte sowas mal mit einem billigen VIA-USB-Controller
(vielleicht war es auch nur eine schlechte chinesische
Fälschuhg), ein anderer („NEC“-) Controller brachte Linderung.

Hmm ein Controller ist beim reinschauen tatsächlich drin ich bestell dann mal einen neuen besser als eine kaputte festplatte kannst du mir einen empfehlen? am besten wäre einer mit sata

Das ist Code, der hier nicht tut. Nimm’

überall was anderes^^

dankeschön :smile:

Enrico

Also beim ersten Versuch ist der ganze Rechner einmal abgeschmiert. beim neustarten taucht nun die festplatte komplett nirgends mehr auf… aber ich nehm einfach mal das von Sebastian an.

Danke dir für die viele mühe :smile: