Muss ich reiserfs_corrupter ernst nehmen?

spritcat_048d2a · 21. März 2004 um 15:11

Moin,

ich habe mal - weil mir nach einer Neuinstallation das Debian bockte - mal von meinem alten Suse aus ein

linux:~ # reiserfs\_corrupter /dev/hda1

eingegeben und das kam als Output:
[…stark gekürzt…]

check\_and\_free\_buffer\_mem: not free buffer (3, 1540096, 4096, 1)
check\_and\_free\_buffer\_mem: not free buffer (3, 1572864, 4096, 1)
corrupt 1572864
Done

Es ist einge 6GB Partition, die ich überprüft habe. Nun ist meine Frage, ob ich diese Meldung sehr ernst oder nur ernst nehmen muss(also: neue Platte kaufen oder weitermachen, aber oft Backup). Gibts irgendwelche Tools, die die fehlerhaften Sektoren ausblenden.
Woher kann es kommen, dass so viele Sektoren den Bach runtergehen?

ciao, leon

pumpkin_1768a9 · 21. März 2004 um 17:18

Moin

Bist du sicher dass das die gleiche reiserfs-Version war ? die sind inzwischen bei 3.6 (3.7 ?) angekommen und die Versionen sind sich untereinander nicht ganz grün…

cu

spritcat_048d2a · 21. März 2004 um 17:47

Moin

Bist du sicher dass das die gleiche reiserfs-Version war ? die
sind inzwischen bei 3.6 (3.7 ?) angekommen und die Versionen
sind sich untereinander nicht ganz grün…

Nein bin ich mir nicht. Zumal reiserfsck auch „no curruptions found“ meldete. Also nochmal munter Debian installieren, weil anscheinend irgendwas schief gelaufen ist bei der Installation?
Reicht normalerweise ein reiserfsck aus? Wie kann man seine eigene Rootpartition überprüfen, vom laufenden System aus?

Wieder einige Fragen, aber ich hoffe, dass ich mir nicht gleich morgen ne neue Platte kaufen muss…

cu

pumpkin_1768a9 · 21. März 2004 um 20:59

Moin

Nein bin ich mir nicht.

dann formatier das Ding neu. Wenn mna versucht eine mit 3.6 formatierte Platte mit dem Modul für 3.0 zu betreiben wird nicht viel vom System über bleiben.

Zumal reiserfsck auch „no curruptions
found“ meldete.

sehr positiv.

Also nochmal munter Debian installieren, weil
anscheinend irgendwas schief gelaufen ist bei der
Installation?

Wenn du schon debian nimmst und neu installiert: nimm ext3. Da gibts sowas wie die falsche Version-nummer schon länger nicht mehr.

Reicht normalerweise ein reiserfsck aus?

ja.

Wie kann man seine
eigene Rootpartition überprüfen, vom laufenden System aus?

effektiv gar nicht. Man besten ist der Check von knoppix (oder einer Install-CD mit konsole) aus. Und nicht vergessen den Oberflächencheck anzuschalten.

Wieder einige Fragen, aber ich hoffe, dass ich mir nicht
gleich morgen ne neue Platte kaufen muss…

nana, wer wird den gleich… kuck erstmal was „smartctl -a /dev/hdXYZ“ von sich gibt.

Andererseits: Wenn du morgen einkaufen gehst sehen wir uns, meine ist vor 2 Tagen gestorben.

cu

spritcat_048d2a · 21. März 2004 um 22:04

Moin

Nein bin ich mir nicht.

dann formatier das Ding neu. Wenn mna versucht eine mit 3.6
formatierte Platte mit dem Modul für 3.0 zu betreiben wird
nicht viel vom System über bleiben.

Wie muss ich das verstehen? Ich habe von der stable Install von Debian aus mit reiser formatiert(also Uraltversion von Reiser…)

Zumal reiserfsck auch „no curruptions
found“ meldete.

sehr positiv.

Wirklich? *sehr freu*

Also nochmal munter Debian installieren, weil
anscheinend irgendwas schief gelaufen ist bei der
Installation?

Wenn du schon debian nimmst und neu installiert: nimm ext3. Da
gibts sowas wie die falsche Version-nummer schon länger nicht
mehr.

Ok, werd ich machen…

Reicht normalerweise ein reiserfsck aus?

ja.

Und für was ist dann reiserfs_corrupter da?

Wie kann man seine
eigene Rootpartition überprüfen, vom laufenden System aus?

effektiv gar nicht. Man besten ist der Check von knoppix (oder
einer Install-CD mit konsole) aus. Und nicht vergessen den
Oberflächencheck anzuschalten.

Hat man da dann nicht auch diese Versionsprobleme?

Wieder einige Fragen, aber ich hoffe, dass ich mir nicht
gleich morgen ne neue Platte kaufen muss…

nana, wer wird den gleich… kuck erstmal was „smartctl -a
/dev/hdXYZ“ von sich gibt.

Gibt folgendes aus:

linux:/home/le/tmp/smartctl # smartctl -a /dev/hda1
ATA GET HD Failed: Invalid argument
Smartctl: Hard Drive Identity Failed
Device: Supports ATA Version 13
Drive supports S.M.A.R.T. and is enabled
Smart Values Read failed: Input/output error
Smartctl: Smart Values Read Failed

Ich weiss nicht wirklich, ob ich das gut finden soll…zumal auf einer anderen Partition auf dieser Platte ich gerade online bin …

Andererseits: Wenn du morgen einkaufen gehst sehen wir uns,
meine ist vor 2 Tagen gestorben.

Arme Sau, vor einem Monat ist mir meine 2. Platte ich laufenden Betrieb gestorben. Schöne Kernelmeldungen mit I/O Error gehabt und System ist mir seit langer Zeit mal wieder abgeschmiert…nie wieder auf den Tisch hauen. Deshalb bin ich jetzt auch so übervorsichtig, wenn mir irgendein Tool Fehler in Verbindung mit meiner Platte meldet.

So, gut Nacht…
Leon

pumpkin_1768a9 · 21. März 2004 um 23:44

Moin

dann formatier das Ding neu. Wenn mna versucht eine mit 3.6
formatierte Platte mit dem Modul für 3.0 zu betreiben wird
nicht viel vom System über bleiben.

Wie muss ich das verstehen? Ich habe von der stable Install
von Debian aus mit reiser formatiert(also Uraltversion von
Reiser…)

Wenn man unterschiedliche System zur formatierung und Betrieb einsetzt (also z.b. Suse 9 installiert, dann per debian die Platte löscht, aber nicht formatiert und debian installiert) bricht das System nach kurzer Zeit zusammen. Da gibts dann mächtig Ärger, weil reiser sich immer wieder verändert hat.

ja.

Und für was ist dann reiserfs_corrupter da?

Wenn alles zuspät ist kanns man’s damit im Notfall noch versuchen… aber wenns soweit zeigt die Erfahrung ist Aufgeben und das Backup zurückholen besser.

effektiv gar nicht. Man besten ist der Check von knoppix (oder
einer Install-CD mit konsole) aus. Und nicht vergessen den
Oberflächencheck anzuschalten.

Hat man da dann nicht auch diese Versionsprobleme?

…ähm… ja, aber deshalb sag ich ja: nimm ext3. (Oder die installations-CD von dem System das du benutzt)

linux:/home/le/tmp/smartctl # smartctl -a /dev/hda1

Mein Fehler, lass die 1 weg. Tipp nur:
smartctl -a /dev/hda

Arme Sau, vor einem Monat ist mir meine 2. Platte ich
laufenden Betrieb gestorben. Schöne Kernelmeldungen mit I/O
Error

Was mit Ankündigung ? das ist ja langweilig, meine hat einfach nur falsche Daten geliefert, ohne I/O-Fehler, ohne was im SMART-Log auszuzeigen.

Deshalb bin
ich jetzt auch so übervorsichtig, wenn mir irgendein Tool
Fehler in Verbindung mit meiner Platte meldet.

Backup’s… immerwieder Backups machen. Festplatten sind nix zuverlässiges mehr.

cu

spritcat_048d2a · 22. März 2004 um 17:16

linux:/home/le/tmp/smartctl # smartctl -a /dev/hda1

Ok, Ausgabe lautet:

linux:/home/le # smartctl -a /dev/hdb
Device: MAXTOR 4K040H2 Supports ATA Version 5
Drive supports S.M.A.R.T. and is disabled
Use option -e to enable
linux:/home/le #

Ist das jetzt gut oder schlecht?

Backup’s… immerwieder Backups machen. Festplatten sind nix
zuverlässiges mehr.

Oh ja, vor 3 Jahren konnte ich noch meinen 2GB Platten vertrauen, aber heute…nö, alles halbe Jahr Datenverlust…ne,ne… *sentimental werd*

Wie ist denn das? Wenn ich die Partition jetzt von Suse(testweise) mal mit ext3 formatieren würde und dann mit reiserfsck.ext3 drüber gehen würde und mir dieses keine Fehler liefern würde, wäre dann die Partition fehlerfrei?

Hoffentlich antwortest du noch…

mfg
leon

pumpkin_1768a9 · 22. März 2004 um 19:13

Moin

Drive supports S.M.A.R.T. and is disabled
Use option -e to enable

tu das mal, also tipp:
smartctl -e /dev/hdb

(Das letzte mal war’s noch hda… was nun ? )

Ist das jetzt gut oder schlecht?

Das ist keine wirkliche Aussage. Das heist nur dass SMART nicht gestartet wird und dementsprecht auch keine Werte liefert. So hat das auszusehen:

smartctl version 5.1-18 Copyright © 2002-3 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: SAMSUNG SP0802N
Serial Number: 0637J2FW654369
Firmware Version: TK100-23
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Mon Mar 22 19:18:49 2004 CET

==> WARNING: Contact developers; may need -F samsung enabled.

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Off-line data collection status: (0x00) Offline data collection activity was
never started.
Auto Off-line Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete off-line
data collection: (2160) seconds.
Offline data collection
capabilities: (0x1b) SMART execute Offline immediate.
Automatic timer ON/OFF support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
No Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 36) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 077 045 000 Pre-fail Always - 4352
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 748
5 Reallocated_Sector_Ct 0x0033 077 077 010 Pre-fail Always - 52
7 Seek_Error_Rate 0x000b 253 253 051 Pre-fail Always - 0
8 Seek_Time_Performance 0x0024 253 253 000 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 228460
10 Spin_Retry_Count 0x0013 253 253 049 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 541
194 Temperature_Celsius 0x0022 190 085 000 Old_age Always - 16
195 Hardware_ECC_Recovered 0x000a 100 100 000 Old_age Always - 347228625
196 Reallocated_Event_Count 0x0012 253 253 000 Old_age Always - 0
197 Current_Pending_Sector 0x0033 253 253 010 Pre-fail Always - 0
198 Offline_Uncorrectable 0x0031 253 253 010 Pre-fail Offline - 0
199 UDMA_CRC_Error_Count 0x000a 100 100 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x000b 100 100 051 Pre-fail Always - 19
201 Soft_Read_Error_Rate 0x000b 100 100 051 Pre-fail Always - 0

SMART Error Log Version: 1
Warning: ATA error count 512 inconsistent with error log pointer 5

ATA Error Count: 512 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Timestamp = decimal seconds since the previous disk power-on.
Note: timestamp „wraps“ after 2^32 msec = 49.710 days.

Error 512 occurred at disk power-on lifetime: 1903 hours
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH

04 51 00 00 4f c2 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name

b0 da 00 00 4f c2 e0 00 669.563 SMART RETURN STATUS

Error 511 occurred at disk power-on lifetime: 1903 hours
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH

04 51 00 00 4f c2 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name

b0 da 00 00 4f c2 e0 00 669.500 SMART RETURN STATUS
ec 00 00 c6 e3 a6 e0 00 669.500 IDENTIFY DEVICE
ec 00 01 00 00 00 e0 00 63.375 IDENTIFY DEVICE
ec 00 01 00 00 00 e0 00 62.875 IDENTIFY DEVICE
ef 02 00 00 00 00 e0 00 25.813 SET FEATURES [Enable write cache]

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error

1 Extended off-line Completed without error 00% 64 -

2 Short off-line Completed without error 00% 14 -

3 Short off-line Completed without error 00% 12 -

(Die Platte ist übrigens am Sterben und wird morgen entsorgt)

Wie ist denn das? Wenn ich die Partition jetzt von
Suse(testweise) mal mit ext3 formatieren würde und dann mit
reiserfsck.ext3

fsck.ext3, nicht reiser…

drüber gehen würde und mir dieses keine Fehler
liefern würde, wäre dann die Partition fehlerfrei?

ja. (Dann sind aber auch alle Daten weg => formatierung)

Evtl solltest du beim formatieren „mkfs.ext3 -c -c /dev/FESTPLATTE_Partitionsnummer“ (2x -c) angeben. Nachteil: es dauert Stunden, Vorteil: die Platte wird 4x komplett durchgetestet.

cu

spritcat_048d2a · 23. März 2004 um 18:01

Moin

Drive supports S.M.A.R.T. and is disabled
Use option -e to enable

tu das mal, also tipp:
smartctl -e /dev/hdb

(Das letzte mal war’s noch hda… was nun ? )

ich hab eine (sehr wahrscheinlich) defekte Platte /dev/hdb und eine hoffentlich noch nicht defekte Platte /dev/hda
Das heisst, die Hilfe, die ich von dir bekomme wir an beiden Platten ausprobiert.

Also ich habe mal folgendes mit Platte /dev/hdb gemacht:

linux:~ # smartctl -a /dev/hdb
Device: MAXTOR 4K040H2 Supports ATA Version 5
Drive supports S.M.A.R.T. and is disabled
Use option -e to enable
linux:~ # smartctl -e /dev/hdb
linux:~ # smartctl -a /dev/hdb1
ATA GET HD Failed: Invalid argument
Smartctl: Hard Drive Identity Failed
Device: Supports ATA Version 13
Drive supports S.M.A.R.T. and is enabled
Check S.M.A.R.T. Passed
 
General Smart Values:
Off-line data collection status: (0x00) Offline data collection activity was
 never started
 
Self-test execution status: ( 0) The previous self-test routine completed
 without error or no self-test has ever
 been run
 
Total time to complete off-line
data collection: ( 44) Seconds
 
Offline data collection
Capabilities: (0x1b) SMART EXECUTE OFF-LINE IMMEDIATE
 Automatic timer ON/OFF support
 Suspend Offline Collection upon new
 command
 Offline surface scan supported
 Self-test supported
Smart Capablilities: (0x0003) Saves SMART data before entering
 power-saving mode
 Supports SMART auto save timer
 
Error logging capability: (0x01) Error logging supported
 
Short self-test routine
recommended polling time: ( 2) Minutes
 
Extended self-test routine
recommended polling time: ( 22) Minutes
 
Vendor Specific SMART Attributes with Thresholds:
Revision Number: 11
Attribute Status Flag Value WorstEver Threshold Raw Value
 1 0x0029 100 253 020 000000000000
 3 0x0027 088 086 020 000000000632
 4 0x0032 098 098 008 000000000625
 5 0x0033 097 097 020 000000000011
 7 0x000b 100 093 023 000000000000
 9 0x0012 099 099 001 00000000038a
 10 0x0026 100 100 000 000000000000
 11 0x0013 100 100 020 000000000000
 12 0x0032 098 098 008 00000000052d
 13 0x000b 100 100 023 000000000000
 194 0x0022 093 084 042 000000000014
 195 0x001a 021 003 000 000001f21f8f
 196 0x0010 100 253 020 000000000000
 197 0x0032 100 098 020 000000000004
 198 0x0010 100 253 000 000000000000
 199 0x001a 192 192 000 000000000008
SMART Error Log:
SMART Error Logging Version: 1
Error Log Data Structure Pointer: 01
ATA Error Count: 111
Non-Fatal Count: 0
 
Error Log Structure 1:
DCR FR SC SN CL SH D/H CR Timestamp
 b3 01 18 3f 00 b4 f1 c8 270
 b7 01 18 3f 00 b8 f1 c8 270
 bb 01 18 3f 00 bc f1 c8 270
 c0 01 18 3f 00 c0 f1 c8 271
 c4 01 18 3f 00 c4 f1 c8 271
 00 40 18 3f 00 c4 f1 d1 0
 
Error Log Structure 2:
DCR FR SC SN CL SH D/H CR Timestamp
 00 00 08 18 05 08 f1 c8 206
 00 00 08 98 04 08 f1 c8 206
 07 01 08 40 d8 07 f1 c8 206
 00 01 08 50 2e 00 f1 c8 207
 00 01 08 50 2e 00 f1 c8 211
 00 40 08 50 2e 00 f1 d1 0
 Error Log Structure 3:
DCR FR SC SN CL SH D/H CR Timestamp
 00 01 08 50 2e 00 f1 c8 207
 00 01 08 50 2e 00 f1 c8 211
 26 01 10 b8 8c 26 f1 ca 215
 2b 01 08 90 b3 2b f1 ca 215
 00 01 08 50 2e 00 f1 c8 215
 00 40 08 50 2e 00 f1 d1 0
 
Error Log Structure 4:
DCR FR SC SN CL SH D/H CR Timestamp
 26 01 10 b8 8c 26 f1 ca 215
 2b 01 08 90 b3 2b f1 ca 215
 00 01 08 50 2e 00 f1 c8 215
 cc 00 58 60 44 cc f0 ca 219
 00 01 08 50 2e 00 f1 c8 219
 00 40 08 50 2e 00 f1 d1 0
 
Error Log Structure 5:
DCR FR SC SN CL SH D/H CR Timestamp
 cb 01 18 3f 00 cc f1 c8 197
 cf 01 18 3f 00 d0 f1 c8 197
 d3 01 18 3f 00 d4 f1 c8 197
 d7 01 18 3f 00 d8 f1 c8 197
 db 01 18 3f 00 dc f1 c8 197
 00 40 18 3f 00 dc f1 d1 0
linux:~ #

Ok, gleiches Spiel mit /dev/hda:

linux:~ # smartctl -a /dev/hda1
ATA GET HD Failed: Invalid argument
Smartctl: Hard Drive Identity Failed
Device: Supports ATA Version 13
Drive supports S.M.A.R.T. and is enabled
Check S.M.A.R.T. Passed
 
General Smart Values:
Off-line data collection status: (0x84) Offline data collection activity was
 suspended by an interrupting command
 
Self-test execution status: ( 0) The previous self-test routine completed
 without error or no self-test has ever
 been run
 
Total time to complete off-line
data collection: (1754) Seconds
 
Offline data collection
Capabilities: (0x3b) SMART EXECUTE OFF-LINE IMMEDIATE
 Automatic timer ON/OFF support
 Suspend Offline Collection upon new
 command
 Offline surface scan supported
 Self-test supported
 
Smart Capablilities: (0x0003) Saves SMART data before entering
 power-saving mode
 Supports SMART auto save timer
Error logging capability: (0x01) Error logging supported
 
Short self-test routine
recommended polling time: ( 2) Minutes
 
Extended self-test routine
recommended polling time: ( 30) Minutes
 
Vendor Specific SMART Attributes with Thresholds:
Revision Number: 16
Attribute Status Flag Value WorstEver Threshold Raw Value
 1 0x000b 200 200 051 000000000000
 3 0x0007 103 096 021 0000000008b1
 4 0x0032 100 100 040 000000000398
 5 0x0033 200 200 140 000000000000
 7 0x000b 100 253 051 000000000000
 9 0x0032 098 098 000 0000000005f1
 10 0x0013 100 100 051 000000000000
 11 0x0013 100 100 051 000000000000
 12 0x0032 100 100 000 0000000002ac
 196 0x0032 200 200 000 000000000000
 197 0x0012 200 200 000 000000000000
 198 0x0012 200 200 000 000000000000
 199 0x000a 200 253 000 000000000008
 200 0x0009 200 200 051 000000000000
SMART Error Log:
SMART Error Logging Version: 1
No Errors Logged

Sorry, war jetzt mal en bissl mehr…das für /dev/hda mit No Errors Logged klingt für mich gar net mal so schlecht. Dagegen der Kommentar auf meine /dev/hdb Platte hin hört sich für mich wie kaputte Platte an…oder vielleicht doch nicht?

Ciao, Leon

pumpkin_1768a9 · 23. März 2004 um 22:40

Moin

Das heisst, die Hilfe, die ich von dir bekomme wir an beiden
Platten ausprobiert.

immer feste druff…

linux:~ # smartctl -a /dev/hdb1

(ohne 1)

ATA GET HD Failed: Invalid argument

(dann kommt die Fehlermeldung nicht mehr)

Smartctl: Hard Drive Identity Failed

(die auch nicht…)

Self-test execution status: ( 0)

Das sollte man nochmal überprüfen: (du hast eine uralt-version von smartctl, wenn die optionen nicht gehen, mach ein UPDATE)

smartctl -t long /dev/hdb

das dauert etwa:

Extended self-test routine
recommended polling time: ( 22) Minutes

22 min.

Die Platte simuliert bei dem Test für 22 min Maximalbelastung für die Elektronik und teilweise auch für die Mechanik. Wenn danach in der Zeile immernoch eine „0“ steht ist dabei nix schlimmes passiert. Steht nach vollständigem Durchlauf des Tests da keine 0 mehr: ausschalten, ausbauen, wegwerfen.

Währendem der Test läuft steht da keine „0“, also nicht gleich blindlings zum Schrauber greifen, sondern erstmal lesen was smartctl zu der Zahl sagt und evtl. eine halbe Stunde später nochmal versuchen. Während der Test läuft soll man nicht auf die Platte zugreifen, weder mit smartctl noch sonst.

Da in der Tabelle die Klartext-bezeichnungen fehlen… die Version ist wirklich uralt oder ?

Attribute Status Flag Value WorstEver Threshold
4 0x0032 098 098 008
000000000625

1573 mal eingeschaltet ? wie alt ist die Platte ?

5 0x0033 097 097 020
000000000011

11 Sektoren kaputt und durch andere ersetzt. Das ist für eine so alte Platte gar nicht mal schlecht, hab schon schlimmeres gesehen.

9 0x0012 099 099 001
00000000038a

nur 906 Stunden gelaufen ??? bei 1500 starts ? arbeitets du immer nur für 5 min am PC oder das Powersave so hoch eingestellt ?.. oder ist die smartctl-version zu alt ?

11 0x0013 100 100 020
000000000000

kein reset… solangsam trau ich deinem smartctl wirklich nicht mehr.

194 0x0022 093 084 042
000000000014

20°C. Gleich nach dem Einstalten gemessen ?

195 0x001a 021 003 000
000001f21f8f

runde 32 millionen abgefangene Lesefehler… das ist nicht so gut, aber auch nicht exterm schlecht.

199 0x001a 192 192 000
000000000008

nur 8 Fehler auf dem IDE-Bus. Das Kabel ist nicht allererste Sahne, aber auch nicht wirklich schlecht.

ATA Error Count: 111

Das ist nicht gut. Das sollte eher 2-stellig sein,… am besten 0. Aber es gibt durchaus Festplatten die 4-stellige Werte erreichen und überleben sollen.

Error Log Structure 1:

zu dem was hier noch kommt kann dir höchstens der Hersteller was sagen. (Was er aber nicht tun wird… Betriebsgeheimnis)

Wenn da was wichtiges drauf kommen soll würd ich zumindest mehr Backups machen, so alle 6 Stunden eins. Die Platte ist nicht ganz ok, liegt aber auch noch nicht in den letzten Zügen. Ums mit einem Auto zu vergleichen: Opel Astra (benziner) nach 250.000 km.

Ok, gleiches Spiel mit /dev/hda:

Off-line data collection status: (0x84) Offline data
collection activity was
suspended by an
interrupting command

ein bisschen mit smartctl gespielt und sich vertippt, wie ? (das sagt aber nix über die gesundheit der Platte aus.

Self-test execution status: ( 0)

auch hier gilt das gleiche wie oben.

recommended polling time: ( 30) Minutes

Nur dass hier der Test nicht 22 min sondern 30 min dauern soll. (Das sind alles Richtwerte, ±20%)

4 0x0032 100 100 040
000000000398

nur 920 starts.

5 0x0033 200 200 140
000000000000

sehr, sehr schön. Keine defekten Sektoren, der Platte gehts richtig gut.

9 0x0032 098 098 000
0000000005f1

1521 Stunden gelaufen. Die Platte ist schon länger eingebaut ? (Das Verhältniss start/Zeit ist da auch realistischer)

12 0x0032 100 100 000
0000000002ac

684 Power-cycles (meist sind damit kalt-starts gemeint)

199 0x000a 200 253 000
000000000008

Die hat auch was am Kabel zu mekern, ist aber nicht wirklich sauer. Wegen dem bisschen Aufregen würd ich das Kabel nicht tauschen.

No Errors Logged

Schön.

Also zusammengefast:

Die 2. (hda ?) Platte ist tip-top in Schuss und wird (laut smart) noch lange leben. Die ist OK.

Bei der ersten (hdb) siehts nicht so doll aus. Die hat ihre besten Tage hinter sich und wird (geschätzt) noch maximal 6-12 Monate mitmachen. Es hängt aber stark davon ab was man mit der Platte tut: einmal fallenlassen oder beim Aus/Einbau grob anstossen und schon ist Essig. Wenn die Platte aber nix zu arbeiten bekommt und nur ohne Last (Zugriffe) läuft kanns auch noch Jahre gutgehen. Ich würd die 1. als Platte für nicht-wichtige Daten (unter Linux: /tmp) noch ein paar Monate halten und dann bei günstiger Gelegenheit gehen eine neue austauschen.

Ich geb auf die ganzen Aussagen aber keinerlei Garantie, das ist eine Einschätzung auf Basis der Daten einer alten smartctl-version, ausgeführt auf einem System das ich nicht kenne unter Unständen die ich nicht einschätzen kann. Die UDMA-IDE-Fehler (Kennnummer 199) der 1. Platte könnten z.b. auch von einem CD-ROM am gleichen IDE-Strang stammen.

Wenn du viel Zeit (1-2 Tage) investieren willst um die 1. Platte nochmal durchzutesten:
badblocks -o /root/badblocks.log -p 3 -t random -s -n /dev/hdb

Je mehr in badblocks.log steht, je dreckiger gehts der Platte. Jede Zeile kann im Ernstfall eine kaputte Datei oder ein unlesbares Verzeichniss bedeuten. Der Test ist sicherer als smart, dauert aber ewig lange. Ich würd ihn nicht starten, smartctl würde mir reichen. Die Daten auf der Platte bleiben erhalten wenn man sich nicht vertippt

cu

spritcat_048d2a · 24. März 2004 um 13:05

Ok, ich hatte die ganzen Sachen auch mal mit /dev/hda aufgerufen, aber da kam gar nichts…liegt wahrscheinlich an dieser Uraltversion, die ich mir geladen habe(Scheiss rpmfinder.net…).

Ich werde jetzt deinen Angaben Glauben schenken und auf der 1. Platte doch mein Debian installieren, mit dem Filesystem ext3.

Die 2. Platte hatte deshalb so ein komisches Verhältnis, weil die nur unregelmäßig gemountet war, benutzt wurde, davor in einem anderen Rechner als Hauptplatte lief, usw. --> Auf gut Deutsch, die Platte wir nur noch für temporären Kram und Swap genutzt werden, oder kann ich der doch noch mehr zutrauen(deinen Angaben nach eher nicht).

Vielen Dank für deine Hilfe, bin ja mal richtig froh, dass die 1. Platte es noch ne Weile macht

Mit vielen freundlichen Grüßen,

Leon Burkard