Datenträger - Festplatten, SSDs, Speichersticks und -Karten, CD/ 19.585 Themen, 110.174 Beiträge

Interpretation der raw-Werte von Smart-Attributen

igorr / 10 Antworten / Baumansicht Nickles

Die Smartattribute sind von den Herstellern definiert aber nirgendwo beschrieben. Wei komme ich zu der Beschreibung von zB: ID# 1, 7, 195 der ATA-Platte ST3120026A (seagate)?

bei Antwort benachrichtigen
Andreas42 igorr „Interpretation der raw-Werte von Smart-Attributen“
Optionen

Hi!

Holla! Ziemlich spezifische Frage für ein Forum voller normaler "Computermenschen". ;-)

geben die Whitepapers von Seagate oder Maxtor (auf den Supportseiten) nichts dazu her?

Laut dieser Seiteb http://www.seagate.com/support/kb/disc/smart.html sind die SMART-Attributes durchaus genormt:

"S.M.A.R.T. emerged for the ATA/IDE environment when SFF-8035 was placed in the public domain. SCSI drives incorporate a different industry standard specification, as defined in the ANSI-SCSI Inf_ormational Exception Control (IEC) document X3T10/94-190."

Mit etwas Google (s.m.a.r.t. attributes maxtor) min ich dann auf diese Seite gestossen (ich hatte zuerst "seagte" statt "maxtor" versucht und war dabei nicht so erfolgreich):
http://smartlinux.sourceforge.net/smart/attributes.php

Evtl. hilft das ja schon weiter (bei der weiteren Suche).

Bis dann
Andreas

Hier steht was ueber mein altes Hard- und Softwaregedoens.
bei Antwort benachrichtigen
Franz Linter Andreas42 „Antwort“
Optionen

Hallo Andreas,
danke für Deine Antwort. Leider habe ich (bereits vorher) die whitepapers und manuals durchgeforstet und nichts gefunden.
Die Seite vom sourceforge gibt ebenfalls nur eine indirekte Beschribung der Attribute durch Ihren Namen. Nichts was die VALUE/WORST/THRESH-Werte bedeuten.
Ich habe auch über die Attributnamen gegoogelt und bin nicht fündig geworden. Eine Antwort von Seagate steht seit längerer Zeit aus.

Um das Problem zu verdeutlichen habe ich mir selbst eine Antwort gesendet, die Näheres schildert.
Gruß
Franz

bei Antwort benachrichtigen
Tilo Nachdenklich igorr „Interpretation der raw-Werte von Smart-Attributen“
Optionen

Die Art wie die SMART-Daten codiert sind schwanken nicht nur von Hersteller zu Hersteller, sondern sogar von Modell zu Modell und es wird auch nicht informiert. Man bleibt auf bestimmte Programme - Tools - angewiesen und ein paar Details (nicht vollständig) stehen im folgenden c't-Artikel

c't 23/04, Seite 236
Da sind die Software-Links zum Artikel:
www.heise.de/ct/04/23/links/236.shtml

Zitate:
"Bei vielen Festplatten ist die SMART-Funktion im Auslieferungszustand standardmäßig nicht scharf geschaltet. Das Laufwerk zeichnet Attribute wie Betriebszeit oder Ein-/Ausschaltzyklen zwar auf, behält sie aber für sich. Der Aufruf

smartctl -s on /dev/hda

aktiviert SMART für die erste Festplatte. Die Linux-typische Bezeichnung /dev/hda funktioniert auch unter Windows,...."

"Viele Laufwerke sind nämlich mit Temperatursensoren ausgestattet, darunter alle Modelle von Hitachi und Seagate."

Empfohlen wird die Installation der smartmontools und HDD Health. Ich selber komme eigentlich mit einem vernünftigen Mainboardbios + AIDA sehr gut klar.


bei Antwort benachrichtigen
Franz Linter Tilo Nachdenklich „Die Art wie die SMART-Daten codiert sind schwanken nicht nur von Hersteller zu...“
Optionen

Hallo,
wollte bereits früher antworten, habe aber mit der nickles-Oberfläche gekämpft.
Der ct-Artikel ist bekannt. Ich habe auch die smart-tools auf meinen w2k-System installiert, bekomme aber keine Logauswertungen. Anders sieht es dagegen aus, wenn ich auf dem gleichen System knoppix von cd starte, dann arbeitet smartctl sauber und bringt die gewünschten Ergebnisse.
Um das Problem zu verdeutlichen habe ich mir selbst eine Antwort gesendet, die Näheres schildert.
Gruß
Franz

bei Antwort benachrichtigen
Franz Linter igorr „Interpretation der raw-Werte von Smart-Attributen“
Optionen

Um meine Frage zu verdeutlichen habe ich hier Auszüge aus einem Aufruf (smartctl -a /dev/hda) eingebettet:

Device Model: ST3120026A Serial Number: 5JS2AWB4 Firmware Version: 8.54 ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 2
...
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 073 069 006 Pre-fail - 33432228
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age - 0
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail - 0
7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail - 26570760
9 Power_On_Hours 0x0032 100 100 000 Old_age - 382
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age - 52
194 Temperature_Celsius 0x0022 035 051 000 Old_age - 35
195 Hardware_ECC_Recovered 0x001a 073 068 000 Old_age - 33432228
...
Wie man sieht, sind die raw-Werte sehr gross, sie ändern sich teilweise mit 3/s. auch Überläufe habe ich schon gesichtet. Die Werte in der 4. Spalte sind nahe/über dem worst-wert 5.spalte.
Da die Platte einwandfrei funktioniert, dasselbe Verhalten auch bei einer anderen Seagateplatte zu beobachten ist, nehme ich an, dass seagate in dem Attribut was anders darstellt.
Ich habe mit s.m.a.r.t. bisher sehr gute Erfahrungen sammeln können. Die Temperatubeobachtung ist wichtig, z.B., wenn man weitere HW einbaut, den Rechner wo anders aufstellt oder durch "Beruhigungsmaßnahmen" die Kühlung verhindert. Seit der Beobachtung sind mir keine Daten durch Plattenfehler verloren gegangen, da sich bisher Plattenprobleme durch erste Lesefehler voranzeigen. Selbst zur Kontrolle über die PC-Nutzung sind die Werte zu verwenden.

bei Antwort benachrichtigen
Tilo Nachdenklich igorr „Interpretation der raw-Werte von Smart-Attributen“
Optionen

Den Begriff Überlauf habe ich nicht mit c't-Artikel gefunden. Aber er enthält noch ne Reihe nützlicher Infos:

"Der Aufruf

smartctl -t offline /dev/hda

veranlasst die Platte, auch die als "Offline" gekennzeichneten Attribute zu aktualisieren. "
Das ergibt einen Selbsttest ev. mehrere Minuten. Den Test gibt es noch mit den Attributen long oder short:
"smartctl -t long /dev/hda

führt einen kompletten Scan der Plattenoberfläche durch und benötigt dafür je nach Platte ungefähr eine Stunde. "
"Das Testergebnis findet sich später in einem Protokoll, das man mit dem Befehl

smartctl -l selftest /dev/hda

abfragt. "

"Der Typ eines Attributs ist entweder "Pre-fail" oder "Old_age". Die Old_age-Attribute zeichnen Daten wie die Lebensdauer oder die Temperatur auf, die zwar interessant sind, aber nicht auf einen bevorstehenden Plattenschaden hinweisen. Dazu dienen die "Pre-fail"-Attribute wie die Motoranlaufzeit (ID 3, Spin_Up_Time)."

"Wie aus den Rohdaten die normalisierten Werte berechnet werden, ist normalerweise gut gehütetes Herrschaftswissen. Seagate verriet uns, dass der normalisierte Wert bei Raw-Read-Error-Rate und Seek-Error-Rate auf dem Logarithmus der Fehlerraten basiert."

"Das Temperatur-Attribut 194 funktioniert allerdings anders als die anderen. Da die meisten Festplatten für Betriebstemperaturen im Bereich zwischen 0° C und 60° C spezifiziert sind, genügt der Zahlenbereich der normalisierten Werte für die Angabe gesunder Temperaturen. Bei den meisten Herstellern enthält er parallel zum Raw-Wert einfach die Temperatur in Grad Celsius, steigt also für schlechte Werte, statt zu fallen. "Worst" enthält nicht den geringsten umgerechneten Wert, wie bei anderen Attributen, sondern die höchste jemals erreichte Temperatur. Als Grenzwert setzen die meisten Hersteller null ein."

Die Festplattentemperatur nach SMART soll nicht dauerhaft über 45°C liegen.

bei Antwort benachrichtigen
Franz Linter Tilo Nachdenklich „Den Begriff Überlauf habe ich nicht mit c t-Artikel gefunden. Aber er enthält...“
Optionen

Mit Überlauf war nur der rawwert gemeint, der nach 2**32 spätestens wieder vorne anfängt. Meine Interpretation, denn zwischen 2 kurz nacheinander folgenden Abfragen steigt der Wert immer.
Vom Satz "seagate verriet uns ..." interessiert mich natürlich mehr.

bei Antwort benachrichtigen
Tilo Nachdenklich Franz Linter „Mit Überlauf war nur der rawwert gemeint, der nach 2 32 spätestens wieder...“
Optionen

Das war leider alles was die c't berichten konnte, was Seagate verraten hat. Da steht nicht mehr.

bei Antwort benachrichtigen
Tilo Nachdenklich igorr „Interpretation der raw-Werte von Smart-Attributen“
Optionen
bei Antwort benachrichtigen
Franz Linter Tilo Nachdenklich „Schau nochmal da nach: http://stephan.win31.de/platten.htm smarties“
Optionen

Danke. Den hatte ich noch nicht.
ausgehend davon und mit einer anderen Suchmaschine konnte ich sehr viele s.m.a.r.t.-Beispiele von den unterschiedlichsten Herstellern und Modellen finden. Dabei konnte ich bez. Seagate gewisse Gemeinsamkeiten finden, die im Widerspruch zur smart-philosphie und auch zu anderen Herstellern sind.

Noch funktionierende Platten haben im Attributwert 1 und 195 dieselben hohen Rawwerte, auch die normalisierten Werte sind gleich, wenn angegeben. Und das obwohl das Attribut ID#1 (Raw_Read_Error_Rate) vom Typ prefail, das andere ID#195 (Hardware_ECC_Recovered) vom Typ old-age ist. Praktisch anderen Platten, die einerseits noch funktionieren, oder keine defekten Bereiche haben, haben die ID#195 0 oder sehr klein.

Da die Antwort von Seagate noch immer aussteht, werde ich es machen wie alle anderen, die auf dasselbe Problem gestossen sind: Werte ignorieren, solange die Platte läuft, beim nächsten Plattenkauf mehr auf solche Angaben achten.

Sollte Seagate sich doch noch melden, werde ich das Ergebnis hier publizieren, ansonsten bedanke ich mich und betrachte den Fall als abgeschlossen.

bei Antwort benachrichtigen