PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Festplattensterben?


PatkIllA
2011-02-01, 22:51:28
Ich habe jetzt innerhalb von 2 Monaten Probleme mit 4 von meinen 7 Festplatten

SAMSUNG HD642JJ (2,5 Jahre alt) wurde zwischendurch nicht erkannt und Windows 7 rät davon ab, es darauf zu installieren, da die Platte bald ausfallen werde
SAMSUNG HD642JJ (2,0 Jahre alt) SMART Fehler Reallocated Sector Count auf 1
SAMSUNG HD103SI (1,5 Jahre alt) SMART Fehler Current Pending Sector auf D
WDC WD20EARS-00MVWB0 (2 Monate alt) SMART Fehler Current Pending Sector Count auf 1, Uncorrectable Sector Count auf 1

Ist das jetzt purer Zufall, ist bei mir was anderes defekt, dass das heraufbeschwört?
Reicht ein drohender Ausfall zum Austausch?

san.salvador
2011-02-01, 22:53:10
2. und 4. sehe ich nicht kritisch. Ist glaub ich eher die Regel als die Ausnahme. Für solche Fälle hat eine Platte ja Ersatzsektoren.
1. klingt nich gut und mit 3. kann ich nix anfangen.

PatkIllA
2011-02-01, 22:55:24
der Wert bei 3 ist wohl ein Hexwert.

Ich dachte die Ersatzsektoren wäre der "Reallocated Sectors Count"

Bei 1 frage ich mich wie Win7 da was erkennt, denn eigentlich da ist der SMART Status ja in Ordnung.

HeldImZelt
2011-02-01, 23:00:56
Hast du was übertaktet?
Mit DOS Vendortools dran gehen und vollständigen Test machen.

san.salvador
2011-02-01, 23:02:00
der Wert bei 3 ist wohl ein Hexwert.

Ich dachte die Ersatzsektoren wäre der "Reallocated Sectors Count"

Bei 1 frage ich mich wie Win7 da was erkennt, denn eigentlich da ist der SMART Status ja in Ordnung.
D wäre 13.
Da ich in dem Bereich aber auch kein Experte bin, hier mal eine Liste - vielleicht hilfts dir ja weiter.
http://www.ntfs.com/disk-monitor-smart-attributes.htm

PatkIllA
2011-02-01, 23:03:32
die beiden alten Samsung Geräte waren mal an einem übertakteten System, aber das ist auch schon ein Jahr her, aber die Fehler sind halt relativ neu.

ux-3
2011-02-01, 23:07:44
Wie warm sind die Platten im Betrieb?

PatkIllA
2011-02-01, 23:10:02
Je nach Platte, Einbau und Umgebungstemperatur, waren die immer so zwischen 30 und 45°C. Beim FurmarkTest wurden die beiden kleinen Samsungs wahrscheinlich eher von der Wakü geheizt.
Die anderen sitzen im Wechselrahmen bzw. Quickport.

san.salvador
2011-02-01, 23:11:11
Je nach Platte, Einbau und Umgebungstemperatur, waren die immer so zwischen 30 und 45°C
Nicht zu warm, nicht zu kalt - passt.

PatkIllA
2011-02-01, 23:13:32
Ich sehe eine Platte zwar als Verschleißteil an, aber das innerhalb so kurzer Zeit so viele und auch gleich die neue WD auffällig werden kommt mir so spanisch vor.

Reichen verdächtige SMART-Werte eigentlich als Austauschgrund? Die sind alle noch innerhalb der Garantie.

Welches Tool von Samsung muss ich denn nehmen?
Der Link hier geht nicht.
http://www.samsung.com/global/business/hdd/support/utilities/Support_DiskManager.html

HeldImZelt
2011-02-01, 23:25:15
Nimm die UBCD. Das sind eigentlich alle drauf...
Oder das: http://www.samsung.com/global/business/hdd/support/downloads/support_in_es.html

ux-3
2011-02-01, 23:31:49
Magnetquellen in der Nähe?

PatkIllA
2011-02-01, 23:33:16
Eine Box steht da so etwas über einen halben Meter vom Rechner entfernt. Das ist aber schon seit 10 Jahren so.

PatkIllA
2011-02-02, 00:00:22
Beim Samsung Tool kriege ich nur eine Fehlermeldung aus durchlaufendem Text mit invalid code.
Habe extra von AHCI auf IDE umgestellt.

Bei HDTune werden mir nur bei der Samsung die zwei SMART Werte als ok aber gelb makiert. Bei den anderen Platten wird nichts moniert.

Spike2
2011-02-02, 03:08:24
Wenn noch Garantie, dann würde ich reklamieren. Zumindest die neue WD.

PatkIllA
2011-02-02, 06:42:06
Ich hab jetzt übernacht Scans mit HD-Tune gemacht gemacht.
Bei 1 kam wieder die Meldung von Windows, aber HD Tune selbst hat keinen Fehler gemeldet.
Bei 2 lief der Scan problemlos durch, aber die Warnungen bleiben.
Bei 3 wird ein Block als Damaged markiert
Bei 4 läuft der Scan noch und es wird ein Block als Damaged markiert und die Transferrate ist von anfänglich 110 MB auf 45 abgesackt. (Die hängt aber auch am Sandy Bridge Controller ;) )

eraser-x
2011-02-02, 07:00:00
ohne was pauschal sagen zu wollen
aber habe 5 jahre lang samsung hdd´s bei arlt verkauft und ja samsungplatten sterben halt wie die fliegen
sie sind günstig(gibt ja kaum was günstigeres)
sie sind leise
sie sind relative schnell

und der preis ist eben wohl die lebensdauerwas
meinst du warum samsung mit einmal dem endkunden die reklamation ermöglicht hat ;)
das ging ja vor glaube 2 jahren noch garnicht da durfte das immer der händler abwickeln
und da der langsam immer mehr in die samsung rma schicken durfte (das kostetet dem händler zeit geld und den kunden;)) hat samsung eben diesen schritt eröffnet

mfg

sandokan
2011-02-02, 11:24:31
Wobei ich sagen muss, dass Samsung wohl die "Qualität" ihrer Platten kennt und bei mir noch nie gezickt hat wenn es um eine defekte Platte ging.:biggrin:

Ich hab von denen eine HD 753LJ (750GB)

Die ist mir gleich nach dem Kauf 1 Monat später abgeraucht. Soll heißen nur noch klacken, keine Möglichkeit mehr die nochmal zum Arbeiten zu bewegen.
1. Tausch
Nach 6 Monaten wieder klackern, zum Glück diesmal noch die Daten lesbar
2. Tausch
Nach 1 Jahr immer wieder Schreibabbrüche etc.
3. Tausch (immer über HoH, die haben sich gefreut;))
Auch die aktuelle (inzwischen 4. Platte) macht nun nach ca. 5 Monaten wieder Probleme. Inzwischen hängt sie nicht mehr im System (was alle Probleme unter Win 7 beseitigt hat: Explorerabstürze, Festplatten verschwinden etc)

Somit ist es zwar toll, dass Samsung alles so problemlos tauscht, aber wenn ich dafür wieder Ware bekomme die die gleichen Probleme hat...:rolleyes:

Meine Seagate 80GB Systemdisk läuft seit fast 5 Jahren ohne Probleme und wurde sicher um ein Vielfaches mehr beansprucht als die Samsung die nur als Datengrab dient...

HeldImZelt
2011-02-02, 11:43:03
Du kannst sämtliche Tests unter Windows vergessen. Wenn es ein Software- oder Treiberproblem ist, läuft da gar nichts mehr zuverlässig. Bring das ESTool/DOS zum laufen, notfalls im anderen Rechner.

Schlammsau
2011-02-02, 11:59:08
Du hast doch ein neues Intel Mainboard oder?

Ich geh mal stark davon aus, dass du von dem Problem betroffen bist und die Platten gar nicht defekt sind, sondern dein Sata-Controller.

Gastomat
2011-02-02, 12:56:47
JA er hat ein Asus P67 Mainboard. Das riecht wirklich verdächtig nach dem Intel-Chipsatz-Bug. Sind die Platten (mit den Problemen) alle den den SATAII-Ports angeschlossen?

Scoty
2011-02-02, 13:30:53
Würde mal die Platten an denn SATA6 hängen und schauen was dann ist.

Chrisch
2011-02-02, 13:49:04
Du hast doch ein neues Intel Mainboard oder?

Ich geh mal stark davon aus, dass du von dem Problem betroffen bist und die Platten gar nicht defekt sind, sondern dein Sata-Controller.
Da die Fehler sich scheinbar in den letzten 2 Monaten eingeschlichen haben wird er wohl auch schon welche gehabt haben bevor er ein P67 Board hatte ;)
Ich habe jetzt innerhalb von 2 Monaten Probleme mit 4 von meinen 7 Festplatten

PatkIllA
2011-02-02, 14:04:02
Den von der 1 TB Samsung habe ich gestern erst bemerkt, die anderen waren vorher schon da.
Und der Controller wird ja auch keine Sektoren kaputt machen. Da würde ich eher andere SMART-Attribute erwarten.

Schlammsau
2011-02-02, 14:16:58
Wahrscheinlich sind sie ja gar nicht kaputt, schonmal an einem anderen Rechner getestet?

Is doch nur ne Vermutung, aber wieso sollten die ganzen HDDs innerhalb so kurzer Zeit bei dir in Grass beissen?

FeuerHoden
2011-02-02, 14:40:52
Den von der 1 TB Samsung habe ich gestern erst bemerkt, die anderen waren vorher schon da.
Und der Controller wird ja auch keine Sektoren kaputt machen. Da würde ich eher andere SMART-Attribute erwarten.

Es gibt bereits einen allgemeinen Verkaufsstop für alle Intel 6x Boards, die Händler bieten höchstkulante Umtauschaktionen an, Intel beschreibt das Fehlverhalten des Controllers sehr ähnlich zu deinem (Datenfehler, reduzierte Geschwindigkeit, als Symptom Blöcke die als defekt erkannt werden).

Ich würde diesen Fall also keinesfalls leichtfertig abtun und die Festplatten am SataIII Controller oder wenn geht an einem ganz anderen Rechner betreiben und das Mainboard dem Händler retournieren (es fallen keine Kosten für dich an).

Bevor du tatsächlich Daten verlierst die dir wichtig sind würde ich das Mainboard oder zumindest den Controller wechseln und DANN die Festplatten überprüfen. Die vielen Tests auf dem möglicherweise defekten Board verschlimmern die Probleme nur noch.

HDDGast
2011-02-02, 14:44:56
Bei den SMART-Meldungen sehe ich keinen Zusammenhang mit dem 6-series Bug. SMART registriert sektorbezogen Probleme, die Laufwerksintern auftreten, unabhängig vom Controller. Für die Signalübertragung zum Controller gibts eigene Counter innerhalb SMART, die aber mit den Sector counts gar nichts zu tun haben.


Reallocated Sector Count:

Bezeichnet die Anzahl der nach wiederholten Lese-/Schreibproblemen "ausgewechselten" Sektoren. Der Sektor wurde in der Firmware remapped auf einen im Reservebereich gelegenen. Datenverlust tritt dabei i.A. nicht auf, da auch bei einem schwer lesbaren Sektor das Laufwerk mit Hilfe von statistischer Auswertung vieler Leseversuche (über eine 3- oder 4-stellige Anzahl) den ursprünglichen Inhalt rekonstruieren kann.

Ich habe eine steinalte WD1200BB (120GB/7,2kRPM/PATA) in Betrieb, die hat dort den Wert 72 (Dez) drin stehen, und tut trotzdem unverdrossen weiter ihren Dienst. Auch vollständige Oberflächenscans laufen durch ohne sich irgendwo "festzufressen". Dagegen hatte ich in den vergangenen 10 Jahren schon 2-3 Fälle, wo alle SMART-Werte OK waren, die Platte aber doch Fehler schmiss (CRC-Fehler beim kopieren, plötzlich kein Zugriff mehr auf Volumes, usw.), die direkt zur Betriebssystem-/Treiberebene durchgingen und offensichtlich von der Firmware so nicht in die SMART-Tables geschrieben wurden. Da half dann meistens nur noch ein herstellereigenes Diagnosetool, um die Sache aufzudecken und den Fehler der Platte (und nicht dem Controller) zuordnen zu können.

Von daher würde ich dem Absolutwert, der in diesem Zähler steht, keine allzugroße Bedeutung zumessen. Interessant wäre höchstens die Änderung pro Zeiteinheit, also um wieviel sich der Zähler innerhalb welchen Zeitraums erhöht. Laufen Oberflächenscans aber ohne Auffälligkeiten durch ("festfressen" an bestimmten Prozentwerten der Gesamtkapazität bei einem vollständigen linearen Medienscan), und treten im Normalbetrieb keine sonstigen Probleme auf, dann ist. m.M.n. trotzdem alles "i.O.".


Current Pending Sector count:

Zahl der "schwachen" Sektoren. D.h., die Laufwerkslogik brauchte überdurchschnittlich viele Leseversuche, um den Inhalt des Sektors auszulesen. Anschließendes beschreiben und neuauslesen hat daraufhin jedoch problemlos funktioniert. Der Sektor wird markiert, und bei eventuellem Wiederauftreten von Leseschwierigkeiten zu einem späteren Zeitpunkt dann remapped. Sollte dieser Fall eintreten, wird der Zähler entsprechend um 1 verringert, und "Reallocated Sector Count" um 1 erhöht.

FeuerHoden
2011-02-02, 15:37:41
Reallocated Sector Count:

Bezeichnet die Anzahl der nach wiederholten Lese-/Schreibproblemen "ausgewechselten" Sektoren. Der Sektor wurde in der Firmware remapped auf einen im Reservebereich gelegenen. Datenverlust tritt dabei i.A. nicht auf, da auch bei einem schwer lesbaren Sektor das Laufwerk mit Hilfe von statistischer Auswertung vieler Leseversuche (über eine 3- oder 4-stellige Anzahl) den ursprünglichen Inhalt rekonstruieren kann.


Wiederholte Schreib/Leseprobleme sind in der Tat ein Symptom des Sandy Bridge Bugs, der Algo der die Sektoren als defekt markiert kann nicht erkennen ob der Sektor auf der Platte falsch gelesen wird oder vom Controller ein Fehler gemeldet wird.
Die vom Threadstarter gemeldeten Geschwindigkeitseinbrüche sind ebenfalls ein Indiz da von Intel auch so beschrieben. Das die Festplatten daneben noch eigene Fehler haben kann möglich sein und schließt den Bug nicht per se aus.

Selbst wenn sich herausstelt dass es nicht der Bug ist sollte der Threadstarter das Board in jedem Fall austauschen.

FeuerHoden
2011-02-02, 15:38:21
Wiederholte Schreib/Leseprobleme sind in der Tat ein Symptom des Sandy Bridge Bugs, der Algo der die Sektoren als defekt markiert kann nicht erkennen ob der Sektor auf der Platte falsch gelesen wird oder vom Controller ein Fehler gemeldet wird.
Die vom Threadstarter gemeldeten Geschwindigkeitseinbrüche sind ebenfalls ein Indiz da von Intel auch so beschrieben. Das die Festplatten daneben noch eigene Fehler haben kann möglich sein und schließt den Bug nicht per se aus.

Selbst wenn sich herausstelt dass es nicht der Bug ist sollte der Threadstarter das Board in jedem Fall austauschen.

Current Pending Sector count:

Dito.

PatkIllA
2011-02-02, 15:48:09
der Algo der die Sektoren als defekt markiert kann nicht erkennen ob der Sektor auf der Platte falsch gelesen wird oder vom Controller ein Fehler gemeldet wird. Ich stelle mir es eher ziemlich schwer vor, den Controller da in die Kette einzubauen. Und für die Kommunikation mit dem Festplattencontroller gibt es extra SMART-Attribute.

Ich werde aber mal den Marvell-Controller, den ich noch rumliegen habe einbauen.

Gast
2011-02-02, 16:31:52
Wiederholte Schreib/Leseprobleme sind in der Tat ein Symptom des Sandy Bridge Bugs, der Algo der die Sektoren als defekt markiert kann nicht erkennen ob der Sektor auf der Platte falsch gelesen wird oder vom Controller ein Fehler gemeldet wird.

Nein, da hat der Controller nix zu melden. Ihn gehen Laufwerksinterna diesbezüglich nichts an, für ihn ist dieser Teil komplett transparent und wird nur von der Plattenfirmware verwaltet. Wenn der Controller einen Datenfehler am Interface reklamiert, dann landet das höchstens unter der ID C7 "Ultra ATA CRC Error Rate" oder vergleichbaren Zählern.

Wie schon vorhin geschrieben - die Sektorverwaltung findet einzig und allein festplattenintern statt. Es geht dabei einzig und allein um die Umsetzung digital-analog: Die analog auf Magnetscheibe gespeicherten Bits müssen vom Lesekopf anhand der Magnetfeldstärke interpretiert werden, und wenn es da Probleme gibt (da das Medium gewisse Schwellenwerte nicht erreicht), wendet das Laufwerk intern dafür Lösungsmöglichkeiten an. Zum Thema u.a: http://de.wikipedia.org/wiki/Schwellenwert_%28Elektronik%29

FeuerHoden
2011-02-02, 17:21:28
Dann bleibt immer noch der Geschwindigkeitseinbruch als Indiz.

Anyway. Die komplette Mainboardserie ist von einem irreparablen Defekt betroffen und die Mainboards werden zurückgerufen. Es ist zwar wahrscheinlich nicht jedes einzelne Mainboard an sich betroffen, aber welche Boards genau betroffen sind lässt sich nicht sagen da der Fehler nicht sofort auftritt.

PatkIllA
2011-02-03, 19:01:23
Nachdem ich passend verkabelt habe, im BIOS die Controller passend eingestellt habe und die autoexec.bat analysiert habe, habe ich jetzt auch das Samsung ES-Tool ans laufen gebracht.

Da gibt mir das BIOS am Anfang einen Smart-Warnung aus und das ES-Tool meldet "AJ38 Smart Error"
Keine Fehler vom ES-Tool, aber noch keinen vollständigen Test gemacht.
Fehler "AJ36 Bad Sector" wird beim Random Scan gefunden.
nicht weiter untersucht.


Ich hab jetzt übrigens meine ASRock SATA3 Card eingebaut und habe an dem betroffenen Ports nur noch den DVD-Brenner hängen.

PatkIllA
2011-02-19, 17:12:22
Ich habe mir in der Zwischenzeit noch zwei WD20EARS gekauft und alle Daten drauf kopiert.
Die 2 Monate alte WD hat k&m mir anstandlos vor Ort ersetzt.

Die Samsung Festplatten habe ich alle noch mal mit ESTool gelöscht und überprüft, aber die Fehler bleiben.
1) AJ38 Smart Error
2) AJ36 Bad Sector
3) AJ36 Bad Sector

Man kann bei Samsung ja die Festplatten auch als Endkunde selbst einschicken. Gibt es da was zu beachten?

PatkIllA
2011-02-20, 15:29:07
Geraden eben mit HD Tune einen Oberflächenscan gemacht und meine zweite SAMSUNG HD103SI hat jetzt auch einen erhöhten "Current Pending Sector Count".

(del)
2011-02-20, 16:33:54
Nicht zu warm, nicht zu kalt - passt.

zu kalt? Selbst im Sommer werden meine Platten selten wärmer als 30°C

Thanatos
2011-02-20, 16:35:45
zu kalt? Selbst im Sommer werden meine Platten selten wärmer als 30°C

Die groß angelegte Google Festplattenstudie zeigte, dass eine Temperatur zwischen 40-45°c optimal für die Lebensdauer der Festplatten ist. Darunter und darüber stieg die Ausfallrate wieder an.

san.salvador
2011-02-20, 16:51:20
Die groß angelegte Google Festplattenstudie zeigte, dass eine Temperatur zwischen 40-45°c optimal für die Lebensdauer der Festplatten ist. Darunter und darüber stieg die Ausfallrate wieder an.
IIRC war das untere Limit etwa 25°C - aber ja, das meinte ich. Zu kalt ist genau so schädlich wie zu warm. Alles zwischen 30°C und 45°C würde ich als ideal einstufen.