PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 1. Woche RAID5 - Erste Platte defekt


FeuerHoden
2011-10-15, 13:32:43
Hallo

habe ein RAID5 aus 3 Seagate 7200.12 1TB Platten am Onboard Controller des Gigabyte GA-870A-UD3 und jetzt meldet der Controller beim Start dass bereits eine Festplatte entweder 'disconnected' oder 'failed' ist.
Die Steckkontakte habe ich überprüft und ich werde nachher mal probieren die Platte in einem anderen System zum laufen zu bringen, ich habe aber vorher 2 Fragen:

1. Kann es sein dass eine Platte länger zum Initialisieren braucht und deswegen nicht erkannt wird?
2. Die Platten sind im Controllermenü mit 1-3 durchnummeriert, kann ich davon ausgehen dass Platte 1 im Controllermenü auch die ist die am SATA Port 1 hängt und die Nummerierung somit ident ist oder kann das abweichen?


MfG
FeuerHoden

Sven77
2011-10-15, 14:02:13
Ich hab die Erfahrung gemacht das Raid-Controller manchmal wählerisch sind was die Platten angeht. Reicht schon die falsche FW aus, und der Verbund wird nach einiger Zeit korrup, obwohl beim initialisieren alles geklappt hat

Tesseract
2011-10-15, 14:10:09
1. Kann es sein dass eine Platte länger zum Initialisieren braucht und deswegen nicht erkannt wird?
ja, das kann sein. ist es ein fake-raid d.h. über die raidfunktionalität des boards gelöst?

2. Die Platten sind im Controllermenü mit 1-3 durchnummeriert, kann ich davon ausgehen dass Platte 1 im Controllermenü auch die ist die am SATA Port 1 hängt und die Nummerierung somit ident ist oder kann das abweichen?
wahrscheinlich ist es so (bzw. um eins verschoben da die SATAs wahrscheinlich bei 0 beginnen was im raid-bios nicht unbedingt so sein muss), aber darauf verlassen würde ich mich nicht wenn es nicht definitiv irgendwo in der anleitung, doku oder sonstwo steht.

FeuerHoden
2011-10-15, 14:47:43
Die Firmwares werde ich mal prüfen

ja, das kann sein. ist es ein fake-raid d.h. über die raidfunktionalität des boards gelöst?

Exakt.

wahrscheinlich ist es so (bzw. um eins verschoben da die SATAs wahrscheinlich bei 0 beginnen was im raid-bios nicht unbedingt so sein muss), aber darauf verlassen würde ich mich nicht wenn es nicht definitiv irgendwo in der anleitung, doku oder sonstwo steht.

Die genau Nummerierung im Controllermenü (etwas verkürzt von mir):

1:1 - ST 7200.12 1 TB
1:2 - ST 7200.12 1 TB
1:3 - failed failed

Aber kann es nicht auch sein dass der Controller nach dem Ausfall einer Platte das Array neu angeordnet hat und die Durchnummerierung damit Mumpitz ist?

Egal, das kann ich ja durch umstecken ausprobieren aber das kann ich erst später machen.

FeuerHoden
2011-10-15, 19:01:16
OK, Firmware ist überall die gleiche, alles Port umstecken hat nichts gebracht aber der Controller kann die Platte formatieren (Secure Erase), das heißt sie funktioniert und ich schau mal ob ich sie wieder ins Array einbinden kann.

Edit: Secure Erase ist fehlgeschlagen, habe die Platte jetzt mal unter Windows formatiert und mache mit RaidXpert eine Wiederherstellung, wenn das auch nicht klappt kann ich diese RAID-Lösung vermutlich aufgeben weil vorne und hinten nichts funktioniert.

Tesseract
2011-10-16, 13:13:46
von fake-raids generell die finger weg, die kombinieren alle nachteile von soft-und hardware-raids und haben fast keine vorteile.

wahrscheinlich ist der controller zu pingelig bei verschiedenen timeouts, oder die platte hat was. lies mal mit cystaldiskinfo oder ähnlichem SMART aus.

FeuerHoden
2011-10-17, 12:22:19
Habe die dritte Platte wieder ins Array einbinden können, aber kaum 2 Stunden später wärend eines Kopiervorgangs erschien eine 'Array gone Critical' Meldung, was ein Indikator dafür ist dass der Controller wieder eine Platte aufgegeben hat.

Und Timeouts kann ich gar keine einstellen oder zumindest noch nicht gefunden wo.

Sven77
2011-10-17, 12:27:48
Habe die dritte Platte wieder ins Array einbinden können, aber kaum 2 Stunden später wärend eines Kopiervorgangs erschien eine 'Array gone Critical' Meldung, was ein Indikator dafür ist dass der Controller wieder eine Platte aufgegeben hat.

Exakt das gleich Verhalten hatte ich mit einem Raid-Controller der mit einer bestimmten Platte (FW) nicht zurecht kam. Ob das vergleichbar ist, weiss ich nicht, das war ein externes 2000Eur Raid (http://www.sonnettech.com/product/fusiond800raid.html) und kein Onboard-Controller..

FeuerHoden
2011-10-17, 12:51:40
OK, ich werde die FW's mal auslesen und ggf. eine andere aufspielen, bisher habe ich mich nur mit dem Aufdruck der FW zufrieden gegeben.

sei laut
2011-10-17, 13:20:26
Raid-Controller sind in der Tat wählerisch, was die Platten betrifft. (unabhängig, welcher Festplattenhersteller)
Da muss man dann unbedingt beim Hersteller nachschauen, sonst quält man sich nur unnötig. (ich geh davon aus, dass die Boardhersteller das auch listen, bin mir gerade nicht sicher)

Gast
2011-10-17, 21:13:26
Was sagen denn die Smart-Werte der Platte? Ich hatte hier auch noch 2 Wochen (mit 4*1,5 TB Samsung) gleich den ersten Ausfall... War aber in den Smart-Werten der Platte ersichtbar, und die wurde dann auch anstandslos getauscht.

FeuerHoden
2011-10-17, 21:50:42
Tja ...

Wollte den Server gerade hochfahren um FW und SMART Werte zu überprüfen und jetzt das:

http://666kb.com/i/bxvp6x1v7u74plmyb.jpg

Normalerweise sind das 7-8 Punkte und bis ich das Foto am Rechner hatte waren schon 4 Reihen voll, da stimmt irgendetwas grundsätzliches nicht. Ahja und der Infoscreen vom Raid Controller scheint nur eine Sekune auf. Wenn das Wort 'Critical' nicht blau unterlegt wäre hätte ich kaum eine Chance das zu lesen.

Aber wärend ich hier getippt habe ist der Server nun hochgefahren, ich schau mal ob sich was auslesen lässt.

drdope
2011-10-17, 22:08:54
Zeigt der Controller evtl. die Serienummern der HDDs an? darüber könnte man sie eindeutich identifizieren.

Generell würde ich bei Fake-Raids (über eine reine Softwarelösung im treiber implementiert) von allen Raidleveln >=1 absehen, das bringt meiner Erfahrung mehr Streß als es Vorteile bietet.

FeuerHoden
2011-10-17, 22:13:13
So, der Server fährt nicht mehr hoch. Der Controller zeichnet minutenlang Punkte auf den Schirm, meldet dann 'Warning, Something is wrong with your Hardware!' und verweigert den weiteren Bootvorgang. Der Server ist als ATM tot und ich sehe mich jetzt auf geizhals.at nach einem Controller um.

Edit: RaidXpert hat jetzt die 3. Platte gar nicht mehr angezeigt aber von den anderen werden Seriennummer und Firmware angezeigt, die angezeigte FW stimmt auch mit der aufgedruckten überein. Die Seriennummer ist 8-stellig und die ersten 4 Stellen stimmen auch überein, also werden die Platten nicht so weit auseinander produziert worden sein als dass da eine andere Hardware Revision verbaut wäre.
ATM kann ich aber GAR NICHTS mehr überprüfen, die Kiste fährt stur nicht mehr hoch.

Edit2: Crystaldiskinfo kann die Daten des Raids überhaupt nicht auslesen, mit der Systemplatte gehts aber problemlos und da war auch alles in Ordnung.

Unlimited
2011-10-18, 16:38:24
Tja, vergiss es würde ich sagen.

Ich weiß zwar aus eigener Erfahrung, dass du mir das jetzt nicht glauben wirst, aber:
Ich habe es selber an der ICH9R mit den unterschiedlichsten Platten probiert.
Die letzte Konfiguration die bei mir einwandfrei funktionierte, das waren 4x250GB.
Die 420AS von Seagate mit einem Platter.. Das war toll!!

Am selben Controller ging danach mit größeren Platten leider garnichts mehr.
Ich vermute einen prinzipiellen BUG, wenn man eine bestimmte RAID5-Größe überschreitet o.Ä.
Ständig Disconnects, obwohl die Platten einwandfrei sind.

Eigentlich eine Frechheit, dass die Hersteller so einen Schrott überhaupt bewerben dürfen.., man müsste denen echt mal die verschwendete Zeit in Rechnung stellen dürfen, die man benötigt, bis man herausfindet dass man einem defekten Beta-Produkt aufgessen ist! Das die bewrobenen Features sämtlich nicht funktionieren im wahren Leben.
Dann würden die sich auch nicht mehr trauen, einen mit heißer Luft anzulocken...

M.E. gibts keinen RAID5 onboard Controller, der WRIKLICH zuverlässig funktioniert.
Und wenn ein RAIDcontroller nicht 100% zuverlässig funktioniert, dann funktioniert er in meinen Augen GARNICHT, DEFEKT!
Umtauschen, gnadenlos.
Solange bis der Hersteller pleite ist.
Meine Meinung.

Nach 4x Hitachi, 4x WD habe ich die Geldverschwendung dann aufgeben.
Jetzt benutze ich FlexRAID, was völlig ohne Raidcontroller auskommt und seit nem halben Jahr TOP mit ALLEN möglichen Platten-Herstellern und -größen gemischt läuft...

Ich lege dir folgenden thread ans Herz:
http://www.planet3dnow.de/vbulletin/showthread.php?t=394844

Unlimited
2011-10-18, 16:56:40
So, der Server fährt nicht mehr hoch

verweigert den weiteren Bootvorgang.

Der Server ist als ATM tot

die 3. Platte gar nicht mehr angezeigt aber von den anderen werden Seriennummer und Firmware angezeigt,

die angezeigte FW stimmt auch mit der aufgedruckten überein.

Die Seriennummer ist 8-stellig und die ersten 4 Stellen stimmen auch überein, also werden die Platten nicht so weit auseinander produziert worden sein als dass da eine andere Hardware Revision verbaut wäre.
ATM kann ich aber GAR NICHTS mehr überprüfen, die Kiste fährt stur nicht mehr hoch.

Edit2: Crystaldiskinfo kann die Daten des Raids überhaupt nicht auslesen, mit der Systemplatte gehts aber problemlos und da war auch alles in Ordnung.

Diese Symptome kommen mir allesamt bekannt vor, hatte ich auch. Obwohl ich quasi durchlaufende Serienummern hatte.
Dachte zuerst eine Platte wär defekt. Sie hatte i.d. SN auch ganz merkwürdige Symbole... phasenweise...
Da fällst du echt vom Glauben ab.
Witzigerweise laufen sämtliche Platten bis heute einwandfrei (nicht im RAID) auf meinem Rechner!!

Einfach alle Platten abhängen, Raid löschen. Schlauerweise wirst du ja wohl diene Daten noch gesichert haben....

Platten dann im laufenden Betrieb einzeln an SATA ranhängen und formatieren.
Damit sollte es wieder gehen.

Fang bloß nicht an mit "Kabeltausch", "Firmwareorgien", Plattentausch. Verbuch es unter "Was dazugelernt" und lass es bleiben.
Damit sparst du dir viel Zeit und Ärger.

An deiner Stelle würde ich mir auch KEINEN "Hardware" RAIDcontroller zulegen.
Dann sparst du zusätzlich noch viel Geld.

Weil vor einem BUG im RAID5 bist du dort auch nicht gefeiht und jeder Hersteller wird behaupten: jajajaja, Dummie, kauf dir erstmal dieses 20EUR-Kabel, dann dazu diese RAID Edition blablabla getestete Festplatte fürs doppelte Geld wie normale Platten und DANN reden wir weiter... mir hat der Support damals auch irgendwelche Firmwares untergejubelt ("jaja, ist bekannt, liegt an der FW" lol...)... stimmt, ich vergaß, ich Spinner... maxtor-platten hatte ich auch mal probiert. Sämtlich stundenlang durchgeflasht, formatiert, low-level-formatiert, etc.... Eine ging sogar komplett hops dabei.
PRIMA!
DANKE GIGABYTE!!!
So ein Lü-..npack.
Der Fehler lag natürlich NICHT an den Platten, sondern war ein BUG, wie sich EIN JAHR!!!! später herausstellte und Gigabyte kleinlaut zugab.
Google mal DualBIOS / QuadBIOS Bug.
http://ht4u.net/forum/index.php?topic=48056.0

Genau so ein BUG wirds bei dir und mir auch sein, der weiterhin verhindert, dass RAID5 mit großen und vielen Platten zuverlässig läuft.... bloß einer der sich besser versteckt und nicht so offensichtlich von der Community aufgedeckt wird.
Glaub bloß nicht, durch andere Platten würde sich was bessern!

Richte dir ein FlexRAID ein.
Und schlag damit den dreisten, unfähigen, geradezu lügenden Herstellern ein Schnippchen.

drdope
2011-10-18, 17:46:28
Ich kann über Hardwareraids per dedizierten Controller nichts negatives Berichten.

Man sollte sich nur vor dem Plattenkauf informieren, mit welchen ConsumerHDDs an dem verwendeten Controller positive Erfahrungen gemacht wurden (die Hersteller testen idR nur Serverplatten) und bei einer großen Anzahl von HDDs sollte das NT ausreichend dimensioniert sein um Spitzenlasten beim Spinup der HDDs zu kompensieren (staggered Spinup funzt nur mit Backplanes oder modifizierten Sata-Stromstecken; Stichwort Pin 11).

Das gleiche gilt auch für den Einsatz von Raidcontrollern in PEG16x Slots auf Consumerboards--> vorher informieren mit welchen Boards das harmoniert, wenn man keine teuren Serverboards nutzen möchte.

FeuerHoden
2011-10-18, 22:12:01
Na gut,

ich denke es ist sinnvoller wenn ich mir zum Wochende mal FlexRaid ansehe und am Wochenende mal etwas damit rumprobiere, danach kann ich mir immer noch einen extra Controller kaufen wenn ich will.

Der Witz ist ja dass die Konfiguration mit 3 Platten ja nur der Anfang sein sollte, eigentlich plane ich ja alle paar Monate oder immer dann wenn ich es brauche eine weitere Platte ins Array hinzuzufügen bzw. ein zweites unabhängiges Array zu erstellen, aber das ist jetzt alles erstmal auf Eis bis die Minimalkonfiguration überhaupt mal läuft.

FlashBFE
2011-10-25, 15:49:46
Um mal eine kleine Lanze für Onboard Controller zu brechen:
Ich habe drei 1TB WD Green an einem ICH10R (Gigabyte X58 Board) hängen und ein paar Wochen nach dem Kauf ging auch die erste Platte sporadisch offline. Ich habe damals ewig rumprobiert und alles (gibt hier auch einen Thread dazu) versucht, bis ich auch das Rest-RAID komplett kaputt hatte und mit einem Programm (zum Glück) neu aufbauen durfte. Dann habe ich endlich die Platte beim Händler ersetzen lassen. Seit dem gings gut. Die neue Platte hatte auch eine neue Typennummer als die alten zwei. Vor ein paar Monaten ging dann die neue ausgetauschte Platte hops mit leisem Klackern. Diesmal habe ich gar nicht weiter rumprobiert, sondern diese gleich als RMA zu WD geschickt. Diese haben den Defekt anerkannt und mir eine (wieder neue) Austauschplatte geschickt, die seit dem problemlos läuft.

Das Fazit daraus: Manchmal ist etwas einfach kaputt und muss ersetzt werden. Ewiges Rumprobieren macht die Sache nur noch schlimmer. Und das RAID5 ist immer noch das Selbe wie von Anfang an. Sinnlos ist es also nicht gewesen.

FeuerHoden
2011-10-25, 15:59:39
Inzwischen wird keine der 3 Platten mehr erkannt und der Controller verweigert nicht nur den Start des Systems sondern auch den Zugang zum BIOS da der Controller versucht die Platten zu initialisieren und dabei hängen bleibt. Nach ca. 10 Minuten erlaubt der Controller dann dem System das weitere hochfahren und ich kann ins BIOS.

Aber egal ob ich den Controller nun auf RAID oder IDE konfiguriere, er erkennt keine Platten, die Systemplatte am anderen Controller wird anstandslos erkannt. Es geht jetzt also gar nicht mehr um ein RAID, der Controller ist überhaupt gar nicht in der Lage die angeschlossenen Platten zu erkennen.

Gast
2011-10-28, 18:44:15
Ich habe seit ca. 12 Monaten 9 Seagate 7200.12 1TB im Raid5 an einem Areca 1231.
In den ersten 2-3 Monaten hatte ich 3 defekte Platten, seither läuft es ohne Probleme. Die 7200.12 ist eine billig Platte, da sollte man gleich eine Ersatzplatte einplanen um nicht auf die RMA Disk warten zu müssen.

Snoopy69
2011-11-15, 15:57:07
@ FeuerHoden

Ich nehme mal an, daß der Controller die Non-Raid-HDDs einfach kickt bzw. erst garnicht als ein Array laufen lässt.
Du hast nur die Möglichkeit echte Raid-HDDs mit Time-Limited Error Recovery. Also mit TLER, CRC oder CCTL.
Oder eben einen gute Raid-Controller, der auch mit normalen HDDs gut zurecht kommt.

Wichtig zu wissen wäre noch, daß SATA-Raid-Controller bei SATA-HDDs nicht so wählerisch sind, wie SAS-Raid-Controller, die SAS- als auch SATA-HDDs fressen.
Das liegt daran, daß der SATA-Protokoll lediglich softwaremäßig emuliert wird.
Aber es gibt ja auch genug User, die normale SATA-HDDs erfolgreich an SAS-Controllern laufen haben.

Ich dachte jahrelang, daß Raid-Controller-Karten im Homebereich völlig oversized sind.
Mittlerweile möchte ich die Vorteile (Zuverlässigkeit, Performance, Flexibilität etc.) nicht mehr missen. Zumal solche Controller eine langjährige, wertstabile Anschaffung sind.
Ich kann so gut wie alles am Array ändern ohne zu booten oder gar das Array auflösen zu müssen.
Paranoide können sich den Zustand des Arrays auch per Mail zukommen lassen :freak: (etwa ein Server, der 24/7 laufen muss).

Ich selbst habe einen ARC-1261ML. Es laufen mom. 10x 1TB Samsung F1 absolut fehlerfrei.
4 Stück @ Raid 5 davon 5 Monate lang am ARC-1210. Dann Umzug auf ARC-1261ML mit Upgrade auf Raid 6 (ohne Array aufzulösen natürlich).
Aufgrund Platzmangel und gutem Vertrauen (Vollbackup ist ja auch noch da) hab ich letztes Jahr einen Downgrade zurück auf Raid 5 gemacht (alles "online")

FeuerHoden
2011-11-15, 17:06:46
Das stimmt so wie du es sagst (non-Raid Platten usw.), aber ich habe mich jetzt ehrlicherweise nicht mehr viel mit der Kiste befasst, weil der Kasten komischerweise auch in non-Raid Konfiguration (IDE-Mode), die Platten nicht erkennt. :confused:

Ich war ja schon dabei geknickt aufzugeben weil ich nicht weiß ob ich andere Platten, ein anderes Mainboard oder einen dedizierten Controller kaufen soll, preislich kommt alles so ca. aufs gleiche (~100-150€).

Die von dir propagierten Areca Controller sind mit sicherheit sehr zu empfehlen, haben aber leider jeder einen Lüfter und sprengen das Budget ein wenig um 4-fache. ;)
Ich muss mich bei der Controllerwahl an Highpoint oder Promise orientieren (mehr gibt die Kohle nicht her), welcher von den beiden Herstellern wäre denn eher zu empfehlen?

Edit: http://geizhals.at/440496 Den hier finde ich sexy, aber akzeptiert der meine non-Raid Barracudas?

Snoopy69
2011-11-15, 17:24:53
Der 1261ML wird völlig lautlos von einem 120er-Lüfter angepustet. Da ist ja nur ein Passivkühler drauf.

Bei den günstigen Controllern bin ich nicht so auf dem Laufenden.
Da hörst du dich besser bei HWluxx (http://www.hardwareluxx.de/community/f15/) um.
Im Idealfall kannst du ja im Marktplatz einen guten, gebrauchten Controller abstauben.

Ist zwar wahrscheinlich über deiner Preisvorstellung, aber dennoch ein sehr guter Preis (kostet neu über 500) http://www.ebay.de/itm/Areca-ARC1231ML-ARC1280-Board-12-Port-PCIexpress-x8-1GB-RAM-Raid-0-1-3-5-6-/270847033024?pt=Controller&hash=item3f0fbdbec0
Die BBU alleine kostet schon über 100€...