Hallo!
Habe in der Firma eine Server mit ner Informix-Datenbank aufgesetzt (IDS2000). Der Server ist mit einem PERC3-Raid-Controller, sowie 4 Xeon-MP-CPUs á 1.5 GHz und 1 GB DDR-RAM ausgestattet. Gespeichert wird auf 4 SCSI-Platten á 18 GB mit 15.000 U/min. im RAID5 + 1 als HotSpare.
Die Antwortzeiten sind wider Erwarten schlechter als auf dem alten System (4 PIIIs, 512 MB RAM).
Bevor ich jetzt aber meinen Doktor in Informix Dynamic Server mache, wollte ich nur fragen, ob es performancemäßig etwas ausmacht, wenn ich statt auf 4 Platten, auf 5 Platten speichere (die HotSpare dann quasi auslagere, mehr passen halt net in den Server).
D.h. die Kapazität steigt auf jeden Fall um 18 GB, aber wie sieht\'s mit der Performance aus? Im RAID5 arbeitet dann ja quasi auch ein Schreib-Lesekopf mehr, dann können parallel doch mehr Daten verschoben werden, oder?
Die Anregung kam von unserem Sofwarehaus, die sagten, lieber auf 10 Platten á 9 GB, statt auf 5 Platten á 18 GB speichern...
Ist da was dran?
P.S.: Ich weiß, daß ich den Server komplett neu aufsetzen muss - das ist aber sowieso geplant...
Archiv SCSI 2.798 Themen, 12.895 Beiträge
kleine einführung:
RAID steht für Redundant Array of Independent (oder Inexpensive) Disks, zu deutsch: redundante Anordnung unabhängiger (oder billiger) Festplatten, und wurde 1987 von der Berkeley Universität als Beschreibung der Datensicherheit festgelegt. Wie die Abkürzung bereits sagt, sind, um RAID verwenden zu können zwei oder mehr Festplatten notwendig, die gekoppelt, je nach Level, sich entweder Daten teilen und/oder Daten doppelt speichern. Die Teilung der Daten hat den Sinn, dass doppelt so viele Daten gleichzeitig geliefert werden können, da sie unabhängig voneinander auf zwei Festplatten liegen. RAID-Arrays (so die geläufige Bezeichnung) werden vor allem in Servern verwendet, da hier viele Anfragen gleichzeitig verarbeitet werden müssen. · Datenträgersatz – Zusammenfassung von Speicherplatz (auch auf verschiedenen Laufwerken zu einem logischen Laufwerk unter NTFS ...erweiterter Datenträgersatz ACHTUNG: KEIN RAID nur MS·
RAID 0: Striping. Bei diesem Verfahren werden mehrere kleine Laufwerke zu einem großen logischen Laufwerk zusammengeschlossen. Nachteil: Beim Ausfall nur einer Platte sind alle Daten auf dem logischen Laufwerk verloren. KEINE DATENSICHERHEIT
RAID 1: Mirroring (Festplatten-Spiegelung). Zwei Platten werden zeitgleich mit denselben Daten beschrieben.
RAID 0+1: Manchmal auch RAID 10 genannt vereinigt Mirroring und Striping. Zwei striped Sets werden gespiegelt wobei sich die hohe Sicherheit von RAID 1 mit der Performance von RAID 0 vereinigt. Nachteil sind die hohen Kosten, da immer die doppelte Anzahl Platten gebraucht wird.
RAID 5: Hier werden sowohl die Daten wie auch die Paritäten auf alle Disks verteilt; der Flaschenhals Paritätsplatte entfällt; beim Ausfall einer Platte kann diese, so hot pluggable während dem Serverbetrieb, ausgewechselt werden.
...die kombination mit der höchsten sicherheit UND performance ist 0+1, dafür benötigst du minimum 4 platten - das hat sich gerade auch bei datenbanken gut bewährt.
zusätlich kann man je nach controller das gesamte 1. raid noch mit einem 2. sichern.
;-)
Hallo gaftermy!
Danke für die Einführung.
Allerdings hab ich mich über die verschiedenen RAID-Level auch schon etwas erkundigt.
Ich denke, daß vom Preis-Leitsungsverhältnis momentan RAID 5 die beste Lösung ist (unser Softwarehaus hat allerdings RAID10 empfohlen).
Ich hab den Server vom DC zum Mitgliedsserver der Domäne degradiert - das hat schon einen Performanceschub gebracht, mit dem man leben kann.
Meine Frage war nur:
Erhöht sich (neben der Kapazität) die Performance, wenn ich statt auf 4 FPs + HSP auf 5 FPs + HSP speichere?
Lohnt sich das, noch eine zusätzliche Platte anzuschaffen oder ist das von der Leistungsverbesserung (wenn überhaupt) zu gering?
Ehrlich gesagt, geht ein RAID10 gar nicht in den Server rein...
ps: für raid10 brauchst du auch nur 4 platten.
Hi Xafford!
Bist Du Dir sicher, RAID10 mit nur 4 Platten fahren zu können?
RAID10 ist doch RAID5 gespiegelt, und für RAID5 braucht man doch mind. 3 Platten (2 + 1 Parity), das ganze gespiegelt wärn 6 Platten.
Ich würd dafür aber nicht meine Hand ins Feuer legen...
nein, was du meinst ist eventuell RAID50, wobei die beschreibung nicht stimmt. bei RAID 50 werden zwei RAID5 gestriped. RAID 10 ist RAID1+RAID0, also ein stripe (mindestens 2 platten) werden nochmal gespiegelt (geht in gewissen konfigurationen mit den entsprechenden controllern auch schon ab 3 platten). aber wie schon erwähnt, ich denke, daß der engpaß nicht unbedingt an den laufwerken liegt.
hi, also erst einmal sollte man analysieren, wo der engpaß ist. rein physikalisch bedingt ist ein raid 5 im schreiben kaum schneller als ein raid1 und um einiges langsamer als ein raid0, da die berechnung der checksummen das ganze doch etwas ausbremst. wo es seine vorteile ausspielen kann ist beim lesen, gerade wenn es ein reines scsi-raid ist und kein mischsystem mit scsi oder fc-anbindung und ide-platten, wie z.b. die Arenas. wenn es wirklich komplett krankt und nciht mehr ausreicht, dann wäre eventuell über ein raid50 nachzudenken, was aber noch von einem faktor abhängt: wieviele kanäle hat das raidsystem?
es bringt nämlich nicht viel, wenn es nur 2 kanäle hat und U160 als modus besitzt, da bist du mit 2 platten pro kanal und spare schon ziemlich an der grenze der realen übertragung, eine minimale steigerung sollte aber noch drin sein. sollte das raid nur einen einzigen kanal besitzen, dann ist mit platten ohnehin keine durchsatzsteigerung mehr zu erreichen. was aber bei datenbanken noch ein immenser faktor ist sind die clustergrößen und das dateisystem. wenn in eurer datenbank nicht große BLOBs gespeichert sind, sondern hauptsächlich chars, ints, usw, dann kann eine optimierung der clustergröße einiges bringen, da müsste man aber schon recht genau analysieren, wie große die pakete letztendlich werden.
aber mal das raid außer acht gelassen, datenbanken (wenigstens die, welche den namen verdienen) arbeiten hauptsächlich aus dem speicher, und wenn die antwortzeiten oder die dauer von querys schlecht sind, dann liegt es meist eher am design der datenbank, probleme des hostsystems, als an problemen mit den platten. der großteil der tables landet ohnehin im speicher und die gängisten querys werden gecached. untersucht mal das tabellen und datenbanklayout in bezug auf die gewählten tabellentypen undindizes. lieber ein paar indexe zu viel, als zu wenig. vor allem auch BLOBs in der datenbank machen den meisten zu schaffen, einzig oracle ist bei BLOBs wirklich empfehlenswert.
um, damit der "Parity-Aha-effekt" reinkommt
(RAID 0 hat keine, RAID 5 hat Parity-Daten ... :) )
hih
bis denne
da gaga
PS: is just copy n paste, hab noch paar andere modi genauso erklärt (habich mir mal aus nem ewig-uralten thread rauskopiert :O)), ich hoff ich fall auch nich gleich wieder mit der tür ins haus ...
******
RAID 0 :
Der RAID-Level 0 wird auch als "Non-Redundant Striped Array" bezeichnet. Die "0" steht also für "keine Redundanz" bzw. "keine Sicherheit".
Im RAID-0-System werden zwei und mehr Festplatten zusammengeschaltet, um die Schreib-Lese-Geschwindigkeit zu erhöhen - z.B. zur Verarbeitung von digitalen Video-Daten. Die beim Benutzer entstehenden Daten werden in kleine Blöcke mit einer Größe von 4 bis 128 KByte aufgeteilt. Diese Blöcke werden abwechselnd auf den Platten des RAID-0-Arrays gespeichert. So kann auf mehrere Platten gleichzeitig zugegriffen werden, was die Geschwindigkeit insbesondere bei sequentiellen Zugriffen erhöht. Da bei RAID 0 keine redundanten Informationen erzeugt werden, gehen Daten verloren, wenn eine RAID-Platte ausfällt. Und da die Daten einer Datei auf mehrere Platten verteilt sind, lassen sich auch keine zusammenhängenden Datensätze mehr reproduzieren, selbst wenn nur eine Platte im RAID-0-Array ausfällt.
RAID 1 :
In einem RAID-1-System, auch "Drive Duplexing" genannt, werden auf zwei Festplatten identische Daten gespeichert. Es ergibt sich damit eine
Redundanz von 100 Prozent. Fällt eine der beiden Platten aus, so arbeitet das System mit der verbleibenden Platte ungestört weiter. Die hohe Ausfallsicherheit dieses Systems wird allerdings meist nur in relativ kleinen Servern eingesetzt, da bei RAID 1 die doppelte Platten-Kapazität benötigt wird, was sich bei großen Datenmengen schnell finanziell bemerkbar macht.
RAID 10 bzw. RAID 0+1
Eigentlich handelt es sich bei RAID 10 nicht um einen eigenen RAID-Level, sondern lediglich um die Kombination von RAID 1 mit RAID 0. Damit werden die Eigenschaften der beiden "Mutter-Levels" - Sicherheit und sequentielle Performance vereinigt. Bei RAID 10 werden üblicherweise vier Festplatten verwendet, denn dieses System verlangt nach zwei Paaren gespiegelter Arrays, die dann zu einem RAID-0-Array zusammengefaßt werden. RAID 10 eignet sich insbesondere zur redundanten Speicherung von großen Dateien. Da hierbei keine Parität berechnet werden muß, sind die Schreibzugriffe mit RAID 10 sehr schnell. RAID 10 gilt übrigens auch als zusätzlich gestripte Version von RAID 1.
RAID 5
Beim RAID-5-Level werden die Parity-Daten - im Unterschied zu Level 4 - auf allen Laufwerke des Arrays verteilt. Dies erhöht die Geschwindigkeit beiverteilten Schreibzugriffen. Engpässe durch die spezielle Parity-Platte können nicht entstehen. Bedingt durch diese Vorteile hat sich RAID 5 in denletzten Jahren beliebteste RAID-Variante für PC-Systeme etabliert.
RAID 50
Werden sowohl große Datensicherheit wie auch schnelle Zugriffszeiten und hohe Datentransfer-Raten benötigt, empfiehlt sich RAID 50. Auch diese Version stammt von AMI. Sie ist ebenfalls komplexer als niedrigere RAID-Level und benötigt ebenfalls sechs Festplatten. RAID 50 ist die gestripte Version von RAID 5.