Current Page: | Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: mmserver » Learning Units » Unit ID: 040raid |
---|---|
Last Modified: | Tuesday, 2015-05-05 - 08:09:06 |
Tools: | Validate — Preview XML Preview HTML Preview PDF |
Alternative: | Printable HTML |
Title: | RAID Speichersysteme | ||
---|---|---|---|
Abstract: | RAID ist die Abkürzung von “Redundant Array of Inexpensive (auch Independent) Disks”. Ein RAID ist ein Verbund von mehreren magnetischen Laufwerken, der wie eine einzelne große Disk agiert. Der Vorteil des Verbundes ist erhöhte Datensicherheit, bessere Schreib/Leseperformance und geringere Kosten im Betrieb. Es gibt unterschiedliche Arten, Laufwerke zu einem Verbund zusammen zu schließen. Ein RAID Level bezeichnet jeweils einen speziellen Aufbau der Komponenten. | ||
Status: | content final - to do: siehe LU Zipf gesetz | Version: | 2005-10-10 |
History: |
2005-10-10 (Thomas Migl): Abstract hinzugefügt |
Author 1: | Thomas Migl | E-Mail: | migl@ims.tuwien.ac.at |
---|---|---|---|
Author 2: | (empty) | E-Mail: | (empty) |
Author 3: | (empty) | E-Mail: | (empty) |
Author 4: | (empty) | E-Mail: | (empty) |
Author 5: | (empty) | E-Mail: | (empty) |
Organization: | Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/ |
Motivation1Motivation
RAID Definition
2MotivationDie Hauptmotivation zur Entwicklung von Disk Arrays ist, ein Speichermedium zu schaffen, welches in Bezug auf Performance, Datensicherheit und Kostenverträglichkeit anderen Medien überlegen ist. .Als Standard für Massenspeicher digitaler Informationen hat sich die magnetische Speicherplatte durchgesetzt. Im Laufe der Jahre konnten deren Eigenschaften Speicherkapazität und Plattengröße/MB rapide verbessert werden. Im Gegensatz dazu erweisen sich die technischen Fortschritte betreffs Gesamtperformance (Zugriffszeit, I/O Rate…) allerdings als nur mäßig. Auch hat man bei einer einzigen großen Speicherplatte den Nachteil, dass im Falle eines Laufwerkausfalles sämtliche Daten verloren gehen. Als Alternative zu einer einzigen großen Speicherplatte bietet sich nun ein Verbund von mehreren, unabhängigen Laufwerken an, eines so genannten RAID. Vorteile eines RAID gegenüber einer einzigen großen Speicherplatte (SLED) sind erhöhte Zuverlässigkeit, bessere Performance und geringere Kosten. RAID DefinitionRAID ist die Abkürzung von “Redundant Array of Inexpensive (auch Independent) Disks”. Ein RAID besteht aus mehreren unabhängigen Laufwerken, die dementsprechend zusammengefasst, wie ein einziges großes Speichermedium arbeiten. Prinzipien von RAID1Grundprinzipien
Striping
Erzeugung von Redundanz
Verbund unabhängiger Laufwerke
2GrundprinzipienDie grundlegenden Prinzipien von RAID Systemen sind:
StripingFunktionsweiseDie Daten werden vor dem Speichern in Datenblöcke geteilt. Aufeinander folgende Blöcke werden dann gleichmäßig über die Laufwerke aufgeteilt. Diese Technik wird im englischen als „Striping“ bezeichnet. Striping mit 2 Laufwerken: Datenblöcke ABCDEFGH werden auf 2 Laufwerke aufgeteilt [luth2004] VorteileStriping verbessert wesentlich die Gesamtperformance des Systems. Auf Grund der Möglichkeit, dass auf die Platten nun parallel zugegriffen werden kann, können einerseits mehrere Requests gleichzeitig abgearbeitet werden (multiple independent requests), andererseits können Dateien schneller ein- und ausgelesen werden (single multipile-block request). Erzeugung von RedundanzDie Erzeugung von Datenredundanz dient zur Verbesserung der Systemzuverlässigkeit. Wie schon oben erwähnt, verliert man bei einer SLED im Falle eines Plattenausfalls sämtliche Daten. Bei einem RAID schafft man nun zusätzlichen (redundanten) Speicherplatz für Datenkopien oder Sicherungscodes (ECC), mit deren Hilfe man im Falle eines Plattenausfalls die Daten rekonstruieren kann. Die verschiedenen RAID unterscheiden sich dadurch, mit welchen ECC sie arbeiten, wie und wo sie den redundanten Speicherplatz verwalten und gegen welche Art von Datenverlust sie gewappnet sind. Verbund unabhängiger LaufwerkeDer Verbund unabhängiger Laufwerke ist die Grundvoraussetzung für die beiden Techniken Striping und Erzeugung von Redundanz. Weiters ist ein RAID im Vergleich zu einer SLED gleicher Kapazität kostengünstiger: Fällt ein RAID Laufwerk aus, so ist nur das kaputte Laufwerk zu ersetzen, bei Ausfall einer SLED ist die gesamte Platte zu ersetzen. Die Levels von RAID1Bedeutung RAID Level
2Bedeutung RAID LevelIm Paper A Case for Redundant Arrays of Inexpensive Disks (RAID) patt1998 aus dem Jahre 1988 schlugen die drei Doktoranten Patterson, Gibson und Katz von der kalifornischen Universität Berkley 5 unterschiedliche Methoden vor, mit denen sich einzelne Platten zu einem Array zusammenschließen lassen. Diese Methoden nannten sie Level 1 bis Level 5. Diese Bezeichnungen sind noch bis zum heutigen Tag gültig. Der Terminus „Level“ bezieht sich dabei nicht, wie sonst üblich, auf eine qualitative Abstufung, vielmehr beschreibt jeder Level eine eigene, von den anderen Levels unabhängige Technik. Ein Level mit niedriger Nummer ist also einem höheren RAID Level nicht automatisch unterlegen! Im Laufe der Zeit wurden für unterschiedliche Anwendungen weitere RAID Levels entwickelt. 3RAID LevelTecChannel: RAID im Überblick byte2002 RAID: High-Performance, Reliable Secondary Storage chen1994 A Tutorial on RAID Storage Systems peru2004 RAID Level its2004 Streaming RAID: a disk array management system for video files toba1993 Bedeutung RAID LevelPaper A Case for Redundant Arrays of Inexpensive Disks (RAID) patt1998 RAID Levels ohne Fehlerkorrektur1RAID Level 0 (Striping)Funktionsweise
RAID 0 (Striping). Eine Datei wird in Blöcken (A, B, C..) sukzessive auf mehrere Laufwerke aufgeteilt [byte2002] Vorteile
Nachteile
Anwendungsbereiche
RAID Level 1 (Mirroring)Funktionsweise
Vorteile
Nachteile
Anwendungsbereiche
RAID Level 0+1Funktionsweise
Vorteile
Nachteile
Anwendungsbereiche
2RAID Level 0 (Striping)FunktionsweiseWie der Name Level 0 schon erahnen lässt, handelt es sich um ein Speicherverfahren, das keine Redundanz erzeugt, und daher, genau genommen, kein eigentliches RAID ist. Vielmehr werden hier ausschließlich die Vorteile der Striping Technik ausgenutzt. RAID 0 (Striping). Eine Datei wird in Blöcken (A, B, C..) sukzessive auf mehrere Laufwerke aufgeteilt [byte2002] VorteileGünstige KostenRAID Level 0 ist das kostengünstigste RAID, da es keine redundanten Dateien und somit auch keinen Speichermehraufwand benötigt. Optimale SchreibperformanceAus dem Fehlen von redundanter Information folgt auch eine optimale Schreibperformance, da keine redundanten Informationen aktualisiert werden müssen. RAID Level 0 ermöglicht das parallele Lesen beziehungsweise Schreiben auf mehrere Laufwerke. Es zeigt sich, dass ein Zusammenhang zwischen Größe der Dateien und der Schreibe/Lesegeschwindigkeit des RAID Level 0 Systems besteht: Sehr große Dateien erfahren eine hohe Steigerung an Schreibe/ Lesegeschwindigkeit, da parallel auf alle Platten zugegriffen werden kann, und dadurch die Transferrate entsprechend erhöht werden kann. Bei sehr kleinen Dateien hingegen erreicht man in Bezug auf Schreibe/Lesegeschwindigkeit nur Werte ähnlich denen eines Einzellaufwerks. NachteileGeringe ZuverlässigkeitRAID Level 0 weist auf Grund fehlender redundanter Daten eine hohe Fehleranfälligkeit auf. Selbst wenn nur eine Disk ausfällt, sind alle Daten des Systems unbrauchbar. Nicht optimale LeseperformanceWeiters liefert RAID 0 zwar beste Schreibperformance, überraschenderweise ist dessen Leseperformance redundanten Techniken wie RAID Level 1 (Mirroring) unterlegen. chen1994 Anwendungsbereich chen1994 luth2004Nicht - redundante Disk Arrays werden für Anwendungen herangezogen, wo gute Performance und hohe Speicherkapazität bei geringen Kosten im Vordergrund stehen, hingegen Systemzuverlässigkeit keine Rolle spielt. Wie oben beschrieben, liefert RAID 0 besonders für sehr große Dateien eine gute Performance. So wird RAID 0 zum Beispiel gerne bei Workstations für CAD/CAM oder für Video- und Audioanwendungen eingesetzt. RAID Level 1 (Mirroring)FunktionsweiseRAID Level 1 verwendet doppelt so viele Speicherplatten als ein nicht
redundantes System zur Speicherung derselben Informationsmenge benötigte.
Jedes mal, wenn Daten auf eine Disk geschrieben werden, werden diese
auch auf eine zweite (redundante) Disk „gespiegelt“, so dass es von
jeder Datei immer zwei Kopien gibt. Man spricht daher vom Mirroring-Verfahren
(Spiegelung). RAID1: Jedem Datenlaufwerk ist ein redundantes Laufwerk zugeteilt. Von jeder Datei gibt es jeweils zwei Kopien. [byte2002] VorteileOptimale LeseperformanceRAID 1liefert die beste Leseperformance aller RAID Systeme. Der Grund dafür ist, dass für jeden Request individuell entschieden werden kann, welche Platte zum Zeitpunkt der Abfrage die gewünschte Information schneller liefern kann. Hohe ZuverlässigkeitEs stehen alle Daten doppelt zur Verfügung. Auch wenn eine Platte komplett ausfallen sollte, bleiben alle Daten erhalten. NachteileHohe KostenZur Speicherung der eigentlichen Daten steht nur die Hälfte des gesamten Speichervolumens zur Verfügung. Die Kosten sind bei gleicher Datenmenge doppelt so hoch wie bei einem nicht redundanten System. Mäßige SchreibperformanceDie Schreibgeschwindigkeit wird durch die Technik des Mirroring nicht verbessert. Vielmehr liefert RAID 1 nur im Idealfall die gleiche Schreibgeschwindigkeit wie ein Einzellaufwerk. AnwendungsbereicheDie großen Stärken von RAID 1 liegen in dessen hohen Leseperformance und hoher Zuverlässigkeit. So eignet es sich besonders für Anwendungen, bei welchen wichtige Daten mit hoher Transfergeschwindigkeit hauptsächlich zum Lesen geliefert werden sollen. RAID Level 0+1FunktionsweiseRAID 0+1 ist eine Kombination der beiden Verfahren Mirroring und Striping (RAID0 und RAID 1). Durch diese Kombination werden die jeweiligen Nachteile der Verfahren eliminiert, die Vorteile hingegen möglichst ausgenutzt. Zu beachten ist dabei die korrekte Reihenfolge: Bei RAID 0+1 werden zuerst die Daten auf die Laufwerke aufgeteilt (Striping), deren Inhalte werden dann gespiegelt (Mirroring). RAID 0+1: RAID0+1 ist eine Kombination aus RAID0 und RAID1. [byte2002] VorteileOptimale Schreibe/LesegeschwindigkeitDurch die Kombination der beiden Verfahren bietet RAID 0+1 sowohl für Schreib- als auch Leseaufgaben beste Performance. ZuverlässigkeitGegenüber RAID 0 weist RAID 0+1 eine erhöhte Zuverlässigkeit auf, allerdings kann sie nicht jene von RAID 1 erreichen. Beispiel RAID 0+1 versus RAID 0Fällt eine Platte aus, kommt die gespiegelte Platte zum Einsatz. Fällt nun auch diese aus, sind sämtliche Daten des Systems verloren. Bei einem RAID 1 hingegen gehen in diesem ungünstigen Fall nur jene Daten verloren, die auf den beiden ausgefallenen Platten gespeichert waren. NachteileHohe KostenAuf Grund der doppelten Speicherung der Nutzdaten sind die Kosten von RAID 0+1 sehr hoch. Somit sind auch schnell die Grenzen der Skalierbarkeit eines Systems erreicht. AnwendungsbereicheRAID 0+1 wird dort eingesetzt, wo hoher Wert auf optimale Performance gelegt wird, die vergleichsweise mäßige Zuverlässigkeit stört den Anwender dabei nicht.Beispiel: Bilder gespeichert auf einem allgemeinen Fileserver. 3RAID Level 0 (Striping) luth2004
RAID Level 1 (Mirroring) luth2004RAID Levels mit Fehlerkorrektur1Motivation Fehlerkorrektur
Funktionsweise Fehlerkorrektur
RAID Level 2Funktionsweise
Vorteile
Nachteile
Anwendungsbereiche
RAID Level 3Funktionsweise
Vorteile
Nachteile
Anwendungsbereiche
RAID Level 4Funktionsweise
Vorteile
Nachteile
Anwendungsbereiche
RAID Level 5Funktionsweise
Beispiel RAID 5Vorteile
Nachteile
Anwendungsbereiche
RAID Level 6Funktionsweise
Vorteile
Nachteile
Anwendungsbereiche
RAID Level 7 (Proprietär)Funktionsweise
Vorteile
Nachteile
2Motivation FehlerkorrekturIn Bezug auf Datenredundanz ist Mirroring das perfekte Verfahren. Leider handelt man sich auch einen entsprechend hohen Mehraufwand an Hardware und damit einhergehend horrende Kosten ein. Um diesen Nachteil zu eliminieren, wurden RAID Verfahren (RAID Level 2 bis Level 7) entwickelt, die den Datenoverhead von RAID 1 durch ein Fehlerkorrekturverfahren reduzieren können. Funktionsweise FehlerkorrekturZuerst werden mittels Striping die Daten auf verschiedene Platten aufgeteilt. Anschließend werden für die Daten auf den Laufwerken Fehlerkorrekturwerte errechnet und als Error Correcting Codes (ECC) im System gespeichert. Im Falle eines Ausfalls einer Platte können mit Hilfe dieser Korrekturwerte die verloren gegangenen Daten wieder rekonstruiert werden. Als Fehlerkorrekturverfahren wird für RAID eine Paritätsprüfung eingesetzt. Bei diesem Verfahren ergeben sich die Korrekturwerte aus einer Verknüpfung aller Daten im System. Fällt nun eine Platte aus, werden mit Hilfe jener Nutzdaten und EEC-Werte, die auf den noch funktionstüchtigen Platten gespeichert sind, die verloren gegangenen Daten rekonstruiert. Der Datenoverhead wird in solch einem RAID-System durch die Anzahl der zusätzlich benötigten Laufwerke bestimmt, diese ist aber im Vergleich zu einem Mirroring-System wesentlich geringer. RAID Level 2FunktionsweiseRAID 2 liefert als einziges RAID System nicht nur Fehlerkorrekturwerte für den Fall eines Komplettausfalls eines Laufwerkes, sondern es kann auch Informationsverluste innerhalb der Laufwerke, die zum Beispiel durch einen Schreibfehler entstanden sind, erkennen und korrigieren. Bei jedem Schreibvorgang wird für jedes Datenwort ein Hamming Code ECC generiert. Das Datenwort selbst wird auf die Nutzdaten-Laufwerke abgespeichert, der dazugehörige Hammingcode auf eigene ECC-Laufwerke aufgeteilt. Mit Hilfe des Hammingcodes können nun im Bedarfsfalle sowohl Komplettausfälle von einzelnen Laufwerken kompensiert wie auch Fehler in einzelnen Dateien korrigiert werden. Das Verhältnis der Anzahl der Nutzdaten-Laufwerke und der Anzahl der benötigten ECC-Laufwerke ist bei der Hamming Kodierung ein logarithmisches. Soll heißen, je höher die Anzahl der Nutzlaufwerke ist, desto geringer fällt im Verhältnis dazu der Datenoverhead aus. RAID 2: Nutzdaten werden auf Datenlaufwerke (blau), die errechneten Hammingcodes auf EEC-Laufwerke (rot) aufgeteilt [byte2002] VorteileHamming Code ECCFehlerkorrektur sowohl bei Laufwerksausfall als auch bei Datenverlusten innerhalb der Laufwerke. Bei jedem Datenzugriff wird kontrolliert, ob Daten auch wirklich fehlerfrei sind. Wird ein Fehler erkannt, kann dieser auch korrigiert werden. Bei hoher Anzahl von Nutzdaten-Laufwerken ist nur ein verhältnismäßig geringer Datenoverhead notwendig. Optimale LesegeschwindigkeitRAID 2 nutzt effektiv die Möglichkeit des parallelen Plattenzugriffs und erreicht somit optimale Lesegeschwindigkeit. Einfacher ControllerIm Vergleich zu RAID 3,4 und 5 ist der Controller von RAID 2 sehr einfach aufgebaut. NachteileGeringe SchreibegeschwindigkeitEs müssen bei jedem Schreibvorgang die ECC Laufwerke aktualisiert werden, was eine nur mäßige Schreibgeschwindigkeit ergibt. Schwierige ImplementierungRAID Level 2 hat sich in der Industrie bis dato nicht durchgesetzt, weil an die Laufwerke spezielle Anforderungen gestellt werden. Da die Produktionsmenge die Kosten bestimmt, ist es wirtschaftlich sinnvoller, RAID-Systeme einzusetzen, die mit herkömmlichen Laufwerken arbeiten können. Hoher Overhead bei kleinen DateienHandelt es sich bei den Nutzdaten vorwiegend um kleine Dateien, wird das Verhältnis „Anzahl der benötigten ECC Laufwerk“ und „Anzahl Festplatten für Nutzdaten“ unwirtschaftlich. AnwendungsbereicheAuf Grund der aufwendigen Implementierung existieren keine kommerziell bedeutsamen Anwendungen. Der praktische Einsatz von RAID 2 beschränkt sich auf wenige Applikationen im Großrechnerbereich. RAID Level 3FunktionsweiseRAID 3 benötigt neben den Nutzdatenlaufwerken nur ein einziges Paritätslaufwerk. Die Daten werden mittels Striping Verfahren auf alle Datenlaufwerke aufgeteilt. Während des Schreibens wird die Stripe-Parität generiert und auf dem Paritätenlaufwerk abgespeichert. Die Kopfpositionen aller Laufwerke (inklusive Paritätslaufwerk) sind bei RAID 3 dabei synchronisiert, d.h., zusammenhängende Stripes und dazugehörige Parität sind auf gleicher Plattenposition gespeichert. RAID 3: Auf einer eigenen Paritätsplatte (rot) werden Paritätswerte der Stripes abgelegt [byte2002] VorteileHohe Datenübertragungsrate (Transferrate)Bei großen zusammenhängenden Dateien kann RAID 3 sowohl beim Ein- wie auch Auslesen die Vorteile des parallelen Plattenzugriffs optimal nützen. VerlässlichkeitIm Falle des Ausfalls einer der Datenplatten wird die Performance kaum beeinträchtigt; die verloren gegangenen Daten können jeweils aus den Daten der korrespondieren Stripes auf den funktionierenden Platten und der Paritätplatte schnell rekonstruiert werden. Fällt die Paritätsplatte aus, hat auch dies keinen unmittelbaren Einfluss auf die Funktionstauglichkeit des Systems, nur ist dieses dann nicht mehr gegen einen eventuellen Ausfall eines Datenlaufwerks geschützt. Geringer DatenoverheadRAID 3 benötigt nur ein Paritätslaufwerk. Einfache ImplementierungRAID 3 ist im Vergleich zu RAID 4, 5 und 6 leicht zu implementieren. NachteileGeringe I/O Rate (Transaktionsrate)Bei schnell wechselnden Requests wird die Synchronisierung der Kopfpositionen zum Flaschenhals. Bei jedem neuen Request müssen alle Köpfe gleichzeitig neu positioniert werden. Unterschiedliche Requests können so nicht gleichzeitig abgearbeitet werden. Die sich ergebende I/O Rate ist im günstigsten Fall gleich hoch wie bei einem Einzellaufwerk. AnwendungsbereicheRAID 3 ist für alle Anwendung geeignet, die vor allem große, zusammenhängende Dateien verarbeiten sollen. Es eignet sich daher besonders für CAM/CAD Anwendungen, zur Bearbeitung von multimedialen Daten, für Video- und Audiostreaming. RAID Level 4FunktionsweiseDie Daten werden blockweise mittels Striping Verfahren auf die Datenlauf¬wer¬ke geschrieben. Im Gegensatz zu RAID 3 sind bei RAID 4 die Laufwerkköpfe nicht synchronisiert, auf die einzelnen Platten kann unabhängig voneinander zugegriffen werden. Dadurch wird erreicht, dass auch bei der Bearbeitung von kleinen Dateien und einer hohen Frequenz an Requests eine gute Per¬formance geboten wird. Wie RAID 3 benötigt auch RAID 4 nur eine Paritäts¬platte. Auf dieser werden keine Stripes-, sondern Blockparitäten gespeichert. RAID 4: Auf einer eigenen Paritätsplatte werden Paritätswerte der Datenblöcke abgelegt [byte2002 VorteileHohe LeseperformanceEs kann unabhängig auf die einzelnen Platten zugegriffen werden. Hohe Transaktionsrate bei LeseaufgabenDer Controller kann auf die einzelnen Datenlaufwerke unabhängig vonein¬an¬der zugreifen und so die Abarbeitung der unterschiedlichen Requests optimieren. Geringer DatenoverheadSowie RAID 3 benötigt auch RAID 4 nur ein Paritätslaufwerk um das System vor einem eventuellen Datenverlust zu schützen. NachteileKomplexer ControllerDer Controller hat viele Freiheiten, ist aber auch dementsprechend komplex im Aufbau. Schlechte Performance bei SchreibaufgabenHier erweist sich die Unabhängigkeit der Laufwerke als Nachteil. Bei jedem Schreibvorgang muss natürlich auch der jeweilige EEC Code auf der Paritätsplatte aktualisiert werden. Dabei muss erst die passende Stelle auf der Paritätsplatte gefunden werden und der Kopf entsprechend positioniert werden. Weiters unterbindet das einzige Paritätslaufwerk parallele Schreibzugriffe und stellt somit einen systemimmanenten Flaschenhals dar. RAID 4 erweist sich bei Schreibaufgaben nicht schneller als ein Einzellaufwerk. ZuverlässigkeitIm Falle eines Datenlaufwerksausfalles arbeitet RAID 4 sehr schwerfällig. Die Prozedur des Rekonstruierens der verlorenen Daten ist im Vergleich zu RAID 3 sehr ineffizient. AnwendungsbereicheAuf Grund seiner Eigenschaften eignet sich RAID 4 ausschließlich für An¬wen¬dun¬gen, die hauptsächlich Leseaufgaben zu erfüllen haben. In der Praxis kommt RAID 4 nur selten zum Einsatz, da die Vorteile gegenüber RAID 3 nur minimal sind. RAID Level 5FunktionsweiseRAID 5 verteilt die Nutzdaten blockweise auf die Laufwerke. In der Absicht, den Flaschenhals „Paritätsplatte“ aus RAID 4 zu eliminieren, verzichtet RAID 5 auf ein eigenes Paritätslaufwerk. Als Alternative werden die errechneten ECC-Blockwerte gleichmäßig auf die Nutzlaufwerke aufgeteilt.
RAID 5: Paritätswerte werden gleichmäßig auf die Datenlaufwerke aufgeteilt. Dies verbessert im Vergleich zu einer Architektur mit eigenem Paritätslaufwerk die Schreibperformance [byte2002 Beispiel RAID 5In unserem Beispiel betrachten wir ein Speichersystem, das aus 3 Daten¬lauf¬wer¬ken besteht (Disk A, Disk B und Disk C). Die Daten sind blockweise auf die Datenträger aufgeteilt. Auf jedem Laufwerk sind neben Nutzdaten jeweils Paritätswerte der beiden anderen Laufwerke gespeichert. Der Ausdruck P(x,y) in untenstehender Grafik bedeutet dabei die Parität der Stripes x und y. Zum Beispiel bezeichnet P(1A, 2B) die Parität der Strips 1A und 1B. Fällt nun eines der Laufwerke aus, kann RAID 5 mit Hilfe der beiden anderen Laufwerke verloren gegangenen Daten vollständig rekonstruieren. Beispiel RAID 5: [byte2002] FallbeispielFällt Disk B aus, gehen dadurch die Datenblöcke 1B, 2B und 4B verloren. RAID 5 kann nun 1B durch P(1A, 1B)/Disk C und 1A/Disk A regenerieren, ebenso 2B (P(2B,2C)/Disk A und 2C/Disk C) und 4B (P(4A,4B)/Disk C und 4A/Disk A). VorteileHohe SchreibperformanceIm Gegensatz zur RAID 4 erzielt RAID 5 eine sehr gute Schreibperformance. Hohe LeseperformanceDurch die Verteilung der Daten über alle Laufwerke bietet RAID 5 eine hohe Leseperformance. Hohe Transaktions- und TransferrateRAID 5 liefert für Leseaufgaben eine hervorragende Transaktionsrate für Lese¬auf¬gaben und eine gute Transaktionsrate für Schreibaufgaben. Allgemein erzielt RAID 5 eine ausgezeichnete Transferrate. Mechanisch ausgewogene BelastungDie mechanische Belastung verteilt sich gleichmäßig auf alle Platten, da keines der Laufwerke eine Sonderstellung wie das Paritätslaufwerk von RAID 3 und RAID 4 besitzt. NachteileController KomplexitätController hat sehr komplexen Aufbau. Schwierige DatenrekonstruktionIm Falle eines Laufwerkausfalls gestaltet sich die Datenrekonstruktion un¬gleich schwieriger als zum Beispiel bei RAID 1. AnwendungsbereicheRAID 5 ist der vielseitigste RAID Level. Dementsprechend mannigfaltig sind auch die Anwendungen: www, Email-, und News Server, Intranetserver, File und Application Server… RAID Level 6FunktionsweiseVorrangiges Ziel bei der Entwicklung von RAID 6 war die Erhöhung der Datensicherheit bei Laufwerkausfällen. RAID3 bis RAID 5 sind gegen den Ausfall eines einzigen Laufwerks gewappnet, fallen hingegen 2 Laufwerke aus, gehen Daten verloren. RAID 6 kann auch in diesem Fall die Daten vollständig rekonstruieren. Es verwendet zu diesem Zweck eine „zweidimensionale Parität“. RAID Level 6 arbeitet wie RAID 5, nur mit dem Unterschied, dass auf jedem Laufwerk neben den eigentlichen Nutzdaten zwei Paritäten gespeichert werden. Mit deren Hilfe können auch bei einem Ausfall von zwei Laufwerken die verlorenen Daten rekonstruiert werden. RAID 6: RAID 6 verwendet „zweidimensionale Parität“. So können auch zwei Laufwerke ausfallen, ohne dass Daten verloren gehen [byte2002] VorteileZuverlässigkeitEs können zwei beliebige Laufwerke ausfallen, ohne dass Daten verloren gehen. NachteileSchlechte SchreibperformanceDie komplexe Berechnung der Paritäten bewirkt eine sehr schlechte Schreibperformance. Schwierige DatenrekonstruktionFallen ein oder zwei Laufwerke aus, sinkt merklich die Gesamtperformance des Speichersystems. Komplexer ControllerWie für RAID 5 ist auch bei RAID 6 der Controlleraufbau sehr komplex. Overhead an RechenaufwandDie Berechnung der Paritätsadressen bedeutet für den Controller einen erheblichen Mehraufwand, was sich auf die Qualität der Performance auswirkt. AnwendungsbereicheRAID 6 wird überall dort eingesetzt, wo Zuverlässigkeit wichtiger ist als die Qualität der Performance. RAID Level 7 (Proprietär)FunktionsweiseRAID Level 7 ist eine Entwicklung der Firma Storage Computer. Das
neuartige an diesem RAID System ist, dass es einen eingebetteten Array
Control Mikroprozessor beinhaltet, der mittels eigenen Echtzeitbetriebssystems
die Performance der unterschiedlichen Aufgaben optimiert. Er nutzt
dazu einen schnellen internen Datenbus und interne Pufferspeicher.
Paritätsinformationen können auch ähnlich wie bei RAID 6 auf mehrere
Laufwerke aufgeteilt werden. RAID 7: Die Datenlaufwerke und Paritätsplatte sind über einen internen High-Speed Datenbus mit einander verbunden. Die Verwaltung der externen Zugriffe übernimmt mittels Echtzeitbetriebssystems ein systemeigener Mikroprozessor [byte2002] VorteileHohe SchreibperformanceDie Schreibperformance von RAID 7 übertrifft die der anderen RAID Levels um das 1,5- bis 6-fache. Die Schreibperformance steigt dabei mit der Anzahl der verbundenen Laufwerke. SkalierbarkeitHost Interfaces sind weit skalierbar in Bezug auf Anschlussmöglichkeiten und Transferbandbreite. NachteileAbhängigkeit vom AnbieterDa RAID 7 ein Produkt ausschließlich einer Firma ist, ist man von dieser vollkommen abhängig. Hohe KostenRAID 7 ist eine sehr teure Lösung Abhängigkeit von StromversorungIm Falle eines Stromausfalles gehen die Daten aus den Pufferspeichern verloren. Aus Sicherheitsgründen muss man mit einer teuren UPS Stromversorgung arbeiten. 3RAID 3 luth2004RAID 4 luth2004RAID 7WeblinkStorage Computer - http://www.storage.com/metadot/index.pl Weitere RAID Levels1Kombinations-RAIDs byte2002
Geläufige Kombinationen
Tabelle: Beispiele für Kombinations-RAIDs RAID (n,m) luth2004
2Kombinations-RAIDs byte2002In der Praxis werden nun oft die unterschiedlichen RAID Levels miteinander kombiniert. Welche Levels kombiniert wurden, ist dann aus der Levelnummer ersichtlich. Zum Beispiel bezeichnet der RAID Level 05 ein Verfahren, das sich aus der Kombination von Level 0 und Level 5 zusammensetzt. Ein häufig eingesetzter Kombinationslevel ist RAID 10, der gleich wie RAID 0+1Striping und Mirroring kombiniert, nur dass hier zuerst Platten gespiegelt werden, und dann Stripes erzeugt werden. Durch diese günstige Kombination erzielt man ein RAID mit der Zuverlässigkeit von RAID 1 und der Performance von RAID 0. Geläufige KombinationenFolgende Tabelle listet die Eigenschaften geläufiger Kombinations- RAIDs:
Tabelle: Beispiele für Kombinations RAIDs RAID (n,m) luth2004RAID 6 ist das einzige Verfahren, dass auch den Ausfall von zwei Platten kompensieren kann. Will man nun ein RAID aufbauen, das mehr als zwei Plattenausfälle verkraftet, kann das Prinzip von RAID 6 beliebig erweitert werden. Als Levelbezeichnung solcher RAIDs hat sich die Schreibweise RAID (n, m) bzw. RAID n+m eingebürgert, wobei n die Gesamtanzahl der Platten im Verbund angibt und m die Zahl der Platten, die ohne Datenverlust ausfallen dürfen. 3Kombinations-RAIDsVergleich von RAID Levels stor2005 |
Akronyme CAD – Computer-Aided Design CAM – Computer-Aided Manufacturing ECC – Error Correcting Code: Verfahren zum Erkennen und Korrigieren von Bitfehlern. (EIS – Enterprise Information Systems) (IDE - Integrated Drive Electronics (hard disk)) (MTTF – Main Time To Failure) RAID – Redundant Arrays of Inexpensive (or Independent) Discs (SCSI - Small Computer Serial (or System) Interface) SLED – Single Large Expensive Disc UPS - Uninterruptible Power Supply
Glossar Durchsatz - Die (Daten)menge, die in einer bestimmten Zeit verarbeitet wird Hamming Code – Benannt nach Mathematiker Richard Wesley Hamming (1915-1998), Den Bits einer Nutzfunktion werden Bits zur Fehlerkorrektur beigefügt Paritätsbit - Der Ausdruck Paritätsbit bezeichnet ein Prüfbit, welches an eine Bitfolge gebunden ist und der Fehlererkennung dient. Das Paritätsbit ist ein zeichendiskretes Prüfbit, das in einer Funktion zu den Datenbits hinzugefügt wird und die Bitsumme gerade oder ungerade macht. Diese Maßnahme dient der Fehlererkennung bei asynchroner Datenübertragung (Paritätsprüfung). Ist die Bitsumme beim Empfänger nicht korrekt angekommen, kann man einen Übertragungsfehler annehmen. [wikipedia] Paritätsprüfung – Methode der Fehlerprüfung mittels Paritätsbit Proprietär - [EDV] Hard– oder Softwareprodukt einer Firma, das nur als Baustein eines speziellen Computertyps verwendet werden kann Transaktionsrate – I/O Rate Transferrate – Durchsatzrate, Datenübertragungsgeschwindigkeit |