Current Page:	Greybox » Authoring » Course ID: medieninformatik » Modules » Module ID: mmserver » Learning Units » Unit ID: 040raid
Last Modified:	Tuesday, 2015-05-05 - 08:09:06

Tools:	Validate — Preview XML Preview HTML Preview PDF
Alternative:	Printable HTML

Title:	RAID Speichersysteme
Abstract:	RAID ist die Abkürzung von “Redundant Array of Inexpensive (auch Independent) Disks”. Ein RAID ist ein Verbund von mehreren magnetischen Laufwerken, der wie eine einzelne große Disk agiert. Der Vorteil des Verbundes ist erhöhte Datensicherheit, bessere Schreib/Leseperformance und geringere Kosten im Betrieb. Es gibt unterschiedliche Arten, Laufwerke zu einem Verbund zusammen zu schließen. Ein RAID Level bezeichnet jeweils einen speziellen Aufbau der Komponenten.

Status:	content final - to do: siehe LU Zipf gesetz	Version:	2005-10-10
History:	2005-10-10 (Thomas Migl): Abstract hinzugefügt 2005-09-02 (Thomas Migl): LOD1 fertiggestellt 2005-09-01 (Thomas Migl): LOD1 bis einschließlich RAID Level 7 erstellt 2005-07-25 (Thomas Migl): Quellen importiert, LOD2+3 vorläufiges final, mit LOD1 begonnen 2005-07-19 (Thomas Migl): Begonnen mit Import von Text 2005-07-18 (Thomas Migl): LU angelegt

Author 1:	Thomas Migl	E-Mail:	migl@ims.tuwien.ac.at
Author 2:	(empty)	E-Mail:	(empty)
Author 3:	(empty)	E-Mail:	(empty)
Author 4:	(empty)	E-Mail:	(empty)
Author 5:	(empty)	E-Mail:	(empty)
Organization:	Technische Universität Wien; Institut für Softwaretechnik und Interaktive Systeme; Arbeitsgruppe für Interaktive Multimediale Systeme; http://www.ims.tuwien.ac.at/

Motivation

1

Motivation

Hauptziel ist optimales Speichermedium bezüglich
- Performance
- Datensicherheit
- Kostenverträglichkeit
Magnetische Disk ist Standard für Massenspeicher
- Vorteil
  - Hohe Kapazität
- Nachteil
  - erzielbare Werte für Zugriffszeit und I/O Rate sind nur mäßig
  - Im Falle eines Laufwerkausfalles gehen sämtliche Daten verloren
SLED - Single Large Expensive Disc
Verbund von mehreren Disks versus SLED
- Höhere Zuverlässigkeit
- bessere Performance
- geringere Kosten

RAID Definition

RAID : Redundant Array of Inexpensive (auch Independent) Disks
Ein RAID ist ein Verbund mehrerer unabhängiger Laufwerke
Ein RAID arbeitet wie ein einziges großes Speichermedium

2

Motivation

Die Hauptmotivation zur Entwicklung von Disk Arrays ist, ein Speichermedium zu schaffen, welches in Bezug auf Performance, Datensicherheit und Kostenverträglichkeit anderen Medien überlegen ist. .Als Standard für Massenspeicher digitaler Informationen hat sich die magnetische Speicherplatte durchgesetzt. Im Laufe der Jahre konnten deren Eigenschaften Speicherkapazität und Plattengröße/MB rapide verbessert werden. Im Gegensatz dazu erweisen sich die technischen Fortschritte betreffs Gesamtperformance (Zugriffszeit, I/O Rate…) allerdings als nur mäßig. Auch hat man bei einer einzigen großen Speicherplatte den Nachteil, dass im Falle eines Laufwerkausfalles sämtliche Daten verloren gehen. Als Alternative zu einer einzigen großen Speicherplatte bietet sich nun ein Verbund von mehreren, unabhängigen Laufwerken an, eines so genannten RAID. Vorteile eines RAID gegenüber einer einzigen großen Speicherplatte (SLED) sind erhöhte Zuverlässigkeit, bessere Performance und geringere Kosten.

RAID Definition

RAID ist die Abkürzung von “Redundant Array of Inexpensive (auch Independent) Disks”. Ein RAID besteht aus mehreren unabhängigen Laufwerken, die dementsprechend zusammengefasst, wie ein einziges großes Speichermedium arbeiten.

Prinzipien von RAID

1

Grundprinzipien

Die Technik des Stripings
Erzeugung von Datenredundanz
Verbund unabhängiger Laufwerke

Striping

Funktionsweise
- Daten in Datenblöcke aufgeteilt
- Aufeinander folgende Blöcke auf verschiedene Laufwerke aufgeteilt
Vorteile
- Steigerung Gesamtperformance
- Paralleler Zugriff
  - Gleichzeitige Bearbeitung mehrerer Requests
    - multiple independent request
  - Gleichzeitige Bearbeitung mehrerer Blöcke einer Datei
    - single multipile-block request
    - Bewirkt höhere Transferdatenrate

Erzeugung von Redundanz

Datenredundanz dient zur Verbesserung der Systemzuverlässigkeit
- SLED verliert im Falle eines Plattenausfalls sämtliche Daten
- RAIDs können verlorene Daten rekonstruieren
  - Benötigen redundanten Speicherplatz für
    - Datenkopien
    - Sicherungscodes (ECC = Error Correcting Code )
Unterschiedliche RAIDs unterscheiden sich durch
- Verwendung eines ECC
- Verwaltung des redundanten Speicherplatzes
- Verkraftbarer Datenverlust

Verbund unabhängiger Laufwerke

Grundvoraussetzung für Striping und Erzeugung von Redundanz
Verbund unabhängiger Laufwerke im Vergleich zu einer SLED gleicher Kapazität kostengünstiger
- Fällt ein RAID Laufwerk aus, so ist nur das kaputte Laufwerk zu ersetzen
- Bei Ausfall einer SLED ist die gesamte Platte zu ersetzen

2

Grundprinzipien

Die grundlegenden Prinzipien von RAID Systemen sind:

Die Technik des Stripings: Sie bringt eine Verbesserung der Performance gegenüber einer SLED
Erzeugung von Datenredundanz: Dient zur Steigerung der System Zuverlässigkeit
Verbund unabhängiger Laufwerke: Dies ermöglicht erst die beiden oben beschriebenen Techniken. Zusätzlich werden dadurch die Kosten reduziert

Striping

Funktionsweise

Die Daten werden vor dem Speichern in Datenblöcke geteilt. Aufeinander folgende Blöcke werden dann gleichmäßig über die Laufwerke aufgeteilt. Diese Technik wird im englischen als „Striping“ bezeichnet.

Striping mit 2 Laufwerken: Datenblöcke ABCDEFGH werden auf 2 Laufwerke aufgeteilt [luth2004]

Vorteile

Striping verbessert wesentlich die Gesamtperformance des Systems. Auf Grund der Möglichkeit, dass auf die Platten nun parallel zugegriffen werden kann, können einerseits mehrere Requests gleichzeitig abgearbeitet werden (multiple independent requests), andererseits können Dateien schneller ein- und ausgelesen werden (single multipile-block request).

Erzeugung von Redundanz

Die Erzeugung von Datenredundanz dient zur Verbesserung der Systemzuverlässigkeit. Wie schon oben erwähnt, verliert man bei einer SLED im Falle eines Plattenausfalls sämtliche Daten. Bei einem RAID schafft man nun zusätzlichen (redundanten) Speicherplatz für Datenkopien oder Sicherungscodes (ECC), mit deren Hilfe man im Falle eines Plattenausfalls die Daten rekonstruieren kann. Die verschiedenen RAID unterscheiden sich dadurch, mit welchen ECC sie arbeiten, wie und wo sie den redundanten Speicherplatz verwalten und gegen welche Art von Datenverlust sie gewappnet sind.

Verbund unabhängiger Laufwerke

Der Verbund unabhängiger Laufwerke ist die Grundvoraussetzung für die beiden Techniken Striping und Erzeugung von Redundanz. Weiters ist ein RAID im Vergleich zu einer SLED gleicher Kapazität kostengünstiger: Fällt ein RAID Laufwerk aus, so ist nur das kaputte Laufwerk zu ersetzen, bei Ausfall einer SLED ist die gesamte Platte zu ersetzen.

Die Levels von RAID

1

Bedeutung RAID Level

1988 - Doktorat von Patterson, Gibson und Katz von der kalifornischen Universität Berkley
- Beschreibung 5 unterschiedlicher Methoden um Disks zu einem Array zusammenzuschließen
  - Methoden mit Level1 bis Level 5 bezeichnet
  - Bezeichnungen sind heute noch gültig
Achtung!
- Levels bedeuten hier nicht eine qualitative Abstufung
  - Jeder Level beschreibt eigene Technik
  - Level mit niedriger Nummer ist höherem RAID Level nicht automatisch unterlegen!
Im Laufe der Zeit wurden weitere RAID Levels entwickelt

2

Bedeutung RAID Level

Im Paper A Case for Redundant Arrays of Inexpensive Disks (RAID) patt1998 aus dem Jahre 1988 schlugen die drei Doktoranten Patterson, Gibson und Katz von der kalifornischen Universität Berkley 5 unterschiedliche Methoden vor, mit denen sich einzelne Platten zu einem Array zusammenschließen lassen. Diese Methoden nannten sie Level 1 bis Level 5. Diese Bezeichnungen sind noch bis zum heutigen Tag gültig. Der Terminus „Level“ bezieht sich dabei nicht, wie sonst üblich, auf eine qualitative Abstufung, vielmehr beschreibt jeder Level eine eigene, von den anderen Levels unabhängige Technik. Ein Level mit niedriger Nummer ist also einem höheren RAID Level nicht automatisch unterlegen! Im Laufe der Zeit wurden für unterschiedliche Anwendungen weitere RAID Levels entwickelt.

3

RAID Level

TecChannel: RAID im Überblick byte2002

RAID: High-Performance, Reliable Secondary Storage chen1994

A Tutorial on RAID Storage Systems peru2004

RAID Level its2004

Streaming RAID: a disk array management system for video files toba1993

Bedeutung RAID Level

Paper A Case for Redundant Arrays of Inexpensive Disks (RAID) patt1998

RAID Levels ohne Fehlerkorrektur

1

RAID Level 0 (Striping)

Funktionsweise

RAID 0 nutzt nur Striping
Es wird keine Redundanz erzeugt
- Daher Bezeichnung Level 0
- Genau genommen kein RAID

RAID 0 (Striping). Eine Datei wird in Blöcken (A, B, C..) sukzessive auf mehrere Laufwerke aufgeteilt [byte2002]

Vorteile

Günstige Kosten
- Gesamtspeicherkapazität für eigentliche Daten nutzbar
Optimale Schreibperformance
- Aktualisierung von redundanten Informationen nicht nötig
- Möglichkeit des parallelen Zugriffes
  - Hohe Transferrate
    - Es gilt dabei: Je größer die Dateien, desto höher die Transferrate

Nachteile

Geringe Zuverlässigkeit
- Fällt eine Disk aus, sind Daten aller Dateien verloren
Nicht optimale Leseperformance
- Leseperformance redundanten Techniken wie RAID Level 1 (Mirroring) unterlegen

Anwendungsbereiche

RAID geeignet für Anwendungen mit folgenden Ansprüchen
- Gute Performance und hohe Speicherkapazität bei geringen Kosten
- Geringer Anspruch bezüglich Systemzuverlässigkeit
RAID 0 besonders für sehr große Dateien geeignet
- Workstations für
  - CAD/CAM
  - Video- und Audioanwendungen

RAID Level 1 (Mirroring)

Funktionsweise

RAID Level 1 speichert für jede Datei zusätzlich eine Kopie
- Kopien auf eigener (redundanter ) Disk abgelegt
- Mirroring - Disk mit Nutzdaten auf redundanter Disk "gespiegelt"
RAID Level 1 benötigt für gleiche Information doppelt soviel Speicherkapazität wie RAID 0

Vorteile

Optimale Leseperformance
- Beste Leseperformance aller RAIDs
  - Es wird auf jene Disk zugegriffen, die zurzeit am schnellsten gewünschte Daten liefern kann
Hohe Zuverlässigkeit
- Fällt eine Disk aus, bleiben alle Daten erhalten

Nachteile

Hohe Kosten
- Nur die Hälfte der Gesamtspeicherkapazität für eigentliche Daten nutzbar
Mäßige Schreibperformance
- Daten müssen immer zweimal geschrieben werden
  - Nur im Idealfall gleiche Schreibperformance wie Einzellaufwerk

Anwendungsbereiche

Anwendungen mit hohen Anspruch bezüglich
- Zuverlässigkeit
- Hohe Transfergeschwindigkeit während Lesevorganges

RAID Level 0+1

Funktionsweise

Kombination aus RAID 0 und RAID 1
Wichtig ist richtige Reihenfolge
- Striping (RAID 0) - zuerst werden Dateien auf Disks aufgeteilt
- Mirroring (RAID 1) - Disks werden gespiegelt

Vorteile

Optimale Schreibe/Lesegeschwindigkeit
- Durch Kombination beste Performance für Schreib- und Leseaufgaben
Zuverlässigkeit
- Größer als RAID 0, kleiner als RAID 1
- Vergleich Zuverlässigkeit RAID 0+1 und RAID 1
  - Fällt eine Disk und deren Spiegelung aus
    - RAID 1 - Daten entsprechender Disk sind verloren
    - RAID 0+1 - Alle Daten sind verloren

Nachteile

Hohe Kosten
- Nur die Hälfte der Gesamtspeicherkapazität für eigentliche Daten nutzbar

Anwendungsbereiche

Speicherung von Bildern auf Fileserver

2

RAID Level 0 (Striping)

Funktionsweise

Wie der Name Level 0 schon erahnen lässt, handelt es sich um ein Speicherverfahren, das keine Redundanz erzeugt, und daher, genau genommen, kein eigentliches RAID ist. Vielmehr werden hier ausschließlich die Vorteile der Striping Technik ausgenutzt.

RAID 0 (Striping). Eine Datei wird in Blöcken (A, B, C..) sukzessive auf mehrere Laufwerke aufgeteilt [byte2002]

Vorteile

Günstige Kosten

RAID Level 0 ist das kostengünstigste RAID, da es keine redundanten Dateien und somit auch keinen Speichermehraufwand benötigt.

Optimale Schreibperformance

Aus dem Fehlen von redundanter Information folgt auch eine optimale Schreibperformance, da keine redundanten Informationen aktualisiert werden müssen. RAID Level 0 ermöglicht das parallele Lesen beziehungsweise Schreiben auf mehrere Laufwerke. Es zeigt sich, dass ein Zusammenhang zwischen Größe der Dateien und der Schreibe/Lesegeschwindigkeit des RAID Level 0 Systems besteht: Sehr große Dateien erfahren eine hohe Steigerung an Schreibe/ Lesegeschwindigkeit, da parallel auf alle Platten zugegriffen werden kann, und dadurch die Transferrate entsprechend erhöht werden kann. Bei sehr kleinen Dateien hingegen erreicht man in Bezug auf Schreibe/Lesegeschwindigkeit nur Werte ähnlich denen eines Einzellaufwerks.

Nachteile

Geringe Zuverlässigkeit

RAID Level 0 weist auf Grund fehlender redundanter Daten eine hohe Fehleranfälligkeit auf. Selbst wenn nur eine Disk ausfällt, sind alle Daten des Systems unbrauchbar.

Nicht optimale Leseperformance

Weiters liefert RAID 0 zwar beste Schreibperformance, überraschenderweise ist dessen Leseperformance redundanten Techniken wie RAID Level 1 (Mirroring) unterlegen. chen1994

Anwendungsbereich chen1994 luth2004

Nicht - redundante Disk Arrays werden für Anwendungen herangezogen, wo gute Performance und hohe Speicherkapazität bei geringen Kosten im Vordergrund stehen, hingegen Systemzuverlässigkeit keine Rolle spielt. Wie oben beschrieben, liefert RAID 0 besonders für sehr große Dateien eine gute Performance. So wird RAID 0 zum Beispiel gerne bei Workstations für CAD/CAM oder für Video- und Audioanwendungen eingesetzt.

RAID Level 1 (Mirroring)

Funktionsweise

RAID Level 1 verwendet doppelt so viele Speicherplatten als ein nicht redundantes System zur Speicherung derselben Informationsmenge benötigte. Jedes mal, wenn Daten auf eine Disk geschrieben werden, werden diese auch auf eine zweite (redundante) Disk „gespiegelt“, so dass es von jeder Datei immer zwei Kopien gibt. Man spricht daher vom Mirroring-Verfahren (Spiegelung).

RAID1: Jedem Datenlaufwerk ist ein redundantes Laufwerk zugeteilt. Von jeder Datei gibt es jeweils zwei Kopien. [byte2002]

Vorteile

Optimale Leseperformance

RAID 1liefert die beste Leseperformance aller RAID Systeme. Der Grund dafür ist, dass für jeden Request individuell entschieden werden kann, welche Platte zum Zeitpunkt der Abfrage die gewünschte Information schneller liefern kann.

Hohe Zuverlässigkeit

Es stehen alle Daten doppelt zur Verfügung. Auch wenn eine Platte komplett ausfallen sollte, bleiben alle Daten erhalten.

Nachteile

Hohe Kosten

Zur Speicherung der eigentlichen Daten steht nur die Hälfte des gesamten Speichervolumens zur Verfügung. Die Kosten sind bei gleicher Datenmenge doppelt so hoch wie bei einem nicht redundanten System.

Mäßige Schreibperformance

Die Schreibgeschwindigkeit wird durch die Technik des Mirroring nicht verbessert. Vielmehr liefert RAID 1 nur im Idealfall die gleiche Schreibgeschwindigkeit wie ein Einzellaufwerk.

Anwendungsbereiche

Die großen Stärken von RAID 1 liegen in dessen hohen Leseperformance und hoher Zuverlässigkeit. So eignet es sich besonders für Anwendungen, bei welchen wichtige Daten mit hoher Transfergeschwindigkeit hauptsächlich zum Lesen geliefert werden sollen.

RAID Level 0+1

Funktionsweise

RAID 0+1 ist eine Kombination der beiden Verfahren Mirroring und Striping (RAID0 und RAID 1). Durch diese Kombination werden die jeweiligen Nachteile der Verfahren eliminiert, die Vorteile hingegen möglichst ausgenutzt. Zu beachten ist dabei die korrekte Reihenfolge: Bei RAID 0+1 werden zuerst die Daten auf die Laufwerke aufgeteilt (Striping), deren Inhalte werden dann gespiegelt (Mirroring).

RAID 0+1: RAID0+1 ist eine Kombination aus RAID0 und RAID1. [byte2002]

Vorteile

Optimale Schreibe/Lesegeschwindigkeit

Durch die Kombination der beiden Verfahren bietet RAID 0+1 sowohl für Schreib- als auch Leseaufgaben beste Performance.

Zuverlässigkeit

Gegenüber RAID 0 weist RAID 0+1 eine erhöhte Zuverlässigkeit auf, allerdings kann sie nicht jene von RAID 1 erreichen.

Beispiel RAID 0+1 versus RAID 0

Fällt eine Platte aus, kommt die gespiegelte Platte zum Einsatz. Fällt nun auch diese aus, sind sämtliche Daten des Systems verloren. Bei einem RAID 1 hingegen gehen in diesem ungünstigen Fall nur jene Daten verloren, die auf den beiden ausgefallenen Platten gespeichert waren.

Nachteile

Hohe Kosten

Auf Grund der doppelten Speicherung der Nutzdaten sind die Kosten von RAID 0+1 sehr hoch. Somit sind auch schnell die Grenzen der Skalierbarkeit eines Systems erreicht.

Anwendungsbereiche

RAID 0+1 wird dort eingesetzt, wo hoher Wert auf optimale Performance gelegt wird, die vergleichsweise mäßige Zuverlässigkeit stört den Anwender dabei nicht.Beispiel: Bilder gespeichert auf einem allgemeinen Fileserver.

3

RAID Level 0 (Striping) luth2004

RAID Level 1 (Mirroring) luth2004

RAID Levels mit Fehlerkorrektur

1

Motivation Fehlerkorrektur

Mirroring bezüglich Datenredundanz perfektes Verfahren
- Nachteil - hoher Mehraufwand an Hardware und horrende Kosten
RAID Level 2 bis Level 7
- Es wird Datenoverhead von RAID 1 durch Fehlerkorrekturverfahren reduziert
- Dadurch geringerer Datenoverhead

Funktionsweise Fehlerkorrektur

RAID verwendet Paritätsprüfung zur Fehlerkorrektur
Vorgangsweise
- Daten werden mittels Striping auf Disks aufgeteilt
- Error Correction Codes (EEC) werden berechnet und im System gespeichert
- Bei Ausfall einer Disk
  - Verlorene Daten werden durch Verknüpfung EEC- Werte /verbliebene Daten rekonstruiert

RAID Level 2

Funktionsweise

Für jedes geschriebene Datenwort wird ein Hamming Code ECC generiert
EECs auf eigene Disks gespeichert
Verhältnis Anzahl Nutzdaten- / ECC-Laufwerke ist logarithmisch
- D.h. - Je mehr Nutzdatendisks, desto geringer der prozentuelle Overhead

Vorteile

Hamming Code EEC
- Hamming Code schützt System gegenüber zwei Arten von Datenverlust
  - Ausfall einer Disk
  - Informationsverlust innerhalb einer Disk, z.B. Schreibfehler
Optimale Lesegeschwindigkeit
- Optimale Nutzung des parallen Plattenzugriffs
Einfacher Controller

Nachteile

Geringe Schreibgeschwindigkeit
- Generierung der Hamming Code Wörter nimmt viel Zeit in Anspruch
Schwierige Implementierung
- RAID 2 stellt spezielle Ansprüche an Laufwerke
Hoher Overhead bei kleinen Daten
Bei kleinen Dateien Verhältnis Anzahl Nutzdaten- / ECC-Laufwerke unwirtschaftlich

Anwendungsbereiche

Auf Grund aufwendiger Implementierung keine kommerzielle Anwendungen
Praktischer Einsatz ausschließlich im Großrechnerbereich

RAID Level 3

Funktionsweise

RAID 3 arbeitet mit einem einzigen Partitätslaufwerk
Daten werden mittels Striping auf Datendisks gespeichert
Für jeden Stripe wird ein Paritätswert generiert
Kopfpositionen aller Disks sind miteinander synchronisiert (Schreiben und Lesen)

Vorteile

Hohe Transferrate
- Optimale Nutzung des parallen Plattenzugriffs
Hohe Verlässlichkeit
- Fällt ein Laufwerk aus
  - Performance ohne bemerkenswerte Beeinträchtigung
  - Verlorengegangene Stipes können schnell rekonstruiert werden
- Fällt Paritätsdisk aus
  - Performance ohne Beeinträchtigung
  - System nicht mehr gegen Diskausfall geschützt
Geringer Datenoverhead
- Paritätslaufwerk ist einziges redundantes Laufwerk
Einfache Implementierung

Nachteile

Geringe Transaktionsrate
- Synchrone Kopfpositionen werden bei schnell wechselten Requests zum Flaschenhals
  - Alle Köpfe müssen jeweils gleichzeitig positionert werden
  - Unterschiedliche Requests können nicht gleichzeitig abgearbeitet werden

Anwendungsbereiche

RAID 3 geeignet für große Dateien
- CAM, CAD
- Multimediale Dateien
- Video- und Audiostreaming

RAID Level 4

Funktionsweise

RAID 4 arbeitet mit einem einzigen Partitätslaufwerk
Daten werden blockweise gestriped
Für jeden Block wird ein Paritätswert generiert
Köpfe sind nicht synchronisiert
- Ermöglicht unabhängigen Plattenzugriff

Vorteile

Hohe Leseperformance
- Unabhängiger Zugriff auf einzelne Disks
Hohe Transaktionsrate bei Leseaufgaben
- Es können mehrere Leseaufgaben gleichzeitig abgearbeitet werden
Geringer Datenoverhead
- Paritätslaufwerk ist einziges redundantes Laufwerk

Nachteile

Komplexer Controller
Schlechte Performance bei Schreibaufgaben
- Einziges Paritätslaufwerk verhindert paralleles Schreiben
Zuverlässigkeit
- Fällt ein Laufwerk aus
  - System wird sehr schwerfällig
  - Prozedur der Rekonstruktion im Vergleich zu RAID 3 sehr ineffizient

Anwendungsbereiche

Geeignet für Anwendungen mit hohen Ansprüchen betreff
- Hohe Leseperformance
- Hohe Transaktionsrate (Leseaufgabe)
RAID 4 wird nur selten in der Praxis eingesetzt
- RAID 3 wird meist der Vorzug gegeben

RAID Level 5

Funktionsweise

RAID 5 verzichtet auf das Paritätslaufwerk
- Motivation - Eliminierung des Flaschenhalses "Paritätsplatte"
Nutzdaten werden blockweise auf Laufwerke verteilt
ECC-Blockwerte gleichmäßig auf Nutzlaufwerke aufgeteilt

Beispiel RAID 5

Vorteile

Hohe Schreibperformance
- Kein Flaschenhals "Paritätsplatte"
Hohe Leseperformance
Hohe Transaktions- und Transferrate
Mechanisch ausgewogene Belastung
- Alle Laufwerke haben gleiche Relevanz
  - Mechanische Belastung verteilt sich gleichmäßig auf die Laufwerke

Nachteile

Komplexer Controller
Schwierige Datenrekonstruktion bei Ausfall einer Disk

Anwendungsbereiche

RAID 5 ist vielseitigster RAID Level
- www
- E-Mail und News Server
- Intranet Server
- File und Application Server
- etc.

RAID Level 6

Funktionsweise

RAID 6 kann auch Daten vollständig rekonstruieren, wenn 2 Laufwerke ausfallen
- RAID 6 arbeitet wie RAID 5
  - Einziger Unterschied - „Zweidimensionale Parität“

Vorteile

Zuverlässigkeit
- Es können gleichhzeitig zwei Laufwerke ausfallen, ohne dass Daten verloren gehen

Nachteile

Schlechte Schreibperformance
- Komplexe Berechnung der Paritäten
Schwierige Datenrekonstruktion
Ausfall von Laufwerken
- Träge Gesamtperformance des Speichersystems
Komplexer Controller
Overhead an Rechenaufwand
- Berechnung der Paritätsadressen bedeutet erheblichen Mehraufwand
  - Beeinträchtigung der Performance

Anwendungsbereiche

RAID 6
- Hoher Anspruch bezüglich Zuverlässigkeit
- Geringer Anspruch bezüglich Performance

RAID Level 7 (Proprietär)

Funktionsweise

Entwicklung der Firma Storage Computer
Besonderheiten
- Eingebetteter Array Control Mikroprozessor
  - Performanceoptimierung mittels eigenem Echtzeitbetriebssystems
- Schneller interner Datenbus
- Interner Pufferspeicher

Vorteile

Hohe Schreibperformance
- Übertrifft die anderen RAID Levels um das 1,5- bis 6-fache
- Steigt mit der Anzahl der verbundenen Laufwerke
Skalierbarkeit
- Host Interfaces sind weit skalierbar in Bezug auf
  - Anschlussmöglichkeiten
  - Transferbandbreite

Nachteile

Abhängigkeit vom Anbieter
Hohe Kosten
- RAID 7 ist eine sehr teure Lösung
Abhängigkeit von Stromversorgung
- Im Falle eines Stromausfalles
  - Daten aus den Pufferspeichern gehen verloren
- Einsatz einer teuren UPS (Uninterruptible Power Supply) Stromversorgung ist notwendig

2

Motivation Fehlerkorrektur

In Bezug auf Datenredundanz ist Mirroring das perfekte Verfahren. Leider handelt man sich auch einen entsprechend hohen Mehraufwand an Hardware und damit einhergehend horrende Kosten ein. Um diesen Nachteil zu eliminieren, wurden RAID Verfahren (RAID Level 2 bis Level 7) entwickelt, die den Datenoverhead von RAID 1 durch ein Fehlerkorrekturverfahren reduzieren können.

Funktionsweise Fehlerkorrektur

Zuerst werden mittels Striping die Daten auf verschiedene Platten aufgeteilt. Anschließend werden für die Daten auf den Laufwerken Fehlerkorrekturwerte errechnet und als Error Correcting Codes (ECC) im System gespeichert. Im Falle eines Ausfalls einer Platte können mit Hilfe dieser Korrekturwerte die verloren gegangenen Daten wieder rekonstruiert werden. Als Fehlerkorrekturverfahren wird für RAID eine Paritätsprüfung eingesetzt. Bei diesem Verfahren ergeben sich die Korrekturwerte aus einer Verknüpfung aller Daten im System. Fällt nun eine Platte aus, werden mit Hilfe jener Nutzdaten und EEC-Werte, die auf den noch funktionstüchtigen Platten gespeichert sind, die verloren gegangenen Daten rekonstruiert. Der Datenoverhead wird in solch einem RAID-System durch die Anzahl der zusätzlich benötigten Laufwerke bestimmt, diese ist aber im Vergleich zu einem Mirroring-System wesentlich geringer.

RAID Level 2

Funktionsweise

RAID 2 liefert als einziges RAID System nicht nur Fehlerkorrekturwerte für den Fall eines Komplettausfalls eines Laufwerkes, sondern es kann auch Informationsverluste innerhalb der Laufwerke, die zum Beispiel durch einen Schreibfehler entstanden sind, erkennen und korrigieren. Bei jedem Schreibvorgang wird für jedes Datenwort ein Hamming Code ECC generiert. Das Datenwort selbst wird auf die Nutzdaten-Laufwerke abgespeichert, der dazugehörige Hammingcode auf eigene ECC-Laufwerke aufgeteilt. Mit Hilfe des Hammingcodes können nun im Bedarfsfalle sowohl Komplettausfälle von einzelnen Laufwerken kompensiert wie auch Fehler in einzelnen Dateien korrigiert werden. Das Verhältnis der Anzahl der Nutzdaten-Laufwerke und der Anzahl der benötigten ECC-Laufwerke ist bei der Hamming Kodierung ein logarithmisches. Soll heißen, je höher die Anzahl der Nutzlaufwerke ist, desto geringer fällt im Verhältnis dazu der Datenoverhead aus.

RAID 2: Nutzdaten werden auf Datenlaufwerke (blau), die errechneten Hammingcodes auf EEC-Laufwerke (rot) aufgeteilt [byte2002]

Vorteile

Hamming Code ECC

Fehlerkorrektur sowohl bei Laufwerksausfall als auch bei Datenverlusten innerhalb der Laufwerke. Bei jedem Datenzugriff wird kontrolliert, ob Daten auch wirklich fehlerfrei sind. Wird ein Fehler erkannt, kann dieser auch korrigiert werden. Bei hoher Anzahl von Nutzdaten-Laufwerken ist nur ein verhältnismäßig geringer Datenoverhead notwendig.

Optimale Lesegeschwindigkeit

RAID 2 nutzt effektiv die Möglichkeit des parallelen Plattenzugriffs und erreicht somit optimale Lesegeschwindigkeit.

Einfacher Controller

Im Vergleich zu RAID 3,4 und 5 ist der Controller von RAID 2 sehr einfach aufgebaut.

Nachteile

Geringe Schreibegeschwindigkeit

Es müssen bei jedem Schreibvorgang die ECC Laufwerke aktualisiert werden, was eine nur mäßige Schreibgeschwindigkeit ergibt.

Schwierige Implementierung

RAID Level 2 hat sich in der Industrie bis dato nicht durchgesetzt, weil an die Laufwerke spezielle Anforderungen gestellt werden. Da die Produktionsmenge die Kosten bestimmt, ist es wirtschaftlich sinnvoller, RAID-Systeme einzusetzen, die mit herkömmlichen Laufwerken arbeiten können.

Hoher Overhead bei kleinen Dateien

Handelt es sich bei den Nutzdaten vorwiegend um kleine Dateien, wird das Verhältnis „Anzahl der benötigten ECC Laufwerk“ und „Anzahl Festplatten für Nutzdaten“ unwirtschaftlich.

Anwendungsbereiche

Auf Grund der aufwendigen Implementierung existieren keine kommerziell bedeutsamen Anwendungen. Der praktische Einsatz von RAID 2 beschränkt sich auf wenige Applikationen im Großrechnerbereich.

RAID Level 3

Funktionsweise

RAID 3 benötigt neben den Nutzdatenlaufwerken nur ein einziges Paritätslaufwerk. Die Daten werden mittels Striping Verfahren auf alle Datenlaufwerke aufgeteilt. Während des Schreibens wird die Stripe-Parität generiert und auf dem Paritätenlaufwerk abgespeichert. Die Kopfpositionen aller Laufwerke (inklusive Paritätslaufwerk) sind bei RAID 3 dabei synchronisiert, d.h., zusammenhängende Stripes und dazugehörige Parität sind auf gleicher Plattenposition gespeichert.

RAID 3: Auf einer eigenen Paritätsplatte (rot) werden Paritätswerte der Stripes abgelegt [byte2002]

Vorteile

Hohe Datenübertragungsrate (Transferrate)

Bei großen zusammenhängenden Dateien kann RAID 3 sowohl beim Ein- wie auch Auslesen die Vorteile des parallelen Plattenzugriffs optimal nützen.

Verlässlichkeit

Im Falle des Ausfalls einer der Datenplatten wird die Performance kaum beeinträchtigt; die verloren gegangenen Daten können jeweils aus den Daten der korrespondieren Stripes auf den funktionierenden Platten und der Paritätplatte schnell rekonstruiert werden. Fällt die Paritätsplatte aus, hat auch dies keinen unmittelbaren Einfluss auf die Funktionstauglichkeit des Systems, nur ist dieses dann nicht mehr gegen einen eventuellen Ausfall eines Datenlaufwerks geschützt.

Geringer Datenoverhead

RAID 3 benötigt nur ein Paritätslaufwerk.

Einfache Implementierung

RAID 3 ist im Vergleich zu RAID 4, 5 und 6 leicht zu implementieren.

Nachteile

Geringe I/O Rate (Transaktionsrate)

Bei schnell wechselnden Requests wird die Synchronisierung der Kopfpositionen zum Flaschenhals. Bei jedem neuen Request müssen alle Köpfe gleichzeitig neu positioniert werden. Unterschiedliche Requests können so nicht gleichzeitig abgearbeitet werden. Die sich ergebende I/O Rate ist im günstigsten Fall gleich hoch wie bei einem Einzellaufwerk.

Anwendungsbereiche

RAID 3 ist für alle Anwendung geeignet, die vor allem große, zusammenhängende Dateien verarbeiten sollen. Es eignet sich daher besonders für CAM/CAD Anwendungen, zur Bearbeitung von multimedialen Daten, für Video- und Audiostreaming.

RAID Level 4

Funktionsweise

Die Daten werden blockweise mittels Striping Verfahren auf die Datenlauf¬wer¬ke geschrieben. Im Gegensatz zu RAID 3 sind bei RAID 4 die Laufwerkköpfe nicht synchronisiert, auf die einzelnen Platten kann unabhängig voneinander zugegriffen werden. Dadurch wird erreicht, dass auch bei der Bearbeitung von kleinen Dateien und einer hohen Frequenz an Requests eine gute Per¬formance geboten wird. Wie RAID 3 benötigt auch RAID 4 nur eine Paritäts¬platte. Auf dieser werden keine Stripes-, sondern Blockparitäten gespeichert.

RAID 4: Auf einer eigenen Paritätsplatte werden Paritätswerte der Datenblöcke abgelegt [byte2002

Vorteile

Hohe Leseperformance

Es kann unabhängig auf die einzelnen Platten zugegriffen werden.

Hohe Transaktionsrate bei Leseaufgaben

Der Controller kann auf die einzelnen Datenlaufwerke unabhängig vonein¬an¬der zugreifen und so die Abarbeitung der unterschiedlichen Requests optimieren.

Geringer Datenoverhead

Sowie RAID 3 benötigt auch RAID 4 nur ein Paritätslaufwerk um das System vor einem eventuellen Datenverlust zu schützen.

Nachteile

Komplexer Controller

Der Controller hat viele Freiheiten, ist aber auch dementsprechend komplex im Aufbau.

Schlechte Performance bei Schreibaufgaben

Hier erweist sich die Unabhängigkeit der Laufwerke als Nachteil. Bei jedem Schreibvorgang muss natürlich auch der jeweilige EEC Code auf der Paritätsplatte aktualisiert werden. Dabei muss erst die passende Stelle auf der Paritätsplatte gefunden werden und der Kopf entsprechend positioniert werden. Weiters unterbindet das einzige Paritätslaufwerk parallele Schreibzugriffe und stellt somit einen systemimmanenten Flaschenhals dar. RAID 4 erweist sich bei Schreibaufgaben nicht schneller als ein Einzellaufwerk.

Zuverlässigkeit

Im Falle eines Datenlaufwerksausfalles arbeitet RAID 4 sehr schwerfällig. Die Prozedur des Rekonstruierens der verlorenen Daten ist im Vergleich zu RAID 3 sehr ineffizient.

Anwendungsbereiche

Auf Grund seiner Eigenschaften eignet sich RAID 4 ausschließlich für An¬wen¬dun¬gen, die hauptsächlich Leseaufgaben zu erfüllen haben. In der Praxis kommt RAID 4 nur selten zum Einsatz, da die Vorteile gegenüber RAID 3 nur minimal sind.

RAID Level 5

Funktionsweise

RAID 5 verteilt die Nutzdaten blockweise auf die Laufwerke. In der Absicht, den Flaschenhals „Paritätsplatte“ aus RAID 4 zu eliminieren, verzichtet RAID 5 auf ein eigenes Paritätslaufwerk. Als Alternative werden die errechneten ECC-Blockwerte gleichmäßig auf die Nutzlaufwerke aufgeteilt.

RAID 5: Paritätswerte werden gleichmäßig auf die Datenlaufwerke aufgeteilt. Dies verbessert im Vergleich zu einer Architektur mit eigenem Paritätslaufwerk die Schreibperformance [byte2002

Beispiel RAID 5

In unserem Beispiel betrachten wir ein Speichersystem, das aus 3 Daten¬lauf¬wer¬ken besteht (Disk A, Disk B und Disk C). Die Daten sind blockweise auf die Datenträger aufgeteilt. Auf jedem Laufwerk sind neben Nutzdaten jeweils Paritätswerte der beiden anderen Laufwerke gespeichert. Der Ausdruck P(x,y) in untenstehender Grafik bedeutet dabei die Parität der Stripes x und y. Zum Beispiel bezeichnet P(1A, 2B) die Parität der Strips 1A und 1B. Fällt nun eines der Laufwerke aus, kann RAID 5 mit Hilfe der beiden anderen Laufwerke verloren gegangenen Daten vollständig rekonstruieren.

Beispiel RAID 5: [byte2002]

Fallbeispiel

Fällt Disk B aus, gehen dadurch die Datenblöcke 1B, 2B und 4B verloren. RAID 5 kann nun 1B durch P(1A, 1B)/Disk C und 1A/Disk A regenerieren, ebenso 2B (P(2B,2C)/Disk A und 2C/Disk C) und 4B (P(4A,4B)/Disk C und 4A/Disk A).

Vorteile

Hohe Schreibperformance

Im Gegensatz zur RAID 4 erzielt RAID 5 eine sehr gute Schreibperformance.
Dadurch, dass die Paritäten nicht auf einer einzigen Platte sondern gleichmäßig auf alle Laufwerke verteilt gespeichert sind, entfällt der Flaschenhals Paritätsplatte. So können Schreibzugriffe parallel ausgeführt werden.

Hohe Leseperformance

Durch die Verteilung der Daten über alle Laufwerke bietet RAID 5 eine hohe Leseperformance.

Hohe Transaktions- und Transferrate

RAID 5 liefert für Leseaufgaben eine hervorragende Transaktionsrate für Lese¬auf¬gaben und eine gute Transaktionsrate für Schreibaufgaben. Allgemein erzielt RAID 5 eine ausgezeichnete Transferrate.

Mechanisch ausgewogene Belastung

Die mechanische Belastung verteilt sich gleichmäßig auf alle Platten, da keines der Laufwerke eine Sonderstellung wie das Paritätslaufwerk von RAID 3 und RAID 4 besitzt.

Nachteile

Controller Komplexität

Controller hat sehr komplexen Aufbau.

Schwierige Datenrekonstruktion

Im Falle eines Laufwerkausfalls gestaltet sich die Datenrekonstruktion un¬gleich schwieriger als zum Beispiel bei RAID 1.

Anwendungsbereiche

RAID 5 ist der vielseitigste RAID Level. Dementsprechend mannigfaltig sind auch die Anwendungen: www, Email-, und News Server, Intranetserver, File und Application Server…

RAID Level 6

Funktionsweise

Vorrangiges Ziel bei der Entwicklung von RAID 6 war die Erhöhung der Datensicherheit bei Laufwerkausfällen. RAID3 bis RAID 5 sind gegen den Ausfall eines einzigen Laufwerks gewappnet, fallen hingegen 2 Laufwerke aus, gehen Daten verloren. RAID 6 kann auch in diesem Fall die Daten vollständig rekonstruieren. Es verwendet zu diesem Zweck eine „zweidimensionale Parität“. RAID Level 6 arbeitet wie RAID 5, nur mit dem Unterschied, dass auf jedem Laufwerk neben den eigentlichen Nutzdaten zwei Paritäten gespeichert werden. Mit deren Hilfe können auch bei einem Ausfall von zwei Laufwerken die verlorenen Daten rekonstruiert werden.

RAID 6: RAID 6 verwendet „zweidimensionale Parität“. So können auch zwei Laufwerke ausfallen, ohne dass Daten verloren gehen [byte2002]

Vorteile

Zuverlässigkeit

Es können zwei beliebige Laufwerke ausfallen, ohne dass Daten verloren gehen.

Nachteile

Schlechte Schreibperformance

Die komplexe Berechnung der Paritäten bewirkt eine sehr schlechte Schreibperformance.

Schwierige Datenrekonstruktion

Fallen ein oder zwei Laufwerke aus, sinkt merklich die Gesamtperformance des Speichersystems.

Komplexer Controller

Wie für RAID 5 ist auch bei RAID 6 der Controlleraufbau sehr komplex.

Overhead an Rechenaufwand

Die Berechnung der Paritätsadressen bedeutet für den Controller einen erheblichen Mehraufwand, was sich auf die Qualität der Performance auswirkt.

Anwendungsbereiche

RAID 6 wird überall dort eingesetzt, wo Zuverlässigkeit wichtiger ist als die Qualität der Performance.

RAID Level 7 (Proprietär)

Funktionsweise

RAID Level 7 ist eine Entwicklung der Firma Storage Computer. Das neuartige an diesem RAID System ist, dass es einen eingebetteten Array Control Mikroprozessor beinhaltet, der mittels eigenen Echtzeitbetriebssystems die Performance der unterschiedlichen Aufgaben optimiert. Er nutzt dazu einen schnellen internen Datenbus und interne Pufferspeicher. Paritätsinformationen können auch ähnlich wie bei RAID 6 auf mehrere Laufwerke aufgeteilt werden.

RAID 7: Die Datenlaufwerke und Paritätsplatte sind über einen internen High-Speed Datenbus mit einander verbunden. Die Verwaltung der externen Zugriffe übernimmt mittels Echtzeitbetriebssystems ein systemeigener Mikroprozessor [byte2002]

Vorteile

Hohe Schreibperformance

Die Schreibperformance von RAID 7 übertrifft die der anderen RAID Levels um das 1,5- bis 6-fache. Die Schreibperformance steigt dabei mit der Anzahl der verbundenen Laufwerke.

Skalierbarkeit

Host Interfaces sind weit skalierbar in Bezug auf Anschlussmöglichkeiten und Transferbandbreite.

Nachteile

Abhängigkeit vom Anbieter

Da RAID 7 ein Produkt ausschließlich einer Firma ist, ist man von dieser vollkommen abhängig.

Hohe Kosten

RAID 7 ist eine sehr teure Lösung

Abhängigkeit von Stromversorung

Im Falle eines Stromausfalles gehen die Daten aus den Pufferspeichern verloren. Aus Sicherheitsgründen muss man mit einer teuren UPS Stromversorgung arbeiten.

3

RAID 3 luth2004

RAID 4 luth2004

RAID 7

Weblink

Storage Computer - http://www.storage.com/metadot/index.pl

Weitere RAID Levels

1

Kombinations-RAIDs byte2002

In der Praxis werden oft RAID Levels miteinander kombiniert
- Motivation - Nutzung von Vorteilen, Eliminierung von nachteiligen Eigenschaften
Levelbezeichnung
- Die Levelnummer ergibt sich aus den Nummern der kombinierten Levels
  - Beispiel - RAID 05 ist eine Kombination von RAID 0 und RAID 5

Geläufige Kombinationen

Level	Performance	Zuverlässigkeit	Kosten
RAID 10	wie Level 0	wie Level1	Hoher Datenoverhead, daher sehr teuer
RAID 50 (oder 05)	Verbesserter Datendurchsatz bei Lesezugriffen	Sehr hoch (besser als alle einfachen RAID Levels)	keine Information
RAID 53	Äußerst hohe Transaktions- und Transferrate	wie RAID 3	stellt besondere Anforderungen an Laufwerke, daher sehr teuer

Tabelle: Beispiele für Kombinations-RAIDs

RAID (n,m) luth2004

RAID 6 kann Ausfall von zwei Platten kompensieren
- Prinzip auf mehrere Platten erweiterbar
Levelbezeichnung
- RAID (n, m) bzw. RAID n+m
  - n - Gesamtanzahl der Platten im Verbund
  - m - Anzahl der Platten, die ohne Datenverlust ausfallen dürfen

2

Kombinations-RAIDs byte2002

In der Praxis werden nun oft die unterschiedlichen RAID Levels miteinander kombiniert. Welche Levels kombiniert wurden, ist dann aus der Levelnummer ersichtlich. Zum Beispiel bezeichnet der RAID Level 05 ein Verfahren, das sich aus der Kombination von Level 0 und Level 5 zusammensetzt.

Ein häufig eingesetzter Kombinationslevel ist RAID 10, der gleich wie RAID 0+1Striping und Mirroring kombiniert, nur dass hier zuerst Platten gespiegelt werden, und dann Stripes erzeugt werden. Durch diese günstige Kombination erzielt man ein RAID mit der Zuverlässigkeit von RAID 1 und der Performance von RAID 0.

Geläufige Kombinationen

Folgende Tabelle listet die Eigenschaften geläufiger Kombinations- RAIDs:

Level	Performance	Zuverlässigkeit	Kosten
RAID 10	wie Level 0	wie Level1	Hoher Datenoverhead, daher sehr teuer
RAID 50 (oder 05)	Verbesserter Datendurchsatz bei Lesezugriffen	Sehr hoch (besser als alle einfachen RAID Levels)	keine Information
RAID 53	Äußerst hohe Transaktions- und Transferrate	wie RAID 3	stellt besondere Anforderungen an Laufwerke, daher sehr teuer

Tabelle: Beispiele für Kombinations RAIDs

RAID (n,m) luth2004

RAID 6 ist das einzige Verfahren, dass auch den Ausfall von zwei Platten kompensieren kann. Will man nun ein RAID aufbauen, das mehr als zwei Plattenausfälle verkraftet, kann das Prinzip von RAID 6 beliebig erweitert werden. Als Levelbezeichnung solcher RAIDs hat sich die Schreibweise RAID (n, m) bzw. RAID n+m eingebürgert, wobei n die Gesamtanzahl der Platten im Verbund angibt und m die Zahl der Platten, die ohne Datenverlust ausfallen dürfen.

3

Kombinations-RAIDs

Vergleich von RAID Levels stor2005

Akronyme

CAD – Computer-Aided Design

CAM – Computer-Aided Manufacturing

ECC – Error Correcting Code: Verfahren zum Erkennen und Korrigieren von Bitfehlern.

(EIS – Enterprise Information Systems)

(IDE - Integrated Drive Electronics (hard disk))

(MTTF – Main Time To Failure)

RAID – Redundant Arrays of Inexpensive (or Independent) Discs

(SCSI - Small Computer Serial (or System) Interface)

SLED – Single Large Expensive Disc

UPS - Uninterruptible Power Supply

Glossar

Durchsatz - Die (Daten)menge, die in einer bestimmten Zeit verarbeitet wird

Hamming Code – Benannt nach Mathematiker Richard Wesley Hamming (1915-1998), Den Bits einer Nutzfunktion werden Bits zur Fehlerkorrektur beigefügt

Paritätsbit - Der Ausdruck Paritätsbit bezeichnet ein Prüfbit, welches an eine Bitfolge gebunden ist und der Fehlererkennung dient. Das Paritätsbit ist ein zeichendiskretes Prüfbit, das in einer Funktion zu den Datenbits hinzugefügt wird und die Bitsumme gerade oder ungerade macht. Diese Maßnahme dient der Fehlererkennung bei asynchroner Datenübertragung (Paritätsprüfung). Ist die Bitsumme beim Empfänger nicht korrekt angekommen, kann man einen Übertragungsfehler annehmen. [wikipedia]

Paritätsprüfung – Methode der Fehlerprüfung mittels Paritätsbit

Proprietär - [EDV] Hard– oder Softwareprodukt einer Firma, das nur als Baustein eines speziellen Computertyps verwendet werden kann

Transaktionsrate – I/O Rate

Transferrate – Durchsatzrate, Datenübertragungsgeschwindigkeit