RAID – was ist das?
RAID ist eine Technik zur Kombination einzelner Speichereinheiten zu einem Verbund, realisiert entweder mittels Steuerungssoftware (Software-RAID) oder Hardwarecontroller (Hardware-RAID).
Das Akronym RAID steht für „Redundant Array of Indepent Disks“, also eine redundante Anordnung mehrerer unabhängiger Datenträger (meistens Festplatten oder SSDs).
Historisch wurde RAID auch manchmal als „Redundant Array of Inexpensive Disks“ bezeichnet. Dies vor dem Hintergrund, da die Kosten für die Kombination kleinerer Speichermodule (Festplatten) Anfang der 90er Jahre niedriger waren als die Anschaffung eines einzelnen größeren Speichers.
Einsatzmöglichkeiten für RAID-Speichersysteme
Heute werden RAID-Technologien angewendet zur Leistungssteigerung von Speichergeräten (Verteilung der Daten über mehrere Speichereinheiten) oder zur Erhöhung der Datensicherheit (redundante Speicherung).
Moderne RAID-Speicher erlauben den Wechsel von defekten Laufwerken während des Betriebs („Hot-Swapping“) und können sich nach einem (teilweisen) Ausfall automatisch selbst regenerieren.
RAID verwendet verschiedene Methoden zur Datenverwaltung, die als RAID-Level bekannt sind.
RAID – kein Ersatz für Backups
RAID schützt vor dem Ausfall eines (oder mehrerer) physischer Laufwerke, jedoch nicht vor Datenverlust aufgrund von Dateisystemfehlern oder dem versehentlichen bzw. absichtlichen Löschen von Daten.
Nicht verwechseln darf man übliche RAID-Speichersysteme mit der zeitversetzten Spiegelung von Datenbeständen, verallgemeinernd als „RAID-Backup“ bezeichnet. Denn erst der Faktor Zeit erfüllt alle Bedingungen eines typischen Backups.
Unternehmenskritische und wertvolle Datenbestände sollten daher zusätzlich regelmäßig auf externe Medien gesichert und getrennt vom RAID-Speicher gelagert werden (z.B. im 3-Generationen-Prinzip).
Gängige RAID-Level im Überblick
RAID 0
Striping – Beschleunigung ohne Redundanz (erfordert mindestens zwei Laufwerke gleicher Größe)
Verfügbarer Speicherplatz = Anzahl der Laufwerke * Laufwerkskapazität
Alle Laufwerke im RAID-Verbund werden miteinander kombiniert und als ein einziges logisches Volume abgebildet. Anwendungen sind vor allem in der Video- & Audiobearbeitung zu finden.
Die Daten werden in zusammenhängenden Blöcken gleicher Größe aufgeteilt und in einer Art „Reißverschlussverfahren“ zu einem einzigen großen Datenträger angeordnet. Das erlaubt den parallelen Zugriff auf alle Datenträger.
Der Vorteil liegt in einer Steigerung der Leistung bei Lese- & Schreibzugriffen. Von Nachteil ist allerdings, dass bei Ausfall auch nur eines einzelnen Laufwerks der komplette Datenbestand verloren ist.
RAID 1
Mirroring – Spiegelung (erfordert eine gerade Anzahl aus mindestens zwei Laufwerken gleicher Größe)
Verfügbarer Speicherplatz = (Anzahl der Laufwerke * Laufwerkskapazität) / 2
Der Datenbestand ist doppelt gesichert, indem der Inhalt aller Laufwerke auf der gleichen Anzahl zusätzlicher Laufwerke vorgehalten (gespiegelt) wird.
Diese Redundanz gewährleistet bei Ausfall eines Laufwerks die Funktionsfähigkeit des Speichersystems und wird daher vor allem bei Serverlösungen eingesetzt. Ausgefallene Laufwerke lassen sich schnell wiederherstellen (Daten müssen nur umkopiert werden).
Von Nachteil ist die im Vergleich zu RAID 0 niedrigere Schreibgeschwindigkeit sowie die mit der doppelt benötigten Anzahl von Laufwerken verbundenen höheren Betriebskosten.
RAID 5 & RAID 6
Stripesets mit verteilter Paritätsinformation (erfordert mindestens drei Laufwerke gleicher Größe)
Verfügbarer Speicherplatz (RAID 5) = (Anzahl der Laufwerke – 1) * Laufwerkskapazität
Die Daten werden über alle Laufwerke hinweg gespeichert (ähnlich RAID 0). Jedes Stripeset (Gruppe aus Datenblöcken) erhält einen Paritätsblock auf einem anderen Laufwerk, welcher die Wiederherstellung im Fehlerfall erlaubt.
Bei Ausfall einer Speichereinheit bleibt der Betrieb des Speichers sichergestellt. Außerdem bietet RAID 5 im Vergleich zu RAID 1 mehr Speichervolumen bei gleicher Anzahl von Laufwerken (ca. 75 % zu 50 % der Gesamtkapazität).
Zu beachten ist aber die niedrigere Zugriffsgeschwindigkeit sowie die langwierige Wiederherstellung eines ausgefallenen Laufwerks von oft mehreren Stunden, wobei der Zugriff auf den Speicher aber währenddessen – trotz Einbußen in der Performance – möglich bleibt.
Die Alternative RAID 6 verwendet doppelte Paritätsinformationen und verkraftet so auch den gleichzeitigen Ausfall von zwei Festplatten, benötigt jedoch ein weiteres Laufwerk (also mindestens vier).
RAID 3 / RAID 4
Byte-Level-Striping mit verteilter Paritätsinformation (erfordert mindestens drei Laufwerke)
Verfügbarer Speicherplatz (RAID 3) = (Anzahl der Laufwerke – 1) * Laufwerkskapazität
Die Funktionsweise ähnelt der von RAID 5, jedoch werden die Paritätsinformationen auf Byteebene erstellt und zudem auf einer separaten Festplatte gebündelt abgelegt. Mehrere Speichermedien teilen sich also eine Platte mit den Paritätsdaten, was leichte Kostenvorteile bietet.
Dadurch entsteht aber auch ein gravierender Nachteil: Die Paritätsplatte wird bei jedem Zugriff benötigt und bildet daher den Flaschenhals des Systems. Aufgrund des Preisverfalls bei Speichermedien wird RAID 3 kaum mehr genutzt.
Anmerkung: Ein RAID 3 mit zwei Festplatten entspricht faktisch dem RAID 1, erfordert jedoch eine höhere Leistung des Controllers.
Die Alternative RAID 4 verwendet Paritätsinformationen auf Blockebene (gleich RAID 5), welches eine höhere Geschwindigkeit als RAID 3 bietet.
RAID x + Spare
Zusätzlich zum angegebenen RAID-Level (x) werden ein oder mehrere Ersatzlaufwerke bereitgehalten, sodass sich bei Ausfall eines Laufwerks das Speichersystem sofort selbst regenerieren kann.
Hier steht der Gewinn an Sicherheit im Vordergrund, da kein sofortiges manuelles Eingreifen bei einem Hardware-Defekt erforderlich ist. In großen Rechenzentren können so Reparaturaufträge effizienter koordiniert oder Zeiten ohne Wartungspersonal (z.B. Wochenende) überbrückt werden.
Verschachtelte / Kombinierte RAID-Level
Je nach Anforderung können die Eigenschaften verschiedener RAID-Levels auch miteinander verknüpft werden. Das bezeichnet man als „Verschachtelung“ oder „RAID-Kombination“.
Häufig verwendet wird RAID-10, ein „Stripe aus gespiegelten Datensätzen“ (die Daten werden über zwei gespiegelte RAID-1-Systeme geschrieben). Die Vorteile liegen in der schnellen Wiederherstellung (keine Nutzung von Paritätsdaten) und der Tatsache, dass von jedem Array eine Festplatte ausfallen kann.
Weitere RAID-Level
Aufgrund der starken Verbreitung von Speichersystemen gerade im Homeoffice-Bereich, aber auch bei professionellen Lösungen, existiert eine Vielzahl herstellerspezifischer RAID-Level.
Diese sind meist Nischenanwendungen vorbehalten und können ihre spezifischen Vorteile nur in diesen Fällen ausspielen.
Autor: Tobias Eichner | Datum der Veröffentlichung: August 2017 | Letzte Aktualisierung: Februar 2023
Wichtig: Bitte beachten Sie die Nutzungsbedingungen und rechtlichen Hinweise für diesen Beitrag!