Speicherplatz sparen mit Datendeduplizierung

Mit der Datendeduplizierung lässt sich unter Windows Server einiges an Speicherplatz sparen. Besonders in Umgebungen, in denen nur begrenzt Festplattenspeicher zur Verfügung steht, kann sich die Aktivierung dieser Funktion durchaus lohnen. In diesem Artikel erfährst Du, wie die Datendeduplizierung installiert wird und wie Du sie dafür nutzt um Speicherplatz sparen zu können.



Was ist Datendeduplizierung?

Was Datendeduplizierung bedeutet und warum Du damit Speicherplatz einsparen kannst, ist relativ schnell erklärt. Nehmen wir einmal an, Du hast einen Fileserver, auf welchem tausende Dateien im Microsoft Word Format gespeichert sind. Alle diese Dateien bestehen, bis auf den Inhalt/Text, aus den gleichen Teilen (Dateiheader, usw.). Genau dort setzt die Datendeduplizierung an: Gleiche Blöcke werden nur einmal komplett auf der Festplatte gespeichert. Die anderen, identischen Blöcke werden mittels eines Pointers auf den gespeicherten Block verlinkt.

Ziel der Datendeduplizierung ist es also, redundante Blöcke zu erkennen, diese in Pointer umzuwandeln und damit Speicherplatz sparen. Tiefgehendere Informationen zu der Funktionsweise findest Du hier.

Eingesetzt werden kann die Datendeduplizierung seit Windows Server 2012. Die Funktion ist nicht standardmäßig aktiviert und muss daher nachinstalliert werden. Das kann entweder über den Server Manager erfolgen oder über die Windows PowerShell.

Speicherplatz sparen mit Datendeduplizierung
Aktivierung der Datendeduplizierung über den Server Manager

Der dazugehörige PowerShell Befehl lautet:

Install-WindowsFeature -Name FS-Data-Deduplication
Datendeduplizierung installieren über die PowerShell
Datendeduplizierung installieren mit der Windows PowerShell.

In beiden Fällen ist kein Neustart nötig. Das Feature Datendeduplizierung ist sofort über den Server Manager verfügbar. Du findest alle nötigen Einstellungen in den Datei-/Speicherdiensten im Reiter „Volumes„. Nach der Installation des Features wird dortige Übersicht der Volumes um die Spalten „Deduplizierungsrate“ und „Einsparungen durch Deduplizierung“ erweitert.

Datendeduplizierung im Server Manager

Speicherplatz sparen – Deduplizierung aktivieren

Die Datendeduplizierung kann nur auf Volumeebene aktiviert werden. Hierfür klickst Du in der obigen Ansicht mit der rechten Maustaste auf das Volume, für welches Du die Deduplizierung aktivieren möchtest. Es erscheint das folgende Auswahlfenster:

Datendeduplizierung konfigurieren Windows Server
Für jedes Volume kann die Datendeduplizierung explizit de-/aktiviert werden.

Nach einem Klick auf „Datendeduplizierung konfigurieren“ öffnet sich ein Fenster, in dem Du alle notwendigen Einstellungen vornehmen kannst. Zunächst aktivierst Du die Deduplizierung indem Du die grobe Verwendung des Servers festlegst.

Zur Auswahl stehen:

  • Deaktiviert
    Die Datendeduplizierung ist ausgeschaltet.
  • Allgemeiner Dateiserver
    Diese Auswahl sollte getroffen werden, wenn das Volume als Ablage für Benutzerdateien verwendet wird.
  • VDI-Server (Virtual Desktop Infrastructure)
    Bei Verwendung des Volumes für Remotedesktopdienste
  • Virtualisierter Sicherungsserver
    z.B. Partitionen von eingesetzten Backupprogrammen

In meinem Beispiel aktiviere ich die Datendeduplizierung auf einem Fileserver, um dort Speicherplatz sparen zu können. Fileserver sind ein ideales Beispiel für das enorme Einsparpotential der Deduplizierung. Durch den sehr oft vorkommenden Wildwuchs in den Freigaben, häufen sich enorme Datenmengen an – die zudem noch häufig doppelt oder dreifach abgelegt werden.

Ich wähle daher die Einstellung „Allgemeiner Dateiserver“ und lege gleichzeitig noch fest, dass alle Dateien, deren Alter größer als 3 Tage beträgt, dedupliziert werden dürfen. Du kannst weiterhin noch Ordner und Dateierweiterungen von der Deduplizierung ausnehmen.

Deduplizierung aktivieren Windows Server 2019

Über die Schaltfläche „Zeitplan für die Deduplizierung festlegen“ kannst Du die Hintergrundoptimierung aktivieren. Damit sorgst Du dafür, dass die Deduplizierung immer im Hintergrund läuft, ohne aber die Leistung des Servers zu beeinträchtigen.

Darüberhinaus lassen sich noch zwei Zeitspannen festlegen, in welchen die Datendeduplizierung mit höherer Priorität als bei der Hintergrundoptimierung durchgeführt wird. Es empfiehlt sich, die Durchsatzoptimierung nur zu den Zeiten auszuführen, in denen das System nur wenig bis gar nicht genutzt wird (meistens Nachts).

Deduplizierung Hintergrundoptimierung aktivieren

Ist alles nach Deinen Wünschen eingerichtet, beginnt die Datendeduplizierung auf dem gewählten Volume. Du kannst Dich nun zurücklehnen und abwarten. Nach und nach werden Dir nun in der „Volumes-Ansicht“ die aktuellen Ergebnisse der Deduplizierung angezeigt.

Speicherplatz einsparen mit Datendeduplizierung Server 2019
Bei einem reinen Fileserver mit vielen Microsoft Office Dateien wird das Einsparungspotential der Deduplizierung besonders deutlich.

Du wirst überrascht sein, wie viel Speicherplatz durch diesen kleinen Eingriff eingespart werden kann. Die Deduplizierungsrate liegt gerade bei Fileservern nicht selten bei über 50 %.

Wichtig: Eine auf Snapshots basierende Backupsoftware muss die Datendeduplizierung erkennen und verarbeiten können, damit die Wiederherstellung von Dateien funktioniert. Im Falle von Veeam Backup & Replication muss beispielsweise das Feature „Datendeduplizierung“ auch auf dem wiederherstellenden Backupserver installiert sein (siehe hier).

Fazit:

Mit der Datendeduplizierung von Windows Server lässt sich erheblich Speicherplatz sparen. Gerade auf Volumes mit vielen Dateien des gleichen Typs lohnt sich der Einsatz dieses Features.

Ebenfalls interessant:

Dieser Artikel ist wie alle anderen auf dieser Seite kostenlos für Dich und ich hoffe, ich konnte Dir weiterhelfen. Wer möchte, kann diesem Blog eine kleine Aufmerksamkeit in Form einer kleinen Spende (PayPal) oder über die Amazon Wunschliste zukommen lassen.

Schreibe einen Kommentar