Arkeia Software

Progressive Deduplizierung

Arkeia hat die “progressive Deduplizierungs”-Technologie im November 2009 mit der Übernahme von Kadena-Systems erstanden. Arkeia Software bietet eine Deduplizierungs-Funktionalität, die auf Blockebene arbeitet, quellseitig, unmittelbar und schliesslich „content-aware“ funktioniert. Die progressive Deduplizierung unterscheidet sich von Technologien, die auf der Basis von variablen oder festen Blocks funktionieren.

Comparison_DedupTechnologies_sm
Die "feste Blockdeduplizierung" (ein Block oder eine Untereinheit einer Datei werden dedupliziert) ist bereits eine Verbesserung verglichen mit Deduplizerungstechnologien auf Dateienebene (ganze redundante Dateien werden dedupliziert). Die Deduplizierung auf Blockebene zeigt allerdings Schwächen beim Einfügen von Daten am Anfang oder in der Mitte einer Datei. Wenn Daten in eine Datei eingefügt werden erkennt der Deduplizierungs-Agent die an neue Daten anschliessenden Blocks als neue Blocks und erreicht daher geringere Deduplizierungs-Kompressionsraten.

Die "variable Blockdeduplizierung" bietet eine Lösung für dieses Problem, fügt dabei allerdings zusätzliche Arbeitsschritte ein. Die "variable Blockdeduplizierung" definiert innerhalb der Daten einer Datei Blockgrenzen durch spezifische Markierungen (sogenannte magische Nummern).

Kadena's progressive Deduplizierung wiederum bietet die Leistungsstärke von "festen Blockdeduplizierungen" und die Flexibilität beim Einfügen von neuen Daten der "variablen Blockdeduplizierung". Die „sliding-Window“-Technologie, die in der progressiven Deduplizierung eingesetzt wird, wurde bereits in vielen Kompressions-Algorithmen benutzt. Kadena’s Weiterentwicklung ist  die unten beschriebene „Progressive Matching“-Strategie.

Schnelligkeit und kürzere Zeitfenster

Progressive-matching algorithm

Bei der progressiven Deduplizierung wird nun das bisher verwendete zeitraubende Scannen von Blockgrenzen überflüssig. Neue unbekannte Daten untersucht Arkeia dynamisch. Mit Hilfe der Sliding-Window-Technologie erkennt Arkeia eine neue Datei, die lediglich durch das Einfügen von nur ein paar Bytes Informationen aus einer bereits bekannten Datei erzeugt wurde. Ein schneller und schlanker Algorithmus bestimmt, ob Daten mit einer gewissen Wahrscheinlichkeit zu bereits bekannten Typen passen und welche die ideale Blockgröße ist. Wahrscheinliche Treffer werden mit einem leistungsstarken Hash-Algorithmus geprüft. Da über 99% der wahrscheinlichen Treffer sich im Ergebnis als exakte Treffer herausstellen, ist dieses progressive Matchen extrem effizient.

Diese als “progressive Deduplizierung“ bezeichnete patentierte Matchingtechnologie bietet im Ergebnis höhere Kompressionsraten, beschleunigt das Backup und spart den Unternehmen Kosten dank des geringeren Speicherplatzbedarfs und niedrigerer Netzwerkauslastung.

Höhere Kompressionsraten für eine bessere Netzwerkauslastung und die Optimierung vom Speicherplatz

Die progressive Deduplizierung bietet im höhere Kompressionsraten, beschleunigt das Backup und spart den Unternehmen Kosten dank des geringeren Speicherplatzbedarfs und niedrigerer Netzwerkauslastung. Die variable Blockdeduplizierung legt die Blockgrenzen zufällig fest und ermöglicht nur geringe Kontrollmöglichkeiten über die Größe der Blocks.

Progressive Deduplizierung testet alle möglichen Blockgrenzen und garantiert so die bestmögliche Deduplizierung. Die genaue Kontrolle über die Blockgrenzen führt zu optimalen Blockgrenzen für jeden Dateityp. Dadurch ist die progressive Deduplizierung kontextsensibel (auch "application aware").  Jeder Dateityp (wie ausführbare Dateien, Textdateien oder Datenbankeinträge) werden mit derjenigen Blockgröße dedupliziert, die eine maximale Kompressionsrate erzielt. Dafür hat Arkeia unzählige Dateitypen analysiert, die von Hunderten von in mittleren und großen Firmen eingesetzten Anwendungen stammen und die jeweilige optimale Blockgröße ermittelt.
Administratoren können Default-Blockgrössen überschreiben und können Blockgrössen für neue Dateitypen spezifizieren.  

graph_compressionratio-blocksize_sm
Deduplizierungsraten hängen stark von den betroffenen Daten ab, können aber eine Reduzierung des Datenvolumens von bis zu 95% erreichen wenn die gleichen Dateien mehrere Male gesichert werden (z.b. Sicherungen in der Nacht während eines Monats) oder wenn ähnliche Volumen gesichert werden (z.B. mehrere dutzend virtuelle Maschinen über mehrere physikalische Hosts).

Replikation of Deduplicated Data

Durch die Kombination der Deduplizierung mit der Arkeia-Technologie der Replikation von Datensicherungen können Arkeia-Anwender noch besser ihre verteilten WAN-Umgebungen schützen.Da ausschliesslich neue Blocks, die sich noch nicht auf dem Disaster Recovery Site befinden, über das WAN transferiert werden sind Datensicherungen extrem schnell. Backup-Umgebungen, die vorher Tapes für den Datenschutz transportieren mussten können nun von den Vorteilen und Kostenersparnissen der WAN-Datentransfers profitieren.

Weitere Informationen finden Sie unter hier