Qu'est-ce que la Déduplication à la Source

source-and-targetLa déduplication à la source est effectuée au niveau de la machine cliente avant que les données ne soient transférées sur le réseau. Dans ce cas de figure, l'agent sur le client de sauvegarde communique avec le serveur de sauvegarde pour déterminer si les données à sauvegarder s’y trouvent déjà. Contrairement à la déduplication à la destination, la déduplication à la source ne transfère pas les données via le LAN/WAN améliorant ainsi non seulement l’utilisation de
l’espace de stockage pour les sauvegardes  mais aussi réduisant en même temps le trafic réseau.

En réduisant considérablement le volume de données transférées sur le réseau, la déduplication à la source permet la sauvegarde de volumes de données importants sans requérir un investissement dans du matériel et de la bande passante supplémentaires.

La Déduplication à la Source au Sein des Environnements Virtualisés

Les serveurs virtuels sont faciles à déployer et ne sont pas directement freinés par les coûts liés à l'achat de matériel. Ainsi, les environnements virtuels disposent souvent de beaucoup plus de serveurs que l'on en trouve dans une infrastructure informatique non virtualisée ; dédier une machine virtuelle avec un système d’exploitation à chaque application ou environnement de test provoque une importante redondance des données. Des sauvegardes lentes, la congestion réseau et et de disques, la charge de l'hyperviseur - tels sont les problèmes que l'on rencontre fréquemment dans des environnements virtualisés.

En conséquence, les méthodes de sauvegarde traditionnelles ne permettent souvent pas de maintenir des fenêtres de sauvegarde courtes. La déduplication à la source en environnement virtualisé réduit le volume des donnés à sauvegarder permettant ainsi une réduction du trafic réseau, de l'utilisation de l'espace de stockage et une réduction de la charge de l'hyperviseur. La déduplication à la source peut être intégrée au niveau du système d'exploitation de la machine cliente ou être intégrée à l'API spécifique pour le stockage au niveau de l'hyperviseur, comme par exemple vStorage de VMware  ou VSS de Microsoft Hyper-V.

La Déduplication à la Source au Sein des Environnements Distribués

Les environnements distribués comptent souvent de nombreux sites géographiquement dispersés et connectés via un réseau WAN. Il est très difficile d’effectuer des sauvegardes dans ce genre d’environnement car il est impossible de transférer d'importants volumes de données sur un réseau WAN. Dans les environnements distribués, les sauvegardes sont parfois tellement lentes que les fenêtres de sauvegardes ne sont pas réalisables. Parfois, il est tout simplement impossible d’effectuer des sauvegardes centralisées.

Le déploiement de solutions indépendantes sur chaque site rend la gestion des sauvegardes ainsi que la consolidation des données extrêmement difficiles. La déduplication à la source relève tous ces défis en réduisant  considérablement le volume des données transférées sur le réseau. De plus, en associant la déduplication et la réplication, les entreprises peuvent transférer des données entre différents sites pour mettre en œuvre des stratégies de Disaster Recovery ou pour un meilleur stockage des données critiques hors site.

La Déduplication à la Source au Sein des Environnements LAN des Datacenters

Avec un volume de données en constante augmentation, et malgré le fait que les médias de stockage sur disques deviennent plus accessibles, les entreprises sont continuellement confrontées à des problèmes de bande passante et de fenêtres de sauvegardes non réalisables, même dans des environnements LAN. De plus, le coût pour faire évoluer son infrastructure réseau est non négligeable. La déduplication à la source permet aux entreprises d’implémenter une solution qui répond non seulement aux besoins en termes de stockage mais également au niveau de la bande passante, sans devoir investir dans du nouveau matériel.