Skip to end of metadata
Go to start of metadata
Indice

1 Visión general

WBS Airback®  provee una solución unificada para la consolidación de almacenamiento y archivado de datos, así como la gestión de la seguridad de los mismos, permitiendo establecer diferentes niveles de acceso a estos en virtud de sus requerimientos de disponibilidad.

 

WBS Airback®  supone una nueva generación en los sistemas de gestión y protección del almacenamiento, incluyendo funcionalidades capaces de gestionar almacenamiento heterogéneo para su uso como almacenamiento primario o como repositorio de backup, así como funcionalidades para la gestión del ciclo de vida del backup. Dichas funciones son gestionadas de una manera muy sencilla debido a que abstraen parte de la complejidad técnica y conceptual de los mencionados servicios.

WBS Airback®  está basado en una plataforma de tipo appliance que integra todos los componentes lógicos necesarios en una única plataforma. No requiere la adquisición ni instalación de sistemas operativos ni aplicaciones de terceros para funcionar. Puede adquirirse como un appliance físico incluyendo la plataforma hardware adecuada a cada necesidad, o como un appliance virtual incluyendo los ficheros estándar necesarios para desplegar una máquina virtual en las principales plataformas de virtualización.

A través de una sencilla interfaz web accesible desde cualquier navegador, se puede realizar toda la administración y configuración del sistema y de sus funcionalidades principales.

Desde dicha interfaz se realiza la actualización de versiones, actualizaciones, parches, etc. con tan sólo dos o tres clicks.

El esquema general de la solución es el siguiente:

Figura 1: Esquema de funcionamiento de WBSAirback ®

 

En el presente documento se describe la estrategia y técnicas apropiadas para abordar el backup utilizando la técnica de Deduplicación Global, que permite grandes ahorros en cuanto a espacio de almacenamiento y tiempo de backup en la mayoría de situaciones.

2 Deduplicación Global

A partir de la versión 15 WBS Airback®  incorpora el módulo de Deduplicación Global, basándose de las caracterísiticas del plugin 'Global Endpoint Deduplication' de Bacula Enterprise Edition v8. Con el uso de la Deduplicación Global, los datos son analizados a nivel de bloque y son escritos una sola vez en disco a través del motor de deduplicación. Nuevos bloques iguales a los ya existentes, serán solamente referenciados.

La Deduplicación Global es capaz de deduplicar tanto en el destino de almacenamiento como en los orígenes de datos. Esto puede producir un beneficio muy significativo en términos de ahorro de espacio de almacenamiento, velocidad de trabajos de backup y rendimiento general del sistema.

2.1 Cómo funciona

El proceso de backup de un trabajo configurado con Deduplicación Global en origen y en destino funcionaría de la siguiente manera:

Pasos
  1. Cuando un backup da comienzo, el servicio BACKUP-STORAGE (también llamado  Storage Daemon ) alojado en WBSAirback ® informa al agente alojado en el cliente origen del backup (también denominado  File Daemon ), que el dispositivo destino soporta deduplicación global
  2. El File Daemon computa códigos hash para cada bloque que ha de transmitir hacia  WBS Airback®  y envía las referencias de los mismos para que el  compruebe si ya dispone de cada bloque o no.
  3. El Storage Daemon solicitará al File Daemon todos aquellos bloques nuevos que no tuviese ya almacenados. Para aquellos que ya tiene almacenados, solamente almacenará una referencia.

Cuando la Deduplicación Global está activada, los conjuntos de datos asociados a repositorios de deduplicación son llenados con las referencias a los datos que quedan almacenados en el 'Almacén Global de Datos de Deduplicación'. Sin embargo, los datos encriptados y los archivos muy pequeños, siguen almacenándose en los volúmenes de cada conjunto.

3 Beneficios

A continuación, se listan los principales beneficios del uso de esta técnica de backup en WBS Airback® , frente a otras alternativas de la propia solución.

Beneficios
  • Los backups de tipo VirtualFull tienen un rendimiento muy superior con Deduplicación Global respecto al uso de Deduplicación ZFS, ya que cada virtual no intentará mover todos los datos en disco para hacer un nuevo Full. En oposición, computará códigos hash y creará solamente punteros de referencia con respecto a los datos ya existentes en los Incrementales o Full anteriores.
  • Los backups con agente pueden mejorar considerablemente su rendimiento al necesitar transmitir menos datos por la red cuando activamos la deduplicación en origen.
  • Las recuperaciones con el modo 'Rehidratación de datos' activo pueden funcionar de forma más rápida y transmitir menos datos por la red.
  • La deduplicación se produce entre todos los backups del sistema que activen deduplicación, independientemente de su organización en conjuntos o repositorios de backup. Por lo tanto, se puede lograr deduplicar más bloques al compartir el espacio de todos los agregados del sistema, además de no necesitar configuración específica por sistema de almacenamiento.
  • Si la naturaleza de los datos lo permite, se puede deduplicar cualquier tipo de backup. Esto incluye: backups VSS, backups de SystemState, plugins de BBDD, etc.
  • Es posible ejecutar réplica deduplicada entre equipos WBS Airback® remotos, ahorrando espacio, computación y carga de red.

 

4 Limitaciones  

Hay que tener en cuenta las siguientes limitaciones:

Limitaciones
  • Solamente podemos utilizar un tipo de deduplicación de forma concurrente en los mismos dispositivos de almacenamiento de  WBS Airback® : Deduplicación Global ó Deduplicación ZFS.
  • Al tratarse de una deduplicación que trabaja de forma global, no es posible agrupar los datos de deduplicación de forma separada por dispositivo de almacenamiento. Es decir, si tenemos 2 conjuntos que deduplican bien por separado, pero no juntos, la Deduplicación Global en un sólo WBSAirback ® no sería una buena solución.
    • Si disponemos de más de un  WBS Airback® , sí podríamos organizar los datos en distintos equipos para que cada elemento (Director o MediaServer) deduplicase fuentes de datos diferentes.
  • Es posible realizar copias de jobs con Deduplicación Global, obviamente, estas copias ocuparán el espacio 'original' sin deduplicar en el disco de destino. Por lo tanto, no hay inconveniente tampoco para pasar a cinta. 
    • Sin embargo, no podemos hacer copia de los datos sin usar un job de copia. En otras palabras, No es posible realizar una copia de datos consistente usando RSYNC ó ZFS Send.
    • Este inconveniente implica que actualmente no podemos replicar volúmenes de backup entre dos sistemas  WBS Airback®  en ningún entorno, incluyendo entornos de HA. 
      • **Esta problemática será abordada en el futuro por WhitebearSolutions ®  para hacerla posible.
  • Si se perdiesen de manera irrecuperable los datos contenidos en el almacén de Meta-Datos de deduplicación, sería posible llevar a cabo recuperaciones de los datos existentes. Sin embargo, no sería posible continuar haciendo backup.
    • **A medio plazo serán incluidas en la solución herramientas para poder recupera almacenes de Meta-Datos de deduplicación perdidos, inconsistentes o corruptos.
  • No es posible deduplicar backups Cifrados.

 

5 Requisitos y Arquitectura Hardware

5.1 Memoria y Discos SSD

Para usar Deduplicación Global, se necesitan gran cantidad de recursos hardware. La cantidad de memoria RAM necesaria se calcula en base al volumen y naturaleza de los datos a deduplicar. Como referencia, esto se puede resumir en cantidad de datos únicos. Adicionalmente, es necesario utilizar un disco SSD para garantizar un rendimiento adecuado del sistema. A continuación se detallan las necesidades de cada uno de los elementos y su justificación.

El sistema utiliza una tabla de índices donde almacena todas las referencias a los datos utilizados con Deduplicación Global. Esta tabla de índices se almacena en el volumen de datos definido como 'Almacén de Índices de Deduplicación'. Esta tabla necesita ser accesible desde un disco de altas IOPS, es decir, un disco SSD. Además, para gestionar ese disco y las operaciones de deduplicación, se requiere cierta cantidad de RAM. Para un rendimiento totalmente óptimo, se requiere tener la suficiente cantidad como para incorporar la tabla completa alojada en el SSD en la propia memoria RAM. WBS Airback®  intentará almacenar por defecto toda la tabla de índices completa en RAM, aunque también esté replicada en el disco SSD.

Los requisitos mínimos de la Deduplicación Glboal en cuanto a tamaños de memoria y disco SSD son los siguientes:

Requisitos mínimos

Para cada 1TB de dato único gestionado en el sistema necesitaremos

  • 20 Gb de disco SSD
  • 12.8 Gb de RAM

Por cada ejecución de un job con GED, se necesitan 4Mb de memoria adicionales.

 

Teniendo en consideración, además, los elementos externos a al sistema de deduplicación que deben funcionar en el sistema (Servidor Web, Watchdog, Auditoría, NFS, CIFS, Otros backups sin deduplicación, CDP, StorageCloud, etc), necesitamos añadir un margen adicional de memoria para el sistema. En un equipo WBS Airback®  de 128Gb de RAM podríamos deduplicar, teóricamente, 10TB de datos. Sin embargo, aplicando el margen de memoria comentado, se han establecido 9TB de datos.

Las dos arquitecturas recomendadas estándard de WBSAirback ®, incluyendo los márgenes oportunos, quedarían de la siguiente manera:

Arquitecturas Deduplicación Global
  • 128Gb de RAM
    • Podrá deduplicar 9TB de datos únicos
    • Necesitará un disco SSD de 180Gb
  • 256Gb de RAM
    • Podrá deduplicar 18TB de datos únicos
    • Necesitará un disco SSD de 360Gb

El rendimiento del sistema de Deduplicación Global puede ser optimizado en base al establecimiento correcto de la tabla de índices. Esto se controla estableciendo los parámetros que limitan, inferior y superiormente. El tamaño de esta tabla puede ser configurado en la pantalla de configuración de la Deduplicación Global en la sección de parámetros avanzados. El sistema hace los cálculos para un rendimiento óptimo en este sentido, para tamaños de memoria RAM estándar. En casos no estándar y ante una situación de bajo rendimiento, será aconsejable revisar estos valores.

Por último, es muy recomendable aplicar mecanismos de protección hardware sobre los discos SSD utilizados, como arquitecturas RAID. Aunque se dispone de herramientas avanzadas de regeneración de índices en caso de desastre, es importante asegurar un nivel de protección óptimo de la información de deduplicación, pues esta será compartida por todos los backups del un equipo dado. Los equipos WBS Airback® estándar incorporan la protección adecuada para este tipo de dispositivos cuando se contrata este tipo de deduplicación.

5.2 CPU

Los requisitos de CPU, tanto en el lado de WBS Airback® , como en el lado del cliente (File Daemon) para las tareas de generación de Hashes, compresión, búsquedas en la tabla de índices, etc., son:

  • 3Ghz por cada 100Mb/s

6 Configuración

6.1 Activación del plugin

La Deduplicación Global se presenta en formato plugin. Este plugin no se incluye entre las características básicas de WBS Airback® , por lo que se necesita adquirir una licencia específica que permita su uso.

Para la activación del plugin, será necesario ir a la opción SUSCRIPCIÓN e insertar el código de servicio que se haya proporcionado desde WhiteBearSolutions ®  Al hacer click en Guardar, el plugin quedará activado.

 


Figura 2: Menú de Servicios de suscripción


Una vez añadido el código de servicio correspondiente, lo veremos en el listado de códigos registrados de un modo similar a éste:

 


Figura 3: Código de servicio de Deduplicación Global Activado


6.2 Configuración general

Con el código de servicio registrado, ya podemos acceder a los menús particulares de esta funcionalidad, accesibles desde el menú general en árbol, situado a la izquierda de la aplicación:

 


Figura 4: Menú de Deduplicación Global


El primer paso para utilizar Deduplicación Global, es establecer la configuración general.

Esta característica requiere de la definición de dos espacios de almacenamiento diferenciados:

Almacenamiento
  • El Almacén de Datos, será compartido por todos los recursos que utilicen deduplicación global para almacenar los bloques de información compartida. Por lo tanto, ha de ser un espacio de almacenamiento lo suficientemente grande y flexible para afrontar esta tarea. La mayor parte de la información de los backups será almacenada en este volumen de datos.
  • El Almacén de Meta-datos, almacena las tablas de deduplicación y otros metadatos necesarios para el correcto funcionamiento del motor de deduplicación. Ha de ser un volumen alojado en un agregado construido sobre un disco de estado sólido para garantizar un rendimiento óptimo.

La interfaz web, solamente muestra aquellos volúmenes que no tienen activada ni Deduplicación ZFS ni compresión, ya que:

  • La Deduplicación ZFS es incompatible con Deduplicación Global.
  • El sistema de Deduplicación Global lleva a cabo compresión de forma automática y transparente.


Figura 5: Configuración inicial de Deduplicación Global


En la pantalla de configuración también se especifica una planificación para el proceso de optimizado, que limpia el sistema de referencias no utilizadas, así como los parámetros avanzados que establecen los límites inferior y superior de la tabla de índices. En cualquier momento podemos consultar información adicional sobre cada uno de los parámetros de configuración pasando el cursor por encima del icono de información.

El proceso de optimizado**, es una tarea de mantenimiento interna del sistema de Deduplicación Global:

  • Es necesario que se ejecute de forma periódica, ya que va eliminando referencias a datos no utilizados en las tablas de deduplicación y, por lo tanto, manteniendo la ocupación y la salud del sistema en buen estado.
  • Este proceso puede ejecutarse con trabajos de forma paralela. Sin embargo, es muy recomendable no planificarlo al mismo tiempo que backups de tipo Full, pues esto puede ralentizar el sistema.
  • La planificación recomendada para este proceso es 1 vez por semana.
  • En el caso de un equipo que actúe como MediaServer, es importante desactivar este proceso.

Una vez configuremos este paso inicial, ya es posible definir repositorios y el resto de configuraciones para hacer backup. Al establecer el primer repositorio con la tipología 'Deduplicación Global', el motor quedará completamente activado y se aplicará internamente la configuración avanzada recomendad por defecto. No es necesario modificar estos valores avanzados en el caso general.

Estos parámetros avanzados especifican los límites inferior y superior de las tablas de deduplicación que se guardan en el almacén de metadatos de deduplicación.


Figura 6: Configuración avanzada de Deduplicación Global


**Nota sobre proceso optimizador:

  • El espacio que utilizan los volúmenes y que se deduplica, va completando una serie de referencias (contenedores)
  • Cuando borramos volúmenes, puede que alguna referencia se corresponda con datos que no existen
  • Este proceso limpia esas referencias, y gracias a la opción interna 'holepunching', también se trunca el espacio.

6.3 Repositorios con deduplicación global

Tras configurar los parámetros generales de la deduplicación global, el siguiente paso es definir los repositorios que utilizarán esta característica.

Para ello, en la pantalla de cada repositorio, hay que seleccionar el check 'Deduplicación Global':

 


Figura 7: Configuración de un repositorio con Deduplicación Global


Es importante señalar que solamente mostrarán el check como seleccionable, aquellos volúmenes aptos para utilizar Deduplicación Global. En otras palabras, aquellos que tengan la Deduplicación ZFS y la compresión desactivadas (de la misma manera, solamente se muestra el check de Deduplicación ZFS cuando el volumen tiene la Deduplicación ZFS activada).

También destacamos que, al ser incompatibles ambos métodos de deduplicación de forma simultánea en el mismo espacio de almacenamiento, la selección de una de ellas, invalida la otra.

6.4 Conjuntos con deduplicación global

Tras configurar el repositorio, podemos configurar un pool con el procedimiento habitual, seleccionando un repositorio de deduplicación. Al hacerlo, automáticamente se marcará la casilla de 'Máximo número de jobs por volumen' con el valor 1, pues así deben funcionar este tipo de pools.



Figura 8: Conjunto con Deduplicación Global


6.5 Patrones de ficheros con deduplicación global

El último elemento específico a configurar en un backup con Deduplicación Global, es el patrón de ficheros. Aquí es donde realmente se define si un backup va a deduplicar y cómo.

En cualquiera de los tipos de patrones de ficheros que estén activados en la aplicación (Según licencias contratadas), veremos la opción de activar la deduplicación global para ejercerla en:

  • WBS Airback®  y en el cliente (Repositorio y origen)
  • Solamente en WBS Airback®  (Repositorio)
  • O dejarla desactivada (no)


Figura 9: Deduplicación Global en los patrones de ficheros


Es importante resaltar que en los patrones de ficheros también se desactiva automáticamente la compresión, pues es una tarea que ya realiza el motor de deduplicación global tanto en el cliente como en el propio destino de almacenamiento. De activarla, perderíamos rendimiento y desperdiciaríamos recursos en la máquina que aloje al agente de backup.

6.6 Trabajos con Deduplicación Global

Una vez tenemos todos los elementos, es posible configurar cualquier job de un modo estándar y ejecutarlo por los medios habituales.

Un detalle que puede llamar la atención, es el tamaño** y velocidades obtenidas de un backup configurado para deduplicar en origen y en WBS Airback® . Si se consigue deduplicar ampliamente, veremos que los tamaños son muy pequeños, pero esto es normal, ya que, realmente, están viajando muy pocos datos por la red, y el valor que muestra la interfaz del listado de trabajos se corresponde con los datos enviados por el demonio File Daemon, situado en el cliente de backup.

 



Figura 10: Trabajos con Deduplicación Global


**Nota sobre tamaños: El tamaño del backup que se almacena en la BBDD es lo escrito por el FileDaemon, por lo tanto:

  • Si deduplicamos en origen y en destino: El tamaño será muy bajo si se deduplica mucho, pues pocos datos pasarán por la red
  • Si deduplicamos solo en origen: El tamaño será el total del backup, pues eso es lo que ha transferido el FileDaemon. Sobre ese dato, se aplica nuevamente deduplicación y compresión.
  • Metadatos: La ocupación del volumen de índices cuando deduplicamos sólo en destino, es mayor.

6.7 Monitorización con deduplicación global

En cualquier momento podremos consultar el estado del sistema de deduplicación y del almacenamiento asociado. Basta con acceder a la pantalla de 'Estado de Deduplicación Global':

 


Figura 11: Estado de Deduplicación Global


En esta sección podemos consultar los factores de deduplicación, el ahorro de espacio obtenido, la cantidad de memoria RAM y disco SSD recomendados para la situación actual de datos únicos, así como qué tipo de datos están utilizando el almacenamiento en cada momento.

Como se ha explicado en este documento, la deduplicación la lleva a cabo el demonio BACKUP-STORAGE. Por lo tanto, cada WBSAirback ® que utilice este tipo de deduplicación, mostrará sus propios datos en esta pantalla y serán únicos e intransferibles. En un entorno con varios WBS Airback®  interconectados: desde el Director veremos los datos de deduplicación del director y desde cada MediaServers, los correspondientes a la deduplicación efectiva en esos MediaServers.

También veremos cuándo se ejecutó por última vez el proceso de optimizado y cuanto tiempo le llevó. Si se encuentra en ejecución, es posible detenerlo. Si no se encuentra en ejecución, es posible lanzar forzosamente su ejecución. Este proceso se ejecuta en background y no interfiere con la ejecución de otros procesos de backup. Sin embargo, utiliza un pequeño porcentaje de CPU, Memoria y accesos a disco que va creciendo a medida que aumentan los datos presentes en el sistema. Por este motivo, se recomienda que se lance en horas de poca actividad del equipo.

Una característica importante del sistema de Deduplicación Global y el proceso de optimizado, es la referente a la reutilización de espacio. Aquellos bloques que han sido optimizados por el proceso de optimización, no se muestran libres al sistema de ficheros, pero realmente serán reutilizados en el futuro. Desde esta pantalla podremos apreciar qué cantidades de espacio están en ese estado (etiqueta 'Reutilizable').

6.8 Alertas

Si el sistema detecta que los datos únicos gestionados superan la memoria RAM recomendada, se envía una alerta a la dirección configurada para este fin con el siguiente asunto:

GLOBAL DEDUPLICATION Unique data limit reached

En caso de experimentar esta alerta, es muy importante revisar el dimensionamiento del proyecto. Pues un equipo por encima de sus capacidades de gestión, puede ocasionar grandes problemas en cuanto a rendimiento y estabilidad.

Adicionalmente, se monitorizan los siguientes indicadores:

  • Errores en carga de tabla de índices en memoria
  • Errores en tabla de deduplicación
  • Errores en proceso de optimizado
  • Tamaño de tabla de índice muy cerca del tamaño configurado
  • Tamaño de mínimo de tabla de índices en memoria menor del recomendado en base a número de hashes

Cualquier anomalía que se detecte en cuanto a la lista anterior. activará la alerta:

GLOBAL DEDUPLICATION Engine

7 Rehidratación de datos en Restauraciones

Con la característica de rehidratación de datos de un cliente de backup, es posible acelerar las restauraciones de clientes con poco ancho de banda sin suponer ningún inconveniente adiciona en la fase de backup. Cuando esta característica está activada, un cliente intentará reconstruir los datos de una restauración a partir de los datos locales. Aquellos datos que no pudiese reconstruir, serían solicitados a WBS Airback®  de la misma forma que en una restauración estándar.

Para activar esta característica es necesario añadir el siguiente parámetro en el fichero de configuración bacula-fd.conf

bacula-fd.conf
FileDaemon {
...
  Enable Client Rehydration = yes
...
}

Nota: Además de la posible ganancia de velocidad, la única diferencia apreciable en la interfaz de WBS Airback®  en cuanto a una restauración sin esta directiva es un menor 'Transfer rate', indicando que se transfirieron menos datos, a pesar de que el total de datos es el mismo que sin la directiva.

8 Estudio de rendimiento

A continuación, a modo de ejemplo de funcionamiento, se muestran los datos recogidos en un entorno de pruebas con datos productivos. Las características del entorno son las siguientes:

  • El conjunto de datos de backup estudiado está formado por 16 máquinas virtuales y un sistema Windows.
  • Todos los backups en todas las iteraciones han sido backups Full
  • El equipo WBS Airback®  objeto del análisis, no realizaba otros backups durante las pruebas.
  • Los vCenter cliente utilizados durante las pruebas, al ser elementos en producción, sí atendían de forma simultánea a otros entornos de backup (además de las propias operaciones de su funcionamiento diario). Por lo tanto, los datos de los tiempos recogidos no pueden ser interpretados de una forma literal para sacar conclusiones, pues este factor variable tiene un gran impacto sobre tiempo y velocidad de backup.
  • Los equipos que se copian se encuentran en uso, por lo que podemos asumir un 5% de cambio diario en ellos
  • Se ha hecho backup diariamente durante 12 días. En las tablas se muestran los datos de forma evolutiva que se obtuvieron los días 1, 3, 6, 9 y 12.

8.1 Indicadores de almacenamiento y memoria

 x1x3x6x9x12
Factor deduplicación1.07x3.12x5.7x9.25x12.2x
Factor compresión1.64x1.66x1.68x1.64x1.64x
Factor ahorro1.75x5.18x9.55x15.2x20.03x

     
Datos únicos
875 GB896.1 GB911.2 GB963.3 GB988.4 GB
Ocupación teórica1.54 TB4.64 TB8.7 TB14.64 TB18.8 TB
Datos ahorrados696.41 GB3.77 TB7.81 TB13.7 TB17.81 TB

     
Duración de proceso de optimizado177s339s623s1228x1447s

     
Volumen Datos4 GB12.38 GB24.21 GB40.29 GB48.2 GB
Almacén Datos Deduplicación0.8 TB0.82 TB0.83 TB0.85 TB0.86 TB
Ocupación Física Datos Agregado (sin metadatos)
823 GB848 GB873 GB910 GB931 GB
Almacén MetaDatos Deduplicación1,76 GB1.80 GB1.84 GB1.87 GB1.94 GB

     
Conjunto VM4 GB12 GB24 GB40 GB48 GB
Conjunto Windows297 MB894 MB1 GB2 GB3 GB

 

Con estos datos podemos apreciar que los datos se consiguen deduplicar en un porcentaje cercano al 100% en cada una de las iteraciones. Cada iteración adicional, a pesar de los casi 2TB de datos originales, no incrementa la cantidad de datos únicos.

**Nota: La diferencia entre los 2TB originales de backup y la ocupación teórica de la primera iteración de 1.54TB, se debe al proceso de compresión en cliente que realiza la Deduplicación Global. Al igual que cuando activamos compresión LZO o GZIP en los patrones de ficheros con configuraciones sin deduplicación, la información llega comprimida a WBS Airback® , por lo que su tamaño es menor. Una vez en el destino, se le aplica el proceso de deduplicación y compresión global LZ4, ganando nuevamente espacio.

8.1 Indicadores de tamaño y tiempo de backup

 Tipo Nivel Tamaño inicialTiempo Equipo ZFS
Tiempo Dedup Global
backup01Máquina VirtualFull166 GB1h 34m 46s2h 11m 7s
backup02Máquina VirtualFull32 GB33m 21s44m 5s
backup03Máquina VirtualFull20 GB36m 9s32m 27s
backup04Máquina VirtualFull100 GB1h 17m 43s2h 2m 52s
backup05Máquina VirtualFull74.47 GB41m 4s1h 56m 14s
backup06Máquina VirtualFull16 GB9m 20s25m 6s
backup07Máquina VirtualFull16 GB13m 14s13m 51s
backup08Máquina VirtualFull64 GB1h 14m 58s1h 20m 3s
backup09Máquina VirtualFull790 GB9h 10m 28s10h 51m 14s
backup10Máquina VirtualFull250 GB5h 32m 14s4h 31m 25s
backup11Máquina VirtualFull64 GB1h 3m 22s1h 1m 3s
backup12Máquina VirtualFull200 GB5h 25m 37s5h 19m 18s
backup13Máquina VirtualFull7.54 GB11m 21s11m 25s
backup14Máquina VirtualFull40 GB22m 16s22m 10d
backup15Máquina VirtualFull90 GB1h 4s1h 40s
backup16Máquina VirtualFull16 GB14m 6s13m 32s
backup17Windows FileSystemFull24.44 GB2h 23m 12s2h 17m 26s
      
17 Fuentes de backup  1.924 TB31h 43m 15s35h 13m 8s

 

En los tiempos de backup, vemos diversas fluctuaciones: algunos necesitan más tiempo, mientras que otros necesitan menos. En conjunto, el backup de todo el conjunto de datos, lleva más tiempo con Deduplicación Global que con Deduplicación ZFS.

Sin embargo, hemos de tener en consideración el punto comentado de que el vCenter está en producción. En los propios tiempos de ZFS estudiados, existen también grandes fluctuaciones. Este factor y el hecho de que la diferencia global no sea muy significativa, nos hacen concluir que para backups de máquinas virtuales no tenemos ganancia o pérdida de tiempo con respecto a deduplicación ZFS y la situación se mantiene dentro de unos parámetros muy similares

  • No labels