Deduplicación posterior al procesamiento (ppd)

Definición: ¿Qué significa la deduplicación posterior al procesamiento (PPD)?

La deduplicación posterior al proceso (PPD) se refiere a un sistema en el que los procesos de software filtran datos redundantes de un conjunto de datos después de que se han transferido a una ubicación de almacenamiento de datos. Esto también se puede denominar deduplicación asincrónica y se usa a menudo cuando los administradores consideran que es ineficiente o inviable eliminar datos redundantes antes o durante la transferencia.

Techinfo explica la deduplicación de posprocesamiento (PPD)

La deduplicación posterior al proceso se puede contrastar con una práctica denominada deduplicación en línea, en la que los datos redundantes se eliminan a medida que los datos se transfieren para su almacenamiento. Una de las razones por las que los administradores pueden elegir un enfoque de deduplicación posterior al proceso es cuando la deduplicación en línea puede ralentizar el proceso de transferencia y dificultar el archivo de datos de manera fácil y eficiente.

Si bien a los gerentes o administradores les puede resultar más fácil utilizar un método de deduplicación posterior al proceso, este tipo de optimización de datos presenta inconvenientes. Uno es el hecho de que el destino de almacenamiento de datos deberá tener suficiente espacio para adaptarse al conjunto de datos sin filtrar más grande. Suponiendo que los administradores de datos tienen un amplio almacenamiento y que analizar los datos almacenados no presenta dificultades técnicas, el método de deduplicación posterior al proceso a menudo puede ser una forma deseable de limpiar un conjunto de datos para uso futuro después de que ya se haya guardado cuidadosamente en "almacenamiento en frio."