Deduplicación de datos

Definición: ¿Qué significa la deduplicación de datos?

La deduplicación de datos es una técnica de compresión de datos en la que las copias repetidas o redundantes de datos se eliminan de un sistema. Se implementa en los mecanismos de respaldo de datos y datos de red y permite el almacenamiento de una instancia única de datos dentro de una base de datos o sistema de información (SI).

La deduplicación de datos también se conoce como compresión inteligente, almacenamiento de instancia única, factorización de elementos comunes o reducción de datos.

Techinfo explica la deduplicación de datos

La deduplicación de datos funciona analizando y comparando segmentos de datos entrantes con datos almacenados previamente. Si los datos ya están presentes, los algoritmos de deduplicación de datos descartan los nuevos datos y crean una referencia. Por ejemplo, si se realiza una copia de seguridad de un archivo de documento con cambios, el archivo anterior y los cambios aplicados se agregan al segmento de datos. Sin embargo, si no hay diferencia, el archivo de datos más reciente se descarta y se crea una referencia. De manera similar, un algoritmo de deduplicación de datos escanea los datos salientes en una conexión de red para buscar duplicados, que se eliminan para aumentar la velocidad de transferencia de datos.