Caja de arena de datos

Definición: ¿Qué significa Data Sandbox?

Un espacio aislado de datos, en el contexto de big data, es una plataforma escalable y de desarrollo que se utiliza para explorar los ricos conjuntos de información de una organización a través de la interacción y la colaboración. Permite que una empresa se dé cuenta de su valor real de inversión en big data.

Un espacio aislado de datos es explorado principalmente por equipos de ciencia de datos que obtienen plataformas de espacio aislado de datamarts analíticos independientes o particiones lógicas en almacenes de datos empresariales.

Las plataformas de espacio aislado de datos proporcionan la informática necesaria para que los científicos de datos aborden cargas de trabajo analíticas típicamente complejas.

Techinfo explica Data Sandbox

Una caja de arena de datos incluye unidades masivas de procesamiento central paralelo, memoria de alta gama, almacenamiento de alta capacidad y capacidad de E / S y generalmente separa los entornos de base de datos de producción y experimentación de datos en los almacenes de datos.

IBM Netezza 1000 es un ejemplo de una plataforma de espacio aislado de datos que es una despensa de datos analítica independiente. Un ejemplo de una partición lógica en un almacén de datos empresarial, que también sirve como plataforma de espacio aislado de datos, es IBM Smart Analytics System.

Un clúster de Hadoop como IBM InfoSphere BigInsights Enterprise Edition también se incluye en esta categoría.

Esta definición fue escrita en el contexto de Big Data