Definición: ¿Qué significa DataStage Parallel Extender (DataStage PX)?
DataStage Parallel Extender (DataStage PX) es una herramienta de integración de datos de IBM. Es una de las muchas herramientas de extracción, transformación y carga (ETL) ampliamente utilizadas en la industria del almacenamiento de datos. Esta herramienta puede recopilar información de fuentes heterogéneas, realizar transformaciones según las necesidades de una empresa y cargar los datos en los respectivos almacenes de datos.
DataStage PX también puede llamarse DataStage Enterprise Edition.
Techinfo explica DataStage Parallel Extender (DataStage PX)
DataStage Parallel Extender tiene una arquitectura paralela para procesar datos. Los dos tipos principales de paralelismo implementados en DataStage PX son el paralelismo de tuberías y particiones. La capacidad de procesar datos de forma paralela acelera el procesamiento de datos en gran medida.
DataStage Parallel Extender incorpora una variedad de etapas a través de las cuales los datos de origen se procesan y se refuerzan en las bases de datos de destino. Estos se definen en términos de terabytes. Además de las etapas, DataStage PX utiliza contenedores para reutilizar los componentes y las secuencias del trabajo para ejecutar y programar varios trabajos al mismo tiempo.
Las etapas más utilizadas en DataStage Parallel Extender incluyen:
- transformador
- Aggregator
- Conjunto de datos
- Copiar
- Aplicar cambio
- modificar
- Filtra
- Unirse
- ir
- Buscar