Definición: ¿Qué significa el repositorio de bases de datos?
Un repositorio de bases de datos es una agrupación lógica, pero a veces también física, de datos de bases de datos relacionadas pero separadas.
Esto se hace generalmente cuando hay un "propósito superior" para los datos, pero los elementos de datos necesarios para hacerlo residen en diferentes bases de datos. En estos casos, es necesario un repositorio para reunir los elementos de datos discretos y operar sobre ellos como uno solo.
Techinfo explica el repositorio de bases de datos
Los repositorios de bases de datos generalmente se analizan e implementan en el ámbito del almacenamiento de datos y la inteligencia empresarial. Por lo general, esto requiere un nivel de agregación de datos que las bases de datos de nivel inferior simplemente no pueden proporcionar, por lo que es necesaria la creación de una estructura de nivel superior.
Considere el caso de un gran banco. Tal institución probablemente estará compuesta por varias subsidiarias diferentes, no en un sentido físico, geográficamente diverso, sino más bien en un sentido funcional o de líneas de negocio. Habrá la división de cuentas bancarias tradicional, además de una división de préstamos, una división de forex y tesorería, una división de banca de inversión y una división de custodia / depósito seguro. Todas estas divisiones tienen sus propios sistemas de información separados, lo que por supuesto implica bases de datos separadas.
Sin embargo, cada división debe informar sus propias finanzas a la oficina central. El Director Financiero (CFO) necesita agregar todos los datos financieros de las distintas divisiones para medir su rentabilidad, porque estos se incorporan directamente a la posición financiera general del banco. Puede ver que la oficina del CFO no está realmente interesada en la parte operativa de las diversas bases de datos, solo está realmente interesada en los datos relacionados con las finanzas. Otra cosa a tener en cuenta es que confía completamente en los informes de las divisiones para informarle sobre qué decisiones tomar, no tiene datos propios ni genera datos por sí mismo.
Ingrese a un repositorio de datos. Es probable que este sea otro sistema con su propia base de datos, diferente de todos los demás, que pueda acceder directamente a los datos relevantes de las otras bases de datos y agregarlos en información significativa para el CFO. Sin embargo, es importante recordar que los datos y la información que el CFO está mirando pueden estar o no ubicados físicamente en el depósito de datos. El repositorio puede simplemente leer directamente de las otras bases de datos o, por razones de rendimiento, puede almacenar una copia local de los datos a los que ha accedido desde las demás. El repositorio probablemente incluirá la capacidad de mostrar tendencias de rendimiento a lo largo del tiempo, comparar y contrastar los objetivos de las divisiones, mostrar desviaciones a lo largo de períodos, etc. Algunos de estos objetivos están claramente en el contexto de Business Intelligence. Además, dado que nuestro CFO se cruza principalmente en los informes en lugar de la entrada y la generación de datos, su repositorio de datos probablemente será un sistema de solo lectura, o uno con escrituras mínimas, además de agregar datos que se remontan a un período prolongado. Esta función comienza a pasar al contexto del almacenamiento de datos.
Por lo tanto, un depósito de datos es la agregación lógica de elementos de datos de bases de datos independientes en una ubicación centralizada para un propósito específico que no se puede lograr utilizando las bases de datos en sí.