Definición: ¿Qué significa Schema on Read?
Schema on read se refiere a una estrategia innovadora de análisis de datos en nuevas herramientas de manejo de datos como Hadoop y otras tecnologías de bases de datos más involucradas. En el esquema de lectura, los datos se aplican a un plan o esquema a medida que se extraen de una ubicación almacenada, en lugar de a medida que ingresan.
Techinfo explica Schema en lectura
Las tecnologías de bases de datos más antiguas tenían una estrategia de aplicación de esquema en escritura; en otras palabras, los datos tenían que aplicarse a un plan o esquema cuando iban a la base de datos. Esto se hizo en parte para reforzar la coherencia de los datos, y ese es uno de los principales beneficios del esquema en escritura. Con el esquema en lectura, las personas que manejan los datos pueden necesitar hacer más trabajo para identificar cada pieza de datos, pero hay mucha más versatilidad.
De manera fundamental, el diseño de esquema en lectura complementa los principales usos de Hadoop y herramientas relacionadas. Las empresas quieren agregar una gran cantidad de datos de manera efectiva y almacenarlos para usos particulares. Dicho esto, es posible que valoren la recopilación de datos sucios o inconsistentes más de lo que valoran un régimen estricto de aplicación de datos. En otras palabras, Hadoop puede adaptarse a la obtención de una amplia gama de pequeños bits de datos diferentes que pueden no estar completamente organizados. Luego, a medida que se usa esa información, se organiza. La aplicación del antiguo sistema de esquema en escritura de la base de datos significaría que probablemente se descartarían los datos menos organizados.
Otra forma de expresar esto es que el esquema en escritura es mejor para obtener conjuntos de datos muy limpios y consistentes, pero esos conjuntos de datos pueden ser más limitados. Schema on read proyecta una red más amplia y permite una organización de datos más versátil. Los expertos también señalan que es más fácil crear dos vistas diferentes de los mismos datos con el esquema en lectura.
Esta estrategia de esquema en lectura es una parte esencial de por qué Hadoop y las tecnologías relacionadas son tan populares en la tecnología empresarial actual. Las empresas están utilizando grandes cantidades de datos sin procesar para impulsar todo tipo de procesos comerciales mediante la aplicación de lógica difusa y otros sistemas de clasificación y filtrado que involucran almacenes de datos corporativos y otros grandes activos de datos.