Datos semiestructurados

Definición: ¿Qué significa Datos semiestructurados?

Los datos semiestructurados son datos que no son datos sin procesar ni datos escritos en un sistema de base de datos convencional. Son datos estructurados, pero no están organizados en un modelo racional, como una tabla o un gráfico basado en objetos. Una gran cantidad de datos que se encuentran en la Web se pueden describir como semiestructurados. La integración de datos hace uso especialmente de datos semiestructurados.

Techinfo explica los datos semiestructurados

Algunos ejemplos de datos semiestructurados serían archivos BibTex o un documento de lenguaje de marcado generalizado estándar (SGML). Los archivos que están semiestructurados pueden contener datos racionales compuestos por registros, pero esos datos pueden no estar organizados en una estructura reconocible. Algunos campos pueden faltar o contener información que no se puede describir fácilmente en un sistema de base de datos.

En los datos semiestructurados, la información contenida en los datos normalmente se asocia con un esquema de base de datos. Es por eso que la información a veces se denomina autodescripción.