Datos no estructurados

Definición: ¿Qué significa Datos no estructurados?

Los datos no estructurados representan cualquier dato que no tenga una estructura reconocible. Es desorganizado y sin formato y puede ser textual o no textual. Por ejemplo, el correo electrónico es una excelente ilustración de datos textuales no estructurados. Incluye la hora, la fecha, los detalles y el asunto del destinatario y del remitente, etc., pero el cuerpo de un correo electrónico permanece sin estructura. Los datos no estructurados también se pueden identificar como datos poco estructurados, en los que las fuentes de datos incluyen una estructura, pero no todos los datos de un conjunto de datos siguen la misma estructura.

En las empresas centradas en el cliente, los datos que se encuentran en forma no estructurada pueden examinarse para mejorar el marketing relacional y la gestión de relaciones con el cliente (CRM). A medida que las aplicaciones de redes sociales, como Facebook y Twitter, se generalizan, es probable que el desarrollo de datos no estructurados supere el progreso de los datos estructurados.

Techinfo explica los datos no estructurados

Los datos no estructurados se refieren a datos que siguen un formulario menos ordenado que elementos como páginas de hojas de cálculo, tablas de bases de datos u otros conjuntos de datos lineales u ordenados. De hecho, el término "conjunto de datos" es útil porque está asociado con datos que están en arreglos ordenados y accesibles, sin ningún contenido adicional, y que están vinculados o etiquetados en una estructura específica.

Otras instancias de datos textuales no estructurados incluyen documentos de Word, presentaciones de PowerPoint, mensajes instantáneos, software de colaboración, documentos, libros, publicaciones en redes sociales y registros médicos. Los datos no estructurados no textuales generalmente se crean en medios, como archivos de audio MP3, imágenes JPEG y archivos de video Flash, etc.

Los datos no estructurados generalmente no incluyen un modelo de datos predefinido y es posible que no coincidan bien con las tablas relacionales. Los datos no estructurados suelen tener mucho texto. Sin embargo, puede incluir números y fechas, así como hechos. Esto conduce a ambigüedades que son difíciles de identificar utilizando programas de software convencionales.

El almacenamiento de grandes volúmenes de datos no estructurados generados dentro de una empresa, si se administra de manera deficiente, puede generar mayores gastos. Los datos en documentos impresos o en formato electrónico deben escanearse para que una aplicación de búsqueda analice ideas, dependiendo de las palabras utilizadas en ciertos contextos. Esto se conoce como búsqueda empresarial o semántica.