Minería web

Definición: ¿Qué significa Web Mining?

La minería web es el proceso de utilizar técnicas y algoritmos de minería de datos para extraer información directamente de la web extrayéndola de documentos y servicios web, contenido web, hipervínculos y registros del servidor. El objetivo de la minería web es buscar patrones en los datos web mediante la recopilación y el análisis de información para obtener información sobre las tendencias, la industria y los usuarios en general.

Techinfo explica la minería web

La minería web es una rama de la minería de datos que se concentra en la World Wide Web como la fuente de datos principal, incluidos todos sus componentes, desde el contenido web, los registros del servidor y todo lo demás. El contenido de los datos extraídos de la Web puede ser una colección de hechos que las páginas Web deben contener, y estos pueden consistir en texto, datos estructurados como listas y tablas, e incluso imágenes, video y audio.

Categorías de minería web:

  • Minería de contenido web: este es el proceso de extraer información útil del contenido de páginas web y documentos web, que son en su mayoría archivos de texto, imágenes y audio / video. Las técnicas utilizadas en esta disciplina se han extraído en gran medida del procesamiento del lenguaje natural (PNL) y la recuperación de información.
  • Minería de estructuras web: este es el proceso de analizar los nodos y la estructura de conexión de un sitio web mediante el uso de la teoría de grafos. Hay dos cosas que se pueden obtener de esto: la estructura de un sitio web en términos de cómo está conectado a otros sitios y la estructura del documento del sitio web en sí, en cuanto a cómo está conectada cada página.
  • Minería de uso web: este es el proceso de extraer patrones e información de los registros del servidor para obtener información sobre la actividad del usuario, incluido el origen de los usuarios, cuántos hicieron clic en qué elemento del sitio y los tipos de actividades que se realizan en el sitio.