Sistema de indexación web simple para humanos (swish)

Definición: ¿Qué significa Sistema de indexación web simple para humanos (SWISH)?

El Sistema de indexación web simple para humanos (SWISH) es una herramienta de código abierto para indexar páginas web y otros documentos, incluidos texto, HTML y XML.

SWISH se utiliza cuando hay una gran cantidad de documentos, incluidas páginas web y otros documentos, que deben indexarse. La herramienta tiene la capacidad de indexar correos electrónicos, PDF, HTML, XML, Microsoft Word / Powerpoint / Excel, texto plano simple y cualquier otro tipo de archivo que se pueda convertir a texto XML o HTML.

Techinfo explica el sistema de indexación web simple para humanos (SWISH)

El sistema de indexación web simple para humanos mejorado (SWISH-e) es el descendiente de SWISH. SWISH fue desarrollado por Kevin Hughes en 1994 y finalmente fue relanzado bajo licencia pública general como SWISH-E en 1996.

Las características de SWISH incluyen:

  • Se puede utilizar con bases de datos relacionales como MySQL para búsquedas rápidas de texto completo.
  • Viene con una araña web para indexar documentos remotos a través de HTTP.
  • Admite búsqueda difusa, búsqueda de frases y búsqueda de comodines
  • Puede devolver resúmenes de documentos con cada búsqueda.
  • Tiene la capacidad de limitar las búsquedas a una determinada parte del documento o elementos HTML y XML específicos.
  • Puede informarle de cualquier error estructural en sus documentos XML y HTML.
  • El archivo de índice se puede migrar de una plataforma a otra; es independiente de la plataforma.