Definición: ¿Qué significa Sistema de indexación web simple para humanos (SWISH)?
El Sistema de indexación web simple para humanos (SWISH) es una herramienta de código abierto para indexar páginas web y otros documentos, incluidos texto, HTML y XML.
SWISH se utiliza cuando hay una gran cantidad de documentos, incluidas páginas web y otros documentos, que deben indexarse. La herramienta tiene la capacidad de indexar correos electrónicos, PDF, HTML, XML, Microsoft Word / Powerpoint / Excel, texto plano simple y cualquier otro tipo de archivo que se pueda convertir a texto XML o HTML.
Techinfo explica el sistema de indexación web simple para humanos (SWISH)
El sistema de indexación web simple para humanos mejorado (SWISH-e) es el descendiente de SWISH. SWISH fue desarrollado por Kevin Hughes en 1994 y finalmente fue relanzado bajo licencia pública general como SWISH-E en 1996.
Las características de SWISH incluyen:
- Se puede utilizar con bases de datos relacionales como MySQL para búsquedas rápidas de texto completo.
- Viene con una araña web para indexar documentos remotos a través de HTTP.
- Admite búsqueda difusa, búsqueda de frases y búsqueda de comodines
- Puede devolver resúmenes de documentos con cada búsqueda.
- Tiene la capacidad de limitar las búsquedas a una determinada parte del documento o elementos HTML y XML específicos.
- Puede informarle de cualquier error estructural en sus documentos XML y HTML.
- El archivo de índice se puede migrar de una plataforma a otra; es independiente de la plataforma.