Filtrado heurístico

Definición: ¿Qué significa filtrado heurístico?

El filtrado heurístico se refiere al uso de varios algoritmos y recursos para examinar texto o contenido de formas específicas. La palabra heurística describe un tipo de análisis que se basa en la experiencia o en criterios intuitivos específicos, en lugar de simples métricas técnicas. El uso de algoritmos de alto nivel permite el análisis heurístico del contenido, donde los humanos pueden programar computadoras para pensar de ciertas maneras en lugar de simplemente aplicar un análisis puramente cuantitativo.

El filtrado heurístico se usa más ampliamente en Internet para filtrar el correo electrónico y el acceso a la Web.

Techinfo explica el filtrado heurístico

Un tipo común de filtrado heurístico se denomina filtrado bayesiano. Esto se aplica comúnmente al filtrado de correo no deseado. El filtrado bayesiano ayuda a una computadora a reconocer ciertas palabras y la probabilidad de que estén relacionadas con el spam. En general, técnicas como esta implican entrenar a la máquina para que aplique un análisis de contenido de alto nivel con el fin de filtrar el spam.

Cualquiera que tenga un servicio de correo electrónico público con una carpeta de spam probablemente haya visto algún tipo de filtrado de spam heurístico en funcionamiento. Dado que el spam sigue siendo un desafío importante en la comunicación por correo electrónico, los expertos en tecnología están tratando de encontrar formas más diversas de identificar el spam. Las alternativas al filtrado heurístico de spam incluyen listas negras de IP y filtrado de URL, que utilizan direcciones IP y otra información en lugar de intentar identificar el spam a través del análisis de contenido. Los críticos del filtrado heurístico de spam argumentan que un filtro basado en la asociación de palabras no siempre es del todo eficaz para separar el spam del correo electrónico legítimo.