K-vecino más cercano (k-nn)

Definición: ¿Qué significa K-Vecino más cercano (K-NN)?

Un algoritmo k-vecino más cercano, a menudo abreviado k-nn, es un enfoque para la clasificación de datos que estima la probabilidad de que un punto de datos sea miembro de un grupo u otro dependiendo del grupo en el que se encuentren los puntos de datos más cercanos a él. .

El k-vecino más cercano es un ejemplo de un algoritmo de "aprendiz perezoso", lo que significa que no crea un modelo utilizando el conjunto de entrenamiento hasta que se realiza una consulta del conjunto de datos.

Techinfo explica K-Vecino más cercano (K-NN)

Un k-vecino más cercano es un algoritmo de clasificación de datos que intenta determinar en qué grupo se encuentra un punto de datos al observar los puntos de datos que lo rodean.

Un algoritmo, mirando un punto en una cuadrícula, tratando de determinar si un punto está en el grupo A o B, mira los estados de los puntos que están cerca de él. El rango se determina arbitrariamente, pero lo importante es tomar una muestra de los datos. Si la mayoría de los puntos están en el grupo A, entonces es probable que el punto de datos en cuestión sea A en lugar de B, y viceversa.

El k-vecino más cercano es un ejemplo de un algoritmo de "aprendiz perezoso" porque no genera un modelo del conjunto de datos de antemano. Los únicos cálculos que realiza son cuando se le pide que interrogue a los vecinos del punto de datos. Esto hace que k-nn sea muy fácil de implementar para la minería de datos.