Definición: ¿Qué significa la agrupación en clústeres de K-medias?
La agrupación de K-means es un algoritmo de aprendizaje simple sin supervisión que se utiliza para resolver problemas de agrupación. Sigue un procedimiento simple de clasificar un conjunto de datos dado en varios grupos, definidos por la letra "k", que se fija de antemano. Luego, los grupos se posicionan como puntos y todas las observaciones o puntos de datos se asocian con el grupo más cercano, se calculan, ajustan y luego el proceso comienza de nuevo utilizando los nuevos ajustes hasta que se alcanza el resultado deseado.
La agrupación de K-means tiene usos en motores de búsqueda, segmentación de mercado, estadísticas e incluso astronomía.
Techinfo explica la agrupación en clústeres de K-medias
La agrupación en clústeres de K-means es un método utilizado para el análisis de agrupaciones, especialmente en la minería de datos y las estadísticas. Su objetivo es dividir un conjunto de observaciones en varios grupos (k), lo que da como resultado la división de los datos en celdas de Voronoi. Puede considerarse un método para descubrir a qué grupo pertenece realmente un determinado objeto.
Se utiliza principalmente en estadística y se puede aplicar a casi cualquier rama de estudio. Por ejemplo, en marketing, se puede utilizar para agrupar diferentes datos demográficos de personas en grupos simples que faciliten la orientación a los especialistas en marketing. Los astrónomos lo utilizan para examinar grandes cantidades de datos astronómicos; dado que no pueden analizar cada objeto uno por uno, necesitan una forma de encontrar estadísticamente puntos de interés para la observación y la investigación.
El algoritmo:
- Los puntos K se colocan en el espacio de datos del objeto que representa el grupo inicial de centroides.
- Cada objeto o punto de datos se asigna al k más cercano.
- Una vez asignados todos los objetos, se recalculan las posiciones de los k centroides.
- Los pasos 2 y 3 se repiten hasta que las posiciones de los centroides ya no se mueven.