Definición: ¿Qué significa reducción de dimensionalidad?
La reducción de dimensionalidad es una serie de técnicas en aprendizaje automático y estadística para reducir la cantidad de variables aleatorias a considerar. Implica la selección de características y la extracción de características. La reducción de la dimensionalidad hace que el análisis de datos sea mucho más fácil y rápido para los algoritmos de aprendizaje automático sin variables extrañas para procesar, lo que hace que los algoritmos de aprendizaje automático sean más rápidos y sencillos a su vez.
Techinfo explica la reducción de dimensionalidad
La reducción de dimensionalidad intenta reducir el número de variables aleatorias en los datos. A menudo se utiliza un enfoque de K-vecinos más cercanos. Las técnicas de reducción de dimensionalidad se dividen en dos categorías principales: selección de características y extracción de características.
Las técnicas de selección de características encuentran un subconjunto más pequeño de un conjunto de datos de muchas dimensiones para crear un modelo de datos. Las principales estrategias para el conjunto de características son filtro, envoltorio (usando un modelo predictivo) e integrado, que realizan la selección de características mientras se construye un modelo.
La extracción de características implica transformar datos de alta dimensión en espacios de menos dimensiones. Los métodos incluyen análisis de componentes principales, kernel PCA, kernel PCA basado en gráficos, análisis discriminante lineal y análisis discriminante generalizado.