Definición - ¿Qué significa sobreajuste?
En estadística y aprendizaje automático, el sobreajuste ocurre cuando un modelo intenta predecir una tendencia en los datos que es demasiado ruidosa. El sobreajuste es el resultado de un modelo demasiado complejo con demasiados parámetros. Un modelo que está sobreajustado es inexacto porque la tendencia no refleja la realidad de los datos.
Techinfo explica el sobreajuste
Un modelo sobreajustado es un modelo con una línea de tendencia que refleja los errores en los datos con los que se entrena, en lugar de predecir con precisión los datos invisibles. Esto se ve mejor visualmente con un gráfico de puntos de datos y una línea de tendencia. Un modelo sobreajustado muestra una curva con puntos más altos y más bajos, mientras que un modelo correctamente ajustado muestra una curva suave o una regresión lineal.
El principal problema del sobreajuste es que el modelo ha memorizado de forma eficaz los puntos de datos existentes en lugar de intentar predecir qué tan invisibles serían los puntos de datos.
El sobreajuste suele deberse a un número excesivo de puntos de entrenamiento. Hay una serie de técnicas que los investigadores de aprendizaje automático pueden utilizar para mitigar el sobreajuste, incluida la validación cruzada, la regularización, la detención temprana, la poda, los antecedentes bayesianos, la deserción y la comparación de modelos.