Definición: ¿Qué significa Conjunto de prueba?
Un conjunto de pruebas en el aprendizaje automático es un conjunto de datos secundario (o terciario) que se usa para probar un programa de aprendizaje automático después de haber sido entrenado en un conjunto de datos de entrenamiento inicial. La idea es que los modelos predictivos siempre tienen algún tipo de capacidad desconocida que debe probarse, en lugar de analizarse desde una perspectiva de programación.
Un conjunto de prueba también se conoce como conjunto de datos de prueba o datos de prueba.
Techinfo explica el conjunto de pruebas
Muchos expertos dirían que una mejor práctica es tener un conjunto de datos de prueba que se “secuestra” o se mantiene hasta el final del proceso. Los ingenieros buscan un ajuste excesivo del modelo y otros problemas en el proceso de capacitación. Idealmente, hay un tercer conjunto, un conjunto de datos de validación, que prueba los parámetros del clasificador. Entonces, y solo entonces, se puede sacar el conjunto de prueba para ver qué tan bien se entrenó el programa y si su modelo predictivo es preciso en nuevos datos. Aunque algunos modelos pueden evitar por completo la creación de un conjunto de pruebas particionado, esto a menudo se considera miope, porque la falta de pruebas prácticas puede hacer que un programa sea propenso a la inexactitud.