Definición: ¿Qué significa tolerancia a fallas?
La tolerancia a fallas es la forma en que un sistema operativo (SO) responde a una falla de hardware o software. El término se refiere esencialmente a la capacidad de un sistema para permitir fallas o mal funcionamiento, y esta capacidad puede ser proporcionada por software, hardware o una combinación de ambos. Para manejar las fallas con elegancia, algunos sistemas informáticos tienen dos o más sistemas duplicados.
Techinfo explica la tolerancia a fallas
El software de tolerancia a fallas puede ser parte de la interfaz del sistema operativo, lo que permite al programador verificar datos críticos en puntos específicos durante una transacción.
La tolerancia a fallas puede incluir:
- Responder a un corte de energía (el nivel más bajo de tolerancia a fallas)
- Uso inmediato de un sistema de respaldo en caso de falla del sistema
- Permitir que los discos reflejados sustituyan inmediatamente a un disco defectuoso
- Varios procesadores trabajan juntos y comparan datos y resultados en busca de errores, y luego corrigen inmediatamente los errores detectados.
En general, nunca se puede lograr una tolerancia a fallas del 100% debido a restricciones de costos.