Tolerancia a fallos

Definición: ¿Qué significa tolerancia a fallas?

La tolerancia a fallas es la forma en que un sistema operativo (SO) responde a una falla de hardware o software. El término se refiere esencialmente a la capacidad de un sistema para permitir fallas o mal funcionamiento, y esta capacidad puede ser proporcionada por software, hardware o una combinación de ambos. Para manejar las fallas con elegancia, algunos sistemas informáticos tienen dos o más sistemas duplicados.

Techinfo explica la tolerancia a fallas

El software de tolerancia a fallas puede ser parte de la interfaz del sistema operativo, lo que permite al programador verificar datos críticos en puntos específicos durante una transacción.

La tolerancia a fallas puede incluir:

  • Responder a un corte de energía (el nivel más bajo de tolerancia a fallas)
  • Uso inmediato de un sistema de respaldo en caso de falla del sistema
  • Permitir que los discos reflejados sustituyan inmediatamente a un disco defectuoso
  • Varios procesadores trabajan juntos y comparan datos y resultados en busca de errores, y luego corrigen inmediatamente los errores detectados.

En general, nunca se puede lograr una tolerancia a fallas del 100% debido a restricciones de costos.