Definición: ¿Qué significa Sistema de archivos de Google (GFS)?
El sistema de archivos de Google (GFS) es un sistema de archivos distribuido (DFS) escalable creado por Google Inc. y desarrollado para adaptarse a los requisitos de procesamiento de datos en expansión de Google. GFS proporciona tolerancia a fallas, confiabilidad, escalabilidad, disponibilidad y rendimiento a grandes redes y nodos conectados. GFS se compone de varios sistemas de almacenamiento construidos a partir de componentes de hardware básicos de bajo costo. Está optimizado para adaptarse a las diferentes necesidades de almacenamiento y uso de datos de Google, como su motor de búsqueda, que genera enormes cantidades de datos que deben almacenarse.
El sistema de archivos de Google aprovechó la solidez de los servidores estándar y minimizó las debilidades del hardware.
GFS también se conoce como GoogleFS.
Techinfo explica el sistema de archivos de Google (GFS)
El clúster de nodos GFS es un único maestro con varios servidores de fragmentos a los que diferentes sistemas cliente acceden continuamente. Los servidores de fragmentos almacenan datos como archivos de Linux en discos locales. Los datos almacenados se dividen en grandes porciones (64 MB), que se replican en la red un mínimo de tres veces. El gran tamaño del fragmento reduce la sobrecarga de la red.
GFS está diseñado para adaptarse a los requisitos de grandes clústeres de Google sin sobrecargar las aplicaciones. Los archivos se almacenan en directorios jerárquicos identificados por nombres de ruta. Los metadatos, como el espacio de nombres, los datos de control de acceso y la información de mapeo, son controlados por el maestro, que interactúa con las actualizaciones de estado de cada servidor de fragmentos y las monitorea a través de mensajes cronometrados.
Las características de GFS incluyen:
- Tolerancia a fallos
- Replicación de datos críticos
- Recuperación de datos automática y eficiente
- Alto rendimiento agregado
- Reducción de la interacción entre el cliente y el maestro debido al gran tamaño del servidor.
- Gestión y bloqueo de espacios de nombres
- Alta disponibilidad
Los clústeres de GFS más grandes tienen más de 1,000 nodos con una capacidad de almacenamiento en disco de 300 TB. Cientos de clientes pueden acceder a él de forma continua.