Definición: ¿Qué significa Big Data?
Big data se refiere a un proceso que se utiliza cuando las técnicas tradicionales de extracción y manejo de datos no pueden descubrir la información y el significado de los datos subyacentes. Los datos que no están estructurados, son sensibles al tiempo o simplemente son muy grandes no pueden ser procesados por motores de bases de datos relacionales. Este tipo de datos requiere un enfoque de procesamiento diferente llamado big data, que utiliza un paralelismo masivo en hardware fácilmente disponible.
Techinfo explica Big Data
En pocas palabras, los macrodatos reflejan el mundo cambiante en el que vivimos. Cuanto más cambian las cosas, más se capturan y registran como datos. Tomemos el clima como ejemplo. Para un pronosticador del tiempo, la cantidad de datos recopilados en todo el mundo sobre las condiciones locales es sustancial. Lógicamente, tendría sentido que los entornos locales dicten los efectos regionales y los efectos regionales dicten los efectos globales, pero bien podría ser al revés. De una forma u otra, estos datos meteorológicos reflejan los atributos de big data, donde se necesita el procesamiento en tiempo real para una gran cantidad de datos y donde la gran cantidad de entradas pueden ser generadas por máquinas, observaciones personales o fuerzas externas como manchas solares.
El procesamiento de información como esta ilustra por qué el big data se ha vuelto tan importante:
- La mayoría de los datos recopilados ahora no están estructurados y requieren un almacenamiento y procesamiento diferente al que se encuentra en las bases de datos relacionales tradicionales.
- La potencia computacional disponible se está disparando, lo que significa que hay más oportunidades para procesar big data.
- Internet ha democratizado los datos, aumentando constantemente los datos disponibles al mismo tiempo que produce más y más datos sin procesar.
Los datos en su forma sin procesar no tienen valor. Los datos deben procesarse para que sean valiosos. Sin embargo, aquí radica el problema inherente del big data. ¿Vale la pena el enorme costo de capital de procesar datos desde un formato de objeto nativo para obtener información útil? ¿O hay demasiados datos con valores desconocidos para justificar la apuesta de procesarlos con herramientas de big data? La mayoría de nosotros estaríamos de acuerdo en que ser capaz de predecir el clima tendría valor, la pregunta es si ese valor podría superar los costos de procesar todos los datos en tiempo real en un informe meteorológico en el que se pueda contar.