Definición - ¿Qué significa la media estadística?
La media estadística es un cierto tipo de promedio matemático que es muy útil en informática, y en el aprendizaje automático en particular.
Simplemente hablando, la media estadística es un proceso de media aritmética, ya que suma todos los números en un conjunto de datos y luego divide el total por el número de puntos de datos.
Eso es simple y directo, por lo que la media aritmética o media estadística se ha utilizado ampliamente a lo largo de la era moderna y en la era de la programación informática.
Aquí, podemos diferenciar la media estadística de otros dos tipos de medias que componen un grupo de tres métodos estadísticos llamados medias pitagóricas. Los otros dos medios se denominan medios armónicos y geométricos.
Los tres pueden ser útiles en el aprendizaje automático y en nuevos tipos de ingeniería de algoritmos de inteligencia artificial.
Techinfo explica la media estadística
En general, la media estadística es útil en todo tipo de tareas de clasificación y apoyo a la toma de decisiones del aprendizaje automático.
Piénselo de esta manera: el programa traza todos los puntos de datos y luego usa la media estadística para llegar a un promedio, que usa para ayudar a la computadora a aprender a través de sus procesos de aprendizaje automático.
La media armónica y la media geométrica algo más complejas también se pueden utilizar en el aprendizaje automático para cosas específicas.
Por ejemplo, la media armónica se utiliza a menudo para derivar una "puntuación F" que ayuda a evaluar la recuperación de datos en un sistema en particular.
Volviendo a la media estadística, suponga que tiene cinco puntos de datos y el total es 25. Su media estadística sería cinco, pero no está muy seguro de cuál es cada uno de esos cinco números. Podrías tener tres unos, un dos y un veinte, o podrías tener cinco cincos perfectamente simétricos.
Tiene un conjunto de datos como el primer ejemplo mencionado anteriormente, donde la media estadística se sesga un poco. Es posible que tenga un conjunto de datos con los siguientes cinco números: dos, tres, seis, siete y 38.
El total es 56, pero solo uno de esos números está por encima de la media estadística, lo cual es un poco engañoso.
Aquí es donde los ingenieros de aprendizaje automático hablan sobre el sesgo y cómo diferentes tipos de medios y promedios pueden mostrar sesgo en un programa de aprendizaje automático.
Sin ser demasiado complejos, los ingenieros pueden prever este tipo de sesgos haciendo algoritmos aún más elaborados y cuestionando o verificando o reevaluando los datos de clasificación.
El modelo de bosque aleatorio es una de esas técnicas en las que, en lugar de un solo conjunto de datos, diferentes sistemas conocidos como "árboles" individuales capturan una variedad de conjuntos de datos y tabulan los resultados colectivamente.
La conclusión es que la media estadística, como tipo básico de media aritmética, es muy útil para proporcionar esas simplificaciones en las que se ejecutan los algoritmos de aprendizaje automático.
Si tiene un diagrama de dispersión de datos y desea filtrarlo en una perspectiva fácilmente digerible, como lo hacen muchos tableros comerciales, la media estadística es una excelente manera de ayudar a facilitar esto.
Muchos de los detalles adicionales sobre los medios estadísticos y otros promedios a menudo son analizados minuciosamente por matemáticos profesionales e ingenieros de algoritmos.
Una media aritmética se calcula utilizando la siguiente ecuación: