Parámetros estadísticos
De Wikipedia
Enlaces internos | Para repasar | Para ampliar | Enlaces externos |
Indice Descartes Manual Casio | Estadística (SM) | WIRIS Geogebra Calculadora |
Tabla de contenidos |
Parámetros estadísticos
Después de haber representado los datos gráficamente, ahora llega el momento de hacer un estudio de los mismos. Si estamos estudiando la estatura de todos los alumnos y alumnas del instituto y necesitamos dar información de este estudio, parece lógico dar un dato que conocemos todos como media y que representa la estatura de todo el alumnado estudiado. Además de este dato existen otros datos (que llamaremos parámetros) que van a representar a toda la población o que nos van a informar sobre la población.
Parámetros estadísticos: Son datos que resumen el estudio realizado en la población. Pueden ser de dos tipos:
- Parámetros de centralización. Son datos que representan de forma global a toda la población. Entre ellos vamos a estudiar la media aritmética, la moda y la mediana.
- Parámetros de dispersión. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización. Por ejemplo el recorrido, la varianza y la desviación típica.
Parámetros de centralización
Moda
Se define la moda como el valor de la variable que más se repite, es el decir, aquél que tiene mayor frecuencia absoluta. Se representa por Mo.
Actividad Interactiva: Moda
Actividad 1. Variable discreta.
Actividad: Calcula en tu cuaderno la moda para el ejemplo número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Una vez que la tienes en tu cuaderno, calcúlala con la escena y compara los resultados. |
Actividad: Moda Actividad 1:
|
Moda correspondiente a una muestra:
- Definición.
- Ejemplos.
Cálculo de la moda para datos sin agrupar.
Cálculo de la moda para datos agrupados con o sin intervalos.
Media aritmética
Se define la media aritmética como la suma de todos los datos dividida por el número de datos. Se representa por .
Para calcular la media aritmética hacemos:
donde .
Sin embargo, podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. Por tanto, podemos simplificar el cálculo de la media aritmética con la fórmula:
Si la variable es continua, el cálculo se hace de la misma forma pero utilizando como xi las marcas de clase: los valores centrales de cada intervalo o la media aritmética de los extremos de cada intervalo.
Actividad Interactiva: Media aritmética
Actividad 1. Variable discreta.
Actividad: Calcula en tu cuaderno la media para el ejemplo número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Una vez que la tienes en tu cuaderno, calcúlala con la escena y compara los resultados.
Actividad 2. Variable continua.
Actividad: Calcula en tu cuaderno el histograma para el ejemplo del número de la estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66, según hayas agrupados los datos en intervalos. Una vez que lo tienes en tu cuaderno, calcúlala con la escena y compara los resultados. |
Actividades: Media Aritmética Actividad 1:
Actividad 2:
|
Media aritmética con datos agrupados o no agrupados.
Cálculo de la media para datos no agrupados.
Cálculo de la media para datos agrupados con o sin intervalos.
Mediana
Si ordenamos todos los valores de la variable de menor a mayor, se define la mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si hay un número impar de valores, habrá un sólo valor central; mientras que si hay un número par de valores habrá dos valores centrales.
Actividad Interactiva: Mediana
Actividad 1. Variable discreta.
Actividad: Calcula en tu cuaderno la mediana para el ejemplo número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Una vez que la tienes en tu cuaderno, calcúlala con la escena y compara los resultados. |
Actividad: Mediana Actividad 1:
|
Mediana correspondiente a una muestra:
- Definición.
- Ejemplos.
Cálculo de la mediana para datos no agrupados. Ejemplos.
Cálculo de la mediana para datos no agrupados. Ejemplos.
Cálculo de la mediana para datos agrupados sin intervalos. Ejemplos.
Cálculo de la mediana para datos agrupados en intervalos. Ejemplos.
Actividades
Cálculo de la moda y la media para datos agrupados con o sin intervalos.
Cálculo de la media, mediana y moda para datos no agrupados.
Cálculo de la media, mediana y moda para datos agrupados en intervalos.
Parámetros de centralización.
Parámetros de dispersión
Recorrido
Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. Se representa por R. Nos indica un intervalo en el que están comprendido todos los datos.
Varianza y desviación típica
Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media. Es decir:
Se calcula más facilmente, con la siguiente fórmula equivalente:
Si la variable es continua, el cálculo se hace de la misma forma pero utilizando como xi las marcas de clase: los valores centrales de cada intervalo o la media aritmética de los extremos de cada intervalo.
Actividades
Actividad Interactiva: Varianza y desviación típica
Actividad 1. Variable discreta.
Actividad: Calcula en tu cuaderno la varianza y desviación típica para el ejemplo número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. Una vez que la tienes en tu cuaderno, calcúlala con la escena y compara los resultados.
Actividad 2. Variable continua.
Actividad: Calcula en tu cuaderno el la varianza y desviación típica para el ejemplo del número de la estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66, según hayas agrupados los datos en intervalos. Una vez que lo tienes en tu cuaderno, calcúlala con la escena y compara los resultados. |
Actividades Actividad 1:
Actividad 2:
|
Cálculo de la vararianza y de la desviación típica. Ejemplos.
Cálculo de la vararianza y de la desviación típica. Ejemplos.
Ejemplo de cálculo de los parámetros estadísticos a partir de la tabla de frecuencias.
Interpretación conjunta de la media y la desviación típica
De todas los parámetros estudiados, los más significativos son la media para las medidas de centralización y la desviación típica para las medidas de dispersión.
Vamos a hacer un estudio conjunto de ambas para entender mejor su significado.
La media aritmética es el centro de gravedad de la distribución estadística. Si nos imaginamos el diagrama de barras o el histograma de frecuencias apoyado en un punto del eje horizontal de forma que quedase en equilibrio, el valor de este punto en dicho eje sería el valor de la media.
Como ya hemos comentado, no es suficiente con un parámetro de centralización, es necesario un parámetro de dispersión que nos indique si los datos estudiados están más concentrados o más dispersos. Y este parámetro de dispersión va a ser la desviación típica. Lógicamente si los datos están más concentrados la desviación típica será menor, y si los datos están más dispersos la desviación típica será mayor.
Actividad Interactiva: Interpretación conjunta de la media y la desviación
Actividad 1. Significado de la media y la desviación.
Actividad: Representa, en la escena, el diagrama de barras para el ejemplo del número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2. |
Actividades: Significado de la media y la desviación Actividad 1: Modifica los valores de las frecuencias, y si quieres introduce más valores de la variable, hasta que el número de datos sea, por ejemplo, N=100. Construye ejemplos con las siguientes características: a) Dale a todas las frecuencias el mismo valor (el que quieras). ¿Cuánto vale la media? ¿Es lógico este resultado? ¿Cuánto vale la desviación típica? b) Ve disminuyendo en varios pasos las frecuencias de los valores centrales y aumentando por igual las frecuencias de los valores extremos, sin que varíe la media ni el número de datos. ¿Qué ocurre con la desviación típica? ¿Por qué sucede esto? c) Realiza ahora el procedimiento inverso, ve aumentando en varios pasos las frecuencias de los valores centrales y disminuyendo por igual las frecuencias de los valores extremos, sin que varíe la media ni el número de datos. ¿Qué ocurre con la desviación típica? ¿Por qué sucede esto? d) ¿Cómo será una variable estadística con desviación típica igual a 0? ¿Compruébalo en la escena? |
Coeficiente de variación. Si hemos realizado un estudio estadístico en dos poblaciones diferentes, y queremos comparar resultados, no podemos acudir a la desviación típica para ver la mayor o menor homogeneidad de los datos, sino a otro parámetro nuevo, llamado coeficiente de variación y que se define como el cociente entre la desviación típica y la media.
En una exposición de ganado estudiamos un conjunto de vacas con una media de 500 kilos y una desviación típica de 50 kilos. Y observamos también un conjunto de perros con una media de 40 kilos y una desviación típica de 10 kilos. ¿Qué grupo de animales es más homogéneo?
Solución:
Un razonamiento falso sería decir que el conjunto de perros es más homogéneo porque su desviación típica es más pequeña, pero si calculamos el coeficiente de variación para ambos:
Por tanto, es más homogéneo el conjunto de las vacas.
Ejercicios
Tutorial que explican los parámetros de dispersión: rango, desviación media, desviación típica o estándar y el coeficiente de variación.
Tutorial que explica los parámetros de centralización (moda, mediana, media) y de dispersión (rango, desviación media, desviación típica, coeficiente de variación), mediante un sencillo ejercicio de los personajes de los Simpson. En este ejercicio aparecen pocos en la muestra por lo que se utiliza la definición de cada uno de los parámetros para su cálculo sin necesidad de recurrir a una tabla de frecuencias ni a complejas fórmulas.