Discusión:Parámetros estadísticos

De Wikipedia

(Diferencia entre revisiones)

Revisión de 18:13 20 jun 2007

Después de haber representado los datos gráficamente, ahora llega el momento de hacer un estudio de los mismos. Si estamos estudiando la estatura de todos los alumnos y alumnas del instituto y necesitamos dar información de este estudio, parece lógico dar un dato que conocemos todos como media y que representa la estatura de todo el alumnado estudiado. Además de este dato existen otros datos (que llamaremos parámetros) que van a representar a toda la población o que nos van a informar sobre la población.

Parámetros estadísticos. Son datos que resumen el estudio realizado en la población. Pueden ser de dos tipos:

Parámetros de centralización. Son datos que representan de forma global a toda la población. Entre ellos vamos a estudiar la media aritmética, la moda y la mediana.
Parámetros de dispersión. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización. Por ejemplo el recorrido, la varianza y la desviación típica.

Tabla de contenidos

Parámetros de centralización

Media aritmética

Se define la media aritmética como la suma de todos los datos dividida por el número de datos. Se representa por \bar x\.

Para calcular la media aritmética hacemos:

\bar x\ = \frac{x_1 + x_2 + ....+x_N} {N}={\sum_{i=1}^N x_i \over N} donde N = nº total de individuos= \sum_{i=1}^N f_i
Sin embargo, podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. Por tanto, podemos simplificar el cálculo de la media aritmética con la fórmula:
\bar x\ = \frac{x_1.f_1 + x_2.f_2 + ....+x_N.f_N} {N}={\sum_{i=1}^N x_i.f_i \over N}
Si la variable es continua, el cálculo se hace de la misma forma pero utilizando como xi las marcas de clase: los valores centrales de cada intervalo o la media aritmética de los extremos de cada intervalo.

ejercicio

Actividad Interactiva: Media aritmética


Actividad 1. Variable discreta.
Actividad 2. Variable continua.

Actividad 3:

a) Tanto en un caso como en otro modifica las frecuencias y observa como puede variar el valor de la media.

b) ¿Cuál es el menor valor que puede tomar la media? Justifica la respuesta.

c) ¿Cuál es el mayor valor que puede tomar la media? Justifica la respuesta.

Actividad 4:

En el caso de la estatura, se ha calculado la media utilizando intervalos, pero como tenemos pocos valores de la variable, calcúlala ahora utilizando la definición, es decir, suma todos las estaturas y divide el resultado por el número de alumnos y alumnas que hay. ¿Coincide el resultado? ¿Por qué ?

Moda

Se define la moda como el valor de la variable que más se repite, es el decir, aquél que tiene mayor frecuencia absoluta. Se representa por Mo.

ejercicio

Actividad Interactiva: Moda


Actividad 1. Variable discreta.

Actividad 2:

a) Modifica las frecuencias y observa como puede variar el valor de la moda.

b) ¿Puede una distribución estadística tener más de una moda? ¿Pueden ser todos los valores de la variable?

Mediana

Si ordenamos todos los valores de la variable de menor a mayor, se define la mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si hay un número impar de valores, habrá un sólo valor central; mientras que si hay un número par de valores habrá dos valores centrales.

ejercicio

Actividad Interactiva: Mediana


Actividad 1. Variable discreta.

Actividad 2:

a) Modifica las frecuencias y observa como puede variar el valor de la mediana.

b) ¿Cuál es el valor menor que puede tomar? ¿Y el mayor?

Parámetros de dispersión

Recorrido

Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. Se representa por R. Nos indica un intervalo en el que están comprendido todos los datos.

Varianza y desviación típica

Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media. Es decir:

\sigma^2\ = \frac{(x_1 - \bar x)^2.f_i + (x_2 - \bar x)^2.f_i + ....+(x_N - \bar x)^2.f_i} {N}={\sum_{i=1}^N (x_i - \bar x)^2.f_i \over N}

Se calcula más facilmente, con la siguiente fórmula equivalente:

\sigma^2\ = {\sum_{i=1}^N x_i^2.f_i \over N} - \bar x^2
Se define la desviación típica como la raíz cuadrada positiva de la varianza.

Si la variable es continua, el cálculo se hace de la misma forma pero utilizando como xi las marcas de clase: los valores centrales de cada intervalo o la media aritmética de los extremos de cada intervalo.

ejercicio

Actividad Interactiva: Varianza y desviación típica


Actividad 1. Variable discreta.
Actividad 2. Variable continua.

Actividad 3: ¿Qué fórmula para la varianza te parece más fácil? Indica las ventajas e inconvenientes de cada una.

Actividad 4: a) Tanto en un caso como en otro modifica las frecuencias y observa como puede variar el valor de la desviación típica.

b) ¿Cuál es el menor valor que puede tomar la desviación típica? Intenta construir un caso con desviación típica igual a 0. Justifica la respuesta.

c) ¿Cuál es el mayor valor que puede tomar la desviación media? Justifica la respuesta.

d) ¿Cómo hay que modificar las frecuencias para que aumente la desviación típica?¿Y para que disminuya?

Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda