Medida de la correlación (1ºBach)

De Wikipedia

Tabla de contenidos

En el apartado anterior hemos visto de manera intuitiva como puede ser la correlación ente dos variables dependiendo del agrupamiento de los puntos de la nube en torno a una recta. Ahora vamos a ver cómo se puede cuantificar dicha correlación mediante un parámetro que denominaremos coeficiente de correlación.

En lo que sigue, consideraremos una distribución bidimensional de cuyas variables \;(X,Y) tenemos \;n valores observados:

\{ \,(x_1, y_1), (x_2,y_2),...,(x_n,y_n) \,\}

Centro de gravedad de una distribución bidimensional

Llamaremos centro de gravedad de la distribución al punto (\overline{x} , \overline{y}) cuyas coordenadas son las medias de las distribuciones unidimensionales de X e Y:

\overline{x}=\frac{\sum_{i=1}^n x_i}{n} \qquad  \overline{y}=\frac{\sum_{i=1}^n y_i}{n}

Covarianza

Se llama covarianza de la distribución al parámetro:

\sigma_{xy}=\frac{\sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{n}=\frac{\sum_{i=1}^n x_i y_i}{n}-\overline{x} \cdot \overline{y}

Coeficiente de correlación

Llamaremos coeficiente de correlación entre las dos variables al parámetro:

r= \frac{\sigma_{xy}}{\sigma_x \sigma_y}

donde σxy es la covarianza y σxy son las desviaciones típicas de las distribuciones unidimensionales de X e Y:

\sigma_x=\sqrt{\frac{\sum_{i=1}^n x_i^2}{n}-\overline{x}^2} \qquad \sigma_y=\sqrt{\frac{\sum_{i=1}^n y_i^2}{n}-\overline{y}^2}

Propiedades del coeficiente de correlación

El coeficiente de correlación tiene las siguientes propiedades:

  • No tiene dimensiones, es decir, no depende de las unidades en las que vengan dadas las variables.
  • Está comprendido entre -1 y 1: |r| \le 1
  • Cuanto más fuerte sea la correlación más próximo a 1 estará |r| \, y cuanto más débil sea la correlación más próximo a 0 estará |r| \,.
  • Si |r|>0 \, la correlación será positiva y si |r|<0 \, la correlación será negativa.

Calculadora

Calculadora

Calculadora: Modo Regresión Lineal (REG / Lin)


Para calcular los parámetros de distribuciones bidimensionales primero deberemos establecer en la calculadora el modo "Regresión Lineal" mediante la secuencia de teclas:

Mode Mode 2 \quad 1

Calculadora

Calculadora: Modo básico (COMP)


Cuando se desea retornar la calculadora al modo "básico" tras haber trabajado en otro modo (p.e. el modo "Regresión Lineal") deberemos teclear la secuencia:

Mode 1 \, Igual

Calculadora

Calculadora: Borrado de la memoria estadística (SCL: Statistical Clear)


Para trabajar con variables estadísticas bidimensionales primero deberemos borrar los posibles datos estadísticos que hubiese en memoria mediante la secuencia de teclas:

Shift Mode 1 \, Igual

Calculadora

Calculadora: Introducción de los datos para el estudio de una distribución bidimensional


Primero deberemos establecer el modo (REG / Lin) y borrar la memoria (SCL) como se ha explicado más arriba.

Para introducir una lista de pares (x,y)\, correspondientes a los datos de una variable bidimensional, introduciremos primero el valor x \, seguido de la tecla Coma separadora, seguido del valor y \, y terminando con la tecla DATA.

A continuación repetiríamos el proceso con los siguientes pares de números. Si algún par se repite un número n \, de veces, después del valor y \, y antes de pulsar DATA, deberemos teclear Shift Punto y coma separador seguido de la frecuencia n \,.

Calculadora

Calculadora: Obtención de los parámetros estadísticos en de una distribución bidimensional


Suponiendo que ya hemos introducido los datos de una distribución bidimensional (X,Y):

a) Para obtener \overline {x} (media de la variable unidimensional X) teclearemos Shift S-VAR 1 \, Igual
b) Para obtener \overline {y} (media de la variable unidimensional Y) teclearemos Shift S-VAR (cursor derecha) 1 \, Igual
c) Para obtener \sigma_{x}\, (desviación típica de la variable unidimensional X) teclearemos Shift S-VAR 2 \, Igual
d) Para obtener \sigma_{y}\, (desviación típica de la variable unidimensional Y) teclearemos Shift S-VAR (cursor derecha) 2 \, Igual
e) Para obtener \sum {xy} (suma de los productos) teclearemos Shift S-SUM (cursor derecha) 3 \, Igual
f) Para obtener n \, (número de datos observados) teclearemos Shift S-SUM 3 \, Igual
g) Para obtener r \, (coeficiente de correlación) teclearemos Shift S-VAR (cursor derecha 2 veces) 3 \, Igual
Nota: La covarianza \sigma_{xy}\, no se puede obtener directamente de la calculadora, hay que obtenerla a partir de la fórmula \sigma_{xy}=\frac{\sum{xy}}{n}-\overline{x} \cdot \overline{y}
Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda