Distribuciones bidimensionales. Nubes de puntos. Correlación (1ºBach)

De Wikipedia

Distribuciones bidimensionales

Una distribución bidimensional o de dos variables es aquella en la que para cada elemento de la población o muestra se consideran dos caracteres cuantitativos distintos, \;(X,Y). Así, a cada individuo le corresponden los valores de dos variables que representamos mediante el par ordenado (x_i, y_i)\;, siendo x_i\; el valor del primer carácter e y_i\; el del segundo.

ejercicio

Ejemplos: Distribuciones bidimensionales


  • Notas obtenidas en las asignaturas de Matemáticas y Física por los alumnos de una clase.
(X,Y)=(Matemáticas,Física)={(3,2),(2,2),(5,6),(1,3),(7,6),(6,8),(2,4),(4,4),(8,10),(9,6),(5,7),(10,9),(7,7)}
  • Estatura y peso de los alumnos del instituto.
(X,Y)=(Estatura (cm),Peso (kg))={(1.65,62),(1.74,72),(1.57,60),(1.83,80),(1.77,67),(1.60,58),...}

Nube de puntos

Si representamos cada par (x_i, y_i)\; de valores de una distribución bidimensional como un punto del plano, obtendremos lo que se llama una nube de puntos o diagrama de dispersión. A partir de ella podemos observar como se relacionan las dos variables de forma intuitiva.

Nota: Si algún par de puntos se repite, el punto correspondiente de la nube se representará con mayor grosor, proporcional al número de repeticiones.

En el anterior ejemplo sobre las notas de Matemáticas y Física, teníamos la siguiente tabla de observaciones:

Matemáticas (X) 32517624895107
Física (Y)22636844106797

Su correspondiente nube de puntos será:

Correlación

A partir de la nube de puntos podemos observar como se relacionan las dos variables. Si al aumentar o disminuir una de ellas, aumenta o disminuye la otra de forma sistemática, diremos que existe correlación entre las dos variables.

La correlación puede ser:

  • Fuerte: Si hay mayor alineamiento de los puntos de la nube.
  • Débil: Si el alineamiento es menor, hay mas "dispersión" de los puntos.

La correlación (fuerte o débil), además puede ser:

  • Positiva: Si al aumentar X aumenta Y
  • Negativa: Si al aumentar X, disminuye Y

La correlación más o menos fuerte viene, por tanto, determinada por lo apretados que estén los puntos de la nube en torno a una recta que llamaremos recta de regresión. El signo de la pendiente de esta recta determina si la correlación es positiva (pendiente positiva) o negativa (pendiente negativa).

En el anterior ejemplo, las notas de Matemáticas y Física mantienen una correlación positiva ya que al aumentar las de Matemáticas, aumentan las de Física. Además es una correlación relativamente fuerte dado el alineamiento de los puntos.

wolfram

Actividad: Nube de puntos y recta de regresión de distribuciones bidimensionales


a) El ejemplo anterior de las notas de Matemáticas y Física.
(X,Y)=(Matemáticas,Física)={(3,2),(2,2),(5,6),(1,3),(7,6),(6,8),(2,4),(4,4),(8,10),(9,6),(5,7),(10,9),(7,7)}
b) Un jugador de golf da 10 golpes desde diferentes distancias. Sea X la distancia en metros e Y el número de hoyos obtenidos:
(X,Y)=(Distancia, Hoyos)={(1,10),(2,10),(4,8),(6,7),(8,6),(10,3),(12,4),(15,3),(18,1),(20,0)}

ejercicio

Actividad Interactiva: Nube de puntos y recta de regresión de distribuciones bidimensionales


La siguiente escena muestra una nube de puntos y una tabla con las notas obtenidas por 12 alumnos en las asignaturas de Lengua Española (X) y Literatura (Y).

Mueve los puntos de la nube y observa como afecta a la correlación. También puedes ver la recta de regresión marcando la casilla correspondiente.

Puedes añadir o quitar puntos de la tabla y adapatar la escena para otras variables bidimensionales que quieras. Puedes cambiar los valores de las notas para adaptarlo al ejemplo de las notas de Matemáticas y Física o al ejemplo del jugador de golf que vimos anteriormente.
Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda