Rectas de regresión (1ºBach)

De Wikipedia

Recta de regresión de Y sobre X

Consideremos una variable bidimensional \;(X,Y) y una serie de valores observados \;(x_i,y_i) que representamos en el plano mediante una nube de puntos. Buscamos la recta que mejor se ajuste a la nube. Para ello utilizaremos el método de mínimos cuadrados que consiste en quedarse con aquella recta que cumpla que "la suma de los cuadrados de las distancias de todos los puntos a la recta sea mínima". Así se obtiene:

ejercicio

Recta de regresión de Y sobre X


La recta de regresión de Y sobre X viene dada por la ecuación:

y = \bar{y} + \frac{\sigma_{xy}}{\sigma_{x}^2}(x - \bar{x})

Es una recta que pasa por el centro de gravedad de la nube (\bar{x},\bar{y}) y cuya pendiente, m_{xy} = \frac{\sigma_{xy}}{\sigma_{x}^2}, recibe el nombre de coeficiente de regresión.

Nota: El coeficiente de regresión y el de correlación coinciden en signo. No obstante, no existe otra relación entre ambos coeficientes ya que, por ejemplo, la pendiente de la recta puede ser grande pero la correlación entre las variables ser baja.

Estimaciones usando la recta de regresión

  • Llamaremos valor estimado de y\, correspondiente a un valor dado x=x_0\,, al valor de y\, que se obtiene al sustituir en la recta de regresión la x\, por x_0\,. Lo representaremos por \hat {y}(x_0)\,
  • Llamaremos valor estimado de x\, correspondiente a un valor dado y=y_0\,, al valor de x\, que se obtiene al sustituir en la recta de regresión la y\, por y_0\,. Lo representaremos por \hat {x}(y_0)\,

Algunas consideraciones:

  • No olvidemos que éstos son valores estimados, es decir, que tienen una cierta probabilidad de que tomen ese valor.
  • Estas estimaciones funcionan mejor cuando los valores de |r| \, son próximos a 1 y cuando los valores de x\, o de y\, son próximos o están dentro del intervalo de los puntos de la nube.

ejercicio

Actividad Interactiva: Recta de regresión de distribuciones bidimensionales. Estimación


a) La siguiente escena muestra una nube de puntos y una tabla con las notas obtenidas por 12 alumnos en las asignaturas de Lengua Española (X) y Literatura (Y).
  • Mueve los puntos de la nube y observa como afecta a la correlación.
  • Puedes ver la recta de regresión o el centro de gravedad marcando las casillas correspondientes.
  • También podrás estimar los valores de las variables marcando la casilla correspondiente.
b) Puedes añadir o quitar puntos de la tabla y adaptar la escena para otras variables bidimensionales que quieras:

  • Por ejemplo, puedes cambiar los valores de las notas para adaptarlo al ejercicio de las notas de Matemáticas y Física de 13 alumnos de una clase visto anteriormente:
(X,Y)=(Matemáticas,Física)={(3,2),(2,2),(5,6),(1,3),(7,6),(6,8),(2,4),(4,4),(8,10),(9,6),(5,7),(10,9),(7,7)}

  • O al ejemplo del jugador de golf que da 10 golpes desde diferentes distancias, siendo X la distancia en metros e Y el número de hoyos obtenidos:
(X,Y)=(Distancia, Hoyos)={(1,10),(2,10),(4,8),(6,7),(8,6),(10,3),(12,4),(15,3),(18,1),(20,0)}

Apéndice

Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda