Medida de la correlación (1ºBach)
De Wikipedia
Revisión de 16:33 17 oct 2014 Coordinador (Discusión | contribuciones) ← Ir a diferencia anterior |
Revisión de 16:51 17 oct 2014 Coordinador (Discusión | contribuciones) (→Centro de gravedad de una distribución bidimensional) Ir a siguiente diferencia → |
||
Línea 7: | Línea 7: | ||
En el apartado anterior hemos visto de manera intuitiva como puede ser la correlación ente dos variables dependiendo del agrupamiento de los puntos de la nube en torno a una recta. Ahora vamos a ver cómo se puede cuantificar dicha correlación mediante un parámetro que denominaremos coeficiente de correlación. | En el apartado anterior hemos visto de manera intuitiva como puede ser la correlación ente dos variables dependiendo del agrupamiento de los puntos de la nube en torno a una recta. Ahora vamos a ver cómo se puede cuantificar dicha correlación mediante un parámetro que denominaremos coeficiente de correlación. | ||
- | ==Centro de gravedad de una distribución bidimensional== | + | Dada una distribución bidimensional de cuyas variables <math>\;(X,Y)</math> tenemos <math>\;n</math> valores observados: |
- | {{Caja Amarilla|texto=Dada una distribución bidimensional de cuyas variables <math>\;(X,Y)</math> tenemos n valores observados: | + | |
{{p}} | {{p}} | ||
<center><math>\{ \,(x_1, y_1), (x_2,y_2),...,(x_n,y_n) \,\}</math></center> | <center><math>\{ \,(x_1, y_1), (x_2,y_2),...,(x_n,y_n) \,\}</math></center> | ||
{{p}} | {{p}} | ||
- | llamaremos '''centro de gravedad''' de la distribución al punto <math>(\overline{x} , \overline{y})</math> cuyas coordenadas son las medias de las distribuciones unidimensionales de X e Y: | + | ==Centro de gravedad de una distribución bidimensional== |
+ | {{Caja Amarilla|texto= | ||
+ | {{p}} | ||
+ | Llamaremos '''centro de gravedad''' de la distribución al punto <math>(\overline{x} , \overline{y})</math> cuyas coordenadas son las medias de las distribuciones unidimensionales de X e Y: | ||
{{p}} | {{p}} | ||
<center><math>\overline{x}=\frac{\sum_{i=1}^n x_i}{n} \qquad \overline{y}=\frac{\sum_{i=1}^n y_i}{n}</math></center> | <center><math>\overline{x}=\frac{\sum_{i=1}^n x_i}{n} \qquad \overline{y}=\frac{\sum_{i=1}^n y_i}{n}</math></center> | ||
+ | }} | ||
+ | {{p}} | ||
+ | ==Covarianza== | ||
+ | {{Caja Amarilla|texto=Se llama '''covarianza''' de la distribución al parámetro: | ||
+ | {{p}} | ||
+ | <center><math>\sigma_{xy}=\frac{\sum_{i=1}^n (x_i-\overline{x})((y_i-\overline{y})}{n}=\frac{\sum_{i=1}^n x_i y_i}{n}-\overline{x} \overline{y}</math></center> | ||
+ | }} | ||
+ | {{p}} | ||
+ | ==Correlación== | ||
+ | {{Caja Amarilla|texto=La '''correlación''' entre las dos variables viene dada por el parámetro: | ||
+ | {{p}} | ||
+ | <center><math>r= \frac{\sigma_{xy}}{\sigma_x \sigma_y}</math></center> | ||
+ | {{p}} | ||
+ | donde <math>\sigma_{xy}</math> es la covarianza y <math>\sigma_x , \sigma_y</math> son las desviaciones típicas de las distribuciones unidimensionales de X e Y: | ||
+ | {{p}} | ||
+ | <center><math>\sigma_x=\sqrt{\frac{\sum_{i=1}^n x_i^2}{n}-\overline{x}^2} \qquad \sigma_y=\sqrt{\frac{\sum_{i=1}^n y_i^2}{n}-\overline{y}^2}</math></center> | ||
}} | }} | ||
{{p}} | {{p}} |
Revisión de 16:51 17 oct 2014
Enlaces internos | Para repasar o ampliar | Enlaces externos |
Indice Descartes Manual Casio | WIRIS Geogebra Calculadoras |
En el apartado anterior hemos visto de manera intuitiva como puede ser la correlación ente dos variables dependiendo del agrupamiento de los puntos de la nube en torno a una recta. Ahora vamos a ver cómo se puede cuantificar dicha correlación mediante un parámetro que denominaremos coeficiente de correlación.
Dada una distribución bidimensional de cuyas variables tenemos
valores observados:

Centro de gravedad de una distribución bidimensional
Llamaremos centro de gravedad de la distribución al punto cuyas coordenadas son las medias de las distribuciones unidimensionales de X e Y:

Covarianza
Se llama covarianza de la distribución al parámetro:

Correlación
La correlación entre las dos variables viene dada por el parámetro:

donde σxy es la covarianza y σx,σy son las desviaciones típicas de las distribuciones unidimensionales de X e Y:
