Tablas de frecuencia bidimensionales (1ºBach)

De Wikipedia

Tabla de contenidos

Tablas de correlación

Al igual que se hacía con las variables unidimensionales, que cuando el número de valores observados de la variable era grande, en vez de enumerarlos se construía una tabla de frecuencias, cuando trabajamos con variables bidimensionales, si el número de pares (x,y) observados es grande, en vez de enumerarlos se recurre a una tabla de frecuencias de doble entrada en la que cada celda contiene el número de veces que se observa cada pareja de valores (x,y).

Consideremos una población de \;N individuos sobre los que medimos conjuntamente dos variables, \;X e \;Y. Para cada individuo tendremos un par de valores observados (x_i, y_i), i = 1, ..., N\;. Al igual que en el caso unidimensional, debemos buscar una forma organizada de presentar las observaciones.

Supongamos que la variable \;X presenta \;n valores distintos, \;x_1, ..., x_n, y la variable \;Y presenta \;m valores distintos, \;y_1, ..., y_m. Sea f_{ij}\; la frecuencia absoluta del par (x_i, y_j)\;, es decir, el número de individuos que presentan el valor x_i\; en el caracter \;X e y_j\; en el caracter \;Y. La tabla de correlación se construye colocando estas frecuencias en una tabla de doble entrada llamada tabla de correlación.

\begin{matrix} \; & X \\ Y & \; \end{matrix}x_1\;x_2\;...\;x_i\;...\;x_n\;f_{\bullet j}
y_1\;f_{11}\;f_{21}\;...\;f_{i1}\;...\;f_{n1}\;f_{\bullet 1}
y_2\;f_{12}\;f_{22}\;...\;f_{i2}\;...\;f_{n2}\;f_{\bullet 2}
...\; ...\;...\;...\;...\;...\;...\;...\;
y_j\; f_{1j}\;f_{2j}\;...\;f_{ij}\;...\;f_{nj}\;f_{\bullet j}
...\;...\;...\;...\;...\;...\;...\;...\;
y_m\; f_{1m}\;f_{2m}\;...\;f_{im}\;...\;f_{nm}\;f_{\bullet m}
f_{i \bullet}\; f_{1 \bullet}\;f_{2 \bullet}\;...\;f_{i \bullet}\;...\;f_{n \bullet}\;N\;

Distribuciones marginales

Se llama distribución marginal de la variable X\;, a la distribución unidimensional formada por los valores f_{i \bullet}\; que se obtiene al sumar para cada valor x_i, i = 1, ..., n\; toda la columna de frecuencias f_{i j}\;, es decir, es la formada a partir de los valores a última fila de la tabla anterior. Análogamente, la distribución marginal de la variable Y\; es la distribución unidimensional formada por los valores f_{\bullet j}\; que se obtiene al sumar para cada valor y_j, j = 1, ..., m\; toda la fila de frecuencias f_{i j}\;, es decir, es la formada a partir de la última columna de la tabla anterior.

Frecuencias marginales

Se llaman frecuencias marginales de la variable X\; a los valores:

f_{i \bullet}=\sum_{j=1}^m f_{i j} para i = 1, ..., n\;.

Analogamente tenemos las frecuencias marginales de Y\;, que son los valores:

f_{\bullet j}=\sum_{i=1}^n f_{i j} para j = 1, ..., m\;.

Media y desviación típica de las distribuciones marginales

ejercicio

Media de las distribuciones marginales


La media de la distribución marginal de X\; viene dada por:

\overline{x}=\frac{\sum_{i=1}^n f_{i \bullet} x_i}{N\;}

y la de Y\; por:

\overline{y}=\frac{\sum_{j=1}^m f_{\bullet j} y_j}{N\;}

ejercicio

Desviación típica de las distribuciones marginales


La desviación típica de la distribución marginal de X\; viene dada por:

\sigma_x=\sqrt{\frac{\sum_{i=1}^n f_{i \bullet} (x_i-\overline{x})^2}{N\;}}

y la de Y\; por:

\sigma_y=\sqrt{\frac{\sum_{j=1}^m f_{\bullet j} (y_j-\overline{y})^2}{N\;}}


Videotutoriales

Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda