Tablas de datos

De Wikipedia

Tablas de frecuencias

Empezaremos dando la definición de los distintos tipos de frecuencia:

  • Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por f_i\; (algunos autores la representan por n_i\;). La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N\;.
  • Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por F_i\; (algunos autores la representan por N_i\;).
  • Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos, N\;. Se representa por h_i\; (algunos autores la representan por f_i\;). Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica.
  • Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por H_i\; (algunos autores la representan por F_i\;).

Las tablas de frecuencias son utilizadas para organizar los datos de un estudio estadístico.

Una tabla de frecuencias es una tabla de doble entrada en la que los posibles valores de la variable del estudio se representan en la primera columna. Las frecuencias absolutas, relativas y acumuladas se representan en las diferentes columnas. A veces se añade otras dos columnas con las frecuencias relativas expresadas en %.

Tipos de tablas de frecuencias

Según el número de observaciones y según el recorrido de la variable estadística (mayor valor menos el menor valor), tenemos los siguientes tipos de tablas de frecuencias:

  • Tipo I (datos no agrupados): Cuando el tamaño de la muestra y el recorrido de la variable son pequeños (por ejemplo, si tenemos una muestra de las edades de 5 personas), por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas.

  • Tipo II (datos agrupados puntualmente): Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable que se repiten.

  • Tipo III (datos agrupados en intervalos): Se utilizan cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que se hace necesario agrupar los valores de la variable en intervalos, también llamados clases. También es obligatorio usarla cuando la variable sea cuantitativa continua.
    • El número de clases a considerar (c) es conveniente que oscile entre 6 y 15. Tomar pocos intervalos implica que la "pérdida de información" sea mayor. También suele usarse la fórmula de Sturges: c=1+log_2 \, N,  donde N es el número de datos. Este valor se redondeará al entero más próximo.
    • Los intervalos serán siempre cerrados por la izquierda y abiertos por la derecha: [L_i, L_s)\;
    • Los extremos de cada intervalo se denominan límites de clase.
    • La amplitud de cada intervalo se denomina la amplitud de la clase. Si elegimos la misma para todos los intervalos deberá ser igual al cociente ente el rango (R) y el número de intervalos de clase (c): A=\cfrac{R}{c}.
    • Las marcas de clase, x_i\;, son los puntos medios de cada intervalo y son los valores que representan a cada intervalo para el cálculo de algunos parámetros.
    • Ver información más detallada en: Tabla de distribución de frecuencias.

Actividades

Nota: Como habrás podido observar, en las dos últimas actividades anteriores sólo se han visto variables cuantitativas. Esto se debe a que si la variable no es numérica, ni cualitativa ordenable, únicamente tendría sentido construir en la tabla las columnas de frecuencias absolutas y relativas, pero no las acumuladas.

ejercicio

Ejercicios propuestos


A partir de las dos actividades anteriores realiza los siguientes ejercicios:

Ejercicio 1:

a) ¿Qué significado tiene cada uno de los valores de la frecuencia absoluta acumulada?
b) ¿Tiene sentido esta columna si no están ordenados los valores de la variable?

Ejercicio 2:

a) Modifica los valores de la variable pero no los de las frecuencias. ¿Influye en el resto de la tabla?
b) Modifica ahora los valores de las frecuencias y observa como varía las demás columnas (puedes incluir más valores de la variable).
c) ¿Cuál es la última frecuencia absoluta acumulada? ¿Por qué?
d) ¿Cuál es la última frecuencia relativa acumulada? ¿Por qué?
e) ¿Cómo se puede obtener el porcentaje de individuos que presentan cada uno de los valores de la variable?
Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda