Análisis descriptivo

De Wikipedia

Tabla de contenidos

[esconder]

Tablas estadísticas

Son utilizadas para organizar los datos. Según el número de observaciones y según el recorrido de la variable estadística, tenemos los siguientes tipos de tablas estadísticas:

Tablas Tipo I

Cuando el tamaño de la muestra y el recorrido (mayor valor menos el valor menor) de la variable son pequeños, por ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas.

Edad de los 5 miembros de una familia:

5, 8, 16, 38, 45

Tablas Tipo II

Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable que se repiten.

Por ejemplo, si preguntamos el número de personas activas que hay en 50 familias obtenemos la siguiente tabla:

Personas Activas en 50 familias

2122124211
2321113422
2212111322
3231242141
1343222133

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:


Personas activasNúmero de familias
116
220
39
45
total50

Tablas Tipo III

Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será necesario agrupar en intervalos los valores de la variable. Tambien obligatorio usarla cuando la variable sea cuantitativa continua.

Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento tienen ahorrado, nos encontramos con los siguientes datos:


450115225030017580252680605785
15952300500012001005180200675500
37515002059851851253154255601100


La variable estadística tiene un recorrido muy grande, (Mayor valor - Menor valor = 5000 - 5 = 4995), por lo que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir ¿cuántos intervalos queremos?. Normalmente se suele trabajar con no más de 10 o 12 intervalos.


Amplitud\ de\ cada\ intervalo=\cfrac {Recorrido} {Num.\ de\ intervalos}


Amplitud =\cfrac{4995}{10} = 499,5

Por lo que tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:

Tomar pocos intervalos implica que la "pérdida de información" sea mayor.

Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha [Li-1 , Li).

Con estas recomendaciones tendremos la siguiente tabla:


IntervaloNº alumnos
[0,500)16
[500,1000)6
[1000,1500)3
[1500,2000)2
[2000,2500)1
[2500,3000)1
[3000,3500)0
[3500,4000)0
[4000,4500)0
[4500,5000)0
[5000,5500)1

Tablas de frecuencias

Ahora iremos añadiendo más columnas según los cálculos y la información que necesitemos. Podemos ir completando la tabla con las frecuencias, que definimos a continuación:

  • Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por fi. En algunos libros de texto nos la encontraremos representada por ni.
  • Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por Fi.
  • Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos (N). Se representa por hi. En algunos libros de texto nos la encontraremos representada por ri. Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica.
  • Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por Hi.

En las siguientes escenas puedes construir la tabla de frecuencias para variables discretas y continuas.

Actividades

ejercicio

Actividad Interactiva: Tablas de frecuencias


1. Variable cuantitativa discreta.
2. Variable cuantitativa continua.

Como puedes observar no se han tenido en cuenta las variables cualitativas. Esto se debe a que al no trabajar con números no se pueden hacer operaciones. Únicamente tendría sentido en la tabla construir las columnas de frecuencias absolutas y relativas, pero no las acumuladas. En el siguiente apartado de gráficos estadísticos también se podrían representar, pero para los apartados de cálculo de parámetros no podremos trabajar con ellas. si tienes interés en alguna representación, sustituye los valores la variable por los números que quieras y represéntalas o construye la tabla

ejercicio

Actividades


Actividad 1:
a) ¿Qué significado tiene cada uno de los valores de la frecuencia absoluta acumulada?
b) ¿Tiene sentido esta columna si no están ordenados los valores de la variable?
c) ¿Tendría sentido la tabla para una variable cualitativa?

Actividad 2:
a) Modifica los valores de la variable pero no los de las frecuencias. ¿Influye en el resto de la tabla?
b) Modifica ahora los valores de las frecuencias y observa como varía las demás columnas (puedes incluir más valores de la variable). ¿Cuál es la última frecuencia absoluta acumulada? ¿Por qué?
c) ¿Cuál es la última frecuencia relativa acumulada? ¿Por qué?
d) ¿Cómo se puede obtener el porcentaje de individuos que presentan cada uno de los valores de la variable?

Una vez construida la tabla de frecuencias, vamos a representar mediante distintos gráficos el estudio realizado. Entre los gráficos más utilizado podemos destacar:

Diagrama de barras

Consiste en dos ejes perpendiculares y una barra o rectángulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque también se puede hacer en el vertical). El otro eje se gradúa según los valores de las frecuencias. La representación gráfica consiste en dibujar una barra o un rectángulo para cada uno de los valores de la variable de altura igual a su frecuencia.

Histograma

Es un caso particular del diagrama anterior en el caso de variables continuas. Si los intervalos son correlativos, los rectángulos aparecen pegados en la representación gráfica. En caso de que la amplitud de los intervalos no se igual para todos, hay que hacer coincidir el área del rectángulo con la frecuencia del intervalo. Un ejemplo muy utilizado de histograma es una pirámide de población.

Polígono de frecuencias

Representamos dos ejes perpendiculares y representamos en el horizontal los valores de la variable y en el vertical las frecuencias. Representamos los puntos que tiene por primera coordenada el valor de la variable y por segunda el valor de la frecuencia. Uniendo todos los puntos obtenemos una línea poligonal que es la representación que buscamos.

Diagrama de sectores

Consiste en dividir un círculo en tantos sectores como valores de la variable. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente.

Actividades

ejercicio

Actividades Interactivas: Gráficos estadísticos


Actividad 1. Diagrama de barras.
Actividad 2. Histograma.
Actividad 3. Polígono de frecuencias.
Actividad 4. Diagrama de sectores.

ejercicio

Actividad


Actividad 1:

a) Modifica los valores de las frecuencias y observa como va cambiando el gráfico. Introduce nuevos valores para la variable.
b) ¿Se podría hacer este gráfico para una variable cualitativa? ¿Cómo se podría hacer con la escena?
c) Cómo se puede obtener el número de grados de cada sector a partir de las frecuencias relativas?

Herramientas personales
phpMyVisites * AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda