Tablas de datos

De Wikipedia

(Diferencia entre revisiones)
Revisión de 16:32 12 jun 2017
Coordinador (Discusión | contribuciones)
(Tablas de frecuencias)
← Ir a diferencia anterior
Revisión actual
Coordinador (Discusión | contribuciones)

Línea 1: Línea 1:
-{{Menú Matemáticas 3ESO+{{Menú Matemáticas Contenidos Generales
|ir= |ir=
|ampliar= |ampliar=
-|repasar=[http://www.librosvivos.net/smtc/homeTC.asp?TemaClave=1051 Estadística (SM)]+|repasar=
|enlaces= |enlaces=
}} }}
{{p}} {{p}}
-==Tablas estadísticas==+{{Tablas estadísticas}}
-Son utilizadas para organizar los datos. Según el número de observaciones y según el recorrido de la variable estadística (mayor valor menos el menor valor), tenemos los siguientes tipos de tablas estadísticas:+
-{{Caja_Amarilla|texto=+
-*'''Tablas Tipo I:''' Cuando el tamaño de la muestra y el recorrido de la variable son pequeños (por ejemplo, si tenemos una muestra de las edades de 5 personas), por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas.+
-{{Ejemplo_simple|titulo=Ejemplo|contenido=+
-*Variable: "Edad de los 5 miembros de una familia"+
-*Valores observados: 5, 8, 16, 38, 45+
-}}+
-*'''Tablas Tipo II:''' Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable que se repiten.+
-{{Ejemplo_simple|titulo=Ejemplo|contenido=+
-Si preguntamos el número de personas activas que hay en 50 familias obtenemos la siguiente tabla:+
-<center> 
-<table border="1" cellpadding="2"> 
- <tr> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 2</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 2</td> 
- <td align="center"> 4</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 1</td> 
- </tr> 
- <tr> 
- <td align="center"> 2</td> 
- <td align="center"> 3</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 1</td> 
- <td align="center"> 1</td> 
- <td align="center"> 3</td> 
- <td align="center"> 4</td> 
- <td align="center"> 2</td> 
- <td align="center"> 2</td> 
- </tr> 
-<tr> 
- <td align="center"> 2</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 1</td> 
- <td align="center"> 1</td> 
- <td align="center"> 3</td> 
- <td align="center"> 2</td> 
- <td align="center"> 2</td> 
- </tr> 
- <tr> 
- <td align="center"> 3</td> 
- <td align="center"> 2</td> 
- <td align="center"> 3</td> 
- <td align="center"> 1</td> 
- <td align="center"> 2</td> 
- <td align="center"> 4</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 4</td> 
- <td align="center"> 1</td> 
- </tr> 
- <tr> 
- <td align="center"> 1</td> 
- <td align="center"> 3</td> 
- <td align="center"> 4</td> 
- <td align="center"> 3</td> 
- <td align="center"> 2</td> 
- <td align="center"> 2</td> 
- <td align="center"> 2</td> 
- <td align="center"> 1</td> 
- <td align="center"> 3</td> 
- <td align="center"> 3</td> 
- </tr> 
- 
-</table> 
-</center> 
- 
-Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla: 
- 
-<center> 
-<table border="1" cellpadding="2"> 
- <tr> 
- <td align="center"><strong>Personas activas</strong></td> 
- <td align="center"><strong>Nº de familias</strong></td> 
- </tr> 
- <tr> 
- <td align="center"> 1</td> 
- <td align="center"> 16</td> 
- </tr> 
- <tr> 
- <td align="center"> 2</td> 
- <td align="center"> 20</td> 
- </tr> 
- <tr> 
- <td align="center"> 3</td> 
- <td align="center"> 9</td> 
- </tr> 
- <tr> 
- <td align="center"> 4</td> 
- <td align="center"> 5</td> 
- </tr> 
- <tr> 
- <td align="center"><strong>Total</strong></td> 
- <td align="center"><strong>50</strong></td> 
- </tr> 
-</table> 
-</center> 
-}}{{p}} 
-*'''Tablas Tipo III:''' Se utilizan cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será necesario agrupar en intervalos los valores de la variable. Tambien obligatorio usarla cuando la variable sea cuantitativa continua. 
-{{Ejemplo_simple|titulo=Ejemplo|contenido= 
-Si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento tienen ahorrado, nos encontramos con los siguientes datos: 
- 
-<center> 
-<table border="1" cellpadding="2"> 
- <tr> 
- <td align="center"> 450</td> 
- <td align="center"> 1152</td> 
- <td align="center"> 250</td> 
- <td align="center"> 300</td> 
- <td align="center"> 175</td> 
- <td align="center"> 80</td> 
- <td align="center"> 25</td> 
- <td align="center"> 2680</td> 
- <td align="center"> 605</td> 
- <td align="center"> 785</td> 
- </tr> 
- <tr> 
- <td align="center"> 1595</td> 
- <td align="center"> 2300</td> 
- <td align="center"> 5000</td> 
- <td align="center"> 1200</td> 
- <td align="center"> 100</td> 
- <td align="center"> 5</td> 
- <td align="center"> 180</td> 
- <td align="center"> 200</td> 
- <td align="center"> 675</td> 
- <td align="center"> 500</td> 
- </tr> 
- <tr> 
- <td align="center"> 375</td> 
- <td align="center"> 1500</td> 
- <td align="center"> 205</td> 
- <td align="center"> 985</td> 
- <td align="center"> 185</td> 
- <td align="center"> 125</td> 
- <td align="center"> 315</td> 
- <td align="center"> 425</td> 
- <td align="center"> 560</td> 
- <td align="center"> 1100</td> 
- </tr> 
-</table> 
-</center> 
-{{p}} 
-La variable estadística tiene un recorrido muy grande, (Mayor valor - Menor valor = 5000 - 5 = 4995), por lo que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir ¿cuántos intervalos queremos?. Normalmente se suele trabajar con no más de 10 o 12 intervalos. 
- 
-<br> 
-{{Caja|contenido=<math>Amplitud\ de\ cada\ intervalo=\cfrac {Recorrido} {Num.\ de\ intervalos}</math> 
-}} 
-<br> 
-<center><math>Amplitud =\cfrac{4995}{10} = 499,5</math></center> 
- 
-Por lo que tomaremos intervalos de amplitud 500 
- 
-Debemos tener en cuenta las siguientes consideraciones: 
- 
-Tomar pocos intervalos implica que la "pérdida de información" sea mayor. 
- 
-Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha [Li-1 , Li). 
- 
-Con estas recomendaciones tendremos la siguiente tabla: 
- 
-<center> 
-<table border="1" cellpadding="2"> 
- <tr> 
- <td align="center"><strong>Intervalo</strong></td> 
- <td align="center"><strong>Nº de alumnos</strong></td> 
- </tr> 
- <tr> 
- <td align="center"> [0,500)</td> 
- <td align="center"> 16</td> 
- </tr> 
- <tr> 
- <td align="center"> [500,1000)</td> 
- <td align="center"> 6</td> 
- </tr> 
- <tr> 
- <td align="center"> [1000,1500)</td> 
- <td align="center"> 3</td> 
- </tr> 
- <tr> 
- <td align="center"> [1500,2000)</td> 
- <td align="center"> 2</td> 
- </tr> 
-<tr> 
- <td align="center"> [2000,2500)</td> 
- <td align="center"> 1</td> 
- </tr> 
-<tr> 
- <td align="center"> [2500,3000)</td> 
- <td align="center"> 1</td> 
- </tr> 
-<tr> 
- <td align="center"> [3000,3500)</td> 
- <td align="center"> 0</td> 
- </tr> 
-<tr> 
- <td align="center"> [3500,4000)</td> 
- <td align="center"> 0</td> 
- </tr> 
-<tr> 
- <td align="center"> [4000,4500)</td> 
- <td align="center"> 0</td> 
- </tr> 
-<tr> 
- <td align="center"> [4500,5000)</td> 
- <td align="center"> 0</td> 
- </tr> 
-<tr> 
- <td align="center"> [5000,5500)</td> 
- <td align="center"> 1</td> 
- </tr> 
-</table> 
-</center> 
-}} 
-}} 
- 
-==Tablas de frecuencias== 
-Ahora iremos añadiendo más columnas según los cálculos y la información que necesitemos. Podemos ir completando la tabla con las frecuencias, que definimos a continuación: 
-{{Caja Amarilla|texto= 
-*'''Frecuencia absoluta'''. Es el número de veces que aparece cualquier valor de la variable. Se representa por <math>f_i\;</math> (algunos autores la representan por <math>n_i\;</math>). 
-*'''Frecuencia absoluta acumulada'''. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por <math>F_i\;</math> (algunos autores la representan por <math>N_i\;</math>). 
-*'''Frecuencia relativa'''. Es el cociente entre la frecuencia absoluta y el número de datos, <math>N\;</math>. Se representa por <math>h_i\;</math> (algunos autores la representan por <math>f_i\;</math>). Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica. 
-*'''Frecuencia relativa acumulada'''. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por <math>H_i\;</math> (algunos autores la representan por <math>F_i\;</math>). 
-}} 
-{{p}} 
-{{Videotutoriales|titulo=Tablas de frecuencias|enunciado= 
-{{Video_enlace_tutomate 
-|titulo1=Tutorial (Tipo II) 
-|duracion=6'59" 
-|sinopsis=Tabla de distribución de frecuencias para muchos datos discretos con recorrido pequeño (Tipo II). Ejemplo. 
-|url1=https://www.youtube.com/watch?v=n-uRZRL8K4o 
-}} 
-{{Video_enlace_tutomate 
-|titulo1=Tutorial (Tipo III) 
-|duracion=7'45" 
-|sinopsis=Tabla de distribución de frecuencias con intervalos (Tipo III). Ejemplo. 
-|url1=https://www.youtube.com/watch?v=RdLAechnDlM 
-}} 
----- 
-{{Video_enlace_abel 
-|titulo1=Ejemplo 1 
-|duracion=17'24" 
-|sinopsis=Tabla de distribución de frecuencias para muchos datos discretos con recorrido pequeño (Tipo II). 
-|url1=https://www.youtube.com/watch?v=8ksx5e_UJ6w 
-}} 
-{{Video_enlace_abel 
-|titulo1=Ejemplo 2 
-|duracion=12'01" 
-|sinopsis=Tabla de distribución de frecuencias para muchos datos discretos con recorrido pequeño (Tipo II). 
-|url1=https://www.youtube.com/watch?v=w9ADbh_dHf8 
-}} 
-{{Video_enlace_abel 
-|titulo1=Ejemplo 3 
-|duracion=27'01" 
-|sinopsis=Tabla de distribución de frecuencias con intervalos (Tipo III). 
-|url1=https://www.youtube.com/watch?v=Z3OiXfKtoTY 
-}} 
-{{Video_enlace 
-|titulo1=Ejemplo 4 
-|duracion=15'47" 
-|sinopsis=Tabla de distribución de frecuencias con intervalos (Tipo III). 
-|url1=https://www.youtube.com/watch?v=CuKr7GzohbI 
-}} 
-{{Video_enlace_matemovil 
-|titulo1=Ejemplo 5 
-|duracion=20'14" 
-|sinopsis=Tabla de distribución de frecuencias con intervalos (Tipo III). 
-|url1=https://www.youtube.com/watch?v=_Ncv6hEs_o0&list=PL3KGq8pH1bFTotSlEStmW6zkYj7m3RQHC&index=5 
-}} 
-}} 
-{{p}} 
-{{AI_enlace 
-|titulo1=Tablas de frecuencias: ''Variable cuantitativa discreta''. 
-|descripcion=Se recuenta el número de hermanos de 11 personas y se obtiene los siguientes resultados: 
- 
-<center>2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2</center> 
- 
-# Construye en tu cuaderno la tabla de frecuencias. 
-# Una vez que la tienes en tu cuaderno, constrúyela con la escena y compara los resultados. 
-{{p}} 
-<center><iframe> 
-url=http://maralboran.org/web_ma/wiki_Estadistica/descriptiva/variables/frecuencias_discreta_est.htm 
-width=100% 
-height=730 
-name=myframe 
-</iframe></center> 
-|url1=http://maralboran.org/web_ma/wiki_Estadistica/descriptiva/variables/frecuencias_discreta_est.htm 
-}} 
-{{AI_enlace 
-|titulo1=Tablas de frecuencias: ''Variable cuantitativa continua''. 
-|descripcion=Se pregunta por la estatura a 11 personas y se obtiene los siguientes resultados: 
- 
-<center>1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66</center> 
- 
-# Construye en tu cuaderno la tabla de frecuencias. 
-# Una vez que la tienes en tu cuaderno, constrúyela con la escena y compara los resultados. 
-{{p}} 
-<center><iframe> 
-url=http://maralboran.org/web_ma/wiki_Estadistica/descriptiva/variables/frecuencias_continua_est.htm 
-width=100% 
-height=730 
-name=myframe 
-</iframe></center> 
-|url1=http://maralboran.org/web_ma/wiki_Estadistica/descriptiva/variables/frecuencias_continua_est.htm 
-}} 
-{{p}} 
-Como puedes observar no se han tenido en cuenta las variables cualitativas. Esto se debe a que al no trabajar con números no se pueden hacer operaciones. Únicamente tendría sentido en la tabla construir las columnas de frecuencias absolutas y relativas, pero no las acumuladas. En el siguiente apartado de gráficos estadísticos también se podrían representar, pero para los apartados de cálculo de parámetros no podremos trabajar con ellas. si tienes interés en alguna representación, sustituye los valores la variable por los números que quieras y represéntalas o construye la tabla 
-{{P}} 
-{{ejercicio 
-|titulo=Actividades 
-|cuerpo= 
-:'''Actividad 1:''' 
-::a) ¿Qué significado tiene cada uno de los valores de la frecuencia absoluta acumulada? 
-::b) ¿Tiene sentido esta columna si no están ordenados los valores de la variable? 
-::c) ¿Tendría sentido la tabla para una variable cualitativa? 
-{{p}} 
-:'''Actividad 2:''' 
-::a) Modifica los valores de la variable pero no los de las frecuencias. ¿Influye en el resto de la tabla? 
-::b) Modifica ahora los valores de las frecuencias y observa como varía las demás columnas (puedes incluir más valores de la variable). ¿Cuál es la última frecuencia absoluta acumulada? ¿Por qué? 
-::c) ¿Cuál es la última frecuencia relativa acumulada? ¿Por qué? 
-::d) ¿Cómo se puede obtener el porcentaje de individuos que presentan cada uno de los valores de la variable? 
-}} 
[[Categoría: Matemáticas]][[Categoría: Estadística]] [[Categoría: Matemáticas]][[Categoría: Estadística]]

Revisión actual

Tablas de frecuencias

Empezaremos dando la definición de los distintos tipos de frecuencia:

  • Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por f_i\; (algunos autores la representan por n_i\;). La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N\;.
  • Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por F_i\; (algunos autores la representan por N_i\;).
  • Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos, N\;. Se representa por h_i\; (algunos autores la representan por f_i\;). Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica.
  • Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por H_i\; (algunos autores la representan por F_i\;).

Las tablas de frecuencias son utilizadas para organizar los datos de un estudio estadístico.

Una tabla de frecuencias es una tabla de doble entrada en la que los posibles valores de la variable del estudio se representan en la primera columna. Las frecuencias absolutas, relativas y acumuladas se representan en las diferentes columnas. A veces se añade otras dos columnas con las frecuencias relativas expresadas en %.

Tipos de tablas de frecuencias

Según el número de observaciones y según el recorrido de la variable estadística (mayor valor menos el menor valor), tenemos los siguientes tipos de tablas de frecuencias:

  • Tipo I (datos no agrupados): Cuando el tamaño de la muestra y el recorrido de la variable son pequeños (por ejemplo, si tenemos una muestra de las edades de 5 personas), por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas.

  • Tipo II (datos agrupados puntualmente): Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable que se repiten.

  • Tipo III (datos agrupados en intervalos): Se utilizan cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que se hace necesario agrupar los valores de la variable en intervalos, también llamados clases. También es obligatorio usarla cuando la variable sea cuantitativa continua.
    • El número de clases a considerar (c) es conveniente que oscile entre 6 y 15. Tomar pocos intervalos implica que la "pérdida de información" sea mayor. También suele usarse la fórmula de Sturges: c=1+log_2 \, N,  donde N es el número de datos. Este valor se redondeará al entero más próximo.
    • Los intervalos serán siempre cerrados por la izquierda y abiertos por la derecha: [L_i, L_s)\;
    • Los extremos de cada intervalo se denominan límites de clase.
    • La amplitud de cada intervalo se denomina la amplitud de la clase. Si elegimos la misma para todos los intervalos deberá ser igual al cociente ente el rango (R) y el número de intervalos de clase (c): A=\cfrac{R}{c}.
    • Las marcas de clase, x_i\;, son los puntos medios de cada intervalo y son los valores que representan a cada intervalo para el cálculo de algunos parámetros.
    • Ver información más detallada en: Tabla de distribución de frecuencias.

Actividades

Nota: Como habrás podido observar, en las dos últimas actividades anteriores sólo se han visto variables cuantitativas. Esto se debe a que si la variable no es numérica, ni cualitativa ordenable, únicamente tendría sentido construir en la tabla las columnas de frecuencias absolutas y relativas, pero no las acumuladas.

ejercicio

Ejercicios propuestos


A partir de las dos actividades anteriores realiza los siguientes ejercicios:

Ejercicio 1:

a) ¿Qué significado tiene cada uno de los valores de la frecuencia absoluta acumulada?
b) ¿Tiene sentido esta columna si no están ordenados los valores de la variable?

Ejercicio 2:

a) Modifica los valores de la variable pero no los de las frecuencias. ¿Influye en el resto de la tabla?
b) Modifica ahora los valores de las frecuencias y observa como varía las demás columnas (puedes incluir más valores de la variable).
c) ¿Cuál es la última frecuencia absoluta acumulada? ¿Por qué?
d) ¿Cuál es la última frecuencia relativa acumulada? ¿Por qué?
e) ¿Cómo se puede obtener el porcentaje de individuos que presentan cada uno de los valores de la variable?
Herramientas personales
* AVISO: Para que te funcionen los applets de Java debes usar Internet Explorer y seguir las instrucciones de la Ayuda del menu de la izquierda