2.1 Agrupando los datos

¿Te gusta la música?, ¿posees muchos CD/DVDs en tu casa? Aún en el caso de que no sea sí, piensa en una musipedia. Hay multitud de CDs y DVDs y, para poder tenerlos organizados de forma que sean fácilmente accesibles; deben estar ordenados. Una de las primeras formas de ordenarlos es agruparlos por los que son del mismo género. Algo parecido a lo que se hace con los CDs y DVDs es lo que vamos a hacer nosotros con los datos recogidos en una encuesta o por cualquier otro medio.

Lo que veremos en este apartado y el siguiente valdrá para las variables cualitativas y las cuantitativas discretas. En el punto siguiente sabremos qué pasa con las variables cuantitativas continuas.

Se llama tabla de frecuencias a una tabla en la que se relacionan los distintos resultados de la variable con la cantidad de veces que han aparecido dichos resultados. Un ejemplo es la siguiente en la que se recogen el número de DVDs/CDs de música de una musipedia.

 

Tipo de música

xi

Nº de CD/DVDs

fi

 Clásica  200
 Pop  500
 Jazz  60
 Dance  50
 Rock and roll
 120

 

Los conceptos que vamos a reflejar en las tablas van a tener una representación que es necesario que conozcas. Ya hemos definido en la parte anterior qué se entiende por variable estadística: lo que estudiamos de la población. Vamos a representar la variable que se está estudiando por la letra x. Si suponemos ordenados de alguna manera los posibles valores de esa variable, llamaremos x1 al primer valor, x2 al segundo y así sucesivamente. En general, la columna donde vamos a colocar esos resultados la encabezaremos por el símbolo xi para indicar que están todos los valores; cada uno con su subíndice u orden correspondiente.

Icono de iDevice

Importante

Se llama frecuencia absoluta al número de veces que aparece un determinado resultado de la variable estadística entre todos los datos que se han recogido. Vamos a representarla genéricamente por la letra f.

Si hemos entrevistado a 600 personas, de las cuales 250 han sido hombres y el resto mujeres, la frecuencia absoluta del resultado Hombres sería 250 y del resultado Mujeres sería 350.


En la siguiente tabla de frecuencias se han recogido los datos sobre el color de pelo de 50 personas y se han agrupado según su frecuencia absoluta. Como puedes apreciar, lo único que hay que hacer es anotar los resultados posibles y al lado la cantidad de veces que se han recogido esos resultados.

Color del pelo

xi

Nº de personas

fi

Castaño 10
Moreno
 20
Pelirrojo  15
Rubio
 5

El número total de elementos recogidos, que debe coincidir con la suma de todas las frecuencias absolutas, suele representarse por la letra N.

 

En la siguiente escena, puedes practicar el recuento de datos y completar una tabla de frecuencia sobre círculos coloreados. Cada vez que pulses el botón Genera, aparecerán distintos círculos de diferentes colores. Pulsando a los botones colocados a la derecha de cada color podrás ir realizando el recuento.

Recuento de datos. Escena de José Ireno Fernández Rubio en ITE

Licencia Creative Commons by-nc-sa


Icono de iDevice Comprueba lo aprendido

En un I.E.S. se está realizando un estudio sobre las faltas de asistencia de 40 alumnos de bachillerato a la primera hora de clase en el último mes. El objetivo es conocer el grado de absentismo a primera hora de clase. Se han elegido aleatoriamente 40 alumnos de bachillerato y se han obtenido los siguientes datos:

3, 1, 2, 0, 1, 0, 3, 0, 0, 1, 4, 2, 1, 0, 0, 0, 1, 1, 2, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 1, 0, 2

Esos datos se han agrupado en la siguiente tabla de frecuencias. Rellena los huecos correspondientes.

xi
fi
0
1
2
3
4
  

 

Ahora imagínate que te comentan que en la clase de 3º de E.S.O. A hay 12 niñas y en la clase de 3º de E.S.O. B hay 15 niñas.

A simple vista, parece que en la segunda clase la representación femenina es mayor. Sin embargo,  si te dicen que la primera clase tiene en total 20 alumnos mientras que la segunda tiene 30, la deducción ya no parece correcta.

Esto es importante a la hora de compartir resultados obtenidos por un mismo valor en distintos estudios, pues en ese caso es mejor comparar proporciones. Para ello necesitamos unos nuevos conceptos.

Icono de iDevice

Importante

Se llama frecuencia relativa de un resultado al cociente entre su frecuencia absoluta y el número total de datos que se han recogido. Vamos a representarla por h. En ese caso la frecuencia relativa se calcularía como: .

El tanto por ciento de un resultado de la variable se halla multiplicando la frecuencia absoluta por 100 y dividiendo por el total o, directamente, multiplicando la frecuencia relativa por 100.


Icono de iDevice Aprende a hacerlo
Instalaciones deportivas de un I.E.S.
Instalaciones deportivas de un I.E.S. Imagen de Arturo Mandly en Flickr
Licencia Creative Commons by-nc-sa
Anota en tu cuaderno la tabla de la autoevaluación de la actividad anterior y añade una columna para la frecuencia relativa (encabezamiento hi) y otra para el tanto por ciento (encabezamiento %). La frecuencia relativa exprésala redondeada con dos decimales y el tanto por ciento sin decimales.
Icono de iDevice

Importante

La suma de todas las frecuencias relativas debe dar uno y la suma de los % debe dar 100. Pero, por problemas de redondeo, a veces se desvían un poco de esos valores. Es lo que ocurre en la tabla de la autoevaluación anterior, en la que las frecuencias relativas suman 1,02 y el porcentaje 102%. No importa, pero acostúmbrate a repasar los cálculos por si en algún lugar no te has acordado de redondear correctamente.

Icono de iDevice

Curiosidad

La frecuencia relativa nos indica una proporción. Es decir; cuando hablamos de la frecuencia relativa de los rubios en un conjunto de personas, es el cociente entre el número de rubios respecto del total. Esto lo puedes ver con una sonrisa en el siguiente enlace a un vídeo.


Matemáticas 3º E.S.O. CeDeC