4.1 Centralización
|
Pirámides de Giza, Egipto.
Imagen del ITE en el banco de imágenes del ITE
Licencia Creative Commons by-nc-sa
|
Hay conceptos estadísticos que seguro que utilizas muy a menudo, aún sin darte cuenta. Si tienes tantos hermanos o hermanas mayores como menores, entonces tú eres el hermano mediano (o hermana mediana, según el caso). Si utilizas algo que está de actualidad, es porque estás a la moda, es decir, te relacionas con lo que más gente usa en esos momentos. Si te gusta salir los fines de semana de marcha, seguro que unos días gastarás más que otros. Pero si quieres saber cuál es el gasto medio al mes deberás calcular la media estadística de los gastos de cada fin de semana. Estos tres conceptos tan elementales son los que vamos a desarrollar.
Los Parámetros de centralización son aquellos valores en torno a los cuales están agrupados los datos. Básicamente, son los valores centrales del conjunto de valores recogidos y representan, de forma global, a toda la población o la muestra.
Importante
|
Escaparete de una tienda de moda, París.
Imagen de Luis Serrano en el banco de imágenes del ITE
Licencia Creative Commons by-nc-sa
|
La moda es el único parámetroestadístico que puede utilizarse con cualquier tipo de variable. En concreto, es el único parámetro que tiene sentido calcular en las variables cualitativas.
Tiene además la particularidad de ser el único que puede tomar más de un valor. Por ejemplo, si disponemos de 6 monedas de 1 €, 1 €, 2 €, 0,50 €, 0,50 € y 0,20 €; la moda correspondería a los valores 1 € y 0,50 €, ya que ambas se repiten dos veces.
La moda de esos valores es de
euros.Importante
Si suponemos que los datos están ordenados numéricamente de menor a mayor, la mediana es el valor que está en el centro, es decir, el valor que tiene por delante la mitad de los valores y por detrás la otra mitad. La representaremos por Me.
|
Carretera.
Imagen del ITE en el banco de imágenes del ITE
Licencia Creative Commons by-nc-sa
|
Para su cálculo hay que distinguir si los datos están agrupados o no por intervalos. En el caso de que los datos estén agrupados por intervalos, la mediana coincide con el segundo cuartil, concepto que estudiaremos en el apartado correspondiente a los parámetros de posicionamiento.
Cuando los datos no están agrupados por intervalos, se procede de la siguiente forma para el cálculo de la Me:
- Si el número de valores que tenemos es impar, la mediana será el que ocupe el valor central. Por ejemplo, si el número de personas que viven en los distintos pisos de un bloque de viviendas son: 2, 2, 2, 3, 4, 4, 5, 5, 6; la cantidad mediana de personas que viven en esos pisos sería de 4 personas.
- Si el número de valores de los que disponemos fuese par, entonces la mediana es la semisuma de los dos valores centrales. Y no importa que obtengamos un valor decimal, aunque parezca no tener sentido en el contexto. Si en el ejemplo anterior hubiese una vivienda más con tres personas, entonces los valores centrales serían el 3 y el 4, por lo tanto, la mediana sería
|
Industria.
Imagen del ITE en el banco de imágenes del ITE
Licencia Creative Commons by-nc-sa
|
-
El sueldo que correspondería con la mediana sería
euros. -
Si consideramos también el sueldo del gerente, que cobra 2.500 euros, entonces la mediana de esos valores sería un sueldo de
euros.
Importante
La media es el valor promedio del conjunto de valores que estamos trabajando. Suele representarse por. Suele considerarse a la media como el centro de gravedad de la distribución de valores y, como veremos, no tiene por qué estar exactamente en la mitad.
Se calcula sumando todos los valores obtenidos y dividiendo entre el número total de datos. Si los datos que tenemos son x1, x2, x3, ... hasta el valor xN, entonces la media vendría dada por la expresión.
La media equivale al valor que obtendríamos si reuniésemos todo el valor completo de la variable y lo repartiésemos a partes iguales entre todas las observaciones que hubiésemos hecho.
Aquí tienes un ejemplo. Si sumamos los sueldos de todos los empleado,s tendríamos 805+950+950+950+1200+1200+2100 = 8155 €. Si ahora calculamos la media, obtenemos:
Si supusiésemos que el sueldo de todos los empleados era igual, sería precisamente ese valor medio, ya que la suma de todos los sueldos valdría lo mismo: 805+950+950+950+1200+1200+2100 = 8155 = 1165 · 7.
|
|
En una mediana empresa quieren realizar un estudio sobre el número de empleados que faltan al trabajo por encontrarse enfermos. Durante dos semanas van anotando la cantidad de personas que faltan, obteniendo los siguientes datos:
Calcula el número medio de empleados que han faltado al trabajo en esas dos semanas.
Variables. Escena de Juan Jesús Cañas Escamilla y José R. Galo Sánchez en ITE
Licencia Creative Commons by-nc-sa |
Curiosidad
Los valores extremos de la distribución que hayamos tomado no suelen afectar a la mediana, pero si afectan a la media. Si hay algunos valores muy grandes, hacen aumentar la media; mientras que si hay valores muy pequeños respecto de los demás, hacen que la media disminuya. Por eso, la media no está a veces exactamente en el medio, como sí le pasa a la mediana.