GRÁFICO DIAGRAMAS DE CAJA DE SPSS
Los diagramas de caja también llamados gráficos de caja y bigotes, nos permiten identificar la distribución y la dispersión de los datos de una variable de escala. Con este tipo de gráfico se representa la mediana, los Cuartiles (1 y 3), los valores atípicos y los valores extremos. La estructura de este tipo de gráfico esta basada en una caja, donde el límite superior corresponde al valor del tercer cuartil (75% de los datos) y el límite inferior al primer cuartil (25%); a su vez dentro de la caja se incluye una línea representando el valor de la mediana.
Además se incluye dos barras verticales (Bigotes), los cuales determinan la distancia o rango del 95% de los casos; adicionalmente el procedimiento anexa algunos símbolos representativos de los valores atípicos y extremos. La utilidad de este tipo de gráficos radica en la posibilidad de resumir el comportamiento y las principales medidas de una o varias variables de escala, mediante un solo diagrama.
Para acceder al procedimiento Diagrama de caja, debemos ir al menú Gráficos.. Interactivos.. Diagramas de caja. Al seleccionarlo aparece el cuadro de diálogo correspondiente [Fig.7-70]. Este cuadro cuenta con las mismas características de forma y aplicación del gráfico de barras; la única diferencia que encontramos corresponde a la casilla Etiquetar los casos mediante; en esta casilla se pude ingresar una variable para identificar la etiqueta de los valores atípicos y extremos. Note que en este cuadro no aparecen las variables preincorporadas ni las opciones de agrupar o apilar.
Al igual que los demás gráficos interactivos, los diagramas de cajas cuentan con un grupo de opciones específicas para este tipo de gráficos. Al hacer clic en la pestaña Caja, aparecerán todas las opciones de edición con que cuenta el procedimiento [Fig.7-71]; en la primera sección Mostrar en las cajas, encontramos las opciones para incluir los valores atípicos, extremos y la línea de la mediana; por defecto estas opción están activas. La segunda sección (Remates de los bigotes) nos permite escoger la forma final de los bigotes.
La tercera sección Base de caja, nos permite escoger la forma de la base de las cajas (Cuadrado o Circular); cabe notar que esta sección sólo se activa cuando creamos diagramas en 3-D. Por último encontramos la opción Mostrar las etiquetas de la frecuencia, por medio de la cual podemos pedirle al programa que anexe el recuento de los casos en la parte inferior del gráfico.
Para comprender mejor estos conceptos vamos a generar algunos diagramas de caja, tratando de emplear cada una de las opciones. El primer gráfico que generaremos describe el comportamiento de los datos la variable de escala Años estudiados; para realizarlo debemos ingresar la variable de interés en la casilla del eje vertical y sucesivamente hacer clic en Aceptar, con lo cual el gráfico se creará en el visor de resultados [Fig.7-72].
Si nos fijamos en el gráfico notaremos que en la parte superior e inferior aparecen una serie de símbolos (círculos y asteriscos); el circulo representa los valores atípicos, mientras el asterisco representa los valores extremos. Para facilitar la identificación de los conceptos del gráfico, hemos anexado al diagrama de la figura [7-72], algunas etiquetas informativas; a través de ellas podemos apreciar parámetros como la mediana, el 50% de los datos que aborda la caja y el 95% (aprox.) de los datos que se cubren desde los limites de los bigotes.
Para el segundo ejemplo, emplearemos esta misma variable para notar las diferencias en los años estudiados entre los hombres y las mujeres. Para hacerlo debemos volver al cuadro de diálogo e ingresar la variable Género del encuestado en la casilla del eje horizontal y a continuación activar la pestaña Cajas y dentro de ella seleccionar la opción Mostrar las etiquetas de la frecuencia; Para finalizar hacemos clic en Aceptar con lo que se crea el gráfico en el visor de resultados [Fig.7-73].
Si nos fijamos en los resultados del gráfico, notaremos que no existe una gran diferencia entre los géneros en el promedio de años estudiados, pero que sin embargo, las mujeres presentan una media más baja y a su vez cuentan con varios valores atípicos y extremos. Este tipo de gráficos nos permite realizar comparaciones del comportamiento de los datos entre las categorías de una variable. Estas comparaciones se pueden realizar entre múltiples variables categóricas ingresándolas en las casillas de color, estilo o panel.
Para comprender el efecto de la adición de múltiples variables vamos a generar un ejemplo por lo que debemos volver al cuadro de diálogo e ingresar la variable Estado civil en la casilla Color. Dado que el número de cajas aumentará significativamente, es posible que las leyendas de la frecuencia se sobrepongan unas a otras impidiendo observar claramente sus valores, por lo que nos dirigimos a la pestaña Cajas y desactivamos la opción Mostrar etiquetas de la frecuencia. Para finalizar hacemos clic en Aceptar y obtenemos el gráfico en al visor de resultados [Fig.7-74].
Como podemos apreciar, el programa le asigna un color específico a cada una de las cajas con el fin de diferenciar las categorías de la variable estado civil; de igual manera, el programa ubica un grupo de cajas dentro de cada categoría del género, lo cual nos permite conocer el comportamiento del estado civil de acuerdo al género del encuestado. Si nos fijamos en el género femenino, notaremos que una de las cajas no aparece; este fenómeno se produce debido a que dentro de los datos del archivo sólo se encontró una persona con esas características (Mujer Viuda) y por lo tanto el programa se limita a ubicar la barra de la mediana.
Si por el contrario una categoría no cuenta con respuestas, el programa la omite del gráfico. Para este tipo de gráficos, se considera que existe una diferencia significativa cuando las cajas y sus respectivos bigotes no se interceptan, es decir, ninguno de sus componentes se encuentra en el mismo rango de edad. Teniendo esto en cuenta, podríamos a firmar que en el gráfico de la figura [7-74], las cajas de las personas del género femenino que son viudas y las personas del género masculino que son casados no tienen ninguna relación estadísticamente significativa.