Chi-Cuadrado Pruebas Estadisticas de SPSS
El procedimiento Tablas personalizadas, nos permite realizar tres diferentes pruebas estadísticas para determinar la relación existente entre las variables de fila y columna. A través de la pestaña Estadísticos de contraste se puede solicitar para las variables que se ingresen en la dimensión de filas y columnas, las pruebas de relación / independencia, comparación de medias o la comparación de porcentajes.
Para facilitar la interpretación de estos procedimientos generaremos algunos ejemplos de cada una de ella. Debemos resaltar que las pruebas estadísticas aquí mencionadas hacen parte del análisis de inferencia y por lo tanto no serán exploradas a profundidad, sino que las anexamos con el propósito de familiarizarnos con los objetivos de cada prueba, como un preámbulo al estudio de la estadística de inferencia.
Prueba de independencia (Chi-cuadrado)
La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.
A manera de ejemplo crearemos un prueba Chi-cuadrado para las variables Género y Estado civil; desde luego para crear la prueba es necesario realizar la tabla, por lo que debemos volver al generador de tablas y ubicar en la lista la variable género e ingresarla a las columnas, sucesivamente ubicamos la variable Estado civil y la ingresamos a las Filas. Una vez ubicadas la variables en las dimensiones, activamos (Hacer clic) la pestaña Estadísticos de contraste, con lo que aparecen en el cuadro las pruebas estadísticas disponibles [Fig.8-98].
Cada una de estas pruebas cuenta con la opción Alfa (α); este valor hace referencia al nivel de confianza que deseamos que tengan los cálculos de la prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de la confianza. Continuando con el ejemplo, seleccionamos la prueba Chi-cuadrado y mantenemos el valor del 0.05 en el Alfa; para finalizar hacemos clic en Aceptar con lo que las tablas se generan el visor de resultados [Fig.8-99].
El programa genera por defecto dos tablas; la primera de ellas corresponde a la tabla de contingencia, en ella aparecen las variables seleccionadas y los estadísticos que se hayan determinado en el procedimiento. La segunda tabla corresponde a la prueba de Chi-cuadrado de Pearson y en ella aparecen los resultados de las pruebas (valor del Chi-cuadrado, los grados de libertad (gl) y el valor de significación (Sig.)).
La prueba de independencia del Chi-cuadrado, parte de la hipótesis que las variables (Estado civil y Género) son independientes; es decir, que no existe ninguna relación entre ellas y por lo tanto ninguna ejerce influencia sobre la otra. El objetivo de esta prueba es comprobar la hipótesis mediante el nivel de significación, por lo que sí el valor de la significación es mayor o igual que el Alfa (0.05), se acepta la hipótesis, pero si es menor se rechaza.
Para calcular el valor de significación, el Chi-cuadrado mide la diferencia global entre los recuentos de casilla observados y los recuentos esperados. Entre mayor sea el valor del Chi-cuadrado, mayor será la diferencia entre los recuentos observados y esperados, lo que nos indica que mayor es la relación entre las variables. El valor de significación corresponde a la probabilidad de que una muestra aleatoria, extraída del Chi-cuadrado nos dé cómo resultado un valor superior a 39.672; es decir, es la probabilidad que los datos de una muestra aleatoria extraída de las dos variables sean independientes. Para nuestro ejemplo este valor es menor que el Alfa (0.05), por lo que se rechaza la hipótesis de independencia y por lo tanto, podemos concluir las variables Estado civil y Género están relacionadas.
La prueba de independencia Chi-cuadrado, también puede ser empleada con variables Anidadas y/o Apiladas. Si las variables se encuentran anidadas, el programa genera una prueba por cada una de las subtablas (Categorías) de la variable principal de la anidación. Para comprender cómo se ven afectadas las pruebas de independencia con la anidación de variables, retomaremos el ejemplo anterior, pero anidando la variable Región dentro de las categorías del Género. Para realizarlo debemos volver al generador de tablas; ubicamos en la lista la variable Región y la arrastramos hasta la dimensión de las columnas, de manera que se anide a las categorías del género. Una vez ubicada las variables hacemos clic en Aceptar con lo que las tablas se crean en el visor de resultados [Fig.8-100].
Si nos fijamos en los resultados de la tabla, notaremos que el programa realiza dos pruebas de independencia (Una para categoría del Género). Al igual que en el ejemplo anterior, la relación o independencia se determina de acuerdo al valor de significación.
Si nos fijamos en los resultados de la significación de las dos pruebas (0.574 y 0.689), notaremos que estos valores superan por un alto margen el valor de alfa (0.05), por lo que debemos aceptar la hipótesis de independencia para los hombres y las mujeres. Notemos que en la parte inferior de la tabla aparecen algunas Notas que nos indican que más del 20% de las casillas de cada tabla tienen frecuencias esperadas menores a 5, por lo que puede que los resultados de la prueba no sean validos. Estas notas nos pueden advertir que existen irregularidades que afectan la muestra, ya sea un sesgo muestral, la fidelidad de los datos o el tamaño de la muestra.
Ahora, cuando las variables se encuentran apiladas el programa genera una prueba por cada combinación entre las variables de las filas y las columnas. Para comprender el efecto de la apilación en las pruebas de independencia, retomaremos el ejemplo anterior pero pasando la variable Región de las columnas a las filas, apilándola con el estado civil. Para realizarlo debemos volver al generador de tablas y llevar la variable Región a las filas apilándola con la variable Estado civil. Una vez ubicadas las variables hacemos clic en Aceptar con lo que las tablas se crean en el visor de resultados [Fig.8-101].
Si nos fijamos en los resultados de la significación para las dos pruebas, notaremos que la variable Género se relaciona con la variable Estado civil, pero es independiente con la variable Región. Las pruebas de independencia nos permiten determinar si existe una relación entre variables, pero para saber el grado de influencia y la dirección (Si es el Género quien influye el Estado civil o viceversa), es necesario realizar una serie de pruebas estadísticas complementarias.