Pruebas Estadisticas - Tablas de Contingencia
Hasta ahora sólo hemos empleado las tablas de contingencia de manera descriptiva, sin involucrar las pruebas estadísticas de asociación e independencia. Para poder determinar si existe una relación entre dos variables no basta con los porcentajes o los recuentos, la relación debe ser comprobada mediante una prueba estadística. Todas las pruebas con que cuenta las tablas de contingencia se encuentran ubicadas dentro de las opciones del botón Estadístico. Al hacer clic en él aparece el cuadro de diálogo correspondiente [Fig.6-23].
Dentro de las diferentes pruebas estadísticas de asociación que nos ofrece el procedimiento encontramos el Chi-cuadrado de Pearson, Chi-cuadrado de la razón de verosimilitud, prueba de asociación lineal por lineal, prueba exacta de Fisher, Chi-cuadrado corregido de Yates, r de Pearson, rho de Spearman, coeficiente de contingencia, phi, V de Cramer, lambdas simétricas y asimétricas, tau de Kruskal y Goodman, coeficiente de incertidumbre, gamma, d de Somers, tau-b de Kendall, tau-c de Kendall, coeficiente eta, kappa de Cohen, estimación de riesgo relativo, razón de ventajas, prueba de McNemar, estadísticos de Cochran y Mantel-Haenszel. La mayoría de estas pruebas nos permiten comprobar si existe alguna relación entre las variable, generando un número para representar la fuerza de la relación.
Por el momento sólo haremos énfasis en el Chi-cuadrado de Pearson, la cual es la más utiliza. Esta prueba nos permite determinar si el comportamiento de las categorías de una variable presentan diferencias Estadísticamente significativas. Para establecer la diferencia a través de SPSS, debemos partir de la teoría que no existe relación entre las variables de la tabla de contingencia (Hipótesis nula); es decir, debemos asumir que los resultados de las categorías de una variable no se ven afectados o influenciados por las categorías de la segunda variable.
El cálculo del Chi-cuadrado arroja como resultado un valor numérico denominado alfa (a), el cual debe ser comparado con el valor teórico de 0.05. Cuando el valor calculado es menor que el 0.05 se rachaza la hipótesis nula, con lo cual podemos concluir que si existe una relación entre las variables; por el contrario si el valor calculado es mayor que 0.05 no se rechaza la hipótesis nula aceptando que no existe ninguna relación entre las variables.
A manera de ejemplo vamos a generar la prueba de asociación del Chi-cuadrado para las variables Género y Estado civil; para lograrlo debemos volver al cuadro de diálogo y hacer clic en el botón Restablecer de manera que se retome la configuración inicial del procedimiento. Una vez se habilita el cuadro, ubicamos en el listado la variable Estado civil y la ingresamos en la casilla Filas; sucesivamente ubicamos la variable Género y la ingresamos en la casilla Columnas. A continuación seleccionamos el botón Estadísticos y activamos la opción Chi-cuadrado, haciendo clic sobre la opción. Para finalizar hacemos clic en Continuar y luego en Aceptar con lo que los resultados son creados en el visor [Fig.6-24].
Como de costumbre el programa genera la tabla del resumen del procesamiento y la tabla de contingencia, pero adicionalmente genera una tercera tabla denominada Pruebas de Chi-cuadrado. En ella aparecen los valores del Chi-cuadrado y la razón de verosimilitud los cuales son calculados con base a la diferencia entre las frecuencias observadas y las esperadas. De todos los valores que se incluyen en la tabla, sólo hay uno que realmente nos interesa y es el valor correspondiente a la significación asintótica (Bilateral) de la prueba Chi-cuadrado de Pearson; este valor es el resultado de la prueba y es el que se emplea para realizar la comparación.
De acuerdo al resultado podemos concluir que las variables Estado civil y Género si tienen relación ya que el valor obtenido es menor que [0.05]. Existen tres factores que pueden alterar el resultado de las pruebas de asociación e independencia como lo son el tamaño de la muestra, la fidelidad de los datos y el sesgo muestral; antes de sacar alguna conclusión es necesario revisar estos factores ya que cualquiera de ellos puede distorsionar severamente el resultado.
Para concluir con las tablas de contingencia vamos a revisar el último botón de opción que podemos encontrar en el cuadro de diálogo, el cual corresponde a Exactas (Este botón sólo está disponible si se ha instalado el módulo de pruebas exactas). Al seleccionar este botón, aparece el cuadro de diálogo correspondiente [Fig.6-25]; a través de sus opciones se proporcionan dos métodos adicionales para calcular los niveles de significación de los estadísticos disponibles en los procedimientos Tablas de contingencia y Pruebas no paramétricas. Estos métodos (el método exacto y el de Monte Carlo), proporcionan el medio para obtener resultados exactos cuando los datos no cumplen alguno de los supuestos subyacentes necesarios para obtener resultados fiables.
Las pruebas exactas permiten obtener un nivel de significación exacto sin confiar en supuestos que los datos podrían no cumplir. Por ejemplo, los resultados de un examen de calidad de 20 empaques en una fábrica muestran que los cinco empaques plásticos superaron la prueba, mientras que los resultados de los empaques de papel son diversos. Una prueba de Chi-cuadrado de Pearson, que contrasta la hipótesis nula de que los resultados son independientes del material, produce un nivel de significación asintótico del 0,07. Este resultado lleva a la conclusión de que los resultados del examen son independientes del material del empaque.
Sin embargo, dado que los datos incluyen sólo 20 casos y las casillas tienen frecuencias esperadas menores que 5, este resultado no es fidedigno. Al realizar una prueba exacta a la muestra obtenemos que el Chi-cuadrado de Pearson es de 0,04, lo que conduce a la conclusión contraria. Según la significación exacta, se concluirá que los resultados del examen y el material del empaque están relacionados. Esto demuestra la importancia de la obtención de resultados exactos cuando no se pueden cumplir los supuestos del método asintótico. La significación exacta es siempre fiable, independientemente del tamaño, la distribución, la dispersión o el equilibrio de los datos.
En conclusión, el procedimiento Tablas de contingencia nos permite realizar tablas en las que se describan las categorías de una variable a través de las categorías de una segunda variable. Para efectuar la descripción se pueden emplear diferentes medidas como el recuento, el porcentaje de fila, el porcentaje de columna o el porcentaje de tabla. Adicionalmente este procedimiento nos permite generar gráficos de barras con las variables involucradas en la tabla, así como también pruebas estadísticas de independencia como el Chi-cuadrado de Pearson e incluso generar pruebas estadísticas de precisión como el método de Monte Carlo o el método Exacto.