Test de Chi-cuadrado | χ²

Estadística descriptiva

Toni
Ingeniería de Procesos
12 min readSep 8, 2024

--

El Test de Chi-cuadrado (χ²) es una prueba estadística que se utiliza para evaluar la independencia y la adecuación de un modelo en relación con datos categóricos. Es una herramienta fundamental en la estadística para determinar si existe una asociación significativa entre variables categóricas o si los datos observados se ajustan a una distribución teórica esperada.

El Test de Chi-cuadrado calcula una estadística Chi-cuadrado que compara las frecuencias observadas en las categorías con las frecuencias esperadas bajo la hipótesis nula. El valor obtenido se compara con una distribución Chi-cuadrado para determinar si la diferencia observada es significativa.

Este test es ampliamente utilizado en estudios de investigación y análisis de datos para evaluar relaciones entre variables categóricas y validar modelos estadísticos, proporcionando una medida clara de la asociación o ajuste de los datos.

El Test de Chi-cuadrado se usa para analizar la independencia y el ajuste de datos categóricos, a diferencia del ANOVA, que se aplica a datos numéricos para comparar medias entre grupos. Mientras que el Test de Chi-cuadrado es útil para evaluar asociaciones entre variables categóricas, técnicas como la regresión logística pueden ser empleadas para modelar la relación entre variables categóricas y continuas, proporcionando un análisis más detallado en contextos donde se requieren modelos predictivos. Ambos métodos ofrecen perspectivas valiosas en el análisis de datos dependiendo del tipo de variables involucradas.

Aplicaciones:

  • Situaciones útiles: El Test de Chi-cuadrado se utiliza para analizar datos categóricos y evaluar la independencia entre variables o el ajuste a una distribución esperada.
    Por ejemplo, puede utilizarse para analizar si la distribución de respuestas en una encuesta se ajusta a una distribución teórica o si dos variables categóricas están asociadas.
  • Información que proporciona: Indica si hay una asociación significativa entre variables categóricas o si los datos se ajustan a una distribución esperada. Un valor alto del estadístico chi-cuadrado indica una discrepancia significativa entre los datos observados y los esperados.
  • Cuándo no es recomendable: No es adecuado para datos numéricos continuos o cuando los tamaños de muestra son pequeños, ya que puede afectar la validez de la prueba. En tales casos, se pueden usar pruebas t o modelos de regresión según la naturaleza de los datos.
    Por ejemplo, no debe usarse para saber si hay una relación entre el número de horas de estudio y las calificaciones en un examen.

Supuestos del Test de Chi-cuadrado

Para que los resultados del Test de Chi-cuadrado sean válidos, es fundamental cumplir ciertos supuestos:

  • Tamaño de Muestra: Las frecuencias esperadas en cada categoría deben ser al menos 5 para que el test sea válido.
  • Independencia: Las observaciones deben ser independientes entre sí.

Hipótesis Nula (H0)

La hipótesis nula (H0) es una afirmación que se utiliza como punto de partida en una prueba estadística. Asume que no hay efecto, diferencia o relación en la población, y se acepta hasta que se demuestre lo contrario.

Tipos de Pruebas Chi-Cuadrado

La hipótesis nula siempre asume que no hay un efecto o relación significativa, y cualquier variación observada se debe al azar. La prueba de hipótesis se realiza para verificar si esta suposición puede ser rechazada con base en los datos observados.

Test de Bondad de Ajuste

  • Propósito: Determinar si los datos de una muestra se ajustan a una distribución teórica específica.
  • Hipótesis Nula (H0): La distribución observada sigue la distribución esperada.
  • Por ejemplo, si se evalúa la distribución de defectos en las naranjas, H0 sería que cada tipo de defecto ocurre con la misma frecuencia esperada (es decir, la distribución de los defectos es uniforme).

Test de Frecuencias

  • Propósito: Similar al test de bondad de ajuste, pero sirve para verificar si la frecuencia observada de una categoría en una muestra se ajusta a una frecuencia teórica esperada.
  • Hipótesis Nula (H0): La frecuencia observada de una categoría coincide con la frecuencia esperada.
  • Por ejemplo, si se espera una proporción específica de colores de bolas en una urna, H0 sería que la proporción observada de cada color coincide con la proporción esperada.

Test de Independencia

  • Propósito: Analizar si hay una asociación significativa entre dos variables categóricas.
  • Hipótesis Nula (H0): No hay relación entre las dos variables categóricas.
  • Por ejemplo, si se evalúa la relación entre el turno de trabajo y la preferencia por el tipo de fruta en un almacén de cítricos, H0 sería que la preferencia por el tipo de fruta es independiente del turno de trabajo.

Interpretación del Valor Chi-Cuadrado (χ²)

  • Valor χ² Grande: Indica una gran discrepancia entre las frecuencias observadas y las esperadas. Esto sugiere que hay una relación significativa o que la distribución no se ajusta al modelo esperado.
  • Valor χ² Pequeño: Indica poca discrepancia, lo que sugiere que las frecuencias observadas y esperadas están cerca. Esto significa que no hay relación significativa o que la distribución observada se ajusta al modelo esperado.

Tipos de errores

En las pruebas estadísticas, se pueden cometer dos tipos principales de errores: Error de Tipo I y Error de Tipo II:

Error de Tipo I (Error Alfa)

  • Definición: Rechazar la hipótesis nula (H0) cuando en realidad es verdadera.
  • Significado: Se concluye incorrectamente que hay un efecto o relación significativa cuando no la hay. Este error también se conoce como falso positivo.
  • Probabilidad de Cometerlo: Representada por el nivel de significancia (α). Por ejemplo, si α = 0.05, hay un 5% de probabilidad de cometer un error de Tipo I.

Error de Tipo II (Error Beta)

  • Definición: No rechazar la hipótesis nula (H0) cuando en realidad es falsa.
  • Significado: Se concluye incorrectamente que no hay un efecto o relación significativa cuando sí la hay. Este error también se conoce como falso negativo.
  • Probabilidad de Cometerlo: Representada por β. La potencia de la prueba, que es 1 — β, mide la capacidad de la prueba para detectar un efecto real cuando existe.

Resumen

  • Error de Tipo I (α): Rechazo incorrecto de H0 (falso positivo).
  • Error de Tipo II (β): No rechazo incorrecto de H0 (falso negativo).

Controlando los Errores:

  • Error de Tipo I: Se controla ajustando el nivel de significancia (α). Un α más bajo reduce el riesgo de cometer un error de Tipo I pero puede aumentar el riesgo de un error de Tipo II.
  • Error de Tipo II: Se controla aumentando el tamaño de la muestra o mejorando la sensibilidad de la prueba. Un β más bajo aumenta la potencia de la prueba.

Nivel de Significancia (α)

El nivel de significancia (α) es un umbral predefinido que utilizamos en una prueba estadística para determinar si los resultados observados son lo suficientemente sólidos como para rechazar la hipótesis nula (H0). Este nivel representa la probabilidad máxima aceptable de cometer un Error de Tipo I, que ocurre cuando rechazamos una hipótesis nula que en realidad es verdadera.

Umbral de Decisión

Establecimiento del Nivel de Significancia:

  • El nivel de significancia se fija antes de realizar la prueba. Un valor comúnmente utilizado es 0.05 (5%), lo que implica que estamos dispuestos a aceptar un 5% de probabilidad de cometer un Error de Tipo I.

Valor p y Decisión:

  • Durante la prueba, se calcula el valor p, que es la probabilidad de obtener un resultado tan extremo como el observado, suponiendo que la hipótesis nula (H0) es verdadera.
  • Comparación con el Nivel de Significancia:
    Si el valor p es menor que α (por ejemplo, 0.05):
    Los resultados son considerados suficientemente fuertes como para rechazar la hipótesis nula. Esto sugiere que hay evidencia significativa para concluir que el efecto o la relación observada es real y no solo atribuible al azar.
    Si el valor p es mayor o igual a α: No se rechaza la hipótesis nula. Esto indica que no hay suficiente evidencia para concluir que el efecto o la relación observada es significativa, y los resultados podrían ser resultado del azar.

Controlar el Riesgo de Error

Ajuste del Nivel de Significancia:

  • Un α más bajo (por ejemplo, 0.01) disminuye el riesgo de cometer un Error de Tipo I, pero aumenta la probabilidad de cometer un Error de Tipo II (no rechazar una hipótesis nula falsa).
  • Un α más alto (por ejemplo, 0.10) incrementa la probabilidad de cometer un Error de Tipo I, pero reduce el riesgo de Error de Tipo II, permitiendo más flexibilidad en la detección de efectos reales.

Definir la Zona de Rechazo

  • Zona de Rechazo:
  • El nivel de significancia define una “zona de rechazo” en la distribución de la estadística de prueba. Si el valor calculado de la estadística de prueba cae dentro de esta zona, se rechaza la hipótesis nula.
  • En el test chi-cuadrado, la zona de rechazo se encuentra en la cola derecha de la distribución, lo que indica que un valor χ² alto sugiere que los resultados son estadísticamente significativos.

Ejemplo Aplicado

  • Situación: Evaluar si existe una relación entre el turno de trabajo y las lesiones.
  • Hipótesis Nula (H0): No hay relación entre el turno de trabajo y las lesiones.
  • Nivel de Significancia (α): 0.05.
  • Decisión: Si el valor p obtenido es menor que 0.05, se rechaza la hipótesis nula, indicando que hay evidencia significativa de una relación entre el turno de trabajo y las lesiones. Si el valor p es mayor o igual a 0.05, no se rechaza la hipótesis nula.

Grados de Libertad (df)

Los grados de libertad (df) son una medida que refleja el número de categorías o grupos en los datos. Afectan la forma de la distribución chi-cuadrado y, por ende, la interpretación del valor p.

Chi-Cuadrado de Bondad de Ajuste:

  • df = k — 1, donde k es el número de categorías en los datos.
  • Ejemplo: Si tienes 4 categorías (tipos de defectos), los grados de libertad son 4–1 = 3.

Chi-Cuadrado de Independencia y Homogeneidad:

  • df = (r — 1) × (c — 1), donde r es el número de filas y c el número de columnas en la tabla de contingencia.
  • Ejemplo: Si tu tabla tiene 3 filas y 4 columnas, los grados de libertad son (3–1) × (4–1) = 2 × 3 = 6.

Importancia

  • Los grados de libertad ajustan la forma de la distribución chi-cuadrado. Esto afecta cómo se interpreta el valor p.
  • Ayudan a asegurar que los resultados sean precisos al tener en cuenta el número de categorías o grupos evaluados.

Formula

Aunque todas las pruebas usan la misma fórmula, lo que cambia es el contexto, el número de variables y cómo interpretas los resultados.

La fórmula del estadístico de prueba chi-cuadrado (χ²) es:

χ² = Σ ( (O — E)² / E )

donde:

  • χ²: El valor calculado de Chi-Cuadrado.
  • Σ: Sumatoria (se suman los valores para todas las categorías).
  • O: Frecuencia observada (número real de veces que se presenta una categoría en el conjunto de datos).
  • E: Frecuencia esperada (número teórico de veces que se esperaría que aparezca una categoría si la hipótesis nula fuera verdadera).

Explicación de la fórmula:

  • La fórmula calcula la suma de las diferencias al cuadrado entre las frecuencias observadas (O) y las frecuencias esperadas (E), divididas por las frecuencias esperadas (E) para cada categoría.
  • Cuanto mayor sea la diferencia entre las frecuencias observadas y esperadas, mayor será el valor del chi-cuadrado.

Ten en cuenta:

  • Esta fórmula se utiliza para pruebas de bondad de ajuste (una variable categórica) o independencia (dos variables categóricas).
  • Para interpretar el resultado del chi-cuadrado, se compara el valor obtenido con un valor crítico de la distribución chi-cuadrado, teniendo en cuenta los grados de libertad (df) de la prueba.
  • Los grados de libertad dependen del número de filas y columnas de la tabla de contingencia utilizada en el análisis.

Ejemplo:

Imagina que estás analizando la relación entre el color del pelo (categoría) y la preferencia por un tipo de música (otra categoría). Tienes datos observados y esperados para cada combinación de color de pelo y preferencia musical. La fórmula te permite calcular el chi-cuadrado, que luego se compara con el valor crítico para determinar si existe una asociación significativa entre las dos variables.

Ejemplo de Prueba de Chi-cuadrado

Queremos determinar si hay una asociación significativa entre el tipo de fertilizante utilizado (orgánico o químico) y el crecimiento de plantas (alto o bajo) en un experimento agrícola.

Datos:

Tenemos los siguientes datos observados:

| Tipo de Fertilizante | Crecimiento Alto | Crecimiento Bajo | Total |
|----------------------|------------------|------------------|-------|
| Orgánico | 30 | 10 | 40 |
| Químico | 20 | 20 | 40 |
| Total. | 50 | 30 | 80 |

Hipótesis:

  • Hipótesis Nula (H0): No hay asociación entre el tipo de fertilizante y el crecimiento de las plantas (son independientes).
  • Hipótesis Alternativa (Ha): Existe una asociación significativa entre el tipo de fertilizante y el crecimiento de las plantas.

Nivel de Significancia:

Fijamos el nivel de significancia en α=0.05

Cálculo de Frecuencias Esperadas:

Para cada celda de la tabla de contingencia, calculamos la frecuencia esperada usando la fórmula:

Eij = (Total de la Fila×Total de la Columna)/ Total General
  • Para Orgánico y Crecimiento Alto:
    E11=(40×50)80=25
  • Para Orgánico y Crecimiento Bajo:
    E12=(40×30)80=15
  • Para Químico y Crecimiento Alto:
    E21=(40×50)80=25
  • Para Químico y Crecimiento Bajo:
    E22=(40×30)80=15

Tabla de Frecuencias Esperadas:

| Tipo de Fertilizante | Crecimiento Alto | Crecimiento Bajo | Total |
|----------------------|------------------|------------------|-------|
| Orgánico | 25 | 15 | 40 |
| Químico | 25 | 15 | 40 |
| Total | 50 | 30 | 80 |

Cálculo del Estadístico de Prueba Chi-cuadrado:

La fórmula para el estadístico Chi-cuadrado es:

donde O es la frecuencia observada y E es la frecuencia esperada.

  • Para Orgánico y Crecimiento Alto:
    (30−25)² / 25 = 1
  • Para Orgánico y Crecimiento Bajo:
    (10−15)²/15≈1.67
  • Para Químico y Crecimiento Alto:
    (20−25)²/25=1
  • Para Químico y Crecimiento Bajo:
    (20−15)²/15≈1.67

Sumamos estos valores para obtener el estadístico Chi-cuadrado:

χ²=1+1.67+1+1.67=5.34

Grados de Libertad (df):

Prueba de Independencia (dado que estás analizando la relación entre dos variables categóricas).

Los grados de libertad se calculan como:

df=(r−1)×(c−1)

donde r es el número de filas y c es el número de columnas.

En este caso:

  • r=2 (Tipo de Fertilizante)
  • c=2 (Crecimiento)

Entonces:

df = (2−1)×(2−1) = 1

Cómo Interpretar el Valor Chi-cuadrado

Encuentra el Valor Crítico:

  • Usa una tabla de chi-cuadrado para encontrar el valor crítico correspondiente a tus grados de libertad (df) y el nivel de significancia (α). Para df = 1 y α=0.05, el valor crítico es 3.841.

Compara el Estadístico de Prueba:

  • Si tu estadístico de chi-cuadrado calculado (5.34) es mayor que el valor crítico (3.841), entonces el resultado es estadísticamente significativo.

Interpretación:

Dado que el valor chi-cuadrado calculado (5.34) supera el valor crítico (3.841), el valor p asociado es menor que 0.05. Esto indica que el resultado es estadísticamente significativo, y puedes rechazar la hipótesis nula, sugiriendo que existe una relación significativa entre el tipo de fertilizante y el crecimiento de las plantas. La asociación observada no es probable que sea debida al azar.

Resolución con EXCEL

Para resolver el test de chi-cuadrado en Excel, primero debes calcular el estadístico de chi-cuadrado calculado, a continuación puedes utilizar las funciones de excel para Compara el Estadístico de Prueba:

  • DISTR.CHICUAD y DISTR.CHICUAD.CD: Calculan la probabilidad acumulada (valor p) hasta un valor dado del chi-cuadrado.

https://support.microsoft.com/es-es/office/funci%C3%B3n-distr-chicuad-cd-dc4832e8-ed2b-49ae-8d7c-b28d5804c0f2

  • PRUEBA.CHICUAD: Calcula el valor p basado en el estadístico chi-cuadrado y grados de libertad.

https://support.microsoft.com/es-es/office/funci%C3%B3n-prueba-chicuad-2e8a7861-b14a-4985-aa93-fb88de3f260f

  • INV.CHICUAD y INV.CHICUAD.CD: Calculan el valor crítico del chi-cuadrado para un nivel de significancia dado.

https://support.microsoft.com/es-es/office/funci%C3%B3n-inv-chicuad-cd-435b5ed8-98d5-4da6-823f-293e2cbc94fe

Tabla de Valores Críticos de Chi-Cuadrado

| Grados Libertad | α = 0.10 | α = 0.05 | α = 0.01 | α = 0.005 | α = 0.001 |
|-----------------|----------|----------|----------|-----------|-----------|
| 1 | 2.71 | 3.84 | 6.64 | 7.88 | 10.83 |
| 2 | 4.61 | 5.99 | 9.21 | 11.14 | 13.82 |
| 3 | 6.25 | 7.81 | 11.34 | 13.28 | 16.27 |
| 4 | 7.78 | 9.49 | 13.28 | 15.13 | 18.47 |
| 5 | 9.24 | 11.07 | 15.09 | 17.03 | 20.52 |
| 6 | 10.64 | 12.59 | 16.81 | 18.67 | 22.46 |
| 7 | 12.02 | 14.07 | 18.48 | 20.83 | 24.32 |
| 8 | 13.36 | 15.51 | 20.09 | 22.75 | 26.12 |
| 9 | 14.68 | 16.92 | 21.67 | 24.64 | 27.88 |
| 10 | 15.99 | 18.31 | 23.21 | 26.57 | 29.62 |
| 11 | 17.28 | 19.68 | 24.72 | 28.42 | 31.33 |
| 12 | 18.55 | 21.03 | 26.22 | 30.23 | 33.02 |
| 13 | 19.81 | 22.36 | 27.69 | 32.00 | 34.68 |
| 14 | 21.06 | 23.68 | 29.14 | 33.77 | 36.32 |
| 15 | 22.30 | 25.00 | 30.58 | 35.52 | 37.94 |
| 16 | 23.53 | 26.30 | 32.00 | 37.26 | 39.54 |
| 17 | 24.75 | 27.61 | 33.41 | 38.99 | 41.12 |
| 18 | 25.97 | 28.91 | 34.81 | 40.71 | 42.68 |
| 19 | 27.18 | 30.21 | 36.20 | 42.42 | 44.22 |
| 20 | 28.39 | 31.41 | 37.58 | 44.12 | 45.75 |

--

--

Toni
Ingeniería de Procesos

Calidad y la mejora continua de la producción aplicando principios de Lean Manufacturing para optimizar y estandarizar procesos industriales.