Muestreo estratificado

Toni
Ingeniería de Procesos
4 min readJun 28, 2024

Para realizar el muestreo estratificado proporcional, primero tenemos que calcular el tamaño total de la muestra mediante un muestreo aleatorio simple.

Contexto: Supongamos que queremos estimar la media del peso de los estudiantes de una universidad.

Parámetros:
z:
Nivel de confianza = 95% (1,96);
E: Margen de error = 5 kg (5);
S: Desviación estándar = 10 kg (10).

Cálculo:

n=(z²⋅S²) / E²​
n=(1,96²​⋅10²​) / 5²​
n=15,37

Resultado: Se necesitan aproximadamente 16 muestras.

Este resultado, se utilizará para seguir calculando los próximos muestreos estratificados.

Muestreo de Estratificación Proporcional

Se utiliza cuando se quiere asegurar que cada estrato esté representado de manera proporcional en la muestra.

ni​ = n*(Ni​​/N)
  • Contexto: Suponiendo que la universidad tiene dos facultades con igual número de estudiantes (500 estudiantes cada una).
  • Parámetros:
    Ni​:
    Tamaño del estrato/Facultad i (500 estudiantes)
    N: Tamaño de la población (1000 estudiantes).
    n: Tamaño total de la muestra (16 estudiantes).
  • Cálculo del Tamaño de la Muestra para Cada Estrato:
Facultad 1:
n1 = 16* (500/1000)
n1 = 8
Facultad 2:
n2 = 16*(500/1000)
n2 = 8
ni = 8 + 8= 16
  • Resultado: Se necesitan 8 estudiantes de la Facultad 1 y 8 estudiantes de la Facultad 2 para un total de 16 estudiantes.

Muestreo de Estratificación Equi-Probabilística:

Se utiliza cuando se quiere dar igual importancia a cada estrato, independientemente de su tamaño.

ni = n/k
  • Contexto: Suponiendo que la universidad tiene dos facultades con un número similar de estudiantes.
  • Parámetro
    n:
    Tamaño total de la muestra (16 estudiantes).
    k: Número de estratos 2 (2 facultades).
  • Cálculo:
ni = 16/2 = 8
  • Resultado: Se necesitan 8 estudiantes de la Facultad 1 y 8 estudiantes de la Facultad 2 para un total de 16 estudiantes.

Muestreo de Estratificación Neyman:

Se utiliza cuando se tiene información auxiliar sobre la población para formar grupos homogéneos.

ni​=((Ni​⋅si​​)/(​Ni​⋅si)+(​Ni​⋅si))​*n
  • Contexto: Suponiendo que la universidad tiene dos facultades con igual número de estudiantes (500 estudiantes cada una) y diferentes desviaciones estándar:

Facultad 1: Desviación estándar (s1) = 8 puntos.
Facultad 2: Desviación estándar (s2) = 12 puntos.

  • Parámetros:
    Ni​: Tamaño del estrato/Facultad i (500 estudiantes);
    si:​ Desviación estándar del estrato (s1=8; s2=12);
    n: Tamaño total de la muestra (16 estudiantes);
    k: Número total de estratos 2 (2 facultades).
  • Cálculo:
Facultad 1:
n1 = ((500×8)/((500×8)+(500×12)))​×16
n1 = 6.4
Facultad 2:
n2 = ((500×12)/((500×8)+(500×12)))​×16
n2 = 9,6
ni = 6.4 + 9.6 = 16
  • Resultado: Se necesitan 6 estudiantes de la Facultad 1 y 10 estudiantes de la Facultad 2 para un total de 16 estudiantes.

Muestreo de Estratificación Óptima:

Fórmula de varianza ponderada, n debe tener un valor grande y reflejen la distribución de la varianza dentro de cada estrato.

n = n1 + n2
ni = (N_i * s_i²)/ (n * P_i * S²)
  • Contexto: Suponiendo que la universidad tiene dos facultades con igual número de estudiantes (500 estudiantes cada una) y diferentes desviaciones estándar:
    Facultad 1: Desviación estándar (s1) = 8 puntos.
    Facultad 2: Desviación estándar (s2) = 12 puntos.
  • Parámetros:
    Ni​: Tamaño del estrato/facultad i (500 estudiantes);
    si:​ Desviación estándar del estrato i (s1=8; s2=12);
    n: Tamaño total de la muestra (16 estudiantes)
    Pi: Proporción de la población en el estrato/facultad i (0.5 para ambas facultades).
    S: Desviación estándar estimada de la población (10 puntos).
  • Cálculo:
Facultad 1:
n1 = 500 * 8² / (16 * 0.5 * 10²)
n1 = 70.37
Facultad 2:
n2 = 500 * 12² / (16 * 0.5 * 10²)
n2 = 65.63
ni = 70.37 + 65.63 = 136
  • Resultado: Se necesitan 70 estudiantes de la Facultad 1 y 66 estudiantes de la Facultad 2 para un total de 137 estudiantes.

Notas al muestreo por estratos:

  • Desviación Estándar en cada Estrato (s_i​): Representa la variabilidad de las puntuaciones dentro de cada estrato. En el ejemplo, la Facultad 1 tiene una desviación estándar de 8 puntos y la Facultad 2 de 12 puntos.
  • Proporción de la Población en cada Estrato (P_i​): Es la proporción de la población total representada por cada estrato. En este ejemplo, cada facultad representa el 50% de la población total.
  • Desviación Estándar Estimada de la Población (S): Es una medida de la dispersión de las puntuaciones en toda la población. En este ejemplo, se estima en 10 puntos.
  • Tamaño de Muestra (n): El tamaño total de la muestra se calcula previamente utilizando un muestreo aleatorio simple, y luego se distribuye entre los estratos según sus características.

--

--

Toni
Ingeniería de Procesos

Calidad y la mejora continua de la producción aplicando principios de Lean Manufacturing para optimizar y estandarizar procesos industriales.