Muestreo aleatorio simple

Muestreo estadístico probabilístico

Toni
Ingeniería de Procesos
6 min readJun 8, 2024

--

Formulas verificadas

El cálculo del tamaño de muestra es una etapa crucial en cualquier estudio estadístico. Seleccionar una muestra adecuada permite obtener resultados precisos y fiables, garantizando que las conclusiones obtenidas sean representativas de la población total.

A continuación, se presenta un índice detallado de los contenidos que se abordarán en este documento:

  • Estimación de una Proporción
    - Fórmula Muy Simplificada
    - Fórmula Ajustada (Muestra Grande)
    - Fórmula Ajustada (Muestra Pequeña)
  • Estimación de un Promedio (Media)
    -
    Fórmula Simplificada
    - Fórmula Ajustada (Desviación Estándar Muestral)
    - Fórmula Ajustada (Desviación Estándar Poblacional)

Al final de este post, encontrarás contenido relacionado que te ayudará a comprender mejor los conceptos aquí presentados y a complementar esta información con otros recursos y perspectivas relevantes.

Estimación de una Proporción

Generalmente utilizada para datos discretos, la estimación de una proporción nos ayuda a determinar qué porcentaje de la población presenta una característica específica.

# Fórmula muy Simplificada

Es una simplificación de la fórmula ajustada y se utiliza cuando la población es verdaderamente grande en comparación con el tamaño de muestra. Al omitir la corrección por población finita, se asume que la población es infinita.

n=(Z²⋅p⋅(1−p))/E²
  • Contexto: Supongamos que queremos estimar el porcentaje de estudiantes que aprobaron un examen (aprobado o no aprobado) para todo el país en un contexto que no sabes cuantos estudiantes hay realmente.
  • Parámetros:
    z: Nivel de confianza = 95% (1,96);
    E: Margen de error = 5% (0,05);
    p: Proporción esperada = 50% (0,5).
  • Cálculo:
n=(1,96²⋅0,5⋅(1−0,5)) / 0,05²
n=384,16
  • Resultado: Se necesitan aproximadamente 385 muestras.

# Fórmula Ajustada (Muestra grande)

Es una simplificación de la fórmula ajustada y se utiliza cuando la población es muy grande en comparación con el tamaño de muestra.

n = (N·z²·p·(1-p))/(E²·N+Z²·p·(1-p))
  • Contexto: Supongamos que queremos estimar el porcentaje de estudiantes que aprobaron un examen (aprobado o no aprobado) en una región.
  • Parámetros:
    N: Población = 10.000 personas (10.000);
    z: Nivel de confianza = 95% (1,96);
    E: Margen de error = 5% (0,05);
    p: Proporción esperada = 50% (0,5).
  • Cálculo:
n = (10.000*1,96²·0,5·0,5) / (0,05²·10.000+1,96²·0,5·0,5)
n= 370.14
  • Resultado: Se necesitan aproximadamente 371 muestras.

# Fórmula Ajustada

Se utiliza cuando la población es finita y se desea una estimación precisa del tamaño de muestra. La corrección por población finita (N-n) en el denominador asegura que el tamaño de muestra no se sobrestime.

n=(N⋅z²⋅p⋅(1−p)) / (E²⋅(N−1)+z²⋅p⋅(1−p))
  • Contexto: Supongamos que queremos estimar el porcentaje de estudiantes que aprobaron un examen (aprobado o no aprobado) en una localidad.
  • Parámetros:
    N: Población = 1000 personas (1.000);
    z: Nivel de confianza = 95% (1,96);
    E: Margen de error = 5% (0,05);
    p: Proporción esperada = 50% (0,5).
  • Cálculo:
n=(1.000⋅1,96²⋅0,5⋅(1−0,5)) / (0,05²⋅(1.000−1)+1,96²⋅0,5⋅(1−0,5))
n=277,75
  • Resultado: Se necesitan aproximadamente 278 muestras.

Estimación de un Promedio (Media)

Esta sección se aplica a datos continuos y se utiliza para estimar la media de una característica dentro de una población.

# Fórmula Simplificada

Es una simplificación de la fórmula ajustada y se utiliza cuando la población es verdaderamente grande en comparación con el tamaño de muestra. Al omitir la corrección por población finita, se asume que la población es infinita.

Utilizamos la Desviación estándar muestral cuando se desconoce la poblacional y tenemos que hacer una estimación a partir de una muestra.

n=(z²⋅S²) / E²​

Si somos capaces de obtener la Desviación estándar poblacional, el resultado será preciso.

n=(z²⋅σ²) / E²​

Contexto: Supongamos que queremos estimar la media del peso de los estudiantes de una universidad.

  • Parámetros:
    z:
    Nivel de confianza = 95% (1,96);
    E: Margen de error = 5 kg (5);
    S: Desviación estándar muestral = 10 kg (10).
    σ: Desviación estándar poblacional = 10 kg (10).
  • Cálculo:
n=(1,96²​⋅10²​) / 5²​
n=15,37
  • Resultado: Se necesitan aproximadamente 16 muestras.

# Fórmula Ajustada (S)

Se utiliza cuando la población es finita pero no se conoce la variabilidad de la población. La corrección por población finita (N-n) en el denominador asegura que el tamaño de muestra no se sobrestime.

n=(N⋅z²⋅S²) / (E²⋅(N−1)+z²⋅S²)
  • Contexto: Supongamos que queremos estimar la media del peso de los estudiantes de una universidad.
  • Parámetros:
    N:
    Población = 1000 personas (1.000);
    z: Nivel de confianza = 95% (1,96);
    E: Margen de error = 5 kg (5);
    S: Desviación estándar = 10 kg (10).
  • Cálculo:
n= (1.000⋅1,96²⋅10²) / (5²⋅(1.000−1)+1,96²⋅10²)
n=15,15
  • Resultado: Se necesitan aproximadamente 16 muestras.

# Fórmula Ajustada (σ)

Se utiliza cuando la población es finita y se conoce la variabilidad de la población.

n = (N·Z²·σ²) / (E²·N+Z²·σ²):
  • Contexto: Supongamos que queremos estimar la media del peso de los estudiantes de una universidad.
  • Parámetros:
    N:
    Población = 1000 personas (1.000);
    z: Nivel de confianza = 95% (1,96);
    E: Margen de error = 5 kg (5);
    σ: Desviación estándar = 10 kg (10).
  • Cálculo:
n=(1,96²·10²·1.000) / (5²·1.000+1,96²·10²)
n=15,34
  • Resultado: Se necesitan aproximadamente 16 muestras.

Notas al muestreo aleatorio simple

El cálculo adecuado del tamaño de muestra es fundamental para garantizar la precisión y validez de los estudios estadísticos. Dependiendo de si la población es finita o infinita, y si se conocen o no ciertos parámetros como la desviación estándar, se elige una fórmula específica.

  • Población Infinita: Si la población es muy grande, el término que incluye N tiende a desaparecer, y la fórmula se asemeja más a la utilizada para poblaciones infinitas.
  • Nivel de confianza (z): Se elige dependiendo de qué tan seguro quieres estar en tus resultados. El valor z se obtiene de la tabla de distribución normal estándar y generalmente se elige para un nivel de confianza del 95%, que corresponde a un valor z de aproximadamente 1.96.
    Generalmente se utilizan tres niveles de confianza según el nivel de precisión y rigurosidad:
    — 90% (z= 1.645);
    — 95% (z= 1.96);
    — 99% (z= 2.576).
    — 99,9% (z= 3.29).
  • Margen de error (E): Especifica la amplitud máxima del intervalo de confianza alrededor de tu estimación. La elección de este valor depende de la precisión que desees en tus resultados. Un margen de error típico es del 5% o menos.
    Si la desviación estándar (s) es grande, se necesitará un margen de error más pequeño para obtener una estimación más precisa.
  • Probabilidad de éxito (p): Representa la proporción de individuos en la población que tienen el resultado de interés. Esta probabilidad se utiliza para calcular la muestra cuando se espera que ocurra el evento de interés. A mayor nivel de p, menor será el tamaño de la muestra.
    Si tienes un estudio anterior que indica que la proporción de estudiantes que aprueban un examen es del 60%, entonces podrías utilizar p = 0.6 en tu nuevo estudio.
  • Probabilidad de fracaso (q): Es la probabilidad complementaria a la de éxito. Se calcula como 1 menos la probabilidad de éxito. Por lo general, se utiliza cuando se espera que el evento de interés no ocurra.
  • Desviación estándar poblacional (σ): Se calcula utilizando todos los datos de una población y proporciona una medida exacta de la dispersión. En el caso de poblaciones grandes, si no se conoce la desviación estándar, se puede utilizar una estimación basada en una muestra previa o en estudios similares.
  • Desviación estándar muestral (s): Se calcula a partir de una muestra y se utiliza como estimador de la desviación estándar poblacional cuando esta se desconoce. En el caso de poblaciones grandes, si no se conoce la desviación estándar, se puede utilizar una estimación basada en una muestra previa o en estudios similares.

Bibliografía:

Técnicas de muestreo. Sesgos más frecuentes. Neus Canal Díaz.

Contenido complementario

--

--

Toni
Ingeniería de Procesos

Calidad y la mejora continua de la producción aplicando principios de Lean Manufacturing para optimizar y estandarizar procesos industriales.