Calculadora de tamaño de muestra para medias apareadas

Calculadora de tamaño de muestra para medias apareadas determina el número necesario de pares en estudios antes/después.

Este artículo ofrece fórmulas, tablas, ejemplos completos y guía normativa para implementar cálculos precisos.

Calculadora de tamaño de muestra para medias apareadas

Calcula el número mínimo de pares necesarios en un estudio de medidas apareadas (antes-después o casos apareados) para detectar una diferencia media esperada con un nivel de significación y potencia deseados.

Diferencia media mínima clínicamente relevante entre pares. Debe ser > 0 y en las mismas unidades que la SD de las diferencias.
Desviación estándar de las diferencias (variable: valor_post - valor_pre). Debe estimarse de estudios previos o de una muestra piloto.
Probabilidad de error tipo I (comúnmente 0.05). Seleccione bilateral (el cálculo usa Z_{1-α/2}).
Probabilidad (1−β) de detectar la Δ especificada si existe realmente. Valor típico 0.8–0.9.
Seleccione bilateral para hipótesis de diferencia en cualquier dirección; unilateral si la dirección es preespecificada.
Ingrese los datos para ver el resultado.
Reporte errores o sugerencias: Enviar informe
Fórmulas usadas
• Fórmula aproximada (basada en la aproximación Z para prueba t apareada cuando n es moderado/grande):
  n = [ (Z_{1−α/2} + Z_{potencia}) * σd / Δ ]^2
• Variables:
  Δ = diferencia media esperada entre pares (valor absoluto).
  σd = desviación estándar de las diferencias (post − pre).
  Z_{1−α/2} = cuantíl de la Normal estándar para α bilateral (si selecciona unilateral usa Z_{1−α}).
  Z_{potencia} = cuantíl de la Normal estándar para la potencia requerida (ej. 0.84 para 80%).
• Interpretación: se calcula n (número de pares). Se redondea hacia arriba al entero más próximo porque se requieren sujetos completos.
Valores típicos / referencias
Contextoσd (desv. diferencias)Δ clínico típico
Presión arterial sistólica (mmHg)8–125 mmHg
Puntaje de dolor (escala 0–10)1.5–31 punto
Glucemia en ayunas (mmol/L)0.8–1.50.5 mmol/L
Test funcional (segundos)2–62 seg

Preguntas frecuentes

¿Cuándo usar esta calculadora en lugar de una para muestras independientes?
Use esta calculadora cuando las mediciones están emparejadas por sujeto (por ejemplo antes y después), ya que considera la variabilidad de las diferencias dentro del mismo sujeto.
¿Qué pasa si no conozco la desviación estándar de las diferencias?
Se recomienda estimarla a partir de estudios previos o realizar un estudio piloto. Como alternativa, use valores publicados para la misma variable clínica.
¿La fórmula es exacta para muestras pequeñas?
La fórmula usa aproximación Z; para n pequeño conviene usar corrección basada en t de Student o simulación. Este cálculo ofrece una estimación conservadora inicial.

Concepto y aplicación de medias apareadas

Las medias apareadas se usan cuando cada sujeto tiene dos mediciones relacionadas: antes y después, o dos condiciones emparejadas.

El análisis aprovecha la correlación intra-sujeto para aumentar la potencia estadística respecto a muestras independientes.

Calculadora de tamano de muestra para medias apareadas: guía rápida y precisa
Calculadora de tamano de muestra para medias apareadas: guía rápida y precisa

Planteamiento estadístico y parámetros clave

En diseños apareados se evalúa la diferencia D = X1 - X2 por sujeto; la media y desviación estándar de D son los insumos del cálculo.

Parámetros: efecto clínico mínimo relevante (Δ), desviación estándar de las diferencias (σd), alfa, potencia y dirección del contraste.

Parámetros detallados

  • Δ (delta): diferencia mínima de interés que se desea detectar (media de las diferencias).
  • σd: desviación estándar de las diferencias entre las dos mediciones por sujeto.
  • α: riesgo tipo I (nivel de significación), comúnmente 0.05.
  • β: riesgo tipo II; potencia = 1 - β, típicamente 0.8 o 0.9.
  • Zα/2 o Zα: valores críticos de la distribución normal para pruebas bilaterales o unilaterales.
  • Zβ: valor crítico asociado a la potencia deseada.
  • n: número de pares requeridos.

Fórmulas fundamentales para cálculo de tamaño de muestra en medias apareadas

La formulación básica asume que la distribución de las diferencias es aproximadamente normal y usa la desviación estándar de las diferencias.

A continuación se presentan las expresiones y su derivación, con explicaciones por variable y valores típicos.

Fórmula básica (prueba bilateral)

n = ((Zα/2 + Zβ) * σd / Δ)^2

Variables: Zα/2 = cuantil normal para α/2; Zβ = cuantil normal para potencia; σd = desviación estándar de diferencias; Δ = diferencia mínima relevante.

Fórmula para prueba unilateral

n = ((Zα + Zβ) * σd / Δ)^2

Se usa cuando la hipótesis alternativa tiene dirección conocida (por ejemplo, X1 > X2).

Ajuste por pérdida de seguimiento

n_final = n / (1 - f)

f = fracción esperada de pares perdidos (porcentaje/100). Ej.: si se espera 10% de pérdida, f = 0.10.

Ajuste por correlación entre mediciones (cuando se conoce σ de cada medición y r)

Si solo se conocen σ1, σ2 y correlación r entre X1 y X2, entonces σd = sqrt(σ1^2 + σ2^2 - 2 r σ1 σ2)

Valores típicos: σ1≈σ2 en mediciones simétricas; r puede ser 0.3–0.8 dependiendo de la repetibilidad.

Cálculo de Z críticos (valores típicos)

  • Zα/2 para α=0.05 → 1.96
  • Zα/2 para α=0.01 → 2.575
  • Zα para α=0.05 (unilateral) → 1.645
  • Zβ para potencia 0.8 → 0.84
  • Zβ para potencia 0.9 → 1.28

Interpretación y consejos prácticos para seleccionar parámetros

Seleccione Δ basado en relevancia clínica o mínima diferencia detectable con impacto real; evite elegir Δ demasiado pequeño sin justificación.

Estimate σd usando datos piloto, literatura o estudios previos; si no, realice un estudio piloto para estimar variabilidad.

Tablas con valores más comunes

A continuación se presentan tablas responsivas con combinaciones frecuentes de parámetros y n calculado. Las tablas están optimizadas para visualización en escritorio y móviles.

Las tablas incluyen α 0.05 bilateral y potencias 80% y 90%, σd típicas y distintos Δ representativos.

σdΔαPotenciaZα/2n (pares)
2.01.00.050.81.960.8420
2.00.50.050.81.960.8480
3.01.50.050.81.960.8420
3.01.00.050.81.960.8471
1.50.50.050.91.961.2857
1.00.50.050.81.960.8416
0.80.20.050.91.961.28101
5.02.00.050.81.960.8444
4.02.00.050.91.961.2871
2.51.00.050.81.960.8443

Tabla explicativa: interpretación rápida

Las entradas muestran cómo aumenta n cuando Δ disminuye o σd aumenta; la potencia mayor eleva n considerablemente.

Use estas tablas como referencia inicial y ajuste con estimaciones específicas del estudio o piloto.

Representación visual de fórmulas y componentes

Para claridad se muestran expresiones con resaltado y explicación de cada término; estas representaciones son aptas para integración en páginas web técnicas.

Cada variable incluye rangos típicos y fuente de estimación para facilitar diseño experimental.

n = ((Zα/2 + Zβ) × σd / Δ)²
n: número de pares. Zα/2: valor crítico para alfa bilateral (ej. 1.96 para 0.05). Zβ: valor crítico para potencia (ej. 0.84 para 80%). σd: desviación estándar de las diferencias. Δ: diferencia mínima clínicamente relevante.
σd = √(σ1² + σ2² − 2 × r × σ1 × σ2)
σ1, σ2: desviaciones estándar de cada medición. r: correlación intraclase o Pearson entre las mediciones del mismo sujeto. Rango típico de r: 0.3–0.9 según repetibilidad.
n_final = n / (1 − f)
f: fracción esperada de pérdidas (por ejemplo 0.10 para 10%). Use este ajuste para asegurar suficiencia muestral ante pérdidas.

Casos prácticos: ejemplos completos y resueltos

Ejemplo 1 — Ensayo clínico antes y después de intervención

Un investigador mide la presión arterial sistólica en 40 pacientes antes y después de un tratamiento. Desea detectar una reducción media de 5 mmHg con potencia 80% y α 0.05. A partir de estudios previos, la desviación estándar de las diferencias estimada es σd = 10 mmHg.

Calcule el tamaño de muestra requerido y determine si 40 pares son suficientes.

Paso 1: Identificar parámetros.

Δ = 5; σd = 10; Zα/2 = 1.96; Zβ = 0.84.

Paso 2: Aplicar fórmula básica.

n = ((1.96 + 0.84) × 10 / 5)² = (2.8 × 2)² = (5.6)² = 31.36 → redondear hacia arriba n = 32 pares.

Interpretación: se necesitan 32 pares para detectar 5 mmHg con 80% potencia. Con 40 pares disponibles, el estudio está adecuadamente potenciado.

Si se espera 10% de pérdidas: n_final = 32 / (1 − 0.10) = 35.56 → 36 pares, aún por debajo de 40.

Ejemplo 2 — Estudio de validación de un dispositivo biométrico

Se comparan dos dispositivos de medición de glucemia en 0 minutos y 30 minutos en 25 voluntarios. El investigador considera Δ = 0.3 mmol/L como diferencia mínima relevante. Se estima σ1 = 0.6 mmol/L, σ2 = 0.6 mmol/L y correlación r = 0.7 entre mediciones del mismo sujeto.

Calcule σd, n requerido para α 0.05 bilateral y potencia 90%, y evalúe si 25 pares son suficientes.

Paso 1: Calcular σd usando las σ individuales y r.

σd = √(0.6² + 0.6² − 2 × 0.7 × 0.6 × 0.6) = √(0.36 + 0.36 − 0.504) = √(0.216) = 0.4648 mmol/L.

Paso 2: Parámetros para potencia 90%: Zα/2 = 1.96; Zβ = 1.28.

Aplicar fórmula: n = ((1.96 + 1.28) × 0.4648 / 0.3)² = (3.24 × 1.5493)² = (1.591)² ≈ 2.531 → n ≈ 3 pares.

Interpretación: la alta correlación y baja variabilidad hacen que se necesiten muy pocos pares para detectar Δ = 0.3. Con 25 pares el estudio está sobredimensionado para este objetivo.

Advertencia: cuando n calculado es pequeño, verificar supuestos de normalidad y considerar pruebas no paramétricas o intervalos de confianza.

Consideraciones adicionales y buenas prácticas

Validación de supuestos: verificar normalidad de las diferencias (prueba de Shapiro-Wilk, inspección gráfica) y homogeneidad cuando corresponda.

Si las diferencias no son normales, considere transformaciones (log) o métodos no paramétricos como la prueba de signos apareados o de Wilcoxon, aunque estos requieren mayor n para misma potencia.

Uso de datos piloto

Realizar un estudio piloto de tamaño moderado (ej. 15–30 pares) permite estimar σd y r con mayor precisión y reducir riesgo de subdimensionamiento o sobredimensionamiento.

Reportar estimaciones de σd y sus intervalos de confianza en informes para transparencia y planificación futura.

Ajustes por diseño y análisis

  • Si se emplean covariables en análisis (ANOVA de medidas repetidas, modelos mixtos), la potencia puede incrementarse; sin embargo, el cálculo de n debe reflejar la varianza residual esperada después del ajuste.
  • Para múltiples comparaciones (puntos temporales adicionales), ajuste de alfa (Bonferroni, Holm) o uso de modelos longitudinales para controlar error tipo I.

Consultar con un estadístico para diseños complejos, efectos intragrupo y correlación estructurada en series temporales.

Recursos, normativa y referencias

Referencias técnicas y guías metodológicas para cálculos y mejores prácticas:

- Cohen J. Statistical Power Analysis for the Behavioral Sciences. Routledge. (estimaciones prácticas de tamaño efecto).

- Julious SA. Sample Sizes for Clinical Trials. Chapman & Hall/CRC.

- Guidance for industry: E9 Statistical Principles for Clinical Trials. ICH (International Council for Harmonisation).

Enlaces de autoridad:

Preguntas frecuentes técnicas

¿Qué hacer si no conozco σd?

Si no dispone de σd, estime a partir de estudios previos o realice un piloto. Alternativamente, calcule σd desde σ1, σ2 y r si estos están disponibles.

En ausencia total de datos, utilice estimaciones conservadoras (σd grande) para evitar subdimensionar el estudio.

¿Cómo redondear n?

Siempre redondear hacia arriba al entero siguiente; si el cálculo devuelve un valor muy pequeño (p. ej. n < 6), considere factores prácticos y validez estadística.

Para ensayos clínicos, coordinar con comité de ética y estadísticas para justificar tamaño muestral.

Ampliación técnica: derivación y supuestos matemáticos

Derivación breve: la estadística de prueba para medias apareadas es t = (D̄ − Δ0) / (Sd / √n), donde D̄ es la media muestral de las diferencias y Sd la desviación estándar muestral.

Para aproximación normal, sustituimos t por normal y despejamos n según el error estándar deseado para lograr Z críticos combinados.

Explicación de la derivación

  • Error estándar de la media de diferencias: SE = σd / √n.
  • Queremos que la diferencia de efecto Δ sea detectable con probabilidad 1 − β, por lo que (Zα/2 + Zβ) × SE = Δ.
  • Despejando n aparece la fórmula n = ((Zα/2 + Zβ) × σd / Δ)².

Esta derivación supone varianza conocida o muestra suficientemente grande para aproximar t por Z; para muestras pequeñas use distribución t y ajustes en el cálculo o métodos de simulación.

Recomendaciones finales para implementación en estudios

Documente claramente supuestos, fuentes de parámetros y justificación de Δ en protocolos y registros de estudio.

Use software estadístico o cálculo reproducible con scripts; siempre valide con un estadístico y ajuste por pérdidas y múltiples comparaciones cuando aplique.

Anexos: fórmulas alternativas y recursos prácticos

Fórmula usando distribución t para muestras pequeñas: n = smallest integer satisfying noncentral t based power equations (recomienda uso de software para resolución numérica).

Herramientas útiles: G*Power (software gratuito), paquetes en R (pwr, sampleSize, powerAnalysis), y módulos en Python (statsmodels).

Este documento proporciona una guía técnica completa para calcular y validar tamaños de muestra para medias apareadas, con tablas, fórmulas y ejemplos aplicables a entornos clínicos y de investigación.

Para adaptaciones específicas (diseños crossover, medidas repetidas con más de dos tiempos), consulte literatura especializada y asesórese con un estadístico.