Calculadora de tamaño de muestra para medias apareadas determina el número necesario de pares en estudios antes/después.
Este artículo ofrece fórmulas, tablas, ejemplos completos y guía normativa para implementar cálculos precisos.
Calculadora de tamaño de muestra para medias apareadas
Calcula el número mínimo de pares necesarios en un estudio de medidas apareadas (antes-después o casos apareados) para detectar una diferencia media esperada con un nivel de significación y potencia deseados.
n = [ (Z_{1−α/2} + Z_{potencia}) * σd / Δ ]^2
• Variables:
Δ = diferencia media esperada entre pares (valor absoluto).
σd = desviación estándar de las diferencias (post − pre).
Z_{1−α/2} = cuantíl de la Normal estándar para α bilateral (si selecciona unilateral usa Z_{1−α}).
Z_{potencia} = cuantíl de la Normal estándar para la potencia requerida (ej. 0.84 para 80%).
• Interpretación: se calcula n (número de pares). Se redondea hacia arriba al entero más próximo porque se requieren sujetos completos.
| Contexto | σd (desv. diferencias) | Δ clínico típico |
|---|---|---|
| Presión arterial sistólica (mmHg) | 8–12 | 5 mmHg |
| Puntaje de dolor (escala 0–10) | 1.5–3 | 1 punto |
| Glucemia en ayunas (mmol/L) | 0.8–1.5 | 0.5 mmol/L |
| Test funcional (segundos) | 2–6 | 2 seg |
Preguntas frecuentes
Concepto y aplicación de medias apareadas
Las medias apareadas se usan cuando cada sujeto tiene dos mediciones relacionadas: antes y después, o dos condiciones emparejadas.
El análisis aprovecha la correlación intra-sujeto para aumentar la potencia estadística respecto a muestras independientes.

Planteamiento estadístico y parámetros clave
En diseños apareados se evalúa la diferencia D = X1 - X2 por sujeto; la media y desviación estándar de D son los insumos del cálculo.
Parámetros: efecto clínico mínimo relevante (Δ), desviación estándar de las diferencias (σd), alfa, potencia y dirección del contraste.
Parámetros detallados
- Δ (delta): diferencia mínima de interés que se desea detectar (media de las diferencias).
- σd: desviación estándar de las diferencias entre las dos mediciones por sujeto.
- α: riesgo tipo I (nivel de significación), comúnmente 0.05.
- β: riesgo tipo II; potencia = 1 - β, típicamente 0.8 o 0.9.
- Zα/2 o Zα: valores críticos de la distribución normal para pruebas bilaterales o unilaterales.
- Zβ: valor crítico asociado a la potencia deseada.
- n: número de pares requeridos.
Fórmulas fundamentales para cálculo de tamaño de muestra en medias apareadas
La formulación básica asume que la distribución de las diferencias es aproximadamente normal y usa la desviación estándar de las diferencias.
A continuación se presentan las expresiones y su derivación, con explicaciones por variable y valores típicos.
Fórmula básica (prueba bilateral)
n = ((Zα/2 + Zβ) * σd / Δ)^2
Variables: Zα/2 = cuantil normal para α/2; Zβ = cuantil normal para potencia; σd = desviación estándar de diferencias; Δ = diferencia mínima relevante.
Fórmula para prueba unilateral
n = ((Zα + Zβ) * σd / Δ)^2
Se usa cuando la hipótesis alternativa tiene dirección conocida (por ejemplo, X1 > X2).
Ajuste por pérdida de seguimiento
n_final = n / (1 - f)
f = fracción esperada de pares perdidos (porcentaje/100). Ej.: si se espera 10% de pérdida, f = 0.10.
Ajuste por correlación entre mediciones (cuando se conoce σ de cada medición y r)
Si solo se conocen σ1, σ2 y correlación r entre X1 y X2, entonces σd = sqrt(σ1^2 + σ2^2 - 2 r σ1 σ2)
Valores típicos: σ1≈σ2 en mediciones simétricas; r puede ser 0.3–0.8 dependiendo de la repetibilidad.
Cálculo de Z críticos (valores típicos)
- Zα/2 para α=0.05 → 1.96
- Zα/2 para α=0.01 → 2.575
- Zα para α=0.05 (unilateral) → 1.645
- Zβ para potencia 0.8 → 0.84
- Zβ para potencia 0.9 → 1.28
Interpretación y consejos prácticos para seleccionar parámetros
Seleccione Δ basado en relevancia clínica o mínima diferencia detectable con impacto real; evite elegir Δ demasiado pequeño sin justificación.
Estimate σd usando datos piloto, literatura o estudios previos; si no, realice un estudio piloto para estimar variabilidad.
Tablas con valores más comunes
A continuación se presentan tablas responsivas con combinaciones frecuentes de parámetros y n calculado. Las tablas están optimizadas para visualización en escritorio y móviles.
Las tablas incluyen α 0.05 bilateral y potencias 80% y 90%, σd típicas y distintos Δ representativos.
| σd | Δ | α | Potencia | Zα/2 | Zβ | n (pares) |
|---|---|---|---|---|---|---|
| 2.0 | 1.0 | 0.05 | 0.8 | 1.96 | 0.84 | 20 |
| 2.0 | 0.5 | 0.05 | 0.8 | 1.96 | 0.84 | 80 |
| 3.0 | 1.5 | 0.05 | 0.8 | 1.96 | 0.84 | 20 |
| 3.0 | 1.0 | 0.05 | 0.8 | 1.96 | 0.84 | 71 |
| 1.5 | 0.5 | 0.05 | 0.9 | 1.96 | 1.28 | 57 |
| 1.0 | 0.5 | 0.05 | 0.8 | 1.96 | 0.84 | 16 |
| 0.8 | 0.2 | 0.05 | 0.9 | 1.96 | 1.28 | 101 |
| 5.0 | 2.0 | 0.05 | 0.8 | 1.96 | 0.84 | 44 |
| 4.0 | 2.0 | 0.05 | 0.9 | 1.96 | 1.28 | 71 |
| 2.5 | 1.0 | 0.05 | 0.8 | 1.96 | 0.84 | 43 |
Tabla explicativa: interpretación rápida
Las entradas muestran cómo aumenta n cuando Δ disminuye o σd aumenta; la potencia mayor eleva n considerablemente.
Use estas tablas como referencia inicial y ajuste con estimaciones específicas del estudio o piloto.
Representación visual de fórmulas y componentes
Para claridad se muestran expresiones con resaltado y explicación de cada término; estas representaciones son aptas para integración en páginas web técnicas.
Cada variable incluye rangos típicos y fuente de estimación para facilitar diseño experimental.
Casos prácticos: ejemplos completos y resueltos
Ejemplo 1 — Ensayo clínico antes y después de intervención
Un investigador mide la presión arterial sistólica en 40 pacientes antes y después de un tratamiento. Desea detectar una reducción media de 5 mmHg con potencia 80% y α 0.05. A partir de estudios previos, la desviación estándar de las diferencias estimada es σd = 10 mmHg.
Calcule el tamaño de muestra requerido y determine si 40 pares son suficientes.
Paso 1: Identificar parámetros.
Δ = 5; σd = 10; Zα/2 = 1.96; Zβ = 0.84.
Paso 2: Aplicar fórmula básica.
n = ((1.96 + 0.84) × 10 / 5)² = (2.8 × 2)² = (5.6)² = 31.36 → redondear hacia arriba n = 32 pares.
Interpretación: se necesitan 32 pares para detectar 5 mmHg con 80% potencia. Con 40 pares disponibles, el estudio está adecuadamente potenciado.
Si se espera 10% de pérdidas: n_final = 32 / (1 − 0.10) = 35.56 → 36 pares, aún por debajo de 40.
Ejemplo 2 — Estudio de validación de un dispositivo biométrico
Se comparan dos dispositivos de medición de glucemia en 0 minutos y 30 minutos en 25 voluntarios. El investigador considera Δ = 0.3 mmol/L como diferencia mínima relevante. Se estima σ1 = 0.6 mmol/L, σ2 = 0.6 mmol/L y correlación r = 0.7 entre mediciones del mismo sujeto.
Calcule σd, n requerido para α 0.05 bilateral y potencia 90%, y evalúe si 25 pares son suficientes.
Paso 1: Calcular σd usando las σ individuales y r.
σd = √(0.6² + 0.6² − 2 × 0.7 × 0.6 × 0.6) = √(0.36 + 0.36 − 0.504) = √(0.216) = 0.4648 mmol/L.
Paso 2: Parámetros para potencia 90%: Zα/2 = 1.96; Zβ = 1.28.
Aplicar fórmula: n = ((1.96 + 1.28) × 0.4648 / 0.3)² = (3.24 × 1.5493)² = (1.591)² ≈ 2.531 → n ≈ 3 pares.
Interpretación: la alta correlación y baja variabilidad hacen que se necesiten muy pocos pares para detectar Δ = 0.3. Con 25 pares el estudio está sobredimensionado para este objetivo.
Advertencia: cuando n calculado es pequeño, verificar supuestos de normalidad y considerar pruebas no paramétricas o intervalos de confianza.
Consideraciones adicionales y buenas prácticas
Validación de supuestos: verificar normalidad de las diferencias (prueba de Shapiro-Wilk, inspección gráfica) y homogeneidad cuando corresponda.
Si las diferencias no son normales, considere transformaciones (log) o métodos no paramétricos como la prueba de signos apareados o de Wilcoxon, aunque estos requieren mayor n para misma potencia.
Uso de datos piloto
Realizar un estudio piloto de tamaño moderado (ej. 15–30 pares) permite estimar σd y r con mayor precisión y reducir riesgo de subdimensionamiento o sobredimensionamiento.
Reportar estimaciones de σd y sus intervalos de confianza en informes para transparencia y planificación futura.
Ajustes por diseño y análisis
- Si se emplean covariables en análisis (ANOVA de medidas repetidas, modelos mixtos), la potencia puede incrementarse; sin embargo, el cálculo de n debe reflejar la varianza residual esperada después del ajuste.
- Para múltiples comparaciones (puntos temporales adicionales), ajuste de alfa (Bonferroni, Holm) o uso de modelos longitudinales para controlar error tipo I.
Consultar con un estadístico para diseños complejos, efectos intragrupo y correlación estructurada en series temporales.
Recursos, normativa y referencias
Referencias técnicas y guías metodológicas para cálculos y mejores prácticas:
- Cohen J. Statistical Power Analysis for the Behavioral Sciences. Routledge. (estimaciones prácticas de tamaño efecto).
- Julious SA. Sample Sizes for Clinical Trials. Chapman & Hall/CRC.
- Guidance for industry: E9 Statistical Principles for Clinical Trials. ICH (International Council for Harmonisation).
Enlaces de autoridad:
- European Medicines Agency (EMA) — Guías regulatorias y estándares estadísticos.
- U.S. Food & Drug Administration (FDA) — Recomendaciones para diseño de estudios clínicos.
- PubMed / NCBI — Artículos y estudios sobre variabilidad y reproducibilidad.
Preguntas frecuentes técnicas
¿Qué hacer si no conozco σd?
Si no dispone de σd, estime a partir de estudios previos o realice un piloto. Alternativamente, calcule σd desde σ1, σ2 y r si estos están disponibles.
En ausencia total de datos, utilice estimaciones conservadoras (σd grande) para evitar subdimensionar el estudio.
¿Cómo redondear n?
Siempre redondear hacia arriba al entero siguiente; si el cálculo devuelve un valor muy pequeño (p. ej. n < 6), considere factores prácticos y validez estadística.
Para ensayos clínicos, coordinar con comité de ética y estadísticas para justificar tamaño muestral.
Ampliación técnica: derivación y supuestos matemáticos
Derivación breve: la estadística de prueba para medias apareadas es t = (D̄ − Δ0) / (Sd / √n), donde D̄ es la media muestral de las diferencias y Sd la desviación estándar muestral.
Para aproximación normal, sustituimos t por normal y despejamos n según el error estándar deseado para lograr Z críticos combinados.
Explicación de la derivación
- Error estándar de la media de diferencias: SE = σd / √n.
- Queremos que la diferencia de efecto Δ sea detectable con probabilidad 1 − β, por lo que (Zα/2 + Zβ) × SE = Δ.
- Despejando n aparece la fórmula n = ((Zα/2 + Zβ) × σd / Δ)².
Esta derivación supone varianza conocida o muestra suficientemente grande para aproximar t por Z; para muestras pequeñas use distribución t y ajustes en el cálculo o métodos de simulación.
Recomendaciones finales para implementación en estudios
Documente claramente supuestos, fuentes de parámetros y justificación de Δ en protocolos y registros de estudio.
Use software estadístico o cálculo reproducible con scripts; siempre valide con un estadístico y ajuste por pérdidas y múltiples comparaciones cuando aplique.
Anexos: fórmulas alternativas y recursos prácticos
Fórmula usando distribución t para muestras pequeñas: n = smallest integer satisfying noncentral t based power equations (recomienda uso de software para resolución numérica).
Herramientas útiles: G*Power (software gratuito), paquetes en R (pwr, sampleSize, powerAnalysis), y módulos en Python (statsmodels).
Este documento proporciona una guía técnica completa para calcular y validar tamaños de muestra para medias apareadas, con tablas, fórmulas y ejemplos aplicables a entornos clínicos y de investigación.
Para adaptaciones específicas (diseños crossover, medidas repetidas con más de dos tiempos), consulte literatura especializada y asesórese con un estadístico.