Esta guía técnica explica cómo usar una calculadora de decisión de hipótesis para rechazar o no rechazar.
Se detallan fórmulas, tablas adaptables, ejemplos y referencias normativas para implementación avanzada.
Calculadora de decisión de hipótesis: Rechazo vs No rechazo
Calcula el p-valor y determina si se rechaza o no la hipótesis nula a partir del estadístico de prueba (Z o t), el nivel de significación y la dirección de la prueba; útil para pruebas de medias y proporciones en investigación.
• p-valor (t): CDF de Student T con v grados de libertad, F_t. Igual que Z pero usando F_t en lugar de Φ.
• Decisión: Rechazar H0 si p ≤ α; No rechazar si p > α.
• Variables:
z o t = estadístico de prueba observado.
α = nivel de significación (probabilidad de error tipo I).
v = grados de libertad (solo para t).
• Cálculo técnico: se usa la CDF adecuada (normal o t) para obtener p-valor; para t se calcula la integral de la densidad y para cuantiles se realiza búsqueda numérica.
Valores típicos / referencias
| Concepto | Valor típico / comentario |
|---|---|
| α habitual | 0.05 (5%) — uso estándar en ciencias sociales |
| α más conservador | 0.01 (1%) — ciencias físicas, medicina |
| Pruebas bilaterales | Uso cuando no se conoce la dirección del efecto |
| t vs Z | t para n pequeño (df bajos) o desviación estimada; Z para grandes muestras |
Preguntas frecuentes
Fundamento teórico de la decisión en pruebas de hipótesis
La prueba de hipótesis evalúa evidencia muestral contra una hipótesis nula mediante una estadística de prueba.
Elementos esenciales
- Nivel de significancia (α): probabilidad de error tipo I aceptada.
- Hipótesis nula (H0) y alternativa (H1): formulación direccional o bilateral.
- Estadística de prueba: z, t, χ², F u otras según modelo.
- Región crítica y valor p: criterios para rechazar H0.
Flujo operativo de una calculadora de decisión
Entrada: datos muestrales, tipo de prueba, α y parámetros poblacionales.

Procesamiento: cálculo de estadística, comparación con criterio y salida de decisión y p-valor.
Tablas con valores comunes para decisión de hipótesis (respon-sive)
Las tablas siguientes incluyen valores críticos y percentiles más usados en pruebas z, t, χ² y F.
| α | α/2 | z crítico |
|---|---|---|
| 0.10 | 0.05 | ±1.645 |
| 0.05 | 0.025 | ±1.96 |
| 0.01 | 0.005 | ±2.575 |
| 0.001 | 0.0005 | ±3.291 |
| df | t crítico (α=0.05) |
|---|---|
| 1 | 12.706 |
| 5 | 2.571 |
| 10 | 2.228 |
| 20 | 2.086 |
| 30 | 2.042 |
| 60 | 2.000 |
| ∞ | 1.960 |
| df | χ² crítico |
|---|---|
| 1 | 3.841 |
| 2 | 5.991 |
| 5 | 11.070 |
| 10 | 18.307 |
| 20 | 31.410 |
| df1\df2 | 5 | 10 | 20 | 30 |
|---|---|---|---|---|
| 1 | 6.61 | 4.96 | 4.35 | 4.17 |
| 2 | 4.74 | 3.88 | 3.49 | 3.35 |
| 5 | 3.33 | 2.71 | 2.34 | 2.21 |
| 10 | 2.98 | 2.35 | 1.94 | 1.81 |
Fórmulas necesarias para la calculadora de decisión
A continuación se presentan expresiones estructuradas para implementar cálculo y decisión sin dependencias externas.
Prueba z para media (población σ conocida)
Variables:
- x̄: media muestral. Valores típicos: según datos, p. ej. 100.
- μ0: media bajo H0. Típico: 100 o valor objetivo.
- σ: desviación estándar poblacional conocida. Típico: 10, 15.
- n: tamaño de la muestra. Típico: 30, 50, 100.
Prueba t para media (σ desconocida)
Variables:
- s: desviación estándar muestral. Valores típicos: calculados por datos, ej. 12.
- df: grados de libertad = n − 1.
Prueba z para proporciones
Variables:
- p̂: proporción muestral (x / n). Ej.: 0.45, 0.60.
- p0: proporción bajo H0. Ej.: 0.5.
- n: tamaño muestral. Recomendado n·p0≥5 y n·(1−p0)≥5.
Prueba χ² para varianza
Variables:
- s²: varianza muestral. Valores típicos: según datos.
- σ0²: varianza bajo H0. Ej.: 25, 100.
- df: n − 1.
Prueba F para comparación de varianzas
Variables:
- s1²: varianza de la muestra 1 (mayor).
- s2²: varianza de la muestra 2 (menor).
- df1 = n1 −1, df2 = n2 −1.
Valor p y regla de decisión
El valor p corresponde a la probabilidad de observar una estadística tan extrema bajo H0.
Decisión:
- Si p ≤ α: rechazar H0.
- Si p > α: no rechazar H0.
Implementación práctica de una calculadora de decisión
Las funciones clave incluyen: cálculo de estadística, obtención del valor p y comparación con α; además manejo de tipo de prueba.
Pasos para codificar la lógica
- Validar entradas: n, datos, tipo de prueba y α.
- Seleccionar estadística apropiada (z, t, χ², F, z proporción).
- Calcular estadística con las fórmulas anteriores.
- Calcular valor p usando funciones de distribución acumulada.
- Comparar p con α y producir salida: p-valor, estadística, decisión, intervalo de confianza si aplica.
Ejemplos del mundo real con desarrollo completo
Se presentan dos casos completos: prueba de media con σ desconocida y prueba de proporciones comparando tasas de conversión.
Caso 1: Comparación de media de tiempo de respuesta (t bilateral)
Contexto: un servicio quiere validar que el tiempo medio de respuesta es 15 minutos (H0: μ=15).
Datos: n=25, x̄=13.2 minutos, s=4.1 minutos, α=0.05, prueba bilateral.
Paso 1 — Estadística: t = (x̄ − μ0) / (s / √n) t = (13.2 − 15) / (4.1 / √25) = (−1.8) / (4.1 / 5) = −1.8 / 0.82 = −2.195 df = 24
Paso 2 — Valor p: Para t = −2.195 (bilateral) con df=24, p = 2·P(T ≤ −2.195) ≈ 2·0.019 = 0.038 (aprox).
Paso 3 — Decisión: p = 0.038 < α = 0.05 ⇒ Rechazar H0. Interpretación: evidencia estadísticamente significativa de que la media difiere de 15 minutos.
Paso 4 — Intervalo de confianza 95%: IC = x̄ ± t_{0.025,24}·(s/√n) t_{0.025,24} ≈ 2.064 IC = 13.2 ± 2.064·0.82 = 13.2 ± 1.692 ⇒ [11.508,14.892]
Caso 2: Prueba de proporciones (z unilateral)
Contexto: una tienda online afirma una tasa de conversión ≥ 10%. Se toma muestra para verificar si la tasa real es menor.
Datos: n=400, x=32 conversiones ⇒ p̂=32/400=0.08, p0=0.10, α=0.05, prueba unilateral a la izquierda (H1: p < 0.10).
Paso 1 — Estadística: z = (p̂ − p0) / √(p0(1−p0)/n) z = (0.08 − 0.10) / √(0.10·0.90/400) z = (−0.02) / √(0.09/400) = −0.02 / √0.000225 = −0.02 / 0.015 = −1.333
Paso 2 — Valor p: Prueba unilateral izquierda ⇒ p = P(Z ≤ −1.333) ≈ 0.0918
Paso 3 — Decisión: p = 0.0918 > α = 0.05 ⇒ No rechazar H0. Interpretación: no hay evidencia suficiente para afirmar que la tasa es menor al 10%.
Validación robusta y consideraciones avanzadas
Control de supuestos: normalidad, independencia, tamaño muestral y homogeneidad de varianzas según prueba seleccionada.
Correcciones: uso de corrección de continuidad para proporciones con n pequeño; ajuste de Welch para t con varianzas desiguales.
Pruebas de potencia y tamaño de muestra
Es esencial calcular potencia (1−β) y tamaño de muestra requerido para detectar efectos prácticos relevantes.
Fórmula aproximada para diferencia de medias (σ conocida): n = ( (z_{1−α/2}+z_{1−β})² · σ² ) / δ² donde δ es la diferencia mínima detectable.
Accesibilidad y experiencia de usuario en la calculadora
Interfaz debería permitir introducir datos, seleccionar prueba, mostrar pasos del cálculo y ofrecer ayuda contextual.
Resultados deben ser presentados con etiquetas ARIA, tablas responsivas y colores con contraste suficiente.
Referencias normativas y recursos de autoridad
Normas y guías relevantes para pruebas estadísticas y aseguramiento de calidad:
- ISO/IEC 17025: Requisitos generales para la competencia de laboratorios de ensayo y calibración — aplica en validación de métodos estadísticos en laboratorio. Fuente: https://www.iso.org
- American Statistical Association: políticas sobre p- valores y prácticas reproducibles — https://www.amstat.org
- Textos de referencia: Casella y Berger, "Statistical Inference"; Student (Gosset) sobre t; Fisher sobre pruebas de significancia.
Recursos online de autoridad para funciones de distribución y tablas: NIST Digital Library of Mathematical Functions, R documentation, y publicaciones de la Organización Mundial de la Salud para análisis epidemiológicos.
Buenas prácticas para SEO técnico y publicación
Estructurar contenido con encabezados semánticos y atributos ARIA mejora accesibilidad y posicionamiento.
Incluir meta descripciones, datos estructurados y ejemplos reales con datos reproducibles para aumentar confianza y replicabilidad.
Ampliación técnica: manejo de muestras pequeñas y no paramétricas
Si supuestos paramétricos no se cumplen, emplear pruebas no paramétricas: Wilcoxon, Mann-Whitney, Kruskal-Wallis según caso.
Para proporciones con n pequeño usar prueba exacta de Fisher en tablas 2×2 en lugar de aproximación z.
Test de homogeneidad y ajustes múltiples
En comparaciones múltiples, controlar tasa de error familiar con correcciones de Bonferroni, Holm o FDR de Benjamini-Hochberg.
Ejemplo breve: k comparaciones, α' = α/k para Bonferroni o aplicar p-valor ajustado con procedimiento elegido.
Checklist de verificación antes de aceptar resultados
- ¿Son válidos los supuestos de la prueba seleccionada?
- ¿Se usó α apropiado y fue informado?
- ¿Se calculó el tamaño muestral y la potencia para efectos relevantes?
- ¿Se ajustaron p-valores en comparaciones múltiples?
- ¿Se comunicaron intervalos de confianza junto con decisión de rechazo/no rechazo?
Recursos para implementación programática
Librerías estadísticas confiables: R (stats), Python (scipy.stats), y entornos probados en producción para cálculos de p-valor y funciones acumuladas.
Documentación recomendada: manuales de scipy, CRAN packages, y guías NIST para algoritmos numéricos de distribución acumulada.
Notas finales técnicas
Registre todos los supuestos, versiones de librerías y tablas de referencia utilizadas para auditoría y reproducibilidad.
Para aplicaciones críticas, implemente tests unitarios y validación cruzada con tablas manuales y simulaciones Monte Carlo.