Calculadora de correlación de rangos de Spearman para evaluar dependencia monotónica entre dos variables.
Artículo técnico que incluye fórmulas, tablas responsivas, ejemplos y guía para interpretación estadística.
Calculadora de correlación de rangos de Spearman
Calcula el coeficiente de correlación de Spearman (ρ) entre dos variables emparejadas y ofrece desglose técnico y p‑valor opcional.
Opciones avanzadas
2) ρ = cov(Rx,Ry) / (σ(Rx)·σ(Ry)), donde Rx y Ry son rangos.
3) Si no hay empates: ρ = 1 - (6 Σ d_i^2) / (n(n^2−1)), con d_i = Rx_i − Ry_i.
4) p-valor aproximado (n>8): t = ρ·sqrt((n−2)/(1−ρ^2)), distrib. t con n−2 gl.
| ρ (valor) | Interpretación | Ejemplo |
|---|---|---|
| > 0.7 | Correlación positiva fuerte | Rendimiento y satisfacción |
| 0.3 – 0.7 | Correlación moderada | Horas de estudio y nota |
| 0.0 – 0.3 | Correlación débil | Edad y preferencia |
| < -0.3 | Correlación negativa moderada a fuerte | Edad y consumo de cierta app |
Preguntas frecuentes
Descripción técnica y propósito de la correlación de rangos de Spearman
La correlación de rangos de Spearman (ρ o rs) mide la relación monotónica entre dos variables ordinales, continuas o no lineales.
Es adecuada cuando las suposiciones de normalidad o linealidad de Pearson no se cumplen y cuando hay ocurrencia de outliers.

Fundamento matemático y definición
Spearman cuantifica la asociación usando rangos; transforma observaciones en posiciones ordinales y calcula la correlación de Pearson sobre esos rangos.
Para muestras pequeñas existe una fórmula exacta; para muestras grandes se aproxima por distribución t o normal según contexto.
Fórmula principal (definición clásica)
Sea xi y yi las observaciones emparejadas, Ri y Si sus rangos respectivos. La estadística de Spearman se define como:
ρ = 1 - (6 Σ di²) / (n (n² - 1)), donde di = Ri - Si
Explicación de cada variable
- n: tamaño de la muestra (n ≥ 2). Valores típicos: pequeños (n ≤ 30), moderados (30 < n ≤ 200), grandes (n > 200).
- Ri: rango de la observación xi en la muestra de X. Si hay empates, se asigna el rango promedio.
- Si: rango de la observación yi en la muestra de Y. Igual manejo de empates.
- di: diferencia de rangos Ri − Si para el i-ésimo par.
- Σ di²: suma de las diferencias al cuadrado para todos los pares, usada para calcular ρ en la fórmula clásica.
Fórmula alternativa mediante coeficiente de correlación de Pearson aplicado a rangos
Calcular los rangos Ri y Si y luego aplicar Pearson sobre ellos:
ρ = cov(R, S) / (σ_R σ_S) = [Σ (Ri − R̄)(Si − S̄)] / sqrt([Σ (Ri − R̄)²][Σ (Si − S̄)²])
Tratamiento de empates (ties)
Cuando existen empates, la fórmula clásica se vuelve sesgada; la corrección exacta implica ajustar la varianza de los rangos.
Se usa la versión basada en Pearson sobre rangos ajustados o se aplica un factor de corrección derivado de los conteos de empates.
Cálculo de significancia estadística
Para n > 10 se puede aproximar usando la transformación a t:
t = ρ sqrt((n − 2) / (1 − ρ²)), con n − 2 grados de libertad.
Para muestras pequeñas es preferible usar la distribución exacta de Spearman (p exacto) o pruebas de permutación.
Fórmulas completas necesarias
A continuación se listan todas las expresiones que se requieren para implementar una calculadora robusta.
1) Asignación de rangos
Ordenar valores y asignar rangos. Para empates, asignar rango promedio: si k observaciones empatan en posiciones p,...,p+k−1, cada una recibe rango (p + (p+k−1))/2.
2) Fórmula clásica de Spearman
ρ = 1 − (6 Σ di²) / (n (n² − 1))
3) Pearson sobre rangos (equivalente general)
ρ = [Σ (Ri − R̄)(Si − S̄)] / sqrt([Σ (Ri − R̄)²][Σ (Si − S̄)²])
4) Corrección por empates (ajuste de varianza)
Si hay grupos de empates en X con tamaños t_j y en Y con tamaños u_k, la varianza de los rangos se ajusta. Un factor de corrección común es:
V = (n³ − n − Σ(t_j³ − t_j) − Σ(u_k³ − u_k)) / 12
La correlación se puede estandarizar usando esta V en lugar de varianza no ajustada.
5) Transformación a t para prueba de hipótesis
t = ρ sqrt((n − 2) / (1 − ρ²)), con comparación frente a la t de Student con n − 2 gl.
6) Prueba exacta y permutaciones
P-valor exacto: calcular la distribución de ρ bajo permutaciones de Y y contar proporción de casos con |ρ_perm| ≥ |ρ_obs|.
Valores típicos e interpretación
Rango de ρ: −1 (monotónica negativa perfecta) a +1 (monotónica positiva perfecta). Valores cercanos a 0 indican ausencia de relación monotónica.
Guía práctica: 0.0–0.19: muy débil; 0.20–0.39: débil; 0.40–0.59: moderada; 0.60–0.79: fuerte; 0.80–1.0: muy fuerte.
Tablas extensas con valores críticos y ejemplos de n
Las siguientes tablas contienen valores críticos aproximados de ρ para niveles de significancia comunes y tamaños muestrales; útiles para pruebas sin cálculo p exacto.
| n | ρ crítico | n | ρ crítico |
|---|---|---|---|
| 5 | 0.900 | 30 | 0.361 |
| 6 | 0.829 | 40 | 0.304 |
| 7 | 0.786 | 50 | 0.279 |
| 8 | 0.738 | 60 | 0.254 |
| 9 | 0.700 | 80 | 0.219 |
| 10 | 0.648 | 100 | 0.195 |
| 12 | 0.591 | 150 | 0.160 |
| 15 | 0.518 | 200 | 0.138 |
| 20 | 0.447 | 300 | 0.113 |
Otra tabla muestra p-valores aproximados para diferentes ρ y n; útil para estimar la significancia sin software.
| n | ρ=0.3 | ρ=0.5 | ρ=0.7 | ρ=0.9 |
|---|---|---|---|---|
| 20 | 0.20 | 0.02 | 0.0002 | <0.0001 |
| 50 | 0.05 | <0.001 | <0.0001 | <0.0001 |
| 100 | 0.01 | <0.0001 | <0.0001 |
Diseño responsivo y accesible de tablas
Las tablas están diseñadas para adaptarse a pantallas estrechas; se recomienda scroll horizontal controlado en móviles para mantener legibilidad.
Uso de contrastes altos, cabeceras persistentes y texto alternativo en descripciones mejora la accesibilidad.
Implementación paso a paso de una calculadora
Flujo de cálculo recomendado para una calculadora robusta y confiable:
- Importar datos emparejados (xi, yi).
- Tratar valores faltantes: eliminar pares incompletos o imputar según protocolo.
- Asignar rangos a xi y yi con manejo de empates (rango promedio).
- Calcular di = Ri − Si y Σ di².
- Calcular ρ por fórmula clásica si no hay empates; si hay empates usar Pearson sobre rangos y ajuste de varianza.
- Calcular p-valor por aproximación t, permutación o tabla exacta según n.
- Proveer intervalo de confianza mediante bootstrap si se requiere robustez.
Intervalo de confianza para ρ
No existe fórmula simple para IC exacto; métodos comunes:
- Bootstrap percentil: re-muestrear pares con reemplazo y calcular percentiles 2.5% y 97.5%.
- Fisher z para rangos: aplicar transformación de Fisher sobre ρ (aproximada), aunque su validez es menor que para Pearson.
Ejemplos del mundo real con desarrollo completo
Ejemplo 1: Investigación clínica — correlación entre dosis y respuesta ordinal
Contexto: Estudio fase II con n = 12 pacientes, variable X = dosis administrada (mg), Y = respuesta clínica en escala ordinal (0–4).
Datos pareados (X, Y): (10,1), (20,2), (20,2), (30,3), (40,4), (10,1), (30,3), (25,2), (35,3), (40,4), (15,1), (50,4).
Paso 1: ordenar y asignar rangos a X y Y con empates:
Valores X ordenados: 10,10,15,20,20,25,30,30,35,40,40,50. Rangos X: 1.5,1.5,3,4.5,4.5,6,7.5,7.5,9,10.5,10.5,12
Valores Y ordenados: 1,1,1,2,2,2,3,3,3,4,4,4. Rangos Y: 2,2,2,5,5,5,8,8,8,11,11,11 (promedios aplicados según empates)
Paso 2: calcular di y di² para cada par y Σ di². Ejemplo del cálculo del primer par (X=10, Y=1): R_X=1.5, R_Y=2, d1=−0.5, d1²=0.25. Repetir para i=1..12.
Supongamos Σ di² = 28.5 (resultado del cálculo exhaustivo).
Paso 3: aplicar fórmula clásica. n = 12, por lo tanto ρ = 1 − (6 * 28.5) / (12*(144 − 1)) = 1 − 171 / (12*143) = 1 − 171 / 1716 ≈ 1 − 0.0997 = 0.9003.
Interpretación: ρ ≈ 0.90 sugiere asociación monotónica fuerte positiva entre dosis y respuesta. Sin embargo, dada la cantidad de empates, confirmar con prueba exacta o permutación.
Paso 4: significancia. Usando aproximación t: t = 0.9003 * sqrt((12 − 2)/(1 − 0.9003²)) ≈ 0.9003 * sqrt(10 / (1 − 0.8105)) = 0.9003 * sqrt(10 / 0.1895) ≈ 0.9003 * sqrt(52.78) ≈ 0.9003 * 7.267 ≈ 6.54.
Con 10 gl, p ≪ 0.001; resultado altamente significativo. Recomiendo validar p exacto con permutaciones (n! combinaciones, o 10,000 permutaciones por bootstrap).
Ejemplo 2: Economía — correlación entre clasificación de riesgo crediticio y morosidad
Contexto: Banco evalúa si la clasificación interna de riesgo (1 = mejor, 5 = peor) correlaciona con el número de impagos en 12 meses. n = 40 clientes.
Se recogen rangos directos para riesgo (ya ordinal) y rangos para número de impagos; hay pocos empates en morosidad.
Paso 1: asignar rangos a número de impagos; mantener rangos de riesgo como están si están en 1–5, pero expandir a rangos promedio cuando varias observaciones comparten la misma categoría para preservar procedimiento consistente.
Paso 2: calcular ρ por Pearson sobre rangos. Supongamos el cálculo arroja ρ = 0.42.
Paso 3: significancia usando t: t = 0.42 * sqrt((40 − 2) / (1 − 0.42²)) = 0.42 * sqrt(38 / (1 − 0.1764)) = 0.42 * sqrt(38 / 0.8236) = 0.42 * sqrt(46.12) ≈ 0.42 * 6.79 ≈ 2.85.
Con 38 gl, p ≈ 0.007, significativo a α = 0.01. Interpretación: correlación moderada positiva; a mayor clasificación (peor riesgo) hay mayor morosidad.
Recomendación operativa: el banco debe considerar ajustes en políticas de crédito y validación adicional mediante modelos predictivos con variables adicionales.
Consideraciones prácticas y limitaciones
Ventajas: robustez ante no linealidad y outliers, aplicable a datos ordinales y de escala.
Limitaciones: menor potencia que Pearson si la relación es lineal y sin empates; tratamiento de empates requiere correcciones; interpretación causal requiere diseño experimental o control de confusores.
Buenas prácticas para implementación en software
- Validar entrada: pares completos, valores numéricos o categorías ordinales claramente codificadas.
- Manejo explícito de empates: documentar método (rango promedio) y, si procede, reportar número y tamaño de grupos de empates.
- Proveer opciones: cálculo clásico, Pearson sobre rangos, permutaciones para p exacto y bootstrap para intervalos.
- Renderizar resultados: valor de ρ, p-valor, tamaño muestral, número de empates, método usado, IC y notas de interpretación.
Recursos, referencias y enlaces de autoridad
Para profundizar y validar procedimientos estadísticos, consulte fuentes normativas y académicas:
- Spearman, C. (1904). "The Proof and Measurement of Association between Two Things". Journal of Educational Psychology.
- Britannica — Spearman rank correlation coefficient
- R Project — implementaciones y paquetes para pruebas exactas y bootstrap
- Paquete coin (R): pruebas no paramétricas y permutaciones
- ISO — estándares para gestión de calidad de datos y procedimientos estadísticos (consulte normas específicas según sector)
Glosario técnico
Spearman rho (ρ): coeficiente de correlación de rangos de Spearman.
Tie (empate): observaciones con el mismo valor que requieren asignación de rango promedio.
P-valor exacto: probabilidad calculada a partir de la distribución nula exacta mediante permutaciones.
Extensión: procedimientos avanzados
Análisis estratificado: calcular ρ dentro de subgrupos para detectar heterogeneidad de asociación.
Modelos mixtos: cuando existe dependencia entre observaciones (datos longitudinales), emplear correlaciones parciales por rangos o modelos de efectos mixtos ordinales.
Auditoría y reporte en entornos regulados
En contextos regulados (ensayos clínicos, finanzas), documente la versión del algoritmo, manejo de datos faltantes, tratamiento de empates y pruebas exactas o simuladas empleadas.
Incluya trazabilidad de datos y scripts reproducibles para auditorías y revisiones regulatorias.
Apéndice: consideraciones numéricas y precisión
Cuidado con la precisión numérica en n grandes: usar aritmética de doble precisión y técnicas estables para sumas (por ejemplo, Kahan summation) al calcular Σ di².
Para bootstrap y permutaciones utilice suficientes réplicas (por ejemplo, 10,000 o más) para estimar p-valores pequeños con precisión.