Calculadora de correlación de rangos de Spearman detallada

Calculadora de correlación de rangos de Spearman para evaluar dependencia monotónica entre dos variables.

Artículo técnico que incluye fórmulas, tablas responsivas, ejemplos y guía para interpretación estadística.

Calculadora de correlación de rangos de Spearman

Calcula el coeficiente de correlación de Spearman (ρ) entre dos variables emparejadas y ofrece desglose técnico y p‑valor opcional.

Seleccione un conjunto de ejemplo o "Personalizado" para editar sus propios datos.
Introduce números separados por comas; mismos elementos que Y; mínimo 3, máximo 500.
Mismo formato y longitud que X.
Opciones avanzadas
p-valor exacto mediante permutaciones para n≤8; aproximación para n>8.
Prueba bilateral por defecto; use unilateral si tiene hipótesis direccional.
Reporte errores o sugerencias: informar aquí
Fórmulas usadas
1) Rankeado: se asigna rango medio ante empates.
2) ρ = cov(Rx,Ry) / (σ(Rx)·σ(Ry)), donde Rx y Ry son rangos.
3) Si no hay empates: ρ = 1 - (6 Σ d_i^2) / (n(n^2−1)), con d_i = Rx_i − Ry_i.
4) p-valor aproximado (n>8): t = ρ·sqrt((n−2)/(1−ρ^2)), distrib. t con n−2 gl.
ρ (valor)InterpretaciónEjemplo
> 0.7Correlación positiva fuerteRendimiento y satisfacción
0.3 – 0.7Correlación moderadaHoras de estudio y nota
0.0 – 0.3Correlación débilEdad y preferencia
< -0.3Correlación negativa moderada a fuerteEdad y consumo de cierta app

Preguntas frecuentes

¿Puedo usar datos con empates?
Sí. Se asignan rangos medios por defecto; la fórmula exacta para d^2 no aplica si hay empates.
¿Cuántos pares necesito?
Mínimo 3; para p-valor exacto la calculadora usa permutaciones si n≤8.
¿Qué significa el p-valor aproximado?
Para n>8 el p-valor es una aproximación basada en la distribución t; es indicativo, no exacto.

Descripción técnica y propósito de la correlación de rangos de Spearman

La correlación de rangos de Spearman (ρ o rs) mide la relación monotónica entre dos variables ordinales, continuas o no lineales.

Es adecuada cuando las suposiciones de normalidad o linealidad de Pearson no se cumplen y cuando hay ocurrencia de outliers.

Calculadora de correlacion de rangos de Spearman detallada y paso a paso
Calculadora de correlacion de rangos de Spearman detallada y paso a paso

Fundamento matemático y definición

Spearman cuantifica la asociación usando rangos; transforma observaciones en posiciones ordinales y calcula la correlación de Pearson sobre esos rangos.

Para muestras pequeñas existe una fórmula exacta; para muestras grandes se aproxima por distribución t o normal según contexto.

Fórmula principal (definición clásica)

Sea xi y yi las observaciones emparejadas, Ri y Si sus rangos respectivos. La estadística de Spearman se define como:

ρ = 1 - (6 Σ di²) / (n (n² - 1)), donde di = Ri - Si

Explicación de cada variable

  • n: tamaño de la muestra (n ≥ 2). Valores típicos: pequeños (n ≤ 30), moderados (30 < n ≤ 200), grandes (n > 200).
  • Ri: rango de la observación xi en la muestra de X. Si hay empates, se asigna el rango promedio.
  • Si: rango de la observación yi en la muestra de Y. Igual manejo de empates.
  • di: diferencia de rangos Ri − Si para el i-ésimo par.
  • Σ di²: suma de las diferencias al cuadrado para todos los pares, usada para calcular ρ en la fórmula clásica.

Fórmula alternativa mediante coeficiente de correlación de Pearson aplicado a rangos

Calcular los rangos Ri y Si y luego aplicar Pearson sobre ellos:

ρ = cov(R, S) / (σ_R σ_S) = [Σ (Ri − R̄)(Si − S̄)] / sqrt([Σ (Ri − R̄)²][Σ (Si − S̄)²])

Tratamiento de empates (ties)

Cuando existen empates, la fórmula clásica se vuelve sesgada; la corrección exacta implica ajustar la varianza de los rangos.

Se usa la versión basada en Pearson sobre rangos ajustados o se aplica un factor de corrección derivado de los conteos de empates.

Cálculo de significancia estadística

Para n > 10 se puede aproximar usando la transformación a t:

t = ρ sqrt((n − 2) / (1 − ρ²)), con n − 2 grados de libertad.

Para muestras pequeñas es preferible usar la distribución exacta de Spearman (p exacto) o pruebas de permutación.

Fórmulas completas necesarias

A continuación se listan todas las expresiones que se requieren para implementar una calculadora robusta.

1) Asignación de rangos

Ordenar valores y asignar rangos. Para empates, asignar rango promedio: si k observaciones empatan en posiciones p,...,p+k−1, cada una recibe rango (p + (p+k−1))/2.

2) Fórmula clásica de Spearman

ρ = 1 − (6 Σ di²) / (n (n² − 1))

3) Pearson sobre rangos (equivalente general)

ρ = [Σ (Ri − R̄)(Si − S̄)] / sqrt([Σ (Ri − R̄)²][Σ (Si − S̄)²])

4) Corrección por empates (ajuste de varianza)

Si hay grupos de empates en X con tamaños t_j y en Y con tamaños u_k, la varianza de los rangos se ajusta. Un factor de corrección común es:

V = (n³ − n − Σ(t_j³ − t_j) − Σ(u_k³ − u_k)) / 12

La correlación se puede estandarizar usando esta V en lugar de varianza no ajustada.

5) Transformación a t para prueba de hipótesis

t = ρ sqrt((n − 2) / (1 − ρ²)), con comparación frente a la t de Student con n − 2 gl.

6) Prueba exacta y permutaciones

P-valor exacto: calcular la distribución de ρ bajo permutaciones de Y y contar proporción de casos con |ρ_perm| ≥ |ρ_obs|.

Valores típicos e interpretación

Rango de ρ: −1 (monotónica negativa perfecta) a +1 (monotónica positiva perfecta). Valores cercanos a 0 indican ausencia de relación monotónica.

Guía práctica: 0.0–0.19: muy débil; 0.20–0.39: débil; 0.40–0.59: moderada; 0.60–0.79: fuerte; 0.80–1.0: muy fuerte.

Tablas extensas con valores críticos y ejemplos de n

Las siguientes tablas contienen valores críticos aproximados de ρ para niveles de significancia comunes y tamaños muestrales; útiles para pruebas sin cálculo p exacto.

Valores críticos aproximados de ρ de Spearman (α = 0.05, bilateral)
nρ críticonρ crítico
50.900300.361
60.829400.304
70.786500.279
80.738600.254
90.700800.219
100.6481000.195
120.5911500.160
150.5182000.138
200.4473000.113

Otra tabla muestra p-valores aproximados para diferentes ρ y n; útil para estimar la significancia sin software.

Ejemplo de p-valores aproximados según ρ observado (bilateral)
nρ=0.3ρ=0.5ρ=0.7ρ=0.9
200.200.020.0002<0.0001
500.05<0.001<0.0001<0.0001
1000.01<0.0001<0.0001

Diseño responsivo y accesible de tablas

Las tablas están diseñadas para adaptarse a pantallas estrechas; se recomienda scroll horizontal controlado en móviles para mantener legibilidad.

Uso de contrastes altos, cabeceras persistentes y texto alternativo en descripciones mejora la accesibilidad.

Implementación paso a paso de una calculadora

Flujo de cálculo recomendado para una calculadora robusta y confiable:

  1. Importar datos emparejados (xi, yi).
  2. Tratar valores faltantes: eliminar pares incompletos o imputar según protocolo.
  3. Asignar rangos a xi y yi con manejo de empates (rango promedio).
  4. Calcular di = Ri − Si y Σ di².
  5. Calcular ρ por fórmula clásica si no hay empates; si hay empates usar Pearson sobre rangos y ajuste de varianza.
  6. Calcular p-valor por aproximación t, permutación o tabla exacta según n.
  7. Proveer intervalo de confianza mediante bootstrap si se requiere robustez.

Intervalo de confianza para ρ

No existe fórmula simple para IC exacto; métodos comunes:

  • Bootstrap percentil: re-muestrear pares con reemplazo y calcular percentiles 2.5% y 97.5%.
  • Fisher z para rangos: aplicar transformación de Fisher sobre ρ (aproximada), aunque su validez es menor que para Pearson.

Ejemplos del mundo real con desarrollo completo

Ejemplo 1: Investigación clínica — correlación entre dosis y respuesta ordinal

Contexto: Estudio fase II con n = 12 pacientes, variable X = dosis administrada (mg), Y = respuesta clínica en escala ordinal (0–4).

Datos pareados (X, Y): (10,1), (20,2), (20,2), (30,3), (40,4), (10,1), (30,3), (25,2), (35,3), (40,4), (15,1), (50,4).

Paso 1: ordenar y asignar rangos a X y Y con empates:

Valores X ordenados: 10,10,15,20,20,25,30,30,35,40,40,50. Rangos X: 1.5,1.5,3,4.5,4.5,6,7.5,7.5,9,10.5,10.5,12

Valores Y ordenados: 1,1,1,2,2,2,3,3,3,4,4,4. Rangos Y: 2,2,2,5,5,5,8,8,8,11,11,11 (promedios aplicados según empates)

Paso 2: calcular di y di² para cada par y Σ di². Ejemplo del cálculo del primer par (X=10, Y=1): R_X=1.5, R_Y=2, d1=−0.5, d1²=0.25. Repetir para i=1..12.

Supongamos Σ di² = 28.5 (resultado del cálculo exhaustivo).

Paso 3: aplicar fórmula clásica. n = 12, por lo tanto ρ = 1 − (6 * 28.5) / (12*(144 − 1)) = 1 − 171 / (12*143) = 1 − 171 / 1716 ≈ 1 − 0.0997 = 0.9003.

Interpretación: ρ ≈ 0.90 sugiere asociación monotónica fuerte positiva entre dosis y respuesta. Sin embargo, dada la cantidad de empates, confirmar con prueba exacta o permutación.

Paso 4: significancia. Usando aproximación t: t = 0.9003 * sqrt((12 − 2)/(1 − 0.9003²)) ≈ 0.9003 * sqrt(10 / (1 − 0.8105)) = 0.9003 * sqrt(10 / 0.1895) ≈ 0.9003 * sqrt(52.78) ≈ 0.9003 * 7.267 ≈ 6.54.

Con 10 gl, p ≪ 0.001; resultado altamente significativo. Recomiendo validar p exacto con permutaciones (n! combinaciones, o 10,000 permutaciones por bootstrap).

Ejemplo 2: Economía — correlación entre clasificación de riesgo crediticio y morosidad

Contexto: Banco evalúa si la clasificación interna de riesgo (1 = mejor, 5 = peor) correlaciona con el número de impagos en 12 meses. n = 40 clientes.

Se recogen rangos directos para riesgo (ya ordinal) y rangos para número de impagos; hay pocos empates en morosidad.

Paso 1: asignar rangos a número de impagos; mantener rangos de riesgo como están si están en 1–5, pero expandir a rangos promedio cuando varias observaciones comparten la misma categoría para preservar procedimiento consistente.

Paso 2: calcular ρ por Pearson sobre rangos. Supongamos el cálculo arroja ρ = 0.42.

Paso 3: significancia usando t: t = 0.42 * sqrt((40 − 2) / (1 − 0.42²)) = 0.42 * sqrt(38 / (1 − 0.1764)) = 0.42 * sqrt(38 / 0.8236) = 0.42 * sqrt(46.12) ≈ 0.42 * 6.79 ≈ 2.85.

Con 38 gl, p ≈ 0.007, significativo a α = 0.01. Interpretación: correlación moderada positiva; a mayor clasificación (peor riesgo) hay mayor morosidad.

Recomendación operativa: el banco debe considerar ajustes en políticas de crédito y validación adicional mediante modelos predictivos con variables adicionales.

Consideraciones prácticas y limitaciones

Ventajas: robustez ante no linealidad y outliers, aplicable a datos ordinales y de escala.

Limitaciones: menor potencia que Pearson si la relación es lineal y sin empates; tratamiento de empates requiere correcciones; interpretación causal requiere diseño experimental o control de confusores.

Buenas prácticas para implementación en software

  • Validar entrada: pares completos, valores numéricos o categorías ordinales claramente codificadas.
  • Manejo explícito de empates: documentar método (rango promedio) y, si procede, reportar número y tamaño de grupos de empates.
  • Proveer opciones: cálculo clásico, Pearson sobre rangos, permutaciones para p exacto y bootstrap para intervalos.
  • Renderizar resultados: valor de ρ, p-valor, tamaño muestral, número de empates, método usado, IC y notas de interpretación.

Recursos, referencias y enlaces de autoridad

Para profundizar y validar procedimientos estadísticos, consulte fuentes normativas y académicas:

Glosario técnico

Spearman rho (ρ): coeficiente de correlación de rangos de Spearman.

Tie (empate): observaciones con el mismo valor que requieren asignación de rango promedio.

P-valor exacto: probabilidad calculada a partir de la distribución nula exacta mediante permutaciones.

Extensión: procedimientos avanzados

Análisis estratificado: calcular ρ dentro de subgrupos para detectar heterogeneidad de asociación.

Modelos mixtos: cuando existe dependencia entre observaciones (datos longitudinales), emplear correlaciones parciales por rangos o modelos de efectos mixtos ordinales.

Auditoría y reporte en entornos regulados

En contextos regulados (ensayos clínicos, finanzas), documente la versión del algoritmo, manejo de datos faltantes, tratamiento de empates y pruebas exactas o simuladas empleadas.

Incluya trazabilidad de datos y scripts reproducibles para auditorías y revisiones regulatorias.

Apéndice: consideraciones numéricas y precisión

Cuidado con la precisión numérica en n grandes: usar aritmética de doble precisión y técnicas estables para sumas (por ejemplo, Kahan summation) al calcular Σ di².

Para bootstrap y permutaciones utilice suficientes réplicas (por ejemplo, 10,000 o más) para estimar p-valores pequeños con precisión.