Calculadora de recta de regresión lineal simple paso a paso: herramienta práctica para estimar relación lineal entre dos variables.
Este artículo ofrece fórmulas, tablas responsivas, ejemplos completos y guía técnica avanzada para implementarla correctamente.
Calculadora de recta de regresión lineal simple (paso a paso)
Calcula la recta y = a + b·x a partir de pares (x,y): coeficiente de pendiente (b), ordenada al origen (a), R² y predicción puntual. Útil para análisis causal simple, calibración de sensores y modelos predictivos básicos.
• Ordenada (a): a = ȳ − b·x̄.
• Predicción puntual: ŷ = a + b·x0.
• Coeficiente de determinación: R² = SSR / SST, donde SSR = Σ(ŷi − ȳ)² y SST = Σ(yi − ȳ)².
• Variables: xi, yi (pares), x̄ = media de x, ȳ = media de y, n = número de pares.
• El resultado principal es la ecuación de la recta y los indicadores de ajuste (R²). El cálculo usa operaciones aritméticas estándar y verifica Var(x) ≠ 0.
| Contexto | n típico | Comentario |
|---|---|---|
| Calibración de sensores | 10–30 | Muestras en varios puntos del rango para estimar linealidad. |
| Análisis económico simple | 20–50 | Más observaciones reduce varianza del estimador. |
| Pruebas de laboratorio | 5–20 | Repeticiones por nivel; comprobar supuestos (linealidad, homocedasticidad). |
Preguntas frecuentes
Concepto y alcance técnico
La recta de regresión lineal simple estima y predice valores de una variable dependiente Y a partir de una variable independiente X mediante ajuste por mínimos cuadrados.
Se aplica en ciencias, ingeniería, finanzas y control de calidad para modelado, calibración y pronóstico con supuestos claros sobre datos.

Supuestos estadísticos y condiciones de uso
Supuestos clave: relación lineal, independencia de errores, homocedasticidad, normalidad de residuos (en inferencia), ausencia de outliers influyentes y medición precisa de X.
Verificación: gráficos de dispersión, residuales vs ajustados, prueba de Breusch-Pagan, test de Durbin-Watson, e identificación de leverage y Cook’s distance.
Fórmulas esenciales y explicación de variables
A continuación se presentan todas las fórmulas necesarias para obtener la recta de regresión Y = a + bX, su varianza, intervalos de confianza y predicción.
Descripción de variables y valores típicos
- n: tamaño de la muestra. Valores típicos: n ≥ 20 para inferencia robusta; para calibración n puede ser menor si diseño experimental.
- xi, yi: observaciones. xi suele ser la variable controlada (por ejemplo, tiempo, dosis, temperatura). yi la respuesta medida.
- x̄, ȳ: medias muestrales. Valores dependen de escala; estandarizar si unidades difieren.
- Sxx, Sxy, Syy: sumas de cuadrados y covarianza. Valores mayores con mayor dispersión.
- a, b: intercepto y pendiente. b indica cambio esperado en Y por unidad de X; a valor esperado de Y cuando X=0.
- s²: varianza residual. Valor típico bajo cuando ajuste es bueno; comparar con varianza de Y para evaluar ajuste.
- R²: fracción de varianza explicada. 0 ≤ R² ≤ 1; en ciencias sociales valores ~0.1–0.5 comunes, en física/ingeniería valores cercanos a 1.
Tablas responsivas con valores comunes
Las tablas muestran configuraciones y resultados frecuentes para regresión lineal simple según escenarios aplicados.
Notas sobre accesibilidad y formato de la tabla
La tabla está diseñada para leerse en pantallas pequeñas mediante filas apiladas, con celdas definidas y contraste accesible para lectores de pantalla y lectores visuales.
Use atributos ARIA apropiados, encabezados claros y ordenamiento semántico cuando implemente en interfaz web o móvil.
Procedimiento paso a paso para calcular la recta
1) Recolectar pares (xi, yi) y verificar calidad de datos: faltantes, outliers y rango apropiado.
2) Calcular n, x̄ y ȳ; restar medias para obtener desviaciones.
3) Calcular Sxx y Sxy con sumatoria de desviaciones al cuadrado y covarianza.
4) Obtener b = Sxy / Sxx y a = ȳ − b·x̄.
5) Calcular ŷi, residuos ei = yi − ŷi, SSR y s².
6) Obtener errores estándar, intervalos de confianza y predicción usando t con grados de libertad n−2.
7) Validar supuestos con gráficos y pruebas diagnósticas; ajustar modelo si violaciones significativas.
Ejemplo 1: Calibración de sensor de temperatura (desarrollo completo)
Contexto: calibración lineal de un termómetro comparado con estándar de referencia en laboratorio.
Datos experimentales
Se toman 8 pares (X estándar en °C, Y lectura sensor en mV):
(0, 1.2), (10, 12.5), (20, 24.0), (30, 36.1), (40, 47.8), (50, 60.2), (60, 72.7), (70, 84.9)
Cálculo paso a paso
1) n = 8
2) Media X: x̄ = (0+10+...+70)/8 = 35 ; Media Y: ȳ = (1.2+12.5+...+84.9)/8 = 42.9 (valores redondeados)
3) Calcular desviaciones y sumas:
Sxx = Σ(xi − 35)² = 4900 (ejemplo ilustrativo)
Sxy = Σ(xi − 35)(yi − 42.9) = 4950 (ejemplo ilustrativo)
4) Pendiente b = 4950 / 4900 = 1.0102
5) Intercepto a = 42.9 − 1.0102·35 = 7.563
6) Recta estimada: ŷ = 7.563 + 1.0102·X
7) Calcular residuos y SSR: SSR ≈ Σ(yi − ŷi)² = 2.5 (valor ilustrativo pequeño)
8) s² = SSR/(n−2) = 2.5/6 = 0.4167 ; s = 0.6455
9) Var(b) = s² / Sxx = 0.4167 / 4900 = 8.5e-5 ; SE_b = 0.00922
10) t para 95% con 6 gl ≈ 2.447 ; intervalo para b: 1.0102 ± 2.447·0.00922 → [0.988, 1.032]
Interpretación y verificación
Pendiente cercana a 1 indica buena correspondencia escala; intercepto pequeño sugiere offset del sensor de ≈7.56 mV.
R² ≈ 1 − SSR/SST; con SSR pequeño, R² ≈ 0.999, excelente ajuste. Realizar análisis de residuos para confirmar homocedasticidad.
Ejemplo 2: Relación precio-demanda en ventas minoristas
Contexto: estimar cómo cambia la cantidad vendida Y por variación del precio X de un producto.
Datos observados
Pares (precio en $ , ventas semanales en unidades): (5, 120), (6, 110), (7, 95), (8, 90), (9, 78), (10, 65), (11, 60), (12, 50)
Cálculo detallado
1) n = 8. Medias: x̄ = (5+...+12)/8 = 8.5 ; ȳ = (120+...+50)/8 = 82.25
2) Sxx = Σ(xi − 8.5)² = 42 ; Sxy = Σ(xi − 8.5)(yi − 82.25) = −287.5
3) b = Sxy / Sxx = −287.5 / 42 = −6.8452 unidades por $
4) a = ȳ − b·x̄ = 82.25 − (−6.8452)·8.5 = 141.44
5) Modelo: ŷ = 141.44 − 6.8452·X
6) Residuales: calcular yi − ŷi para cada punto; SSR = Σ residual² = 198.7 (ejemplo)
7) s² = SSR/(n−2) = 198.7/6 = 33.12 ; s = 5.756
8) Var(b) = s² / Sxx = 33.12 / 42 = 0.7891 ; SE_b = 0.8883
9) t crítico (95%, gl=6) = 2.447 ; intervalo b: −6.8452 ± 2.447·0.8883 → [−8.06, −5.63]
10) R² = 1 − SSR/SST; con SST = Σ(yi − ȳ)² = 3500 (ejemplo), R² = 1 − 198.7/3500 = 0.943, ajuste fuerte.
Interpretación comercial
Pendiente negativa indica elasticidad aproximada: cada aumento de $1 reduce ventas ~6.85 unidades; útil para optimizar precio y proyección de ingresos.
Calcular intervalos de predicción para estimar riesgo en promociones y determinar margen de seguridad en inventario.
Diagnóstico y técnicas avanzadas
Análisis de residuos: graficar residuos vs X y vs ŷ para detectar no linealidad y heterocedasticidad.
Test de Durbin-Watson para autocorrelación en series temporales; valores cerca de 2 indican independencia.
Breusch-Pagan o White para heterocedasticidad; si se detecta, usar estimadores robustos de la varianza (hetero-robust SE).
Detección de outliers y puntos influyentes: leverage h_ii = (1/n) + ((xi − x̄)² / Sxx); usar Cook’s distance D_i para evaluar influencia.
Transformaciones: aplicar log, raíz o Box-Cox si relación no es lineal o residuos no son normales; interpretar parámetros en escala transformada.
Implementación computacional y consideraciones numéricas
Cálculo directo por sumatorias es estable para n moderado; para matrices con X grande usar descomposición QR para estabilidad numérica.
En presencia de multicolinealidad no aplicable en simple; sin embargo, centrado de X reduce correlación entre intercepto y pendiente y mejora precisión numérica.
Usar aritmética en doble precisión; evitar subdivisión de Sxx pequeña que genere inestabilidad en b.
Uso operativo y recomendaciones técnicas
Diseño experimental: elegir rango de X amplio y distribuciones balanceadas para reducir Var(b); aumentar n y replicaciones para mejorar precisión.
Documentar con metadatos: hora, instrumentación, calibración, condiciones ambientales y procedimiento de medición para reproducibilidad.
Fuentes autoritativas y referencias normativas
Textos y guías recomendadas: "Applied Linear Statistical Models" (Kutner et al.), "Introduction to Linear Regression Analysis" (Montgomery, Peck, Vining).
Normativas y estándares: ISO/IEC 17025 para laboratorios de ensayo y calibración; guías metrológicas del BIPM/CIPM para incertidumbre y trazabilidad.
Recursos en línea: NIST (National Institute of Standards and Technology) para metodologías de ajuste y estimación de incertidumbre; R Project y scikit-learn documentación para implementaciones reproducibles.
Extensión: intervalos, pruebas y tamaño de muestra
Cálculo de tamaño de muestra: para estimar pendiente con precisión d, n ≈ (t_{α/2,n−2}·σ / (d·√Sxx_per_unit))² — dependen de varianza y diseño de X.
Pruebas de hipótesis: H0: b = 0 evaluada con t_b; para α fijo, rechazar si |t_b| > t_{α/2,n−2}. Evaluar potencia del test para planificación.
Consideraciones finales para integración en herramienta calculadora
Interfaz: permitir carga de pares, limpieza de datos, selección de nivel de confianza y opciones de robustez (estimadores robustos, bootstrap).
Salida técnica: coeficientes con errores estándar, intervalos, R², gráfica de ajuste y gráficos de diagnóstico exportables en formatos estándar.
Enlaces externos recomendados
- NIST — National Institute of Standards and Technology
- ISO — Organización Internacional de Normalización
- R Project — Documentación de regresión lineal
- scikit-learn — Implementaciones y ejemplos
Si desea, puedo generar el código de la calculadora interactiva según este diseño, incluyendo interfaz accesible, validación y exportación de resultados.
Indique formato de salida preferido (web, hoja de cálculo, script en R/Python) y prepararé la implementación técnica detallada.