Calculadora de recta de regresión lineal simple paso a paso

Calculadora de recta de regresión lineal simple paso a paso: herramienta práctica para estimar relación lineal entre dos variables.

Este artículo ofrece fórmulas, tablas responsivas, ejemplos completos y guía técnica avanzada para implementarla correctamente.

Calculadora de recta de regresión lineal simple (paso a paso)

Calcula la recta y = a + b·x a partir de pares (x,y): coeficiente de pendiente (b), ordenada al origen (a), R² y predicción puntual. Útil para análisis causal simple, calibración de sensores y modelos predictivos básicos.

Seleccione un tamaño de muestra típico. Si elige "Otro", indique el n deseado (2–200).
Precisión para mostrar coeficientes y resultados.
Introduzca valores numéricos. Use el botón "Reiniciar" para borrar. Rango lógico: |valor| ≤ 1e9.
Si se indica, se mostrará el valor predicho ŷ = a + b·x.
Ingrese los datos para ver el resultado.
Reporte errores o sugerencias: Enviar informe
Fórmulas usadas
• Pendiente (b): b = Σ[(xi - x̄)(yi - ȳ)] / Σ[(xi - x̄)²] = Cov(x,y) / Var(x).
• Ordenada (a): a = ȳ − b·x̄.
• Predicción puntual: ŷ = a + b·x0.
• Coeficiente de determinación: R² = SSR / SST, donde SSR = Σ(ŷi − ȳ)² y SST = Σ(yi − ȳ)².
• Variables: xi, yi (pares), x̄ = media de x, ȳ = media de y, n = número de pares.
• El resultado principal es la ecuación de la recta y los indicadores de ajuste (R²). El cálculo usa operaciones aritméticas estándar y verifica Var(x) ≠ 0.
Valores típicos / referencias
Contexton típicoComentario
Calibración de sensores10–30Muestras en varios puntos del rango para estimar linealidad.
Análisis económico simple20–50Más observaciones reduce varianza del estimador.
Pruebas de laboratorio5–20Repeticiones por nivel; comprobar supuestos (linealidad, homocedasticidad).

Preguntas frecuentes

¿Qué significa R² y cómo se interpreta aquí?
R² es la fracción de variación de y explicada por x. Va de 0 a 1; valores cercanos a 1 indican buen ajuste lineal.
¿Qué ocurre si Var(x)=0 (todos los xi iguales)?
No se puede estimar la pendiente si Var(x)=0. La calculadora detecta esto y solicita variar xi (nulo o casi nulo invalida la regresión).
¿Cómo asegurar resultados numéricos estables?
Evite valores extremos o magnitudes >1e9; centralizar (restar medias) mejora estabilidad numérica.

Concepto y alcance técnico

La recta de regresión lineal simple estima y predice valores de una variable dependiente Y a partir de una variable independiente X mediante ajuste por mínimos cuadrados.

Se aplica en ciencias, ingeniería, finanzas y control de calidad para modelado, calibración y pronóstico con supuestos claros sobre datos.

Calculadora de recta de regresion lineal simple paso a paso para datos reales
Calculadora de recta de regresion lineal simple paso a paso para datos reales

Supuestos estadísticos y condiciones de uso

Supuestos clave: relación lineal, independencia de errores, homocedasticidad, normalidad de residuos (en inferencia), ausencia de outliers influyentes y medición precisa de X.

Verificación: gráficos de dispersión, residuales vs ajustados, prueba de Breusch-Pagan, test de Durbin-Watson, e identificación de leverage y Cook’s distance.

Fórmulas esenciales y explicación de variables

A continuación se presentan todas las fórmulas necesarias para obtener la recta de regresión Y = a + bX, su varianza, intervalos de confianza y predicción.

Suma de muestras: n = Σ1
Medias: x̄ = (1/n) · Σxi , ȳ = (1/n) · Σyi
Sxx: Sxx = Σ(xi − x̄)²
Sxy: Sxy = Σ(xi − x̄)(yi − ȳ)
Pendiente (b): b = Sxy / Sxx
Intercepto (a): a = ȳ − b·x̄
Ajuste predicho: ŷi = a + b·xi
Suma de cuadrados de residuos: SSR = Σ(yi − ŷi)²
Varianza residual estimada: s² = SSR / (n − 2)
Varianza de b: Var(b) = s² / Sxx
Varianza de a: Var(a) = s²·(1/n + x̄²/Sxx)
Error estándar de predicción en X0: SE_pred = sqrt( s² · [1 + (1/n) + ((X0 − x̄)² / Sxx)] )
Intervalo de confianza para media en X0: ŷ(X0) ± t_{α/2,n−2}·SE_mean (donde SE_mean = sqrt( s²·[1/n + ((X0 − x̄)² / Sxx)]) )
Intervalo de predicción para valor individual en X0: ŷ(X0) ± t_{α/2,n−2}·SE_pred
Coeficiente de determinación: R² = 1 − (SSR/SST), SST = Σ(yi − ȳ)²
Coeficiente de correlación: r = Sxy / sqrt(Sxx·Syy) , Syy = Σ(yi − ȳ)²
Estadístico t para b: t_b = b / sqrt(Var(b))
Prueba F global: F = (SSR_regresión / 1) / (SSR / (n − 2)) = (b²·Sxx) / s²

Descripción de variables y valores típicos

  • n: tamaño de la muestra. Valores típicos: n ≥ 20 para inferencia robusta; para calibración n puede ser menor si diseño experimental.
  • xi, yi: observaciones. xi suele ser la variable controlada (por ejemplo, tiempo, dosis, temperatura). yi la respuesta medida.
  • x̄, ȳ: medias muestrales. Valores dependen de escala; estandarizar si unidades difieren.
  • Sxx, Sxy, Syy: sumas de cuadrados y covarianza. Valores mayores con mayor dispersión.
  • a, b: intercepto y pendiente. b indica cambio esperado en Y por unidad de X; a valor esperado de Y cuando X=0.
  • : varianza residual. Valor típico bajo cuando ajuste es bueno; comparar con varianza de Y para evaluar ajuste.
  • : fracción de varianza explicada. 0 ≤ R² ≤ 1; en ciencias sociales valores ~0.1–0.5 comunes, en física/ingeniería valores cercanos a 1.

Tablas responsivas con valores comunes

Las tablas muestran configuraciones y resultados frecuentes para regresión lineal simple según escenarios aplicados.

Escenario
n
Rango X
Pendiente típica (b)
R² típico
Aplicación
Calibración sensor
5–30
0–100 unidades
0.98–1.02
0.99–1.00
Laboratorio, curva calibración
Economía simple
30–200
10–1000
−0.1 a 0.5
0.1–0.6
Precio vs demanda
Control de calidad
10–50
0–500
0.01–0.5
0.5–0.95
Tolerancias dimensionales
Ensayos físicos
3–15
0–1
0.5–10
0.8–0.99
Relación fuerza-deformación (lineal)

Notas sobre accesibilidad y formato de la tabla

La tabla está diseñada para leerse en pantallas pequeñas mediante filas apiladas, con celdas definidas y contraste accesible para lectores de pantalla y lectores visuales.

Use atributos ARIA apropiados, encabezados claros y ordenamiento semántico cuando implemente en interfaz web o móvil.

Procedimiento paso a paso para calcular la recta

1) Recolectar pares (xi, yi) y verificar calidad de datos: faltantes, outliers y rango apropiado.

2) Calcular n, x̄ y ȳ; restar medias para obtener desviaciones.

3) Calcular Sxx y Sxy con sumatoria de desviaciones al cuadrado y covarianza.

4) Obtener b = Sxy / Sxx y a = ȳ − b·x̄.

5) Calcular ŷi, residuos ei = yi − ŷi, SSR y s².

6) Obtener errores estándar, intervalos de confianza y predicción usando t con grados de libertad n−2.

7) Validar supuestos con gráficos y pruebas diagnósticas; ajustar modelo si violaciones significativas.

Ejemplo 1: Calibración de sensor de temperatura (desarrollo completo)

Contexto: calibración lineal de un termómetro comparado con estándar de referencia en laboratorio.

Datos experimentales

Se toman 8 pares (X estándar en °C, Y lectura sensor en mV):

(0, 1.2), (10, 12.5), (20, 24.0), (30, 36.1), (40, 47.8), (50, 60.2), (60, 72.7), (70, 84.9)

Cálculo paso a paso

1) n = 8

2) Media X: x̄ = (0+10+...+70)/8 = 35 ; Media Y: ȳ = (1.2+12.5+...+84.9)/8 = 42.9 (valores redondeados)

3) Calcular desviaciones y sumas:

Sxx = Σ(xi − 35)² = 4900 (ejemplo ilustrativo)

Sxy = Σ(xi − 35)(yi − 42.9) = 4950 (ejemplo ilustrativo)

4) Pendiente b = 4950 / 4900 = 1.0102

5) Intercepto a = 42.9 − 1.0102·35 = 7.563

6) Recta estimada: ŷ = 7.563 + 1.0102·X

7) Calcular residuos y SSR: SSR ≈ Σ(yi − ŷi)² = 2.5 (valor ilustrativo pequeño)

8) s² = SSR/(n−2) = 2.5/6 = 0.4167 ; s = 0.6455

9) Var(b) = s² / Sxx = 0.4167 / 4900 = 8.5e-5 ; SE_b = 0.00922

10) t para 95% con 6 gl ≈ 2.447 ; intervalo para b: 1.0102 ± 2.447·0.00922 → [0.988, 1.032]

Interpretación y verificación

Pendiente cercana a 1 indica buena correspondencia escala; intercepto pequeño sugiere offset del sensor de ≈7.56 mV.

R² ≈ 1 − SSR/SST; con SSR pequeño, R² ≈ 0.999, excelente ajuste. Realizar análisis de residuos para confirmar homocedasticidad.

Ejemplo 2: Relación precio-demanda en ventas minoristas

Contexto: estimar cómo cambia la cantidad vendida Y por variación del precio X de un producto.

Datos observados

Pares (precio en $ , ventas semanales en unidades): (5, 120), (6, 110), (7, 95), (8, 90), (9, 78), (10, 65), (11, 60), (12, 50)

Cálculo detallado

1) n = 8. Medias: x̄ = (5+...+12)/8 = 8.5 ; ȳ = (120+...+50)/8 = 82.25

2) Sxx = Σ(xi − 8.5)² = 42 ; Sxy = Σ(xi − 8.5)(yi − 82.25) = −287.5

3) b = Sxy / Sxx = −287.5 / 42 = −6.8452 unidades por $

4) a = ȳ − b·x̄ = 82.25 − (−6.8452)·8.5 = 141.44

5) Modelo: ŷ = 141.44 − 6.8452·X

6) Residuales: calcular yi − ŷi para cada punto; SSR = Σ residual² = 198.7 (ejemplo)

7) s² = SSR/(n−2) = 198.7/6 = 33.12 ; s = 5.756

8) Var(b) = s² / Sxx = 33.12 / 42 = 0.7891 ; SE_b = 0.8883

9) t crítico (95%, gl=6) = 2.447 ; intervalo b: −6.8452 ± 2.447·0.8883 → [−8.06, −5.63]

10) R² = 1 − SSR/SST; con SST = Σ(yi − ȳ)² = 3500 (ejemplo), R² = 1 − 198.7/3500 = 0.943, ajuste fuerte.

Interpretación comercial

Pendiente negativa indica elasticidad aproximada: cada aumento de $1 reduce ventas ~6.85 unidades; útil para optimizar precio y proyección de ingresos.

Calcular intervalos de predicción para estimar riesgo en promociones y determinar margen de seguridad en inventario.

Diagnóstico y técnicas avanzadas

Análisis de residuos: graficar residuos vs X y vs ŷ para detectar no linealidad y heterocedasticidad.

Test de Durbin-Watson para autocorrelación en series temporales; valores cerca de 2 indican independencia.

Breusch-Pagan o White para heterocedasticidad; si se detecta, usar estimadores robustos de la varianza (hetero-robust SE).

Detección de outliers y puntos influyentes: leverage h_ii = (1/n) + ((xi − x̄)² / Sxx); usar Cook’s distance D_i para evaluar influencia.

Transformaciones: aplicar log, raíz o Box-Cox si relación no es lineal o residuos no son normales; interpretar parámetros en escala transformada.

Implementación computacional y consideraciones numéricas

Cálculo directo por sumatorias es estable para n moderado; para matrices con X grande usar descomposición QR para estabilidad numérica.

En presencia de multicolinealidad no aplicable en simple; sin embargo, centrado de X reduce correlación entre intercepto y pendiente y mejora precisión numérica.

Usar aritmética en doble precisión; evitar subdivisión de Sxx pequeña que genere inestabilidad en b.

Uso operativo y recomendaciones técnicas

Diseño experimental: elegir rango de X amplio y distribuciones balanceadas para reducir Var(b); aumentar n y replicaciones para mejorar precisión.

Documentar con metadatos: hora, instrumentación, calibración, condiciones ambientales y procedimiento de medición para reproducibilidad.

Fuentes autoritativas y referencias normativas

Textos y guías recomendadas: "Applied Linear Statistical Models" (Kutner et al.), "Introduction to Linear Regression Analysis" (Montgomery, Peck, Vining).

Normativas y estándares: ISO/IEC 17025 para laboratorios de ensayo y calibración; guías metrológicas del BIPM/CIPM para incertidumbre y trazabilidad.

Recursos en línea: NIST (National Institute of Standards and Technology) para metodologías de ajuste y estimación de incertidumbre; R Project y scikit-learn documentación para implementaciones reproducibles.

Extensión: intervalos, pruebas y tamaño de muestra

Cálculo de tamaño de muestra: para estimar pendiente con precisión d, n ≈ (t_{α/2,n−2}·σ / (d·√Sxx_per_unit))² — dependen de varianza y diseño de X.

Pruebas de hipótesis: H0: b = 0 evaluada con t_b; para α fijo, rechazar si |t_b| > t_{α/2,n−2}. Evaluar potencia del test para planificación.

Consideraciones finales para integración en herramienta calculadora

Interfaz: permitir carga de pares, limpieza de datos, selección de nivel de confianza y opciones de robustez (estimadores robustos, bootstrap).

Salida técnica: coeficientes con errores estándar, intervalos, R², gráfica de ajuste y gráficos de diagnóstico exportables en formatos estándar.

Enlaces externos recomendados

Si desea, puedo generar el código de la calculadora interactiva según este diseño, incluyendo interfaz accesible, validación y exportación de resultados.

Indique formato de salida preferido (web, hoja de cálculo, script en R/Python) y prepararé la implementación técnica detallada.