Regresión lineal: una guía definitiva

Por el equipo editorial de Indeed

1 de julio de 2021

En estadística, la regresión lineal es una forma de examinar la relación entre dos variables. Si su trabajo implica el uso de estadísticas en las operaciones diarias, es probable que aprender sobre la regresión lineal tenga un impacto positivo en sus resultados profesionales. Saber qué es la regresión lineal y para qué usarla puede ser un buen avance profesional, pero requiere investigación y práctica. En este artículo, analizamos qué es la regresión lineal, sus principales aplicaciones, la ecuación de regresión lineal, los valores atípicos en la regresión lineal y proporcionamos un ejemplo de regresión lineal.

¿Qué es la regresión lineal?

La regresión lineal es un método para encontrar una relación lineal entre variables. Se usa comúnmente cuando se intenta determinar el valor de una variable en función del valor de otra. La variable conocida se denomina variable independiente o explicativa, mientras que la variable que desea predecir se denomina variable dependiente o de respuesta.

Hay dos tipos principales de regresión lineal:

  • Regresión lineal simple: utiliza una sola variable independiente para intentar predecir el resultado de una variable dependiente

  • Regresión lineal múltiple: utiliza dos o más variables independientes para intentar predecir el resultado de una variable dependiente

Cuando realiza una regresión lineal simple, está haciendo ciertas suposiciones sobre los datos disponibles. Ellos son:

  • Homogeneidad de la varianza: el tamaño del error predicho no es significativamente diferente en todos los valores de la variable independiente

  • Independencia de la observación: todas las observaciones dentro del conjunto de datos se recopilaron a través de métodos de muestreo estadísticamente válidos, sin relaciones ocultas entre ellos.

  • Normalidad: hay una distribución normal de los datos.

  • Una relación lineal entre variables: la regresión lineal asume que existe una relación lineal entre las variables independientes y dependientes, lo que significa que la línea que pasa por los puntos de datos es recta.

Aplicaciones de la regresión lineal

La regresión lineal se usa en múltiples campos y tiene muchos usos prácticos. Se utiliza principalmente de dos maneras:

  • Si el propósito de su uso es predecir la evolución de una variable o reducir el margen de error, normalmente se usa para comparar un modelo predictivo con un conjunto de datos observados que contiene valores de respuesta y variables explicativas. Si, después de crear el modelo, se determinan valores de variables explicativas adicionales sin los valores de respuesta correspondientes, el modelo predictivo se usa normalmente para hacer una predicción.

  • Si el propósito de usar la regresión lineal es mostrar la variación en la variable de respuesta que puede causar la variación en las variables explicativas, se puede analizar para determinar la fuerza de la relación entre las variables explicativas y de respuesta. A menudo se usa para determinar si algunas variables explicativas y de respuesta no tienen una relación lineal entre sí.

Los campos que más utilizan la regresión lineal son:

  • Estadísticas: se origina a partir de las estadísticas y se utiliza en el modelado estadístico para mostrar las relaciones entre las variables dependientes e independientes de varios conjuntos de datos.

  • Aprendizaje automático: este campo relativamente nuevo también utiliza la regresión lineal, principalmente para el modelado predictivo, con el objetivo final de limitar el margen de error de un modelo tanto como sea posible.

  • Finanzas: los profesionales de las finanzas analizan la relación lineal entre los precios de las materias primas y los precios de las acciones en las empresas que comercian con esas materias primas respectivas.

  • Ventas: los profesionales de ventas analizan la relación entre diferentes variables en un intento de predecir las ventas futuras

Ecuación de regresión lineal

La ecuación para la regresión lineal simple es:

Y = a + bX + tu

La ecuación para la regresión lineal múltiple es:

Y = a + b1 x 1 + b2 x 2 + b3 x 3 + … + b + tu

Donde:

Y = variable dependiente (o de respuesta)

X = variable independiente (o explicativa)

b = pendiente (o la inclinación de la línea del gráfico)

a = intersección (o donde la línea interseca un eje)

u = residual de regresión (o la distancia vertical entre un punto de datos y la línea de regresión)

¿Qué es la técnica de regresión de mínimos cuadrados?

La técnica de regresión de mínimos cuadrados es un tipo de análisis de regresión que tiene como objetivo determinar la línea de mejor ajuste para un conjunto de datos, que se refiere a una línea que pasa por un diagrama de dispersión de puntos de datos que mejor muestra la relación entre los puntos respectivos. Por lo general, se usa en un análisis de regresión lineal para determinar la ecuación geométrica de la línea respectiva. El análisis de regresión simple produce una línea recta, mientras que una regresión con múltiples variables puede producir una línea curva.

Valores atípicos en regresión lineal

Los valores atípicos estadísticos son puntos de datos que difieren significativamente de otras observaciones. Pueden ser causados ​​por una variabilidad anormal en el conjunto de datos, pero también pueden indicar que ocurrió un error en alguna parte del cálculo. Pueden influir significativamente en los resultados, por lo que determinar correctamente su origen es crucial para la precisión de la regresión.

Las dos formas principales de detectar valores atípicos al desarrollar modelos de regresión lineal son:

  • Distancia de Mahalanobis: Comprende medir la distancia entre un punto elegido (P) y una distribución (D). Su objetivo es medir la distancia entre P y la media de D, calculada en número de desviaciones estándar.

  • Apalancamiento: a menudo utilizado en el análisis de regresión, el apalancamiento es una forma de medir la distancia entre los valores de las variables independientes de una observación y otras observaciones.

Relacionada**: [What Does Regression Analysis Tell You?**](https://www.indeed.com/career-advice/career-development/what-does-regression-analysis-tell-you)

Ejemplo de regresión lineal

Considere este ejemplo de una regresión lineal simple:

Puede usar la regresión lineal para determinar la relación entre la edad de un automóvil determinado y su precio de venta proyectado. Como regla general, el precio de un automóvil disminuye gradualmente a medida que envejece, lo que significa que existe una relación negativa entre el precio del automóvil (Y) y su antigüedad (X). Al analizar la relación entre la antigüedad del automóvil y su precio en años anteriores, podemos crear un modelo y predecir cómo cambiaría el precio en los próximos años.

Similar Posts

Leave a Reply

Your email address will not be published.