Vicerrectoría Académica
Dirección Nacional de Innovación Académica

Capítulo 1: REGRESIÓN LINEAL

Lección 1: Estimación de parámetros por mínimos cuadrados

¿Cómo determinar si se debe aplicar un modelo de regresión simple?  

Una vez se han colectado los datos se debe ubicar los puntos en un plano cartesiano donde en el eje $X$ se este la variable independiente y en el eje $Y$ la variable dependiente. Este gráfico es llamado el diagrama de dispersión. Si en el diagrama de dispersión los datos parecen ajustarse a una linea recta se debe proponer un modelo de regresión lineal simple como el dado en la ecuación $\left( 1\right) $.

El diagrama de dispersión con Excel

Para obtener el gráfico de dispersión proceda de la siguiente manera:

  1. Elabore las dos columnas con los datos de la variable $Y$ y $X$
  2. Seleccione el ícono de gráfico o en la barra de menú elija insertar y este gráfico.
  3. Elija en la ventana desplegada dispersión como tipo de gráfico y el diagrama con los puntos como subtipo de gráfico. Haga click en siguiente.
  4. Ingrese el rango de datos. Para esto haga click en la flecha roja del recuadro de rango de datos para que se minimice la ventana y luego seleccione las columnas de $X$ y $Y$. Haga click nuevamente en la flecha roja del recuadro. Tenga en cuenta que si sus datos estan en columnas ( o filas) active en series en la opción columnas (o filas).
  5. Serie. En este paso asegúrese que el rótulo de la variable respuesta esté en nombre, los valores de $X$ sean los seleccionados en la opción valores de $X$ y los valores de $Y$ en la opción valores de haga clic en siguiente
  6. Opciones de gráfico. En esta ventana se debe ingresar las opciones de gráfico como: título, eje, lineas de división, leyendas.
  7. Colocar el gráfico. En esta ventana elija donde ubicar el gráfico y luego haga click en finalizar.
¿ Cómo obtener la ecuación de regresión o modelo ajustado?  

Se le llama modelo de regresión ajustado o ecuación de regresión que relaciona a la variable $Y$ con la variable $X$ obtenida a partir de los datos de la muestra. Para obtener la ecuación de regresión o modelo ajustado se debe obtener los estimadores de los parámetros del modelo: $\beta_{0}$ y $\beta_{1}$. Estos se puede obtener mediante algunos métodos de estimación como

$\surd$ Mínimos cuadrados
$\surd$ Máxima verosimilitud

El método de mínimos cuadrados, encuentra los estimadores de los parámetros $\beta_{0}$ y $\beta_{1}$ tal que la suma de cuadrados de los residuales (diferencias entre el valor observado de $Y$ y el valor estimado $\widehat{Y}_{i}$) sea mínima. Para la aplicación del método de mínimos cuadrados se debe:

1. Escribir la suma de cuadrados del error

MATH

2. Obtener la derivada de la suma de cuadrados del error con respecto a cada parámetro del modelo; es decir MATH y MATH.

MATH

3. Igualar las derivadas a cero y simplificar (se debe sustituir $\beta_{0}$ y $\beta_{1}$ por sus respectivos estimadores $b_{0}$ y $b_{1}$).

MATH

simplificando

MATH

La anteriores ecuaciones son llamadas Ecuaciones normales.

4. Solucionar el sistema de ecuaciones o ecuaciones normales.

Despejando el valor de $b_{0}$ en la ecuación normal $\left( 1\right) $ y reemplazando en la $\left( 2\right) $ se obtiene la solución de las ecuaciones normales para $b_{1}$, llamado la pendiente de la recta ajustada.

MATH de las ecuaciones anteriores se tiene MATH las cuales son llamadas ecuaciones normales. la solución de las ecuaciones normales para MATH, la pendiente de la recta ajustada, es

MATH

Reemplazando el valor de $b_{1}$ en la ecuación normal $\left( 1\right) $ se obtiene la solución para $b_{0}$

MATH

Luego la ecuación de regresión o modelo ajustado es

MATH

Cómo citar este material

La cita para este recurso está presentada en formato APA. Cópiela para su reutilización

Mendoza H, Vargas J, Lopez L, Bautista G. (2002). Métodos de Regresión. Universidad Nacional de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2007315/. Licencia: Creative Commons BY-NC-ND.