Vicerrectoría Académica
Dirección Nacional de Innovación Académica

Capítulo 1: REGRESIÓN LINEAL

Introducción

El análisis de regresión es una técnica para investigar y modelar la relación entre variables. Aplicaciones de regresión son numerosas y ocurren en casi todos los campos, incluyendo ingeniería, la física, ciencias económicas, ciencias biológicas y de la salud, como también ciencias sociales.

Utilidad 

Utilizados para varios propósitos, incluyendo los siguientes:

1. Descripción de datos Ingenieros y científicos frecuentemente utilizan ecuaciones para resumir un conjunto de datos. El análisis de regresión es útil para describir los datos.

2. Estimación de parámetros. Uno de los casos en los cuales se utiliza el análisis de regresión para estimar parámetros es el siguiente:

Suponga que un circuito eléctrico contiene una resistencia conocida de $R$ ohms. Diferentes corrientes pasan a través del circuito y el correspondiente voltaje es medido.

El diagrama de dispersión podría indicar que el voltaje y la corriente estan relacionados por una línea recta que pasa por el orígen con pendiente $R$ (debido a que el voltaje $E$ y la corriente estan relacionados por la ley de Ohm $E=IR$). El análisis de regresión podría ser utilizado para ajustar este modelo a los datos, produciendo un estimado de la resistencia desconocida.

3. Para predicción y estimación. Algunos casos de esta utilidad del análisis de regresión son:

MATH La respuesta de un cultivo al variar la cantidad de los fertilizantes; el objetivo puede ser establecer la forma de la relación, o predecir la combinación optima de fertilizantes.

MATH La relación entre varias medidas meterológicas y la producción del cultivo; el más obvio objetivo podría ser tratar de entender los efectos meterológicos sobre el crecimiento del cultivo.

En el análisis de regresión se pueden distinguir dos tipos de variables: variables predictoras y variables respuestas. La diferencia entre variable predictora y respuesta es no siempre completamente clara y depende algunas veces de nuestros objetivos. Algunos nombres conocidos para las variables predictoras y respuestas son:

MATH

Modelo Lineal  

La más simple relación entre dos variables es una línea recta. En donde se tiene pares de observaciones de $Y$ y $\ X$ donde $Y$, la variable dependiente, se asume dependiente sobre $X$, la variable independiente. Se considera un modelo lineal cuando los parámetros ocurren de manera lineal, así por ejemplo

$\left( 1\right) :$ MATH $\Rightarrow$ Modelo lineal o de primer orden
$\left( 2\right) :$ MATH $\Rightarrow$ Modelo cuadrático o de segundo orden en una variable
$\left( 3\right) :$ MATH $\Rightarrow$ Modelo de tercer orden en una variable
$\left( 4\right) :$ MATH $\Rightarrow$ Modelo lineal o de primer orden con dos variables

En el modelo $\left( 1\right) $ existe una sola variable independiente y los parámetros tienen exponente uno. Los modelos $\left( 2\right) $ y $\left( 3\right) $ tiene una sola variable independiente pero con exponentes diferentes de uno, por lo cual se llama modelo de segundo orden y tercer orden respectivamente con una sola variable indepeniente; es de observar, que los parámetros tienen sólo exponente uno y por tanto sigue siendo un modelo lineal. El modelo $\left( 4\right) $ es un modelo lineal de primer orden pero con dos variables independientes. Los tres primeros modelos de $\left( 1\right) $ se muestran en la figura 1.


polinomios.jpg

 

Figura 1. Modelos polinomiales; (a) MATH, (b) MATH,

(c) MATH

 
Modelo Lineal  

Cuando los parámetros no se encuentran de manera lineal el modelo se llama modelo no lineal

, por ejemplo el modelo

MATH es un modelo no lineal.

Los modelos no lineales de manera general se agrupan en tres tipos. El primero involucra terminos exponenciales dados por:

MATH

El segundo tipo de modelo no lineal que es comunmente usado es basado sobre la relación recíproca, tipicamente la hipérbola rectangular. Simplemente la relación entre la enzima y la quimica cinetica puede frecuentemente ser expresada en la forma

MATH

donde $k$ seria la constante de Michaelis-Menten, o

MATH

utilizada para relacionar la fotosintesis y la intensidad de luz.

Un tercer tipo de modelo no lineal es la curva logistica, extrensivamente utilizada para representar el crecimiento de organismos desde un pequeño estado inicial, durante el cual el crecimiento es proporcional al tamaño, hasta la última etapa cuando el tamaño se aproxima a una asintota. La idea subyacente es que la taza de cambio esta relacionada con el tamaño por una ecuación diferencial

MATH

y en terminos del tamaño a diferentes tiempos, se obtiene el modelo no lineal

MATH

¿ Cómo se analiza un modelo de regresión? 

Para analizar un modelo de regresión se pueden establecer básicamente dos pasos.

Paso 1. Estimar los parámetros del modelo de regresión. Este proceso es llamado ajuste del modelo a los datos.

Paso 2. El siguiente paso de un análisis de regresión es chequear que tan bueno es el modelo ajustado. El resultado de este chequeo puede indicar si el modelo es razonable o si el ajuste original debe ser modificado.

Cómo citar este material

La cita para este recurso está presentada en formato APA. Cópiela para su reutilización

Mendoza H, Vargas J, Lopez L, Bautista G. (2002). Métodos de Regresión. Universidad Nacional de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2007315/. Licencia: Creative Commons BY-NC-ND.