A.4 Sistemas de ecuaciones algebráicas

El propósito de esta sección es el de presentar algunas propiedades de las matrices. Para ello, consideramos el sistema de ecuaciones algebráicas:

$\displaystyle \begin{matrix}a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=y_1 \\ a_{21}x...
..._{2n}x_n=y_2 \\ \vdots \\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=y_m \end{matrix}$ (A.13)

que puede escribirse en forma matricial como

$\displaystyle \mathbf{Ax}=\mathbf{y} \qquad \mathbf{A}= \begin{bmatrix}a_{11}&a...
...\mathbf{y}= \begin{bmatrix}y_{1}\\ y_{1}\\ \vdots\\ y_{m}\\ \end{bmatrix} \quad$ (A.14)

La ecuación (E.14) puede interpretarse como el sistema de ecuaciones algebraícas (E.13), como una transformación lineal $ A:\mathbb{R}^n\to\mathbb{R}^m$, o en general como una transformación lineal de un espacio vectorial de dimensión $ n$ a otro espacio vectorial de dimensióm $ m$ $ A:\mathbf{V}\to\mathbf{W}$ con $ \dim(\mathbf{V})=n$ y $ \dim(\mathbf{W})=m$.

Empleamos esta múltiple interpretación para hacer algunas definiciones y obtener ciertas conclusiones acerca de la existencia y unicidad del sistema de la solución del sistema de ecuaciones algebráicas.

Definición A.26   Codominio
El Codominio de un operador lineal $ \mathbf{A}$ es el conjunto $ \mathcal{R}(\mathbf{A})$ definido como

$\displaystyle \mathcal{R}(\mathbf{A})=\left\{\mathbf{y} \vert \exists \mathbf{x},\;\mathbf{y}=\mathbf{Ax}\right\}
$

Teorema A.10   El codominio de un operador lineal $ \mathbf{A}:\mathbf{V}\to\mathbf{W}$ es un subespacio de $ \mathbf{W}$.

Demostración A.10   Es claro que el codominio $ \mathbf{A}$ es un subconjunto de $ \mathbf{W}$, es decir $ \mathcal{R}(\mathbf{A})\subset\mathbf{W}$. Supónganse dos vectores $ \mathbf{y}_1$, $ \mathbf{y}_2$ de $ \mathcal{R}(\mathbf{A})$. Según la definición E.26 existen dos vectores $ \mathbf{x}_1$, $ \mathbf{x}_2$ en $ \mathbf{V}$ tales que

$\displaystyle \mathbf{y}_1=\mathbf{A}\mathbf{x}_1 \qquad
\mathbf{y}_2=\mathbf{A}\mathbf{x}_2
$

Gracias a la linealidad de $ \mathbf{A}$ cualquier combinación lineal de $ \mathbf{y}_1$, $ \mathbf{y}_2$ puede escribirse como

$\displaystyle \alpha_1\mathbf{y}_1+\alpha_2\mathbf{y}_2=
\alpha_1\mathbf{A}\mat...
...2\mathbf{A}\mathbf{x}_2=
\mathbf{A}(\alpha_1\mathbf{x}_1+\alpha_2\mathbf{x}_2)
$

es decir, para cualquier combinación lineal de $ \mathbf{y}_1$, $ \mathbf{y}_2$ es posible encontrar un elemento $ \mathbf{x}\in\mathbf{V}$ tal que $ \mathbf{y}=\mathbf{A}\mathbf{x}$ y por lo tanto según el teorema E.1 $ \mathcal{R}(\mathbf{A})$ es un subespacio de $ \mathbf{W}$.

Definición A.27   Rango
El rango de una matriz $ \mathbf{A}$, denotado por $ \rho(\mathbf{A})$ es la dimensión del codominio del operador lineal representado por $ \mathbf{A}$ (ver figura E.7).

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/algebra/rango}
}\end{center}

Teorema A.11   El rango de una matriz $ \mathbf{A}$ es igual el número de columnas linealmente independientes de $ \mathbf{A}$.

Demostración A.11   Si denotamos la $ i-$ésima columna de $ \mathbf{A}$ como $ \mathbf{a}_i$, es decir $ \mathbf{A}=[\mathbf{a}_1\;\mathbf{a}_2\;\cdots\;\mathbf{a}_n]$ la ecuación E.14 puede escribirse como

$\displaystyle \mathbf{y}=x_1\mathbf{a}_1+x_2\mathbf{a}_2+\cdots+x_n\mathbf{a}_n
$

es decir, $ \mathbf{y}$ es una combinación lineal de las columnas de $ \mathbf{A}$ cuyos coeficientes son $ x_1,x_2,\cdots,x_n$. El codominio de $ \mathbf{A}$ será entonces el conjunto de todas las posibles combinaciones lineales de las columnas de $ \mathbf{A}$, es decir $ \mathcal{R}(\mathbf{A})=span\{\mathbf{a}_1,\mathbf{a}_2,\cdots,\mathbf{a}_n\}$; por lo tanto la dimensión de $ \mathcal{R}(\mathbf{A})$, que es $ \rho(\mathbf{A})$, será igual al número de elementos linealmente independientes en el conjunto $ \{\mathbf{a}_1,\mathbf{a}_2,\cdots,\mathbf{a}_n\}$.

Ejemplo A.27   Considérese la transformación lineal de $ \mathbb{R}^2$ en $ \mathbb{R}^2$ representada por $ \mathbf{y}=\mathbf{A}\mathbf{x}$ en donde $ \mathbf{A}$ es la matriz

$\displaystyle \mathbf{A}=
\begin{bmatrix}
1 & 1 \\ 0 & 0
\end{bmatrix}$

Esa transformación toma un punto $ (x_1,x_2)$ en el plano y lo convierte en un punto sobre el eje horizontal (figura E.8):

$\displaystyle \mathbf{y}=
\begin{bmatrix}
1 & 1 \\ 0 & 0
\end{bmatrix}\begin{bmatrix}
x_1 \\ x_2
\end{bmatrix}=
\begin{bmatrix}
(x_1 +x_2)\\ 0
\end{bmatrix}$

El codominio de $ \mathbf{A}$, que denotamos por $ \mathcal{R}(\mathbf{A})$ resulta ser el eje horizontal, es decir, un subespacio de $ \mathbf{R}^2$. La dimensión de $ \mathcal{R}(\mathbf{A})$, que es el rango de $ \mathbf{A}$, denotado por $ \rho(\mathbf{A})$ es entonces $ 1$. Nótese que el número de columnas linealmente independientes de $ \mathbf{A}$ también es $ 1$. \begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/algebra/eje_rango_1}
}\end{center}

Ejemplo A.28   Considérese la transformación lineal de $ \mathbb{R}^2$ en $ \mathbb{R}^2$ representada por $ \mathbf{y}=\mathbf{A}\mathbf{x}$ en donde $ \mathbf{A}$ es la matriz

$\displaystyle \mathbf{A}=
\begin{bmatrix}
1 & 2 \\ 1 & 2
\end{bmatrix}$

Esa transformación toma un punto $ (x_1,x_2)$ en el plano y lo convierte en un punto sobre la recta de pendiente $ 1$ (figura E.9):

$\displaystyle \mathbf{y}=
\begin{bmatrix}
1 & 2 \\ 1 & 2
\end{bmatrix}\begin{bm...
...1 \\ x_2
\end{bmatrix}=
\begin{bmatrix}
(x_1 +2x_2)\\ (x_1 +2x_2)
\end{bmatrix}$

El codominio de $ \mathbf{A}$, que denotamos por $ \mathcal{R}(\mathbf{A})$ resulta ser la recta identidad, es decir, un subespacio de $ \mathbf{R}^2$. La dimensión de $ \mathcal{R}(\mathbf{A})$, que es el rango de $ \mathbf{A}$, denotado por $ \rho(\mathbf{A})$ es entonces $ 1$. Nótese que el número de columnas linealmente independientes de $ \mathbf{A}$ también es $ 1$. \begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/algebra/eje_rango_2}
}\end{center}

En el teorema E.14 se demuestra que el rango de una matriz no se altera al premultiplicarla o posmultiplicarla por matrices no singulares. Esto significa que las operaciones elementales sobre matrices no alteran el rango de una matriz y por lo tanto puede comprobarse que el rango también es igual el número de filas linealmente independientes de la matriz, es decir, para una matriz $ \mathbf{A}$ de dimensiones $ m\times n$ se tiene que

$\displaystyle \begin{matrix}\rho(\mathbf{A})& = & \text{Número de columnas L.I....
...\text{Número de filas L.I.} \\ \rho(\mathbf{A})&\leq & \min{(m,n)} \end{matrix}$ (A.15)

Además, puede demostrarse que una matriz es no singular si y sólo si todas sus filas y todas sus columnas son linealmente independientes,

Teorema A.12   El sistema de ecuaciones (E.14) donde $ \mathbf{A}$ es una matriz $ m\times n$ tiene solución para todo $ \mathbf{y}$ en $ \mathbf{W}$ si y solo si $ \mathcal{R}(\mathbf{A})=\mathbf{W}$, o lo que es equivalente, si y sólo si $ \rho(\mathbf{A})=m$

Demostración A.12   La demostración se desprende directamente de las definiciones E.26 y E.27

Definición A.28   Espacio Nulo
El Espacio Nulo de un operador lineal $ \mathbf{A}:\mathbf{V}\to\mathbf{W}$ es el conjunto $ \mathcal{N}(\mathbf{A})$ definido como

$\displaystyle \mathcal{N}(\mathbf{A})=\left\{\mathbf{x}\in\mathbf{V} \vert\;\mathbf{Ax}=\mathbf{0}\right\}
$

La linealidad del operador permite demostrar que el Espacio Nulo es un Subespacio de $ \mathbf{V}$. Esto permite hacer la siguiente definición

Definición A.29   Nulidad
La Nulidad de un operador lineal $ \mathbf{A}:\mathbf{V}\to\mathbf{W}$, denotada por $ \nu(\mathbf{a})$ es la dimensión del espacio nulo de $ \mathbf{A}$

El ejemplo E.29 muestra la relación existente entre el rango y la nulidad de un operador lineal $ \mathbf{A}:\mathbf{V}\to\mathbf{W}$, con $ \dim(\mathbf{V})=n$ y $ \dim(\mathbf{W})=m$ (figura E.10).

$\displaystyle \rho(\mathbf{A})+\nu(\mathbf{A})=n=\dim(\mathbf{V})$ (A.16)

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/algebra/rango_nulidad}
}\end{center}

Teorema A.13   El sistema de ecuaciones $ \mathbf{Ax}=\mathbf{0}$ con $ \mathbf{A}$ una matriz $ m\times n$ tiene una solución distinta de la trivial si y sólo si $ \rho(\mathbf{A})<n$. Si $ m=n$ esto es equivalente a decir si y sólo si $ \det(\mathbf{A})=0$

Demostración A.13   De la definición E.29 se desprende que el número de soluciones linealmente independientes de $ \mathbf{Ax}=\mathbf{0}$ es $ \nu(\mathbf{A})$. Para que exista una solución no trivial se necesita que $ \nu(\mathbf{A})\geq 1$. Empleando (E.16) esta condición se convierte en $ \rho(\mathbf{A})<n$. Si $ m=n$ entonces $ \mathbf{A}$ es cuadrada y la condición es equivalente a $ \det(\mathbf{A})=0$, ya que las columnas de $ \mathbf{A}$ serían linealmente dependientes.

Ejemplo A.29   Supóngase el sistema de ecuaciones $ \mathbf{Ax}=\mathbf{0}$ donde $ \mathbf{A}$ es la matriz $ 5\times 3$

$\displaystyle \mathbf{A}=
\begin{bmatrix}
0&1&1&0&-1\\
2&1&3&4&1\\
1&0&1&2&1
...
...
\mathbf{a}_1&\mathbf{a}_2&\mathbf{a}_3&\mathbf{a}_4&\mathbf{a}_5
\end{bmatrix}$

en donde las dos primeras columnas son linealmente independientes, pero las últimas tres no lo son ( $ \rho(\mathbf{A})=2$), ya que pueden escribirse como combinaciones lineales de las dos primeras:

$\displaystyle \mathbf{a}_3=\mathbf{a}_1+\mathbf{a}_2\qquad \mathbf{a}_4=2\mathbf{a}_1\qquad \mathbf{a}_5=\mathbf{a}_1-\mathbf{a}_2$ (A.17)

El sistema de ecuaciones $ \mathbf{Ax}=\mathbf{0}$ puede escribirse como

$\displaystyle x_1\mathbf{a}_1+x_2\mathbf{a}_2+x_3\mathbf{a}_3+x_4\mathbf{a}_4+x_5\mathbf{a}_5=\mathbf{0}
$

$\displaystyle x_1\begin{bmatrix}0\\ 2\\ 1\end{bmatrix}+ x_2\begin{bmatrix}1\\ 1...
..._5\begin{bmatrix}-1\\ 1\\ 1\end{bmatrix}= \begin{bmatrix}0\\ 0\\ 0\end{bmatrix}$ (A.18)

Empleando (E.17) la ecuación (E.18) se convierte en

$\displaystyle (x_1+x_3+2x_4+x_5)\begin{bmatrix}0\\ 2\\ 1\end{bmatrix}+ (x_2+x_3-x_5)\begin{bmatrix}1\\ 1\\ 0\end{bmatrix}= \begin{bmatrix}0\\ 0\\ 0\end{bmatrix}$ (A.19)

$\displaystyle (x_1+x_3+2x_4+x_5)\mathbf{a}_1+ (x_2+x_3-x_5)\mathbf{a}_2= \mathbf{0}$ (A.20)

Como $ \mathbf{a}_1$ y $ \mathbf{a}_2$ son linealmente independientes, (E.20) sólo puede cumplire si los coeficientes son cero, es decir si

$\displaystyle \left\{ \begin{matrix}x_1+x_3+2x_4+x_5 & =0 \\ x_2+x_3-x_5 & =0 \end{matrix} \right.$ (A.21)

El sistema de ecuaciones (E.21) tiene 5 incógnitas y 2 ecuaciones linealmente independientes, es decir, existen 3 grados de libertad para escoger los valores de $ x_i$. Dicho de otra forma, $ \nu(\mathbf{A})=3$. Nótese que $ \rho(\mathbf{A})+\nu(\mathbf{A})=n$ ($ 2+3=5$), cumpliendo con la ecuación (E.16).

Podemos escoger arbitrariamente los valores de 3 de las incógnitas $ x_i$ y deducir el valor de las otras dos, para construir una base de $ \mathcal{N}(\mathbf{A})$. Si seleccionamos $ x_1$, $ x_2$ y $ x_3$ como los trios $ (1,0,0)$, $ (0,1,0)$ y $ (0,0,1)$ tendremos los tres vectores base de $ \mathcal{N}(\mathbf{A})$:

$\displaystyle \begin{bmatrix}1\\ 0\\ 0\\ -1/2\\ 0\end{bmatrix}\qquad
\begin{bma...
... 0\\ -1/2\\ 1\end{bmatrix}\qquad
\begin{bmatrix}0\\ 0\\ 1\\ -1\\ 1\end{bmatrix}$

Teorema A.14   Sea $ \mathbf{A}$ una matriz $ m \times n$ y $ \mathbf{C}$, $ \mathbf{D}$ dos matrices no singulares cualesquiera $ n \times n$ y $ m \times m$ respectivamente. En esas condiciones se tiene que

$\displaystyle \rho(\mathbf{AC})=\rho(\mathbf{A}) \qquad
\rho(\mathbf{DA})=\rho(\mathbf{A})
$

Demostración A.14   La demostración se apoya en la desigualdad de Sylvester, que establece que si existen dos matrices $ \mathbf{A}$ y $ \mathbf{B}$ de dimensiones $ q\times n$ y $ n\times p$ entonces

$\displaystyle \rho(\mathbf{A})+\rho(\mathbf{B})-n \geq \rho(\mathbf{AB})\geq\min(\rho(\mathbf{A}),\rho(\mathbf{B}))$ (A.22)

Al aplicar (E.22) a $ \mathbf{AC}$ y $ \mathbf{DA}$ se tiene que

$\displaystyle \rho(\mathbf{A})+\rho(\mathbf{C})-n \geq
\rho(\mathbf{AC})\geq\min(\rho(\mathbf{A}),\rho(\mathbf{C}))
$

$\displaystyle \rho(\mathbf{D})+\rho(\mathbf{A})-m \geq
\rho(\mathbf{DA})\geq\min(\rho(\mathbf{D}),\rho(\mathbf{A}))
$

como $ \mathbf{C}$ y $ \mathbf{D}$ son no singulares, sus rangos son $ n$ y $ m$ respectivamente:

$\displaystyle \rho(\mathbf{A})+n-n \geq
\rho(\mathbf{AC})\geq\min(\rho(\mathbf{A}),n)
$

$\displaystyle m+\rho(\mathbf{A})-m \geq
\rho(\mathbf{DA})\geq\min(m,\rho(\mathbf{A}))
$

Por (E.15) se sabe que $ \rho(\mathbf{A})\leq\min{(m,n)}$, por lo tanto

$\displaystyle \rho(\mathbf{A}) \geq
\rho(\mathbf{AC})\geq \rho(\mathbf{A})
$

$\displaystyle \rho(\mathbf{A}) \geq
\rho(\mathbf{DA})\geq \rho(\mathbf{A})
$

Las desigualdades sólo pueden cumplirse simultáneamente si se tiene que

$\displaystyle \rho(\mathbf{A})=\rho(\mathbf{AC}) \qquad
\rho(\mathbf{A})=\rho(\mathbf{DA})
$



Documento generado usando latex2html a partir de las Notas de Clase originales redactadas por Oscar Duarte