Subsecciones


6.8 Introducción al control por variable de estado

El esquema básico de control por variable de estado se muestra en la figura 6.16. La estrategia, que es igualmente válida para sistemas continuos y discretos consiste en utilizar las variables de estado $ \mathbf{x}$ para realimentar el sistema mediante una matriz $ \mathbf{K}$, y comparar el estado con unas señales de referencia $ \mathbf{r}$, de donde se tiene que

$\displaystyle \mathbf{u}=\mathbf{r}+\mathbf{Kx}$ (6.71)

Para que (6.71) tenga sentido, las dimensiones de las variables involucradas deben ser las siguientes:

$\displaystyle \mathbf{u}_{p \times 1}=
\mathbf{r}_{p \times 1}+
\mathbf{K}_{p \times n}
\mathbf{x}_{n \times 1}
$

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/estado/estado_ctl}
}\end{center}

Podemos emplear los diagramas de bloques de la representación en variable de estado para sistemas continuos y discretos que se muestran en las figuras 6.5 y 6.6 para complementar la figura 6.16. El resultado se muestra en las figuras 6.17 y 6.18

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/estado/estado_ctl_con}
}\end{center}

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/estado/estado_ctl_dis}
}\end{center}

Combinando las ecuaciones (6.21) y (6.22) con (6.71) se obtienen las ecuaciones de estado para sistemas continuos y discretos con realimentación por variable de estado:

\begin{equation*}
\left\{
\begin{aligned}
\mathbf{\dot x}(t) & = \mathbf{Ax}(t)+...
...t)+\mathbf{D}[\mathbf{r}(t)+\mathbf{Kx}(t)]
\end{aligned}\right.
\end{equation*}

\begin{equation*}
\left\{
\begin{aligned}
\mathbf{x}(k+1) & = \mathbf{Ax}(k)+\ma...
...k)+\mathbf{D}[\mathbf{r}(k)+\mathbf{Kx}(k)]
\end{aligned}\right.
\end{equation*}

que pueden reescribirse como

\begin{equation*}
\left\{
\begin{aligned}
\mathbf{\dot x}(t) & = [\mathbf{A}+\ma...
...C}+\mathbf{DK}]\mathbf{x}(t)+\mathbf{Dr}(t)
\end{aligned}\right.
\end{equation*}

\begin{equation*}
\left\{
\begin{aligned}
\mathbf{x}(k+1) & = [\mathbf{A}+\mathb...
...C}+\mathbf{DK}]\mathbf{x}(k)+\mathbf{Dr}(k)
\end{aligned}\right.
\end{equation*}

Se obtienen entonces unos nuevos sistemas para los que las entradas son $ \mathbf{r}$, las salidas son $ \mathbf{u}$ y las variables de estado son $ \mathbf{x}$ (ver figura 6.16). Si definimos $ \mathbf{\bar A}=\mathbf{A}+\mathbf{BK}$ y $ \mathbf{\bar C}=\mathbf{C}+\mathbf{DK}$ las ecuaciones de estos nuevos sistemas serán

\begin{equation*}\left\{ \begin{aligned}\mathbf{\dot x}(t) & = \mathbf{\bar A}\m...
...ad & \mathbf{\bar C}=\mathbf{C}+\mathbf{DK} \end{aligned} \right.\end{equation*}

\begin{equation*}\left\{ \begin{aligned}\mathbf{x}(k+1) & = \mathbf{\bar A}\math...
...ad & \mathbf{\bar C}=\mathbf{C}+\mathbf{DK} \end{aligned} \right.\end{equation*}

Dado que el comportamiento de los sistemas descritos por (6.72) y (6.73) dependen de los valores propios de $ \mathbf{\bar A}$, se desprende que la estrategia de control por variable de estado consiste en establecer un sistema como el de la figura 6.16 y seleccionar una matriz $ \mathbf{K}$ tal que los valores propios de $ \mathbf{\bar A}$ en (6.72) y (6.73) sean los deseados.

Como este no es un texto de control, no abordaremos el problema de cómo obtener esa matriz $ \mathbf{K}$. Sin embargo, resaltamos que esta estrategia plantea al menos dos interrogantes:

  1. ¿Pueden asignarse con total libertad los valores propios de $ \mathbf{\bar A}$?, es decir, dado un conjunto de valores propios deseados, ¿existirá siempre una matriz $ \mathbf{K}$ que permita asignarle a $ \mathbf{\bar A}$ dichos valores propios?
  2. Dado que las variables de estado no necesariamente tienen sentido físico, y en caso de tenerlo no necesariamente son medibles, ¿Como pueden conocerse los valores de las variables de estado para implementar el esquema de la figura 6.16?

Las secciones 6.8.1 y 6.8.2 intentan dar respuesta a estas preguntas.


6.8.1 Controlabilidad

La noción de controlabilidad de un sistema está asociada con la posibilidad de hacer que sus variables de estado tomen cualquier valor deseado, no importa cuales sean las condiciones iniciales, en un tiempo finito.

Definición 6.3   Controlabilidad
Un sistema dinámico es controlable en $ t_1$ si para cualquier estado $ \mathbf{x}(t_1)$ y cualquier estado deseado $ \mathbf{x}_d$ es posible encontrar una entrada $ \mathbf{u}(t)$ que aplicada entre $ t_1$ y $ t_2$ produce $ \mathbf{x}(t_2)=\mathbf{x}_d$, con $ t_2 < \infty$

Ejemplo 6.31   Considérese el circuito de la figura 6.19, en el que la variable de entrada es $ v(t)$ y la variable de salida es $ v_x(t)$. Es claro que para escribir las ecuaciones de estado de ese circuito podemos escoger como variable de estado la tensión en el condensador $ v_C(t)$.

Debido a la simetría del circuito, si las condiciones iniciales son nulas ($ v_C(0)=0$), la tensión en el condensador siempre será cero, sin importar qué valor tome la fuente $ v(t)$. Por lo tanto, no es posible modificar a nuestro antojo el valor de la variable de estado, y en consecuencia el sistema es no controlable.

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/estado/cktoNONC}
}\end{center}

La definición 6.3 no brinda por sí sóla un mecanismo fácil para determinar si un sistema es controlable o no. No obstante, podemos aplicar un test de controlabilidad para determinar si un sistema dinámico lineal invariante en el tiempo es o no controlable.


6.8.1.1 Test de controlabilidad

Para determinar si un sistema como (6.21) o como (6.22) es o no controlable, con $ \mathbf{A}$ una matriz $ n\times n$ y $ \mathbf{B}$ una matriz $ n\times p$, se construye la matriz de controlabilidad $ \mathbf{V}$ y se verifica su rango:

$\displaystyle \begin{matrix}\mathbf{V}= \begin{bmatrix}\mathbf{B} & \mathbf{AB}...
...l sistema es controlable sí y sólo si} } \text{rank}(\mathbf{V})=n \end{matrix}$ (6.74)

6.8.1.2 Anotaciones al concepto de Controlabilidad

  1. La definición 6.3 es realmente la definición de controlabilidad de estado, dado que se refiere a la posibilidad de obtener cualquier estado. Existe una definición semejante para la controlabilidad de salida, que no se aborda en este texto.
  2. El test de controlabilidad (6.74) pone de manifiesto que la controlabilidad sólo depende de las matrices $ \mathbf{A}$ y $ \mathbf{B}$, es decir, sólo depende de la ecuación de estado y no de la ecuación de salida
  3. Para determinar la controlabilidad de un sistema como(6.21) no es necesario resolver la ecuación diferencial. Se realiza un análisis cualitativo de la ecuación.
  4. Si un sistema es controlable, entonces con un esquema de control por realimentación de variable de estado como el de la figura 6.16 siempre es posible encontrar una matriz $ \mathbf{K}$ real para que la matriz $ \mathbf{\bar A}$ en (6.72) o en (6.73) tenga los valores propios deseados6.8.
  5. El test es igualmente válido para sistemas continuos y discretos.


6.8.2 Observabilidad

Al observar la estrategia de control por Realimentación de Variable de Estado sugerida en la figura 6.16 surge la cuestión de cómo medir las variables de estado $ \mathbf{x}$, ya que es posible que estas no tengan sentido físico, o que no sean medibles.

Para solucionar este problema se plantea la utilización de un estimador de estado, u observador de estado, que es un elemento que intenta estimar el estado del sistema a partir de mediciones de las entradas y salidas al sistema (se supone que éstas sí tienen sentido físico y son medibles), tal como se observa en la figura 6.20, en la que $ \mathbf{\hat x}$ es la estimación que el observador hace del estado $ \mathbf{x}$

\begin{center}\vbox{\input{/home/ogduarte/Cursos/sistemas/fig/estado/observador}
}\end{center}

La noción de observabilidad de un sistema está asociada con la posibilidad de determinar el estado del sistema a partir de mediciones de sus entradas y salidas durante un tiempo finito, es decir, con la posibilidad de construir un observador.

Definición 6.4   Observabilidad
Un sistema dinámico es observable en $ t_1$ si es posible conocer el estado $ \mathbf{x}(t_1)$ a partir de mediciones de las entradas $ \mathbf{u}(t)$ y las salidas $ \mathbf{y}(t)$ durante el periodo comprendido entre $ t_1$ y $ t_2$, con $ t_2 < \infty$

Ejemplo 6.32   Considérese nuevamente el circuito de la figura 6.19, en el que la variable de entrada es $ v(t)$, la variable de salida es $ v_x(t)$ y la variable de estado la tensión en el condensador $ v_C(t)$.

Es claro que a partir de mediciones de $ v(t)$ y $ v_x(t)$ (que son iguales) no es posible conocer las condiciones iniciales del condensador y en consecuencia el sistema es no observable.

La definición 6.4 no brinda por sí sóla un mecanismo fácil para determinar si un sistema es observable o no. No obstante, podemos aplicar un test de observabilidad para determinar si un sistema dinámico lineal invariante en el tiempo es o no observable.


6.8.2.1 Test de observabilidad

Para determinar si un sistema como (6.21) o como (6.22) es o no observable, con $ \mathbf{A}$ una matriz $ n\times n$ y $ \mathbf{C}$ una matriz $ q\times n$, se construye la matriz de observabilidad $ \mathbf{S}$ y se verifica su rango:

$\displaystyle \begin{matrix}\mathbf{S}= \begin{bmatrix}\mathbf{C} \\ \mathbf{CA...
...El sistema es observable sí y sólo si} } \text{rank}(\mathbf{S})=n \end{matrix}$ (6.75)

6.8.2.2 Anotaciones al concepto de observabilidad

  1. El test de observabilidad (6.75) pone de manifiesto que la controlabilidad sólo depende de las matrices $ \mathbf{A}$ y $ \mathbf{C}$.
  2. Para determinar la observabilidad de un sistema como(6.21) no es necesaro resolver la ecuación diferencial. Se realiza un análisis cualitativo de la ecuación.
  3. Si un sistema es observable, entonces puede construirse un observador como el que se sugiere en la figura 6.20. En este texto no se aborda el problema de cómo construir dicho observador.
  4. El test es igualmente válido para sistemas continuos y discretos.

Ejemplo 6.33   Tomemos nuevamente el circuito de la figura 6.19. Para escribir las ecuaciones que rigen el sistema, nótese que el equivalente Thévenin del circuito visto por el condensador es una resitencia de valor $ R$, de tal manera que:

$\displaystyle v_C=-Ri_C=-RC\frac{d\, v_C}{dt}
$

$\displaystyle \frac{d}{dt}v_C(t)= -\frac{1}{RC}v_C(t)
$

La ecuación de salida es trivial:

$\displaystyle v_x(t)= v(t)
$

De tal manera que la representación en variable de estado para el circuito es:

$\displaystyle \left\{
\begin{matrix}
\dot v_C = -\frac{1}{RC}v_C \\
v_x = v(t)
\end{matrix}\right.
$

Es decir, es un sistema como (6.21) con $ \mathbf{A}=-1/RC$, $ \mathbf{B}=0$, $ \mathbf{C}=0$, y $ \mathbf{D}=1$. Las matrices de controlabilidad y observabilidad definidas en (6.74) y (6.75) son:

$\displaystyle \mathbf{V}=[0]\qquad \mathbf{S}=[0]
$

y por lo tanto tienen rango 0, lo que significa que el sistema es no controlable y no observable



Documento generado usando latex2html a partir de las Notas de Clase originales redactadas por Oscar Duarte

 



Universidad Nacional de Colombia
Carrera 30 No 45-03 - Edificio 477
Bogotá D.C. - Colombia

Aviso Legal - Copyright
Gobierno en LíneaAgencia de Noticias UN