Capitolo 3 Controllo di un satellite

Transcript

Capitolo 3 Controllo di un satellite
Capitolo 3
Controllo di un satellite
3.1
Controllo di un satellite in orbita via linearizzazione
Sia M la massa della terra, m quella del satellite, r, ṙ, θ, θ̇ abbiano l’usuale significato, e siano
rispettivamente u, v le forze tangenziale e radiale agenti sul satellite. Si ha
r = ruR ⇒ ṙ = ṙuR + rθ̇uθ
dove uR = (cos θ, sin θ) e uθ = (− sin θ, cos θ) sono gli usuali versori radiale e tangenziale.
Procedendo nella derivazione
r̈ = r̈uR + ṙθ̇uθ + ṙθ̇uθ + rθ̈uθ − rθ̇2 uR = uR (r̈ − rθ̇2 ) + uθ (2ṙθ̇ + rθ̈)
m
Applicando la legge di Newton (la forza radiale é − GM
+ v, mentre quella tangenziale é u)
r2
r̈ − rθ̇2 = −
GM
1
1
+ v, 2ṙθ̇ + rθ̈ = u
r2
m
m
da cui
r̈ = rθ̇2 −
GM
1
ṙθ̇
1
+ v, θ̈ = −2 +
u
2
r
m
r
mr
Introducendo le variabili x1 = r, x2 = ṙ, x3 = θ, x4 = θ̇, si puó riscrivere il tutto come un
sistema 4−dimensionale non lineare ma lineare nei due controlli u, v (l’uscita y per ora non é
ancora stata specificata ...)




ẋ1
x2
� �
 ẋ 
 x x2 − GM + 1 v 
v
 2
 1 4
m 
x21

=
 = f (x) + g(x)
 x˙3 


x4
u
1
ẋ4
−2 xx2 x1 4 + mx
u
1
definito nel sottoinsieme di R4 soddisfacente il vincolo x1 > 0. Infatti nessun vincolo é assunto
su ṙ, θ, θ̇, ma la coordinata radiale nella sua evoluzione temporale r(t), t ≥ 0 non puó mai
annullarsi (da un punto di vista matematico perdono senso le equazioni, da uno pratico ció
47
48
CAPITOLO 3. CONTROLLO DI UN SATELLITE
corrisponderebbe allo schianto del satellite sulla terra, cioé ad una collisione), e quindi non
puó neppure mai cambiare segno, se r(0) > 0, come é logico assumere in qualunque problema
concreto ... Notiamo comunque che, siccome la collisione con la terra é possibile, se dovesse
valere r(t̄) = 0 in un primo istante t̄ > 0, la soluzione dell’equazione differenziale sarebbe
definita solo in t ∈ [ 0 t̄ ]1 : dopo la collisione nessuna analisi é possibile!
Che la collisione sia possibile (in tempo finito) si puó verificare come segue: assumendo nulle θ(0), θ̇(0), e
nullo il controllo u(t), v(t), t ≥ 0, si vede subito che x3 (t) = x4 (t) = 0 soddisfano le equazioni, per cui rimane
da studiare
GM
ẋ1 = x2 , ẋ2 = − 2
x1
che, assumendo ad esempio x1 (0) = R > 0, ẋ2 (0) = 0, rappresenta un punto in caduta libera, inizialmente
fermo. Poiché ẋ2 (t) é sempre strettamente negativo ed aumenta in valore assoluto con il passare del tempo (in
quanto x1 (t) decresce con il passare del tempo), si ha
� t
� t
GM
x2 (t) =
ẋ2 (τ )dτ ≤
ẋ2 (0)dτ = ẋ2 (0)t = − 2 t
R
0
0
da cui
x1 (t) = x1 (0) +
�
t
ẋ1 (τ )dτ = R +
0
�
t
0
x2 (τ )dτ ≤ R +
�
�
t
0
�
−
GM
R2
�
τ dτ = R −
GM 2
t
2R2
2R3
che sicuramente si annulla prima dell’istante t =
GM . La collisione quindi avviene proprio, in tal caso,
in tempo finito. Di conseguenza al controllo u, v sará in primo luogo demandato il compito di evitare tale
situazione catastrofica.
Cercando soluzioni particolari (orbite circolari), caratterizzate da r = R = costante, θ =
ωt+ψ, u = v = 0, si trova che esse soddisfano il sistema purché risulti R3 ω 2 = GM . Nel seguito
assumeremo tale legame tra R, ω, GM . Una soluzione perturbata dell’orbita circolare sará
tale da garantire piccoli scostamenti dalla traiettoria nominale, cioé
r = x1 = R + z1 , ṙ = x2 = 0 + z2 , θ = x3 = ωt + ψ + z3 , θ̇ = x4 = ω + z4
da cui



z2
ż1
 ż 
 (R + z )(ω + z )2 − GM +
1
4
 2

(R+z1 )2
 =
 z˙3 

z4
(ω+z4 )
1
−2 z2R+z
+ m(R+z
u
ż4
1
1)
1
v
m





É immediato notare che tale sistema ammette un punto di equilibrio nell’origine (assunti
nulli entrambi gli ingressi, u = v = 0), cui corrispondono le traiettorie circolari di equilibrio x = [ R 0 ωt + ψ ω ]T , ∀ψ ∈ R. Sebbene la traiettoria circolare non fosse un vero
e proprio punto di equilibrio (soluzione periodica), tale é diventata la traiettoria nel sistema
degli scostamenti. In generale, quando consideriamo scostamenti da una traiettoria nominale,
il sistema negli scostamenti diviene esplicitamente dipendente da t. Cosı́ sarebbe successo,
1
Trattasi di fenomeno analogo a quello giá discusso del finite escape time: qui non c’é divergenza di r(t),
ma comunque raggiungiamo in tempo finito una singolaritá del sistema, che non é ben definito se r = 0, e questo
+
fatto impedisce alla soluzione x(t) dell’equazione di essere definita su tutto R . Si noti comunque che in realtá
una divergenza é presente: se é vero che x1 (t) tende a zero, é anche vero che x2 (t) diverge!
Non fa parte del programma
3.1. CONTROLLO DI UN SATELLITE IN ORBITA VIA LINEARIZZAZIONE
49
ad esempio, se avessimo assunto un’orbita nominale ellittica (r(t) sarebbe stata una funzione
del tempo, non una costante). Qui non accade perché tutte le variabili, tranne una, sono
costanti, e l’unica che dipende dal tempo (θ) é anche l’unica che non appare non derivata in
alcuna equazione differenziale. Siamo quindi ricondotti ad un sistema cui é possibile applicare
il procedimento di linearizzazione, per analizzare piccoli scostamenti e, in particolare, studiare
stabilitá (e stabilizzabilitá) locale. Linearizzando nell’intorno dell’origine si ottiene facilmente
il sistema linearizzato (dove R, ω rispettano sempre il vincolo espresso in precedenza)

0
 3ω 2
ż = 

 0
0
1
0
0
− 2ω
R


0
0
0
 1
0 2Rω 


z +  m
 0
0
1 
0
0
0
0
0
0
1
mR

�v �


 u
= Fz + G
�
�
v
= F z + g1 v + g2 u
u
Lo scostamento angolare dalla posizione nominale, z3 , rappresenta la variabile di maggior interesse, per vari motivi: se, come accade spesso, siamo interessati a satelliti geostazionari (tali cioé
da compiere un giro in esattamente un giorno) il satellite, nella traiettoria nominale, appare
fermo ad un osservatore dalla terra, ed é molto semplice misurare lo scostamento angolare z3
dalla verticale, mentre le altre variabili sono certamente accessibili ma molto piú difficilmente
misurabili. Meglio quindi misurare la sola uscita y = z3 e stimare le altre variabili con uno
stimatore asintotico, che permetta poi il ricorso ad una retroazione dallo stato stimato (si puó
facilmente verificare che il sistema linearizzato é osservabile, assumendo y = Hz = θ = z3 , cioé
H = [ 0 0 1 0 ]). L’obiettivo sará ovviamente mantenere (con il controllo) il satellite fermo
sulla verticale (z3 = 0).
Si noti che essendo ω stabilita (la velocitá angolare di rotazione della terra), anche il
parametro R lo é, essendo legato a ω, a massa della terra ed a costante di gravitazione universale
in modo univoco. Quindi i valori di ω, R possono supporsi noti (con sufficiente approssimazione).
Inoltre le forze tangenziale e radiale giocano il ruolo dell’ingresso di controllo.
Un calcolo degli autovalori di F porge facimente il polinomio caratteristico λ2 (λ2 + ω 2 ),
da cui gli autovalori λ = 0, 0, ±iω. Gli autovalori non sono distinti, e l’autospazio generato
dall’autovalore nullo é generato da [ 0 0 1 0 ]T , cioé ha dimensione 1. Ne conseguono la
forma di Jordan e l’esponenziale seguenti

iω
 0

FJ = 
 0
0
0
−iω
0
0
0
0
0
0


0
eiωt
 0
0


 ⇒ e FJ t = 
 0
1
0
0
0
e−iωt
0
0

0 0
0 0


1 t
0 1
da cui i modi reali cos ωt, sin ωt, 1, t. Tutti autovalori al limite della stabilitá, quindi (parte reale
nulla), ma la presenza di un modo divergente che rende la traiettoria nominale instabile. Facile
giustificare i modi presenti: i modi oscillatori sono dovuti al mantenimento dello stesso periodo
di oscillazione, ma con le traiettorie di forma leggermente ellittica, con periodo di oscillazione
di un giorno. Il modo costante ad una perturbazione di θ il cui unico effetto é quello di shiftare
nel tempo la traiettoria. Il modo divergente ad una piccola variazione del raggio dell’orbita,
mantenendo la forma circolare della stessa. Dalla relazione tra R, ω, GM segue che variazioni
50
CAPITOLO 3. CONTROLLO DI UN SATELLITE
di R si ripercuotono su variazioni di ω. Per quanto piccole, tali variazioni si traducono in uno
scostamento angolare tra traiettoria nominale e perturbata crescente linearmente con il tempo!
Il calcolo della matrice di raggiungibilitá porta facilmente a rango 4, per cui tutti gli autovalori sono allocabili. Tuttavia é interessante analizzare l’utilizzo di una forza soltanto. Se la
forza utilizzata é quella radiale (che equivale a rimpiazzare G con g1 ), tale rango é pari solo a
3 ed il sistema non é raggiungibile. Impossibile quindi stabilizzarlo asintoticamente con l’uso
della sola forza radiale (interpretazione fisica: la forza radiale puó modificare l’energia ma non
il momento angolare: se il valore di quest’ultimo é errato, la forza radiale non potrá riportare
il moto alla traiettoria nominale). Dei quattro autovalori, tre sono allocabili ed uno no e, per
ovvii motivi di simmetria coniugata, quello non allocabile é λ = 0.
Invece, con G = g2 (ricorrendo quindi alla sola forza tangenziale) si ha raggiungibilitá e
tutti gli autovalori sono allocabili: allocando ad esempio (λ + ω)4 , cioé tutti gli autovalori in
−ω, il ritorno all’orbita geostazionaria nominale é asintoticamente garantito da un controllo
lineare u = Kz (con forza u(∞) = 0, nulla a regime). L’unica K che alloca tali autovalori é
K = m [ −8ω 2
− 83 ω

0
 3ω 2
1 2
ω R −4ωR ] ⇒ F + g2 K = 

3
 0
2
− 8ωR
1
0
0
ω
− 14
3 R
0
0
0
ω2
3

0
2Rω 


1 
−4ω
In tal modo la stabilizzazione (almeno locale, non necessariamente globale) dell’orbita é raggiunta con la sola forza tangenziale u = Kz.
3.2
Considerazioni sulla controllabilitá non lineare
Il risultato positivo del paragrafo precedente suggerisce che in qualche maniera il sistema terrasatellite sia controllabile. Dobbiamo peró ricorrere alle tecniche di feedback linearization, per
verificare le effettive possibilitá di controllo. In effetti, ponendo
x1 x24 − GM
+ m1 v = w1
x21
1
−2 xx2 x1 4 + mx
u = w2
1
�
�
⇔ v = m −x1 x24 + GM
+ mw1
x21
⇔
u = 2mx2 x4 + mx1 w2
il tutto si trasforma nel sistema lineare disaccoppiato (dove w1 agisce su r, ṙ mentre w2 su θ, θ̇)
�
�
�
ẋ1
0 1
=
ẋ2
0 0
��
�
� �
x1
0
+
w,
x2
1 1
�
�
�
ẋ3
0 1
=
ẋ4
0 0
��
�
� �
x3
0
+
w
x4
1 2
dove ora i singoli sistemi sono lineari e controllabili. É quindi possibile agire con w1 , w2 in
modo da trasferire qualsiasi stato iniziale in uno finale in tempo finito. In realtá c’é una piccola
complicazione dovuta al fatto che r = x1 deve essere sempre positivo (in effetti é l’unica variabile
di stato che compare in qualche denominatore e quindi non deve annullarsi mai, restando per
continuitá sempre positiva, come giá discusso in precedenza).
3.2. CONSIDERAZIONI SULLA CONTROLLABILITÁ NON LINEARE
51
Siccome il sistema linearizzato é controllabile facendo ricorso alla sola forza tangenziale u, nel
seguito assumeremo v = 0, anche per ricondurci alla teoria sviluppata nel precedente capitolo,
dove ci siamo occupati esclusivamente di sistemi SISO. Considereremo il seguente problema:
a partire da qualsivoglia condizioni iniziali, é possibile applicare un controllo in feedback
che permetta il raggiungimento asintotico (in senso pertanto globale e non solo locale) di una
prefissata traiettoria circolare (di raggio R preassegnato, non necessariamente corrispondente
ad una traiettoria geostazionaria)?
É interessante notare come l’algoritmo che ora evidenzieremo, accumunato con il controllo
linearizzato geostazionario precedente, permetta di trasportare il satellite, in qualunque
punto si trovi trascorso un certo tempo dal lancio, nell’orbita geostazionaria desiderata. In
una prima fase useremo il feedback non lineare di natura globale che ci apprestiamo ad analizzare, per portare il satellite in prossimitá dell’orbita geostazionaria (ricordiamo che il legame
R3 ω 2 = GM permette in pratica una valutazione, pur molto precisa ma sempre approssimata,
2π
del valore di R. Infatti ωdes = giorno
, assieme alla conoscenza di G e M permetterebbe in
teoria il calcolo del raggio esatto. Ma errori di calcolo, anche piccolissimi, renderebbero solo
ω � ωdes ), in una seconda fase attiveremo il feedback locale giá analizzato per mantenere la
geostazionarietá in senso assolutamente esatto!
Come noto la forma normale dipende fortemente dalla scelta della funzione d’uscita y =
h(x). Nel sistema linearizzato si é discusso come la scelta piú ragionevole fosse quella di misurare
la posizione angolare, per cui vediamo se anche in ambito non lineare tale scelta si rivela utile.
Ponendo
x2 x4
1
y = x3 = θ = ξ1 ⇒ ξ2 = ξ˙1 = ẋ3 = x4 , ξ˙2 = ẋ4 = −2
+
u
x1
mx1
si ottiene un grado relativo basso (r = 2). Siamo obbligati ad introdurre due variabili non osservabili (ad esempio η1 = x1 , η2 = x2 ) che (per pura coincidenza) rendono il diffeomeomorfismo
un cambio di base lineare! Il feedback linearizzante é ovviamente
v = −2
x2 x4
1
+
u ⇔ u = 2mx2 x4 + mx1 v
x1
mx1
che trasforma il sistema in y = ξ1 , ξ˙1 = ξ2 , ξ˙2 = v, ma purtroppo la parte che rimane al di
fuori del nostro controllo diretto (la parte non lineare e non osservabile) ha dimensione 2. Non
conviene quindi tale scelta di y. Ne faremo quindi un’altra, che conduce a grado relativo r = 3,
rinviando al seguito la verifica che ció é quanto di meglio si riesca a fare, nel senso che r = 4
non é comunque ottenibile. Si ponga
y = x1 = ξ 1
Il calcolo della derivata porge
ξ˙1 = x2
e poiché l’ingresso u non appare, poniamo ξ2 = x2 e procediamo nella derivazione
GM
ξ˙1 = ξ2 , ξ˙2 = x1 x24 − 2
x1
52
CAPITOLO 3. CONTROLLO DI UN SATELLITE
Siccome ancora l’ingresso non appare, procediamo ancora, dopo aver posto ξ3 = x1 x24 −
GM
x21
d
GM
2GM
2x4
ξ˙1 = ξ2 , ξ˙2 = ξ3 , ξ˙3 =
[x1 x24 − 2 ] = −3x2 x24 +
x2 +
u
3
dt
x1
x1
m
che si trasforma in
ξ˙3 = v
non appena si ponga (feedback linearizzante)
v = −3x2 x24 +
2GM
2x4
3
GM mx2
m
x2 +
u ⇔ u = mx2 x4 −
+
v
3
3
x1
m
2
x1 x4
2x4
Ovviamente il sistema ha grado relativo r = 3, ed occorre introdurre una variabile η1 . É facile
rendersi conto che η1 = x3 é una possibile scelta, e che vale η̇1 = x4 . Quindi
ξ1 = x1 , ξ2 = x2 , ξ3 = x1 x24 −
x 1 = ξ 1 , x2 = ξ 2 , x4 =
�
� 2
� ξ ξ3
±� 1
GM
2GM
2x4
, η1 = x3 , v = −3x2 x24 +
x2 +
u⇔
x21
x31
m
+ GM
3
GM mx2
m
, x3 = η1 , u = mx2 x4 −
+
v
3
3
ξ1
2
x1 x4
2x4
Chiaramente, determinata l’espressione di v(t) che risolve il problema, potremo sostituirla in
quella di u(t) ottenendo alla fine un feedback non lineare che posiziona (asintoticamente) il satellite nell’orbita desiderata (o quantomeno in sua prossimitá, per quanto giá discusso). Riscriviamo le equazioni precedenti come


 
�
� 2
0 1 0
0
� ξ ξ3 + GM


 
˙
y = [ 1 0 0 ] ξ, ξ =  0 0 1  ξ +  0  v, η̇1 = ±� 1
ξ13
0 0 0
1
Esaminiamo dapprima la dinamica non lineare (η), notando che essa puó essere facilmente
risolta come
η1 (t) = η1
�
� t �
� ξ12 (τ )ξ3 (τ ) + GM
�
(0) ±
dτ
0
ξ13 (τ )
= η1 (0) +
� t
0
x4 (τ )dτ
il che non é affatto sorprendente, ricordando il significato delle varie variabili (η1 rappresenta
la posizione angolare, x4 la velocitá angolare). La risoluzione é stata possibile in quanto tale
equazione non lineare é peró lineare in η1 , cioé della forma
η˙1 = aη1 + f (ξ, v) ⇒ η1 (t) = eat η1 (0) +
� t
0
ea(t−τ ) f (ξ(τ ), v(τ ))dτ
Anzi, addirittura η1 non appare al secondo membro, per cui a = 0 ... una sorta di stabilitá
semplice ma non asintotica per tale sottosistema non lineare, cioé per la zero output
dynamics, che vedremo non comporterá nessun problema ...
3.2. CONSIDERAZIONI SULLA CONTROLLABILITÁ NON LINEARE
53
Prima di procedere, é opportuno discutere i domini dove sono definiti i diffeomeomorfismi introdotti. Anzitutto,� é �necessario introdurre due distinti diffeomeomorfismi (in analogia
ξ
all’Esempio 5), in quanto
= Φ(x) é ben definito, ma l’inversa Φ−1 no, essendo indetermiη
nato il segno di x4 . In effetti é necessario distinguere i casi x1 > 0, x4 > 0 e x1 > 0, x4 < 0, cioé
suddividere lo spazio x in due aperti disgiunti
A1 = { x ∈ R4 : x1 > 0, x4 > 0 }, A2 = { x ∈ R4 : x1 > 0, x4 < 0 }
notando che in ciascuno di essi Φ(x) diventa invertibile (ma le due inverse hanno diverso segno
nell’espressione di x4 ), e che oltre al giá commentato vincolo x1 > 0, dobbiamo ora aggiungere
l’ulteriore vincolo x4 �= 0, dovuto al fatto che x4 interviene al denominatore nell’espressione che
definisce il feedback linearizzante. Ció significa che il cambio di variabili effettuato ci impone
di escludere a priori dall’analisi traiettorie di stato per le quali x4 (t) possa annullarsi, per
cui considereremo solo evoluzioni per le quali il segno di x4 (t) sia sempre lo stesso (pari a
quello di x4 (0), ovviamente ...), e quindi traiettorie interamente confinate in uno dei due aperti
precedentemente definiti. In nessun caso sono ammesse transizioni da un aperto all’altro. Il
significato fisico del vincolo é immediato: x4 rappresenta la velocitá angolare, per cui non
ammetteremo mai la possibilitá di invertire il verso di rotazione del moto2 . Ma anche nello
spazio (ξ, η) ci sono dei vincoli: dall’espressione di x4 , dovrá essere ξ12 ξ3 > −GM in ogni istante
di tempo, altrimenti x4 si annullerebbe o, peggio, diverrebbe immaginaria, facendo perdere
senso fisico al cambio di variabile. Quindi, definito l’aperto
A3 = { (ξ, η) ∈ R4 : ξ1 > 0, ξ12 ξ3 > −GM }
(non avendo dimenticato il vincolo ξ1 = x1 > 0), i due diffeomeomorfismi introdotti lavorano
tra A1 e A3 e tra A2 e A3 , rispettivamente. Il vincolo espresso dall’aperto A3 sulle variabili
ξ (η in realtá nel vincolo non interviene ...) avrá le sue importanti conseguenze. Lavorando
con le nuove variabili, dovremo assicurarci che in nessun caso tali vincoli vengano violati,
altrimenti perderebbe senso fisico la soluzione. Si noti infatti che l’espressione di u(t), riscritta
in termini delle nuove variabili3
u=±
3mξ12 ξ2 ξ3 + GM mξ2 + mξ13 v
�
2ξ1 ξ13 ξ3 + GM ξ1
rende u(t) immaginario (o infinito) qualora il vincolo ξ12 ξ3 > −GM non sia soddisfatto. Nonostante ξ, v assumano valori in R, l’ingresso u(t) effettivo e quindi anche l’evoluzione x(t) non
esibirebbero piú valori reali, ma complessi, facendo perdere senso fisico alla soluzione.
2
Se per qualsiasi ragione fosse necessario invertirlo, potremmo farlo facilmente notando che un ingresso
impulsivo u(t) = aδ(t) induce una discontinuitá in x4 , lasciando continue le altre variabili. Sará sufficiente
pertanto spegnere il controllo fornito dal feedback linearizzante per un tempo brevissimo, applicare un ingresso
impulsivo, o che quantomeno approssimi un andamento impulsivo, di ampiezza tale da invertire il segno di x4 nel
punto di discontinuitá. Potremo successivamente riattivare il controllo in retroazione senza problemi, lavorando
d’ora in poi nell’aperto corrispondente al segno di x4 opposto a quello di x4 (0).
3
Il segno dipende dall’essere nell’aperto A1 oppure A2 . Anche il segno che compare in η̇1 = ± . . . dipende
dalla stessa circostanza. Come giá discusso, la forma normale puó assumere diverse espressioni in due aperti
distinti ...
54
CAPITOLO 3. CONTROLLO DI UN SATELLITE
Il sottosistema lineare controllabile ed osservabile della forma normale cui siamo pervenuti,
ci permette di allocare un qualsiasi polinomio caratteristico di terzo grado (ovviamente stabile).
Sia quindi K = [ −a −b −c ] una qualsiasi matrice tale che λ3 +cλ2 +bλ+a abbia le tre radici
a parte reale negativa (la loro scelta puó dipendere dalla rapiditá con cui si vuole raggiungere
l’obiettivo, piú spesso da un opportuno compromesso tra tempo di risposta ed energia spesa
dal motore che attua la forza u(t)). Poniamo ora
v(t) = Kξ(t) + v0
dove v0 rappresenta un ingresso costante
Sostituendo si ottiene

0
˙ξ = 
 0
−a
la cui ragione d’essere sará chiara tra un attimo.



1
0
0

 
0
1 ξ +  0 
−b −c
v0
e cerchiamo se tale equazione ammette punti di equilibrio, cioé soluzioni ξ(t) =costante. Tale
ricerca fornisce facilmente l’unica soluzione (a �= 0, altrimenti il polinomio caratteristico non
avrebbe solo radici a parte reale negativa)
ξ1 =
v0
, ξ2 = ξ 3 = 0
a
Proviamo che asintoticamente ξ(t) raggiunge proprio il vettore ξeq = [ va0
0 0 ]T . Da
(F + gK)ξeq + gv0 = 0, ξ˙ = (F + gK)ξ + gv0
segue facimente
d
[ξ(t) − ξeq ] = (F + gK)[ξ(t) − ξeq ] ⇒ ξ(t) − ξeq = e(F +gK)t (ξ(0) − ξeq )
dt
da cui la convergenza a ξeq (in senso globale) di ξ(t), per t tendente a +∞. Rimane solo da
interpretare il risultato: a regime si avrá ξ1 = x1 = r = va0 , per cui basta scegliere v0 = aR, dove
R é il raggio orbitale desiderato, per ottenere asintoticamente r(t) � R. Inoltre ξ2 = x2 = 0,
affatto sorprendente (significa a regime ṙ = 0, come dev’essere per una traiettoria circolare), ed
infine ξ3 = x1 x24 − GM
= 0 che, ricordando x1 = r = R a regime e x4 = θ̇, porge θ̇ = ω = costante
x21
a regime, soddisfacente R3 ω 2 = GM , come dev’essere per una traiettoria circolare. L’obiettivo
di condurre il satellite in un’orbita circolare (qualsiasi, non necessariamente geostazionaria) é
cosı́ raggiunto! Alcune osservazioni:
• Abbastanza sorprendentemente (per la controllabilitá riscontrata nel sistema linearizzato), il grado relativo risulta r = 3 < 4, per cui riusciamo a controllare bene solo tre
variabili di stato e non quattro, usando la sola forza tangenziale. Per fortuna la variabile
η = θ non é cosı́ importante nel posizionamento di un’orbita, e come giá visto il suo
andamento puó comunque essere facilmente calcolato una volta deciso l’ingresso v(t) da
applicare, e risolte le corrispondenti equazioni differenziali in ξ. A regime sará comunque
θ(t) = ωt + ψ (solo qualora si sia interessati, come é stato finora, al raggiungimento di
3.2. CONSIDERAZIONI SULLA CONTROLLABILITÁ NON LINEARE
55
un’orbita circolare, ovviamente), dove il valore di ψ non é impostabile a priori, ma solo
calcolabile. Il sistema é sceso di ordine perché abbiamo perso informazione sulla variabile θ (ma non su θ̇), e quindi ψ puó a priori assumere qualunque valore (d’altronde
qualunque valore essa abbia, trattasi sempre della stessa orbita circolare). Vedremo in seguito, qualora si desideri raggiungere in un certo istante anche una ben precisa posizione
angolare nell’orbita circolare, come si puó facilmente risolvere questo problema;
• Come capita spesso con strategie globali di stabilizzazione per sistemi non lineari, i cambi
di variabile effettuati pongono delle restrizioni: abbiamo giá analizzato il significato del
vincolo x1 > 0 (che evita la collisione con la terra) e quello del vincolo x4 �= 0, che
non permette, durante l’azione di controllo, un’inversione angolare del moto! Accertarsi
dell’assenza di collisione e di inversione del senso del moto é tutto quanto viene richiesto al
sistema lineare in analisi per poter rendere funzionante il feedback globale or ora esposto;
• In analogia al feedback lineare che stabilizza l’orbita geostazionaria, dove in assenza di
perturbazioni la forza tangenziale u(t) é esattamente nulla, questo feedback non lineare
si comporta allo stesso modo a regime. Infatti v(∞) = v0 + Kξ(∞) = v0 − aR = 0), ma
non dimentichiamo che il controllo applicato é in realtá
3
GM mx2
m
u = mx2 x4 −
+
v
3
2
x1 x4
2x4
che é anch’esso nullo asintoticamente, essendo x2 = ṙ = 0, v = 0, a regime. Ció non é
affatto sorprendente, in quanto nessuna forza tangenziale (né radiale aggiuntiva) é richiesta per il mantenimento di un’orbita circolare soddisfacente il vincolo R3 ω 2 = GM . Il
risultato trovato é quindi in perfetto accordo con l’intuizione.
Val la pena tornare sulla questione dei vincoli precedentemente discussa. Al sistema lineare
(in ξ) possiamo applicare qualsiasi tecnica di controllo nota (effettuare retroazioni, trasferimenti
tra stati con la tecnica del gramiano, ecc. ...), in sostanza applicare ingressi v qualsiasi, ma
bisogna essere certi che la legge di controllo adottata non violi mai i due vincoli ξ1 > 0, ξ12 ξ3 >
−GM . Tale circostanza puó anche essere verificata a priori, nel senso che é sufficiente una
simulazione dell’evoluzione di stato corrispondente all’applicazione di un certo v(t) (il calcolo
é semplice, trattandosi di sistema lineare ... nessuna verifica é infatti richiesta sulla variabile
η1 , l’unica avente dinamica non lineare ...) per verificare l’eventuale violazione dei vincoli.
Se ció dovesse accadere, il controllo v(t) non sarebbe ammissibile ed andrebbe riprogettato,
in quanto le evoluzioni del sistema non devono mai passare nelle regioni proibite (quelle
che non rispettano i vincoli), quando studiate in termini delle variabili η, ξ. Purtroppo, la
tecnica di allocazione degli autovalori non garantisce affatto che i vincoli non possano venir
violati. Le prossime figure illustrano, nel piano (ξ1 , ξ3 ), la proiezione delle traiettorie (curve
in R4 ) corrispondenti all’allocazione del polinomio caratteristico (s + 1)3 ed all’applicazione
di un ingresso costante al sistema retroazionato per raggiungere il punto di equilibrio ξ =
[ 1 0 0 ]T , partendo rispettivamente da ξ(0) = [ 1 −2 1 ]T e da ξ(0) = [ 1 5 1 ]T . Come
si vede, semplicemente modificando il valore di ξ2 (0) = ṙ(0), si puó facilmente violare sia il
56
CAPITOLO 3. CONTROLLO DI UN SATELLITE
4
vincolo ξ1 > 0, sia quello ξ3 > − GM
. La prima traiettoria porta infatti a collisione con la
ξ12
terra (violazione del vincolo ξ1 > 0, non appena passiamo nel secondo quadrante), la seconda
viola l’altro vincolo (si annulla θ̇ non appena nel quarto quadrante la traiettoria interseca la
curva di forma pseudo-iperbolica corrispondente al vincolo). In entrambi i casi, la soluzione
perde significato fisico dopo un tempo finito (collisione con la terra o velocitá angolare che
diventa immaginaria, caso in cui nel punto di singolaritá l’ingresso effettivo u(t) esibisce un
fenomeno tipo finite escape time, in quanto diventa infinito non appena la velocitá angolare si
annulla, per poi diventare addirittura immaginario ...). Queste soluzioni non sono accettabili,
il che suggerisce come l’analisi appena effettuata sul sistema lineare sia stata un pó frettolosa:
é necessaria un’analisi meno superficiale e piú approfondita per analizzare la possibilitá di
raggiungere l’orbita circolare desiderata5 ...
Quando si verifica la situazione della prima figura (ξ1 = 0, ξ3 > 0), nel dominio x ció
corrisponde alla situazione x1 = 0, x4 = ±∞, u = ±∞. In pratica, la traiettoria assume una
forma a spirale che collide con la terra in tempo finito, con l’applicazione di una forza tangenziale
tendente all’infinito, e con la corrispondente velocitá angolare di rotazione che tende all’infinito
anch’essa: situazione catastrofica che, una volta raggiunta, non permette di mantenere senso
fisico alla soluzione dopo l’impatto! Quando si verifica la situazione della seconda figura (ξ1 >
0, ξ3 = − GM
), nel dominio x ció corrisponde alla situazione x1 > 0, x4 = 0, u = ±∞. In
ξ12
pratica non accade nulla di particolare, se non per il fatto che l’ingresso diverge in tempo finito.
Ma quello che perde senso fisico accade subito dopo: la velocitá angolare (e l’ingresso u(t))
divengono immaginari puri, la posizione angolare diventa complessa, mentre restano reali r, ṙ.
4
Nelle figure seguenti si é assunto GM = 30. Ovviamente la sostanza non cambia, in quanto moltiplicando
per il fattore GM
30 le condizioni iniziali, il punto di equilibrio raggiunto e l’ingresso costante di controllo, si
otterrebbero andamenti della stessa forma di quelli indicati.
5
In realtá il problema é meno serio, rispetto a quanto qui evidenziato: in molti casi le condizioni iniziali
non saranno cosı́ critiche, in molti casi una scelta diversa per il polinomio caratteristico eliminerá il problema.
Senza contare che in ambito lineare esistono altre ben note tecniche di raggiungibilitá, ad esempio quella basata
sul gramiano, e che comunque possiamo tentare di raggiungere il punto desiderato non in modo diretto, ma
raggiungendo in sequenza una serie di stati non tanto lontani tra loro (diminuendo cosı́ decisamente la probabilitá
di violare i vincoli, tentando di seguire una traiettoria che eviti accuratamente le regioni proibite ...). Peró il
problema esiste, e quindi va affrontato, anche se esistono vari modi per riuscire ad aggirarlo ...
3.3. GRADO RELATIVO DEL SISTEMA SATELLITE
57
Chiaramente non si puó attribuire alcun senso fisico a tale soluzione (dopo l’istante t̄ in cui si
annulla θ̇), in quanto applicare forze immaginarie e riscontrare velocitá angolari immaginarie
non ha alcun senso! Il feedback linearizzante non esiste (sui numeri reali) dopo l’istante t̄, e
tutte le conclusioni nel dominio (ξ, η) perdono significato nel dominio x (anche se nulla di tutto
ció accade nel dominio ξ, dove ξ, v rimangono reali, continuano ad aver senso, e non manifestano
nulla di speciale ... tuttavia η risente del fenomeno, in quanto η1 si che diventa complessa ...).
Tutto ció ci obbliga a prestare molta attenzione all’evoluzione del sistema nelle nuove variabili, in quanto anche semplici retroazioni lineari possono causare seri problemi: é di conseguenza necessaria un’analisi del problema della raggiungibilitá (di un punto xF ∈ R4 a partire da un punto xI ∈ R4 ) che tengano dall’inizio in considerazione i vincoli, se si vogliono
comprendere le prestazioni di controllo realmente ottenibili ricorrendo al solo uso della forza
tangenziale.
3.3
Grado relativo del sistema satellite
Calcoliamo la matrice di raggiungibilitá non lineare del satellite: si ha

da cui

x2
 x x2 − GM
1 4
x21
f (x) = 


x4
−2 xx2 x1 4
0
 2
 x4 + 2GM
∂f
x31
=

0
∂x 
2 xx2 x2 4
1
e quindi

1
0
0
−2 xx41
0
 −2 x4

m
[f, g] = 
1
 − mx1
x2
mx21
da cui

2 xm4
2 x4

2 xmx
1
[f, [f, g]] = 

0

x2
−3 mx41 −
ed infine



,



,





g(x) = 


0
0
0
1
mx1





0
0
0
 0
0 2x1 x4 
 ∂g
,
=

 0
0
1 
 ∂x
1
x2
− mx
0 −2 x1
2
1


∂[f, g] 
=

∂x

0
0
1
mx21
x2
−2 mx
3
1
0
0
0
1
mx21
0

x2 x4
 ∂[f, [f, g]]
−2


mx21
,
=


0
∂x

x2
GM
3 mx42 + 4 mx
5
1

[f, [f, [f, g]]] =
2
3

 −2 x2 x24 + 6 x4 − 4 GM x3 4

m
mx1
mx1

x24

GM
3 mx1 + mx4

1

2
x x
2 4
GM x2
9 mx
2 + 2 mx5
1
1
0
0
0
0

0
0


0
0

0
x4
2 mx
1
0
0
1
2 x4
−6 xmx
1
0
0
0
0
0
0
0 − m2 


0
0 

0
0


GM
mx41









2
0
m
x2
0 2 mx
1
0
0
x4
0 −6 mx
1






58
CAPITOLO 3. CONTROLLO DI UN SATELLITE
da cui
detR4 = 4
x24
(2x1 x22 − 3GM ) �= 0
m4 x51
Quindi la prima condizione é soddisfatta. Non é invece soddisfatta la seconda condizione
(involutivitá)6 , in quanto risulta
 
0
1
[g, [f, g]] = −2 2
m x1
1
 
 
0
⇒ det [ [g, [f, g]] g
[f, g] [f, [f, g]] ] = 4
0
x4
�= 0
m5 x31
che prova che il rango aumenta (passa da 3 a 4) aggiungendo tale colonna a R3 , che non é quindi
chiusa alle Lie Brackets. Sappiamo dalla teoria che il grado relativo non potrá raggiungere
r = n = 4 per nessuna scelta della funzione d’uscita, mentre la scelta che abbiamo effettuato,
y = x1 = ξ1 , conduce a grado relativo 3, che é quindi il massimo che si puó ottenere.
É istruttivo effettuare anche una verifica diretta della non esistenza di y = h(x) che renda
r = 4. Da y = h(x1 , x2 , x3 , x4 ) segue
ẏ =
∂h
∂h
∂h
∂h
ẋ1 +
ẋ2 +
ẋ3 +
ẋ4
∂x1
∂x2
∂x3
∂x4
Sostituendo le espressioni di ẋi , siccome ẋ4 é l’unica che coinvolge u, se si desidera che ẏ non
∂h
dipenda da u, dev’essere ∂x
= 0, quindi h non puó dipendere da x4 e si ha y = h(x1 , x2 , x3 ).
4
Proseguendo nella derivazione con tale assunzione, si ottiene (dopo conti laboriosi)
�
�
∂h
1 ∂h u
ÿ = . . . + 2x4
+
∂x2 x1 ∂x3 m
dove . . . rappresentano termini che non dipendono da u. Se vogliamo che ÿ non dipenda da u
deve quindi essere
∂h
∂h
2x1 x4
+
=0
∂x2 ∂x3
L’equazione precedente é peró della forma a(x1 , x2 , x3 )x4 + b(x1 , x2 , x3 ) = 0, da cui necessaria∂h
∂h
mente a = b = 0 e quindi in definitiva ∂x
= ∂x
= 0. Ecco provato che h non dipende neppure
2
3
da x2 , x3 , cioé y = h(x1 ). Rifacendo i conti a partire da tale espressione si trova facilmente che
y, ẏ, ÿ non dipendono da u, mentre (solito significato per i termini ...)
d3
2x4 dh
y = ... +
u
3
dt
m dx1
6
Dall’analisi successiva seguirá che il sistema non lineare non é completamente controllabile ma ... quasi, nel
senso che lo é in un’ampia regione. A differenza del caso lineare, dove se la condizione di controllabilitá non é
n
soddisfatta possiamo raggiungere solo un sottospazio di R , quindi un insieme di misura nulla, qui riusciremo a
raggiungere ben di piú ... ció conferma il fatto, giá menzionato, che le condizioni esposte non sono propriamente
delle condizioni di controllabilitá in senso letterale, ma semplicemente condizioni per poter ottenere r = n.
3.4. CONTROLLABILITÁ VIA IL FEEDBACK LINEARIZZANTE
59
dh
che, per essere indipendente da u, implica dx
= 0, cioé y = costante, per cui il grado relativo
1
non sarebbe definito (sistema completamente non osservabile). Ció prova che il grado relativo
é al massimo 3 scegliendo y funzione (non banale) della sola variabile x1 , mentre altrimenti é
inferiore ...
Nota: considerando il precedente sistema linearizzato (nell’intorno di un’orbita circolare)
ż = F z + g2 u, é immediato verificare che y = a(z2 − 2Rωz3 ) = a [ 0 1 −2Rω 0 ] z, a �= 0,
rappresenta tutte e sole le possibili scelte (lineari) dell’uscita che rendono il sistema di grado
3
relativo 4. Piú precisamente, scegliendo ξ1 = y, ξ2 = ẏ, ξ3 = ÿ, ξ4 = dtd 3 y, si arriva al sistema
lineare algebricamente equivalente seguente (per a = 1), in (quasi) forma canonica di controllo

la cui FDT
0
0

ξ˙ = 
0
0
1
0
0
1
0
0
0 −ω 2

 
W (s) =
6ω 3
1
2
2
m s (s + ω 2 )
0
0

6ω 3 
0

0
ξ +
  u, y = [ 1 0 0 0 ] ξ
1
m 0
0
1
ha grado relativo r = 4. Quindi é solo il sistema non lineare che non riesce ad andare oltre al
valore r = 3 (come ben noto dalla teoria ... per un sistema lineare controllabile esiste sempre
una scelta di y = Hx che rende r = n).
3.4
Controllabilitá via il feedback linearizzante
L’aperto A3 precedentemente definito é diffeomeomorfo all’aperto A1 7 , quindi eventuali regioni
non raggiungibili nelle variabili (η, ξ) hanno un corrispondente non raggiungibile nell’aperto
originario A1 (aperto originario che, vista la scelta di adottare le coordinate polari, puó essere
inteso, piuttosto che un sottoinsieme di R4 , come una specie di cilindro in 4 dimensioni, r >
0, ṙ = qualsiasi, θ ∈ C1 , θ̇ > 0, dove C1 é il cerchio unitario, visto che θ ha senso considerarla
modulo 2π ...). Iniziamo ad occuparci delle sole variabili ξ, descritte dalla dinamica lineare
ξ˙1 = ξ2 , ξ˙2 = ξ3 , ξ˙3 = v
che rappresenta un sistema lineare controllabile. Tuttavia non possiamo muoverci in tutto R3 ,
in quanto ci sono due vincoli da rispettare (ξ1 > 0 e ξ12 ξ3 + GM > 0). Per analizzare come
tali due vincoli influenzano la raggiungibilitá (di un sistema lineare che, senza vincoli, sarebbe
completamente raggiungibile ...), conviene anzitutto notare che, definendo
a(t) = ξ12 (t)ξ3 (t) ⇒ nuovo vincolo a(t) > −GM, ∀t ≥ 0
7
Per ovvii motivi di simmetria l’analisi che condurremo puó essere altrettanto efficacemente estesa all’aperto
A2 . Non solo. Come giá discusso, un eventuale ingresso impulsivo permette di trasferire lo stato da un’aperto
all’altro, per cui tutte le conclusioni cui perverremo riguardo al problema della raggiungibilitá studiato nelle variabili (ξ, η), saranno immediatamente trasferibili ad entrambi gli aperti A1 e A2 , anche nel senso di raggiungere
uno stato in un aperto a partire da uno stato nell’altro aperto!