Capitolo 3 Controllo di un satellite
Transcript
Capitolo 3 Controllo di un satellite
Capitolo 3 Controllo di un satellite 3.1 Controllo di un satellite in orbita via linearizzazione Sia M la massa della terra, m quella del satellite, r, ṙ, θ, θ̇ abbiano l’usuale significato, e siano rispettivamente u, v le forze tangenziale e radiale agenti sul satellite. Si ha r = ruR ⇒ ṙ = ṙuR + rθ̇uθ dove uR = (cos θ, sin θ) e uθ = (− sin θ, cos θ) sono gli usuali versori radiale e tangenziale. Procedendo nella derivazione r̈ = r̈uR + ṙθ̇uθ + ṙθ̇uθ + rθ̈uθ − rθ̇2 uR = uR (r̈ − rθ̇2 ) + uθ (2ṙθ̇ + rθ̈) m Applicando la legge di Newton (la forza radiale é − GM + v, mentre quella tangenziale é u) r2 r̈ − rθ̇2 = − GM 1 1 + v, 2ṙθ̇ + rθ̈ = u r2 m m da cui r̈ = rθ̇2 − GM 1 ṙθ̇ 1 + v, θ̈ = −2 + u 2 r m r mr Introducendo le variabili x1 = r, x2 = ṙ, x3 = θ, x4 = θ̇, si puó riscrivere il tutto come un sistema 4−dimensionale non lineare ma lineare nei due controlli u, v (l’uscita y per ora non é ancora stata specificata ...) ẋ1 x2 � � ẋ x x2 − GM + 1 v v 2 1 4 m x21 = = f (x) + g(x) x˙3 x4 u 1 ẋ4 −2 xx2 x1 4 + mx u 1 definito nel sottoinsieme di R4 soddisfacente il vincolo x1 > 0. Infatti nessun vincolo é assunto su ṙ, θ, θ̇, ma la coordinata radiale nella sua evoluzione temporale r(t), t ≥ 0 non puó mai annullarsi (da un punto di vista matematico perdono senso le equazioni, da uno pratico ció 47 48 CAPITOLO 3. CONTROLLO DI UN SATELLITE corrisponderebbe allo schianto del satellite sulla terra, cioé ad una collisione), e quindi non puó neppure mai cambiare segno, se r(0) > 0, come é logico assumere in qualunque problema concreto ... Notiamo comunque che, siccome la collisione con la terra é possibile, se dovesse valere r(t̄) = 0 in un primo istante t̄ > 0, la soluzione dell’equazione differenziale sarebbe definita solo in t ∈ [ 0 t̄ ]1 : dopo la collisione nessuna analisi é possibile! Che la collisione sia possibile (in tempo finito) si puó verificare come segue: assumendo nulle θ(0), θ̇(0), e nullo il controllo u(t), v(t), t ≥ 0, si vede subito che x3 (t) = x4 (t) = 0 soddisfano le equazioni, per cui rimane da studiare GM ẋ1 = x2 , ẋ2 = − 2 x1 che, assumendo ad esempio x1 (0) = R > 0, ẋ2 (0) = 0, rappresenta un punto in caduta libera, inizialmente fermo. Poiché ẋ2 (t) é sempre strettamente negativo ed aumenta in valore assoluto con il passare del tempo (in quanto x1 (t) decresce con il passare del tempo), si ha � t � t GM x2 (t) = ẋ2 (τ )dτ ≤ ẋ2 (0)dτ = ẋ2 (0)t = − 2 t R 0 0 da cui x1 (t) = x1 (0) + � t ẋ1 (τ )dτ = R + 0 � t 0 x2 (τ )dτ ≤ R + � � t 0 � − GM R2 � τ dτ = R − GM 2 t 2R2 2R3 che sicuramente si annulla prima dell’istante t = GM . La collisione quindi avviene proprio, in tal caso, in tempo finito. Di conseguenza al controllo u, v sará in primo luogo demandato il compito di evitare tale situazione catastrofica. Cercando soluzioni particolari (orbite circolari), caratterizzate da r = R = costante, θ = ωt+ψ, u = v = 0, si trova che esse soddisfano il sistema purché risulti R3 ω 2 = GM . Nel seguito assumeremo tale legame tra R, ω, GM . Una soluzione perturbata dell’orbita circolare sará tale da garantire piccoli scostamenti dalla traiettoria nominale, cioé r = x1 = R + z1 , ṙ = x2 = 0 + z2 , θ = x3 = ωt + ψ + z3 , θ̇ = x4 = ω + z4 da cui z2 ż1 ż (R + z )(ω + z )2 − GM + 1 4 2 (R+z1 )2 = z˙3 z4 (ω+z4 ) 1 −2 z2R+z + m(R+z u ż4 1 1) 1 v m É immediato notare che tale sistema ammette un punto di equilibrio nell’origine (assunti nulli entrambi gli ingressi, u = v = 0), cui corrispondono le traiettorie circolari di equilibrio x = [ R 0 ωt + ψ ω ]T , ∀ψ ∈ R. Sebbene la traiettoria circolare non fosse un vero e proprio punto di equilibrio (soluzione periodica), tale é diventata la traiettoria nel sistema degli scostamenti. In generale, quando consideriamo scostamenti da una traiettoria nominale, il sistema negli scostamenti diviene esplicitamente dipendente da t. Cosı́ sarebbe successo, 1 Trattasi di fenomeno analogo a quello giá discusso del finite escape time: qui non c’é divergenza di r(t), ma comunque raggiungiamo in tempo finito una singolaritá del sistema, che non é ben definito se r = 0, e questo + fatto impedisce alla soluzione x(t) dell’equazione di essere definita su tutto R . Si noti comunque che in realtá una divergenza é presente: se é vero che x1 (t) tende a zero, é anche vero che x2 (t) diverge! Non fa parte del programma 3.1. CONTROLLO DI UN SATELLITE IN ORBITA VIA LINEARIZZAZIONE 49 ad esempio, se avessimo assunto un’orbita nominale ellittica (r(t) sarebbe stata una funzione del tempo, non una costante). Qui non accade perché tutte le variabili, tranne una, sono costanti, e l’unica che dipende dal tempo (θ) é anche l’unica che non appare non derivata in alcuna equazione differenziale. Siamo quindi ricondotti ad un sistema cui é possibile applicare il procedimento di linearizzazione, per analizzare piccoli scostamenti e, in particolare, studiare stabilitá (e stabilizzabilitá) locale. Linearizzando nell’intorno dell’origine si ottiene facilmente il sistema linearizzato (dove R, ω rispettano sempre il vincolo espresso in precedenza) 0 3ω 2 ż = 0 0 1 0 0 − 2ω R 0 0 0 1 0 2Rω z + m 0 0 1 0 0 0 0 0 0 1 mR �v � u = Fz + G � � v = F z + g1 v + g2 u u Lo scostamento angolare dalla posizione nominale, z3 , rappresenta la variabile di maggior interesse, per vari motivi: se, come accade spesso, siamo interessati a satelliti geostazionari (tali cioé da compiere un giro in esattamente un giorno) il satellite, nella traiettoria nominale, appare fermo ad un osservatore dalla terra, ed é molto semplice misurare lo scostamento angolare z3 dalla verticale, mentre le altre variabili sono certamente accessibili ma molto piú difficilmente misurabili. Meglio quindi misurare la sola uscita y = z3 e stimare le altre variabili con uno stimatore asintotico, che permetta poi il ricorso ad una retroazione dallo stato stimato (si puó facilmente verificare che il sistema linearizzato é osservabile, assumendo y = Hz = θ = z3 , cioé H = [ 0 0 1 0 ]). L’obiettivo sará ovviamente mantenere (con il controllo) il satellite fermo sulla verticale (z3 = 0). Si noti che essendo ω stabilita (la velocitá angolare di rotazione della terra), anche il parametro R lo é, essendo legato a ω, a massa della terra ed a costante di gravitazione universale in modo univoco. Quindi i valori di ω, R possono supporsi noti (con sufficiente approssimazione). Inoltre le forze tangenziale e radiale giocano il ruolo dell’ingresso di controllo. Un calcolo degli autovalori di F porge facimente il polinomio caratteristico λ2 (λ2 + ω 2 ), da cui gli autovalori λ = 0, 0, ±iω. Gli autovalori non sono distinti, e l’autospazio generato dall’autovalore nullo é generato da [ 0 0 1 0 ]T , cioé ha dimensione 1. Ne conseguono la forma di Jordan e l’esponenziale seguenti iω 0 FJ = 0 0 0 −iω 0 0 0 0 0 0 0 eiωt 0 0 ⇒ e FJ t = 0 1 0 0 0 e−iωt 0 0 0 0 0 0 1 t 0 1 da cui i modi reali cos ωt, sin ωt, 1, t. Tutti autovalori al limite della stabilitá, quindi (parte reale nulla), ma la presenza di un modo divergente che rende la traiettoria nominale instabile. Facile giustificare i modi presenti: i modi oscillatori sono dovuti al mantenimento dello stesso periodo di oscillazione, ma con le traiettorie di forma leggermente ellittica, con periodo di oscillazione di un giorno. Il modo costante ad una perturbazione di θ il cui unico effetto é quello di shiftare nel tempo la traiettoria. Il modo divergente ad una piccola variazione del raggio dell’orbita, mantenendo la forma circolare della stessa. Dalla relazione tra R, ω, GM segue che variazioni 50 CAPITOLO 3. CONTROLLO DI UN SATELLITE di R si ripercuotono su variazioni di ω. Per quanto piccole, tali variazioni si traducono in uno scostamento angolare tra traiettoria nominale e perturbata crescente linearmente con il tempo! Il calcolo della matrice di raggiungibilitá porta facilmente a rango 4, per cui tutti gli autovalori sono allocabili. Tuttavia é interessante analizzare l’utilizzo di una forza soltanto. Se la forza utilizzata é quella radiale (che equivale a rimpiazzare G con g1 ), tale rango é pari solo a 3 ed il sistema non é raggiungibile. Impossibile quindi stabilizzarlo asintoticamente con l’uso della sola forza radiale (interpretazione fisica: la forza radiale puó modificare l’energia ma non il momento angolare: se il valore di quest’ultimo é errato, la forza radiale non potrá riportare il moto alla traiettoria nominale). Dei quattro autovalori, tre sono allocabili ed uno no e, per ovvii motivi di simmetria coniugata, quello non allocabile é λ = 0. Invece, con G = g2 (ricorrendo quindi alla sola forza tangenziale) si ha raggiungibilitá e tutti gli autovalori sono allocabili: allocando ad esempio (λ + ω)4 , cioé tutti gli autovalori in −ω, il ritorno all’orbita geostazionaria nominale é asintoticamente garantito da un controllo lineare u = Kz (con forza u(∞) = 0, nulla a regime). L’unica K che alloca tali autovalori é K = m [ −8ω 2 − 83 ω 0 3ω 2 1 2 ω R −4ωR ] ⇒ F + g2 K = 3 0 2 − 8ωR 1 0 0 ω − 14 3 R 0 0 0 ω2 3 0 2Rω 1 −4ω In tal modo la stabilizzazione (almeno locale, non necessariamente globale) dell’orbita é raggiunta con la sola forza tangenziale u = Kz. 3.2 Considerazioni sulla controllabilitá non lineare Il risultato positivo del paragrafo precedente suggerisce che in qualche maniera il sistema terrasatellite sia controllabile. Dobbiamo peró ricorrere alle tecniche di feedback linearization, per verificare le effettive possibilitá di controllo. In effetti, ponendo x1 x24 − GM + m1 v = w1 x21 1 −2 xx2 x1 4 + mx u = w2 1 � � ⇔ v = m −x1 x24 + GM + mw1 x21 ⇔ u = 2mx2 x4 + mx1 w2 il tutto si trasforma nel sistema lineare disaccoppiato (dove w1 agisce su r, ṙ mentre w2 su θ, θ̇) � � � ẋ1 0 1 = ẋ2 0 0 �� � � � x1 0 + w, x2 1 1 � � � ẋ3 0 1 = ẋ4 0 0 �� � � � x3 0 + w x4 1 2 dove ora i singoli sistemi sono lineari e controllabili. É quindi possibile agire con w1 , w2 in modo da trasferire qualsiasi stato iniziale in uno finale in tempo finito. In realtá c’é una piccola complicazione dovuta al fatto che r = x1 deve essere sempre positivo (in effetti é l’unica variabile di stato che compare in qualche denominatore e quindi non deve annullarsi mai, restando per continuitá sempre positiva, come giá discusso in precedenza). 3.2. CONSIDERAZIONI SULLA CONTROLLABILITÁ NON LINEARE 51 Siccome il sistema linearizzato é controllabile facendo ricorso alla sola forza tangenziale u, nel seguito assumeremo v = 0, anche per ricondurci alla teoria sviluppata nel precedente capitolo, dove ci siamo occupati esclusivamente di sistemi SISO. Considereremo il seguente problema: a partire da qualsivoglia condizioni iniziali, é possibile applicare un controllo in feedback che permetta il raggiungimento asintotico (in senso pertanto globale e non solo locale) di una prefissata traiettoria circolare (di raggio R preassegnato, non necessariamente corrispondente ad una traiettoria geostazionaria)? É interessante notare come l’algoritmo che ora evidenzieremo, accumunato con il controllo linearizzato geostazionario precedente, permetta di trasportare il satellite, in qualunque punto si trovi trascorso un certo tempo dal lancio, nell’orbita geostazionaria desiderata. In una prima fase useremo il feedback non lineare di natura globale che ci apprestiamo ad analizzare, per portare il satellite in prossimitá dell’orbita geostazionaria (ricordiamo che il legame R3 ω 2 = GM permette in pratica una valutazione, pur molto precisa ma sempre approssimata, 2π del valore di R. Infatti ωdes = giorno , assieme alla conoscenza di G e M permetterebbe in teoria il calcolo del raggio esatto. Ma errori di calcolo, anche piccolissimi, renderebbero solo ω � ωdes ), in una seconda fase attiveremo il feedback locale giá analizzato per mantenere la geostazionarietá in senso assolutamente esatto! Come noto la forma normale dipende fortemente dalla scelta della funzione d’uscita y = h(x). Nel sistema linearizzato si é discusso come la scelta piú ragionevole fosse quella di misurare la posizione angolare, per cui vediamo se anche in ambito non lineare tale scelta si rivela utile. Ponendo x2 x4 1 y = x3 = θ = ξ1 ⇒ ξ2 = ξ˙1 = ẋ3 = x4 , ξ˙2 = ẋ4 = −2 + u x1 mx1 si ottiene un grado relativo basso (r = 2). Siamo obbligati ad introdurre due variabili non osservabili (ad esempio η1 = x1 , η2 = x2 ) che (per pura coincidenza) rendono il diffeomeomorfismo un cambio di base lineare! Il feedback linearizzante é ovviamente v = −2 x2 x4 1 + u ⇔ u = 2mx2 x4 + mx1 v x1 mx1 che trasforma il sistema in y = ξ1 , ξ˙1 = ξ2 , ξ˙2 = v, ma purtroppo la parte che rimane al di fuori del nostro controllo diretto (la parte non lineare e non osservabile) ha dimensione 2. Non conviene quindi tale scelta di y. Ne faremo quindi un’altra, che conduce a grado relativo r = 3, rinviando al seguito la verifica che ció é quanto di meglio si riesca a fare, nel senso che r = 4 non é comunque ottenibile. Si ponga y = x1 = ξ 1 Il calcolo della derivata porge ξ˙1 = x2 e poiché l’ingresso u non appare, poniamo ξ2 = x2 e procediamo nella derivazione GM ξ˙1 = ξ2 , ξ˙2 = x1 x24 − 2 x1 52 CAPITOLO 3. CONTROLLO DI UN SATELLITE Siccome ancora l’ingresso non appare, procediamo ancora, dopo aver posto ξ3 = x1 x24 − GM x21 d GM 2GM 2x4 ξ˙1 = ξ2 , ξ˙2 = ξ3 , ξ˙3 = [x1 x24 − 2 ] = −3x2 x24 + x2 + u 3 dt x1 x1 m che si trasforma in ξ˙3 = v non appena si ponga (feedback linearizzante) v = −3x2 x24 + 2GM 2x4 3 GM mx2 m x2 + u ⇔ u = mx2 x4 − + v 3 3 x1 m 2 x1 x4 2x4 Ovviamente il sistema ha grado relativo r = 3, ed occorre introdurre una variabile η1 . É facile rendersi conto che η1 = x3 é una possibile scelta, e che vale η̇1 = x4 . Quindi ξ1 = x1 , ξ2 = x2 , ξ3 = x1 x24 − x 1 = ξ 1 , x2 = ξ 2 , x4 = � � 2 � ξ ξ3 ±� 1 GM 2GM 2x4 , η1 = x3 , v = −3x2 x24 + x2 + u⇔ x21 x31 m + GM 3 GM mx2 m , x3 = η1 , u = mx2 x4 − + v 3 3 ξ1 2 x1 x4 2x4 Chiaramente, determinata l’espressione di v(t) che risolve il problema, potremo sostituirla in quella di u(t) ottenendo alla fine un feedback non lineare che posiziona (asintoticamente) il satellite nell’orbita desiderata (o quantomeno in sua prossimitá, per quanto giá discusso). Riscriviamo le equazioni precedenti come � � 2 0 1 0 0 � ξ ξ3 + GM ˙ y = [ 1 0 0 ] ξ, ξ = 0 0 1 ξ + 0 v, η̇1 = ±� 1 ξ13 0 0 0 1 Esaminiamo dapprima la dinamica non lineare (η), notando che essa puó essere facilmente risolta come η1 (t) = η1 � � t � � ξ12 (τ )ξ3 (τ ) + GM � (0) ± dτ 0 ξ13 (τ ) = η1 (0) + � t 0 x4 (τ )dτ il che non é affatto sorprendente, ricordando il significato delle varie variabili (η1 rappresenta la posizione angolare, x4 la velocitá angolare). La risoluzione é stata possibile in quanto tale equazione non lineare é peró lineare in η1 , cioé della forma η˙1 = aη1 + f (ξ, v) ⇒ η1 (t) = eat η1 (0) + � t 0 ea(t−τ ) f (ξ(τ ), v(τ ))dτ Anzi, addirittura η1 non appare al secondo membro, per cui a = 0 ... una sorta di stabilitá semplice ma non asintotica per tale sottosistema non lineare, cioé per la zero output dynamics, che vedremo non comporterá nessun problema ... 3.2. CONSIDERAZIONI SULLA CONTROLLABILITÁ NON LINEARE 53 Prima di procedere, é opportuno discutere i domini dove sono definiti i diffeomeomorfismi introdotti. Anzitutto,� é �necessario introdurre due distinti diffeomeomorfismi (in analogia ξ all’Esempio 5), in quanto = Φ(x) é ben definito, ma l’inversa Φ−1 no, essendo indetermiη nato il segno di x4 . In effetti é necessario distinguere i casi x1 > 0, x4 > 0 e x1 > 0, x4 < 0, cioé suddividere lo spazio x in due aperti disgiunti A1 = { x ∈ R4 : x1 > 0, x4 > 0 }, A2 = { x ∈ R4 : x1 > 0, x4 < 0 } notando che in ciascuno di essi Φ(x) diventa invertibile (ma le due inverse hanno diverso segno nell’espressione di x4 ), e che oltre al giá commentato vincolo x1 > 0, dobbiamo ora aggiungere l’ulteriore vincolo x4 �= 0, dovuto al fatto che x4 interviene al denominatore nell’espressione che definisce il feedback linearizzante. Ció significa che il cambio di variabili effettuato ci impone di escludere a priori dall’analisi traiettorie di stato per le quali x4 (t) possa annullarsi, per cui considereremo solo evoluzioni per le quali il segno di x4 (t) sia sempre lo stesso (pari a quello di x4 (0), ovviamente ...), e quindi traiettorie interamente confinate in uno dei due aperti precedentemente definiti. In nessun caso sono ammesse transizioni da un aperto all’altro. Il significato fisico del vincolo é immediato: x4 rappresenta la velocitá angolare, per cui non ammetteremo mai la possibilitá di invertire il verso di rotazione del moto2 . Ma anche nello spazio (ξ, η) ci sono dei vincoli: dall’espressione di x4 , dovrá essere ξ12 ξ3 > −GM in ogni istante di tempo, altrimenti x4 si annullerebbe o, peggio, diverrebbe immaginaria, facendo perdere senso fisico al cambio di variabile. Quindi, definito l’aperto A3 = { (ξ, η) ∈ R4 : ξ1 > 0, ξ12 ξ3 > −GM } (non avendo dimenticato il vincolo ξ1 = x1 > 0), i due diffeomeomorfismi introdotti lavorano tra A1 e A3 e tra A2 e A3 , rispettivamente. Il vincolo espresso dall’aperto A3 sulle variabili ξ (η in realtá nel vincolo non interviene ...) avrá le sue importanti conseguenze. Lavorando con le nuove variabili, dovremo assicurarci che in nessun caso tali vincoli vengano violati, altrimenti perderebbe senso fisico la soluzione. Si noti infatti che l’espressione di u(t), riscritta in termini delle nuove variabili3 u=± 3mξ12 ξ2 ξ3 + GM mξ2 + mξ13 v � 2ξ1 ξ13 ξ3 + GM ξ1 rende u(t) immaginario (o infinito) qualora il vincolo ξ12 ξ3 > −GM non sia soddisfatto. Nonostante ξ, v assumano valori in R, l’ingresso u(t) effettivo e quindi anche l’evoluzione x(t) non esibirebbero piú valori reali, ma complessi, facendo perdere senso fisico alla soluzione. 2 Se per qualsiasi ragione fosse necessario invertirlo, potremmo farlo facilmente notando che un ingresso impulsivo u(t) = aδ(t) induce una discontinuitá in x4 , lasciando continue le altre variabili. Sará sufficiente pertanto spegnere il controllo fornito dal feedback linearizzante per un tempo brevissimo, applicare un ingresso impulsivo, o che quantomeno approssimi un andamento impulsivo, di ampiezza tale da invertire il segno di x4 nel punto di discontinuitá. Potremo successivamente riattivare il controllo in retroazione senza problemi, lavorando d’ora in poi nell’aperto corrispondente al segno di x4 opposto a quello di x4 (0). 3 Il segno dipende dall’essere nell’aperto A1 oppure A2 . Anche il segno che compare in η̇1 = ± . . . dipende dalla stessa circostanza. Come giá discusso, la forma normale puó assumere diverse espressioni in due aperti distinti ... 54 CAPITOLO 3. CONTROLLO DI UN SATELLITE Il sottosistema lineare controllabile ed osservabile della forma normale cui siamo pervenuti, ci permette di allocare un qualsiasi polinomio caratteristico di terzo grado (ovviamente stabile). Sia quindi K = [ −a −b −c ] una qualsiasi matrice tale che λ3 +cλ2 +bλ+a abbia le tre radici a parte reale negativa (la loro scelta puó dipendere dalla rapiditá con cui si vuole raggiungere l’obiettivo, piú spesso da un opportuno compromesso tra tempo di risposta ed energia spesa dal motore che attua la forza u(t)). Poniamo ora v(t) = Kξ(t) + v0 dove v0 rappresenta un ingresso costante Sostituendo si ottiene 0 ˙ξ = 0 −a la cui ragione d’essere sará chiara tra un attimo. 1 0 0 0 1 ξ + 0 −b −c v0 e cerchiamo se tale equazione ammette punti di equilibrio, cioé soluzioni ξ(t) =costante. Tale ricerca fornisce facilmente l’unica soluzione (a �= 0, altrimenti il polinomio caratteristico non avrebbe solo radici a parte reale negativa) ξ1 = v0 , ξ2 = ξ 3 = 0 a Proviamo che asintoticamente ξ(t) raggiunge proprio il vettore ξeq = [ va0 0 0 ]T . Da (F + gK)ξeq + gv0 = 0, ξ˙ = (F + gK)ξ + gv0 segue facimente d [ξ(t) − ξeq ] = (F + gK)[ξ(t) − ξeq ] ⇒ ξ(t) − ξeq = e(F +gK)t (ξ(0) − ξeq ) dt da cui la convergenza a ξeq (in senso globale) di ξ(t), per t tendente a +∞. Rimane solo da interpretare il risultato: a regime si avrá ξ1 = x1 = r = va0 , per cui basta scegliere v0 = aR, dove R é il raggio orbitale desiderato, per ottenere asintoticamente r(t) � R. Inoltre ξ2 = x2 = 0, affatto sorprendente (significa a regime ṙ = 0, come dev’essere per una traiettoria circolare), ed infine ξ3 = x1 x24 − GM = 0 che, ricordando x1 = r = R a regime e x4 = θ̇, porge θ̇ = ω = costante x21 a regime, soddisfacente R3 ω 2 = GM , come dev’essere per una traiettoria circolare. L’obiettivo di condurre il satellite in un’orbita circolare (qualsiasi, non necessariamente geostazionaria) é cosı́ raggiunto! Alcune osservazioni: • Abbastanza sorprendentemente (per la controllabilitá riscontrata nel sistema linearizzato), il grado relativo risulta r = 3 < 4, per cui riusciamo a controllare bene solo tre variabili di stato e non quattro, usando la sola forza tangenziale. Per fortuna la variabile η = θ non é cosı́ importante nel posizionamento di un’orbita, e come giá visto il suo andamento puó comunque essere facilmente calcolato una volta deciso l’ingresso v(t) da applicare, e risolte le corrispondenti equazioni differenziali in ξ. A regime sará comunque θ(t) = ωt + ψ (solo qualora si sia interessati, come é stato finora, al raggiungimento di 3.2. CONSIDERAZIONI SULLA CONTROLLABILITÁ NON LINEARE 55 un’orbita circolare, ovviamente), dove il valore di ψ non é impostabile a priori, ma solo calcolabile. Il sistema é sceso di ordine perché abbiamo perso informazione sulla variabile θ (ma non su θ̇), e quindi ψ puó a priori assumere qualunque valore (d’altronde qualunque valore essa abbia, trattasi sempre della stessa orbita circolare). Vedremo in seguito, qualora si desideri raggiungere in un certo istante anche una ben precisa posizione angolare nell’orbita circolare, come si puó facilmente risolvere questo problema; • Come capita spesso con strategie globali di stabilizzazione per sistemi non lineari, i cambi di variabile effettuati pongono delle restrizioni: abbiamo giá analizzato il significato del vincolo x1 > 0 (che evita la collisione con la terra) e quello del vincolo x4 �= 0, che non permette, durante l’azione di controllo, un’inversione angolare del moto! Accertarsi dell’assenza di collisione e di inversione del senso del moto é tutto quanto viene richiesto al sistema lineare in analisi per poter rendere funzionante il feedback globale or ora esposto; • In analogia al feedback lineare che stabilizza l’orbita geostazionaria, dove in assenza di perturbazioni la forza tangenziale u(t) é esattamente nulla, questo feedback non lineare si comporta allo stesso modo a regime. Infatti v(∞) = v0 + Kξ(∞) = v0 − aR = 0), ma non dimentichiamo che il controllo applicato é in realtá 3 GM mx2 m u = mx2 x4 − + v 3 2 x1 x4 2x4 che é anch’esso nullo asintoticamente, essendo x2 = ṙ = 0, v = 0, a regime. Ció non é affatto sorprendente, in quanto nessuna forza tangenziale (né radiale aggiuntiva) é richiesta per il mantenimento di un’orbita circolare soddisfacente il vincolo R3 ω 2 = GM . Il risultato trovato é quindi in perfetto accordo con l’intuizione. Val la pena tornare sulla questione dei vincoli precedentemente discussa. Al sistema lineare (in ξ) possiamo applicare qualsiasi tecnica di controllo nota (effettuare retroazioni, trasferimenti tra stati con la tecnica del gramiano, ecc. ...), in sostanza applicare ingressi v qualsiasi, ma bisogna essere certi che la legge di controllo adottata non violi mai i due vincoli ξ1 > 0, ξ12 ξ3 > −GM . Tale circostanza puó anche essere verificata a priori, nel senso che é sufficiente una simulazione dell’evoluzione di stato corrispondente all’applicazione di un certo v(t) (il calcolo é semplice, trattandosi di sistema lineare ... nessuna verifica é infatti richiesta sulla variabile η1 , l’unica avente dinamica non lineare ...) per verificare l’eventuale violazione dei vincoli. Se ció dovesse accadere, il controllo v(t) non sarebbe ammissibile ed andrebbe riprogettato, in quanto le evoluzioni del sistema non devono mai passare nelle regioni proibite (quelle che non rispettano i vincoli), quando studiate in termini delle variabili η, ξ. Purtroppo, la tecnica di allocazione degli autovalori non garantisce affatto che i vincoli non possano venir violati. Le prossime figure illustrano, nel piano (ξ1 , ξ3 ), la proiezione delle traiettorie (curve in R4 ) corrispondenti all’allocazione del polinomio caratteristico (s + 1)3 ed all’applicazione di un ingresso costante al sistema retroazionato per raggiungere il punto di equilibrio ξ = [ 1 0 0 ]T , partendo rispettivamente da ξ(0) = [ 1 −2 1 ]T e da ξ(0) = [ 1 5 1 ]T . Come si vede, semplicemente modificando il valore di ξ2 (0) = ṙ(0), si puó facilmente violare sia il 56 CAPITOLO 3. CONTROLLO DI UN SATELLITE 4 vincolo ξ1 > 0, sia quello ξ3 > − GM . La prima traiettoria porta infatti a collisione con la ξ12 terra (violazione del vincolo ξ1 > 0, non appena passiamo nel secondo quadrante), la seconda viola l’altro vincolo (si annulla θ̇ non appena nel quarto quadrante la traiettoria interseca la curva di forma pseudo-iperbolica corrispondente al vincolo). In entrambi i casi, la soluzione perde significato fisico dopo un tempo finito (collisione con la terra o velocitá angolare che diventa immaginaria, caso in cui nel punto di singolaritá l’ingresso effettivo u(t) esibisce un fenomeno tipo finite escape time, in quanto diventa infinito non appena la velocitá angolare si annulla, per poi diventare addirittura immaginario ...). Queste soluzioni non sono accettabili, il che suggerisce come l’analisi appena effettuata sul sistema lineare sia stata un pó frettolosa: é necessaria un’analisi meno superficiale e piú approfondita per analizzare la possibilitá di raggiungere l’orbita circolare desiderata5 ... Quando si verifica la situazione della prima figura (ξ1 = 0, ξ3 > 0), nel dominio x ció corrisponde alla situazione x1 = 0, x4 = ±∞, u = ±∞. In pratica, la traiettoria assume una forma a spirale che collide con la terra in tempo finito, con l’applicazione di una forza tangenziale tendente all’infinito, e con la corrispondente velocitá angolare di rotazione che tende all’infinito anch’essa: situazione catastrofica che, una volta raggiunta, non permette di mantenere senso fisico alla soluzione dopo l’impatto! Quando si verifica la situazione della seconda figura (ξ1 > 0, ξ3 = − GM ), nel dominio x ció corrisponde alla situazione x1 > 0, x4 = 0, u = ±∞. In ξ12 pratica non accade nulla di particolare, se non per il fatto che l’ingresso diverge in tempo finito. Ma quello che perde senso fisico accade subito dopo: la velocitá angolare (e l’ingresso u(t)) divengono immaginari puri, la posizione angolare diventa complessa, mentre restano reali r, ṙ. 4 Nelle figure seguenti si é assunto GM = 30. Ovviamente la sostanza non cambia, in quanto moltiplicando per il fattore GM 30 le condizioni iniziali, il punto di equilibrio raggiunto e l’ingresso costante di controllo, si otterrebbero andamenti della stessa forma di quelli indicati. 5 In realtá il problema é meno serio, rispetto a quanto qui evidenziato: in molti casi le condizioni iniziali non saranno cosı́ critiche, in molti casi una scelta diversa per il polinomio caratteristico eliminerá il problema. Senza contare che in ambito lineare esistono altre ben note tecniche di raggiungibilitá, ad esempio quella basata sul gramiano, e che comunque possiamo tentare di raggiungere il punto desiderato non in modo diretto, ma raggiungendo in sequenza una serie di stati non tanto lontani tra loro (diminuendo cosı́ decisamente la probabilitá di violare i vincoli, tentando di seguire una traiettoria che eviti accuratamente le regioni proibite ...). Peró il problema esiste, e quindi va affrontato, anche se esistono vari modi per riuscire ad aggirarlo ... 3.3. GRADO RELATIVO DEL SISTEMA SATELLITE 57 Chiaramente non si puó attribuire alcun senso fisico a tale soluzione (dopo l’istante t̄ in cui si annulla θ̇), in quanto applicare forze immaginarie e riscontrare velocitá angolari immaginarie non ha alcun senso! Il feedback linearizzante non esiste (sui numeri reali) dopo l’istante t̄, e tutte le conclusioni nel dominio (ξ, η) perdono significato nel dominio x (anche se nulla di tutto ció accade nel dominio ξ, dove ξ, v rimangono reali, continuano ad aver senso, e non manifestano nulla di speciale ... tuttavia η risente del fenomeno, in quanto η1 si che diventa complessa ...). Tutto ció ci obbliga a prestare molta attenzione all’evoluzione del sistema nelle nuove variabili, in quanto anche semplici retroazioni lineari possono causare seri problemi: é di conseguenza necessaria un’analisi del problema della raggiungibilitá (di un punto xF ∈ R4 a partire da un punto xI ∈ R4 ) che tengano dall’inizio in considerazione i vincoli, se si vogliono comprendere le prestazioni di controllo realmente ottenibili ricorrendo al solo uso della forza tangenziale. 3.3 Grado relativo del sistema satellite Calcoliamo la matrice di raggiungibilitá non lineare del satellite: si ha da cui x2 x x2 − GM 1 4 x21 f (x) = x4 −2 xx2 x1 4 0 2 x4 + 2GM ∂f x31 = 0 ∂x 2 xx2 x2 4 1 e quindi 1 0 0 −2 xx41 0 −2 x4 m [f, g] = 1 − mx1 x2 mx21 da cui 2 xm4 2 x4 2 xmx 1 [f, [f, g]] = 0 x2 −3 mx41 − ed infine , , g(x) = 0 0 0 1 mx1 0 0 0 0 0 2x1 x4 ∂g , = 0 0 1 ∂x 1 x2 − mx 0 −2 x1 2 1 ∂[f, g] = ∂x 0 0 1 mx21 x2 −2 mx 3 1 0 0 0 1 mx21 0 x2 x4 ∂[f, [f, g]] −2 mx21 , = 0 ∂x x2 GM 3 mx42 + 4 mx 5 1 [f, [f, [f, g]]] = 2 3 −2 x2 x24 + 6 x4 − 4 GM x3 4 m mx1 mx1 x24 GM 3 mx1 + mx4 1 2 x x 2 4 GM x2 9 mx 2 + 2 mx5 1 1 0 0 0 0 0 0 0 0 0 x4 2 mx 1 0 0 1 2 x4 −6 xmx 1 0 0 0 0 0 0 0 − m2 0 0 0 0 GM mx41 2 0 m x2 0 2 mx 1 0 0 x4 0 −6 mx 1 58 CAPITOLO 3. CONTROLLO DI UN SATELLITE da cui detR4 = 4 x24 (2x1 x22 − 3GM ) �= 0 m4 x51 Quindi la prima condizione é soddisfatta. Non é invece soddisfatta la seconda condizione (involutivitá)6 , in quanto risulta 0 1 [g, [f, g]] = −2 2 m x1 1 0 ⇒ det [ [g, [f, g]] g [f, g] [f, [f, g]] ] = 4 0 x4 �= 0 m5 x31 che prova che il rango aumenta (passa da 3 a 4) aggiungendo tale colonna a R3 , che non é quindi chiusa alle Lie Brackets. Sappiamo dalla teoria che il grado relativo non potrá raggiungere r = n = 4 per nessuna scelta della funzione d’uscita, mentre la scelta che abbiamo effettuato, y = x1 = ξ1 , conduce a grado relativo 3, che é quindi il massimo che si puó ottenere. É istruttivo effettuare anche una verifica diretta della non esistenza di y = h(x) che renda r = 4. Da y = h(x1 , x2 , x3 , x4 ) segue ẏ = ∂h ∂h ∂h ∂h ẋ1 + ẋ2 + ẋ3 + ẋ4 ∂x1 ∂x2 ∂x3 ∂x4 Sostituendo le espressioni di ẋi , siccome ẋ4 é l’unica che coinvolge u, se si desidera che ẏ non ∂h dipenda da u, dev’essere ∂x = 0, quindi h non puó dipendere da x4 e si ha y = h(x1 , x2 , x3 ). 4 Proseguendo nella derivazione con tale assunzione, si ottiene (dopo conti laboriosi) � � ∂h 1 ∂h u ÿ = . . . + 2x4 + ∂x2 x1 ∂x3 m dove . . . rappresentano termini che non dipendono da u. Se vogliamo che ÿ non dipenda da u deve quindi essere ∂h ∂h 2x1 x4 + =0 ∂x2 ∂x3 L’equazione precedente é peró della forma a(x1 , x2 , x3 )x4 + b(x1 , x2 , x3 ) = 0, da cui necessaria∂h ∂h mente a = b = 0 e quindi in definitiva ∂x = ∂x = 0. Ecco provato che h non dipende neppure 2 3 da x2 , x3 , cioé y = h(x1 ). Rifacendo i conti a partire da tale espressione si trova facilmente che y, ẏ, ÿ non dipendono da u, mentre (solito significato per i termini ...) d3 2x4 dh y = ... + u 3 dt m dx1 6 Dall’analisi successiva seguirá che il sistema non lineare non é completamente controllabile ma ... quasi, nel senso che lo é in un’ampia regione. A differenza del caso lineare, dove se la condizione di controllabilitá non é n soddisfatta possiamo raggiungere solo un sottospazio di R , quindi un insieme di misura nulla, qui riusciremo a raggiungere ben di piú ... ció conferma il fatto, giá menzionato, che le condizioni esposte non sono propriamente delle condizioni di controllabilitá in senso letterale, ma semplicemente condizioni per poter ottenere r = n. 3.4. CONTROLLABILITÁ VIA IL FEEDBACK LINEARIZZANTE 59 dh che, per essere indipendente da u, implica dx = 0, cioé y = costante, per cui il grado relativo 1 non sarebbe definito (sistema completamente non osservabile). Ció prova che il grado relativo é al massimo 3 scegliendo y funzione (non banale) della sola variabile x1 , mentre altrimenti é inferiore ... Nota: considerando il precedente sistema linearizzato (nell’intorno di un’orbita circolare) ż = F z + g2 u, é immediato verificare che y = a(z2 − 2Rωz3 ) = a [ 0 1 −2Rω 0 ] z, a �= 0, rappresenta tutte e sole le possibili scelte (lineari) dell’uscita che rendono il sistema di grado 3 relativo 4. Piú precisamente, scegliendo ξ1 = y, ξ2 = ẏ, ξ3 = ÿ, ξ4 = dtd 3 y, si arriva al sistema lineare algebricamente equivalente seguente (per a = 1), in (quasi) forma canonica di controllo la cui FDT 0 0 ξ˙ = 0 0 1 0 0 1 0 0 0 −ω 2 W (s) = 6ω 3 1 2 2 m s (s + ω 2 ) 0 0 6ω 3 0 0 ξ + u, y = [ 1 0 0 0 ] ξ 1 m 0 0 1 ha grado relativo r = 4. Quindi é solo il sistema non lineare che non riesce ad andare oltre al valore r = 3 (come ben noto dalla teoria ... per un sistema lineare controllabile esiste sempre una scelta di y = Hx che rende r = n). 3.4 Controllabilitá via il feedback linearizzante L’aperto A3 precedentemente definito é diffeomeomorfo all’aperto A1 7 , quindi eventuali regioni non raggiungibili nelle variabili (η, ξ) hanno un corrispondente non raggiungibile nell’aperto originario A1 (aperto originario che, vista la scelta di adottare le coordinate polari, puó essere inteso, piuttosto che un sottoinsieme di R4 , come una specie di cilindro in 4 dimensioni, r > 0, ṙ = qualsiasi, θ ∈ C1 , θ̇ > 0, dove C1 é il cerchio unitario, visto che θ ha senso considerarla modulo 2π ...). Iniziamo ad occuparci delle sole variabili ξ, descritte dalla dinamica lineare ξ˙1 = ξ2 , ξ˙2 = ξ3 , ξ˙3 = v che rappresenta un sistema lineare controllabile. Tuttavia non possiamo muoverci in tutto R3 , in quanto ci sono due vincoli da rispettare (ξ1 > 0 e ξ12 ξ3 + GM > 0). Per analizzare come tali due vincoli influenzano la raggiungibilitá (di un sistema lineare che, senza vincoli, sarebbe completamente raggiungibile ...), conviene anzitutto notare che, definendo a(t) = ξ12 (t)ξ3 (t) ⇒ nuovo vincolo a(t) > −GM, ∀t ≥ 0 7 Per ovvii motivi di simmetria l’analisi che condurremo puó essere altrettanto efficacemente estesa all’aperto A2 . Non solo. Come giá discusso, un eventuale ingresso impulsivo permette di trasferire lo stato da un’aperto all’altro, per cui tutte le conclusioni cui perverremo riguardo al problema della raggiungibilitá studiato nelle variabili (ξ, η), saranno immediatamente trasferibili ad entrambi gli aperti A1 e A2 , anche nel senso di raggiungere uno stato in un aperto a partire da uno stato nell’altro aperto!