Tesi - Osservatorio di Arcetri

Transcript

Tesi - Osservatorio di Arcetri
UNIVERSITA DEGLI STUDI DI FIRENZE
Facolta di Scienze Matematiche, Fisiche e Naturali
Tesi di Laurea in Fisica
di
Armando Riccardi
Analisi e sviluppo di un nuovo sensore
di fronte d'onda per sistemi ottici
adattivi, basato sul \test" di Foucault
Relatore:
Dott. Simone Esposito
Correlatore:
Prof. Alberto Righini
Anno Accademico 1995-1996
A Paola
Indice
1 Telescopi, turbolenza atmosferica e sistemi ottici adattivi
6
1.1
Parametri che caratterizzano le immagini prodotte da un telescopio .
6
1.2
PSF e OTF nel caso limitato dalla diffrazione . . . . . . . . . . . . .
9
1.3
PSF e OTF in presenza di aberrazioni introdotte dalla turbolenza
atmosferica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4
Turbolenza di Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5
Parametro di Fried e risoluzione angolare . . . . . . . . . . . . . . . . 17
1.6
Rapporto di Strehl e decomposizione modale degli effetti della turbolenza
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.7
Risoluzione angolare come parametro di qualità globale . . . . . . . . 22
1.8
Principi di funzionamento dei sistemi Ottici Adattivi . . . . . . . . . 24
1.9
Parametri fondamentali per un sistema ottico adattivo . . . . . . . . 25
1.9.1
Frequenza di correzione . . . . . . . . . . . . . . . . . . . . . . 26
1.9.2
Numero di attuatori e intervallo richiesto di correzione . . . . 26
1.9.3
Angolo isoplanatico e sorgente di riferimento . . . . . . . . . . 28
1.10 Il sensore di Shack-Hartmann . . . . . . . . . . . . . . . . . . . . . . 31
2 Il test di Foucault in ottica adattiva. Il sensore a piramide
35
2.1
Principio di funzionamento del test di Foucault . . . . . . . . . . . . 35
2.2
Impiego quantitativo del test di Foucault . . . . . . . . . . . . . . . . 39
2.2.1
Il test di Foucault per piccole aberrazioni . . . . . . . . . . . . 39
2.2.2
Metodo dello scorrimento del coltello . . . . . . . . . . . . . . 40
2.2.3
Metodo con modulazione del “tilt” locale . . . . . . . . . . . . 43
i
2.3
Applicazione del test di Foucault a sistemi ottici adattivi . . . . . . . 47
2.3.1
2.4
Misure simultanee delle derivate della funzione di aberrazione
48
Il sensore a piramide con modulazione di fuoco . . . . . . . . . . . . . 51
2.4.1
Efficienza del sensore in termini di rapporto segnale-rumore
2.4.2
Confronto con il sensore di Shack-Hartmann . . . . . . . . . . 57
3 Simulazione del sensore a piramide con modulazione di fuoco
. 55
61
3.1
Trattazione diffrattiva del test di Foucault . . . . . . . . . . . . . . . 61
3.2
Descrizione del codice di simulazione . . . . . . . . . . . . . . . . . . 66
3.3
3.2.1
Generazione della funzione di aberrazione . . . . . . . . . . . . 68
3.2.2
Eliminazione del termine di tilt globale . . . . . . . . . . . . . 71
3.2.3
Introduzione dello sfocamento e propagazione sul rivelatore . . 71
3.2.4
Stima di ∇W e ricostruzione del fronte d’onda . . . . . . . . . 74
3.2.5
Correzione del fronte d’onda . . . . . . . . . . . . . . . . . . . 76
Risultati della simulazione . . . . . . . . . . . . . . . . . . . . . . . . 77
3.3.1
Discussione dei risultati con rapporto segnale-rumore infinito . 81
3.3.2
Discussione dei risultati con rapporto segnale-rumore finito . . 83
4 Realizzazione del sensore a piramide con modulazione di fuoco.
85
4.1
Apparato sperimentale . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.2
L’ottica che produce le aberrazioni . . . . . . . . . . . . . . . . . . . 87
4.3
La membrana vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.4
Il doppio prisma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.5
La camera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.6
Il “software” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5 Risultati sperimentali e loro discussione
97
5.1
Oggetto della misura . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.2
Acquisizione delle misure . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3
Discussione dei risultati
. . . . . . . . . . . . . . . . . . . . . . . . . 101
ii
A Proprietà delle trasformate di Fourier
105
B Polinomi di Zernike
107
iii
Introduzione
L’astrofisica studia oggetti e processi che, nella maggior parte dei casi, non sono
riproducibili in laboratorio, per cui l’insieme delle conoscenze sperimentali si fondano sull’osservazione diretta degli oggetti stessi. La maggior parte delle informazioni utilizzate in campo astrofisico sono ottenute dall’analisi della radiazione
elettromagnetica che giunge a noi dagli oggetti studiati e solo in piccola parte da
altre fonti come, ad esempio, i neutrini o i raggi cosmici. Ciò fa del telescopio il principale strumento di indagine nel campo astrofisico, in quanto collettore di radiazione
elettromagnetica.
Le informazioni sullo stato fisico degli oggetti studiati sono ottenute, in genere,
dall’analisi della distribuzione di intensità, associata al campo elettromagnetico
emesso, in funzione della direzione da cui proviene, della lunghezza d’onda e del
tempo.1 Per conoscere in dettaglio tali oggetti, dunque, può essere necessario che
il telescopio raggiunga una alta sensibilità, associata ad una elevata risoluzione angolare, spettrale e temporale. Tali richieste possono essere limitate, come vedremo,
non tanto dalla qualità delle ottiche del telescopio o dei rivelatori, ma dalla presenza dell’atmosfera. Per prima cosa, l’atmosfera assorbe parte della radiazione che
proviene da un oggetto, permettendo osservazioni da terra essenzialmente in due
particolari regioni dello spettro, la finestra ottica e quella radio. La prima si estende
da lunghezze d’onda di circa 300 nm a circa 1.4 µm. Il taglio nell’ultravioletto è
dovuto allo strato di ozono (O3 ) che si trova approssimativamente a 25 km di quota. Nell’infrarosso la diminuizione della trasparenza è più graduale, con una serie
1
Lo stato di polarizzazione della radiazione elettromagnetica fornisce ulteriori informazioni. Nel
presente lavoro trascureremo tale argomento.
1
di strette finestre intervallate da bande di assorbimento dovute, principalmente, al
vapore acqueo (H2 O) e anidride carbonica (CO2 ). La finestra radio si estende da
circa 8 mm a circa 15 m, sebbene l’elevato assorbimento inizi a decrescere da circa
300 µm. Il taglio a 15 m è causato dalla riflessione delle onde radio sulla ionosfera, una regione dell’atmosfera oltre i 100 km di quota che possiede una elevata
percentuale di elettroni liberi e ioni. Nel presente lavoro ci interesseremo soltanto
delle osservazioni nella finestra ottica e più precisamente tra circa 0.55 µm (visibile)
e 2.2 µm (vicino infrarosso).
Anche se nella regione di nostro interesse la trasparenza dell’atmosfera permette
osservazioni da terra, essa presenta uno strato compreso tra il livello del suolo e
25 ÷ 30 km (troposfera e la prima porzione della stratosfera), che è caratterizzato da un regime di turbolenza con variazione casuale dell’indice di rifrazione. La
propagazione in un tale mezzo determina fluttuazioni di intensità (scintillazione) e
deformazioni del fronte d’onda della radiazione che raggiunge il telescopio, “deteriorando” le informazioni trasportate. Per questa ragione la struttura dell’immagine
di una stella ottenuta con un telescopio astronomico, anche nel caso di ottiche perfette, differisce dalla figura di diffrazione prevista teoricamente e muta rapidamente
con tempi caratteristici dell’ordine di 1 ÷ 10 ms. Con tempi di esposizioni cosı̀
brevi possiamo “congelare” gli effetti della turbolenza, evidenziando due contributi
principali: una diffusione dell’immagine (spesso in una struttura a macchie) e un
moto casuale del baricentro dell’intera figura. Le esposizioni a scopo astronomico
sono generalmente molto più lunghe e le strutture osservate vengono integrate nel
tempo, generando una tipica figura simmetrica il cui diametro corrisponde ad un
angolo in cielo di circa 0.5÷2 secondi d’arco (per un buon sito astronomico). Questa
dimensione è equivalente alla risoluzione angolare raggiunta da un telescopio otticamente perfetto di circa 20 ÷ 5 cm di diametro nel visibile e di circa 90 ÷ 20 cm
per λ ≈ 2.2 µm. Un tipico telescopio astronomico di 4 m di diamtero, ad esempio,
sarebbe invece in grado di raggiungere una risoluzione angolare teorica di 0.03 arcsec nel visibile e 0.1 arcsec a λ = 2.2 µm. La presenza della turbolenza, dunque,
2
degrada il potere risolutivo angolare, di un tale strumento, di 5 ÷ 70 volte.
Costruendo telescopi sempre più grandi si raccoglie sempre più radiazione (aumentando la sensibilità), ma non si riesce a migliorare il potere risolutivo angolare.
Una delle tecniche più promettenti e flessibili, che permette di recuperare risoluzione
angolare, è l’ottica adattiva. Questa tecnica permette di compensare in tempo reale
le deformazioni del fronte d’onda causate dalla turbolenza atmosferica. La compensazione è attuata inserendo nel percorso ottico un dispositivo (tipicamente uno
specchio deformabile) che riesca ad introdurre nel fronte d’onda una distorsione
uguale e contraria a quella prodotta dalla turbolenza.
Per determinare la forma che lo specchio deformabile deve assumere, viene utilizzato un dispositivo detto sensore di fronte d’onda. Questo analizza la radiazione
proveniente da una sorgente celeste di riferimento (o una stella artificiale) e fornisce
informazioni sufficienti a ricostruire il fronte stesso.
Scopo e originalità della tesi
Il lavoro svolto per questa tesi ha avuto lo scopo di sviluppare un nuovo sensore
di fronte d’onda per ottiche adattive, detto sensore a piramide con modulazione di
fuoco. Nella tesi abbiamo analizzato in dettaglio le caratteristiche del sensore e ne
abbiamo realizzato un primo prototipo. Questo dispositivo basa il suo principio di
funzionamento sul test di Foucault e nasce come sviluppo di un sensore proposto da
R. Ragazzoni (sensore a piramide oscillante, 1996) a cui abbiamo apportato alcune
modifiche per incrementarne la rapidità.
Il sensore a piramide è particolamente interessante, perché permette di modificare, con semplicità e continuità, il campionamento spaziale e la sensibilità della
misura del fronte d’onda sulla pupilla del telescopio. Queste proprietà sono fondamentali per ottimizzare l’efficienza dell’intero sistema adattivo, al variare, per
esempio, delle condizioni di turbolenza, della lunghezza d’onda in cui viene eseguita l’osservazione e della luminosità della sorgente di riferimento disponibile. È da
notare che i sensori per ottica adattiva difficilmente permettono di variare simul3
taneamente e indipendentemenete il campionamento e la sensibilità della misura del
fronte d’onda. Ciò è vero, in particolare, per il sensore più diffuso tra i sistemi adattivi per uso astronomico (sensore di Shack-Hartman). Inoltre il sensore a piramide è
caratterizzato dall’avere relazioni analitiche semplici che intercorrono tra il segnale
misurato (una distribuzione di intensità su un rivelatore panoramico) e le derivate
del fronte d’onda.
Le modifiche che abbiamo apportato al sensore proposto da R. Ragazzoni, hanno
reso necessaria una trattazione analitica originale che ne descrivesse il funzionamento. Questa trattazione, ottenuta nel regime di ottica geometrica, ha permesso di
ottenere le relazioni fra segnale misurato e gradiente del fronte d’onda, di caratterizzare la risposta del dispositivo in termini di rapporto segnale-rumore e di identificare
la configurazione di lavoro ottimale del sensore.
Per ottenere una descrizione più completa del sensore nelle tipiche condizioni
che si presentano nei sistemi adattivi per uso astronomico, abbiamo sviluppato un
codice numerico che ne simula il comportamento in ottica diffrattiva. Questo codice
ha confermato l’applicabilità delle relazioni ottenute con la trattazione in ottica geometrica ed ha evidenziato l’importanza di poter modificare la sensibilità del sensore
per massimizzare le prestazioni del sistema adattivo.
Infine, allo scopo di vericare la realizzabilità del sensore descritto, ne abbiamo
realizzato un prototipo con l’attrezzatura di laboratorio a nostra disposizione.
Struttura della tesi
La tesi può essere divisa in tre parti. Nella prima, costituita dal cap. 1, abbiamo descritto l’influenza dalla turbolenza atmosferica sulla qualità delle immagini ottenute
da telescopi astronomici basati a terra. A questo scopo abbiamo riassunto i risultati fondamentali dell’analisi di Fourier dei sistemi ottici e le principali proprietà
statistiche della turbolenza atmosferica.
In base a ciò abbiamo descritto il funzionamento e i parametri fondamentali dei
sistemi ottici adattivi mostrando come essi consentano di ridurre, se non eliminare,
4
gli effetti della turbolenza, migliorando notevolmente le prestazioni dei telescopi
astronomici.
La seconda parte, costituita dai capp.2 e 3, descrive ed analizza, da un punto
di vista teorico, il sensore sviluppato nella tesi. In particolare, nel cap. 2, dopo
una descrizione del test di Foucault classico, presentiamo le modifiche che abbiamo
apportato a tale test allo scopo di renderlo quantitativo e utilizzabile per realizzare
un sensore di fronte d’onda per sistemi ottici adattivi. Successivamente, tramite
una trattazione in ottica geometrica, ricaviamo le equazioni che regolano il comportamento di tale sensore. In base ai risultati ottenuti, abbiamo confrontato le
caratteristiche di questo sensore con quello del sensore di Shack-Hartman. L’analisi teorica è ulteriormente approfondita nel cap. 3, che contiene la descrizione del
codice numerico citato in precedenza. Questo codice simula il comportamento del
sensore quando è inserito in un sistema ottico adattivo. Il capitolo si conclude con
la discussione dei risultati ottenuti dalle simulazioni per varie condizioni di lavoro
del sensore.
La terza parte, che descrive il lavoro sperimentale della tesi, è costituita dai
capp. 4 e 5, che descrivono rispettivamente la realizzazione su banco ottico del
sensore di fronte d’onda e le misure con esso effettuato. In particolare il cap. 4 è
dedicato alla descrizione dei componenti ottici principali del sistema, del disegno
ottico utilizzato per un corretto funzionamento del sensore e del software sviluppato
per l’acquisizione e la riduzione dei dati. Nel cap. 5 sono riportati i risultati di
alcune delle misure effettuate durante il lavoro di tesi. Lo scopo di queste misure
è di studiare il comportamento del sensore in presenza di aberrazioni statiche. Il
capitolo si conclude con la discussione dei risultati ottenuti.
5
Capitolo 1
Telescopi, turbolenza atmosferica
e sistemi ottici adattivi
1.1
Parametri che caratterizzano le immagini prodotte
da un telescopio
Un telescopio, indipendentemente dai particolari della loro struttura, contiene un
elemento ottico la cui apertura limita maggiormente il fascio. L’immagine di questa
apertura formata dagli elementi ottici che la seguono è chiamata pupilla di uscita del
sistema, mentre l’immagine formata dagli elementi ottici che la precedono è detta
pupilla di entrata [Jenkins & White, 1972, cap. 7].
Con riferimento alla fig. 1.1, indichiamo con (xo , yo ), (x, y) e (xi , yi ) i sistemi di
riferimento sui piani, rispettivamente, dell’oggetto, della pupilla di uscita e dell’immagine. I centri sono posti sull’asse ottico z. Indichiamo con do la distanza del piano
oggetto dalla pupilla di ingresso. Nel caso astronomico do può essere condiderato
praticamente infinito, per cui la distanza tra la pupilla di uscita e il piano immagine
rappresenta la focale f del sistema ottico. Con questa configurazione risulta più
comodo riferirsi alla direzione in cui si trova un oggetto in cielo. Questa direzione
può essere individuata dagli angoli αo = xo /do e βo = yo /do formati con i piani yo z
e xo z. Per coerenza identifichiamo un punto (xi , yi ) sul piano immagine con la sua
direzione equivalente in cielo data da (αi , βi ) = (xi /f, yi /f ).
1
1
Per interpretare αo come un angolo, abbiamo supposto (xo /do )2 1 (approssimazione parassiale). In questo modo è possibile approssimare xo /do = sin αo ≈ αo . Analoghe considerazioni
6
y
Ottiche del
telescopio
o
i
βi
z
βo
y
y
Pupilla di Pupilla di
uscita
ingresso
Figura 1.1: Geometria di un sistema ottico che produce un’immagine di una sorgente all’infinito.
(xo , yo ) piano oggetto, (x, y) piano della pupilla di uscita, (xi , yi ) piano immagine. Gli assi xo , x
e xi sono ortogonali al foglio. L’asse z rappresenta l’asse ottico.
Indichiamo con Io (αo , βo ) la distribuzione di intensità proveniente dall’oggetto astronomico dalla direzione (αo , βo ) e con Ii (αi , βi ) la distribuzione di intensità
osservata sul piano immagine.
I tipici processi di emissione che regolano la produzione di radiazione in un
oggetto astronomico generano il campo elettromagnetico in punti distinti con relazioni di fase statisticamente indipendenti. Questo motivo, insieme all’ipotesi che
l’oggetto abbia dimensioni angolari maggiori del rapporto tra la lunghezza d’onda
di osservazione e il diametro del telescopio2 [Goodman, 1985, par. 5.2], permette di
considerare la sorgente spazialmente incoerente. Questa proprietà permette di calcolare la distribuzione di intensità sul piano immagine come somma delle intensità
prodotte dai singoli punti che compongono l’oggetto.
valgono per gli altri angoli.
2
Vedremo in seguito che questa condizione rende la sorgente indistinguibile da una sorgente
puntiforme.
7
Quanto affermato può essere espresso dall’integrale di sovrapposizione
Ii (αi , βi ) =
∞
−∞
PSF (αi , βi ; αo , βo )Io (αo , βo )dαo dβo ,
(1.1)
dove la funzione PSF (αi , βi ; αo , βo ) rappresenta la risposta all’impulso in intensità
o Point Spread Function (PSF), cioè l’intensità nella direzione (αi , βi ) quando una
sorgente puntiforme è posta nella direzione (αo , βo ).
Nel caso in cui la risposta all’impulso sia invariante per traslazione, la funzione
PSF dipende soltanto dalle differenze αi − αo e βi − βo . In questo caso il sistema è
detto isoplanatico. In realtà un sistema ottico difficilmente verifica questa proprietà
su tutto il proprio campo di vista, comunque è sempre possibile suddividere il campo
dell’oggetto in regioni sufficientemente piccole (zone isoplanatiche) in cui la PSF
possa essere considerata invariante. Per ogni regione si ha una risposta impulsiva
differente e l’eq. 1.1 diventa
Ii (αi , βi ) =
∞
−∞
PSF (αi − αo , βi − βo )Io (αo , βo )dαo dβo .
(1.2)
Utilizzando l’operatore di trasformata di Fourier F definito da
F{f}(kα , kβ ) =
∞
−∞
f(α, β) exp [−2πi(kα α + kβ β)] dαdβ .
(1.3)
e sfruttando il teorema della convoluzione (vedi app. A, eq. A.1), l’eq. 1.2 può essere
scritta nello spazio delle frequenze spaziali
Gi (kα , kβ ) = OTF (kα , kβ )Go (kα , kβ ) ,
(1.4)
dove Gi , OTF e Go sono le trasformate di Fourier di Ii , PSF e Io , mentre (kα , kβ )
è una coppia di frequenze angolari, misurate, ad esempio, in rad−1 . La funzione
OTF è chiamata funzione di trasferimento ottica o Optical Tranfer Function (OTF).
L’eq. 1.4 permette di interpretare un sistema ottico come un filtro nel dominio delle
frequenze angolari. Il modulo di OTF (kα , kβ ) è detto Modulation Tranfer Function
(MTF) e rappresenta il fattore di attenuazione con cui sono riprodotte le componenti
spettrali Go (kα , kβ ) della sorgente nell’immagine.
8
La conoscenza della PSF o della OTF descrive totalmente il comportamento del
sistema ottico, infatti, per ogni distribuzione di intensità associata all’oggetto, permettono di prevedere la distribuzione di intensità associata all’immagine, utilizzando
l’eq. 1.2 o l’eq. 1.4.
1.2
PSF e OTF nel caso limitato dalla diffrazione
Nel caso in cui le ottiche del sistema siano perfette e in assenza di disturbi esterni
(ad esempio la turbolenza atmosferica), una sorgente puntiforme nella direzione
(αo , βo ) produce, sulla pupilla di uscita, una porzione di onda sferica centrata nel
punto sul piano immagine individuato dalla direzione (αi , βi ) = (αo , βo ). In questo
caso diremo che il sistema è limitato dalla diffrazione. Se indichiamo con P (x, y) la
funzione pupilla di uscita definita da
P (x, y) =
1
0
se (x, y) appartiene alla pupilla
,
altrimenti
(1.5)
si può dimostrare che la PSF dipende dalla trasformata di Fourier di P secondo la
relazione [Goodman, 1985, par. 7.2]
∞
2
P (λα, λβ) exp [−2πi(α α + β β)] dαdβ ,
P SF (α , β ) ∝ −∞
(1.6)
dove α = αi − αo , β = βi − βo e λ è la lunghezza d’onda media nella banda in
cui eseguiamo l’osservazione. Ricordiamo che la funzione di trasferimento ottica è la
trasformata di Fourier della PSF, per cui, utilizzando il teorema dell’autocorrelazione
(vedi app. A, eq. A.2) e normalizzando la OTF al suo valore nell’origine, otteniamo
∞
OTF (kα , kβ ) =
∗
−∞ P (x, y)P (x − λkα , y − λkβ ) dxdy
∞
2
−∞ |P (x, y)| dxdy
,
(1.7)
in cui l’asterisco indica il comlesso coniugato.
In fig. 1.2 sono riportate la PSF e la OTF nel caso di un sistema ottico con una
pupilla di uscita circolare di diametro D. È stato sufficiente riportare il profilo su un
solo asse perché le due funzioni, in questo caso, presentano simmetria circolare.
9
α/(λ/D)
k/(D/λ)
Figura 1.2: PSF e OTF per un sistema ottico con pupilla circolare e limitato dalla diffrazione.
Come di può notare, anche in presenza di un sistema perfetto, l’immagine di
una sorgente puntiforme (PSF) ha dimensioni angolari non nulle, a causa degli effetti di diffrazione introdotti dall’estensione finita della pupilla di uscita P (x, y).
L’immagine che si ottiene è chiamata figura di Airy ed è costituita da una zona
centrale brillante circolare (che raccoglie ≈ 84% dell’energia totale) e da anelli concentrici molto più deboli. La larghezza a mezza altezza o Full Width High Maximum
(FWHM) della PSF può essere considerara una stima della della risoluzione angolare
del sistema e nel presente caso è data da
FWHM ld = 1.03
λ
[rad] .
D
(1.8)
È evidente, quindi, che il sistema ottico non permetta di distingure particolari dell’oggetto sottesi sotto un angolo minore o circa uguale a λ/D. Questa proprietà
risulta evidente dal grafico della OTF in cui si nota la presenza di una frequenza
angolare di taglio kc = D/λ, oltre la quale le componenti spettrali Go della sorgente
non possono essere riprodotte.
10
La risoluzione angolare migliora, dunque, con l’aumentare del diametro D del
telescopio. Questo risultato, comunque, è valido soltanto per sistemi ottici limitati dalla diffrazione. Come vedremo, la presenza di difetti nelle ottiche o disturbi
introdotti dalla atmosfera turbolenta, causano deviazioni dal comportamento ideale del sistema ottico, producendo difetti nell’immagine (aberrazioni) e limitando le
prestazioni del telescopio in termini di risoluzione angolare.
1.3
PSF e OTF in presenza di aberrazioni introdotte dalla turbolenza atmosferica
Supponiamo di poter trattare la propagazione del campo elettromagnetico con una
teoria scalare [Goodman, 1968]. Questa produce risultati accurati se le dimensioni
dei diaframmi nel sistema sono molto maggiori della lunghezza d’onda e se il campo
diffratto non è osservato troppo vicino ai diaframmi stessi. Nell’ipotesi di radiazione
monocromatica con frequenza ν, il campo scalare u può essere descritto come
u(x, y, z; t) = A(x, y, z) cos [−2πνt + φ(x, y, z)] ,
(1.9)
dove A e φ sono grandezze reali che rappresentano, rispettivamente, l’ampiezza e la
fase del campo elettromagnetico nel punto (x, y, z). Definendo la quantità complessa
U (x, y, z), detta fasore, come
U (x, y, z) = A(x, y, z) exp [iφ(x, y, z)] ,
(1.10)
u(x, y, z; t) = [U (x, y, z) exp(−2πiνt)] ,
(1.11)
l’Eq. 1.9 diventa
dove la funzione (ζ) rende la parte reale del suo argomento. Le superfici a fase φ
costante sono dette fronti d’onda.
Nel caso limitato dalla diffrazione, una sorgente puntiforme nella direzione (αo , βo )
produce una porzione di onda sferica sulla pupilla di uscita centrata nel punto
(xi , yi ) = (f αo , f βo ) sul piano immagine. Il fasore corrispondente sul piano della
11
pupilla (z = 0) assume la forma
π 2
2
U (x, y) = A P (x, y) exp −i
(x − f αo ) + (y − f βo )
,
λf
(1.12)
in cui abbiamo omesso di specificare la coordinata z. La costante A rappresenta
l’ampiezza dell’onda piana in ingresso (sorgente puntiforme all’infinito) e P la funzione pupilla definita precedentemente. L’argomento dell’esponenziale rappresenta
l’approssimazione quadratica del fronte d’onda sferico centrato in (f αo , f βo ) sul piano immagine e passante per il centro della pupilla. Questa approssimazione è valida
se (D/4f )2 1. Questo fronte d’onda è detto sfera di riferimento.
Consideriamo, adesso, il sistema ottico costituito dall’insieme del telescopio (che
supporremo limitato dalla diffrazione) e dallo strato di atmosfera sovrastante. Lo
stato turbolento dell’atmosfera, che gli astronomi usano descrivere con il termine seeing, genera fluttuazioni casuali dell’indice di rifrazione. La propagazione del campo
elettromagnetico in tale mezzo introduce aberrazioni che inducono, sulla pupilla di
uscita, una deformazione del fronte d’onda e una modulazione dell’ampiezza del
campo (scintillazione). Questo permette di descrivere il sistema totale come un sistema perfetto a cui sono aggiunti, sulla pupilla di uscita, una lamina di fase e un
filtro a trasmissione variabile, che riproducano, rispettivamente, la stessa distorsione
del fronte d’onda e la stessa modulazione di ampiezza introdotta dall’atmosfera. In
questo modo gli effetti delle aberrazioni possono essere descritti sostituendo, nella
eq. 1.12, una funzione pupilla generalizzata P definita da
P (x, y) = P (x, y) exp [i∆φ(x, y) + χ(x, y)] ,
(1.13)
in cui ∆φ e χ sono funzioni reali definite sulla pupilla ed espresse in radianti. La
prima descrive le perturbazioni di fase e la seconda le perturbazioni del logaritmo dell’ampiezza (o log-ampiezza). La grandezza Φ = ∆φ − iχ è chiamata fase
complessa.
Spesso può essere utile riferirsi alle distorsioni geometriche del fronte d’onda più
che alle sue perturbazioni in fase ∆φ. A questo scopo possiamo definire la funzione
12
di aberrazione W
W (x, y) =
λ
∆φ ,
2π
(1.14)
che può essere interpretata come una misura, in unità di cammino ottico, delle
deformazioni del fronte d’onda rispetto alla sfera di riferimento.
Le espressioni della PSF e della OTF in presesenza di aberrazioni sono date dalle
eq. 1.6 e 1.7 in cui la funzione pupilla è sostituita con l’espressione 1.13. In questo
modo otteniamo
∞
PSF (α , β ) ∝ P (λα, λβ) exp [i∆φ(λα, λβ) + χ(λα, λβ)]
−∞
2
exp [−2πi(α α + β β)] dαdβ| ,
∞
OTF (kα , kβ ) =
−∞ P (x, y)P
∗
(1.15)
(x , y ) exp {(χ + χ ) + i(∆φ − ∆φ )} dx, dy
, (1.16)
∞
2
−∞ |P (x, y)| exp(2χ)dxdy
dove x = x − λkα , y = y − λkβ , χ e ∆φ sono calcolati in (x, y) e χ e ∆φ in (x , y ).
Come vedremo in seguito, le fluttuazioni temporali di ∆φ e χ hanno tempi caratteristici (1 ÷ 10 ms alle frequenze di nostro interesse) molto minori delle tipiche
esposizioni astronomiche (limite di lunghe esposizioni (LE)). Questo permette di stimare la OTFLE corrispondente, introducendo una media di insieme nel numeratore
e denominatore della eq. 1.16.
Poiché χ e ∆φ possono essere considerate funzioni casuali gaussiane [Goodman, 1985,
par. 8.4.3] e supponendo la turbolenza omogenea ed isotropa, è possibile giungere al
seguente risultato [Fried, 1966]
1
OTF LE (k) = OTF T (k) exp − [Dφ (λk) + Dχ (λk)]
2
,
(1.17)
dove OTF T è la funzione di trasferimento del telescopio (che supporremo privo di
aberrazioni) in assenza di turbolenza e Dχ e Dφ sono le funzioni di struttura delle
perturbazioni della log-ampiezza e della fase sulla pupilla del telescopio. Queste
sono definite da
Dχ (|r|) =
Dφ (|r|) =
[χ(r1 + r) − χ(r1 )]2
(1.18)
[∆φ(r1 + r) − ∆φ(r1 )]2 ,
13
(1.19)
in cui r1 e r sono vettori sul piano (x, y). La dipendenza delle funzioni di struttura dal solo modulo del vettore r discende dall’ipotesi di isotropia e omogeneità
della turbolenza. L’esponenziale nell’eq. 1.17 è interpretabile come la funzione di
trasferimento atmosferica, che indicheremo con
1
OTF A (k) = exp − DΦ (λk) ,
2
(1.20)
dove la quantità DΦ (r) = Dφ (r) + Dχ (r) è detta funzione di struttura d’onda.
Per ottenere l’andamento della funzione di trasferimento atmosferica con k è
necessario definire un modello di turbolenza che permetta di fornire una espressione
analitica per DΦ . Utilizzeremo il modello di Kolmogorov, che viene comunemente
sfruttato dagli astronomi per descrivere la turbolenza atmosferica.
1.4
Turbolenza di Kolmogorov
La turbolenza in un fluido si origina da instabilità del moto laminare quando il
numero di Reynolds Re supera un certo valore critico Recr . Il numero di Reynolds
è definito dalla quantità adimensionale
Re(L0 ) =
L0 vL0
,
ν
(1.21)
dove L0 è la dimensione caratteristica del sistema, vL0 rappresenta la velocità caratteristica del fluido alla scala L0 e ν è il coefficiente di viscosità cinematica. Il numero
Recr dipende soltanto dalle caratteristiche geometriche del flusso ed è, in genere,
dell’ordine di poche migliaia.
Per l’aria ν ≈ 15 × 10−6 m2 s−1 e per l’atmosfera L0 > 15 m e vL0 > 1 m/s, per
cui Re(L0 ) > 106 ( Recr ), che corrisponde ad un regime turbolento. Kolmogorov
[Kolmogorov, 1941] suggerı̀ che, per valori cosı̀ grandi del numero di Reynolds, l’energia dissipata per frizione viscosa è trascurabile rispetto all’energia che alimenta le
perturbazioni della velocità alla scala L0 , che viene, dunque, integralmente trasferita alle scale più piccole. Il passaggio di energia tra scale diverse è dovuto ai tipici
processi non lineari che regolano il moto di un fluido. Ad ogni scala ρ, per la quale
14
Re(ρ) = ρvρ /ν rimane ancora molto maggiore di Recr , si ha un comportamento
simile, instaurando un regime in cui l’energia per unità di tempo e di massa , introdotta nel flusso turbolento alla scala L0 , si trasferisce (senza perdite) di scala in
scala, alimentando la turbolenza a scale sempre più piccole. Giunti alla scala l0 , per
cui Re(l0 ) ≈ Recr (l0 ≈ 1 ÷ 10 mm), l’energia cinetica è dissipata in energia termica
per attrito viscoso e il processo di trasferimento di energia “a cascata” si arresta. La
scala L0 è chiamata scala esterna (o outer scale) e l0 scala interna (o inner scale).
Nell’intervallo lo ρ L0 , detto intervallo inerziale, gli effetti dovuti alla
viscosità sono trascurabili (ρ l0 ) e la turbolenza può essere considerata isotropa
ed omogenea (ρ L0 ), per cui la struttura della turbolenza è regolata soltanto
dall’energia per unità di tempo e di massa che viene trasferita di scala in scala.
In un regime stazionario deve coincidere con l’energia cinetica perduta dal fluido,
cioè con l’energia dissipata per unità di tempo e di massa 0 per attrito viscoso alla
scala inferiore l0 .
Consideriamo la funzione di struttura delle fluttuazioni vi e vj di due componenti
i e j della velocità (i, j = x, y, z). Questa è definita da
Dij (|ρ|) =
2 vi (ρ1 + ρ) − vj (ρ1 )
,
(1.22)
dove ρ1 e ρ sono due vettori nello spazio occupato dal fluido. Per quanto affermato in
precedenza, essa non può dipendere da altri parametri che il suo argomento ρ = |ρ|
e il tasso di dissipazione viscosa 0 . L’analisi dimensionale impone che valga la
relazione
Dij (ρ) ∝ (
0 ρ)2/3
(1.23)
Con i lavori di Obukhov [Obukhov, 1949] e Tatarski [Tatarski, 1961, par. 3.4] si
è potuto dimostrare che vale la stessa legge di potenza per la funzione di struttura
Dn delle fluttuazioni n = n − n dell’indice di rifrazione n. Poiché Dn è positiva
per definizione, viene scritta nella forma
Dn (r) = Cn2 ρ2/3 ,
15
(1.24)
Figura 1.3: Profilo medio di Cn2 . Linea continua: profilo notturno. Linea tratteggiata: profilo
diurno
dove il coefficiente Cn2 (misurato in m−2/3 ) è chiamato costante di struttura delle
fluttuazioni di n.
Si ricordi che la validità dell’eq. 1.24 è limitata all’intervallo inerziale l0 ρ L0 , per cui Cn2 potrà essere considerato costante in regioni non più grandi di L0 . Negli
anni ’70 sono state eseguite misure di Cn2 in funzione della quota h [Bufton, 1973,
Barletti et al., 1977] che hanno evidenziato la concentrazione della turbolenza in
strati con uno spessore tipico di 100 m (che risulta una stima di L0 ), in cui Cn2 cresce
variando di più di un ordine di grandezza. Una volta regolarizzato, il profilo Cn2 (h)
presenta il tipico andamento mostrato in fig. 1.3, in cui si possono distinguere due
strati principali: uno strato inferiore, fino a ≈ 1 km (Planetary Boundary Layer),
soggetto al ciclo giornaliero di riscaldamento dovuto al Sole, e uno strato superiore
(Atmosfera Libera) influenzato soltanto dal ciclo delle stagioni. Il picco di turbolenza
a ≈ 10 km è dovuto ai forti venti presenti in tropopausa, dopo il quale Cn2 decresce
> 25 km.
nuovamente e si può considerare nullo per h ∼
16
1.5
Parametro di Fried e risoluzione angolare
L’eq. 1.24 permette di ottenere la funzione di struttura d’onda sul piano della pupilla,
che può essere scritta nella forma [Fried, 1966]
r
DΦ (r) = Dχ (r) + Dφ (r) = 6.88
r0
5/3
,
(1.25)
dove il parametro di Fried r0 ha le dimensioni di una lunghezza e, per osservazioni
in prossimità della verticale (Zenith), è dato da
2π
r0 = 0.423
λ
2 −3/5
Cn2 (h)dh
.
(1.26)
Si noti che r0 ∝ λ6/5 e dipende soltanto dall’integrale di Cn2 (h) e non dalla particolare
distribuzione con la quota h.
Con questi risultati la OTF atmosferica diventa

λ
OTF A (k) = exp −3.44
k
r0
5/3 
 ,
(1.27)
che risulta dipendere dal solo parametro di Fried r0 , che assume, dunque, un ruolo
fondamentale nella descrizione degli effetti della turbolenza atmosferica nella formazione dell’immagine. In fig. 1.4 è mostrato il confronto tra OTF A e OTF T per un
tipico telescopio (D = 4 m) in un buon sito astronomico durante la notte (r0 = 15 cm
per λ = 0.55 µm). Si può notare come la turbolenza atmosferica introduca una tipica
frequenza angolare di taglio kseeing data da
kseeing =
r0
[rad−1 ] ,
λ
(1.28)
che risulta essere D/r0 volte minore rispetto alla frequenza di taglio kc = D/λ del
caso limitato dalla diffrazione, perdendo gran parte dei dettagli dell’oggetto visibili
in assenza di turbolenza. Per D r0 e k < D/λ, dunque, la OTF del sistema è
limitata dalla turbolenza atmosferica e, fissato r0 , indipendente dal valore di D.
La PSF del sistema è proporzionale, per definizione, alla antitrasformata di Fourier della OTF (≈ OTF A (k) per D r0 ). Poiché la potenza 5/3 di k non è lontana
17
PSF
OTF
0.20
1.0
0.8
Shtrehl Ratio
0.15
0.6
0.10
0.4
0.05
0.2
0.00
-10
-5
0
5
10
Distanza angolare normalizzata
0.0
0.0
0.2
0.4
0.6
0.8
1.0
Frequenze spaziali normalizzate
Figura 1.4: Confronto fra la OTF imperturbata e 4 OTF perturbate corrispondenti ai valori di
D/r0 4,8,12,16. Stessa cosa per le PSF
da 2, la PSF è approssimativamente una gaussiana con larghezza a mezza altezza
(risoluzione del sistema)
FWHM seeing ≈
λ
[rad] ,
r0
(1.29)
anche se le ali non decrescono con altrettanta rapidità. La PSF ottenuta definisce la
cosidetta figura di seeing e la risoluzione λ/r0 , in genere espressa in secondi d’arco
(arcsec) per λ = 0.5 µm, è chiamata angolo di seeing o più semplicemente seeing
(≈ 0.5 ÷ 1 arcsec per un buon sito astronomico).
Aumentare il diametro del telescopio permette di aumentare la radiazione raccolta (incrementando la sensibilità), ma non la risoluzione angolare dell’immagine.
Quest’ultima rimane quella di un telescopio di diametro pari a r0 , con una perdita in
risoluzione di un fattore D/r0 rispetto al caso limitato dalla diffrazione. Per fare un
esempio, un telescopio di 8 m operante nel visibile ha, cosı̀, una risoluzione angolare
effettiva circa 50 volte peggiore di quella prevista in assenza di turbolenza.
La degradazione dell’immagine che abbiamo descritto è prodotta dal contributo
18
delle perturbazioni di fase e della log-ampiezza. Vediamo di stabilire se uno dei due
contributi è dominante.
È possibile dimostrare [Tatarski, 1961, cap. 8] che
Dχ (r) Dφ (r) se r (Hλ)1/2
(1.30)
1
Dχ (r) ≈ Dφ (r) se r (Hλ)1/2
2
dove H è la lunghezza del percorso della radiazione nel mezzo turbolento. La prima
approssimazione è detta di campo vicino (o near-field), la seconda di campo lontano
(o far-field). Abbiamo visto che il maggior contributo alla turbolenza atmosferica in
alta quota proviene dagli strati a ≈ 10 km di altezza. In questo modo, osservando
oggetti allo Zenith, possiamo supporre H ≈ 10 km. La condizione in cui vale
l’approssimazione di near-field diventa r 7 cm per λ = 0.55 µm, che considereremo
soddisfatta, considerando r dell’ordine del diametro dei tipici telescopi astronomici
(D = 1 ÷ 8 m). Gli effetti di scintillazione, dunque, possono essere trascurati e in
particolare, dall’eq. 1.25, otteniamo
r
Dφ (r) ≈ 6.88
r0
5/3
.
(1.31)
Dall’equazione precedente e dalla definizione della funzione di aberrazione (eq. 1.14)
−5/3
otteniamo che la funzione di struttura di W è proporzionale a λ2 r0
. Poiché
r0 ∝ λ6/5 , le fluttuazioni di W non dipendono dalla lunghezza d’onda. Questa proprietà, come vedremo in seguito, sarà molto importante per la realizzazione pratica
di sistemi destinati alla correzione degli effetti di seeing.
1.6
Rapporto di Strehl e decomposizione modale
degli effetti della turbolenza
Introduciamo, adesso, il rapporto di Strehl SR che è tipicamente utilizzato in ottica
per quantificare la qualità dell’immagine. Questo parametro è definito come il rapporto tra il picco della PSF in presenza di aberrazioni e il picco della PSF limitata
dalla diffrazione. Nel nostro caso
SR =
PSF seeing (0, 0)
.
PSF dl (0, 0)
19
(1.32)
Il rapporto di Strehl per sistemi ottici privi di aberrazioni vale SR = 1, mentre vale
SR < 1 quando la FWHM della PSF si allarga per effetto del seeing, provocando
un abbassamento del picco centrale (vedi fig.1.2). Utilizzando le eq. 1.6, 1.15 e
l’approssimazione di campo vicino, dalla definizione di SR abbiamo
2 ∞
−∞ P (x, y) exp [i∆φ(x, y)] dxdy 2 SR =
= exp(i∆φ) ,
2
∞
−∞ P (x, y)dxdy (1.33)
dove la sovralineatura indica la media sulla superficie della pupilla. Se ∆φ 1 rad,
possiamo sviluppare l’esponenziale nell’eq. 1.33 e trascurare i termini di ordine
superiore a (∆φ)2 . In questo caso il rapporto di Strehl assume la forma
2 SR ≈ 1 − (∆φ)2 − ∆φ
2
= 1 − σ∆φ
,
(1.34)
2
in cui abbiamo indicato con σ∆φ
il valore di aspettazione dell’errore quadratico
medio delle perturbazioni di fase sulla pupilla. L’eq. 1.34 identifica in σ∆φ un altro
importante parametro per descrivere la qualità del sistema ottico. Ricordiamo che
< 1 rad esiste
l’espressione trovata è valida solo per σ∆φ 1 rad, comunque per σ∆φ ∼
una espressione empirica [Mahajan, 1991, par. 8.3] data da
2
SR ≈ exp −σ∆φ
.
(1.35)
Per descrivere la statistica delle fluttuazioni di fase su una pupilla circolare può
essere utile esprimere ∆φ in termini del suo sviluppo in polinomi ortonormali di
Zernike (vedi app. B), dato da
∆φ(x, y) =
∞
aj Zj (x/R, y/R) ,
(1.36)
j=1
dove R = D/2 è il raggio della pupilla. Utilizzeremo la versione dei polinomi introdotta da Noll [Noll, 1976], per i quali la condizione di normalizzazione impone
che la radice del valore quadratico medio (o rms) sulla pupilla sia unitaria. Ogni polinomio (o modo) descrive un particolare tipo di aberrazione, ad esempio Z2
e Z3 sono funzioni lineari e corrispondono a errori di inclinazione del fronte d’onda (centraggio dell’immagine), Z4 corrisponde a difetti di fuori fuoco, Z5 e Z6 ad
astigmatismo, ecc.
20
1
2
3
4
5
6
7
8
9
10
11
j > 11
a2j
[rad2 ]
j
0.448(D/r0 )5/3
0.448(D/r0 )5/3
0.023(D/r0 )5/3
0.023(D/r0 )5/3
0.023(D/r0 )5/3
0.0062(D/r0 )5/3
0.0062(D/r0 )5/3
0.0062(D/r0 )5/3
0.0062(D/r0 )5/3
0.0024(D/r0 )5/3
2
∆j = ∞
j =j+1 aj
[rad2 ]
1.030(D/r0 )5/3
0.582(D/r0 )5/3
0.134(D/r0 )5/3
0.111(D/r0 )5/3
0.0880(D/r0 )5/3
0.0648(D/r0 )5/3
0.0587(D/r0 )5/3
0.0525(D/r0 )5/3
0.0463(D/r0 )5/3
0.0401(D/r0 )5/3
0.0377(D/r
)5/3
√ 0
0.2944j − 3/2 (D/r0 )5/3
Tabella 1.1: a2j : contributo del j-esimo polinomio di Zernike al valore di aspettazione dell’errore
quadratico medio sulla pupilla delle perturbazioni di fase. ∆j : errore residuo dopo l’eliminazione
dei primi j polinomi. D è il diametro della pupilla e r0 il parametro di Fried
Utilizzando l’eq. 1.36, la condizione di ortonormalità B.3 e tenendo presente che
2
a1 = ∆φ (eq. B.5), otteniamo la seguente espressione per σ∆φ
2 2
σ∆φ
= (∆φ)2 − ∆φ
=
∞ a2j .
(1.37)
j=2
Utilizzando l’espressione 1.31 della funzione di struttura delle perturbazioni di fase,
è possibile ottenere i valori a2j mostrati in tab. 1.1 [Noll, 1976]. Nella stessa tabella
è anche riportata la quantità
∆j =
∞ j =j+1
a2j ,
(1.38)
che corrisponde al valore di aspettazione dell’errore quadratico medio delle perturbazioni di fase, quando sia possibile eliminare le deformazioni del fronte d’onda
descritte dai primi j polinomi di Zernike.3 Il valore di ∆1 ci permette di interpretare il parametro di Fried come il diametro (D = r0 ) di una zona circolare in cui
la turbolenza introduce perturbazioni di fase pari a circa 1 rad rms.
Dai risultati ottenuti possiamo notare che il solo errore di tilt (j = 2 e j = 3)
2
contribuisce per circa l’87% a σ∆φ
. Questo risultato induce a trattare separatamente
3
Le tecniche utilizzate per ottenere una correzione del fronte d’onda saranno descritte in seguito.
21
questo tipo di errore, che provoca una rapida traslazione dell’immagine sul piano
focale, rispetto a quello introdotto dai termini successivi (detti alti ordini). I due
2
contributi, rispettivamente σt2 e σho
, sono dati da
σt2 =
2
=
σho
a22 + a23
∞ a2j = ∆3 ,
(1.39)
(1.40)
j=4
i quali, sostituiti nell’eq. 1.35, forniscono
2
2
) = exp(−σt2 ) exp(−σho
) = SR t SR ho .
SR = exp(−σt2 − σho
(1.41)
Le quantità SR t e SR ho rappresentano i fattori di attenuazione del rapporto di Strehl
associati al contributo di tilt e degli alti ordini.
1.7
Risoluzione angolare come parametro di qualità
globale
Se fosse possibile eliminare gli effetti della turbolenza atmosferica, non si otterebbe
soltanto una maggiore definizione angolare, ma anche un ulteriore miglioramento nella sensibilità. Infatti, se integriamo la radiazione proveniente da una stella
per un certo tempo τ con un telescopio di diametro D, otteniamo un segnale S
proporzionale all’intensità I (energia ricevuta per unità di tempo e di superficie)
secondo la relazione
S ∝ D2 Iτ .
(1.42)
Il sistema ottico distribuisce la radiazione raccolta in una immagine sottesa sotto
un angolo dell’ordine di FWHM seeing . Il telescopio raccoglie, in tale angolo, anche
l’energia proveniente dal fondo,4 che contribuisce con un segnale SBG , dato da
SBG ∝ FWHM 2seeing D2 IBG τ ,
4
(1.43)
L’emissione del fondo può avere diverse cause, ad esempio luce diffusa dall’atmosfera o, di
particolare importanza nel caso di osservazioni nell’infrarosso, dalla emissione del cielo (termica e
in bande molecolari) e dell’ambiente (termica).
22
dove l’intensità IBG è l’energia associata al fondo per unità di tempo, di superficie
e di angolo solido che raggiunge il telescopio.5
Se il rumore è dominato dal fondo, il rapporto segnale-rumore SNR è dato da
√
S
D
I τ
√
SNR ∝ √
∝
.
(1.44)
FWHM seeing IBG
SBG
È evidente, dunque, che l’eliminazione degli effetti del seeing (cioè passare da FWHM seeing
a FWHM dl ) possa migliorare la sensibilità, incrementando il rapporto segnale rumore di un fattore D/r0 . Mantenendo costante SNR, invece, permette di diminuire
τ , migliorando la risoluzione temporale delle osservazioni di un fattore (D/r0 )2 .
Con il miglioramento della risoluzione angolare si ottiene anche un indiretto
aumento della risoluzione spettrale, ad esempio, nelle osservazioni di oggetti stellari. Per ottenere una buona definizione delle righe spettrali è necessario, oltre ad
avere un elemento dispersore adeguato, tenere la fenditura dello spettroscopio sufficientemente stretta, in modo che la sua immagine sul rivelatore non confonda le
informazioni nella direzione di dispersione. Nello stesso tempo, per non perdere sensibilità, deve essere abbastanza larga per far passare la maggior quantità di energia
possibile proveniente dalla stella, che è focalizzata su di essa. È evidente che diminuendo le dimensioni dell’immagine della stella è possibile diminuire la larghezza della
fenditura (e dunque guadagnare in risoluzione spettrale) senza perdere energia (cioè
sensibilità).
Queste semplici considerazioni permettono di intuire quanto sia importante eliminare il più possibile gli effetti della turbolenza atmosferica. Due strade sono state
intraprese. La prima è di portare l’intero telescopio fuori dell’atmosfera. La seconda
è di sviluppare tecniche di osservazione che riducano questi effetti.
La prima via ha portato alla messa in orbita dello Hubble Space Telescope (HST),
un telescopio di 2.4 m di diametro che raggiunge una risoluzione angolare di circa
0.1 arcsec. Questa soluzione, comunque, è assai costosa e limita i diametri degli
specchi alle capacità dei vettori per il trasporto in orbita.
5
Si noti che l’intensità per sorgenti estese di radiazione è definita per unità di angolo solido, a
differenza di quanto accade per le sorgenti puntiformi.
23
Delle varie tecniche sviluppate per migliorare la risoluzione angolare di osservazioni da terra, la più flessibile e promettente è chiamata Ottica Adattiva. Questa tecnica fu proposta, per la prima volta, da H. W. Babcock più di 40 anni
fa [Babcock, 1953], anche se le prime realizzazioni in campo astronomico cominciarono solo sulla fine degli anni “80.
1.8
Principi di funzionamento dei sistemi Ottici
Adattivi
L’Ottica Adattiva è una tecnica per compensare in tempo reale le deformazioni
del fronte d’onda introdotte dall’atmosfera terrestre. La compensazione è possibile
inserendo nel fascio ottico del telescopio un dispositivo (tipicamente uno specchio
deformabile) che sia capace di introdurre una distorsione del fronte d’onda uguale
e contraria a quella generata dalla turbolenza atmosferica. Tale correzione deve
essere eseguita in un ciclo rapido in modo da inseguire l’evoluzione temporale della
turbolenza stessa.
Per come è concepito, il Sistema Ottico Adattivo può eliminare i soli disturbi
di fase introdotti dall’atmosfera, ma la validità dell’approssimazione di near-field
permette di considerare questo sufficiente.
In Fig. 1.5 è mostrato lo schema di funzionamento di un sistema adattivo. Il
fascio proveniente dal telescopio attraversa un’ottica (L1 ), che crea una immagine
della pupilla del telescopio stesso su un dispositivo (M) in grado di deformare il
fronte d’onda. Tale dispositivo è detto correttore ed è costituito, in genere, da
uno specchio deformabile o specchio adattivo. In seguito il fascio viene diviso in
due parti dal divisore di fascio S. Una parte è rifocalizzata su un rivelatore per
l’acquisizione dell’immagine. L’altra parte è inviata ad un dispositivo, detto sensore
di fronte d’onda. Questo analizza la radiazione proveniente da una sorgente di
riferimento, per ottenere informazioni sullo stato delle deformazioni del fronte d’onda
sulla pupilla. Queste informazioni sono passate al ricostruttore che, in base ad
esse, determina la configurazione che deve assumere il correttore per compensare le
24
Fuoco
F
Telescopio
Immagine
oggetto
Oggetto
Riferimento
L2
L1
B
Fronte
d’onda
corretto
Fronte
d’onda
distorto
M
Correttore
Sensore
Ricostruttore
Figura 1.5: Schema di funzionamento di un sistema ottico adattivo.
deformazioni. È importante osservare che nel percorso ottico il sensore è posto dopo
il correttore. In questo modo, nei passi successivi, il sensore riceverà un fronte d’onda
le cui distorsioni sono date dai soli residui della correzione del passo precedente.
In tali condizioni, in genere, l’efficienza del sistema adattivo migliora, riducendo
ulteriormente i residui di correzione. Il sistema adattivo si comporta dunque come
un sistema a retroazione i cui componenti principali sono il sensore, il ricostruttore
e il correttore.
1.9
Parametri fondamentali per un sistema ottico
adattivo
Analizzeremo brevemente, adesso, i parametri fondamentali che caratterizzano un
sistema ottico adattivo. In particolare intendiamo determinare il modo in cui questi
parametri devono variare in funzione dello stato di turbolenza atmosferica e della
lunghezza d’onda di osservazione.
25
1.9.1
Frequenza di correzione
Per ottenere una correzione efficiente, è necessario che il sistema adattivo operi in
tempi più brevi di quelli caratteristici con cui le perturbazioni di fase evolvono sulla
pupilla del telescopio.
Questi tempi sono determinati dalla velocità del vento alle diverse altezze nell’atmosfera, più che dal tempo di vita media di una perturbazione di indice di rifrazione
in uno strato di turbolenza. Questo perché la perturbazione, trascinata dal vento,
si mantiene per un tempo maggiore di quello impiegato a percorrere una distanza
pari al diametro del telescopio. La velocità del vento è tipicamente V ≈ 10 m/s, e
può raggiungere facilmente 30 m/s in tropopausa a circa 10 km di quota. Poiché le
direzioni e l’intensità del vento variano con l’altezza, il comportamento temporale
delle perturbazioni di fase sulla pupilla è difficile da caratterizzare. Comunque la
tipica scala dei tempi τ0 è data da [Parenti & Sasiela, 1994]
τ0 ≈ 0.3
r0
,
V̄
(1.45)
dove V̄ è una velocità del vento efficace definita da
V̄ =
Cn2 (h)V 5/3 dh
Cn2 (h)dh
3/5
.
(1.46)
Considerando V̄ ≈ 10 m/s e r0 ≈ 15 cm per λ = 0.55 µm, per cui τ0 ≈ 5 ms.
Poiché r0 ∝ λ6/5 , otteniamo la stessa dipendenza di τ0 dalla lunghezza d’onda.
In questo modo le condizioni sui tempi sono meno stringenti nell’infrarosso, dove
abbiamo, ad esempio, τ0 ≈ 24 ms per λ = 2.2 µm.
1.9.2
Numero di attuatori e intervallo richiesto di correzione
Il correttore è solitamente costituito da uno specchio sottile la cui superficie riflettente è deformata da attuatori. Il numero di attuatori determina il grado di correzione che possiamo raggiungere. Possiamo dedurre una stima di questo numero
dai risultati descritti nei paragrafi percedenti.
26
Utilizzando l’eq. 1.31, possiamo dedurre la funzione di struttura della funzione
di aberrazione W (vedi eq. 1.14)
DW (r) = (0.42)2 λ2
r
r0
5/3
.
(1.47)
Dall’eq. 1.47 si ha che la fluttuazione media di cammino ottico fra due punti a
distanza r = r0 è 0.42λ. Deformazioni su scale minori di r0 sono piccole rispetto alla
lunghezza d’onda e le considereremo trascurabili. Risulta ragionevole considerare
gli attuatori distribuiti sullo specchio adattivo in una griglia di passo r0 . Il numero
richiesto di attuatori indipendenti è quindi dell’ordine di (D/r0 )2 per un telescopio di
diametro D. Poiché r0 ∝ λ6/5 , otteniamo che il numero di attuatori è proporzionale
a λ−12/5 .
Ricordiamo che la configurazione assunta dagli attuatori è determinata dalle
informazioni ottenute dal sensore. Per questo motivo il sensore deve stimare le
perturbazioni del fronte d’onda in un numero di punti sostanzialmente uguale al
numero di attuatori indipendenti del correttore. Il sensore, dunque, presenta (D/r0 )2
zone di rivelazione le cui dimensioni equivalenti sulla pupilla corrispondono a r0 .
L’eq. 1.47 permette inoltre di stimare il valore della tipica deformazione ∆W che
gli attuatori del correttore devono produrre. ∆W si ottiene dalla radice quardata
del massimo valore assunto dalla funzione di struttura (r = D), per cui
D
∆W = 0.42λ
r0
5/6
.
(1.48)
Con i valori di r0 assunti in precedenza, per D ≈ 8 m, otteniamo ∆W ≈ 6 µm. Si
noti che ∆W non dipende da λ (r0 ∝ λ6/5 ), ma soltanto dal diametro del telescopio
D e da
Cn2 dh (vedi eq.1.26).
Lo sviluppo delle perturbazioni di fase in polinomi di Zernike ha mostrato, comunque, che gran parte della deformazione del fronte d’onda è data dai termini
di tilt globale. Rimosso il miglior piano che approssima la funzione di aberrazione,
otteniamo una varianza residua di W data da
2
Who
=
λ
2π
2
λ
∆3 = 0.13
2π
27
2 D
r0
5/3
,
(1.49)
dove la sovralineatura indica la media sulla pupilla e Who la funzione di aberrazione
priva del termine di tilt. Con i valori di D e r0 precedenti, questa volta otteniamo
∆Who ≈ 0.9 µm. Poiché questo valore è più piccolo del precedente di circa un fattore
7, mostra come sia conveniente effettuare la correzione del fronte d’onda in due stadi.
Nel primo viene corretto il tilt globale mediante uno specchio piano inclinabile, nel
secondo lo specchio deformabile completa la correzione lavorando con una escursione
ridotta.
1.9.3
Angolo isoplanatico e sorgente di riferimento
Il funzionamento dell’intero sistema adattivo dipende dalla possibilità di utilizzare
la radiazione di una sorgente di riferimento per quantificare, tramite il sensore, le
distorsioni del fronte d’onda. Per ottenere buoni risultati il riferimento deve essere assimilabile ad un oggetto puntiforme (ad esempio una stella) o, comunque, un
oggetto con un picco ben pronunciato. I tempi a disposizione del sensore per effettuare una misura devono essere inferiori a τ0 , determinando un limite inferiore della
luminosità della sorgente, sotto il quale il basso rapporto segnale-rumore, associato
alla stima del fronte d’onda, pregiudica la correzione. A questo punto è importante
notare come, data l’acromaticità delle perturbazioni di cammino ottico discussa nel
par. 1.5, spesso nei sistemi adattivi per osservazioni infrarosse il sensore è utilizzato
nel visibile avvantaggiandosi delle migliori caratteristiche in termini di rumore dei
rivelatori panoramici ottici, rispetto a quelli infrarossi.
Generalmente, l’oggetto osservato di interesse astronomico è esteso e debole, per
cui non soddisfa le condizioni richieste per le sorgenti di riferimento. In questo caso
è necessario utilizzare una stella brillante nei suoi dintorni. L’oggetto in studio deve
trovarsi in una regione di cielo intorno al riferimento per cui i due oggetti subiscano,
sostanzialmente, le stesse perturbazioni di fase. Questa regione è detta campo o
dominio isoplanatico (confronta par. 1.1) e il suo raggio θ0 prende il nome di angolo
isoplanatico. Una stima di θ0 può essere effettuata con riferimento alla fig. 1.6.
Indichiamo con θ la distanza angolare dell’oggetto osservato S dal riferimento Srif
28
Srif.
S
θ
H
Figura 1.6: S sorgente osservata. Srif sorgente di riferimento. H quota dello strato dominante
di turbolenza.
29
e con H la quota dello strato di turbolenza che fornisce il principale contributo ad
r0 . La geometria descritta comporta una distanza lineare Hθ tra i raggi in questo
strato. Se Hθ < r0 le perturbazioni in cammino ottico subite dai raggi differiscono,
in media, di un valore inferiore a 0.42λ (vedi eq. 1.47) e possono essere trascurate.
In questo modo l’angolo isoplanatico può essere stimato dalla relazione
θ0 ≈
r0
,
H
(1.50)
Per r0 = 15 cm a λ = 0.55 µm e H ≈ 10 km, si ottiene un angolo isoplanatico θ0 ≈
3 arcsec. Poiché θ0 dipende linearmente da r0 , otteniamo θ0 ∝ λ6/5 , per cui l’angolo
isoplanatico è più ampio nell’infrarosso, raggiungendo 16 arcsec a λ = 2.2 µm.
Non sempre è possibile trovare una sorgente di riferimento sufficientemente brillante all’interno di un campo cosı̀ esiguo. Questo introduce un problema di copertura
del cielo, che è particolarmente importante per osservazioni nel visibile. In questo
caso, infatti, non solo il campo isoplanatico è più stretto, ma si riduce anche il tempo in cui la sorgente di riferimento può essere integrata sul rivelatore del sensore
d’onda e l’area di raccolta per ogni zona di sensing (∝ r02 ). Per risolvere almeno
in parte il problema della copertura del cielo, si può pensare di creare una stella
di riferimento artificiale nella direzione dell’oggetto osservato utilizzando un laser
[Foy & Labeyrie, 1985]. Regolando il laser alla frequenza di risonanza della riga D2
del sodio (0.589 µm), è stata dimostrata la possibilità di ottenere una sorgente artificiale prodotta per scattering dal sodio presente nello strato mesosferico a 90 km
di quota [Happer et al., 1994].
La tab. 1.2 riassume i risultati ottenuti per i parametri introdotti fino ad ora
per un telescopio con D = 4 m e per valori tipici per il parametro di Fried r0 ,
per la quota H dello strato dominante di turbolenza e per la velocità V del vento
corrispondenti, rispettivamente, a 15 cm (a λ = 0.55 µm), 10 km e 10 ms−1 . Il
valore di r0 utilizzato corrisponde ad un tipico seeing di 0.7 arcsec.
I risultati evidenziano come tutti i parametri importanti per il sistema adattivo
assumano valori più favorevoli al crescere della lunghezza d’onda. Questo è il motivo
30
λ
r0 ∝ λ6/5
micron
cm
0.5
15
1.25
45
1.65
63
2.2
89
θ0 ∝ λ6/5
arcsec
3.1
9.3
13
18
τ0 ∝ λ6/5
msec
15
45
63
89
Natt ∝ λ−12/5
710
79
40
20
Tabella 1.2: Parametri che caratterizzano un sistema adattivo al variare della lunghezza d’onda
di osservazione λ. r0 : parametro di Fried. θ0 : angolo isoplanatico. τ0 : tempo caratteristico di
evoluzione delle perturbazioni del fronte d’onda. Natt : numero di attuatori. I valori sono stati
calcolati per r0 = 15 cm a λ = 0.55 µm e per un telescopio di 4 m di diametro.
per cui i sistemi adattivi per uso astronomico, finora costruiti, operino con successo
generalmente fino circa 1 µm.
1.10
Il sensore di Shack-Hartmann
Poiché il presente lavoro descriverà l’analisi e lo sviluppo di un nuovo sensore di
fronte d’onda per ottiche adattive, ci soffermeremo a descrivere in dettaglio il sensore
attualmente più utilizzato nei sistemi ottici adattivi per uso astronomico: il sensore
di Shack-Hartmann.
Il principio di funzionamento è schematizzato in Fig. 1.7. Su una immagine
della pupilla è posta una griglia di lentine, che forma una corrispondente griglia di
immagini della sorgente di riferimento su un rivelatore panoramico.
Lo spostamento del baricentro della immagine prodotta da ogni lentina, rispetto
alla posizione in assenza di perturbazioni,6 fornisce una stima dell’inclinazione (tilt)
media della porzione del fronte d’onda che incide sulla lentina stessa.
La proiezione dell’apertura di ogni lentina sulla pupilla determina le varie zone
di sensing le cui dimensioni devono essere ≈ r0 . Abbiamo già notato che su distanze
minori o uguali al parametro di Fried le aberrazioni introdotte dalla turbolenza possono essere considerate trascurabili, per cui considereremo le immagini formate dalle
lentine limitate dalla diffrazione. Utilizzando l’eq. 1.8, otteniamo che la dimensione
6
La posizione in assenza di perturbazioni introdotte dalla turbolenza è determinata facendo
incidere un’onda piana sulla griglia di lentine.
31
Matrice di lentine
Rivelatore
Quad-cell
Sa
Sb
f λ/D
L L
Sc
Sd
Baricentro
Fronte d’onda
aberrato
Figura 1.7: Principio di funzionamento del sensore di Shack-Hartmann
32
dell’immagine prodotta sul rivelatore è fL λ/DL dove fL e DL sono, rispettivamente,
la focale e il diametro delle lentine.
Consideriamo il caso in cui l’immagine prodotta da ogni lentina cada all’interno
di una matrice 2x2 di elementi fotosensibili (quad-cell). Questo è il numero minimo
di canali in cui posso suddividere il segnale che permetta di misurare il baricentro
dell’immagine. Supponiamo che l’immagine, in assenza di perturbazioni introdotte
dall turbolenza atmosferica, sia centrata rispetto alla quad-cell e indichiamo con Sa ,
Sb , Sc e Sd i segnali forniti dai quattro elementi sensibili (vedi fig. 1.7). Se le perturbazioni introducono piccole variazioni (∆xB , ∆yB ) della posizione del baricentro
rispetto alle dimensioni dell’immagine, valgono le relazioni
∆xB
∆yB
1 λfL (Sa + Sd ) − (Sb + Sc )
≈
2 DL
Sa + Sb + Sc + Sd
1 λfL (Sa + Sb ) − (Sc + Sd )
≈
.
2 DL
Sa + Sb + Sc + Sd
(1.51)
(1.52)
Le derivate ∂W/∂x e ∂W/∂y forniscono gli angoli di inclinazione del fronte d’onda
rispetto al piano della lentina, per cui
∂W
∂W
(∆xB , ∆yB ) = fL
, fL
∂x
∂y
.
(1.53)
Sostitiendo la relazione precedente nelle eqq. 1.51 e 1.52, otteniamo una stima per
le derivate della funzione di aberrazione nella corrispondente zona di sensing, data
da
∂W
∂x
∂W
∂y
1 λ (Sa + Sd ) − (Sb + Sc )
≈
2 DL
Sa + Sb + Sc + Sd
1 λ (Sa + Sb ) − (Sc + Sd )
.
≈
2 DL
Sa + Sb + Sc + Sd
(1.54)
(1.55)
Poiché il sensore di Shack-Hartman fornisce una stima delle derivate di W , la
funzione di aberrazione può essere ricostruita tramite l’integrazione di un’equazione
differenziale di primo grado a meno di un valore costante, che, comunque, risulta
essere inessenziale ai fini della formazione dell’immagine.
Se le deviazioni della posizione del baricentro sono confrontabili con le dimensioni
delle immagini prodotte dalle lentine, le equazioni ottenute non sono più valide. In
33
particolare si perde la relazione lineare tra le derivate di W e i segnali (normalizzati
alla somma dei segnali stessi) e si introduce una dipendenza esplicita dalla forma
della PSF prodotta da ogni lentina.
34
Capitolo 2
Il test di Foucault in ottica
adattiva. Il sensore a piramide
Foucault pubblicò nel 1859 [Foucault, 1859] un resoconto in cui descriveva un test
per determinare quali tipi di errori di forma avesse una lente o uno specchio. Da
allora gli ottici hanno usato questo test per più di un secolo per ottenere informazioni
sulla qualità di un sistema ottico.
2.1
Principio di funzionamento del test di Foucault
In Fig. 2.1 è schematizzata la configurazione ottica di base, che si adopera per
eseguire il test di Foucault. La lente L rappresenta l’elemento ottico da esaminare.
Sul piano focale nominale di L è posta una lama (o coltello) K il cui bordo è rettilineo
e ben lavorato. Tale lama, ortogonale all’asse ottico, è libera di scorrere sul piano
focale di L. Dietro il coltello è posta una lente LC , che chiameremo lente di camera,
che genera una immagine della pupilla di uscita di L sul piano coniugato I.
Il principio di funzionamento del test di Foucault può essere semplicemente descritto in termini di ottica geometrica. Supponiamo che la lente L sia illuminata da
un fascio di raggi paralleli all’asse ottico. Se tale lente introduce delle aberrazioni,
i raggi che la attraversano non sono focalizzati in un punto (il fuoco), ma sono distribuiti su una certa area del piano focale. Quando la lama non è presente (vedi
35
LC
K
I
L
Figura 2.1: Configurazione ottica del test di Foucault. La lente L è sottoposta al test. Il coltello
K scorre sul piano focale nominale di L. Immediatamente dietro la lama è posta la lente di camera
LC che genera l’immagine della pupilla di L sul piano coniugato I su cui è posto un rivelatore.
Fig. 2.2a), ogni raggio, che passa attraverso la pupilla della lente in esame, raggiunge
la lente di camera. Quest’ultima crea una immagine della pupilla uniformemente
illuminata. Inserendo il coltello sul piano focale della lente con il bordo vicino al
fuoco di quest’ultima (vedi Fig. 2.2b), alcuni raggi vengono intercettati dalla lama.
Se P è un punto sulla pupilla da cui parte un raggio che non incontra il coltello, nel
punto coniugato P vi sarà una zona brillante. Se da Q parte un raggio che viene
intercettato, nel punto coniugato Q vi sarà una zona scura. Fissata la posizione
della lama, l’immagine della pupilla di L è costituita da un insieme di regioni scure
e chiare. Le prime indicano l’insieme dei punti sulla pupilla da cui passano raggi che
intercettano, sul piano focale, il semipiano del coltello, mentre le seconde i punti che
intercettano il semipiano complementare. Nel regime di ottica geometrica, le zone
di separazione tra i due gruppi di regioni sono nette e la loro forma dipende dal tipo
di aberrazione generata dalla lente L. Le principali aberrazioni forniscono immagini
facilmente riconoscibili, in particolare, l’immagine in Fig. 2.2c identifica immediatamente la presenza di aberrazione sferica, mentre quella di Fig. 2.3 la presenza di
coma ortogonale al bordo del coltello.
Anche se il test permette di riconoscere il tipo di aberrazione introdotta, non
36
L
LC
I
K
a)
I
Q
P’
P’
Q’
Q’
b)
P
c)
Figura 2.2: Test di Foucault nel caso di aberrazione sferica. a) Il coltello K non è inserito:
tutti i raggi raggiungono il piano I dell’immagine della pupilla che appare un disco uniformemente
illuminato. b) il coltello è inserito: i raggi che hanno origine da certe zone della pupilla (es. Q)
non raggiungono l’immagine. Nei punti coniugati si hanno zone scure (es. in Q ). c) Il coltello
raggiunge l’asse ottico: tipica immagine ottenuta in presenza di aberrazione sferica.
37
M
I
LC
K
a)
b)
Figura 2.3: Test di Foucault nel caso di coma dominante. Lo specchio parabolico M è illuminato
da un fascio fuori asse. Il coltello K ha il bordo passante per il centro della figura di minima
confusione. In a) il coltello intercetta i raggi parassiali, mentre in b) quelli marginali.
38
permette di ottenere, in modo semplice, informazioni quantitative sull’aberrazione
stessa. Ciò è evidente da un semplice esempio. L’aberrazione associata ad un raggio
può essere espressa quantitativamente dalla distanza tra il fuoco e il punto in cui il
raggio incontra il piano focale. Tale grandezza è chiamata aberrazione trasversale
del raggio. Consideriamo un punto Q della pupilla e il coltello con il bordo sul fuoco
(vedi Fig. 2.2c). Se nel punto Q coniugato vi è una zona scura, l’unica informazione
che possiamo ottenere è che il raggio che passa per Q viene deflesso al di sotto del
bordo della lama. Nessuna informazione è disponibile su quanto sia deflesso, per cui
non abbiamo nessuna informazione sull’aberrazione trasversale associata ad esso.
2.2
Impiego quantitativo del test di Foucault
Nonostante le difficoltà descritte, esistono metodi, basati sul test di Foucault, che
permettono di misurare le aberrazioni associate ad un sistema ottico. In questo
paragrafo ne descriveremo alcuni. Il primo permette di ottenere una stima della
funzione di aberrazione W (a meno di un valore costante), ma presenta una forte
limitazione in quanto non garantisce buoni risulatati se la funzione W presenta
un valore di picco-picco superiore a λ/10. Gli altri metodi forniscono una stima
delle derivate di W e permettono, in linea di principio, di misurare aberrazioni
arbitrariamente grandi.
2.2.1
Il test di Foucault per piccole aberrazioni
La teoria diffrattiva del test di Foucault produce equazioni di validità generale
[Barakat, 1969], la cui soluzione, essendo equazioni non-lineari, può rappresentare
un problema. Comunque, nel caso in cui la funzione di aberrazione W assuma valori
piccoli rispetto alla lunghezza d’onda λ e la pupilla sia illuminata uniformemente, le
equazioni citate possono essere ridotte ad una forma lineare [Linfoot, 1955, cap. 5.1].
Il sistema lineare che ne consegue può essere risolto ottenendo W , a meno di un termine costante, una volta fornite le distribuzioni di intensità dell’immagine della
39
yi
xi
yo
z
x y LC
xo
I
K
L
Figura 2.4: Geometria del sistema ottico per il test di Foucault. L: pupilla di uscita dell’elemento
ottico in esame. K coltello che scorre sul piano focale nominale. LC : pupilla di entrata della lente
di camera. I: piano del rivelatore su cui si forma l’immagine di L per mezzo della lente LC .
pupilla rispettivamente in assenza del coltello e con la lama inserita in opportune
posizioni [Wilson, 1975].
Le condizioni di validità di questa approssimazione risultano, però, troppo restrittive nel caso di aberrazioni introdotte dalla turbolenza atmosferica, rendendo il
metodo di scarsa applicabilità per sistemi ottici adattivi.
2.2.2
Metodo dello scorrimento del coltello
Questo metodo è stato sviluppato negli anni ’30 [Gaviola, 1936] ed è stato aggiornato
recentemente. I risultati ottenuti dalla sua applicazione, alla valutazione quantitativa delle aberrazioni, sono confrontabili con le tecniche interferometriche [Vandenberg et al., 1993].
Riferendoci alla Fig. 2.4, indichiamo con (xo , yo ), (x, y) e (xi , yi ) i sistemi di
coordinate rispettivante sulla pupilla di uscita della lente in esame, sul suo piano
focale nominale e sul piano coniugato della pupilla ottenuto per mezzo della lente
di camera. I tre sistemi hanno l’origine posta sull’asse ottico. La relazione tra un
punto (xo , yo ) sulla pupilla e il punto coniugato corrispondente (xi , yi ) è data da:
xi = −Mxo
yi = −Myo
40
,
(2.1)
dove M è l’ingrandimento introdotto dalla lente di camera e il segno negativo tiene
conto dell’inversione dell’immagine. Nel regime di ottica geometrica e in presenza
di aberrazioni, il raggio che parte dal punto (xo , yo ) intercetta il piano focale in un
punto (x, y) tale che [Born & Wolf, 1985]
f
(x, y) =
nair
∂W
∂W
(xo , yo ),
(xo , yo )
∂xo
∂yo
(2.2)
in cui W è la funzione di aberrazione definita nel par. 1.9.2, nair è l’indice di rifrazione
dell’aria e f la lunghezza focale dell’ottica sottoposta al test. In seguito considereremo nair = 1, che equivale ad esprimere W in cammino geometrico e non in cammino
ottico. Le quantità ∂W/∂xo e ∂W/∂yo rappresentano gli angoli con cui le aberrazioni deflettono, nel punto (xo , yo ), il cammino del raggio rispetto alla direzione in
assenza delle aberrazioni stesse. Chiameremo queste grandezze tilt locali lungo x e
y. L’Eq. 2.2 stabilisce la relazione tra le componenti (x, y) dell’aberrazione trasversale del raggio, che passa per il punto (xo , yo ) sulla pupilla di uscita della lente, e
la funzione di aberrazione nello stesso punto. Consideriamo una zona di area ∆Ao
centrata in un punto (xo , yo ) sul piano della pupilla, che chiameremo zona di rilevamento o di sensing. Da essa ha origine un fascetto di raggi che, in assenza del
coltello, raggiungono una area ∆Ai centrata nel punto (xi , yi ) coniugato a (xo , yo )
(vedi Fig. 2.5a). La relazione tra i due punti è data dall’Eq. 2.1. Facendo scorrere
la lama sul piano focale con il bordo, ad esempio, parallelo all’asse x, si raggiungerà
la condizione in cui alcuni raggi del fascetto saranno bloccati. L’energia per unità
di tempo nell’area ∆Ai inizierà a diminuire. Indichiamo con ∆y(xo , yo ) la misura
della distanza del bordo del coltello dall’asse ottico, quando l’energia per unità di
tempo in ∆Ai si riduce alla metà del valore misurato con la lama disinserita (vedi
Fig. 2.5b). ∆y(xo , yo ) fornisce una stima della media delle aberrazioni trasversali,
lungo l’asse y, dei raggi che partono dall’area ∆Ao centrata in (xo , yo ). Facendo
scorrere il coltello sull’intera figura di aberrazione si ottengono le misure di ∆y per
ogni zona sulla pupilla. Ripetendo l’operazione con la lama ruotata di 90 gradi, si
ottengono le misure ∆x(xo , yo ) delle aberrazioni trasversali lungo l’asse x. Utilizzando le Eqq. 2.1 e 2.2, otteniamo una stima del valor medio delle componenti del
41
(xo , yo )
(xi , yi )
{
∆Ao
}
0
L
a)
LC
K
∆Ai
I
{
∆Ao
∆Ai
}
0
b)
∆y
Figura 2.5: Misura delle aberrazioni trasversali. Sono tracciati soltanto i raggi che passano dalla
zona di area ∆Ao centrata in (xo , yo ). a) Il coltello K non intercetta i raggi; b) Il coltello K
raggiunge una posizione in cui il segnale nella zona coniugata di area ∆Ai è dimezzato.
42
(xo , yo )
LC
2δθy
I
(xi , yi )
L
K
Figura 2.6: La direzione del raggio, passante per il punto (xo , yo ) sulla pupilla di uscita di L, è
modulata sovrapponendo una oscillazione di ampiezza δθy del tilt locale. Poiché i piani L ed I sono
coniugati per mezzo della lente di camera LC , la modulazione modifica il punto di intersezione del
raggio con il piano del coltello K, ma non con l’immagine della pupilla su I, che rimane (xi , yi ).
gradiente di W (∇W ) nella zona ∆Ao centrata in (xo , yo ) date da

∂W



(xo , yo ) =

1
∆x(xo , yo )
∂xo
f
.
1
∂W



(xo , yo ) =
∆y(xo , yo )

∂yo
f
(2.3)
Da queste si può ricostruire la funzione di aberrazione a meno di un termine costante
(pistone), che risulta essere ininfluente ai fini della formazione dell’immagine.
2.2.3
Metodo con modulazione del “tilt” locale
Questo metodo è una variante, da noi sviluppata [Riccardi et al., 1996], di una tecnica proposta da R. Ragazzoni [Ragazzoni, 1996]. Dimostreremo che le modifiche che
abbiamo apportato al metodo originale permettono di migliorare di circa un ordine
di grandezza la rapidità con cui ottenere una misura di ∇W , potendo raggiungere
frequenze di risposta dell’ordine delle decine di kHz. Tali considerazioni saranno
svolte in maggiore dettaglio in seguito, dopo una completa descrizione del metodo.
Come mostrato in Fig. 2.6, introduciamo nel punto (xo , yo ), lungo y, una perturbazione variabile dell’angolo di deflessione del raggio, sinusoidale nel tempo. In
termini di funzione di aberrazione, equivale a sommare un termine oscillante a W ,
ottenendo una funzione di aberrazione W , descritta dalla relazione
∂W
t
∂W (xo , yo ; t) =
(xo , yo ) + δθy (xo , yo ) sin 2π
∂yo
∂yo
T
43
,
(2.4)
y
y
K
f δθy
t=0
t=0
f ∂W
∂y0
t=t1
t=T
x
t=t2
t=T
x
t=t2
a)
t=t1
b)
K
Figura 2.7: Effetti della modulazione del tilt locale sul piano del coltello K. Una oscillazione
del raggio in direzione y con un’ampiezza δθy produce un’oscillazione del punto di intersezione del
raggio con il piano di K di ampiezza f δθy , centrata nel punto di ordinata f ∂W/∂yo . a) Il raggio
si propaga oltre il coltello solo per 0 < t < t1 e t2 < t < T . b) Il raggio si propaga per t1 < t < t2 .
dove δθy è l’ampiezza con cui oscilla l’angolo di tilt locale lungo l’asse y e T è il
periodo di oscillazione. Dall’Eq. 2.2 otteniamo la coordinata y del punto in cui il
raggio intercetta il piano focale
y (t) = f
∂W
t
(xo , yo ) + f δθy (xo , yo ) sin 2π
∂yo
T
.
(2.5)
Consideriamo il caso, mostrato in Fig. 2.7, in cui il coltello sia fermo e con il
bordo coincidente con l’asse x. Se vale la relazione
∂W δθy > ,
∂xo (2.6)
il raggio riesce a transitare sull’asse x. Gli istanti t1 e t2 in cui ciò avviene sono
ottenuti dall’inversione dell’Eq. 2.5 con y = 0. Nel caso, mostrato in Fig. 2.7, in cui
∂W/∂yo > 0 e 0 ≤ t < T , abbiamo
t1
t2
1
T
∂W
=
π + arcsin
(xo , yo )
2π
δθy (xo , yo ) ∂yo
T
∂W
1
=
2π − arcsin
(xo , yo )
.
2π
δθy (xo , yo ) ∂yo
(2.7)
(2.8)
Come in precedenza, indichiamo con (xi , yi ) il punto immagine di (xo , yo ), tra di
essi vale la relazione 2.1. Indichiamo, inoltre, con ∆Ai l’area sul piano immagine
44
corrispondente a ∆Ao . L’energia raccolta in un periodo T nell’area ∆Ai centrata in
(xi , yi ) dipende dalla posizione assunta dal coltello. Se, come in Fig. 2.7a, la lama
occupa il semipiano con y < 0, l’energia Ey>0 raccolta è data da
Ey>0 (xi , yi ) = I(xo , yo )∆Ao [t1 + (T − t2 )] ,
(2.9)
in cui I(xo , yo ) è l’intensità della radiazione nel punto (xo , yo ) sulla pupilla. Nel caso
simmetrico, rappresentato in Fig. 2.7b, otteniamo
Ey<0 (xi , yi ) = I(xo , yo )∆Ao (t2 − t1 ) .
(2.10)
Utilizzando le Eqq. 2.7 e 2.8, le relazioni precedenti assumono la forma
∂W
T
1
Ey>0 (xi , yi ) = I(xo , yo )∆Ao
π + 2 arcsin
(xo , yo ) (2.11)
2π
δθy (xo , yo ) ∂yo
∂W
T
1
Ey<0 (xi , yi ) = I(xo , yo )∆Ao
π − 2 arcsin
(xo , yo ) (2.12)
.
2π
δθy (xo , yo ) ∂yo
Dal rapporto tra la differenza e la somma delle ultime due equazioni otteniamo
∂W
π Ey>0 (xi , yi ) − Ey<0 (xi , yi )
(xo , yo ) = δθy (xo , yo ) sin
∂yo
2 Ey>0 (xi , yi ) + Ey<0 (xi , yi )
.
(2.13)
L’Eq. 2.13 fornisce una stima della derivata di W lungo y nella zona della pupilla
considerata, eliminando, inoltre, la dipendenza esplicita da I(xo , yo ), da ∆Ao e da
T.
Considerando una oscillazione del tilt locale lungo l’asse x e ruotando di 90 gradi
il coltello, otteniamo una relazione simile alla precedente
∂W
π Ex>0 (xi , yi ) − Ex<0 (xi , yi )
(xo , yo ) = δθx (xo , yo ) sin
∂xo
2 Ex>0 (xi , yi ) + Ex<0 (xi , yi )
.
(2.14)
Le due oscillazioni possono essere combinate insieme, fornendo una modulazione del
tilt locale che permetta di eseguire indifferentemente misure delle derivate in due
direzioni ortogonali.
Nell’ipotesi in cui
∂W δθy < ,
∂yo 45
(2.15)
Figura 2.8: Risposta del sensore. È riportata la stima della derivata del fronte d’onda normalizzata al valore di saturazione in funzione del segnale ridotto sx = (Ex>0 − Ex<0 )/(Ex>0 +
Ex<0 ).
il raggio non riesce a transitare sull’asse x, rimanendo sempre dalla stessa parte
rispetto al bordo del coltello. In questo caso diremo che la risposta del sistema è
saturata. Le energie integrate in ∆Ai diventano
Ey>0 (xi , yi ) = I(xo , yo )∆Ao T
Ey<0 (xi , yi ) = 0
Ey>0 (xi , yi ) = 0
Ey<0 (xi , yi ) = I(xo , yo )∆Ao T
se
∂W
(xo , yo )
∂yo
>0
(2.16)
se
∂W
(xo , yo )
∂yo
<0.
(2.17)
L’unica informazione che si può ottenere in queste condizioni è il segno di ∂W/∂yo .
L’Eq. 2.13 può essere estesa a questo caso, fornendo il valore di saturazione ±δθy (xo , yo ),
cioè un limite inferiore per il modulo della derivata di W . Simili considerazioni
valgono per le derivate lungo l’altro asse.
In Fig. 2.8 è riportata la curva di risposta del sensore che fornisce la stima di
∂W/∂xo in funzione della quantità sx , definita da
sx (xi , yi ) =
Ex>0 (xi , yi ) − Ex<0 (xi , yi )
,
Ex>0 (xi , yi ) + Ex<0 (xi , yi )
(2.18)
che chiameremo segnale ridotto (nella direzione x). È evidente che −1 ≤ sx ≤ +1 e
che quando il sensore raggiunge la saturazione si ha sx = ±1.
46
2.3
Applicazione del test di Foucault a sistemi
ottici adattivi
Un sensore utilizzato in ottica adattiva deve misurare le aberrazioni, introdotte
dalla turbolenza atmosferica, in un tempo minore del tempo caratteristico in cui tali
disturbi evolvono. Questo costringe il sensore a lavorare con frequenze dell’ordine
del kHz. Inoltre, poichè la sorgente di riferimento utilizzata dal sensore è solitamente
debole, è essenziale che la risposta del sensore stesso raggiunga il più alto segnalerumore possibile [Goad et al., 1986].
Il metodo con lo scorrimento del coltello, descritto precedentemente, risulta fortemente limitato da questo punto di vista. Per raggiungere le frequenze richieste
sarebbe necessario far scorrere il coltello sull’intera immagine aberrata con frequenze dell’ordine dei kHz, con evidenti problemi meccanici. Inoltre è necessario associare
all’istante, in cui il sensore rivela il dimezzamento del segnale in una certa zona di
sensing, la posizione del coltello con sufficiente accuratezza. Se, per esempio, si volesse ottenere una misura dell’aberrazione trasversale con una precisione di almeno
1/Q volte l’escursione del coltello, sarebbe necessario leggere il rivelatore su cui si
forma l’immagine della pupilla con una frequenza per lo meno pari a Q volte quella
di oscillazione della lama. In questo modo il tempo che avremmo a disposizione per
integrare energia sul rivelatore dovrebbe essere ridotto di 1/Q volte rispetto a quello
a diposizione per eseguire la misura completa. Inoltre, per ogni zona di sensing,
sono necessarie due misure simultanee corrispondenti alle due posizioni ortogonali
del coltello. Il segnale è, dunque, diviso su una coppia di canali del rivelatore. Per
finire, poiché la lama impedisce la propagazione della radiazione che intercetta, una
parte dell’energia disponibile non viene integrata sul rivelatore. In una oscillazione
completa, supponendo che la lama trasli a velocità costante, questo effetto comporta
il dimezzamento dell’energia che raggiunge il rivelatore stesso. Supponiamo che ogni
zona di sensing sia attraversata da N fotoni nell’intervallo di tempo a disposizione
per la misura. Il rapporto segnale-rumore SNR per ogni lettura associato al singolo
47
canale del rivelatore risulta, in prima approssimazione,
%
N/(4Q)
SNR = $
=
N/(4Q)
N
,
4Q
(2.19)
dove si è considerato dominante il rumore fotonico.
Nel caso del metodo con modulazione del tilt locale, si può integrare energia sul
rivelatore per tutto il tempo a disposizione per la misura. In questo caso, le quattro
posizioni necessarie della lama comportano una separazione del segnale, per zona
di sensing, su quattro canali del rivelatore. Il rapporto segnale-rumore per singolo
canale è del tipo
%
SNR =
N
.
8
(2.20)
Quest’ultimo metodo permette di ottenere misure con rapporto segnale-rumore
$
Q/2 volte rispetto a quello del precedente metodo. Il valore di Q dovrà essere
per lo meno pari al numero di zone di sensing presenti su un diametro della pupilla.
Per cui, tipicamente, abbiamo Q ≥ 8 ÷ 32, fornendo
$
Q/2 ≥ 2 ÷ 4. Il metodo con
modulazione del tilt locale risulta, dunque, preferibile all’altro per i sistemi ottici
adattivi.
Per ottimizzare ulteriormente il metodo, è necessario determinare una tecnica che
consenta di ottenere simultaneamente le immagini delle pupille di ingresso relative
alle quattro posizioni diverse del coltello ed inoltre non perdere l’energia che incide
√
sulla lama. In quest’ultimo caso si migliora di un ulteriore fattore 2 il rapporto
segnale rumore.
2.3.1
Misure simultanee delle derivate della funzione di aberrazione
Per non perdere parte dell’energia a disposizione sul piano del coltello sono state
proposte varie soluzioni. La prima è stata quella di utilizzare una lama riflettente [Goad et al., 1986]. In questo modo i raggi che intercettano il coltello non
vengono eliminati, ma riflessi. Essi possono essere raccolti da un opportuno sistema
ottico e utilizzati per creare un’altra immagine della pupilla. Le due immagini cosı̀
48
LC1
I1
LC1
I2
a)
LC2
LC2
b)
Figura 2.9: Una coppia di lenti “spezzate”, simmetriche e incollate lungo il bordo tagliato
fungono contemporaneamente da coltello e lente di camera. Permettono, inoltre, l’acquisizione
contemporanea delle immagini con due posizioni simmetriche del coltello
ottenute corrispondono a due posizioni del coltello simmetriche rispetto al bordo
della lama. Questa soluzione, però, per quanto concettualmente valida, necessita di
una configurazione ottica piuttosto complessa.
Un’altra proposta [Gaffard & Boyer, 1989] suggerisce di sostituire il coltello con
una coppia di lentine come mostrato in Fig. 2.9a. Nell’articolo in cui tale proposta
è stata avanzata non è chiarito come le due lenti siano configurate per simulare il
bordo del coltello. Noi supponiamo che una soluzione possa essere quella proposta
in Fig. 2.9b, dove due lenti “spezzate” e simmetriche siano incollate lungo il bordo
tagliato. In questo modo, facendo incidere il fascio sul bordo tra le due lenti, esse
fungono contemporaneamente da coltello e da lenti di camera, formando due immagini della pupilla la cui separazione e diametro sono in relazione con la distanza
dei centri e la focale delle lentine.
Il sistema più semplice e flessibile, comunque, è stato proposto da R. Ragazzoni [Ragazzoni, 1996], che suggerisce di sostituire il coltello con una piramide a
base quadrata il cui vertice è posto sul fuoco nominale. Come mostrato in Fig. 2.10,
la piramide separa il fascio in quattro parti e ogni parte viene deflessa in una direzione diversa in relazione all’inclinazione della faccia su cui incide. La lente di
camera, posta immediatamente dietro la piramide, genera quattro immagini della
pupilla che possono essere poste su un unico rivelatore panoramico. La separazione
e l’ingrandimento delle immagini sono determinati dall’angolo di apertura al vertice
49
(A)
a)
(C)
(d) (c)
LC
(B)
K
(a) (b)
(D)
I
LC
K
I
b)
Figura 2.10: Sensore a piramide. a) La piramide K ha il vertice posto nel fuoco nominale. Il
fascio viene separato in quattro parti dalle facce della piramide. Ogni parte forma una immagine
della pupilla sul rivelatore I per mezzo della lente di camera LC . b) Sezione del sistema ottico.
50
della piramide e dalla focale della lente di camera.
Indichiamo con (A), (B), (C) e (D) le quattro faccie della piramide e con (a),
(b), (c) e (d) le rispettive immagini della pupilla. In ottica geometrica, i raggi che
raggiungono le immagini (a) e (b), sono passati dalle faccie (A) e (B) del prisma,
cioè nella regione con y > 0 sul piano focale. La “somma” delle immagini (a) e
(b) corrisponde, dunque, all’immagine che si otterrebbe con un coltello coincidente
con il semipiano negativo delle y. In modo del tutto analogo le immagini (b)+(c),
(c)+(d) e (d)+(a) sono equivalenti a quelle ottenute con la lama ruotata di multipli
successivi di 90 gradi.
Poniamo un sistema di coordinate (xi , yi ) con l’origine coincidente con il centro
di (a). Ad ogni zona di sensing di area ∆Ao , intorno al punto (xo , yo ) sulla pupilla,
è associata una zona di area ∆Ai centrata in (xi , yi ) su (a). Indichiamo, inoltre,
con Sa (xi , yi ) il segnale restituito dal rivelatore integrando energia nell’area ∆Ai per
un periodo T . Possiamo definire, in modo analogo, i segnali Sb (xi , yi ), Sc (xi , yi ) e
Sd (xi , yi ). Per quanto affermato in precedenza, valgono le relazioni
Ex>0 − Ex<0
(Sa + Sd ) − (Sb + Sc )
=
Ex>0 + Ex<0
Sa + Sb + Sc + Sd
(Sa + Sb ) − (Sc + Sd )
Ey>0 − Ey<0
=
,
Ey>0 + Ey<0
Sa + Sb + Sc + Sd
(2.21)
(2.22)
che sostituite nelle Eqq. 2.14 e 2.13 forniscono una stima delle derivate della funzione
di aberrazione W dai segnali Sa , Sb , Sc e Sd acquisiti simultaneamente.
2.4
Il sensore a piramide con modulazione di fuoco
Per definire completamente il metodo con modulazione di tilt locale, è necessario
specificare che tipo di distribuzione dei tilt locali è associata alla pertubazione periodica eseguita. Poiché lo scopo della tesi è quello di sviluppare un sensore per ottiche
adattive, uno dei fattori discriminanti per la scelta del metodo di funzionamento è la
rapidità con cui si possa ottenere una risposta. Per il sensore a piramide che stiamo
descrivendo, ciò si traduce nella rapidità con cui può essere attuata una oscillazione
51
completa del tilt locale. Le modulazioni più semplici che possiamo ottenere sono
una traslazione rigida della immagine di aberrazione sul piano focale (tilt globale) o
uno sfocamento.
Un tilt globale può essere ottenuto, ad esempio, introducendo nel fascio uno
specchio piano oscillante. In genere, tali dispositivi sono comandati da attuatori
piezoelettrici e non possono oscillare a frequenze maggiori di 1÷2 kHz [Catalogo Physik Instrument
Una modulazione dello sfocamento può essere ottenuta facendo riflettere il fascio
ottico su una membrana circolare posta in rapida vibrazione [Roddier et al., 1991].
Infatti, la parte centrale della pellicola può essere schematizzata come una calotta
sferica con raggio di curvatura variabile durante l’oscillazione. La frequenza di modulazione è data dalla frequenza di risonanza della membrana, che può raggiungere
facilmente una decina di kHz. Tali vibrazioni possono essere eccitate con un’onda
sonora.
Per non degradare le immagini della pupilla sul rivelatore bisogna introdurre tali
elementi su una immagine della pupilla generata prima della piramide. In questo modo i punti della pupilla e delle immagini sul rivelatore rimangono coniugati qualunque
sia la direzione del tilt locale introdotto.
Ricordando che la frequenza richiesta per un sistema adattivo è dell’ordine del
kHz, il secondo tipo di modulazione permette di compiere molte oscillazioni durante
una misura con il sensore di fronte d’onda. In questo modo la misura di ∇W sarebbe
semplificata, non rendendo necessario alcun sistema di controllo che sincronizzi il
tempo di integrazione sul rivelatore del sensore con il periodo di oscillazione della
membrana. Tale controllo sarebbe, invece, essenziale per lo specchio vibrante. Inoltre, è previsto che questo sensore sarà utilizzato per studiare il comportamento dinamico del secondario adattivo [Salinari et al., 1993] del Large Binocular Telescope.
Poiché la frequenza di lavoro di questo dispositivo può raggiungere circa 1 kHz, il
sensore di fronte d’onda deve avere risposte con frequenze abbastanza superiori, per
ottenere una buona risoluzione temporale. Questi sono i motivi per cui abbiamo
preferito la modulazione dello sfocamento a quella del tilt globale, anche se, come
52
vedremo in seguito, la prima introduce problemi di guadagno non uniforme sulla
pupilla che la seconda non ha.
In termini formali, introdurre un tilt globale equivale a considerare δθx e δθy
costanti nelle Eqq. 2.14 e 2.13. Un sistema di questo tipo (piramide con tilt globale) è equivalente a quello proposto da R. Ragazzoni [Ragazzoni, 1996], in cui la
modulazione del tilt è eseguita facendo oscillare la piramide rispetto alla immagine
aberrata invece che il contrario. Se la posizione del vertice oscilla con ampiezze δVx
e δVy lungo i due assi, il sistema equivale al nostro ponendo
δVx
f
δVy
=
.
f
δθx =
(2.23)
δθy
(2.24)
L’introduzione di uno sfocamento ∆f lungo l’asse ottico, produce una variazione
∆W della funzione di aberrazione, data da [Mahajan, 1991]
∆W (xo , yo ) =
∆f 2
(x + yo2 ) ,
2f 2 o
(2.25)
Nel nostro caso, ∆f è modulato nel tempo con una legge del tipo
∆f (t) = δf sin 2π
t
T
,
(2.26)
dove δf è il massimo sfocamento raggiunto. Dalle Eqq. 2.4, 2.25 e 2.26, si deduce
che le ampiezze delle oscillazioni degli angoli di tilt locale assumono la forma
δf
|xo |
f2
δf
δθy (xo , yo ) =
|yo | .
f2
δθx (xo , yo ) =
(2.27)
(2.28)
Le Eqq. 2.14 e 2.13, in questa configurazione, diventano
∂W
∂xo
∂W
∂yo
δf
π (Sa + Sd ) − (Sb + Sc )
=
|xo | sin
2
f
2 Sa + Sb + Sc + Sd
δf
π (Sa + Sb ) − (Sc + Sd )
=
|yo | sin
.
f2
2 Sa + Sb + Sc + Sd
(2.29)
(2.30)
A differenza del caso precedente, adesso δθx e δθy dipendono dalla posizione in
esame sulla pupilla. In Fig. 2.11 è mostrato come vengono distribuite le ampiezze dei
53
a)
b)
Figura 2.11: Modulazione dei tilt locali introdotti sulla pupilla di uscita del sistema ottico su
cui eseguire il test. a) Oscillazione lungo l’asse x di un tilt globale. b) Tilt locali introdotti dalla
modulazione dello sfocamento. In questo caso i tilt locali tendono ad annullarsi avvicinandosi al
centro della pupilla.
tilt locali. La modulazione di sfocamento introduce, rispetto a quella di tilt globale,
alcune limitazioni dovute ai fenomeni di saturazione. Fissiamo, per il momento, la
nostra attenzione su ∂W/∂xo . Si ha saturazione quando |∂W/∂xo | > δθx Utilizzando
l’Eq. 2.27, la condizione di saturazione diventa
∂W
δf
(x
|xo | .
o , yo ) >
∂xo
f2
(2.31)
Dall’equazione precedente è evidente che esiste sempre una regione della pupilla
intorno all’asse xo , in cui si ottiene sempre un segnale saturato, poiché xo ≈ 0.
Analogamente si ha lo stesso problema sull’asse yo per ∂W/∂yo . Il problema maggiore si potrebbe avere nell’origine in cui i due assi si incontrano. In questa zona
non possiamo ottenere molte informazioni perché ambedue i valori delle derivate
vengono a mancare. Il problema del sensing della zona centrale della pupilla nel
caso astronomico è comunque di importanza limitata. Infatti i telescopi hanno
un’ottica composta, in genere, da uno specchio primario che focalizza il fascio in
direzione di uno specchio secondario, posto sull’asse del precedente. La presenza del
secondario produce un’oscuramento centrale sulla pupilla del telescopio, escludendo
questa porzione dall’analisi del sensore.
54
2.4.1
Efficienza del sensore in termini di rapporto segnalerumore
Determineremo, adesso, il rapporto segnale-rumore con cui il sensore riesce a stimare
le derivate della funzione di aberrazione. Per rendere più compatta la scrittura
dell’eq. 2.30, definiamo
S1 = Sa + Sb
S2 = Sc + Sd .
(2.32)
L’equazione citata assume la forma
∂W
π S 1 − S2
= δθy sin
∂yo
2 S1 + S2
= g(S1 , S2 ) .
(2.33)
Assumeremo che gli errori su Sa , Sb , Sc e Sd siano statisticamente indipendenti, per
cui anche gli errori su S1 e S2 hanno la stessa proprietà. L’errore sulla stima di
∂W/∂yo è dato dalla relazione
σ∂2y W
∂g
∂S1
2
2
∂g
=
+
σS2 2
∂S2
2 2
S2 σS1 + S12 σS2 2
2
2
2 π S 1 − S2
= π (δθ) cos
,
2 S1 + S2
(S1 + S2 )4
σS2 1
(2.34)
2
dove abbiamo indicato con σX
l’errore quadratico medio associato alla grandezza
X. Il rapporto segnale-rumore SNR y , definito come
SNR y =
|∂W/∂yo |
,
σ∂y W
(2.35)
con le relazioni ottenute diventa
−1/2
π |S1 − S2 |
1
SNR y = tan
(S1 + S2 )2 S22 σS2 1 + S12 σS2 2
π
2 S1 + S2
(2.36)
Se i segnali sono limitati dal rumore fotonico, supposto poissoniano, abbiamo
√
che ασSa = αSa , dove α è il fattore di conversione dalle unità di segnale al numero
di fotoni equivalenti. Le dimensioni di α sono quelle dell’inverso di un segnale.
Considerazioni analoghe per σSb , σSc e σSd comportano
σS2 1 =
S1
α
σS2 2 =
55
S2
α
(2.37)
Sostituendo le Eqq. precedenti nella Eq. 2.36, otteniamo
|∆Sy |
2$
αStot G
SNR y =
π
Stot
,
(2.38)
dove
Stot = S1 + S2 = Sa + Sb + Sc + Sd
(2.39)
∆Sy = S1 − S2 = (Sa + Sb ) − (Sc + Sd )
(2.40)
e la funzione G(s) è definita da
G(s) = tan
−1/2
π .
s (1 − s2 )
2
(2.41)
Il rapporto segnale-rumore SNR x per ∂W/∂xo sarà dato dalla analoga relazione
2$
|∆Sx |
αStot G
SNR x =
π
Stot
,
(2.42)
in cui, questa volta, ∆Sx = (Sa + Sd ) − (Sb + Sc )
Poiché Stot è proporzionale al tempo di integrazione τ , si ha che SNR ∝
√
τ.
Inoltre, essendo la funzione G(s) monotona crescente, SNR aumenta al crescere di
|∆S|/Stot , che raggiunge il suo massimo valore alla saturazione. Per ottimizzare il
rapporto segnale-rumore, quindi, oltre a scegliere una sorgente di riferimento brillante e ad utilizzare il massimo tempo di integrazione τ possibile, bisognerà utilizzare
il sensore in prossimità dello stato di saturazione (senza raggiungerlo). Per SNR y ,
quest’ultima condizione è data da
∂W >
.
δθy ∼
∂yo (2.43)
Utilizzando l’Eq. 2.28, la condizione precedente può essere espressa in termini dell’ampiezza di sfocamento δf ottimale da applicare, ottenendo
2 > f ∂W .
δf ∼
|yo | ∂yo (2.44)
Questa condizione è dovuta all’accuratezza con cui è possibile stimare ∆Sy in presenza di rumore. Infatti, se siamo in prossimità della condizione di saturazione, i valori
56
assunti da Sa + Sb e Sc + Sd sono molto diversi tra loro, per cui la loro differenza ∆Sy
risulterà essere, in generale, grande rispetto all’errore introdotto dal rumore. Quando, invece, siamo molto lontani dalla condizione di saturazione (δθy |∂W/∂yo |
ovvero δf f 2 |∂W/∂yo |/|yo |), i valori assunti da Sa + Sb e Sc + Sd sono molto simili
tra loro (vedi Eqq. 2.11 e 2.12) per cui la loro differenza ∆Sy può essere confrontabile
con l’errore introdotto dal rumore, pregiudicando la misura.
Infine notiamo che per il sensore a piramide con modulazione di fuoco, il valore ottimale di δf , dato dalla Eq. 2.44, dipende da |yo |, per cui non è possibile
ottenere tale condizione su tutte le zone di sensing contemporaneamente. Analoghe
considerazioni valgono per SNR x .
L’ampiezza della modulazione dello sfocamento dovrà essere scelta con attenzione
in modo da ottimizzare la risposta del sistema adattivo.
2.4.2
Confronto con il sensore di Shack-Hartmann
Il sensore di fronte d’onda più usato, nei sistemi ottici adattivi per uso astronomico, è
il sensore di Shack-Harmann (SH), il cui principio di funzionamento è stato descritto
nel Par. 1.10. Questo ha molti punti in comune con il sensore a piramide con
modulazione di fuoco da noi sviluppato:
• come per lo SH, il sensore a piramide può lavorare in condizioni non monocromatiche. La dispersione introdotta dal prisma può essere facilmente corretta
con una opportuna progettazione della lente di camera, in modo da rendere il
sistema acromatico. Ciò permette di integrare radiazione su una larga banda,
incrementando il rapporto segnale-rumore;
• il tempo di integrazione sul rivelatore è lo stesso a parità di tempo disponibile
per eseguire una misura;
• in entrambi i sensori, i fotoni raccolti da una zona di sensing vengono suddivisi
in quattro canali del rivelatore, i cui segnali sono utilizzati per ottenete una
misura simultanea delle componenti di ∇W ;
57
• le relazioni che forniscono le derivate del fronte d’onda per il sensore a piramide
(Eqq. 2.29, 2.30, 2.27 e 2.28) sono equivalenti a quelle per uno SH (Eqq. 1.54
e 1.55) con lentine di diametro DL tale che
λ
≈ δθ .
DL
(2.45)
L’angolo di tilt locale nel sensore a piramide equivale, nello SH, alla larghezza
(angolare) della figura di diffrazione generata dalla singola lentina;
• entrambi i sensori presentano un regime di saturazione. Il sensore a piramide
raggiunge la saturazione quando |∂W/∂xo | ≥ δθ. Lo SH satura quando la
figura di diffrazione della lentina non intercetta uno degli assi della quad-cell.
> λ/DL , confermando l’equivalenza esposta nel
Ciò accade quando |∂W/∂xo | ∼
punto precedente.
I due sensori, comunque, presentano alcune differenze:
• il tempo in cui lo SH può eseguire una misura è limitato essenzialmente dal
tempo di lettura del rivelatore, mentre il sensore a piramide ha come ulteriore
limite il periodo con cui si può eseguire una oscillazione dello sfocamento.
Come abbiamo accennato, comunque, utilizzando una membrana vibrante, si
possono raggiungere frequenze tali da non risentire di tale limite in sistemi
ottici adattivi per uso astronomico;
• il sensore a piramide con modulazione di fuoco può variare la sensibilità in
modo continuo e semplice, anche durante l’osservazione, cambiando l’ampiezza di oscillazione dello sfocamento. La sensibilità dello SH, invece, è fissato
da parametri non modificabili come il diametro o la focale delle lentine. La
possibilità di modificare la sensibilità permette un controllo in tempo reale
del rapporto segnale-rumore raggiunto dal sensore a piramide, migliorando
l’efficienza del sistema adattivo;
• lo SH presenta la stessa sensibilità associata ad ogni zona di sensing, per le
quali ottiene, in media, la stessa accuratezza nella misura di ∇W . Il sensore
58
a piramide con modulazione di fuoco presenta un guadagno variabile sulla
pupilla, riducendo la sensibilità del sistema lungo le direzioni degli spigoli della piramide. Modulando un tilt globale si elimina il problema, ma riduce la
rapidità di risposta del sensore. Poichè tale limitazione è dovuta alla particolare simmetria dell’aberrazione introdotta dallo sfocamento (simmetria cilindrica), l’introduzione di aberrazioni più complesse, sommate allo sfocamento,
potrebbe contribuire a risolvere il problema. Ad esempio, è possibile introdurre
un coma facendo lavorare la membrana fuori asse.
• il numero di zone di sensing del sensore a piramide è limitato soltanto dalla
PSF del sistema e può essere modificato facilmente. Ad esempio, se utilizziamo, per il sensore, un rivelatore panoramico con elementi sensibili discreti
(detti pixel), è sufficiente per variare il numero di zone di sensing utilizzare
come lente di camera uno zoom. In questo modo possiamo modificare l’ingrandimento con cui si ottiene l’immagine della pupilla sul rivelatore, modificando l’area di pupilla associata ad ogni pixel. Questa possibilità permette
una notevole adattabilità del sistema alle mutevoli condizioni di seeing e alla
luminosità della sorgente di riferimento disponibile (controllando il numero di
fotoni per unità di tempo raccolti dalla zona di sensing e dunque il rumore
fotonico). Inoltre permette una configurazione ottimale per osservazioni in
differenti bande spettrali (si ricordi che il parametro di Fried r0 dipende da
λ). Lo SH non ha questa possibilità, poiché le zone di sensing sono fissate dal
numero di lentine nella griglia. In ogni caso, una modifica della configurazione
del sensore renderebbe necessaria una laboriosa opera di riallineamento del
sistema, rendendo questa soluzione impraticabile;
Il sensore a piramide risulta, dunque, confrontabile al sensore di SH in termini
di accuratezza e sensibilità. Il primo, inoltre, introduce nel sistema ottico adattivo
alcuni parametri facilmente modificabili (sensibilità e numero delle zone di sensing)
che permettono di adattare il sistema allo stato della turbolenza atmosferica, della
lunghezza d’onda in cui è eseguita l’osservazione e alla luminosità della sorgente di
59
riferimento a disposizione. Ciò potrebbe rendere il sensore a piramide competitivo
rispetto allo SH, soprattuto quando sia richiesto un elevato numero di zone di sensing
come nei sistemi adattivi per telescopi di grandi dimensioni nel visibile.
60
Capitolo 3
Simulazione del sensore a piramide
con modulazione di fuoco
Nel capitolo precedente abbiamo descritto il principio di funzionamento del sensore a piramide con modulazione di fuoco. Inoltre abbiamo ottenuto le relazioni
tra i segnali forniti dal sensore e le derivate del fronte d’onda in termini di ottica
geometrica.
Nel presente capitolo descriveremo il codice utilizzato, per valutare il comportamento del sensore, per applicazioni in sistemi ottici adattivi di uso astronomico.
Per essere in grado di fornire una valutazione accurata, simuleremo il sensore nel
regime di ottica diffrattiva. A tale scopo premetteremo una trattazione diffrattiva
generale del test di Foucault. Le relazioni che otterremo saranno applicate nel caso
particolare della simulazione del sensore a piramide con modulazione di fuoco, come
decritto negli ultimi paragrafi di questo capitolo.
3.1
Trattazione diffrattiva del test di Foucault
Una trattazione diffrattiva del test di Foucault fu iniziata da Lord Rayleigh [Rayleigh, 1917]
che riuscı̀ a spiegare la presenza di un caratteristico anello brillante al bordo dell’immagine della pupilla. Comunque, è dovuta a Linfoot [Linfoot, 1955] la prima
trattazione generale del problema. In seguito Barakat [Barakat, 1969] riformulò la
teoria in termini di ottica di Fourier, con un approccio simile a quello che useremo.
Utilizzeremo una geometria simile a quella descritta nel capitolo precedente (vedi
61
Fig. 2.4). Ricordiamo che i sistemi di coordinate (xo , yo ), (x, y) e (xi , yi ) sono posti
rispettivamente sul piano della pupilla di uscita L dell’elemento ottico su cui eseguire
il test, sul piano del coltello K e sul piano I del rivelatore su cui la lente di camera
forma una immagine di L. In questo caso, per semplicità, considereremo il piano
della pupilla di ingresso della lente di camera LC coincidente con il piano del coltello
K.
Supposto che l’elemento ottico sotto esame sia illuminato da un fascio collimato che si propaga lungo l’asse ottico z,1 la distanza tra il piano L e il coltello K
rappresenta la sua distanza focale nominale f . Indichiamo con d la distanza tra la
pupilla di uscita di LC e il piano I. Schematizzando la lente di camera con una lente
sottile di lunghezza focale fC , la sua pupilla di entrata coincide con quella di uscita
e valgono le relazioni [Jenkins & White, 1972]
1 1
1
+
=
f
q
fC
f
,
M =
q
(3.1)
(3.2)
dove M rappresenta l’ingrandimento con cui è riprodotta la pupilla L.
Utilizzando il formalismo descritto nel cap. 1.3, se la lente Lo produce aberrazioni,
il fasore Uo sulla sua pupilla di uscita assume la forma (vedi eq. 1.12 e 1.13)
π 2
2
Uo (xo , yo ) = A Po (xo , yo ) exp −i
x + yo exp [i∆φ(xo , yo ) + χ(xo , yo )] , (3.3)
λf o
dove A è l’ampiezza del campo incidente la lente, Po è la funzione pupilla e ∆φ e
χ rispettivamente le perturbazioni di fase e di log-ampiezza introdotte dalle aberrazioni. L’intensità Io (xo , yo ) è data dal modulo quadrato del fasore Uo per cui
Io (xo , yo ) = {A exp [χ(xo , yo )]}2 .
(3.4)
Utilizzando la relazione precedente ed esprimendo le perturbazioni di fase in termini
della funzione di aberrazione (eq. 1.14), il campo Uo può essere espresso nella forma
π 2
2π
2
Uo (xo , yo ) = Io (xo , yo )Po (xo , yo ) exp −i
x + yo exp i W (xo , yo ) , (3.5)
λf o
λ
1
2
1
Questa situazione corrisponde, nel caso astronomico, ad osservare una sorgente non risolvibile
(stella lontana) in asse al telescopio.
62
La lente di camera LC può essere trattata come un sistema ottico che genera
una immagine del piano L sul piano coniugato I e come tale possiamo utilizzare
una trattazione simile a quella esposta nel par. 1.1. Il campo sul piano oggetto
(xo , yo ) in questo caso, però, è spazialmente coerente, in quanto generato da una
sorgente puntiforme. In tal modo, la condizione di linearità espressa dall’integrale di
sovrapposizione non vale per le intensità, ma per i campi [Goodman, 1968, par. 6.1],
ottenendo
Ui (xi , yi ) =
∞
−∞
Uo (xo , yo )h(xi , yi ; xo , yo )dxo dxo ,
(3.6)
dove Ui (xi , yi ) è il fasore sul piano immagine I e h(xi , yi ; xo , yo ) è la risposta all’impulso in termini di campo, cioè il fasore sul piano I generato da una onda sferica
centrata nel punto (xo , yo ) del piano oggetto.
La lente LC ha una pupilla efficace data dall’intersezione tra la pupilla effettiva
della lente stessa e la regione di piano non ostruita dal coltello. Indichiamo con PC
la funzione pupilla per LC e con PK la funzione coltello che vale 1 dove il coltello
trasmette e 0 altrimenti. La funzione pupilla efficace per LC è data dal prodotto tra
PK e PC .
L’ottica di Fourier fornisce la risposta all’impulso h per una lente sottile [Goodman, 1968,
Par. 5.3] tra due piani coniugati
π 2
π 2
1
h(xi , yi ; xo , yo ) = 2 exp
i xi + yi2 exp
i xo + yo2
λ fq
λq
λf
∞
−∞
PK (x, y)PC (x, y)
2π
exp − i [(xi + Mxo )x + (yi + Myo )y] dxdy .
λq
(3.7)
Sostituendo le Eqq. 3.7 e 3.5 nella 3.6 e invertendo l’ordine degli integrali,
otteniamo
1
π 2
i xi + yi2
Ui (xi , yi ) = 2 exp
λ fq
λq
∞
π
dxdyPK (x, y)PC (x, y) exp
i (xi x + yi y)
λq
−∞
∞
−∞
1
dxo dyo Po (xo , yo )Io2 (xo , yo )
63
2π
π
exp i W (xo , yo ) exp − i (xi x + yi y) .
λ
λq
(3.8)
Per semplificare la notazione poniamo



 ξo
xo
Ro
yo
=
Ro
=


 ηo



 ξi = −


 ηi
xi
MRo
yi
= −
MRo
(3.9)
.
(3.10)
Le nuove coordinate sono normalizzate rispettivamente al raggio Ro della pupilla
L e al raggio dell’immagine di L, dato da MRo . Il segno negativo nelle 3.10 tiene
conto della inversione dell’immagine. Con questa notazione, la relazione tra punti
coniugati è data banalmente da (ξi , ηi ) = (ξo , ηo ). Per coerenza definiamo
W̃ (ξo , ηo ) = W (Ro ξo , Ro ηo )
(3.11)
I˜o (ξo , ηo ) = Io (Ro ξo , Ro ηo )
(3.12)
P̃o (ξo , ηo ) = Po (Ro ξo , Ro ηo )
(3.13)
P̃C (x/RC , y/RC ) = PC (x, y)
(3.14)
Ũi (ξi , ηi ) = MUi (MRo ξi , MRo ηi )
(3.15)
I˜i (ξi , ηi ) = M2 |Ui (MRo ξi , MRo ηi )|2 ,
(3.16)
in cui RC è il raggio della pupilla della lente di camera e i fattori M e M2 nelle
ultime due equazioni tengono conto della riscalatura dell’ampiezza del campo e
dell’intensità con l’ingrandimento M.
Sostituendo le ultime relazioni nella Eq. 3.8, otteniamo
R2 ∞
x y
Ũi (ξi , ηi ) = 2 o2
dxdyPK (x, y)P̃C
,
λq
RC RC
−∞
MRo
exp 2πi
(ξi x + ηi y)
λq
∞
−∞
1
dξo dηo P̃o (ξo , ηo )I˜o2 (ξo , ηo )
2π
MRo
exp i W̃ (ξo , ηo ) exp −2πi
(xξo + yηo ) ,
λ
λq
64
(3.17)
in cui abbiamo trascurato un fattore di fase che dipende dalle sole coordinate (ξi , ηi ).
Tale termine risulta ininfluente poiché siamo interessati alla distribuzione di intensità
I˜i sul piano I. Nell’Eq. 3.17 risulta naturale introdurre il cambiamento di variabili
ξ = l0 x
,
η = l0 y
in cui
l0 =
(3.18)
MRo
Ro
=f
λq
λ
(3.19)
rappresenta la dimensione tipica della figura limitata dalla diffrazione sul piano
focale. L’Eq. 3.17 diventa
Ũi (ξi , ηi ) =
∞
−∞
∞
−∞
dξdηPK (l0 ξ, l0 η)P̃C
l0
l0
ξ,
η exp [2πi (ξi ξ + ηi η)]
RC RC
1
dξo dηo P̃o (ξo , ηo )I˜o2 (ξo , ηo )
2π
exp i W̃ (ξo , ηo ) exp [−2πi (ξξo + ηηo )] .
λ
(3.20)
Indicando con F l’operatore di trasformata di Fourier definito da
F {f(x, y)} (kx , ky ) =
∞
−∞
f(x, y) exp [−2πi (kx x + ky y)] dxdy ,
(3.21)
si ottiene una forma più compatta per l’Eq. 3.20 e per I˜i
2π
F(ξ, η) = F P̃o (ξo , ηo )I˜o2 (ξo , ηo ) exp i W̃ (ξo , ηo ) (ξ, η)
λ l
l
0
0
Ũi (ξi , ηi ) = F −1 PK (l0 ξ, l0 η)P̃C
ξ,
η F(ξ, η) (ξi , ηi )
RC RC
1
2
I˜i (ξi , ηi ) = Ũi (ξi , ηi ) .
(3.22)
(3.23)
(3.24)
Fissata la geometria delle pupille, l’insieme delle Eqq. 3.22, 3.23 e 3.24 permette
di calcolare numericamente la distribuzione di intensità I˜i sul piano immagine I,
quando si conosca la funzione di aberrazione W̃ e le fluttuazioni di intensità I˜o . È
sufficiente eseguire due volte una procedura di trasformata di Fourier rapida (Fast
Fourier Transform o FFT), la prima diretta e la seconda inversa.
Si noti che le equazioni trovate sono di semplice applicazione in un codice numerico e non dipendono da particolari ipotesi sulla forma delle pupille o del coltello.
65
3.2
Descrizione del codice di simulazione
Abbiamo simulato il comportamento del sensore a piramide con modulazione di
fuoco in un sistema adattivo per un telescopio di uso astronomico. Poiché siamo
interessati a determinare i limiti che introduce il sensore nel sistema adattivo, abbiamo simulato, quando possibile, gli altri elementi del sistema in modo che avessero
un comportamento ideale.
Il programma di simulazione del sensore è stato sviluppato con il linguaggio
IDL (Interactive Data Language) della RSI (Research Systems, Inc.). In Fig. 3.1 è
mostrato il diagramma a blocchi che descrive le unità fondamentali del codice, che
saranno descritte in dettaglio in seguito.
I parametri richiesti dal programma, che caratterizzano il sistema, sono:
• il diametro D del telescopio;
• la focale f del telescopio;
• l’ampiezza δf della modulazione della focale introdotta dal dispositivo di
sfocamento;
• la lunghezza d’onda λs a cui lavora il sensore;
• la lunghezza d’onda λc a cui lavora il correttore, ovvero a cui è acquisita
l’immagine corretta per la turbolenza atmosferica;
• il parametro di Fried r0 alla lunghezza d’onda λc ;
• il numero N di elementi sensibili (o pixel) del rivelatore sul diametro dell’immagine della pupilla, ovvero il numero di zone di sensing;
• il numero Nphot di fotoni rivelati per zona di sensingper intervallo di integrazione;
• la radice dell’errore quadratico medio σron introdotto dal rumore di rettura del
rivelatore (o read out noise).
66
Start
Generazione della funzione
di aberrazione d’onda W
Eliminazione del termine
di tilt
Introduzione dello
sfocamento e propagazione
sul rivelatore
Introduzione
del rumore
Stima di ∇W
Ricostruzione del fronte
d’onda
Correzione
W ← W-Wstimato
Figura 3.1: diagramma a blocchi del programma di simulazione del sensore
67
Il programma richiede di specificare due ulteriori parametri:
• il numero M di elementi per lato della matrice con cui campionare la funzione
di aberrazione;
• il numero MFFT di elementi per lato delle matrici utilizzate nelle FFT.
3.2.1
Generazione della funzione di aberrazione
Nella presente simulazione utilizzeremo l’approssimazione di campo vicino (o nearfield), la cui validità e conseguenze sono state discusse nel Par. 1.5. Ricordiamo
che essa permette di poter trascurare gli effetti della scintillazione sulla qualità
dell’immagine.
Per simulare fronti d’onda aberrati dagli effetti della turbolenza atmosferica, abbiamo utilizzato un algoritmo proposto da N. Roddier [Roddier, 1990]. Supponendo
la pupilla del telescopio circolare di raggio R = D/2, la funzione di aberrazione
W (xo , yo ) può essere sviluppata in serie di polinomi ortonormali di Zernike Zj (vedi
App. B) come segue
W (Rξo , Rηo ) =
∞
wj Zj (ξo , ηo ) ,
(3.25)
j=2
in cui abbiamo trascurato il termine costante (pistone) Z1 che risulta ininfluente
ai fini della formazione dell’immagine. Nel caso di turbolenza di Kolmogorov, le
covarianze wj wj dei coefficienti hanno una espressione analitica nota che dipende
soltanto dagli indici j e j e dal fattore λ2 (D/r0 )5/3 . Possiamo, dunque, calcolare
la matrice di covarianza C limitandoci ad un numero finito di polinomi di Zernike
(2 < j < jmax ). I coefficienti wj possono essere considerati variabili casuali a
media nulla che seguono una statistica Gaussiana,2 per cui la densità di probabilità
p(w) associata ad una realizzazione del vettore (colonna) dei coefficienti w è data
2
Quando un raggio attraversa uno strato turbolento dell’atmosfera, il ritardo di fase accumulato
è dovuto a numerosi contributi casuali e indipendenti che si sommano durante la propagazione.
Per il teorema del limite centrale tali ritardi seguono una distribuzione gaussiana, cosı̀ come i
coefficienti di Zernike che ne sono una combinazione lineare.
68
da [Goodman, 1985, Par. 2.7.1]
p(w) =
1
(2π)jmax −1 |C|1/2
1
exp − wt C−1 w
2
,
(3.26)
dove con |C| e C−1 si è indicato rispettivamente il determinante e l’inversa di
C. Poiché la matrice di covarianza è simmetrica e definita positiva, è possibile
decomporla nella forma di Cholesky, data da [Press et al., 1986]
C = LLt ,
(3.27)
dove L è una matrice triangolare inferiore. Consideriamo il vettore w = L−1 w
e indichiamo con p (w ) la corrispondente densità di probabilità. Dovrà valere la
relazione
p (w )dw = p(w)dw = p (Lw ) |L|dw .
(3.28)
Sostituendo nella precedente relazione l’Eq. 3.26 e tenendo conto della 3.27, otteniamo
p (w ) =
1
(2π)jmax −1
1
exp − (w )t w ,
2
(3.29)
per cui la variabile w risulta essere Gaussiana, a media nulla e con matrice di covarianza pari alla matrice identità. Quest’ultima proprietà comporta che le componenti
di w siano statisticamente indipendenti e con varianza unitaria e dunque possono
essere facilmente fornite da opportune funzioni presenti nella maggior parte delle
librerie dedicate al calcolo numerico. Per generare una funzione di aberrazione W è
necessario, dunque, eseguire i seguenti passi
• fissare il numero jmax di polinomi di Zernike da utilizzare e calcolarli su una
griglia M xM di coordinate appropriata;
• calcolare la matrice di covarianza C e decomporla in forma di Cholesky;
• generare un vettore w di numeri indipendenti con una distribuzione Gaussiana
a media nulla e con varianza unitaria;
• calcolare il vettore dei coefficienti di Zernike dato da w = Lw ;
69
• calcolare la somma 3.25 per ottenere W .
Poiché la matrice di covarianza C dipende dai parametri del sistema per il solo
fattore λ2 (D/r0 )5/3 , è sufficiente decomporla in forma di Cholesky una volta per
tutte. I vari casi con λ2 (D/r0 )5/3 diversi si ottengono da una semplice riscalatura del vettore w ottenuto. Ricordando che r0 ∝ λ6/5 , si può notare che il fattore λ2 (D/r0 )5/3 non dipende dalla lunghezza d’onda, in accordo con l’ipotesi di
acromaticità di W , discussa all’inizio del paragrafo.
Rimane da stabilire il numero di punti M xM su cui campionare i polinomi di
Zernike e il massimo indice jmax da considerare.
Un campionamento troppo denso del dominio su cui sono definiti i polinomi
di Zernike comporterebbe un impiego inutile di grandi risorse di memoria, mentre
un campionamento troppo basso comporterebbe un’inaccettabile perdita di informazione. Il segnale che restituisce ogni pixel del rivelatore è proporzionale all’energia che raggiunge la superficie del pixel stesso. Per il calcolo di questa quantità si
rende necessario un campionamento adeguato di W all’interno di ogni zona di sensing. Un numero di punti per zona maggiore di 10 (M > 3N ) può essere considerato
ragionevole.
La funzione di aberrazione W entra nella simulazione attraverso l’Eq. 3.22. Questa comporta la trasformata di Fourier di una funzione oscillante del tipo exp(2πiW/λ),
per cui è necessario che ogni oscillazione sia sufficientemente campionata. Per ottenere ciò è necessario che tra due punti successivi della griglia di campionamento
la variazione di W sia minore di λ/2. Con considerazioni simili a quelle svolte nel
Par. 1.9.2, questa condizione è soddisfatta per D/M < r0 . Ricordando che le zone
di sensing di un sistema ottico adattivo devono avere dimensioni D/N non maggiori
di r0 , le condizioni ottenute per M comportano
> 3D .
M > 3N ∼
r
0
(3.30)
Nel nostro caso, per limiti imposti dalla memoria, si ha M = 128, per cui il codice
< N < 43. Nel caso più sfavorevsviluppato permette di simulare sistemi con D/r0 ∼
70
ole, cioè in banda V (0.55 µm) dove r0 ≈ 20 cm, una tale griglia ci permette di
< 8.4 m.
simulare telescopi con pupille di diametro D ∼
Imporre che lo sviluppo nell’Eq. 3.25 sia troncato all’indice jmax equivale a trascurare parte delle informazioni ad alta frequenza spaziale. Tale approssimazione risulta
ragionevole osservando che la somma delle varianze dei coefficienti wj con j ≥ j
decresce all’aumentare di j con una legge di potenza del tipo [Noll, 1976]
∞
j =j
wj2 ∝ j −0.866 per j > 10 .
(3.31)
Nelle nostre simulazioni abbiamo utilizzato jmax = 496. Come vedremo in seguito
il numero di polinomi determinati dal sensore nelle simulazioni è sostanzialmente
minore di jmax = 496. Ciò permette di valutare correttamente la varianza residua
del fronte d’onda una volta eliminate le aberrazioni individuate dal sensore.
3.2.2
Eliminazione del termine di tilt globale
Nella simulazione si suppone che sensing e correzione del termine di tilt globale
siano eseguiti da dispositivi dedicati, utilizzando il nostro sensore soltanto per gli
alti ordini. Poiché il nostro scopo è quello di analizzare il comportamento del sensore
a piramide descritto, supporremo che il sensore e correttore di tilt siano perfetti. In
queste ipotesi, il fronte d’onda in ingresso al sensore è ottenuto eliminando i termini
di tilt (j = 2 e j = 3) dallo sviluppo in polinomi di Zernike nell’Eq. 3.25.
3.2.3
Introduzione dello sfocamento e propagazione sul rivelatore
Si suppone che il tempo di integrazione T coincida con il periodo di una oscillazione
del fuoco, durante il quale viene aggiunto alla funzione di aberrazione W un termine
di sfocamento, dipendente dal tempo, dato dalla Eq. 2.25. La funzione W (xo , y0 ; t)
cosı̀ ottenuta fornisce la distribuzione di campo sul piano focale data dall’Eq. 3.22,
in cui I˜o = cost. (approssimazione di near-field), W̃ (ξo , ηo ; t) = W (Rξo , Rηo ; t) e
λ = λs .
71
y
y
x
PB
x
PA
(B)
(A)
(C)
y
(D)
x
y
PC
PD
x
Figura 3.2: Relazione tra le faccie (A), (B), (C) e (D) della piramide e le funzioni pupilla PA ,
PB , PC e PD dei coltelli equivalenti utilizzate nella simulazione.
La distribuzione di campo sul rivelatore (dove si forma l’immagine della pupilla), dipende dalla forma del “coltello” definito dalla funzione PK nell’Eq. 3.23.
Utilizzando una piramide per separare il fascio, come descritto nel capitolo precedente, si hanno quattro diverse funzioni, ognuna associata ad una differente faccia
della piramide, che chiameremo PA , PB , PC e PD (vedi Fig. 3.2). PA è definita da
PA (x, y) =
1 se x ≥ 0 e y ≥ 0
,
0 altrimenti
(3.32)
mentre le altre si ottengono da questa per successive rotazioni di 90 gradi in senso
antiorario intorno all’origine degli assi. Supponendo che le dimensioni del prisma e della lente di camera siano sufficientemente grandi in modo che il campo sia
trascurabile fuori dei limiti di essi, le Eqq. 3.23 e 3.24 diventano
Ũi,a (ξi , ηi ; t) = F −1 {PA (l0 ξ, l0 η)F(ξ, η)} (ξi , ηi ; t)
(3.33)
I˜i,a (ξi , ηi ; t)
(3.34)
2
= Ũi,a (ξ, η; t) ,
dove Ũi,a e I˜i,a (ξi , ηi ; t) indicano, rispettivamente, la distribuzione di campo e di
intensità sul piano dell’immagine della pupilla associata alla faccia A del prisma
72
all’istante t. In modo simile si definiscono le distribuzioni di campo Ũi,b;t , Ũi,c;t e
Ũi,d;t e di intensità I˜i,b;t , I˜i,c;t e I˜i,d;t associate alle faccie B, C e D rispettivamente.
La distribuzione di intensità Ĩi,a (ξi , ηi ) sul rivelatore, mediata in un periodo T
di integrazione, è data da
Nt
1T ˜
1 Ĩi,a (ξi , ηi ) =
Ii,a (ξi , ηi ; t)dt ≈
I˜i,a (ξi , ηi ; tn ) ,
T 0
Nt n=1
(3.35)
dove Nt è il numero di intervalli in cui è stato diviso il tempo di integrazione.
Seguendo le notazioni introdotte nel capitolo precedente, il segnale Sa (Pn ), registrato dal rivelatore nello n-esimo pixel Pn dell’immagine (a), è proporzionale alla
somma dei valori di Ĩi,a che sono contenuti nel perimetro del pixel stesso. Analoghe
relazioni si stabiliscono per i segnali Sb , Sc e Sd associati alle altre immagini di
pupilla. Per ottenere risultati validi è necessario che in ogni pixel vi sia lo stesso
numero di punti in cui è calcolata Ĩi,a . Per garantire ciò è sufficiente che M sia un
multiplo intero del numero N di zone di sensing sul diametro della pupilla.
I segnali ottenuti possono essere trattati, adesso, in due modi diversi, a seconda
che si voglia o no simulare il rumore fotonico e di lettura. Nel caso ideale, con
rapporto segnale-rumore infinito e con errore di lettura nullo, i valori dei segnali
ottenuti non subiscono ulteriori modifiche. Nel caso in cui si voglia considerare
il contributo del rumore, i segnali vengono trasformati in unità di fotoni rivelati,
moltiplicandoli per un opportuno fattore di conversione, e arrotondati all’intero più
vicino. Tale fattore α è legato a Nphot dalla relazione
α=
π
N 2 Nphot
4
Sa + Sb + Sc + Sd
,
(3.36)
dove il fattore π/4 rappresenta la frazione di area effettivamente occupata dalla
pupilla sulla griglia di N 2 zone di sensing. Ad ogni pixel è aggiunto un rumore
fotonico poissoniano, con varianza pari al segnale nel pixel stesso, e un rumore di
lettura a distribuzione di probabilità gaussiana, con standard deviation pari a σron .
73
3.2.4
Stima di ∇W e ricostruzione del fronte d’onda
Le Eqq. 2.29 e 2.30 permettono di ottenere una stima delle derivate della funzione
di aberrazione a partire dai segnali forniti dal sensore. In generale, comunque,
all’interno delle zone di sensing, ∇W non può essere considerato costante, per cui le
equazioni citate forniscono, più esattamente, una stima dei valori medi Sx e Sy delle
derivate della funzione di aberrazione all’interno delle zone stesse. Tali quantità
sono definite dalle relazioni
1 ∆Ao ∆Ao
1 =
∆Ao ∆Ao
Sx =
Sy
∂W
dxo dyo
∂xo
∂W
dxo dyo .
∂yo
(3.37)
(3.38)
Il sensore fornisce una stima di Sx e Sy attraverso le Eqq. 2.29 e 2.30, per le quali
Sx
Sy
δf
π (Sa + Sd ) − (Sb + Sc )
≈
|xo | sin
2
f
2 Sa + Sb + Sc + Sd
π (Sa + Sb ) − (Sc + Sd )
δf
≈
|yo | sin
.
f2
2 Sa + Sb + Sc + Sd
(3.39)
(3.40)
Poiché il sensore trattato fornisce stime di ∇W e non direttamente della funzione
W , si rende necessario l’uso di un ricostruttore del fronte d’onda [Rimmer, 1974].
Esistono due approcci fondamentali al problema, lo sviluppo di un ricostruttore
zonale [Fried, 1977, Hunt, 1979] o modale [Cubalchini, 1979, Southwell, 1980]. Il
primo fornisce una stima del valore di W in certi punti della pupilla del telescopio
(tipicamente in coincienza degli attuatori dello specchio adattivo). Il secondo fornisce i coefficienti associati alle funzioni di pupilla in cui è decomposta la funzione di
aberrazione W (ad esempio in polinomi di Zernike). La ricostruzione modale è considerata superiore a quella zonale [Southwell, 1980] in quanto è meno sensibile alla
propagazione del rumore associato alle stime di ∇W . Per questo motivo abbiamo
scelto di utilizzare un algoritmo di ricostruzione modale nel nostro codice.
Supponiamo di ricostruire la funzione di aberrazione con i primi K polinomi di
Zernike, la funzione di aberrazione Wr ricostruita avrà un’espressione del tipo
Wr (xo , yo ) =
K
wr,j Zj
j=2
74
xo yo
,
R R
.
(3.41)
Se consideriamo Wr la miglior stima di W , dalle Eqq. 3.39 e 3.40, otteniamo
Sx (Pn ) =
K
wr,j
j=2
1 ∂Zj xo yo
dxo dyo
,
∆Ao Pn ∂xo R R
1 ∂Zj xo yo
Sx (Pn ) =
wr,j
dxo dyo ,
,
∆Ao Pn ∂yo R R
j=2
K
(3.42)
(3.43)
dove Pn indica la n-esima zona di sensing (n = 1, 2, · · · , N 2 ).
Per rendere più concisa la scrittura, definiamo
∂Zj 1 ∂Zj xo yo
=
dxo dyo
,
∂xo Pn
∆Ao Pn ∂xo R R
1 ∂Zj xo yo
∂Zj =
dxo dyo .
,
∂yo Pn
∆Ao Pn ∂yo R R
(3.44)
(3.45)
Il sistema di 2N 2 equazioni e K − 1 incognite, dato dalle relazioni 3.42 e 3.43, può
essere scritto in forma matriciale, come segue
Zw = S ,
(3.46)
dove Z detta matrice di interazione è data da

∂Z2 ∂ξo P1
∂Z2 ∂ξo P2
∂Z3 ∂ξo P1
∂Z3 ∂ξo P2





..

.

 ∂Z 2

 ∂ξo P 2

Z =  ∂Z2 N
 ∂η o P

 ∂Z2 1

 ∂ηo P2

..


.

∂Z2 ∂η
o
..
.
∂Z3 ∂ξo P
N2
∂Z3 ∂ηo P1
∂Z3 ∂ηo P2
..
.
∂Z3 ∂ηo P
PN 2
N2
···
···
···
···
···
···
∂ZK ∂ξo P1
∂ZK ∂ξo P2
..
.
∂ZK ∂ξo P
N2
∂ZK ∂ηo P1
∂ZK ∂ηo P2
..
.
∂ZK ∂ηo P






















(3.47)
N2
e i vettori w dei coefficienti di Zernike e S delle derivate medie stimate assumono la
forma




w=


Sx (P1 )
Sx (P2 )
..
.









w2




 S (P 2 ) 
w3 



x
N
 .
.. 
 S=


(P
)
S
y
1
. 


 S (P ) 
y
2


wK


..


.



Sy (PN 2 )
75
(3.48)
In genere si ha K −1 2N 2 , cioè si hanno molte più equazioni che incognite. Questo
è un tipico problema di minimi quadrati, la cui soluzione è data dalla inversione del
seguente sistema lineare [Press et al., 1986, Par. 14.3]
ZT Zw = ZT S .
(3.49)
Rimane da stabilire il valore K del massimo grado del polinomio di Zernike da
utilizzare. La parte radiale del j-esimo polinomio di Zernike (vedi app. B ) ha al
più un numero di zeri (sul diametro) pari al grado radiale n associato, che cresce
all’aumentare di j. È inutile utilizzare polinomi con un numero di zeri maggiore del
numero N di zone di sensing sul diametro della pupilla. In questo caso il sistema
non sarebbe in grado di rivelarne le oscillazioni associate. Oltre a ciò risulterebbero
dannosi nel processo di ricostruzione a causa dell’aliasing introdotto. Il numero
Kmax di polinomi di Zernike con grado radiale n minore o uguale a N è dato da
Kmax =
(N + 1)(N + 2)
,
2
(3.50)
per cui possimo utilizzare K ≤ Kmax .
3.2.5
Correzione del fronte d’onda
Il nostro interesse è focalizzato sul comportamento del sensore a piramide, per cui
abbiamo supposto un correttore perfetto. Il correttore simulato sottrae semplicemente la funzione di aberrazione ricostruita a quella in ingresso al sensore stesso.
Nel successivo ciclo, la funzione di aberrazione in ingresso al sensore risulterà essere
il residuo non corretto dal sistema.
Abbiamo eseguito tre iterazioni successive. La prima simula il comportamento
del sensore in assenza della retroazione del sistema adattivo (condizione di circuito
aperto o di open-loop). Le successive iterazioni simulano il comportamento del sensore quando il sistema adattivo è in funzione, attivando la retroazione (condizione di
circuito chiuso o closed-loop), nell’ipotesi in cui il tempo scala di evoluzione delle perturbazioni introdotte della turbolenza atmosferica sia maggiore del tempo impiegato
ad eseguire la correzione adattiva.
76
3.3
Risultati della simulazione
Prima di discutere i risultati della simulazione, determiniamo quali siano i parametri
significativi, che permettono di stimare l’efficienza del sensore di fronte d’onda simu2
lato. Uno di questi parametri è la varianza σW
della funzione di aberrazione residua,
definita da
2
σW
=
W −W
2 ,
(3.51)
dove il simbolo · · · indica la media sulle prove eseguite e la sovralineatura la media
sulla superficie della pupilla. Dalle Eqq. 3.25 e 3.41 e tenendo conto della ortonor2
malità dei polinomi di Zernike (vedi App. B), otteniamo per la varianza σN
C della
funzione di aberrazione non corretta
2
σN
C =
∞ wj2 ,
(3.52)
j=2
per la varianza σT2 T con il solo tilt(j = 2 e j = 3) corretto
σT2 T =
∞ wj2 ,
(3.53)
j=4
per la varianza residua σ02 nel caso ottimale in cui i primi K polinomi siano totalmente corretti
σ02 =
∞
wj2
(3.54)
j=K+1
e per la varianza residua σC2 dopo la correzione simulata
σC2 =
K (wj − wr,j )2 + σ02 .
(3.55)
j=4
Si noti che, tra le ultime quattro varianze definite, soltanto σC2 presenta una dipendenza dal comportamento del sensore (attraverso i coefficienti wr,j ).
Gli errori residui dopo la correzione sono imputabili sia al sensore che al ricostruttore. Poiché a noi interessa analizzare le caratteristiche del solo sensore,
indipendentemente dai limiti introdotti dal ricostruttore, è necessario separare i due
contributi. Possiamo supporre che il primo contribuisca con una varianza σS2 e il
77
secondo con σR2 , le quali, sommate, danno σC2 . Il contributo del sensore alla varianza
dei residui, dunque, è dato da
σS2 = σC2 − σR2 .
(3.56)
Un buon indice per stimare l’efficienza del sensore è fornito dal confronto di σS2 con
il valore ottimale σ02 .
Per stimare σR2 abbiamo simulato un sensore perfetto, passando al ricostruttore
le derivate vere della funzione d’aberrazione. Utilizzando i parametri riportati in
tab. 3.1 abbiamo ottenuto σR2 = (5.3 ± 0.1)10−3 µm2 . Tale valore, come tutti quelli
riportati in seguito, è stato calcolato come la media dei risultati di 100 simulazioni,
con funzioni di aberrazione indipendenti. Gli errori associati sono dati dall’errore
quadratico medio della media.
I residui di aberrazione non corretti limitano la risoluzione delle immagini ottenute dal sistema adattivo simulato. Per stimare tale effetto forniremo, tra i risultati, i valori del rapporto di Strehl SR nei vari stadi di correzione e alle lunghezze
d’onda λC utilizzate. Dal Par. 1.6, ricordiamo che SR rappresenta il rapporto tra
il picco della PSF media ottenuta dal sistema e il picco di quella ideale, nel caso
2
limitato soltanto dalla diffrazione. SR è legato a σW
dalla relazione
SR W
σW
= exp − 2π
λc
2 ,
(3.57)
valida per aberrazioni non troppo grandi (2πσW /λc < 1 rad).
Nel caso in cui la varianza residua possa essere espressa come somma di vari
contributi, l’Eq 3.57 permette di calcolare SR come prodotto di vari fattori di attenuazione del rapporto di Strehl, uno per ogni singolo contributo all’errore totale.
Per esempio, nel caso trattato abbiamo
σC
SR C = exp − 2π
λc
2 σS
= exp − 2π
λc
2 σR
exp − 2π
λc
2 = SR S SR R .
(3.58)
Avendo stabilito quali siano i parametri significativi per valutare il comportamento del sensore a piramide simulato, presenteremo, adesso, i risultati numerici
ottenuti.
78
Parametri simulazione
D=4m
f = 140 m
λs = 0.55 µm (r0 = 19 cm)
N = 16
K = 153
Nphot = 300
mvis = 8.0
σron = 3 e− /pixel
δf = 1, 2.5, 3, 4, 5 cm
Correzione in banda K
λc = 2.20 µm (r0 = 100 cm)
Correzione in banda J
λc = 1.25 µm (r0 = 51 cm)
Correzione in banda V
λc = 0.55 µm (r0 = 19 cm)
Tabella 3.1: Parametri utilizzati per la simulazione. D rappresenta il diametro del telescopio, f
la focale, λs la lunghezza d’onda a cui lavora il sensore e λc il correttore, N è in numero di zone di
sensing lungo il diametro, K il numero di polinomi di Zernike ricostruiti, r0 il parametro di Fried.
La magnitudine mvis è data considerando una larghezza di banda pari a 0.4 µm centrata attorno
a λ = 0.6µm, una trasparenza del sistema ottico di 0.5 ed un tempo di integrazione di 1 ms.
79
Risultati comuni delle simulazioni
2
σN
σT2 T
σ02
C
2
2
[µm ]
[µm ]
[µm2 ]
1.3±0.1
(1.64 ± 0.07)10−1 (2.98 ± 0.04)10−3
λc
[µm]
2.20
(K)
1.25
(J)
0.55
(V )
SR N C
0.04 ± 0.01
−2
< 10
10−2
SR T T
0.26 ± 0.01
SR 0
0.9760 ± 0.0003
0.016 ± 0.003
0.9274 ± 0.0009
10−2
0.677 ± 0.003
Tabella 3.2: σN2 C , σT2 T , σ02 , sono le varianze della funzione di aberrazione, rispettivamente,
non corretta, con il solo tilt corretto e ottimale. SR N C , SR T T e SR 0 sono i rapporti di Strehl
corrispondenti.
In Tab. 3.1 sono riportati i valori dei parametri che specificano il sistema che
abbiamo simulato. Sono stati eseguiti due gruppi di simulazioni. Il primo in assenza
di rumore, il secondo con un valore non nullo del rumore fotonico e di lettura (vedi
Par. 3.2.3). In quest’ultimo caso, il valore del numero di fotoni Nphot per zona di
sensing è stato scelto in modo da generare un rapporto segnale-rumore medio pari
a 10. Ciò è stato stimato utilizzando l’Eq. 2.38 in cui si è supposto |∆S|/Stot ≈ 0.5.
In Tab. 3.2 sono riportati i valori che non dipendono dalla configurazione del
(W )
2
2
sensore. Si noti che i valori di σN
C e σT T sono compatibili con i valori teorici ∆1
(W )
e ∆3
dati nella Tab. 1.1. Questa è una ulteriore verifica dell’accuratezza con cui
sono state generate le funzioni di aberrazione.
In Tab. 3.3 sono riportati i valori delle varianze dei residui non corretti della
funzione di aberrazione e i corrispondenti valori di attenuazione del rapporto di
Strehl. Sono forniti i risultati ottenuti dopo il primo e il terzo ciclo di correzione.
A sinistra è presentato il caso in assenza di rumore con δf = 5 cm, a destra il caso
con rapporto segnale-rumore finito e δf = 3 cm. Nell’ultima colonna è ripetuto il
valore di σ02 per permetterne il confronto con σS2 .
80
ciclo
corr.
1
3
λc
[µm]
2.20
(K)
1.25
(J)
0.55
(V )
1
3
1
3
1
3
Simulazioni con
SNR = ∞ e δf = 5 cm
2
σC
σS2
2
[µm ]
[µm2 ]
−2
(1.70 ± 0.09)10
(1.2 ± 0.1)10−2
−3
(8.3 ± 0.2)10
(3.0 ± 0.3)10−3
SR C
0.871 ± 0.007
0.934 ± 0.001
0.65 ± 0.02
0.811 ± 0.004
0.11 ± 0.01
0.338 ± 0.008
SR S
0.909 ± 0.008
0.976 ± 0.002
0.74 ± 0.02
0.927 ± 0.006
0.22 ± 0.03
0.68 ± 0.02
Simulazioni con Nphot = 300,
σron = 5e− /pixel e δf = 3 cm
2
σC
σS2
2
[µm ]
[µm2 ]
−2
(2.5 ± 0.1)10
(2.0 ± 0.2)10−2
−3
(8.8 ± 0.4)10
(3.5 ± 0.5)10−3
SR C
0.81 ± 0.01
0.931 ± 0.001
0.53 ± 0.02
0.800 ± 0.008
0.036 ± 0.008
0.31 ± 0.02
SR S
0.85 ± 0.01
0.972 ± 0.004
0.60 ± 0.03
0.91 ± 0.01
0.07 ± 0.02
0.63 ± 0.04
σ02
[µm2 ]
(2.98 ± 0.04)10−3
SR 0
0.9760 ± 0.0003
0.9274 ± 0.0009
0.677 ± 0.003
Tabella 3.3: Sono riportati i risultati delle simulazioni del sensore a piramide con modulazione
2
di fuoco nel caso senza rumore (a sinistra) e con rapporto segnale-rumore finito (a destra). σC
2
e σS sono le varianze della funzione di aberrazione, rispettivamente, la varianza dei residui di
correzione della funzione di aberrazione e il contributo a quest’ultima dovuto al solo sensore. Sono
riportati, per ognuno, due valori, corrispondenti alla varianza dei residui dopo la prima e la terza
correzione. Nell’ultima colonna è riportata la varianza residua ottimale σ02 per permettere un
confronto immediato con σS2 .
3.3.1
Discussione dei risultati con rapporto segnale-rumore
infinito
Riferendosi ai risultati di Tab. 3.3 ottenuti nel caso senza rumore, si può osservare
che nel primo ciclo di correzione la varianza residua viene abbattuta di un ordine di
grandezza rispetto a σT2 T . Comunque il sistema non riesce a raggiungere la completa
correzione dei 153 polinomi di Zernike, infatti σS2 è circa 4 volte quella ottimale.
Eseguire più cicli di correzione equivale a chiudere il sistema retroazionato. Dopo il
terzo ciclo otteniamo che il valore di σS2 raggiunto è compatibile con il valore ottimale
σ02 . In questo caso l’intero sistema è limitato dal ricostruttore e non dal del sensore,
che, invece, raggiunge il comportamento ottimale.
In Fig. 3.3 è mostrata la dipendenza di σS2 dall’ampiezza di sfocamento δf , nei
primi tre cicli di correzione. Si può notare che al crescere della modulazione del
fuoco, migliora la correzione ottenuta.3 un difetto del campionamento di Questo è
3
La debole crescita per elevati valori di δf è dovuta al campionamento della funzione di aberrazione che inizia ad essere insufficiente per sfocamenti cosı̀ marcati, introducendo un leggero
aliasing.
81
Figura 3.3: Contributo σS2 del sensore alla varianza dei residui di correzione della funzione
di aberrazione dopo il primo, secondo e terzo ciclo di correzione, in funzione dell’ampiezza
δf dello sfocamento applicato. σS2 è espressa in unità di varianza residua ottimale σ02 .
82
Figura 3.4: Varianza σC2 della funzione di aberrazione dopo il primo, secondo e terzo ciclo
2 è espressa in
di correzione, in funzione dell’ampiezza δf dello sfocamento applicato. σC
unità di varianza residua ottimale σ02 .
dovuto al fatto che aumentando δf , si riducono le zone sulla pupilla in cui il sensore
satura (vedi Par. 2.4).
La debole crescita di σS2 che si osserva per alti valori di δf è dovuta
Ovviamente, in presenza di un elevato rapporto segnale-rumore (per esempio nel
caso di una sorgente di riferimento particolarmente brillante) è bene utilizzare la più
grande ampiezza di sfocamento δf possibile.
3.3.2
Discussione dei risultati con rapporto segnale-rumore
finito
In Fig. 3.4 è mostrata la dipendenza di σS2 dall’ampiezza di sfocamento δf , nel caso
in cui abbiamo introdotto il rumore nella simulazione.
Come nel caso precedente, per valori bassi di δf si ottengono scarse correzioni del
fronte d’onda, poichè il sensore è in una condizione di forte saturazione. A differenza
83
del caso senza rumore, invece, è presente un evidente punto di minimo, oltre il quale
σS2 tende a crescere. Tale punto fornisce l’ampiezza ottimale δfopt dello sfocamento
da utilizzare. L’esistenza di tale comportamento è stata già discussa nel Par. 2.4.1,
in cui abbiamo dimostrato che il sensore, in presenza di rumore, non fornisce misure
accurate per valori di sfocamento molto maggiori a quelli di saturazione.
Il valore assunto da δfopt dipende dal ciclo di correzione raggiunto e, in generale,
dai valori assunti per Nphot e σron . Il sensore che abbiamo sviluppato, comunque, permette di variare δf (e dunque il sensibilità) in modo semplice e continuo. Sfruttando
questa capacità, il sensore a piramide con modulazione di fuoco può lavorare sempre
nelle condizioni migliori, ottimizzando la risposta dell’intero sistema adattivo.
Per fare un esempio, dopo tre iterazioni, il sensore raggiunge le prestazioni
migliori solo per δf ≈ 3 cm. Questa è la condizione riportata in Tab. 3.3, in cui
si può notare che σS2 è compatibile con il valore ottimale σ02 . Anche in questo caso
le prestazioni del sistema adattivo sono limitate dal ricostruttore e non dal sensore,
che può raggiungere questa condizione modulando opportunamente l’ampiezza di
sfocamento.
Se le condizioni di osservazione cambiano, ad esempio la turbolenza atmosferica
evolve troppo rapidamente, è più probabile che si raggiunga il risultato descritto dal
primo ciclo di correzione. In questo caso, per ottenere un comportamento ottimale
del sensore, è sufficiente impostare uno sfocamento diverso (δf ≈ 5 cm).
I risultati delle simulazioni, dunque, hanno dimostrato che il sensore può raggiungere ottimi livelli di correzione, sia nel caso con SNR tendente all’infinito, che
nel caso con SNR finito (≈ 10). In particolare il sistema adattivo può raggiungere
uno stato operativo in cui il sensore introduce errori minori del ricostruttore.
Per finire, le simulazioni in presenza di rumore hanno permesso di evidenziare le
caratteristiche di flessibilità del sensore a piramide. La possibilità di modificare in
modo semplice il sensibilità, permette di adattare il sensore a condizioni diverse di
lavoro, massimizzando l’efficienza del sistema adattivo.
84
Capitolo 4
Realizzazione del sensore a
piramide con modulazione di
fuoco.
Nel capitolo 2 abbiamo descritto il principio di funzionamento del sensore a piramide
con modulazione di fuoco. Abbiamo, inoltre, confrontato le caratteristiche del nostro
sensore, con quello più usato in sistemi ottici adattivi per uso astronomico (sensore
di Shack-Hartmann). Ciò ha permesso di evidenziare la sostanziale equivalenza tra i
due in termini di accuratezza e sensibilità, ma la maggiore flessibilità del primo per
la possibilità di controllare, in modo semplice, la sensibilità e il numero delle zone
di sensing. Nel capitolo precedente abbiamo verificato, per mezzo di simulazioni, il
buon comportamento del dispositivo come sensore per fronti d’onda aberrati dalla
turbolenza atmosferica. Abbiamo voluto, a questo punto, verificare la realizzabilità
di tale sensore, sviluppandone un primo prototipo con il materiale a disposizione del
laboratorio di ottiche adattive dell’Osservatorio di Arcetri.
In questo capitolo descriveremo l’apparato sperimentale sviluppato per lo studio
del sensore e nel successivo i risultati che abbiamo ottenuto.
4.1
Apparato sperimentale
L’apparato sperimentale utilizzato può essere diviso in tre parti fondamentali:
85
CCD
LC
M1
Lo
M2
L1
P2
S’
P1
F’
S
L4
M3
A
F
M5
M4
L3
Laser He-Ne
Figura 4.1: Schema dell’apparato sperimentale.
• l’ottica che produce le aberrazioni da misurare, composta essenzialmente da
una sorgente puntiforme e una lente che ne crea una immagine aberrata;
• il sensore di fronte d’onda vero e proprio, i cui componenti principali sono la
membrana vibrante (per introdurre la modulazione di fuoco), un componente
ottico equivalente alla piramide e un dispositivo di rivelazione (che chiameremo
più concisamente camera) con la sua elettronica di controllo e acquisizione;
• il software di ricostruzione della funzione di aberrazione.
In Fig. 4.1 è schematizzata la configurazione ottica che abbiamo utilizzato. Descriveremo rapidamente l’intero sistema, per poi tornare in maggior dettaglio sugli
elementi di maggior interesse. La radiazione emessa da un laser (He-Ne) è raccolta
da una fibra che forma una sorgente puntiforme in S. Il fascio generato è riflesso
dallo specchio M1 verso una lente L1 , che crea l’immagine della sorgente in S . La
lente che segue (Lo ), dopo due riflessioni in M2 e M3 , focalizza il fascio in F. La lente
Lo può ruotare intorno ad un suo diametro, in modo da poter “vedere” la sorgente
fuori asse e introdurre aberrazioni crescenti con l’angolo di rotazione. Con l’elemento
86
ottico successivo ha inizio il sensore. La lente L3 ha il fuoco in F in modo da produrre un fascio collimato e, contemporaneamente, una immagine della pupilla sulla
membrana riflettente M4 . Tale membrana può essere messa in vibrazione tramite
un’onda acustica prodotta dall’altoparlante A, cosı̀ da produrre la modulazione di
fuoco richiesta. Il fascio, riflesso da M4 , è inviato allo specchio M5 , che lo devia verso
la lente L4 , la quale ricrea il fuoco in F . In questo punto è posto il bordo del prisma
P1 , che sostitisce, in questa applicazione, la funzione della piramide. Questo dispositivo, che verrà descritto in maggior dettaglio in seguito, separa il fascio originale in
due fasci che sono resi paralleli da un secondo prisma (P2 ), uguale e simmetrico al
primo. I due fascetti raggiungono un obiettivo (zoom) fotografico, schematizzato con
la lente LC , che riproduce due immagini della pupilla di uscita di Lo su un rivelatore
panoramico a scorrimento di carica (charge coupled device o CCD).
I dati acquisiti dal CCD sono elaborati dal calcolatore che ricostruisce la funzione
di aberrazione sul piano della pupilla di uscita di Lo .
4.2
L’ottica che produce le aberrazioni
La lente Lo utilizzata è una piano convessa con focale fo = 150 mm diaframmata
a Do = 10 mm. La sorgente S è stata posta sull’asse ottico di Lo in modo che
producesse il miglior fuoco in F a circa 150 cm di distanza. Ciò comporta che la
lente lavori ad un ingrandimento Mo ≈ 9. Abbiamo montato la faccia convessa verso
la sorgente (dove il fascio è più aperto) per aumentare le aberrazioni introdotte.
In Tab. 4.1 sono riportate le specifiche del laser utilizzato per generare la sorgente.
Perché il sensore funzioni nel migliore dei modi, è necessario che la sorgente S non
sia risolta da Lo e nello stesso tempo illumini la pupilla della lente con sufficiente
omogeneità. La prima condizione impone che la largezza della PSF, limitata dalla
diffrazione, non sia minore della larghezza dell’immagine di S . In formule
< qo λ ,
Mo lS ∼
D
(4.1)
o
dove lS è la dimensione lineare della sorgente S , qo la distanza di F da Lo e
87
Laser He-Ne
Produttore:
Modello:
λ utilizzata:
potenza minima in uscita:
polarizzazione:
diametro fascio (1/e2 ):
divergenza del fascio:
rumore in ampiezza:
Particle Measuring Systems - USA
LSTP-0010
0.6328 µm
0.5 mW
lineare (500-1)
0.76 mm
0.9 mrad
< 1% rms, 30 Hz÷10 MHz
Tabella 4.1: Caratteristiche tecniche del laser utilizzato per generare la sorgente.
λ = 0.6328 µm è la lunghezza d’onda emessa dal laser (He-Ne) utilizzato. Dal< 11 µm. Per ottenere una sorgente di queste dimensioni,
l’Eq. 4.1 otteniamo lS ∼
abbiamo utilizzato una fibra da 10 µm di diametro accoppiata otticamente con il
laser. Ponendo la fibra direttamente in S , comunque, non è semplice ottenere un
accoppiamento fibra-laser che permetta di illuminare la pupilla di Lo con sufficiente
omogeneità. Per questo motivo abbiamo utilizzato la lente L1 (focale f1 = 50 mm
e diaframmata a 10 mm) per formare una immagine della fibra in S . Questo ci ha
permesso di allontanare la sorgente fino a che l’illuminazione della pupilla di L1 (e
di conseguenza di Lo ) non risultasse omogenea. Abbiamo utilizzato il programma di
disegno ottico ZEMAX (Focus Software Inc., Tucson, AZ, USA) per controllare che
l’immagine ottenuta da L1 in S verifichi ancora la condizione 4.1. Abbiamo stimato
che più del 90% dell’energia è compresa in un cerchio di raggio 10 µm, se la sorgente
è allineata con un fuori asse massimo di 1 grado.
Per modulare le aberrazioni introdotte da Lo , la lente è posta su uno stelo fissato
ad una piattaforma che può ruotare, in modo da far lavorare la lente fuori asse. La
rotazione è regolata da un micrometro il cui nonio permette di apprezzare 15 primi
di grado.
88
4.3
La membrana vibrante
Il dispositivo che modula lo sfocamento è costituito da due tubi di metallo inseriti
uno nell’altro e mantenuti aderenti interponendovi una guarnizione. Ad una estremità è fissato un altoparlante (tweeter); dall’altra il supporto su cui è tesa la
membrana alluminata M4 . Poiché la lunghezza del tubo può essere modificata, ciò
permette di regolare la frequenza di risonanza del dispositivo.
Il tweeter ha una frequenza di taglio superiore di 4 kHz (12 dB/ottava) e al suo
ingresso è collegato un generatore di segnali sinusoidali (opportunamente amplificato).
La membrana a nostra disposizione è stata prodotta dalla National Photocolor
(USA) ed è costituita da una pellicola circolare di ETP dello spessore di 2 µm,
fissata e mantenuta tesa al bordo da un supporto di alluminio. L’area utile alluminata è di 6 mm, ma imperfezioni sulla superficie ne limitano l’uso ad una regione
centrale di circa 2 mm di diametro. Abbiamo, perciò, scelto la lente L3 con una
focale f3 = 250 mm in modo da collimare il fascio e creare una immagine della
pupilla sulla membrana con un diametro di circa 1.7 mm. Con diametri maggiori,
la membrana introduce un evidente astigmatismo dovuto a difetti della planarità in
condizioni di riposo. Poichè la data di fabbricazione dell’oggetto in questione risale
al 1992, i difetti descritti potrebbero avere origine dalla deformazione del supporto
o, più probabilmente dalla parziale perdita delle qualità elastiche. La qualità della
pellicola ha introdotto serie limitazioni nell’utilizzo del sistema, come sarà mostrato
nel capitolo dedicato alla discussione dei risultati sperimentali.
4.4
Il doppio prisma
In questo primo stadio di sviluppo, il sensore verrà utilizzato per misurare aberrazioni statiche. Per questo motivo, non è essenziale ottenere misure simultanee delle
derivate della funzione di aberrazione W lungo i due assi x e y. Possiamo, per il momento, sostituire la piramide con un prisma, che risulta di più semplice fabbricazione
89
(d)
(a)
(B)
a)
(c)
(b)
(A)
(C)
(D)
(c)+(d)
(A)+(B)
(a)+(b)
b)
(C)+(D)
(a)+(d)
(b)+(c)
(B)+(C)
(A)+(D)
c)
x
y
z
Figura 4.2: Configurazioni del prisma necessarie per ottenere il gradiente del fronte
d’onda ed equivalenza con l’utilizzo della piramide.
90
12
m
m
d
F′
P1
P2
Figura 4.3: Schema del sistema a doppio prisma utilizzato nel sistema prototipo.
Variando d è possibile variare la separazione dei due fasci in uscita che risulta essere
una quantità critica nel disegno ottico utilizzato
e immediata reperibilità. Come è mostrato in Fig. 4.2, per ottenere informazioni su
entrambe le derivate, è necessario acquisire i dati con due misure successive, corrispondenti a due orientazioni ortogonali del bordo del prisma. La configurazione in
Fig. 4.2b permette di stimare ∂W/∂yo , mentre quella in Fig. 4.2c permette di stimare ∂W/∂xo . L’insieme delle informazioni cosı̀ ottenute sono equivalenti a quelle
fornite da una piramide.
Il bordo del prisma deve essere posto nel fuoco di Lo o in una sua immagine.
Per questo motivo, il fascio riflesso dalla membrana M4 è stato fatto convergere in
F per mezzo della lente L4 di focale f4 = 300 mm. Abbiamo utilizzato una coppia
di prismi retti, come mostrato in Fig. 4.3. Il primo (P1 ) ha il bordo in F e separa
il fascio in direzione ortogonale al bordo stesso. I due fascetti ottenuti sono resi
paralleli dal secondo prisma (P2 ), che assume una posizione simmetrica rispetto alla
base del primo. La distanza d tra le basi dei due prismi regola la separazione tra i
fasci e dunque la distanza tra i centri delle immagini di Lo sul CCD.
Il supporto su cui è posto P1 è fisso, mentre quello di P2 è montato su una slitta
micrometrica in modo da poter variare d con facilità. L’insieme dei due prismi può
ruotare intorno ad un asse parallelo all’asse ottico per mezzo di un rotatore, il cui
91
Rivelatore per immagini ad alta frequenza di acquisizione
Produttore:
DALSA Inc. - Canada
Modello:
CA-D1-0064 Turbosensor
Sensore:
CCD IA-D1-0064 Turbosensor
dimensioni area sensibile:
1024x1024 mm
numero di pixel:
64x64
dimensione del pixel:
16 µm
uscita:
analogica
tasso max. di acquisizione:
2900 immagini/s
tensione di saturazione:
-2000 mV
rms rumore in uscita :
3 mV
intervallo dinamico:
667:1
risposta (λ = 650 µm):
44 V/µJ/cm2
non-unifiormità della risposta
dei pixel (picco-picco):
60 mV (in 1V medio)
Tabella 4.2: Caratteristiche tecniche della camera utilizzata. L’intervallo dinamico è calcolato
come il rapporto tra la tensione di saturazione e la rms di rumore. La risposta è data per la
lungezza d’onda di picco dell’efficienza quantica (λ ≈ 0.7 µm). Per λ = 0.633 µm la risposta è
circa 5 V/µJ/cm2 . Le caratteristiche del sensore si riferiscono ad una frequenza di uscita dei dati
a 8 MHz (1450 immagini/s) e ad una temperatura di esercizio di 25 C.
nonio apprezza fino a 15 primi di grado. Infine, l’intero dispositivo può traslare, con
movimenti micrometrici, in direzioni ortogonali all’asse ottico.
4.5
La camera
Per poter acquisire le immagini della pupilla di uscita di Lo , abbiamo utilizzato una
camera prodotta dalla DALSA Inc., Waterloo, Ontario, (Canada), con un obiettivo
fotografico prodotto dalla SIGMA Corporation, Tokyo, (Giappone).
L’obiettivo è uno zoom la cui focale può essere impostata tra 70 mm e 210 mm.
Questo permette di modificare, in modo semplice e rapido, l’ingrandimento con cui
sono riprodotte le immagini della pupilla di Lo sul sensore della camera.
In Tab. 4.2 sono riportate le caratteristiche della camera DALSA e del sensore
incorporato certificate dal produttore. Abbiamo scelto questa camera per la velocità
con cui riesce ad acquisire le immagini (fino a 2900 immagini/s). Questa caratteristica, infatti, risulta essere fondamentale in previsione dei successivi stadi di sviluppo
92
del sistema, che ne permetteranno l’uso come sensore di fronte d’onda in un sistema
adattivo, quando lo specchio correttore sarà disponibile.
Il sensore utilizzato dalla camera è un CCD con 64x64 elementi fotosensibili (o
pixel). Alla fine di un periodo di integrazione, l’informazione accumulata nei pixel
dell’area sensibile è trasferita rapidamente, facendola scorrere per righe, in una zona
di immagazzinamento del CCD composta da 64x64 celle.1 In questo modo, i dati
possono essere letti da questa zona e contemporaneamente gli elementi fotosensibili possono integrare per ottenere la successiva immagine. La lettura della zona
di immagazzinamento avviene come in un comune CCD. Le righe scorrono verso
una porta di trasferimento (o transfer gate) da cui, una per una, si trasferiscono
ad un registro di lettura di 64 celle. Il contenuto di ogni cella del registro scorre
verso un’uscita, dove l’informazione viene convertita in una differenza di potenziale,
amplificata e inviata, sequenzialmente, all’uscita analogica della camera.
Quando il processo di lettura è conluso, ricomincia un nuovo ciclo. In questo
modo il periodo di integrazione coincide con il tempo necessario per la lettura della
zona di immagazzinamento.
Per gestire la camera, abbiamo utilizzato una scheda di acquisizione per PC
che permette di controllare il tempo di integrazione (cioè la frequenza di clock che
regola la lettura del CCD) e convertire il segnale in uscita dalla camera da analogico a
digitale. La scheda in questione è una Raptor RAP-VL-VS-4 prodotta dalla BitFlow,
Inc., Woburn, MA (USA) ed è stata montata su un PC a 66 MHz. In questa
configurazione, è possibile acquisire immagini digitali a 8-bit (256 livelli) con una
frequenza che va da 570 a 2800 immagini/s.
Il fattore di conversione da unità analogiche a unitá digitali (Analog to Digital
converter Units o ADU) vale 3.9 mV/ADU. In questo modo 1 ADU corrisponde ad
un valore maggiore del rumore del segnale analogico (3 mV rms). Inoltre il massimo
valore digitale (255 ADU) corrisponde a circa 1 V di segnale analogico, cioè metà del
valore di saturazione, garantendo la linearità del sensore nell’intervallo digitalizzato.
1
Il tempo di traferimento è dell’ordine di 10 µs.
93
Figura 4.4: Interfaccia utente del programma XDALSA.
4.6
Il “software”
In Fig. 4.4 è mostrata l’interfaccia utente del programma XDALSA che abbiamo
sviluppato per eseguire le seguenti funzioni
• controllo della scheda di acquisizione;
• visualizzazione e memorizzazione delle immagini ottenute con il CCD;
• ricostruzione modale della funzione di aberrazione.
Il programma è stato sviluppato nel linguaggio IDL (Interactive Data Language) della RSI (Research Systems, Inc., Boulder, CO, (USA)), integrando alcune procedure
della libreria fornita dalla BitFlow per il controllo della scheda.
Il programma permette di impostare la frequenza di lettura del CCD e trasferire,
ad intervalli regolari, un’immagine digitalizzata dalla memoria della scheda a quella
del PC, permettendone la visualizzazione e l’elaborazione.
Prima di eseguire la ricostruzione di una funzione di aberrazione, è necessario
fornire al programma i dati necessari per individuare il centro e il raggio delle quattro
94
immagini, sul CCD, della pupilla di Lo (vedi Fig. 4.2b e 4.2c). Il programma ottiene
queste informazioni da quattro acquisizioni, ognuna delle quali contiene una sola
immagine della pupilla, ottenuta facendo traslare il prisma in modo che il fascio
incida su una sola faccia per volta.
Dopo questa operazione preliminare, il bordo del prisma è portato nuovamente
sul fuoco F . In questo modo il programma permette di memorizzare le immagini
ottenute con il bordo parallelo all’asse x e, ruotando il supporto dei prismi di 90
gradi, con il bordo parallelo all’asse y. Sfruttando i dati ottenuti in precedenza, il
programma estrae le quattro sottoimmagini contenenti le pupille, i cui centri coincidono con quelli delle sottoimmagini stesse. Con riferimento alla Fig. 4.2, indicheremo
le matrici associate alle sottoimmagini con Sa+d , Sb+c , Sa+b e Sc+d .
Le Eqq. 2.29 e 2.30 possono essere riscritte nella forma
∂W
∂x0
∂W
∂y0
kl
kl
Sa+d,kl − Sb+c,kl
∝ |k − k0 | sin
Sa+d,kl + Sb+c,kl
Sa+b,kl − Sc+d,kl
∝ |l − l0 | sin
Sa+b,kl + Sc+d,kl
(4.2)
,
(4.3)
dove k e l sono gli indici di riga e di colonna delle matrici S e k0 e l0 sono gli indici
del pixel che contiene i centri delle pupille.
Poiché le sottoimmagini da sommare o sottrarre sono sovrapposte pixel per pixel,
i centri delle pupille possono non coincidere perfettamente. Facendo corrispondere
le zone di sensing ai pixel, l’errore di centratura potrebbe raggiungere la dimensione
della zona di sensing stessa. Per contenere questo effetto, è necessario posizionare
con cura le immagini delle pupille sulla griglia degli elementi sensibili del CCD.
Inoltre, il programma riduce le matrici delle derivate stimate, prima di passarle al
ricostruttore, a matrici con dimensioni dimezzate, in cui ogni elemento è la media di
un quardante 2x2 dell’originale. In questo modo, il numero di zone di sensing N sul
diametro della pupilla si riduce di un fattore due, ma l’errore di centraggio risulta
piú contenuto in termini di zone di sensing. Le matrici delle derivate cosı̀ ottenute,
sono passate ad una procedura di ricostruzione modale, che restituisce i coefficienti
95
dei polinomi di Zernike associati alla funzione di aberrazione. Tale procedura è del
tutto simile a quella descritta nel Par. 3.2.4.
Si noti che le relazioni 4.2 e 4.3 sono definite a meno di una costante di proporzionalità, che dipende soltanto dall’ampiezza di sfocamento δf e dal fattore di
ingrandimento con cui è riprodotta la pupilla di Lo sul CCD. Poiché l’operazione
di ricostruzione è lineare, anche i coefficienti di Zernike ottenuti avranno la stessa caratteristica. Per avere misure assolute, è sufficiente quantificare il defocus
introdotto dalla membrana vibrante nelle condizioni di misura. Per i nostri scopi,
comunque, sarà sufficente ottenere misure relative con cui eseguire una prima verifica
del comportamento del sensore.
96
Capitolo 5
Risultati sperimentali e loro
discussione
L’apparato sperimentale, descritto nel precedente capitolo, permette una misura
dei coefficienti dello sviluppo in polinomi di Zernike della funzione di aberrazione
W , introdotta dalla lente Lo . Ciò rende possibile valutare in modo semplice il
comportamento del prototipo di sensore di fronte d’onda a sfocamento che abbiamo
sviluppato. Come descritto nel Par. 4.2, la lente Lo può ruotare intorno ad un asse
verticale di un angolo noto. La lente, lavorando fuori asse, introduce aberrazioni che
crescono, all’aumentare dell’angolo di rotazione, con leggi conosciute. La verifica di
tali leggi permetterà una prima stima della funzionalità del sensore.
5.1
Oggetto della misura
Utilizzando la stessa notazione descritta nel Cap. 3, possiamo sviluppare W in serie
di polinomi ortogonali di Zernike, ottenedo
W (Rξo , Rηo ) =
∞
wj Zj (ξo , ηo ) ,
(5.1)
j=2
dove, ricordiamo, (ξo , ηo ) sono le coordinate sul piano della lente, normalizzate al
raggio R della pupilla. I contributi con j = 2 e j = 3 (tilt globale, vedi App. B)
esprimono un errore di centraggio del bordo del prisma sull’immagine aberrata della sorgente in F . Il termine con j = 4 (sfocamento) rappresenta un errore della
97
posizione lungo l’asse ottico del bordo del prisma rispetto al piano di miglior fuoco. Questi tre contributi possono essere resi trascurabili rispetto agli altri termini,
scegliendo con attenzione la posizione del bordo del prisma. Nel nostro caso, in cui
abbiamo una lente con la sorgente fuori asse di un angolo che indicheremo con α, la
teoria prevede che solo alcuni dei termini successivi siano non nulli o predominanti
[Mahajan, 1991, Par. 2.3]. Tali termini sono1
• astigmatismo lungo gli assi (j = 6), con w6 ∝ α2 ;
• coma in direzione x (j = 7), con w7 ∝ α;
• aberrazione sferica (j = 11), con w11 costante rispetto a α.
5.2
Acquisizione delle misure
La frequenza di acquisizione delle immagini è stata impostata al minimo valore
disponibile (574 immagini/s), mentre la membrana è stata fatta oscillare a 1.78 kHz.
In questo modo il tempo di esposizione di ogni immagine è pari a circa 3.1 periodi di
oscillazione della membrana, commettendo un errore di circa il 3% rispetto ai segnali
acquisiti in un numero intero di periodi. Per ridurre notevolmente questo errore,
abbiamo eseguito una media su 100 acquisizioni prima di memorizzare l’immagine.
Ciò permette anche di migliorare il rapporto segnale-rumore rispetto alla singola
acquisizione di un fattore 10.
Ricordiamo che, al presente stadio di sviluppo, il ricostruttore fornisce i coefficienti di Zernike, associati alla funzione di aberrazione, a meno di un fattore
proporzionale all’ampiezza δf dello sfocamento. Per questo motivo è necessario
mantenere δf costante, cosı̀ da poter confrontare i dati ottenuti tra loro. Poiché
le vibrazioni tendono ad evidenziare i difetti della membrana a nostra disposizione
(vedi par. 4.3), l’ampiezza delle oscillazioni non potrà superare una certa soglia, che
determinerà, quindi, un limite superiore per le aberrazioni che potremo misurare
1
il termine di curvatura di campo non è considerato perché è assimilabile ad uno sfocamento
(j = 4) variabile con l’angolo α di fuori asse.
98
(vedi Par. 2.4) Per assicurarsi che δf non sia superiore a questa soglia, abbiamo
impostato la massima ampiezza di oscillazione in modo da produrre un’immagine al
fuoco F senza evidenti asimmetrie.
Lo zoom della camera è stato configurato in modo da fornire immagini della
pupilla Lo sul CCD aventi un diametro di 23 pixel (368 µm). Per quanto descritto
nel capitolo precedente, ciò comporta un numero di zone di sensing sul diametro
della pupilla pari a N = 12. Tale valore è più che sufficiente a ricostruire i primi
15 polinomi di Zernike, che contengono tutte le aberrazioni a cui siamo interessati
(vedi Par. 3.2.4).
Abbiamo misurato i coefficienti di Zernike della funzione di aberrazione generata
da L0 , impostando α = 0.0, 1.0, 1.5, 2.0, 2.5 e 3.0 gradi. Per valori maggiori gli effetti
di saturazione compromettevano la risposta del sensore.
Per ogni valore dell’angolo α, abbiamo, innanzi tutto, posto il bordo del prisma
P1 sul piano del miglior fuoco. Ciò è stato ottenuto con correzioni successive della
posizione del supporto del doppio prisma lungo l’asse ottico, in base al valore del
coefficiente associato allo sfocamento (w4 ), ottenuto ricostruendo ogni volta la funzione di aberrazione. Abbiamo considerato sufficiente ridurre w4 a circa un decimo
del valore di w11 (aberrazione sferica).
Una simile operazione è stata ripetuta anche per il tilt (w2 e w3 ), anche se con
tolleranze maggiori, perché la posizione dei prismi non era perfettamente riproducibile in seguito alla rotazione necessaria per la misura delle derivate su entrambi
gli assi.2
Conclusa l’operazione di allineamento del prisma P1 , abbiamo ottenuto i coefficienti dei primi 15 polinomi di Zernike ricostruiti, dalla media di 5 prove. Ad ogni
coefficiente, abbiamo associato un errore pari alla standard deviation. In Fig. 5.1
sono mostrati i grafici dei risultati per i coefficienti wj con j = 5, 6, 7, 8, 11, che
rappresentano, nell’ordine
• astigmatismo a 45 gradi dagli assi (o, più brevemente, astigmatismo ×);
2
Si ricordi che i polinomi di Zernike sono ortogonali. Per cui, ad esempio, la presenza di un
termine residuo di tilt, non dovrebbe disturbare la ricostruzione degli altri modi.
99
Figura 5.1: Grafici degli andamenti dei coefficienti di Zernike con l’angolo α di rotazione
della lente. Per ognuno è mostrato il miglior fit dei dati con una retta, tranne nel caso
dell’astigmatismo +, per il quale è riportato il miglior fit dei dati con una parabola.
100
Coma x
w7 = a 7 + b 7 α
a7 = −0.05 ± 0.01 U/grado
b7 = 0.200 ± 0.005 U/grado
χ27 = 1.4
P (χ2 > χ27 ) = 85%
Coma y
w8 = a8 + b8 α
a8 = −0.024 ± 0.007 U/grado
b8 = 0.007 ± 0.004 U/grado
χ28 = 31
Tabella 5.1: Risultati del miglior fit dei dati del coma x e coma y. Il simbolo U indica le unità
arbitrarie con cui il ricostruttore esprime i risulatati.
• astigmatimo lungo gli assi (astigmatismo +);
• coma lungo x;
• coma lungo y;
• aberrazione sferica.
5.3
Discussione dei risultati
Nei grafici di Fig. 5.1, abbiamo riportato il miglior fit dei dati con una retta, tranne
che per l’astigmatismo +, per il quale abbiamo sovrapposto ai dati il migliore polinomio di secondo grado. Con una prima analisi qualitativa, si può affermare che il
sensore riconosce le aberrazioni introdotte nel sistema in modo corretto. In particolare non confonde le aberrazioni che devono rimanere pressochè nulle con quelle
che devono crescere con l’angolo α. Il coma x cresce con una legge lineare, mentre
il coma y fluttua intorno allo zero. La sferica è sensibilmente non nulla e pressoché
costante. L’astigmatismo + cresce in modo evidente rispetto all’astigmatismo ×.
Il sensore risulta essere particolarmente efficiente nel riconoscere il coma, anche
dal punto di vista quantitativo. In Tab. 5.1 sono riportati i risultati del miglior fit
ottenuto. Il simbolo U indica le unità arbitrarie con cui il ricostruttore fornisce i
risultati. Per quanto riguarda il coma x, l’andamento lineare dei dati è garantito
con un’elevata affidabilità, mentre per il coma y gli errori sembrano sottostimati per
garantirne una compatibilità con lo zero. In ogni caso, il valore picco-picco della
101
w6 = c 6 α 2
c6 = (6.5 ± 0.4)10−3 λ/grado2
w7 = b 7 α
b7 = (2.0 ± 0.1)10−2 λ/grado
w11 = (1.9 ± 0.1)10−2 λ
Tabella 5.2: relazioni tra i coefficienti di aberrazione di astigmatismo +, coma x e aberrazione
sferica in funzione dell’angolo di fuori asse della lente Lo . I valori numerici sono stati ottenuti con
ZEMAX.
dispersione dei dati del coma y risulta essere inferiore al 2% del valore picco-picco
che assume il coefficiente di Zernike per il coma x.
Utilizzando il programma di progettazione ottica ZEMAX della Focus Software,
Inc. (USA) è possibile calcolare i coefficienti wj , fornendo al programma i dati della
lente Lo e della configurazione in cui lavora. Per una lente sottile, valgono le relazioni
[Mahajan, 1991, Par. 2.3]
Do2
fo d2F
Do3
∝
fo2 dF
Do4
∝
,
fo3
w6 ∝
(5.2)
w7
(5.3)
w11
(5.4)
dove Do e fo sono il diametro e la focale della lente Lo e dF è la sua distanza dal punto
immagine F . Queste relazioni permettono di stimare gli errori sui coefficienti w6 ,
w7 e w11 ottenuti con il programma ZEMAX, una volta conosciute le incertezze sui
parametri Do , fo e dF . La casa produttrice della lente (Newport, USA) garantisce
fo a meno del 1%, il diaframma è stato fabbricato con una tolleranza del decimo di
mm (1% di Do ) e abbiamo misurato dF con un errore del 2%. Con questi dati si
ottiene un’incertezza del 7% per i tre coefficienti w6 , w7 e w11 , riportati in Tab. 5.2.
Dal confronto del parametro b7 misurato e quello ottenuto con il programma
ZEMAX, possiamo tarare il sensore, ottenendo il fattore di conversione (0.10 ±
0.01) λ/U. Questo risultato ci permette di stimare che stiamo lavorando con aberrazioni i cui valori per w (cioè per W rms) sono inferiori a λ/16 (che corrisponde
a circa λ/3 picco-picco di W per coma o astigmatismo). In queste condizioni non
102
è facile garantire che piccoli errori di allineamento o aberrazioni introdotte da elementi ottici tra Lo e il prisma non producano effetti sensibili. Ad esempio le misure
del coefficiente di aberrazione sferica forniscono w11 = (2.9 ± 0.4)10−2 λ, mentre il
valore stimato con ZEMAX è w11 = (1.9 ± 0.1)10−2 λ. I due valori risultano essere
incompatibili, facendo supporre che qualche elemento ottico introduca un contributo
non previsto al termine di aberrazione sferica dell’ordine di λ/100.
In modo simile il coefficiente di astigmatismo presenta una soglia non prevista
(dell’ordine di λ/100), riscontrabile per α = 0 gradi, e un andamento non perfettamente in accordo con l’andamento teorico. Questi ultimi effetti sono imputabili,
molto probabilmente, ai difetti di planarità della membrana che abbiamo già discusso.
In conclusione, le misure eseguite provano che il sensore riconosce in modo evidente le aberrazioni inserite. Comunque le limitazioni introdotte dalla qualità della
membrana a nostra disposizione ci hanno costretto a lavorare in un intervallo dei
coefficienti di W confrontabile con alcuni errori sistematici di difficile eliminazione.
Ciò ha comunque permesso una verifica quantitativa delle leggi con cui le aberrazioni di una lente crescono con l’aumentare dell’angolo di fuori asse della sorgente,
sopratutto per il coma, la cui legge è verificata con elevata affidabilità.
103
Conclusioni
Il lavoro di tesi ha avuto come scopo lo sviluppo di un nuovo tipo di sensore di fronte
d’onda per ottiche adattive basato sul test di Foucault. Il lavoro svolto è divisibile
in due parti. La prima, consistente in uno studio di tipo analitico e numerico del
sensore, ha mostrato la notevole flessibilita dello strumento in termini di campionamento spaziale e sensibilità della misura del fronte d’onda, caratteristica superiore a
quella dei sensori attualmente esistenti. La seconda, consistente nella realizzazione
ed analisi del comportamento di un prototipo da banco ottico di tale sensore, ha
mostrato come lo strumento sia capace di misurare aberrazioni aventi caratteristiche
simili a quelle prodotte dalla turbolenza atmosferica.
Questi risultati mostrano, quindi, la possibilità di utilizzare con successo il
sensore in sistemi ottici adattivi per uso astronomico.
104
Appendice A
Proprietà delle trasformate di
Fourier
1. Teorema di linearità. F{αg + βh} = αF{g} + βF{h}; cioè, la trasformata
della somma di due funzioni è semplicemente la somma delle loro trasformate
individuali.
2. Teorema di similarità. Se F{g(x, y)} = G(kx , ky ), allora
kx ky
1
G
,
F{g(ax, by)} =
| ab |
a b
cioè, un allargamento delle coordinate nel dominio dello spazio (x, y) determina
una contrazione delle coordinate nel dominio delle frequenze (kx , ky ), più un
cambio nell’ampiezza complessiva dello spettro.
3. Teorema dello spostamento. Se F{g(x, y)} = G(kx , ky ), allora
F{g(x − a, y − b)} = G(kx , ky )exp[−j2π(kx a + ky b)]
cioè, uno spostamento nel dominio dello spazio introduce uno spostamento
lineare della fase nel dominio delle frequenze.
4. Teorema di Parseval. Se F{g(x, y)} = G(kx , ky ), allora
∞
−∞
2
| g(x, y) | dx dy =
∞
−∞
| G(kx , ky ) |2 dkx dky
Questo teorema è generalmente interpretabile come un teorema sulla conservazione dell’energia.
105
5. Teorema della convoluzione. Se F{g(x, y)} = G(kx , ky ) e F{h(x, y)} = H(kx , ky )
allora
F
∞
−∞
g(ξ, η)h(x − ξ, y − η) dξ dη = G(kx , ky )H(kx , ky )
(A.1)
La convoluzione di due funzioni nel dominio dello spazio (un’operazione che
sarà trovata risultare frequentemente nella teoria dei sistemi lineari) è interamente equivalente alla più semplice operazione di moltiplicazione delle loro
trasformate individuali.
6. Teorema dell’autocorrelazione. Se F{g(x, y)} = G(kx , ky ), allora

 ∞
F
−∞


g(ξ, η)g
(ξ − x, η − y) dξ dη  =| G(kx , ky ) |2
(A.2)
Similmente,
2
F{| g(ξ, η) | } =
∞
G(ξ, η)G
(ξ − kx , η − ky ) dξ dη
−∞
Questo teorema può essere pensato come un caso speciale del teorema della
convoluzione.
7. Teorema integrale di Fourier. In ogni punto di continuità di g
FF −1 {g(x, y)} = F −1 F{g(x, y)} = g(x, y)
In ogni punto di discontinuità di g, le due trasformate successive producono
la media dei valori di g in un intorno di quel punto. Cioè, le trasformazioni
successive ed inverse di una funzione producono nuovamente quelle funzioni,
ad eccezione dei punti di discontinuità.
106
Appendice B
Polinomi di Zernike
Nel presente lavoro utilizziamo la definizione dei polinomi di Zernike Zj proposta
da Noll [Noll, 1976]. I polinomi Zj costituiscono una base ortogonale per le funzioni
definite su un cerchio di raggio unitario e sono definiti, in coordinate polari (r, ϕ),
dalle seguenti relazioni
√
 √
m

 √n + 1Rn (r)√2 cos(mϕ) se j pari e m = 0
Zj = √n + 1Rnm (r) 2 sin(mϕ) se j dispari e m = 0 ,


n + 1Rn0 (r)
se m = 0
(B.1)
dove la parte radiale Rnm (r) è data da
(n−m)/2
Rnm (r) =
s=0
(−1)s (n − s)!
rn−2s .
s![(n + m)/2 − s]![(n − m)/2 − s]!
(B.2)
I valori di n (grado radiale) e m (frequenza azimutale) sono interi (≥ 0) e soddisfano
le relazioni m ≤ n e n − m pari. L’indice j ordina i modi ed è una funzione di
n e m. In tab. B sono mostrati i primi 22 polinomi e il tipo di aberrazione che
rappresentano.
Vale la seguente condizione di ortonormalità
1 rdϕdrp(r)Zj (r, ϕ)Zj (r, ϕ) =
π
1 j = j
,
0 altrimenti
(B.3)
dove la funzione p(r) vale 1 per r ≤ 1 ed è nulla per r > 1 (pupilla di raggio unitario).
Lo sviluppo in polinomi di Zernike di un generico errore di fase φ(r, ϕ), definito
su una pupilla circolare di raggio R, è dato da
φ(Rr, ϕ) =
∞
j=1
107
aj Zj (r, ϕ) ,
(B.4)
Grado
radiale
(n)
0
Frequenza azimutale (m)
0
Z1 = 1
costante
1
√
3(2r 2 − 1)
Defocus
(Posizione longitudinale)
1
2
Z2 = 2rcosθ
Z3 = 2rsinθ
Tilt (posizione laterale)
3
4
√
Z11 = 5(6r 4 − 6r 2 + 1)
terzo ordine sferico
5
6
Z22 =
√
7(20r 6 − 30r 4 + 12r 2 + 3r)
quinto ordine sferico
4
√
Z5 = √6r 2 sin2θ
Z6 = 6r 2 cos2θ
Z4 =
2
3
Astigmatismo
(Terzo ordine)
√
Z7 = √8(3r 3 − 2r)sinθ
Z8 = 8(3r 3 − 2r)cosθ
coma (Terzo ordine)
√
Z16 = √12(10r 5 − 12r 3 + 3r)cosθ
Z17 = 12(10r 5 − 12r 3 + 3r)sinθ
√
Z12 = √10(4r 4 − 3r 2 )cos2θ
Z13 = 10(4r 4 − 3r 2 )sin2θ
√
Z9 = √8r 3 cos3θ
Z10 = 8r 3 sin3θ
√
Z18 = √12(5r 5 − 4r 3 )cos3θ
Z19 = 12(5r 5 − 4r 3 )sin3θ
Z23
Z24
Z25
Z26
dove i coefficienti aj sono dati da
1 rdϕdrp(r)φ(Rr, ϕ)Zj (r, ϕ) .
aj =
π
108
√
Z14 = √10r 4 cos4θ
Z14 = 10r 4 sin4θ
(B.5)
Bibliografia
[Babcock, 1953] Babcock, H. W. (1953).
“The possibility of compensating
astronomical seeing”. Pub. Astr. Soc. Pac., 65, 229–236.
[Barakat, 1969] Barakat, R. (1969). “General diffraction theory of optical aberration
test, from the point of view of spatial filtering”. J. Opt. Soc. Am., 59, 1432–1439.
[Barletti et al., 1977] Barletti, R., Ceppatelli, G., Paterno, L., Righini, A., e
Speroni, N. (1977). Astronomy and Astrophysics, 54, 649.
[Born & Wolf, 1985] Born, M. e Wolf, E. (1985). Principles of Optics. Pergamon,
New York.
[Bufton, 1973] Bufton, J. L. (1973). Appl. Opt., 12, 1785.
[Catalogo Physik Instrumente, 1995] Catalogo Physik Instrumente (1995). “Products for micropositioning”.
[Cubalchini, 1979] Cubalchini, R. (1979). “Modal wave-front estimation from phase
derivative measurements”. J. Opt. Soc. Am., 69, 972–977.
[Foucault, 1859] Foucault, L. M. (1859).
“Mémorie sur la construccion des
télescopes en verre argenté”. Ann. Obs. Imp. Paris, 5, 197.
[Foy & Labeyrie, 1985] Foy, F. e Labeyrie, A. (1985).
“Feasibility of adaptive
telescope with laser probe”. Astronomy and Astrophysics, 152, 129–131.
109
[Fried, 1966] Fried, D. L. (1966). “Optical resolution through a randomly inhomogeneous medium for very long and very short exposures”. J. Opt. Soc. Am., 56,
1372–1379.
[Fried, 1977] Fried, D. L. (1977). “Least-square fitting a wave-front distortion estimate to an array of phase-difference measurements”. J. Opt. Soc. Am., 67,
370–375.
[Gaffard & Boyer, 1989] Gaffard, J. P. e Boyer, C. (1989). “Simplified wavefront
sensor for adaptive mirror control”. Proc. Soc. Photo-Opt. Instrum. Eng., 1114,
105–119.
[Gaviola, 1936] Gaviola, E. (1936). “On the quantitative use of the Foucault knifeedge test”. J. Opt. Soc. Am., 26, 163–169.
[Goad et al., 1986] Goad, L., Roddier, L., Backers, J., e Eisenhardt, P. (1986). “National Optical Astronomy Observatories (NOAO) IR adaptive optics program III:
criteria for the wavefront selectrion”. Proc. Soc. Photo-Opt. Instrum. Eng., 628,
305–313.
[Goodman, 1968] Goodman, J. (1968). Introduction to Fourier Optics. McGrawHill.
[Goodman, 1985] Goodman, J. (1985). Statistical Optics. Wiley-Intescience.
[Happer et al., 1994] Happer, W., MacDonald, G. J., Max, C. E., e Dyson, F. J.
(1994). “Atmospheric-turbulence compensation by resonant optical backscattering from the sodyum layer in the upper atmosphere”. J. Opt. Soc. Am. A, 11,
263–276.
[Hunt, 1979] Hunt, B. R. (1979). “Matrix formulation of the reconstruction of phase
values from phase differences”. J. Opt. Soc. Am., 69, 393–399.
[Jenkins & White, 1972] Jenkins, F. e White, H. (1972). Ottica. Istituto Editoriale
Universitario, 3 edition.
110
[Kolmogorov, 1941] Kolmogorov, A. N. (1941). “The local structure of turbulence
in incomressible viscous fluids for very large reynolds numbers”. Compt. Rend.
Acad. Sci. (SSSR), 30, 301.
[Linfoot, 1955] Linfoot, E. H. (1955). Recent Advances in optics. Oxford University
Press.
[Mahajan, 1991] Mahajan, V. N. (1991). Aberration theory made simple. TT. SPIE
Optical Engeneering Press.
[Noll, 1976] Noll, R. (1976). “Zernike polynomials and atmospheric turbulence”. J.
Opt. Soc. Am., 66, 207–211.
[Obukhov, 1949] Obukhov, A. M. (1949). Izv. Akad. Nauk S.S.S.R, Ser Geograf.
Geofiz., 13, 58.
[Parenti & Sasiela, 1994] Parenti, R. R. e Sasiela, R. J. (1994). “Laser-guide-star
system for astronomical applications”. J. Opt. Soc. Am. A, 11, 288–309.
[Press et al., 1986] Press, W. H., Flannery, B. P., Teukolsky, S. A. ., e Vetterling,
W. T. (1986). Numerical Recipes. Cambridge University Press, Cambridge.
[Ragazzoni, 1996] Ragazzoni, R. (1996). “Pupil plane wavefront sensing with an
oscillating prism”. Journal of Modern Optics, 43, 289–293.
[Rayleigh, 1917] Rayleigh, L. (1917).
“On methods for detecting small optical
retardations, and on theory of Focault test”. Phil. Mag., 99, 206.
[Riccardi et al., 1996] Riccardi, A., Esposito, S., Ragazzoni, R., Fini, L., e Ranfagni, P. (1996). “Foucault-like wave-front sensor”. In Adaptive Optics, page 246.
Technical Digest vol.13, Maui, Hawaii. Optical Society of America.
[Rimmer, 1974] Rimmer, M. P. (1974). “Method for evaluating lateral shearing
interferograms”. Appl. Opt., 13, 623–629.
111
[Roddier et al., 1991] Roddier, F., Northcott, M., e Graves, J. E. (1991). “A simple
low-order adaptive optics system for near-infrared applications”. Pub. Astr. Soc.
Pac., 103, 131–149.
[Roddier, 1990] Roddier, N. (1990).
“Atmospheric wavefront simulation using
Zernike polynomials”. Optical Engineering, 29, 1174–1180.
[Salinari et al., 1993] Salinari, P., Del Vecchio, C., e Biliotti, V. (1993). “A study of
an adaptive secondary mirror. study of an adaptive secondary mirror”. In ICO-16
Satellite conference on Active and Adaptive Optics. ESO, Munich, Germany.
[Southwell, 1980] Southwell, W. H. (1980). “Wave-front estimation from wave-front
slope measurements”. J. Opt. Soc. Am., 70, 998–1006.
[Tatarski, 1961] Tatarski, V. I. (1961). Wave propagation in a turbulent medium.
Dover Publications, Inc., New York.
[Vandenberg et al., 1993] Vandenberg, D. E., Humbel, W. D., e Wertheimer, A.
(1993). “Quantitative evaluation of optical surfaces by means of an improved
Focault test approach”. Optical Engineering, 32, 1951–1954.
[Wilson, 1975] Wilson, R. G. (1975). “Wavefront-error evaluation by mathematical
analysis of experimenatal foucault-test data”. Appl. Opt., 14, 2286–2297.
112