Connessioni e teorie di gauge

Transcript

Connessioni e teorie di gauge
Università di Pisa
FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di Laurea Triennale in Matematica
Tesi di laurea triennale
Connessioni e teorie di gauge
Candidato:
Relatore:
Alessandro Malusà
Chiarissimo prof.
Riccardo Benedetti
Anno Accademico 2011–2012
Sommario e convenzioni
Il mio obiettivo in questo lavoro è stato quello di approfondire un argomento
che non solo fosse interessante di per sé, ma che si prestasse anche ad applicazioni alla fisica. Con gli strumenti acquisiti in questo percorso mi è stato
possibile formalizzare in maniera per così dire “pulita” alcuni problemi classici
della meccanica trattata nei corsi di base e affrontare argomenti più avanzati
dell’elettrodinamica nel contesto della meccanica quantistica.
Nel primo capitolo affronto le proprietà fondamentali dei fibrati su una varietà M , ponendo particolare attenzione ai due principali punti di vista possibili:
l’uno globale, l’altro locale. Nel primo, la struttura è rappresentata da una mappa di proiezione definita su uno spazio totale E a valori in M con delle proprietà
di banalizzazione per certi aspetti molto simili a quelle dei rivestimenti. Il secondo, invece, consiste nella ricostruzione del fibrato per mezzo di incollamenti
di insiemi della forma U × F , dove U è aperto in M , secondo le regole imposte
dalle mappe di transizione. Un aspetto molto importante, trattato alla fine, è la
possibilità di ricondurre qualsiasi fibrato a uno principale che ne riassume molte
proprietà. Questo oggetto permette già di dare una formulazione compiuta ai
problemi di corpo rigido.
Passo poi alle connessioni, trattando prima quelle affini su varietà generiche
e passando poi a quelle su fibrati principali. Le prime generalizzano a varietà
qualsiasi la nozione di derivata covariante, già affrontata durante i corsi, come un
oggetto che consente di formalizzare consistentemente l’idea che un dato campo
vettoriale sia parallelo lungo una direzione, ed eventualmente di valutarne le
“variazioni”: in questo modo è possibile dare una formulazione del principio
d’inerzia anche per ambienti diversi da quello usuale di Rn . Nel contesto dei
fibrati principali viene introdotto uno strumento simile, espresso in due possibili
modi equivalenti: tramite un’opportuna distribuzione o una 1-forma a valori
in un’algebra di Lie, richiedendo in entrambi i casi delle buone proprietà di
traslazione. Vengono definiti i sollevamenti paralleli e l’olonomia. Tutto questo
viene affrontato con una particolare attenzione per le regole di trasformazione
delle rappresentazioni locali degli oggetti in analisi: questo sarà un punto chiave
nell’affrontare le applicazioni a problemi fisici avanzati.
Nel capitolo successivo approfondisco la nozione di curvatura, accennata
nello studio delle derivate covarianti, estendendola al caso delle connessioni su
fibrati principali. In termini della forma differenziale ad essa associata è possibile
parlare di fibrati piatti, cioè a curvatura nulla, e dimostrare che, in questo
caso, la distribuzione associata alla connessione è integrabile. In questo modo
risulta ben definita una foliazione dello spazio totale, che consente di definire
un opportuno rivestimento di M che lega l’olonomia all’omotopia dello spazio.
1
SOMMARIO E CONVENZIONI
2
Tutto questo viene impiegato nell’ultima parte per costruire un modello per
l’elettrodinamica come teoria di gauge, in termini di una connessione data dal
potenziale vettore. Tramite esempi classici come quello del monopolo di Dirac e
dell’effetto Aharonov-Bohm illustro le applicazioni di quanto visto a questo contesto, dando una previsione teorica astratta e dando una descrizione consistente
di un fenomeno effettivamente osservato in laboratorio.
Salvo precisazioni ulteriori, in quello che segue assumo che tutte le varietà
siano C ∞ , così come tutte le mappe. Userò indistintamente le espressioni “liscio”,
“differenziabile” e “C ∞ ”.
Prima di iniziare l’esposizione, vorrei lasciare un saluto e un ringraziamento alla memoria del professor Pino Vigna Suria, dell’Università degli Studi di
Trento, venuto a mancare la scorsa primavera.
Indice
1 Fibrati
1.1 Qualche esempio introduttivo . . . . .
1.2 Due parole sui rivestimenti . . . . . .
1.3 Definizioni e prime proprietà . . . . .
1.3.1 Punto di vista globale . . . . .
1.3.2 Punto di vista locale . . . . . .
1.4 Operazioni sui fibrati . . . . . . . . . .
1.4.1 Pullback di un fibrato . . . . .
1.4.2 Operazioni su fibrati vettoriali
1.5 Fibrati principali . . . . . . . . . . . .
1.6 Curiosità e considerazioni a posteriori
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
6
6
7
10
12
12
13
14
17
2 Connessioni
2.1 Motivazioni; principio d’inerzia . . . . . . . . . . .
2.1.1 Il punto di vista delle coordinate . . . . . .
2.2 Connessioni affini . . . . . . . . . . . . . . . . . . .
2.2.1 La derivata covariante in sottovarietà di Rn
2.2.2 Connessioni affini su varietà generiche . . .
2.2.3 Il caso di varietà riemanniane . . . . . . . .
2.3 Connessioni su fibrati principali . . . . . . . . . . .
2.3.1 Derivata covariante indotta . . . . . . . . .
2.4 Olonomia . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
23
24
25
28
35
38
42
44
3 Piattezza
3.1 Ancora sulla curvatura nel caso affine .
3.2 Curvatura di una 1-forma di connessione
3.3 Condizioni equivalenti alla piattezza . .
3.4 Olonomia di una connessione piatta . .
4 Teorie di gauge
4.1 Background fisico . . . . . . .
4.1.1 Equazioni di Hamilton
4.2 L’elettrodinamica come teoria
4.3 Il monopolo di Dirac . . . . .
4.4 L’effetto Aharonov-Bohm . .
4.5 Continua... . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
46
46
48
50
52
. . . . . . . . . .
e di Schrödinger
di gauge . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
55
55
57
59
61
63
66
Bibliografia
.
.
.
.
.
.
.
.
.
.
.
.
68
3
Capitolo 1
Fibrati
La struttura di fibrato è molto utile per formalizzare e descrivere alcune idee
che in matematica e fisica ricorrono spesso.
1.1
Qualche esempio introduttivo
Di seguito riporto alcune situazioni in cui questo oggetto si rende necessario,
per mettere in luce i bisogni che portano a introdurre tale strumento.
Es 1.1.1 (Fibrato tangente): Data M una varietà di dimensione n è possibile
definire, punto per punto, lo spazio tangente: si tratta di uno spazio vettoriale
della stessa dimensione di M . Vorremmo costruire un oggetto che esprima bene
l’idea di aver “incollato” una copia di un certo spazio vettoriale a ogni punto, e
che permetta di parlare in maniera consistente di campi vettoriali e della loro
eventuale regolarità. Uno spazio costruito come unione disgiunta dei Tp M al
variare di p ∈ M è del tutto inadeguato a questo scopo: esso non ha alcuna
ovvia struttura differenziabile ereditata da M , nè una topologia soddisfacente.
C’è bisogno di qualcosa di più raffinato.
Se p è un punto di M , esisterà un isomorfismo tra Tp M ed Rn , ma in generale non uno canonico; analogamente, spazi tangenti ad M in punti distinti
sono a loro volta differenti, e non possono essere identificati. È però possibile
dare una base di Tp M , e quindi un particolare isomorfismo con Rn , quando
in un intorno del punto è definito un sistema di coordinate: in questo caso
una base sarà definita sullo spazio tangente in ciascuno dei punti dell’intorno. Consideriamo due aperti coordinati Ui e Uj della varietà, e supponiamo
che questi si intersechino. Lo Jacobiano del cambio di carta fornisce una trasformazione delle coordinate dello spazio tangente, ed essendo M una varietà
C ∞ anche questa trasformazione sarà differenziabile. Se le carte sono date da
ϕi(j) : Ui(j) → F
Ai(j) , con Ai e Aj aperti di Rn , questo fornisce delle funzioni
φi(j) : T M := p∈M Tp M → Ai(j) × Rn che possonoFessere considerate delle
parametrizzazioni C ∞ : Ui e Uj si intersecano in U = p∈Ui ∩Uj Tp M , ed è ben
definita una funzione φ : φi (U ) → φj (U ) che risulta essere C ∞ . Abbiamo quindi
una struttura differenziabile su T M che permette di vedere questo spazio come
incollamento di aperti della forma Ai × Rn , cioè una varietà di dimensione 2n.
Inoltre, nelle carte così costruite, le prime n coordinate della parametrizzazione
4
CAPITOLO 1. FIBRATI
5
identificano un punto di M , mentre le altre n individuano un vettore tangente
nello stesso. Sarà naturale considerare solo carte che godano di questa proprietà,
poiché permettono di individuare in maniera immediata lo spazio a cui ciascun
vettore appartiene.
Es 1.1.2 (Corpo rigido): Considero il moto di un corpo rigido nello spazio
tridimensionale. Nell’approssimazione di un punto materiale, la posizione sarà
determinata completamente dalle coordinate del centro di massa rispetto a un
fissato sistema di riferimento, ma se si considera un corpo esteso occorre tenere
conto di ulteriori gradi di libertà legati alle possibili rotazioni. È utile considerare una fissata posizione privilegiata, in cui il centro di massa dell’oggetto
sia nell’origine del sistema di riferimento, e sia orientato in un qualsiasi modo.
Questo permette, fissato un qualunque punto P , di traslare l’oggetto dall’origine
in P e di considerare l’orientazione ottenuta in questo punto come riferimento.
A questo punto, una qualsiasi posizione dell’oggetto con centro di massa in P
è determinata biunivocamente dalla rotazione intorno al punto che trasforma
l’orientazione di riferimento in quella data. Per passare dal punto materiale al
corpo esteso, quindi, basta associare ad ogni posizione non solo le coordinate del
centro di massa, ma anche un elemento di SO3 che ne esprima l’orientazione.
Si potrà dunque pensare lo spazio delle configurazioni come uno spazio euclideo
a cui sia incollata, punto per punto, una copia di SO3 . Viene naturale a questo punto immaginare che lo spazio che descrive questa situazione possa essere
R3 × SO3 con la sua struttura di varietà differenziabile.
Una situazione simile, ma più complessa, è quella di un corpo esteso il cui
centro di massa è libero di muoversi sulla superficie di una sfera, con l’ulteriore vincolo che le rotazioni possibili siano solo attorno all’asse radiale della
sfera. Anche in questo caso per determinare una generica configurazione non
è sufficiente la posizione del centro di massa. Se si dispone, in ogni punto,
di un’orientazione di riferimento, un’altra generica può essere espressa tramite
una rotazione del piano, cioè un elemento di S 1 (' SO2 ). Nel caso visto sopra
è sufficiente un’orientazione di riferimento solo nell’origine, poiché questo permette di costruirne una in ogni altro punto in maniera canonica, ma sulla sfera
non è ovvio come procedere per avere lo stesso risultato. In R3 si è sfruttato
il fatto che, comunque dati due punti, esiste un’unica traslazione che manda
il primo nel secondo, e sulla sfera vale un risultato simile: se p e q sono due
punti sulla sfera non diametralmente opposti, allora esiste un’unica rotazione
che manda p in q fissando l’ortogonale ai due punti (come raggi vettori). Dunque, data un’orientazione di riferimento in un punto qualsiasi, ad esempio il
polo nord PN = (0, 0, 1), è possibile costruirne una in ogni punto, eccetto quello
diametralmente opposto. Se il centro di massa dell’oggetto non è nel polo sud
PS = (0, 0, −1), quindi, la sua posizione sarà individuata da quella del centro di
massa e da una rotazione del piano: questo permette di vedere lo spazio delle
configurazioni per cui il centro di massa non sia il polo sud come il prodotto
(S 2 \ { PS }) × S 1 . Analogamente, per le configurazioni con il centro di massa
diverso dal polo nord si ha (S 2 \ { PN }) × S 1 . Non è chiaro se l’intero spazio
delle configurazioni possa essere rappresentato come S 2 × S 1 , ma sicuramente è
possibile ricoprire la sfera con aperti per cui questa decomposizione vale.
Nelle situazioni esposte negli esempi qui sopra si rende necessario introdur-
CAPITOLO 1. FIBRATI
6
re un oggetto che permetta di formalizzare l’idea di incollare a ogni punto di
una certa varietà M una copia di una qualche struttura (ad esempio il gruppo che esprime le simmetrie di un corpo libero di muoversi in M ), in maniera
globalmente consistente. Questo permetterebbe, inoltre, di parlare di regolarità di funzioni che assegnano ad ogni punto un elemento della struttura ad
esso associata: questo corrisponde, nei due esempi visti, a campi vettoriali e
rotazioni.
1.2
Due parole sui rivestimenti
La struttura di fibrato richiama quella di rivestimento, affrontata nei corsi istituzionali. Per tale motivo vale la pena riprendere le proprietà fondamentali di
questa costruzione prima di introdurre la definizione precisa di fibrato.
Def 1.2.1: Siano X, E due spazi topologici, π : E → X una funzione continua.
Si dice che π è un rivestimento se ogni punto p ∈ X ammette un intorno aperto
U tale che, per ogni V componente connessa della controimmagine di U , la
restrizione π|V : V → U sia un omeomorfismo. Si chiamano aperti trivializzanti
quelli che realizzano questa proprietà.
Se E è localmente connesso, un rivestimento permette di ricoprire E con
aperti della forma Ui × Fi , dove gli Ui sono aperti di X, mentre gli Fi rappresentano degli spazi discreti (con abuso di notazione, in questa sezione intenderò
con questa espressione “totalmente sconnessi”). Dal seguente diagramma, in cui
p denota la proiezione sul primo fattore, si piò concludere che, per qualsiasi
punto x ∈ Ui , lo spazio di Fi è omeomorfo alla fibra di x tramite π. Infatti, la
proiezione p0 : Ui × Fi → Fi sul secondo fattore induce un omeomorfismo tra Fi
e la controimmagine di x tramite p (si tratta di una bigezione tra spazi discreti),
mentre la funzione f è un omeomorfismo sull’immagine. Per la commutatività
del diagramma, questo induce una bigezione tra Fi e π −1 (x), spazio discreto
rispetto alla topologia di sottospazio: si ha l’omeomorfismo cercato.
Ui × Fi
f E
p
π
-
?
X
Dunque, ogni punto x di X ammette un intorno (aperto) U la cui immagine
possa essere descritta come U × π −1 (x). Sarà questa la proprietà fondamentale
dei fibrati.
1.3
Definizioni e prime proprietà
Le questioni riguardanti i fibrati su M possono essere formulate sfruttando due
diversi punti di vista equivalenti, ciascuno dei quali risulta essere più o meno
vantaggioso a seconda del contesto. Il primo è globale, e si concentra su di una
CAPITOLO 1. FIBRATI
7
seconda varietà E e una mappa di proiezione su M , con proprietà analoghe a
quelle dei rivestimenti, a meno di rimuovere l’ipotesi che le fibre locali siano
discrete. Il secondo, invece, è di carattere locale, e consiste nel ricostruire la
varietà E incollando insiemi della forma Ui × F , con Ui aperti di M con la fibra
F , identificando i punti tramite opportune mappe.
1.3.1
Punto di vista globale
Considero una varietà M , e suppongo siano date un’altra varietà E e una funzione differenziabile π : E → M con differenziale surgettivo. Suppongo inoltre che
la fibra di ogni punto p ∈ M (non lo specificherò più, ma salvo indicazioni ulteriori intenderò sempre tramite π) sia diffeomorfa ad una fissata varietà F , che
chiamerò genericamente fibra, con la seguente proprietà: esistono un ricoprimento aperto { Ui }i∈I di M e una famiglia di diffeomorfismi φi : Ui × F → π −1 (Ui )
in modo che il seguente diagramma sia commutativo (pi denota la proiezione
sul primo fattore):
Ui × F
φi
π −1 (Ui )
pi
π
-
?
Ui
Gli aperti di tale ricoprimento saranno detti “trivializzanti”, e le mappe φi
“trivializzazioni locali”.
Supponiamo che due aperti trivializzanti Ui e Uj si intersechino: le φi e
φj inducono due diffeomorfismi (per i quali non cambio notazione), a priori
distinti, tra (Ui ∩ Uj ) × F e π −1 (Ui ∩ Uj ). Avrò dunque un diffeomorfismo di
(Ui ∩ Uj ) × F in sè dato da φ−1
i ◦ φj , che inoltre conserva la prima componente, e
questo permette di associare ad ogni punto p ∈ Ui ∩Uj una mappa tij (p) : F → F
data da f 7→ tij (p) f tale che φ−1
◦ φj (p, f ) = (p, tij (p) f ). Tale mappa sarà
i
nuovamente un diffeomorfismo: in effetti, dall’ipotesi che φi lo sia segue che la
sua restrizione a { p } × F è differenziabile e iniettiva, e così per la sua inversa.
Sulla fibra F non è stata formulata alcuna ipotesi, se non, naturalmente,
quella che sia una varietà. Tale spazio può avere della struttua ulteriore, come
quella di gruppo, spazio vettoriale o metrico: in tal caso avrà senso richiedere
che, punto per punto, la mappa tij preservi anche questa struttura, e cioè che
tij (p) appartenga a un opportuno sottogruppo si quello dei diffeomorfismi di F in
sè (potrà trattarsi di automorfismi di gruppo o spazio vettoriale o di insometrie,
in questi casi). Si potrà aggiungere l’ipotesi che tale gruppo abbia a sua volta
una struttura differenziabile: questo farà sì che tij possa essere definita come
una mappa da Ui ∩ Uj nel gruppo G considerato, e avrà senso l’ipotesi che anche
queste siano differenziabili.
Una struttura di questo tipo è proprio ciò che occorre per affrontare i problemi sopra menzionati. Riassumo nella seguente definizione ciò che fin qui è
stato detto:
Def 1.3.1 (Fibrato): Siano E, M ed F varietà di classe C ∞ , G un sottogruppo
di Lie dei diffeomorfismi di F in sè. Si dice che la mappa π : E → M definisce un
CAPITOLO 1. FIBRATI
8
fibrato su M con fibra tipica F e gruppo di transizione G se valgono le seguenti
proprietà:
1. π è differenziabile e il suo differenziale è surgettivo;
2. La controimmagine di ogni punto p ∈ M (indicata come Fp , la fibra di π
in p) è diffeomorfa a F ;
3. M ammette un ricoprimento tramite aperti { Ui }i∈I per i quali esistano
diffeomorfismi φi : Ui × F → π −1 (Ui ) in modo che l’immagine di ogni
coppia (p, f ) appartenga a Fp , e che per ogni Ui , Uj che si intersechino
non banalmente esista una fuzione tij : Ui ∩ Uj → G tale che, per ogni
(p, f ) ∈ (Ui ∩ Uj ) × F valga φ−1
i ◦ φj (p, f ) = (p, tij (p) f ).
In tal caso, si dice che E è lo spazio totale del fibrato, M lo spazio base, π è
chiamata proiezione, mentre gli Ui sono detti aperti trivializzanti, ciascuna φi
trivializzazione locale, e infine le mappe tij sono chiamate mappe di transizione.
G è detto gruppo di transizione o di struttura (in contesto fisico “di gauge”). Si
usa chiamare dimensione del fibrato quella di F , e se questo non può dare luogo
ad ambiguità si scrive dim E = dim F .
Sia U ⊆ M un aperto, s : U → E una funzione differenziabile. Si dice che
s è una sezione locale del fibrato se π ◦ s è la mappa identica di U : in altre
parole, s è una sezione se l’immagine di ogni punto appartiene alla sua fibra.
Dato un punto p ∈ M , esiste sempre una sezione locale in un suo intorno: se
(Ui , φi ) è un aperto trivializzante contenente p, f un qualsiasi elemento della
fibra, si può considerare la mappa sf : Ui → E che manda m ∈ M in φi (m, f ).
Per definizione di trivializzazione questa mappa è in effetti una sezione locale
in (un intorno di) p. L’esistenza di una sezione globale, invece, non è sempre
garantita, ed è anzi uno dei problemi principali nello studio di un fibrato.
Es 1.3.1: Se M ed N sono varietà, il loro prodotto cartesiano M × N ha
una naturale struttura di fibrato su ciascuna delle due, tramite le rispettive
proiezioni. Qualsiasi funzione differenziabile f : M → N induce una sezione
globale s : m 7→ (m, f (m)) (analogamente per g : N → M ).
Es 1.3.2: Il cilindro C e il nastro di Möbius N , costruiti identificando i due bordi verticali del quadrato [0, 1] × (0, 1), rispettivamente preservando e invertendo
l’orientazione, forniscono due esempi di fibrati sulla circonferenza S 1 . Infatti, in
entrambi i casi la proiezione sul primo fattore induce mappe πC e πN a valori
in S 1 ' [0, 1]/ ∼, dove ∼ è la relazione che identifica gli estremi.
qN
N πN
[0, 1] × (0, 1)
qC C
πC
?
?
?
qS 1 - 1
1 qS 1
S
[0, 1] × { 1/2 }
S
Nel diagramma, qN , qS 1 e qC denotano le proiezioni ai quozienti. Si verifica
immediatamente che πC e πN sono di classe C ∞ e che i rispettivi differenziali
CAPITOLO 1. FIBRATI
9
sono surgettivi. Siano U1 = (0, 1) e U2 = [0, 1] \ { 1/2 }: le immagini di questi
insiemi tramite qS 1 danno un ricoprimento aperto della circonferenza. Sono ben
definite le seguenti mappe: le prime due in maniera immediata, le altre passando
per il quoziente:
φ1,C : qS 1 (U1 ) × (0, 1) → C
(qS 1 (x), y) 7→ qC (x, y)
φ1,N : qS 1 (U1 ) × (0, 1) → N
(qS 1 (x), y) 7→ qN (x, y)
φ2,C : qS 1 (U2 ) × (0, 1) → C
(qS 1 (x), y) 7→ qC (x, y)
(
qN (x, y)
per x < 1/2
(qS 1 (x), y) 7→
qN (x, 1 − y) per x > 1/2
φ2,N : qS 1 (U2 ) × (0, 1) → N
Queste mappe sono differenziabili, godono delle proprietà delle trivializzazioni
locali, e le prime componenti dei loro domini ricoprono S 1 . Siano GC = { 1 }
con l’azione banale su (0, 1), e GN = { ±1 }, dove −1 agisce mandando y in
1 − y, tC : qS 1 (Ui ) ∩ qS 1 (Uj ) → GC la costante 1, tN : qS 1 (Ui ) ∩ qS 1 (Uj ) → GN
che vale 1 nei punti della forma qS 1 (x) con x < 1/2, −1 altrimenti. Allora le due
proiezioni πC e πN danno fibrati su S 1 con le trivializzazioni indicate, gruppi di
transizione GC e GN e mappe di transizione tC e tN .
Es 1.3.3: Sia M una varietà differenziabile n-dimensionale, e sia T M definito
come nell’esempio 1.1.1, π : T M → M la mappa che manda ogni elemento
di Tp M in p. La rappresentazione in coordinate della proiezione mostra la
differenziabilità di π e la surgettività del suo differenziale, e chiaramente la fibra
di ogni punto p è Tp M , isomorfa (e dunque diffeomorfa) a Rn . Dato un atlante di
M la costruzione già fatta permette di individuare delle trivializzazioni locali,
le cui mappe di transizione sono date dallo Jacobiano dei cambi di carta. Il
gruppo di transizione sarà dunque GLn (R).
In letteratura esistono diverse definizioni di classi di mappe tra fibrati. Per
questa trattazione sarà sufficiente la seguente:
π
π0
Def 1.3.2 (Morfismo di fibrati): Siano dati E → M , E 0 → M due fibrati,
f : E → E 0 una funzione differenziabile. Si dice che f è un morfismo di fibrati
se π 0 ◦ f = π, cioè se il seguente diagramma commuta:
f
E
- E0
π0
-
π
M
Se f è un diffeomorfismo tra E ed E 0 come varietà, allora si dice che è un
isomorfismo di fibrati.
La condizione che f sia un morfismo di fibrati equivale a richiedere che
mandi le fibre di π in quelle di π 0 . Questa definizione di isomorfismo permette
di confrontare due fibrati e permetterà di classificarli.
Un fibrato si dice banale se è equivalente a M × F , con la naturale struttura
di fibrato accennata nell’esempio 1.3.1. Un esempio di fibrato banale su S 1 è il
CAPITOLO 1. FIBRATI
10
cilindro, mentre il nastro di Möbius non può esserlo: se lo fosse, come varietà
sarebbe diffeomorfo a S 1 × (0, 1), cosa che non vale.
Oss 1.3.1L: e notazioni impiegate per indicare i fibrati sono varie: talvolta vengono denotati tramite la 5-upla (E, π, M, F, G), mentre a volte si usa la notaπ
zione E → M , o semplicemente E. Naturalmente, specificare soltanto lo spazio
base e la fibra tipica non determina il fibrato, come mostra l’esempio 1.3.2.
Nemmeno lo spazio totale E, da solo, determina la struttura di fibrato, dato
che, ad esempio, nel caso del prodotto cartesiano tra spazi distinti fornisce un
fibrato su ciascuno. Addirittura può non essere sufficiente nemmeno indicare
E ed M : le mappe eikt : S 1 → S 1 , con k intero non nullo, definiscono fibrati
sulla circonferenza non isomorfi tra loro (la fibra ha cardinalità |k|). D’altra
parte, è fondamentale specificare anche il gruppo di transizione, poiché al variare di questo può darsi che cambi la classe di banalizzazioni locali permesse.
Ad esempio, in maniera del tutto analoga al cilindro, anche il toro ammette una
struttura di fibrato su S 1 con la stessa circonferenza come fibra, con gli aperti banalizzanti e le banalizzazioni locali costruite nello stesso modo. Se come
gruppo di transizione si ammette quello delle isometrie della circonferenza, la
φ2 potrà essere sostituita con una mappa che manda (x, y) in φ2 (x, ρ(y)), dove
ρ è una riflessione: in questo caso t12 (x) = ρ in ogni punto, anziché l’identità.
Se però si desidera considerare solo il gruppo delle rotazioni della circonferenza,
la famiglia di trivializzazioni costruita non soddisfa le richieste.
Nonostante queste considerazioni, spesso indicando un generico fibrato si
alleggerisce la notazione omettendo di specificare alcune delle sue caratteristiche,
purché questo non comprometta la consistenza della trattazione. Io adotterò
π
E → M.
1.3.2
Punto di vista locale
Oss 1.3.2: Se { (Ui , φi ) }i∈I è un ricoprimento di M tramite aperti trivializzanti, le mappe di transizione tij godono delle seguenti due proprietà:
• tii = Id per ogni i ∈ I;
• tij tjk = tik per ogni i, j, k per cui Ui ∩ Uj ∩ Uk 6= ∅. Infatti, applicando
la definizione, si ha, per ogni p ∈ Ui ∩ Uj ∩ Uk , f ∈ F :
(p, (tij tjk (p)) f ) = (p, tij (p) (tjk (p) f )) =
= φ−1
i φj (p, tjk (p) f ) =
−1
= φ−1
i φj φj φk (p, f ) =
= φ−1
i φk (p, f ) =
= (p, tik (p) f )
In effetti, queste proprietà caratterizzano le mappe di transizione: una volta
fissati M , F e G e dato un ricoprimento aperto { Ui }i∈I di M e delle funzioni
CAPITOLO 1. FIBRATI
11
tij : Ui ∩ Uj → G con le proprietà ora enunciate, esiste un fibrato che abbia le
tij come mappe di transizione.
Thm 1.3.3: Siano M , F varietà di dimensione r ed s rispettivamente, G un
gruppo di Lie che agisce a sinistra su F in modo liscio, { Ui }i∈I un ricoprimento
aperto di M e tij : Ui ∩ Uj → G tali che, per ogni i, j, k ∈ I, tii = e (elemento
neutro di G) e tij tjk = tik . Allora esiste un fibrato con base M , fibra tipica F e
gruppo di transizione G con tij come mappe di transizione; inoltre, tale fibrato
è unico a meno di isomorfismo.
F
Dim: Sia E = i∈I Ui × F , ∼ la relazione binaria su E definita nel seguente
modo: se (p1 , f1 ) ∈ Ui × F , (p2 , f2 ) ∈ Uj × F , allora (p1 , f1 ) ∼ (p2 , f2 ) se e solo
se p1 = p2 e f1 = tij f2 . Tale relazione è riflessiva, poiché tii = Id, e transitiva,
dato che tij tjk = tik . Inoltre, per ogni i, j ∈ I vale t−1
ij = tji : tij tji = tii = Id
e viceversa. Da questo segue la simmetria di ∼, che risulta essere quindi una
relazione di equivalenza.
Sia E definito come E/ ∼. Per come è definita ∼, la proiezione sul primo
fattore di ciascun Ui passa al quoziente, e induce una funzione π : E → M .
Inoltre, per ogni i ∈ I la proiezione al quoziente su E fornisce una mappa
φi : Ui × F → E per cui banalmente (π ◦ φi )(p, f ) = p.
Se { (Vj , µj ) }j∈J , { (Wh , νh ) }h∈H sono atlanti rispettivamente di M ed F ,
allora { ((Ui ∩ Vj ) × Wh , µij × νh ) }, dove µij rappresenta µj ristretta a Ui ∩ Vj ,
è un atlante su E. Le µij × νh inducono mappe anche su aperti Aijk in E. Se
Aijk interseca non banalmente Almn , le carte inducono una funzione η (di cui
ometto gli indici) da µj (Ui ∩ Vj ) × νh (Wh ) in µm (Ul ∩ Vm ) × νn (Wn ). Il fatto
che gli aperti si intersechino significa che Ui ∩ Vj interseca Ul ∩ Vm , mentre Wh
interseca til (Wn ). Si avrà
−1
−1
η(x, y) = (µlm µ−1
(y))
ij (x), νm (νk ◦ til (µij (x)))
che per la differenziabilità delle mappe coinvolte è a sua volta di classe C ∞ .
Queste carte mostrano che la proiezione π è anch’essa differenziabile e il differenziale è surgettivo, e questo dimostra la struttura di fibrato dell’oggetto
costruito, dato che le trivializzazioni locali sono già state introdotte e sono banalmente differenziabili. Inoltre, per come è stato costruito E, le mappe di
transizione sono quelle richieste.
π0
Sia ora E 0 → M un fibrato con fibra tipica F e le tij come mappe di transizione. Allora le trivializzazioni locali ψi degli aperti Ui definiscono una mappa
ψ : E → E 0 di classe C ∞ , che passa al quoziente e induce una ψ̃ : E → E 0
differenziabile. Poiché le ψi sono diffeomorfismi sull’immagine, ciascuna di esse
ammette inversa differenziabile ψi−1 a valori in E. Per definizione di mappe di
transizione, passando al quoziente in E le ψi−1 coincidono dove i domini si intersecano e permettono quindi di costruire l’inversa di ψ, anch’essa differenziabile.
Questo rende ψ un diffeomorfismo tra E ed E 0 , che manda banalmente fibre in
fibre, ed è dunque un isomorfismo di fibrati.
B
Oss 1.3.4: Il risultato ora dimostrato non implica che la costruzione fatta con
due famiglie distinte di mappe dia luogo a fibrati non isomorfi: riprendendo la
trattazione del cilindro fatta nell’esempio 1.3.2, ad esempio, scegliendo tij =
CAPITOLO 1. FIBRATI
12
− Id per i 6= j si otterrebbe un fibrato isomorfo. Per vederlo, basta considerare
al posto di φ2,C la funzione che manda (x, y) in φ2,C (x, 1 − y).
In generale, è sempre vero che le mappe tij = Id per ogni i, j ∈ I danno
luogo al fibrato banale, ma non vale l’implicazione inversa.
La definizione 1.3.1 propone un punto di vista globale: l’idea di fibrato su
M con fibra F viene introdotta tramite una nuova varietà E ed una mappa di
proiezione π, e l’attenzione è focalizzata sulle proprietà di questi due oggetti.
Il risultato appena mostrato, invece, apre la strada a un diverso approccio,
che pone l’accento sugli aspetti locali della nuova struttura: un fibrato viene
costruito incollando spazi della forma Ui × F , secondo le regole espresse dalle
mappe di transizione. I due punti di vista si equivalgono, ed è quindi possibile
adottare di volta in volta il più comodo.
Oss 1.3.5: Di fatto, quando si definisce il fibrato tangente ad una varietà,
la costruizione che si fa è quella locale: dato un atlante di M , se due aperti
coordinati si intersecano lo Jacobiano del cambio di carta fornisce una funzione
dall’intersezione in GLn (R), dove n è la dimensione di M . La famiglia di queste
mappe soddisfa le ipotesi richieste.
1.4
Operazioni sui fibrati
Dati uno o più fibrati può essere utile saperne costruire degli altri a partire da
π
questi. Se ad esempio è dato E → M , è naturale aspettarsi che un embedding
di una varietà N in M induca in qualche modo una struttura di fibrato anche
su N . Inoltre, come è stato definito uno strumento che consente di trattare
consistentemente i campi di vettori tangenti ad una varietà, così sarà possibile
costruirne altri per i vettori appartenenti a spazi legati al tangente, ad esempio
il suo duale, e i prodotti tensoriali tra questi.
Alcune di tali costruzioni danno l’occasione di vedere esempi di situazioni in
cui vengono adottate le due diverse prospettive della teoria dei fibrati.
1.4.1
Pullback di un fibrato
π
Siano E → M un fibrato, N una varietà ed f : N → M una mappa differenziabile. Dal momento che π permette, euristicamente, di incollare a ogni punto
di M una copia di F , ci si può aspettare che f permetta di fare lo stesso su N ,
associando a ogni n la fibra di f (n). Ad esempio, se f è un embedding, questo
permette di considerare non solo lo spazio tangente ad n in N , ma anche tutto
il tangente a f (n) in M . Un altro caso che può essere interessante è quello di
una curva γ in M che esprime il moto di un oggetto nella varietà, con F un
gruppo che ne esprime le simmetrie: la traiettoria può non essere iniettiva, ma
ha senso considerare a ogni tempo la fibra del punto in cui ci si trova.
Una tale costruzione è possibile, ed è detta pullback di π: la definirò adottando il punto di vista globale. Sia f ∗ (M ) definita come il sottoinsieme di N ×E
dei punti (p, u) tali che f (p) = π(u), π1 e π2 le restrizioni a questo insieme delle
due proiezioni sui fattori di N × E. Se { (Ui , φi ) }i∈I è un ricoprimento banalizzante per M , la controimmagine di Ui tramite f è aperta in N per ogni i, e gli
CAPITOLO 1. FIBRATI
13
insiemi di questa forma ricoprono N . Dato (p, u) ∈ f ∗ (E) tale che f (p) ∈ Ui , è
possibile definire ψi : f −1 (Ui ) × F → f ∗ (E) tramite
ψi−1 (p, u) = (p, fi )
dove fi è la seconda componente di φ−1
i (u). Questo fornisce una bigezione
tra f −1 (Ui ) × F e π1−1 (f −1 (Ui )), e mostra che π1 è banale su f −1 (Ui ). Se
p ∈ f −1 (Ui ) ∩ f −1 (Ui ), allora fi = tij fj : dato che queste mappe sono lisce, le
rappresentazioni delle transizioni tra le ψi tramite coordinate in N ed F sono a
loro volta C ∞ , e questa costruzione permette di definire una struttura differenziale su f ∗ (E) che renda regolari tutte le funzioni ora definite, in modo che π1
definisca un fibrato. Le mappe di transizione tij sono definite per composizione
con f .
1.4.2
Operazioni su fibrati vettoriali
A fianco dei campi vettoriali, tra i primi oggetti che vengono definiti quando
si introducono le varietà ci sono le forme differenziali: mappe che associano ad
ogni punto p ∈ M un funzionale sul tangente. In maniera del tutto analoga
al fibrato tangente, si può definire il cotangente, la cui fibra sarà il duale dello
spazio tangente.
π
Def 1.4.1 (Fibrato vettoriale): Si dice vettoriale un fibrato E → M la cui fibra
tipica è uno spazio vettoriale V e con gruppo di transizione G un sottogruppo
di Lie di GL(V ).
In generale, a ogni fibrato vettoriale può essere associato il suo duale, cioè
un altro fibrato la cui fibra è lo spazio duale di V .
Richiamo un risultato di algebra lineare: se V è uno spazio vettoriale e
f ∈ End(V ), esiste un’unica f ∗ ∈ End(V ∗ ) tale che, per ogni ϕ ∈ V ∗ e per ogni
v ∈ V valga
(f ∗ (ϕ))(v) = f (ϕ(v))
Inoltre, (IdV )∗ = IdV ∗ , e per f, g ∈ End(V ) vale (f ◦ g)∗ = g ∗ ◦ f ∗ . Infatti,
per ogni ϕ ∈ V ∗ , v ∈ V :
∗
(f ◦ g) (φ) (v) =φ ((f ◦ g) (v)) =
=φ (f (g (v))) =
= (f ∗ (φ)) (g (v)) =
= (g ∗ (f ∗ (φ))) (v) =
= ((g ∗ ◦ f ∗ ) (φ)) (v)
Siano { tij } le mappe di transizione associate al ricoprimento banalizzante
π
{ (Ui , φi ) }i∈I del fibrato vettoriale E → M : definisco τij = t∗ji . Queste funzioni
soddisfano le ipotesi del teorema 1.3.3, e permettono quindi di definire il fibrato
duale E ∗ .
Da un altro risultato di algebra lineare risulta che, per ogni endomorfismo
f di uno spazio vettoriale V , esiste un’unica mappa Λk f ∈ End(Λk V ) tale che
(Λk f )(v1 ∧ · · · ∧ vk ) = f (v1 ) ∧ · · · ∧ f (vk )
CAPITOLO 1. FIBRATI
14
Si verifica che, se f, g ∈ End(V ), allora Λk (f ◦ g) = (Λk f ) ◦ (Λk g), e che
Λk (IdV ) = IdΛk V ; di conseguenza, se f è invertibile lo sarà anche Λk f , e vale
Λk (f −1 ) = (Λk f )−1 .
π
Dato E → M un fibrato vettoriale con fibra V e mappe di transizione tij
rispetto a un certo ricoprimento banalizzante { (Ui , φi ) }i∈I , per ogni p ∈ M si
ha Λk tij ∈ GL(Λk V ): ancora una volta sono soddisfatte le ipotesi del teorema
1.3.3, ed è ben definito il fibrato Λk E con la potenza esterna Λk V come fibra
tipica.
Usando queste due costruzioni si può formalizzare il fibrato delle k-forme
differenziali su una varietà M : da T M si passa a T ∗ M , il fibrato duale, e poi si
passa alla potenza esterna k-esima. Per il fibrato di tutte le forme differenziali,
invece, manca ancora un passaggio.
π
π0
Siano E → M ed E 0 → M 0 due fibrati vettoriali (non necessariamente
sulla stessa varietà) con fibre V e V 0 . Questi inducono una struttura di fibrato
su M × M 0 con fibra V ⊕ V 0 . Se { (Ui , φi ) }i∈I e { (Vj , ψj ) }j∈J sono rispettivi
ricoprimenti banalizzanti, gli aperti della forma Wij = Ui ×Vj ricoprono M ×N .
Dette tii0 e sjj 0 le mappe di transizione, su Wij ∩ Wi0 j 0 sono ben definite rii0 jj 0
che agiscono su V ⊕ V 0 componente per componente. Ancora una volta, si può
definire quello che si usa chiamare il fibrato prodotto, indicato con E × E 0 .
In maniera del tutto analoga si può definire un fibrato su M × M 0 con fibra
V ⊗ V 0 . Se M = M 0 , identificando M con la diagonale ∆ ⊆ M × M tramite
l’immersione ι, il pullback del fibrato prodotto dà quella che si chiama somma
di Whitney (o somma diretta) E ⊕ E 0 , e analogamente si ottiene il prodotto
tensore E ⊗ E 0 . Naturalmente queste due costruzioni possono essere ripetute
con un qualsiasi numero finito di fibrati: in questo modo si ottiene il fibrato
delle forme differenziali su M sommando tutte le potenze k-esime non banali.
Benché ristretti alla sola classe dei fibrati vettoriali, questi esempi danno
un’idea dell’utilità del punto di vista locale presentato sopra, fatta eccezione per
la somma di Whitney e per il prodotto tensore, che coinvolgono un pullback.
1.5
Fibrati principali
π
Def 1.5.1 (Fibrato principale): Un fibrato E → M è detto principale se la fibra
coincide con il gruppo di transizione G, e l’azione è quella sinistra naturalmentee
indotta dalla struttura di gruppo. Tali fibrati sono detti anche G-fibrati su M ,
e spesso il loro spazio totale si indica con P anziché con E.
Nei fibrati principali è ben definita un’azione destra di G su P . Sia u ∈ P ,
U un intorno banalizzante di p = π(u) con trivializzazione φ, g ∈ G tale che
φ(p, g) = u. Per ogni a ∈ G, si definisce:
u a = φ(p, ga)
Il punto u a dipende in effetti solo da a e u, e non dalla particlare scelta di U o
di φ. Se infatti V è un altro intorno banalizzante di p, ψ è la trivializzazione,
con u = ψ(p, h) e t è la mappa di transizione, avrò:
φ(p, ga) = ψ(p, t(ga)) = ψ(p, (tg)a) = ψ(p, ha)
CAPITOLO 1. FIBRATI
15
Inoltre, si tratta proprio di un’azione destra, poiché
(u a) b = φ(p, ga) b = φ(p, (ga)b) = φ(p, g(ab)) = u ab
Oss 1.5.1: L’azione ora definita preserva le fibre: segue immediatamente dalla
definizione che π(u) = π(u a) per ogni u ∈ E, a ∈ G. Essa è libera e transitiva
su ogni fibra, cioè dati comunque punti u1 , u2 ∈ Fp esiste un unico a ∈ G tale
che u1 a = u2 : se φ è un’opportuna trivializzazione locale, con φ(p, g) = u1
e φ(p, h) = u2 , basterà scegliere a = g −1 h, questa è l’unica scelta possibile.
Questa azione è liscia, dato che localmente può essere scritta come composizione
di mappe C ∞ :
u a = φ π (u) , π2 φ−1 (u) a
dove π2 denota la proiezione sul secondo fattore.
Il seguente risultato, seppure molto semplice, merita di essere messo in eviπ
denza per via delle sue implicazioni. La struttura di E → M , come è già stato
osservato, è determinata completamente dalle mappe di transizione: sembra
ragionevole che, se queste non vengono modificate, molte proprietà del fibrato
siano conservate quando si cambia la fibra tipica. Può essere molto interessante
avere un modo canonico per ricondursi a un caso particolare, come quello dei
fibrati principali, che sia più facile da trattare o che si presti a costruzioni più
ricche e flessibili, ed è questo l’obiettivo del prossimo teorema.
Thm 1.5.2: Date due varietà M ed F e un gruppo di Lie G agente a sinistra su
F in maniera liscia, esiste una corrispondenza biunivoca tra le classi di isomorfismo di fibrati su M con fibra F e gruppo di transizione G e quelle di G-fibrati
su M . Inoltre, tale corrispondenza è canonica.
π
Dim: Sia dato E → M un fibrato con fibra F e gruppo di transizione G,
{ (Ui , φi }i∈I un ricoprimento banalizzante. Se { tij } è la famiglia delle mappe
di transizione rispetto a questo ricoprimento, esiste un unico G-fibrato, a meno
di isomorfismo, con le stesse mappe di transizione rispetto al ricoprimento { Ui },
essendo banalmente vere le ipotesi del teorema 1.3.3.
In maniera del tutto analoga, dato un qualsiasi G-fibrato ne esiste uno e uno
solo, sempre a meno di isomorfismo, che soddisfi le richieste.
B
Due fibrati ottenuti l’uno dall’altro tramite la costruzione descritta nella dimostrazione sono detti associati. L’importanza del risultato risiede nel fatto che
molte proprietà di un fibrato sono riassunte in quelle del suo associato. Una di
queste, ad esempio, è la banalità: infatti, questa è equivalente all’esistenza di un
ricoprimento banalizzante le cui mappe di transizione mandino costantemente
nell’identità di G.
Oss 1.5.3: Dato il G-fibrato P , la costruzione di quello associato con fibra F
può essere fatta in maniera alternativa definendo lo spazio totale come quoziente
di un prodotto. Più precisamente, se ρ è l’azione di G su F (l’omomorfismo di
G in un opportuno gruppo di trasformazioni di F che ne definisce l’azione), si
indica con P ×ρ F lo spazio P × F quozientato sulla relazione di equivalenza
data da (u, f ) ∼ (u g, ρ(g)−1 f ); è ben definita una mappa di proiezione π
e data
CAPITOLO 1. FIBRATI
16
da [(u, f )] 7→ π(u). Una trivializzazione locale φi di P può essere impiegata per
definirne una di questa nuova mappa: si definisce ψi (p, f ) = [(φi (p, e), f )]. Se
φj è una trivializzazione il cui dominio interseca quello di φi , varrà:
ψj (p, f ) = [(φj (p, e), f )] = [(φi (p, tij (p)), f )] =
= [(φi (p, e) tij (p), f )] = [(φi (p, e), ρ (tij (p)) f )] = ψi (p, ρ (tij (p)) f )
Dunque le mappe di transizione di questo fibrato sono le stesse di P .
Questa costruzione esplicita sarà utile studiando le connessioni per far ereditare a P ×ρ F della struttura definita su P .
Vale la pena osservare che esiste una corrispondenza biunivoca
tra le sezioni
σ di P ×ρ F e le mappe σ P : P → F che soddisfano σ P u g −1 = ρ(g)σ P (u). Sia
data ad esempio una sezione σ del fibrato. Allora per ogni u ∈ P esiste un unico
f ∈ F tale che σ(π(u)) sia la classe di (p, f ): sia f = σ P (u). Per ogni g ∈ G la
proiezione di u g è uguale a quella di u, e di conseguenza σ(π(u)) = σ(π(u g)),
e (u g, f 0 ) rappresenta la stessa classe di (u, f ) se e solo se f 0 = ρ(g)−1 f . Data
invece una mappa σ P con le proprietà richieste è immediato verificare la buona
definizione di σ(p) = [(u, σ P (u))] per qualsiasi u ∈ Fp .
Un risultato interessante è il seguente:
Thm 1.5.4: Un fibrato vettoriale di dimensione n con gruppo G = GL(V ) è
banale se e solo se ammette n sezioni linearmente indipendenti.
Questo segue da un altro teorema, tenendo conto del fatto che un G-fibrato
è banale se e solo se lo è un suo associato:
Thm 1.5.5:
globale.
Un fibrato principale è banale se e solo se ammette una sezione
Dim: Il G-fibrato banale M × G, fissato un qualsiasi elemento g ∈ G, ammette
l’ovvia sezione s : p 7→ (p, g).
Sia ora s una sezione globale del G-fibrato P . Sarà ben definita una mappa
f : M × G → P data da:
f (p, g) = s(p) g
La differenziabilità di f discende da quelle di s e dell’azione; le proprietà di
quest’ultima mostrano anche la sua bigettività. L’inversa può essere scritta
localmente come composizione di mappe C ∞ , e risulta quindi anch’essa differenziabile. Dunque f è un diffeomorfismo tra M × G e P , e per costruzione
preserva le fibre: è un isomorfismo di fibrati.
B
Anche quando un fibrato principale non è banale, emulando la dimostrazione
appena vista si può dare una procedura per costruire in modo naturale, data una
sezione locale s, una trivializzazione sul suo dominio. Si usa chiamare canonica
questa banalizzazione.
Dim (Teorema 1.5.4): È sufficiente mostrare che in un fibrato vettoriale E n
sezioni globali indipendenti corrispondono ad una sezione globale del principale
associato: questo è equivalente alla banalità di P , che a sua volta coimplica
quella di E. Se V è la fibra di E, una base di V induce un isomorfismo λ tra V ed
CAPITOLO 1. FIBRATI
17
Rn e uno tra GL(V ) e GLn (R) che indico con µ, il quale è anche diffeomorfismo.
Sia { (Ui , φi ) }i∈I un ricoprimento banalizzante di E con mappe di transizione
tij , le µ(tij ) definiscono una famiglia di mappe di transizione per un fibrato E 0
su M con fibra Rn e gruppo GLn (R). Se le ψi sono le trivializzazioni locali
naturalmente associate alla costruzione di E 0 è ben definita una mappa f : E →
E 0 tale che per ogni i
f (φi (p, v)) = ψi (p, λ(v))
Infatti, se p ∈ Ui ∩ Uj , vale
ψj (p, λ(v)) = ψi (p, µ(tij (p)) λ(v)) = ψi (p, λ(tij (p) v))
f è un diffeomorfismo e preserva le fibre, ed è quindi un isomorfismo di fibrati.
In maniera analoga si mostra che il fibrato P 0 associato ad E 0 è isomorfo a P
tramite una mappa naturale definita nello stesso modo di f .
L’ipotesi ulteriore che V sia Rn e che G sia GLn (R), dunque, non lede la
generalità dell’enunciato. Siano ora s1 , . . . , sn sezioni globali indipendenti su E,
e per ogni aperto banalizzante Ui , p ∈ Ui , sia vik (p) tale che
k
φ−1
i (sk (p)) = (p, vi (p))
Detta Mi (p) la matrice ottenuta accostando gli n vettori colonna vik (p), risulta
ben definita la mappa
σ(p) = φi (p, Mi (p))
Dato che i vik (p), fissati p e i, formano una base di Rn , Mi (p) è una matrice
invertibile. La verifica della buona definizione di σ, a questo punto, è immediata:
dalle sk si ricava quindi una sezione globale di P . La costruzione vista, infine,
può essere invertita per mostrare l’implicazione inversa.
B
1.6
Curiosità e considerazioni a posteriori
Es 1.6.1 (Il “teorema della palla pelosa”): Una conseguenza dell’ultimo teorema enunciato, ad esempio, è l’equivalenza tra il cosiddetto teorema della palla
pelosa, secondo il quale ogni campo vettoriale tangente ad S 2 si annulla almeno
in un punto, e la non banalità del fibrato tangente di S 2 . Infatti, se esistesse
un campo tangente mai nullo sarebbe facile costruirne un secondo ortogonale
ad esso, e questi darebbero due sezioni globali indipendenti del fibrato tangente. Per dimostrare il teorema, quindi, è sufficiente studiare T S 2 , o anche il suo
principale associato.
Sia π : SO3 → S 2 la mappa data da g 7→ g e1 , dove la sfera è quella unitaria
in R3 , ed e1 è il primo vettore della sua base canonica. Dato che l’azione è C ∞ ,
π è differenziabile. Si avrà che Tg SO3 = Lg∗ (TId SO3 ) per ogni g, dove Lg è
la naturale azione destra di g su SO3 : identificando TId SO3 con l’algebra di
Lie so3 , e indicando con Jei i suoi generatori standard, si ottiene che per ogni
g ∈ G il tangente in g è generato dai Lg∗ Jei . Siano inoltre γi le curve date da
Lg ◦ exp(tJi ) per un certo g fissato. Con questa notazione è facile mostrare che
il differenziale di π è surgettivo, e che la fibra di ogni punto è diffeomorfa ad S 1 :
avrò che π ◦γ2 e π ◦γ3 sono trasversali in quanto giacciono su piani distinti la cui
CAPITOLO 1. FIBRATI
18
intersezione è ortogonale a Tπ(g) S 2 (rappresentano le due rotazioni attorno agli
assi dati da g e2 e g e3 ), e i loro vettori tangenti al tempo 0 generano Tπ(g) S 2 ,
da cui la surgettività di dπ. Inoltre, π(h) = π(g) se e solo se π(h−1 g) = e1 ,
cioè h−1 g fissa e1 sulla sfera. Questo significa che la fibra di π(g) è il laterale
g SO2 , dove SO2 è identificato con il sottogruppo di Lie di SO3 delle rotazioni
di Span(e2 , e3 ): ogni fibra è quindi diffeomorfa a SO2 ' S 1 .
Dato un punto p ∈ S 2 \ { ±e1 } è possibile costruire in modo canonico una
rotazione gp della sfera
p che manda e1 in p, scegliendo quella che fissa l’ortogonale.
Se p = (x, y, z), r = y 2 + z 2 e θ = arccos(x), tale rotazione è data da
yJe2 + zJe3
gp = exp θ
r
e dipende quindi in maniera liscia da p, e questo vale anche scegliendo ge1 = Id.
Questo permette di costruire la trivializzazione C ∞ di π tramite la mappa
φ1 :(S 2 \ { −e1 }) × SO2
(p, τ )
- SO3
- gp τ
In maniera analoga può essere definita φ2 su S 2 \{ e1 }, associando ad ogni punto
una rotazione che vi mandi −e1 anziché e1 . A questo scopo basta considerare
g−p e scegliere φ2 (p, τ ) = g−p τ . Questo dimostra che la π definita sopra definisce
una struttura di fibrato; non è stato però imposto che sia principale, cioè che
il gruppo strutturale sia S 1 . In effetti, con questa scelta delle trivializzazioni
questo non vale: se φ1 (p, τ ) = φ2 (p, σ), allora:
gp τ = g−p σ =⇒ τ = gp−1 g−p σ
Le mappe di transizione sono dunque della forma gp−1 g−p , che non è una rotazione di Span(e2 , e3 ) poiché ne inverte l’orientazione (e1 va in −e1 ). Se allora
h = exp(πJe2 ), cioè la rotazione di un angolo piatto intorno all’asse di e2 ,
modificando φ2 in modo che sia
φ2 (p, τ ) = g−p hτ
le mappe di transizione diventano della forma
gp−1 g−p h
e sono in effetti rotazioni del piano.
SO3 , dunque, è stato fornito di una struttura di fibrato principale su S 2
con fibra tipica S 1 , identificata con il gruppo delle rotazioni del piano ortogonale a e1 . Inoltre, si può dimostrare che questo fibrato è isomorfo a quello
associato a T S 2 . In effetti, il tangente della sfera ammette delle trivializzazioni
locali costruite in modo analogo a φ1 e φ2 : identificando nuovamente R2 con
Span(e2 , e3 ), siano:
ψ1 (p, v) = gp (v)ψ2 (p, v) = (g−p h)(v)
(1.1)
dove i domini delle ψ1 sono quelli ovvi. A questo punto è evidente, avendo
definito le trivializzazioni dei due fibrati in analisi come l’azione di uno stesso
CAPITOLO 1. FIBRATI
19
oggetto sugli elementi delle rispettive fibra tipiche, che le mappe di transizione
π
sono le stesse. SO3 → S 2 è quindi isomorfo al fibrato principale associato a
2
TS .
Infine, quello introdotto ora non è un fibrato banale: se lo fosse, il suo spazio
totale sarebbe diffeomorfo a S 2 × S 1 , cosa che però non è vera. Esiste infatti
un omomorfismo continuo e surgettivo da S 3 , come sottogruppo moltiplicativo
del corpo dei quaternioni, su SO3 , dato dall’azione per coniugio sull’iperpiano
dei quaternioni puramente immaginari. Il nucleo di tale morfismo è { ± Id },
e si può mostrare che la topologia quoziente di S 3 / { ± Id } è la stessa di SO3 .
Questo spazio, quindi, è ottenuto come quoziente di S 3 (il quale è semplicemente connesso) per l’azione propriamente discontinua del gruppo generato dalla
mappa antipodale. Tale gruppo è isomorfo a Z/2Z, e per un teorema sulla teoria dei rivestimenti si ha che questo è isomorfo al primo gruppo di omotopia si
SO3 . D’altronde, π1 (S 2 ×S 1 ) è isomorfo al prodotto diretto dei singoli gruppi di
omotopia, ed è quindi { Id } × Z ' Z. Dunque SO3 non è omeomorfo a S 2 × S 1 ,
e di conseguenza i due fibrati non sono isomorfi.
Es 1.6.2 (Ancora sul corpo rigido): Alla luce di quanto visto fin qui si possono
fare diverse osservazioni sull’esempio 1.1.2. È chiaro che, in entrambi i casi,
l’oggetto che occorreva formalizzare è un fibrato, rispettivamente su R3 e su S 2 ,
con fibre SO3 e SO2 ' S 1 . Da quanto detto risultava intuitivamente chiaro che
il primo possa essere scritto come R3 × SO3 , mentre non era ancora evidente se
valga una condizione analoga per il secondo: con il linguaggio ora introdotto si
può dire che il primo è un fibrato banale, e che non è ovvio se lo sia anche il
secondo.
I due gruppi SO3 ed S 1 erano stati introdotti per esprimere le simmetrie di
oggetti che si muovono tangenzialmente agli spazi in analisi: una rotazione di
questi oggetti corrisponde ad una dello spazio tangente ad R3 o ad S 2 rispettivamente. Osservato questo, se ne conclude che i fibrati che occorrono in queste
situazioni sono quelli principali associati a T R3 e a T S 2 . Stando così le cose,
la congettura che il primo fosse banale è dimostrata, mentre il secondo non può
esserlo.
Un’altra osservazione interessante è questa: il modo in cui sono state costruite le trivializzazioni locali di questi fibrati (per quanto non fossero stati definiti
come tali) è in sostanza quello menzionato nel precedente paragrafo, sulla falsa
riga della dimostrazione del teorema 1.5.5. Infatti, una volta scelto un punto
di T R3 è stato riconosciuto un modo canonico per costruire a partire da questo
una sezione (in questo caso globale) del fibrato, e da questa la banalizzazione.
Trattando il caso della sfera, invece, non era evidente come scegliere una tale
sezione in modo che fosse globale (in effetti un tale oggetto non esiste, come visto), ma è stato comunque possibile mettere in evidenza la struttura di fibrato
scegliendone due locali.
L’ipotesi che i moti di rotazione fossero tangenziali allo spazio, fatta in questi due casi, non è generale. Ad esempio, nel secondo caso si sarebbe potuto
assumere che il corpo potesse ruotare liberamente intorno al proprio baricentro:
il fibrato che descrive questa situazione non è quello associato al tangente di
S 2 . In questo caso, una rotazione dell’oggetto può essere associata ad una dello
spazio tangente nei punti di S 2 , ma non alla sfera stessa, bensì ad R3 , in cui essa
è immersa. In questo modo appare evidente che l’oggetto “giusto” è il fibrato
CAPITOLO 1. FIBRATI
20
associato al pullback di T R3 tramite l’embedding della sfera nello spazio tridimensionale. Tale fibrato, peraltro, è banale: il pullback menzionato ammette
tre sezioni globali ortonormali date da quelle di T R3 .
Costruzioni di questo tipo possono essere applicate spesso in fisica per esprimere le simmetrie di un dato sistema meccanico. Negli esempi visti sopra il
fibrato considerato è quello associato a un tangente: quest’ultima condizione
è specifica di queste situazioni, e in generale i fibrati considerati saranno sì
principali, ma senza il bisogno che siano associati ad altri più semplici.
Capitolo 2
Connessioni
Da qui in avanti adotterò la convenzione di Einstein per le sommatorie: se in
prodotto compare due volte lo stesso indice, una volta in alto e una in basso, si
intende che la quantità vada sommata su tutti i possibili valori di quell’indice,
salvo indicazioni contrarie.
2.1
Motivazioni; principio d’inerzia
In uno spazio affine A i vettori sono definiti in modo astratto come elementi
della sua giacitura V : si può sempre parlare di “vettore da un punto a un altro”
o di “vettore applicato a un punto” senza bisogno di dare ulteriori specificazioni
sullo spazio a cui questi appartengono, perché si tratta sempre dello stesso (la
giacitura per l’appunto). In questo modo non c’è difficoltà nel definire i campi
vettoriali come funzioni da A in V , né vi è alcuna ambiguità quando si parla
di “campi costanti”. Inoltre, spazi di questo tipo ereditano da Rn anche una
struttura differenziale, tramite la quale lo spazio tangente in qualsiasi punto è
canonicamente isomorfo alla giacitura. La nozione di campo vettoriale, in questo
contesto, è ben definita senza bisogno di distinguere un tangente per ogni punto,
né occorre introdurre alcuna struttura ulteriore sulla collezione di questi spazi:
in definitiva non è evidente il bisogno di parlare di fibrati.
In una generica varietà M le cose non sono così semplici: vettori tangenti
in punti distinti non possono essere confrontati, né tanto meno sommati, in
quanto appartengono a spazi definiti separatamente. Questa è la ragione per
cui, in principio, è stato definito il fibrato tangente. Passando a contesti più
ampi, poi, ci si può imbattere in altre situazioni che si presentano lo stesso
problema, ossia in cui ha senso considerare in ogni punto di M una copia di un
certo oggetto F , ma per qualche ragione è necessario tenerle tutte distinte al
variare del punto in considerazione. La nozione di fibrato è stata introdotta in
definitiva per risolvere questo problema, e ha permesso di definire come sezioni
di una certa mappa le funzioni che a ogni punto assegnano un elemento della
sua copia di F .
Si pone però un altro problema: mentre nel caso degli spazi affini ha senso parlare di campi vettoriali costanti, questo non è possibile in generale, dal
momento che vettori applicati in punti distinti non possono essere confrontati.
L’introduzione del fibrato tangente, in questo caso, non è di aiuto: questo è
21
CAPITOLO 2. CONNESSIONI
22
definito come uno spazio localmente diffeomorfo a U × Rn , U aperto in M , ma
per avere un’identificazione tra il tangente in un punto e lo spazio delle coordinate c’è bisogno di una trivializzazione locale. Questa nella maggior parte dei
casi non è canonica: non è stato stabilito alcun criterio per preferire una banalizzazione ad un’altra, e anzi sono state introdotte le mappe di transizione per
confrontarle nel caso in cui non sia possibile sceglierne una particolare. Inoltre,
quando un fibrato tangente non è banale (come si è visto nel caso della sfera,
ad esempio), non esiste un’identificazione globalmente coerente. Tutte queste
considerazioni valgono in generale per fibrati qualsiasi.
Un altro oggetto che perde di significato passando da spazio affine a varietà
è quello di retta. I primi sono definiti come oggetti su cui la giacitura agisce
secondo determinate regole, ed ha sempre senso, dati un punto p e un vettore
non nullo v, considerare la famiglia del punti della forma p + λv al variare di
λ su R, e chiamare retta questo oggetto, come sottoinsieme su cui Span(v)
agisce secondo le stesse regole degli spazi affini. Nel contesto delle varietà,
invece, i vettori naturalmente legati agli spazi hanno un significato diverso, e il
loro ruolo è quello di descrivere l’andamento delle curve passanti per un dato
punto. Se negli spazi affini ha senso introdurre questo secondo significato dando
loro una struttura differenziale, il contrario non vale: in una generica varietà
non è ovvio come dare un’azione dello spazio tangente in modo da poter fare
costruzioni analoghe. Cambiano leggermente punto di vista, però, e pensando
alle rette affini come curve parametrizzate, esse rappresentano le soluzioni di
una particolare classe di problemi di Cauchy: quelli della forma
(
γ̇ = v
γ(0) = p
In altre parole, le rette sono le curve integrali dei campi costanti. Questo riconduce al problema precedente, ossia quello di stabilire cosa significhi che un
campo è costante: se non ha senso questo, non è nemmeno possibile parlare di
rette come curve con vettore tangente costante.
Da un punto di vista fisico questa osservazione costituisce un problema non
indifferente, poiché compromette il senso del principio di inerzia, secondo il quale un corpo lasciato a se stesso conserva il proprio stato di moto o di quiete,
cioè in definitiva la propria velocità (come grandezza vettoriale). L’intuizione
suggerisce che lo spazio fisico possa essere descritto come R3 (affine), e in questo modo la formulazione del principio d’inerzia secondo cui un corpo che non
venga perturbato da alcuna forza ha velocità costante ha effettivamente senso.
Appena si abbandona questo modello, però, essa perde di significato, e in effetti
limitandosi a questo si corre il rischio di essere troppo restrittivi.
Tanto per cominciare, riprendendo la situazione dell’esempio 1.1.2, ci si può
chiedere che significato assuma il principio d’inerzia per un corpo vincolato a
muoversi su di una sfera (o su una generica superficie) se si dimentica lo spazio
circostante e ci si restringe a questa. È chiaro che in queste condizioni l’oggetto
non potrà muoversi in linea retta come si è abituati a vedere in R3 . Si potrebbe
obiettare che si tratta di un esempio artificioso, e che di fatto un tale corpo è
soggetto alle forze vincolari della superficie, e perciò non costituisce una seria
minaccia al principio d’inerzia, ma vale sempre la domanda: che significato può
assumere tale principio se si considerano spazi diversi da R3 ?
CAPITOLO 2. CONNESSIONI
23
La seguente considerazione può essere più illuminante: perché, nonostante
la nostra percezione sia locale, assumiamo che l’intero spazio possa essere rappresentato da R3 ? In effetti questa ipotesi non è ben giustificata, e sarebbe del
tutto legittimo descrivere lo spazio come una generica 3-varietà Riemanniana.
In questo modo, anche se le regioni che consideriamo si comportano come uno
spazio affine, nulla vieta che problemi su scala più ampia impongano un punto
di vista diverso, e, ancora una volta, vanifichino la nostra formulazione del principio d’inerzia, almeno da un punto di vista teorico. Occorrerebbe dunque un
oggetto che permetta di esprimere l’idea che un certo campo vettoriale (in questo caso la velocità) definito almeno lungo una curva “rimanga costante” lungo
di essa, benché i valori assunti istante per istante non possano essere confrontati.
Questo è soltanto un esempio, in un contesto limitato, di come si renda
necessario uno strumento per studiare alcune proprietà dei campi vettoriali.
In generale, dato un fibrato, può essere interessante domandarsi anche cosa
significhi che una certa sezione “non vari” lungo una data curva. A questo scopo
vengono introdotte le connessioni.
2.1.1
Il punto di vista delle coordinate
Nella definizione di varietà, o di struttura differenziabile, è richiesta l’esistenza locale di sistemi di coordinate compatibili, nel senso che i cambi di carta
debbano essere C ∞ . La maggior parte delle argomentazioni che si fanno oggi
nello studio di questi oggetti, le coordinate sono viste come oggetti transitori
che vengono introdotti all’occorrenza e dimenticati appena possibile. Esiste un
punto di vista, caro alla tradizione passata, utile in alcuni contesti, e largamente
impiegato in fisica, che si concentra invece sulle coordinate, e secondo il quale
molti oggetti vengono definiti attraverso di esse. Ad esempio, campi vettoriali,
tensoriali e forme differenziali vengono introdotti attraverso le regole secondo
cui le coordinate di questi oggetti variano nel passaggio da un sistema di coordinate a un altro. In questo modo, il vettore tangente a una curva γ è definito,
in un particolare sistema di coordinate xk (k = 1, . . . , n), dall’espressione:
γ̇ =
dxi
ei
dt
dove xi (t) sono le coordinate del punto γ(t), mentre il differenziale di una
funzione scalare φ, come forma differenziale, è definita da:
dφ =
∂φ i
dx
∂xi
In quest’ottica, gli oggetti vengono confusi con le loro rappresentazioni in
coordinate, e una stessa quantità, se misurata rispetto a sistemi diversi, può
cambiare. Questo principio è ben evidente in contesto fisico: le coordinate di
uno stesso vettore cambiano a seconda dello specifico sistema di riferimento, e
la forma di una stessa funzione può cambiare nello stesso modo. Si dirà che φ
è una funzione scalare, o semplicemente uno scalare, se le sue rappresentazioni
in coordinate si corrispondono per valore: ad esempio, la temperatura soddisfa
questa condizione, mentre una funzione hamiltoniana, in generale, la viola. Questa definizione equivale sostanzialmente alla richiesta che φ sia una ben definita
funzione su M , a valori reali. Date n funzioni scalari, poi, è chiaro che queste
CAPITOLO 2. CONNESSIONI
24
non possano in generale rappresentare le coordinate di un vettore: le funzioni
costanti ad esempio hanno la medesima rappresentazione in qualsiasi sistema,
ma è evidente che il campo ek , fissato qualche k, dipende fortemente dalla scelta
delle coordinate, benché sia identificato dall’n-upla di funzioni costanti φi ≡ δik .
Si dirà dunque che una famiglia di funzioni rappresentate da X k rispetto a un
h
dato sistema di coordinate xk e da X rispetto a xh se vale
h
X =
∂xh k
X
∂xk
Questa è l’usuale regola di cambiamento di coordinate per i vettori. Adottando
la definizione intrinseca di spazio tangente, questo risultato può essere dimostrato come teorema: secondo questo punto di vista assume invece il valore di
una definizione. In maniera analoga si parla di campi tensoriali qualsiasi, ed è
da questo contesto che nascono le espressioni di vettori “co-” e “controvarianti”:
un vettore non è definito in maniera intrinseca, ma come una collezione di coordinate, e la sua natura è determinata dalle regole con cui queste trasformano se
misurate rispetto a sistemi diversi.
In questo punto di vista il problema sollevato nel precedente paragrafo, cioè
quello di confrontare vettori in punti diversi o di studiare il parallelismo di un
campo lungo una curva, potrebbe non essere tanto evidente. Si potrebbe essere
tentati, dati un campo vettoriale X, una curva γ e un sistema di coordinate in
un opportuno intorno di γ(0), di definire la derivata di X lungo γ come il vettore
che abbia per componenti le derivate temporali delle componenti di X(γ(t)). Se
nell’ottica precedente tutto questo non poteva essere fatto per un problema di
cattiva definizione, ora tutto questo ha senso ed è lecito: la rappresentazione
di X in coordinate non è altro che una funzione definita su un aperto di Rn e
a valori in Rn , mentre la rappresentazione di γ è una curva in questo aperto,
lungo la quale ha senso derivare la definizione. Quello che non è vero in generale,
però, è che ciò che si ottiene sia un “vettore” nel senso ora introdotto: non è
detto cioè che questa operazione, rispetto a due sistemi distinti, dia risultati
compatibili, cioè che si ottengano oggetti che variano secondo le date regole di
trasformazione. In effetti, si può verificare che:
j
∂ 2 xj ∂xl h ∂xj ∂xl ∂X h
∂X
=
X +
k
∂xl ∂xh ∂xk
∂xh ∂xk ∂xl
∂x
(2.1)
e la violazione alla regola di trasformazione è data dal primo termine della
quantità a destra. Dunque non è ben definita la derivazione del campo lungo
la direzione data da ek , nel senso che l’oggetto che si ottiene non è di natura
vettoriale. Un modo per aggirare questo ostacolo è quello di definire un nuovo
operatore differenziale che faccia le veci dell’usuale derivata parziale, in modo
che il termine indesiderato sia dovuto alla trasformazione dell’operatore, e non
a quella dell’oggetto ottenuto per derivazione.
Questo punto di vista è trattato in maniera approfondita e dettagliata (presentando anche i calcoli qui omessi) in [5].
2.2
Connessioni affini
Alla luce delle considerazioni fatte nel precedente paragrafo, occorre definire un
oggetto che consenta di stabilire quando un certo campo vettoriale tangente a
CAPITOLO 2. CONNESSIONI
25
una varietà M definito su una curva γ sia parallelo a se stesso in ogni punto,
e in caso contrario di misurarne la variazione nel tempo. Prima di definire assiomaticamente un simile strumento è utile considerare un caso particolarmente
semplice: quello delle varietà immerse in Rn .
2.2.1
La derivata covariante in sottovarietà di Rn
Sia M un’ipersuperficie di Rn , cioè una sottovarietà di dimensione n − 1. Nei
corsi istituzionali di introduzione alla geometria sono stati definiti la mappa
di Gauss associata ad una parametrizzazione regolare e l’operatore forma, o di
Weingarten 1 . Richiamo rapidamente che la prima è definita come l’applicazione che assegna ad ogni punto di un aperto parametrizzato di M l’unico vettore
unitario N ortogonale ad essa che completi a base positiva quella indotta sul tangente dalle coordinate locali. N (p) ha una dipendenza multilineare e alternante
dagli elementi del riferimento su Tp M e pertanto dà una mappa differenziabile
a valori in S n−1 definita sull’aperto. Il tangente ad M in p e quello alla sfera nella sua immagine coincidono (come sottospazi vettoriali di Rn ), pertanto
l’applicazione lineare indotta L può essere vista come un endomorfismo di Tp M ,
che porta il nome appunto di operatore di Weingarten. Esso è autoaggiunto rispetto al prodotto scalare naturalmente indotto da quello standard dello spazio
ambiente, e per il teorema spettrale ammette una base ortonormale di autovettori, detti direzioni principali, mentre gli autovalori, tutti reali, si chiamano
curvature principali. Il loro prodotto, ossia il determinante di L, porta il nome
di curvatura gaussiana di M .
D’ora in avanti adotterò la convenzione, comune nel linguaggio delle varietà
C ∞ , per cui lo spazio tangente ad M in un punto è quello delle derivazioni.
In questo modo, la velocità γ̇(t) di una curva è identificata con l’operatore che
assegna ad ogni funzione f : M → R la derivata di f ◦ γ al tempo t. Per un
generico vettore X ∈ Tp M , quindi, la notazione Xf assume questo significato,
a meno di scegliere un’opportuna curva che passi per p al tempo 0 con velocità
X; f X, invece, indica l’usuale prodotto per scalare di X per il valore di f in p.
Se Y è un campo vettoriale definito in un intorno di p ∈ M , X un vettore in
p, lo strumento più immediato per valutare la variazione di Y lungo X in p è la
derivata direzionale del campo come applicazione da M in Rn . Questo dà come
risultato un nuovo vettore DX Y di Rn . Se X e W sono vettori in un punto p,
Y , Z campi vettoriali ed f una funzione, definiti in un intorno di p, vale:
DX (Y + Z) = DX Y + DX Z
DX+W Y = DX Y + DW Y
DX (f Y ) = f DX Y + (Xf )Y
(2.2)
Df X Y = f DX Y
La seconda e la quarta proprietà esprimono la linearità di DX Y come funzione della sola X, mentre la prima e la terza rappresentano un analogo per la
regola di Leibnitz per D, e cioè il fatto che questo operatore agisce su Y come
una derivata. Se poi X è un campo liscio, anche quello così ottenuto lo è.
Va osservato che, in generale, l’operatore D non dà vettori tangenti a M : se
ad esempio γ(t) è la curva piana data da (cos(t), sin(t)), il suo vettore velocità è
1 Questo
per le superfici regolari in R3 , ma non c’è difficoltà nel passaggio al caso generale.
CAPITOLO 2. CONNESSIONI
26
Y (t) = (− sin(t), cos(t)), e Dγ̇(0) Y (t) = (− cos(t), − sin(t)), che non è tangente
alla circonferenza parametrizzata da γ. D’altra parte, un qualsiasi vettore in un
punto di M può essere decomposto in modo unico come somma di uno tangente
alla varietà ed uno ortogonale ad essa, e ha perfettamente senso la seguente:
Def 2.2.1 (Derivata covariante): Siano p un punto di una sottovarietà M di
Rn , X un vettore tangente ad M in p e Y un campo definito in un intorno di p
(in M ). Si chiama derivata covariante di Y lungo X il vettore DX Y dato dalla
componente di DX Y tangente ad M .
L’oggetto così definito valuta la derivata di Y , come mappa in Rn anziché
come sezione del fibrato tangente, lungo qualsiasi curva che abbia velocità X,
e ne trascura la componente ortogonale ad M . Euristicamente, l’informazione
che si ottiene in questo modo è la variazione di Y che potrebbe essere misurata
da un osservatore che vive in M senza accorgersi che questa è immersa in Rn .
Dati X ed Y come sopra, varrà costantemente hN, Y i = 0, da cui:
0 = X hN, Y i = hN, DX Y i + hL(X), Y i
Questo implica che la coordinata di DX Y ortogonale ad M (data dal prodotto
scalare con N essendo questo unitario e ortogonale a Tp M ) è data dall’opposto
di hL(X), Y i, e dunque che
DX Y = DX Y + hL(X), Y i N = DX Y + hX, L(Y )i N
Questa relazione porta il nome di equazione di Gauss. Dalla linearità di L segue
che la derivata covariante gode delle stesse proprietà enunciate per D.
La definizione ora data fornisce già uno strumento utile per formalizzare il
semplice problema fisico del moto vincolato, e in definitiva di formulare il principio d’inerzia per punti materiali soggetti a vincoli olonomi. Un oggetto libero
di muoversi nello spazio tridimensionale, cioè su cui non agisca alcuna forza
esterna, soddisfa la relazione v̇ = 0, dove v indica il vettore velocità. Se invece
il moto è ristretto a una superficie, l’assenza di altre forze che quella di reazione
del vincolo è equivalente alla richiesta che l’accelerazione sia ortogonale a questo: la condizione è dunque che Dv v abbia componente tangenziale nulla ad ogni
tempo, cioè Dv v = 0. In questo modo, quindi, il principio d’inerzia conserva
la sua forma originale, a meno di considerare la derivata della velocità lungo la
traiettoria in un senso diverso da quello solito: occorre impiegare la nuova derivata covariante, naturalmente legata alla struttura del vincolo, anziché quella
usuale a cui si è abituati in R3 .
Siano dati X, Y e Z campi vettoriali qualsiasi, definiti su uno stesso intorno
(in Rn ) di un punto p. Applicando la definizione di derivata di Lie a ciascuna
componente di Z si ottiene:
DX (DY Z) − DY (DX Z) − D[X,Y ] Z = 0
Se si suppone che i tre campi siano tangenti ad un’ipersuperficie in Rn , la derivata direzionale D può essere riscritta tramite l’equazione di Gauss in termini
della derivata covariante D e della metrica riemanniana che M eredita dallo
spazio ambiente. Sostituendo nella relazione appena scritta e ricomponendo Z
CAPITOLO 2. CONNESSIONI
27
si ottiene:
DX (DY Z) = DX DY Z − hL(Y ), Zi N =
= DX DY Z − hL(Y ), Zi N − hL(X), DY Xi N =
= DX DY Z − hL(Y ), Zi L(X) − (X hL(Y ), Zi + hL(X), DY Xi)N
DY (DX Z) = DY DX Z − hL(X), Zi L(Y ) − (Y hL(X), Zi + hL(Y ), DX Y i)N
D[X,Y ] Z = D[X,Y ] Z − hL([X, Y ]), Zi N
Sommando e separando i contribuiti tangenziali ad M da quelli ortogonali
si ottengono le equazioni:
DX DY Z − DY DX Z − D[X,Y ] Z = hL(Y ), Zi L(X) − hL(X), Zi L(Y )
DX L(Y ) − DY L(X) − L([X, Y ]) = 0
(2.3a)
(2.3b)
dove nella (2.3b) sono stati sommati i coefficienti con cui compariva N nella
somma, e sono state applicate la bilinearità del prodotto scalare e l’arbitrarietà
di Z. La (2.3a) si chiama equazione della curvatura di Gauss, la (2.3b), invece,
equazione di Codazzi (o Codazzi-Mainardi).
L’equazione della curvatura di Gauss mette in evidenza che, dati X, Y e Z
tangenti ad M , in un punto p fissato l’oggetto
R(X, Y )Z := DX DY Z − DY DX Z − D[X,Y ] Z
dipende solo dai valori dei campi in p, ed è lineare in ciascuno argomento.
Inoltre, R è espresso in termini della sola derivata covariante, senza riferimenti
espliciti all’embedding di M in Rn (a cui l’operatore di Weingarten è prodondamente legato), e sembra in qualche senso definito a partire dalla sola struttura
intrinseca di M dato che, come osservato sopra, la stessa derivata covariante
è stata introdotta nel tentativo di studiare delle proprietà delle superficie che
prescindono dalla sua immersione.
Un risultato classico ed interessante è il seguente:
Thm 2.2.1 (Theorema Egregium di Gauss): La curvatura di una superficie
in R3 può essere espressa in termini della metrica riemanniana e della derivata
covariante.
Dim: Se p ∈ M e X, Y ∈ Tp M formano una base ortonormale, allora K(p), la
curvatura gaussiana in p, è data da hR(X, Y )Y, Xi. Infatti:
hR(X, Y )Y, Xi = hhL(Y ), Y i L(X) − hL(X), Y i L(Y ), Xi =
= hL(Y ), Y i hL(X), Xi − hL(X), Y i hL(Y ), Xi = det L = K(p)
B
La curvatura gaussiana di un’ipersuperficie è stata inizialmente definita a
partire dall’operatore di Weingarten: ora questo teorema mostra che, almeno
nel caso particolare di superfici nello spazio tridimensionale, essa può essere
espressa in termini di oggetti che, almeno euristicamente, sono legati alla natura intrinseca di M , cioè alla sua metrica e alla derivata covariante. Si può
CAPITOLO 2. CONNESSIONI
28
mostrare, poi, che quest’ultima può essere costruita a partire dalla metrica stessa, a prescindere dall’immersione e dall’operatore D dal quale era iniziata la
discussione (si veda la sezione 2.2.3). Di conseguenza, la curvatura gaussiana
può essere espressa in funzione della sola metrica riemanniana della superficie,
benché inizialmente sia stata introdotta in termini di oggetti strettamente legati
all’embedding.
2.2.2
Connessioni affini su varietà generiche
Quanto visto nella sezione precedente, limitato al caso ristretto di ipersuperfici
in Rn , servirà ora a giustificare delle nuove definizioni. Sia dunque M una
generica varietà differenziabile.
Def 2.2.2 (Connessione affine): Per connessione affine su M si intende un
operatore D che, dati un vettore X ∈ Tp M e un campo Y in un intorno U di
p, assegna loro un vettore DX Y tale che soddisfi le condizioni (2.2). È inoltre
richiesto che, se X è un campo su U , DX Y definisca a sua volta un campo C ∞ .
Sono naturali, a questo punto, le seguenti:
Def 2.2.3 (Trasporto parallelo): Un campo vettoriale X definito lungo una
curva γ si dice parallelo (rispetto alla connessione D) se vale
DT X ≡ 0
T = γ̇ essendo il vettore tangente a γ. Se X è definito su un aperto, e soddisfa
la condizione data, si dice che è parallelo lungo γ.
Def 2.2.4 (Geodetica): Una curva γ si dice geodetica se il suo vettore tangente
T è parallelo:
DT T ≡ 0
Se e1 , . . . , en sono campi vettoriali linearmente indipendenti definiti in un
aperto U (cioè formano una base del tangente che varia in modo liscio sull’aperto), sono naturalmente definite n forme differenziali ω 1 , . . . , ω n caratterizzate
da hω i , ej i = δji . Inoltre, la linearità di DX Y rispetto a X, saranno ben definite
delle forme ωji caratterizzate da:
hωji , Xi = hω i , DX ej i
Questo consente di introdurre quello che si usa chiamare il “punto di vista di
Cartan”, che consiste nello studio delle connessioni per mezzo di forme differenziali. Questo punto di vista sarà ripreso più avanti per studiare i tensori
di curvatura e torsione, e poi ancora per proporre un collegamento tra la teoria delle connessioni su fibrati e il punto di vista locale adottato nelle teorie di
gauge.
Una volta dati campi ei come sopra, le proprietà di D consentono di determinare completamente la connessione una volta noti i coefficienti Γkij definiti
CAPITOLO 2. CONNESSIONI
29
da:
Dei ej = Γkij ek
Infatti, se X = X i ei e Y = Y j ej , varrà:
DX Y = DX (Y j ej ) =
= X(Y j )ej + Y j DX ej =
= X(Y j )ej + Y j DX i ei ej =
= (X(Y k ) + Γkij X i Y j )ek
Secondo il punto di vista di Cartan questi coefficienti Γkij sono quelli che individuano le forme ωji : da hωji , ek i = hω i , Dek ej i = Γikj segue l’uguaglianza
ωji = Γikj ω k .
Dato che ogni carta permette di definire una base del tangente in ciascun
punto dell’aperto, ad ogni sistema di coordinate possono essere associati i coefficienti della connessione Γkij . È evidente che, dato un aperto coordinato U
e una qualsiasi famiglia di n3 funzioni, esiste un’unica connessione D su U i
cui coefficienti rispetto alle date coordinate siano quelle assegnate. Può essere
interessante, dati due aperti coordinati con intersezione non vuota e delle funk
zioni Γkij e Γij associate rispettivamente ai due sistemi, sotto quali ipotesi queste
famiglie definiscano la stessa connessione sull’intersezione delle carte; equivalentemente, questo corrisponde a cercare le regole di trasformazione dei coefficienti
di una connessione.
Siano ϕ, ψ coordinate definite su uno stesso aperto U , con
ϕ(p) = (x1 (p), . . . , xn (p))
ψ(p) = (y 1 (p), . . . , y n (p))
e basi associate rispettivamente (ei ) ed (fj ). Allora vale:
fj =
∂xi
ei
∂y j
k
da cui, essendo rispettivamente Γkij e Γij i coefficienti di D associati ai sistemi:
k
Γij
∂xm
k
em =Γij fk = Dfi fj =
∂y k
h ∂x
∂ 2 xh
∂xl ∂xh
eh =
eh + i j Del eh =
=Dfi
j
i
j
∂y
∂y ∂y
∂y ∂y
2 m
l
h
∂ x
∂x ∂x
=
+ i j Γm
em
∂y i ∂y j
∂y ∂y lh
k
Da questa relazione è possibile ricavare Γij , ricordando che lo Jacobiano del
cambio di carta è invertibile:
k
Γij =
∂xl ∂xh ∂y k m
∂ 2 xm ∂y k
Γlh + i j m
i
j
m
∂y ∂y ∂x
∂y ∂y ∂x
(2.4)
Dunque questa è la regola di trasformazione dei coefficienti di una connessione.
D’altra parte, naturalmente, dato un aperto coordinato U e una famiglia di
CAPITOLO 2. CONNESSIONI
30
funzioni Γkij , esisterà un’unica connessione che abbia queste come coefficienti.
Questa potrà essere estesa ad un altro aperto coordinato con altri coefficienti se
e solo se le due famiglie soddisfano la regola di trasformazione, poiché solo in
questo caso definiscono la stessa connessione sull’intersezione.
Il secondo termine della (2.4) somiglia a quello “indesiderato” in (2.1): in
effetti, sostituendo l’operatore D alle “derivate direzionali” (mal definite) del
campo considerato in quel contesto, si ottiene una regola di trasformazione che,
tenendo conto della relazione tra i coefficienti della connessione nelle varie carte,
mostra che il risultato ottenuto è in effetti un vettore, secondo il senso del punto
di vista delle coordinate.
Naturalmente, dare le regole di trasformazione per i coefficienti Γkij è equivalente a dare quelle per le forme ωji . Se le ω ij sono le forme associate al sistema
ψ, ricordando che in questo caso ω i = dxi e ω j = dy j , si dovrà avere:
i
ω ij =Γkj dy k =
l
∂x ∂xh ∂y i m
∂ 2 xm ∂y i ∂y k a
=
Γ
+
dx =
∂y k ∂y j ∂xm lh ∂y k ∂y j ∂xm ∂xa
m k
i
h
∂
∂x
∂y ∂y i
l ∂x ∂y
m
= δa j
Γ +
dxa =
∂y ∂xm lh ∂y k ∂y j ∂xa ∂xm
m
∂x
∂y i
∂xh ∂y i m l
Γlh dx +
d
= j
=
m
m
∂y ∂x
∂x
∂y j
∂y i
∂xm
∂xh ∂y i m
ω
+
d
= j
∂y ∂xm h
∂xm
∂y j
(2.5)
Questa equazione dà le condizioni affinché, date delle 1-forme su aperti della
varietà, queste possano essere usate per costruire una connessione. Nel contesto
delle teorie di gauge questo punto di vista si rivela fondamentale.
Oss 2.2.2: Fissato un sistema di coordinate, le ωji sono forme differenziali a
tutti gli effetti: l’introduzione delle loro regole di trasformazione è resa necessaria
dal fatto che le forme associate a due carte sono a priori del tutto indipendenti.
Queste regole, quindi, non esprimono come siano rappresentate le ωji di una carta
rispetto ad un’altra (il che sarebbe banale, perché le regole di trasformazione di
una 1-forma sono note), bensì il legame tra queste e quelle di un altro aperto
coordinato.
La rappresentazione della connessione tramite questi coefficienti permette di
mostrare degli interessanti risultati di esistenza e unicità di campi paralleli e
geodetiche.
Thm 2.2.3: Sia data γ : [a, b] → M una curva liscia, e sia X0 ∈ Tp M , con
p = γ(a). Allora esiste un unico campo vettoriale X definito lungo γ, parallelo
e tale che X(γ(0)) = X0 .
Oss 2.2.4: Per “campo vettoriale definito lungo γ” intendo una mappa differenziabile definita su [a, b] che assegna a ogni t un vettore X(t) ∈ Tγ(t) M . Secondo
il linguaggio dei fibrati, un oggetto come questo non è altro che un sollevamento
di γ rispetto alla proiezione del fibrato tangente: quello che si cerca, infatti,
CAPITOLO 2. CONNESSIONI
31
è una nuova curva, definita sullo stesso dominio di γ ma a valori nello spazio
totale del fibrato, in modo che π ◦ X = γ. Non è detto che un campo in questo
senso possa essere esteso un aperto contenente la traccia di γ: ad esempio la
curva potrebbe non essere iniettiva, e X potrebbe avere valori diversi a tempi
in cui questa passa dallo stesso punto.
Dim (teorema 2.2.3): Ogni punto t ∈ [a, b] ammette un intorno connesso
controimmagine di un aperto coordinato. A meno di scegliere un’opportuna
famiglia finita di sottoinsiemi di questo tipo (la cui esistenza è garantita dalla
compattezza dell’intervallo), si può supporre che la traccia di γ giaccia per intero
in un aperto coordinato.
Dato un generico campo vettoriale X, la sua derivata covariante lungo il
vettore T della velocità di γ è espressa in coordinate da:
dX k
+ Γkij (γ(t))ẋi X j ek
DT X = T (X k ) + Γkij (γ(t))T i X j ek =
dt
dove le xi (t) rappresentano le coordinate di γ(t). Il problema del trasporto
parallelo è dunque ricondotto a quello di Cauchy:

k
 dX
+ Γkij (γ(t))ẋi X j = 0
(2.6)
dt
 i
X (a) = X0i
Questo problema ammette un’unica soluzione (per via del teorema di CauchyLipschitz), e questa può essere estesa a tutto l’intervallo poiché l’equazione è
lineare.
B
Questo risutlato permette di parlare in maniera consistente di trasporto
parallelo di un vettore lungo una curva. Dati due punti p, q ∈ M , un arco γ
che li connette e un vettore X ∈ Tp M , quindi, è possibile costruire un unico
X 0 ∈ Tq M per parallelismo lungo l’arco. Tuttavia, la scelta del cammino è
tutt’altro che indifferente: il ruolo giocato da questa sarà uno degli argomenti
del prossimo capitolo.
Thm 2.2.5: Se p ∈ M , X0 ∈ Tp M , esistono una costante reale positiva ε e
un’unica geodetica γ : (−ε, ε) → M passante in p al tempo 0 con vettore velocità
X.
Dim: Data una curva γ a valori in un intorno parametrizzato di p, con vettore
velocità T , vale:
DT T = T (T k ) + Γkij (γ(t))T i T j ek = ẍk + Γkij (γ(t))ẋi ẋj ek
Una curva γ realizza dunque la tesi del teorema se e solo se
 k
k
i j

 ẍ + Γij (γ(t))ẋ ẋ = 0
γ(0) = p


γ̇(0) = X0
CAPITOLO 2. CONNESSIONI
32
Esplicitando le coordinate di γ questo sistema assume la forma di un problema
di Cauchy; da qui, nuovamente per il teorema di Cauchy-Lipschitz, si ha la tesi.
B
Una volta che sia data una connessione su una varietà è naturale cercare
di estendere l’operatore in modo da poter derivare campi tensoriali generici,
anziché solo quelli vettoriali. Il principio guida in questa estensione sarà la
regola di Leibnitz: come si è richiesto che DX (f Y ) = X(f )Y + f DX Y , così sarà
naturale imporre che, dati campi tensoriali T1 e T2 valga
DX (T1 ⊗ T2 ) = (DX T1 ) ⊗ T2 + T1 ⊗ (DX T2 )
oltre alle regole di linearità. Inoltre, se ω è una 1-forma e Y un campo, è naturale
chiedere che valga
X(hω, Y i) = hDX ω, Y i + hω, DX Y i
(2.7)
In coordinate, scegliendo X = ei , Y = ej e ω = dxk e applicando la (2.7) si
ottiene
0 = hDei dxk , ej i + Γkij
=⇒
Dei dxk = −Γij k dxj
Queste regole sono sufficienti per determinare completamente la derivata covariante di qualsiasi campo tensoriale lungo una direzione.
I tensori di curvatura e torsione
Nel caso delle ipersuperfici l’equazione di curvatura di Gauss permette di confrontare un oggetto espresso esclusivamente in termini della derivata covariante
con una che dipende dalla struttura metrica e dall’immersione, e questo consente in dimensione 2 di dimostrare il Theorema Egregium, secondo il quale la
curvatura dipende solo da questo oggetto (fissata la metrica).
Sia data una connessione su M , e siano fissati campi vettoriali X e Y . La
mappa
R(X, Y ) : Z 7→ DX DY Z − DY DX Z − D[X,Y ] Z
fornisce un quarto campo il cui valore dipende linearmente da quello di Z puntualmente, e non da quelli assunti in un intorno. La linearità per somma è
infatti evidente, mentre quella per prodotto per scalare è data dalla somma di:
DX DY Z = f DX DY + X(f )DY Z + X(Y (f ))Z + Y (f )DX Z
−DY DX Z = −f DY DY Z − Y (f )DX Z − Y (X(f ))Z − X(f )DY Z
−D[X,Y ] Z = −f D[X,Y ] Z − [X, Y ](f )Z
Se poi e1 , . . . , en sono campi vettoriali indipendenti, la rappresentazione di Z
rispetto a questa base mostra che R(X, Y )Z in un punto p dipende solo dai
valori in p delle coordinate. Dunque R così definito assegna ai campi vettoriali
X e Y un campo tensoriale del tipo (1, 1). Inoltre, R(X, Y ) dipende in modo
bilineare da X e Y (la verifica è analoga a quella appena fatta e non presenta
alcun particolare interesse, pertanto la ometto). Dunque R è un tensore del tipo
(1, 3) su M .
Def 2.2.5 (Tensore di curvatura):
tensore R dato da
Si chiama curvatura di una connessione il
R(X, Y )Z = DX DY Z − DY DX Z − D[X,Y ] Z
CAPITOLO 2. CONNESSIONI
33
Dalle proprietà di linearità della derivata covariante rispetto alla direzione
e dall’antisimmetria della parentesi di Lie è immediato verificare che R è alternante rispetto a X e Y . Per questa ragione si usa dire che la curvatura è una
2-forma a valori in End(T M ).
In questa nuova notazione, l’equazione di curvatura di Gauss è scritta come:
R(X, Y )Z = hL(Y ), Zi L(X) − hL(X), Zi L(Y )
L’equazione di Codazzi, invece, non può essere espressa nello stesso modo,
poiché le quantità coinvolte mescolano la derivata covariante con gli altri oggetti
legati alla struttura di varietà immersa. Si usa però dare la seguente:
Si chiama torsione di una connessione il
Def 2.2.6 (Tensore di torsione):
tensore dato da:
Tor(X, Y ) = DX Y − DY X − [X, Y ]
Anche in questo caso le verifiche delle proprietà di linearità sono immediate
e poco interessanti, e pertanto le ometto. Come per il tensore di curvatura,
anche questo è antisimmetrico rispetto ai due argomenti.
Siano U un aperto ed e1 , . . . , en n campi vettoriali indipendenti, come nell’introduzione del punto di vista di Cartan. Le proprietà di linearità e alternanza
dei tensori ora definiti consentono di rappresentarli come
R(X, Y )ej = Rji (X, Y )ei
Tor(X, Y ) = T i (X, Y )ei
dove le Rji e le T i sono opportune 2-forme. Queste saranno naturalmente legate
alle ω i e alle ωji introdotte sopra: le equazioni che esprimono questa relazione
sono chiamate equazioni di struttura di Cartan, e sono equivalenti alle definizioni
dei tensori.
Rji (X, Y )ei =R(X, Y )ej =
=DX DY ej − DY DX ej − D[X,Y ] ej =
=DX ωji (Y )ei − DY ωji (X)ei − ωji ([X, Y ])ei =
=X(ωji (Y ))ei + ωji (Y )ωik (X)ek − Y (ωji (X))ei − ωji (X)ωik (Y )ek +
− ωji ([X, Y ])ei =
= hdωji , X, Y i + hωki i ∧ ωjk , X, Y ei
Da qui si ricava una delle equazioni di Cartan:
dωji = Rji − ωki ∧ ωjk
(2.8)
L’altra può essere ottenuta in modo del tutto analogo dalla definizione di torsione:
dω i = T i − ωji ∧ ω j
(2.9)
CAPITOLO 2. CONNESSIONI
34
L’ultimo punto di vista ancora da analizzare è quello delle coordinate. Supponendo che la base e1 , . . . , en sia quella indotta da un sistema di coordinate,
si avrà
ω i = dxi
ωji = Γikj dxk
i
T i = Tjk
dxj ⊗ dxk
i
Rji = Rjkh
dxk ⊗ dxh
(2.10)
i
i
dove si può facilmente riconoscere che Tjk
= T i (ej , ek ) e che Rjkh
= Rji (ek , eh ).
In questa notazione, le equazioni strutturali di Cartan assumono la forma:
∂Γijk
∂Γijh
i
−
+ Γirk Γrjh − Γirh Γrjk
Rjkh
= dωji + ωri ∧ ωjr (ek , eh ) =
k
h
∂x
∂x
i
Tjk
= dω i + ωri ∧ ω r (ej , e, k) = Γikj − Γijk
Confronto tra connessioni
e connessioni affini su una varietà M . Applicando la definizione si
Siano D, D
può mostrare facilmente che l’operatore
e X Y := DX Y − D
eX Y
(D − D)
è lineare in ciascuna entrata, anche per coefficienti non costanti. La linearità in
X segue infatti da quella di ciascuna connessione, così come quella per somma
in Y . Inoltre, l’operatore commuta con il prodotto per scalare in Y , infatti:
e X (f Y ) = (D − D)
e X Y + X(f )Y − X(f )Y = (D − D)
e XY
(D − D)
Da questo segue che la differenza B tra due qualsiasi connessioni su M è un
campo tensoriale del tipo (1, 2). Inoltre, è immediato verificare che, dati una
e definito
connessione D e un campo tensoriale T di tipo (1, 2), l’operatore D
come D + T è una connessione. Questo permette di considerare sull’insieme
delle connessioni su M una struttura di spazio affine su T21 (M ).
e sono due connessioni che definiscono lo stesso trasporto
Lemma 2.2.6: Se D, D
parallelo (cioè tali che un campo X è parallelo lungo γ rispetto a D se e solo se
e allora sono uguali.
lo è rispetto a D),
Dim: Sia p ∈ M , con X0 , Y ∈ Tp M , e sia X il trasporto parallelo di X0 rispetto
a D lungo una curva che abbia Y come vettore tangente. Allora X è parallelo
e e dunque
anche rispetto a D,
e Y X = B(Y, X(p)) = B(Y, X0 )
0 = DY X − D
Per l’arbitrarietà di X0 e Y si conclude che B ≡ 0, e dunque la tesi.
B
Questo risultato permette di affermare che una connessione affine è biunivocamente determinata dal suo trasporto parallelo. Per verificare che due connessioni siano uguali, quindi, è sufficiente mostrare che i campi paralleli rispetto
all’una lo sono anche rispetto all’altra, e viceversa.
CAPITOLO 2. CONNESSIONI
35
Il tensore differenza può essere scomposto in maniera unica come somma
di uno simmetrico e uno antisimmetrico rispetto ai due indici covarianti. Sia
B = S + A tale scomposizione: una proprietà interessante di A è che può essere
espresso in termini dei soli tensori di torsione delle due connessioni:
2A(X, Y ) = B(X, Y ) − B(Y, X) =
e X Y − DY X + D
e Y X − [X, Y ] + [X, Y ] =
= DX Y − D
g
= Tor(X, Y ) − Tor(X,
Y)
È particolarmente interessante il caso in cui B = A, cioè B è antisimmetrico: in questo caso, se γ è una geodetica rispetto alla connessione D, varrà
e T T = DT T − B(T, T ) = DT T , e dunque γ è una geodetica anche rispetto
D
e Viceversa, se le due connessioni hanno le stesse geodetiche, dato un veta D.
tore X qualsiasi varrà B(X, X) = 0: per mostrarlo è sufficiente considerare la
geodetica con velocità X al tempo 0.
Questo risultato mostra che non è possibile ricostruire una connessione conoscendo solo le sue geodetiche: essa sarà determinata a meno di un campo di
torsione. Inoltre, data una connessione qualsiasi è possibile costruirne una con
le stesse geodetiche e torsione assegnata, e questa sarà unica.
2.2.3
Il caso di varietà riemanniane
Nel seguito, per ogni oggetto espresso tramite più indici, indicherò il simmetrizzato rispetto a due di essi racchiudendoli tra parentesi tonde, e l’antisimmetrizzato con le quadre. Ad esempio, si potranno esprimere i coefficienti del tensore
di torsione come Tijk = 2Γk[ij] .
Il lavoro svolto finora costituisce un buon punto di partenza nella ricerca dello strumento che occorre per studiare problemi come quelli presentati all’inizio,
poiché mette in luce le proprietà che deve avere l’oggetto cercato per soddisfare
le nostre richieste ed elabora alcuni aspetti di linguaggio utili nella sua manipolazione. Tuttavia, in quanto visto finora non è stato presentato alcun risultato
di esistenza e unicità di connessioni, e anzi le ultime osservazioni del paragrafo
precedente mostrano che un tale risultato non può esistere, a meno di imporre
delle ulteriori restrizioni sulla connessione da costruire. A priori non ci sono
delle condizioni naturali da aggiungere, ma nel caso in cui la varietà su cui si
lavora abbia della struttura aggiuntiva può darsi che sia questa a suggerirle.
Il contesto in cui si affrontano generalmente i problemi di meccanica è quello
delle varietà provviste di una metrica riemanniana o pseudo-riemanniana. In
questo caso è ragionevole richiedere che, se X e Y sono campi vettoriali paralleli
lungo una curva γ, il prodotto scalare di questi sia costante. Tale condizione
può essere espressa chiedendo che il tensore metrico sia parallelo lungo qualsiasi
direzione. Sia infatti γ una curva in un aperto coordinato di M con γ(0) = p,
X, Y campi vettoriali lungo γ ottenuti per trasporto parallelo di due vettori X0
e Y0 qualsiasi. Allora varrà:
0 = DV (g(X, Y )) = V k (Dek g) = V k X i Y j (Dek g)ij
Dall’arbitrarietà dei tre vettori segue che
∂gij
− Γhki ghj − Γhkj gih = 0
∂xk
CAPITOLO 2. CONNESSIONI
36
Permutando ciclicamente gli indici i,j e k si ha
∂gki
− Γhjk ghi − Γhji gkh = 0
∂xj
∂gjk
− Γhij ghk − Γhik gjh = 0
∂xi
Con opportune combinazioni lineari di queste equazioni si ottiene:
−
∂gij
∂gki
∂gjk
h
h
+
+
+ Tki
ghj + Tkj
gih − 2Γh(ij) ghk = 0
∂xk
∂xj
∂xi
Dato che il tensore gij ha rango massimo, esisterà g ij tale che gij g jk = δik :
questo permette di esplicitare Γh(ij) moltiplicando tutta l’equazione per g hk /2.
Definendo
( )
h
∂gki
∂gjk
1 hk
∂gij
+
= g
− k +
2
∂x
∂xj
∂xi
ij
si ha:
Γkij =
( )
k
ij
+
1 k
k
T + Tji
+ Tij
2 ij
(2.11)
Questa è la condizione che garantisce che una connessione la cui curvatura sia
rappresentata dai coefficienti Tijk sia compatibile con la struttura metrica. Resta
ancora in dubbio l’esistenza di una tale connessione.
Se si riesce a far vedere che i
( )
k
ij
sono i coefficienti di una connessione, allora si sarà dimostrato che, per ogni
tensore di coefficienti Tijk antisimmetrico rispetto a i e j, i Γkij come in (2.11)
definiscono una connessione. Dunque, a meno di quest’ultimo passaggio, che
si riduce a una lunga manipolazione di indici e derivate, si può dimostrare che
esiste un’unica connessione simmetrica (cioè a curvatura nulla) rispetto alla
quale il tensore metrico sia parallelo.
Def 2.2.7 (Connessione di Levi-Civita): Si chiama connessione di Levi-Civita
di una varietà (pseudo-)riemanniana l’unica connessione simmetrica che preserva
la metrica.
Es 2.2.1 (Ancora sulla derivata covariante in ipersuperfici di Rn ): La connessione data dalla derivata covariante nel caso di ipersuperfici preserva i prodotti
scalari: se X e Y sono paralleli lungo γ, con γ̇(0) = T , si ha:
T (hX, Y i) = hDT X, Y i + hX, DT Y i = hDT X, Y i + hX, DT Y i = 0
e dunque hX, Y i è costante lungo γ. Il passaggio intermedio è giustificato dal
fatto che la derivata tramite D e quella con D differiscono per un vettore ortogonale alla superficie, che non contribiusce quindi ai prodotti scalari. Inoltre, la
connessione è anche simmetrica:
DX Y − DY X = DX Y + hL(X), Y i N − DY X − hL(Y ), Xi N = [X, Y ]
CAPITOLO 2. CONNESSIONI
37
dove è stata applicata la simmetria di L. Dunque la connessione di Levi-Civita
generalizza a varietà riemanniane qualsiasi la derivata covariante vista in questo
caso particolare.
Es 2.2.2 (Il pendolo di Foucault): Uno degli esperimenti più famosi della storia
della fisica fu quello che provò che la terra “non è ferma”, cioè che il sistema
di riferimento ad essa associato non è inerziale. L’esperimento consistette nell’osservazione del moto di un pendolo vincolato ad un punto fisso rispetto alla
terra, cioè libero di muoversi sulla superficie di una sfera ferma nel suo sistema
di riferimento, con una piccola perturbazione iniziale rispetto al punto di equilibrio stabile. Se la terra fosse ferma, nel senso precisato sopra, allora il moto del
pendolo sarebbe descritto in prima approssimazione da un vettore X(t) ∈ Tp S 2
che risolva il problema di Cauchy:

g

Ẍ = − X


l
X(0) = X0



Ẋ(0) = 0
p
Seguirebbe X(t) = cos(ωt)X0 , dove ω = g/l .
La teoria fin qui esposta permette di dare, invece, una previsione per il caso
in cui esista un sistema di riferimento inerziale solidale al centro della terra,
ma rispetto al quale questa ruoti intorno ad una retta, che senza perdita di
generalità può essere supposto essere l’asse z, con velocità angolare Ω. Se R è
il raggio terrestre e θ è la latitudine a cui si trova il pendolo, dunque, il moto
del vincolo sarà dato dalla curva
γ(t) = R (cos(Ωt) sin(θ), sin(Ωt) sin(θ), cos(θ))
Le equazioni del moto del pendolo in questo caso diventano piuttosto complesse,
ma è possibile affrontare il problema in un altro modo trattandolo da un punto
di vista intrinseco. Quella che nel caso precedente era la derivata temporale
valutava la variazione di un vettore nel tempo; in questo caso, il vettore X(t)
appartiene a Tγ(t) S 2 , che varia nel tempo, e occorre quindi sostituire la derivata
rispetto al tempo con quella covariante. Se v è la velocità di γ il problema
assume la forma:

g


 Dv Dv X = − l X
X(0) = X0



Dv X(0) = 0
Nel caso precedente la soluzione era data da un vettore costante modulato da un
fattore oscillante cos(ωt), e sarà quindi ragionevole cercare una soluzione della
forma X(t) = cos(ωt)V (t) con V un campo parallelo lungo γ. In effetti si ha:
Dv Dv (cos(ωt)V (t)) = Dv (cos(ωt)Dv V (t) − ω sin(ωt)V (t)) = −ω 2 cos(ωt)V (t)
e l’equazione differenziale è soddisfatta. Il problema è risolto se si sceglie V (0) =
X0 : in ultima analisi si tratta di trasportare X0 parallelamente lungo la curva
γ. La soluzione di questo problema è un vettore la cui rappresentazione rispetto
CAPITOLO 2. CONNESSIONI
38
alle coordinate sferiche è dato da una rotazione di quella di X0 con velocità
angolare cos(θ) 2 .
Da un punto di vista fisico, questa non è la soluzione esatta del problema,
nemmeno nell’approssimazione fatta scrivendo il primo problema di Cauchy. In
effetti, la terra è soggetta ad altri moti oltre a quello intorno al proprio asse, e
il pendolo di Foucault ne risentirà.
2.3
Connessioni su fibrati principali
La nozione di connessione affine ammette una descrizione alternativa in termini
del fibrato tangente della varietà su cui si sta lavorando, e questa permetterà
poi una generalizzazione ad un contesto più ampio.
Il problema fondamentale che ha spinto all’introduzione di questo strumento
è stato quello di valutare la variazione di un campo vettoriale lungo una curva,
o di costruire, dati un cammino e un vettore in un suo punto, un campo a “variazione nulla” lungo questo. Il problema è non banale in quanto non è possibile
confrontare vettori in punti diversi, cioè elementi di fibre distinte, il che è legato,
in definitiva, al fatto che non esiste in generale un’identificazione canonica tra la
fibra tipica e quelle puntuali. In questo linguaggio, un campo vettoriale lungo
una curva può essere definito semplicemente come un sollevamento di questa al
fibrato: introdurre un trasporto parallelo, ad esempio, equivale a costruire un
criterio per sollevare i cammini su M scelto il punto di partenza in T M . Nel
caso dei rivestimenti questo è facile, poiché la proiezione è un omeomorfismo locale, e scelto un punto nella fibra di γ(0) esiste un unico sollevamento a partire
dal punto assegnato. Nei fibrati la cosa è più complessa, poiché la fibra non è
discreta e non vi è alcuna identificazione tra aperti di M e sottoinsiemi di T M :
per questa ragione è necessario introdurre della struttura ulteriore.
Vale la pena ora fare qualche osservazione sulla struttura dello spazio tanπ
gente a E in un punto fissato, per un generico fibrato E → M . Siano p ∈ M ,
−1
u ∈ π (p), e si consideri Tu E. Per le proprietà della mappa di proiezione, e
per il teorema della mappa implicita, la fibra Fp = π −1 (p) ha una struttura
di sottovarietà di E, e avrà quindi senso considerare il suo tangente Tu Fp come sottospazio di Tu E. Esso coincide con ker(π∗ |Tu ): dato che π|Fp è costante
dovrà valere Tu Fp ⊆ ker(π∗ |Tu E ), e poiché entrambi gli spazi hanno la stessa
dimensione di F si conclude. Dunque ogni punto dello spazio totale ammette
un’immersione canonica del tangente di F in quello di E: tale copia di Tf F è
usualmente indicata con Vu . Inoltre, vale naturalmente l’isomorfismo di spazi
vettoriali Tu E ' Tp M ⊕ Tf F , dove f può essere scelto in modo arbitrario, ad
esempio a partire da una trivializzazione locale intorno a p. Mentre Tf F può
essere identificato come un sottospazio di Tu E, però, non vale lo stesso per Tp M :
proprio in questo consiste il nostro problema.
Sia ora M una varietà con una connessione affine, e siano dati un vettore
X0 ∈ Tp M e una base e1 , . . . , en del tangente in p. Scegliendo γ1 , . . . , γn curve
con γi (0) = p e γ˙i (0) = ei , sarà possibile trasportare X0 parallelamente lungo
queste ottenendo i campi X1 , . . . , Xn . Si può vedere, allora, che i vettori velocità
dei (γi , X ◦ γi ) generano un sottospazio di T(p,X0 ) (T M ) in somma diretta con
2 Questo problema è stato affrontato dettagliatamente dal punto di vista matematico in un
corso di introduzione alla geometria differenziale, e perciò ne ometto lo svolgimento.
CAPITOLO 2. CONNESSIONI
39
il tangente alla fibra, e cioè forniscono l’identificazione di Tp M in T(p,X0 ) (T M ).
Per mostrarlo, basta osservare che, essendo π ◦ (γi , Xi ◦ γi ) = γi , deve valere
0
anche π∗ (γi , Xi ◦ γi ) (0) = γ˙i (0) = ei . Poiché questi formano una base di
Tp M , ed essendo in numero di n, questi vettori sono linearmente indipendenti;
per ragioni di dimensione, poi, vale la decomposizione in somma diretta con
Vu . Il sottospazio così costruito viene spesso indicato con Hu : esso non dipende
dalla particolare scelta della base e1 , . . . , en , per via della linearità della derivata
covariante rispetto alla direzione, ed è pertanto ben definito.
Va notato che questa costruzione fornisce delle identificazioni a livello di
spazi tangenti, senza però definire alcuna sezione locale di π.
È naturale aspettarsi che le condizioni di linearità per la derivata covariante
imponga delle relazioni tra gli spazi Hu in punti diversi di Fp . Se u0 = (p, Y0 ), la
base e1 , . . . , en fornisce campi Y1 , . . . , Yn che permettono di caratterizzare Hu0 .
Essendo Dei (Xi + Yi ) = Dei Xi + Dei Yi , segue che una base di H(p,X0 +Y0 ) è
data dalle velocità delle curve Xi + Yi . Inoltre, se c è una costante, i campi cXi
sono paralleli e le loro velocità danno una base di H(p,cX) .
Per passare alle connessioni su fibrati principali, conviene analizzare un attimo il fibrato dei riferimenti P associato a T M . La connessione su M consente
di trasportare non solo vettori, ma anche basi del tangente, e questo permette
di dare una decomposizione Tu P = Vu ⊕ Hu come nel caso del fibrato tangente.
Siano X1 , . . . , Xn vettori linearmente indipendenti in p ∈ M , estesi a campi paralleli lungo gli ei 3 , con una trivializzazione che associa alla base formata dagli
Xi la matrice Xij . Se u = (p, X1 (p), . . . , Xn (p)) e ghk ∈ GL(Rn ), allora vale
Hu g = Rg∗ Hu
(2.12)
Infatti, Yhj = Xij ghi è una matrice che rappresenta dei campi Yh = Xi ghi in p,
per i quali vale:
Dej Yh = Dej Xi ghi = Dej Xi ghi = 0
poiché i coefficienti ghi sono costanti e gli Xi sono paralleli lungo gli ej . Dunque,
poiché l’azione destra di ghi sui Dej X i è il differenziale di quella sugli X i , vale
la relazione (2.12).
Tutto questo giustifica la seguente:
π
Def 2.3.1 (Connessione su un fibrato principale): Se P → M è un G-fibrato
principale, si chiama connessione su P una decomposizione in somma diretta di
Tu P come Vu ⊕ Hu , al variare di u in P , dove Vu è il nucleo del differenziale
della proiezione π, tale che:
• le proiezioni su Vu e Hu preservano la differenziabilità dei campi vettoriali;
• per ogni g ∈ G vale Hu g = Rg∗ Hu .
Questa scomposizione assume un significato ben preciso: dato un sollevamento di una curva γ in M , si dirà che questo è parallelo se il suo vettore
tangente T appartiene ad Hu ad ogni tempo. In caso contrario, la proiezione di
T su Vu è un buon candidato a misurare la variazione del sollevamento lungo
3 Con questo si richiede che per ogni i e ogni j sia dato un campo lungo la direzione data
da ej , che valga Xi in p.
CAPITOLO 2. CONNESSIONI
40
la curva, essendo un vettore tangente alla fibra. È esattamente questo lo scopo
della decomposizione.
Se P è un G-fibrato principale, l’azione destra fornisce per ogni u un’identificazione canonica tra Vu e l’algebra di Lie g. Dato A ∈ g, l’esponenziale dà
una curva in G passante per l’identità al tempo 0 con velocità A(Id): l’azione
u exp(tA) dà una curva differenziabile γ in P con γ(0) = u. Mandando A nel
vettore tangente a γ al tempo 0, denotato con A# , si ottiene un isomorfismo tra
i due spazi vettoriali.
Avendo in mente questa corrispondenza, è possibile adottare un nuovo punto
di vista nella trattazione delle connessioni su fibrati principali. Dato che in
questo caso l’analogo della derivata covariante è giocato dalla proiezione su Vu ,
il quale è identificato con g, la struttura di connessione può essere data da
quella che si usa chiamare una 1-forma a valori in g, formalmente un elemento
di T ∗ P ⊗ g, cioè un oggetto che assegna ad ogni punto di P una mappa lineare
dal suo tangente in g. Nel caso di una connessione su P , secondo la prima
definizione, vale naturalmente che la proiezione su Vu fissa puntualmente questo
spazio. Inoltre, Rg∗ induce un isomorfismo tra Hu e Hu g , e dunque vale
πV (Rg∗ X) = Rg∗ X − πH (Rg∗ X) = Rg∗ X − Rg∗ (πH X) = Rg∗ (πV X)
Vale la pena ricordare che nell’algebra di Lie (Rg∗ ) A(h) = Adg−1 A (h).
π
Def 2.3.2 (1-forma di connessione): Sia P → M un fibrato principale: si dice
che ω ∈ Ω1 (P ) ⊗ g è una 1-forma di connessione su P se è differenziabile e:
• ω(A# ) = A;
• Rg∗ ω = Adg−1 ◦ω
Data una 1-forma di connessione è facile costruire in ogni punto uno spazio
Hu come ker ωu . Dato che ωu è surgettiva, la dimensione del suo nucleo è la
stessa di M , e dunque Hu dà in effetti la somma diretta con Vu , ed essendo
∞
ω differenziabile anche la decomposizione di un campo
liscio ne darà due C .
∗
Inoltre, se X ∈ Hu e g ∈ G, allora ω (Rg∗ X) = Rg ω X = Adg−1 (ω(X)): ancora una volta per ragioni di dimensione segue che Hu g = Rg∗ Hu , e questo mostra
che i due punti di vista presentati sono equivalenti. Nel seguito confonderò le
due nozioni di connessione di 1-forma associata.
La nozione di connessione espressa tramite 1-forma si presta meglio dell’altra
a parallelismi col caso affine: assegnare ad ogni punto di un aperto di M un
elemento della sua fibra equivale a dare una sezione locale del fibrato P . Sia
questa σ, e X ∈ Tp M : la “derivata” di σ lungo X sarà espressa da ω (σ∗ X) =
(σ ∗ ω) X.
Es 2.3.1: Il toro può essere visto comeun opportuno quoziente di [0, 1] × S 1 ,
identificando il punto 0, eiθ con 1, eiθ : questo significa richiudere il cilindro
su se stesso in modo da identificare gli estremi di ogni segmento “orizzontale”. Intuitivamente, se invece che in questo modo si incollassero
i due estremi
ruotando il secondo, cioè identificando (0, eiθ ) con 1, ei(θ+φ) per un qualche
φ fissato, si otterrebbe un oggetto “diverso”, in un qualche senso da precisare
meglio. La cosa si rende più evidente se anziché una circonferenza si considera
un poligono P : in questo caso si ha un prisma anziché un cilindro, senza le due
CAPITOLO 2. CONNESSIONI
41
basi. Un modo di richiudere il prisma è quello di identificare ciascun lato l di
P × { 0 } con quello corrispondente in P × { 1 }; un altro è quello di applicare
una permutazione ciclica σ agli spigoli di P × { 1 } e di incollare l a σ(l). Ci
chiediamo allora in quale senso possa essere descritta in modo matematicamente
rigorosa questa differenza intuitiva tra i due diversi quozienti.
Tornando al caso del cilindro, la topologia non distingue i due quozienti, cioè
essi sono omeomorfi, e anzi diffeomorfi. Infatti, la mappa t, eiθ 7→ t, ei(θ+tφ)
è un diffeomorfismo del cilindro in sé che passa al quoziente, e induce l’equivalenza cercata. Nemmeno come fibrati su S 1 (ottenuto come quoziente dell’intervallo) i due oggetti sono distinti: la mappa fornita sopra è un
isomorfismo.
Sia γ(t) = t un cammino sul segmento [0, 1]. Poiché il cilindro è un fibrato
principale banale sull’intervallo, con un’ovvia connessione data da g −1 dg, cioè
il differenziale della proiezione sul secondo fattore,
dato eiθ ∈ S 1 esiste un solle
iθ
vamento naturale di γ con punto base 0, e : quello con seconda componente
costante. Passando al quoziente γ viene trasformata in un loop che viene sollevato a una curva sul cilindro: questa dipenderà da quale dei due quozienti del
cilindro è stato scelto. In un caso, il laccio si chiude, nell’altro questo non è vero
in generale, e lo sarà solo per φ multiplo intero di 2π.
La differenza tra queste strutture è ora evidente: il quoziente fa sì che il toro
erediti dal cilindro una connessione che dipende dalla scelta di φ. Per approfon2
dire ulteriormente, passo a considerare il cilindro “ingrassato” (−ε,
1+ε)×S an
1
iθ
ziché [0, 1] × S : il quoziente sarà ottenuto identificando δ, e
con 1 + δ, eiθ
1
1
per ogni
δ compreso
tra −ε ed ε. Sia ψ : [0, 1] × S → [0, 1] × S data da
iθ
i(θ−tφ)
t, e 7→ t, e
, p la mappa di proiezione sul quoziente “standard”: allora
p ◦ ψ è la proiezione sul toro ottenuto ruotando il secondo estremo. Poiché ψ è
un diffeomorfismo, la connessione standard sul cilindro può essere trasformata
tramite ψ tramite il pull-back dell’inversa, ottenendo:
∗
ψ −1 (g −1 dg)(t, iθ) = g −1 dg ψ −1 ∗ (t, iθ) = (φdt + g −1 dg)(t, iθ)
dove il tangente di S 1 è identificato con iR e quello del toro con il prodotto
iR × iR. Passando al quoziente si può vedere che, definendo la connessione
ω := φdt + g −1 dg
∗
sul toro, si ha (p ◦ ψ) ω = g −1 dg, la connessione canonica del cilindro.
Questa connessione è la stessa che si ottiene definendo gli spazi Hu come
quelli generati dai vettori (−i, iφ): si ha infatti ω(−iφ, i) = −iφ+iφ = 0. Questi
vettori formano un campo globale sul toro, che può sempre essere integrato
dando curve definite su tutto l’asse reale.
Nel caso delle connessioni affini è stato sviluppato il punto di vista di Cartan,
che consiste, dato un riferimento di T M che vari in modo liscio su un intorno
U di un punto p, nel definire delle 1-forme ωji su U da cui è possibile ricostruire
localmente la connessione. Viste tutte insieme, queste possono definire n forme
differenziali a valori in Tp M , ciascuna delle quali esprime la derivata covariante
di una delle direzioni del riferimento. Le regole di trasformazione di queste
ωji , poi, consentono di definire una connessione su M dando delle forme locali
compatibili.
CAPITOLO 2. CONNESSIONI
42
Anche nel caso in analisi ora è possibile una costruzione analoga: ad una
connessione ω è possibile associare delle 1-forme locali su M a valori in g dalle
quali sia possibile ricostruire quella su P , e viceversa una famiglia di forme
compatibili definisce una connessione sul fibrato. Il punto di partenza della
prospettiva suggerita da Cartan è un’opportuna famiglia di campi vettoriali, cioè
di sezioni locali di T M : sia allora σ una sezione di P . L’obiettivo di σ in questo
caso non è quello di dare in ogni punto un elemento di G, ma di fornire una
trivializzazione locale di P , cosa che è possibile grazie alla struttura di fibrato
principale (si veda la dimostrazione del teorema 1.5.5). Naturalmente, la forma
indotta su U sarà il pull-back di ω tramite σ. Se invece A è una 1-forma a valori
in g definita su U , la sezione σ permette di sollevarla ad una connessione ω su
P |U : la costruzione può essere fatta definendo ω
e su U × G e poi passando a P
tramite la trivializzazione locale. Naturalmente, T(p,g) (U × G) = Tp U ⊕ Tg G: se
X è un vettore in (p, g) definisco ω
e (X) come somma di due contributi provenienti
dalla sua decomposizione. La proiezione su Tg G, che può essere scritta come
dg, dà un vettore tangente in g: per vederlo come elemento dell’algebra di Lie
occorre valutare nell’origine il campo invariante che vale dg(X) in g, così che il
contributo della componente parallela a G è g −1 dg. La proiezione su Tp U è data
∗
∗
A) X è un ben definito elemento dell’algebra di Lie. Tuttavia,
: (πU
invece da πU
∗
A non soddisfa le condizioni
la forma differenziale definita da ω
e = g −1 dg + πU
di traslazione richieste dalla definizione di connessione, e per questo si compone
il secondo termine con l’azione di G su g per aggiunzione:
∗
ω
e := g −1 dg + Adg−1 ◦ (πU
A)
È immediato verificare che, se ι è l’immersione U 3 u 7→ (u, 0) ∈ U × G, allora
ι∗ ω
e = A. Passando a P |U si ottiene la 1-forma locale:
ωU = Adg−1 ◦π ∗ A + g −1 dg
dove g = g(u) rappresenta l’elemento di G per cui vale u = σ(π(u)) g. L’invarianza sotto l’azione di G segue per costruzione, così come la condizione
σ ∗ (ωU ) = A. Rimangono da studiare le regole di trasformazione che garantiscono che due 1-forme locali Ai e Aj definite rispettivamente su Ui e Uj diano
tramite le sezioni σi e σj la stessa connessione ω = ωUi ∩Uj . Per ogni p ∈ Ui ∩ Uj
sia tij (p) tale che σj (p) = σi (p) tij (p). Si avrà allora:
Aj (p) = σj∗ (ω (σj (p))) = σj∗ (ω (σi (p) tij (p))) =
= σj∗ Adt−1 ◦π ∗ Ai + t−1
ij dtij =
ij
= Adt−1 ◦Ai +
ij
(2.13)
t−1
ij dtij
Vale la pena notare che la (2.5) è formalmente analoga a questa condizione: di
fatto esprime in coordinate una trasformazione del tutto simile a questa (l’una
per la derivata covariante in una varietà, l’altra per la 1-forma di connessione
su un fibrato principale).
2.3.1
Derivata covariante indotta
La derivata covariante è stata introdotta per studiare il comportamento dei
campi vettoriali tangenti ad M , ed in seguito è stata estesa a campi tensoriali.
CAPITOLO 2. CONNESSIONI
43
In generale, ha senso parlare di derivata covariante nel caso di fibrati vettoriali
qualsiasi, come di un oggetto che soddisfi le proprietà (2.2).
Una connessione su un principale P induce su qualsiasi fibrato vettoriale
associato E = P ×ρ V una derivata covariante, cioè un oggetto che associa ad
una sezione σ di E e un campo vettoriale tangente X una seconda sezione di E.
A σ è associata una mappa σ P : P → V il cui differenziale fornisce una funzione
σ P ∗ : T P → V . Dati un punto p ∈ M e un qualsiasi u nella sua fibra,
la connessione su P dà un isomorfismo tra Tp M e Hu tramite il differenziale
della proiezione π. A meno di scegliere il punto u nella fibra di p, dunque,
esiste un’immersione ιu di Tp M in Tu P , e per composizione una mappa da Tp M
in V . Scegliendo u g al posto di u si ha, per le proprietà della connessione,
ιu g = Rg∗ ◦ ιu . Dunque:
σ P ∗ ◦ ιu g = σ P ∗ ◦ Rg∗ ◦ ιu = σ P ◦ Rg ∗ ◦ ιu = Lρ(g)−1 ◦ σ P ◦ ιu =
= Lρ(g)−1 ∗ ◦ σ P ∗ ◦ ιu = Lρ(g)−1 ◦ σ P ∗ ◦ ιu
essendo Lρ(g)−1 lineare. Dunque è ben definita
(DX σ)(p) = u, σ P ∗ ιu (X)
La linearità in X è banale, come quella in σ rispetto alla somma. Rimane
P
da verificare la regola di Leibnitz: se f è una funzione su M allora (f σ) =
P
(f ◦ π) σ . Di conseguenza
P
(f σ)
= f σ P ∗ + σ P ⊗ π ∗ (df )
∗
da cui
DX (f σ)(p) =
u, f σ P
ι (X)
∗ u
+ X(f )σ P (u) = f DX (σ)(p) + X(f )σ(p)
e questo conclude.
Può essere utile a questo punto saper rappresentare la derivata covariante
associata ad ω in termini della 1-forma locale A legata alla sezione σ. Sia
γ : [0, 1] → M una curva con vettore tangente X al tempo 0, γ
e un sollevamento
di γ in P con vettore tangente orizzontale in 0. Per un’opportuna curva in G
vale γ
e(t) = σ(t) g(t), dove σ(t) = σ(γ(t)). Data una base e01 , . . . , e0m di V , σ
induce m sezioni indipendenti di E, e di conseguenza una base di V lungo γ:
ei (t) = σ(t), e0i = γ
e(t), g(t)−1 e0i
Derivando la seconda componente rispetto al tempo si ottiene:
dg
d
g(t)−1 e0i = −g(t)−1 g(t)−1 e0i
dt
dt
Valutando al tempo 0 si ha
DX ei =
γ
e(0) g(0)−1 , A(X) e0i
dove A(X), essendo un elemento di g, agisce su V come una mappa lineare. Sia
dunque A(X) rappresentato in forma matriciale da
A(X)e0i = Aji (X)e0j
CAPITOLO 2. CONNESSIONI
44
e sostituendo in DX ei si trova:
DX ei = Ak ji X k ej
dove l’indice k è legato alla scrittura di A in coordinate come Ak dxk . Per un
generico campo Y = Y i ei si ottiene
DX Y = X(Y i )ei + Ak ji Yi X k ej
che ricorda la vecchia forma della derivata covariante espressa tramite i coefficienti Γkij .
2.4
Olonomia
Anche nel caso di connessioni su fibrati principali vale un risultato di esistenza
ed unicità del trasporto parallelo, cioè di un sollevamento a P dei cammini in
M che dia come risultato curve i cui vettori tangenti siano sempre orizzontali,
cioè in Hu .
Thm 2.4.1 (Trasporto parallelo): Se P è un fibrato principale con una connessione ω, γ : [0, 1] → M una curva differenziabile, u0 ∈ π −1 (γ(0)) allora esistono
ε > 0 ed un unico sollevamento γω di γ a P con punto iniziale u0 e vettore
velocità in Hu ad ogni tempo, definito su [0, ε).
Dim: Come nella dimostrazione del teorema 2.2.3 si potrà supporre senza
perdita di generalità che la traccia di γ sia contenuta in un aperto U su cui sia
definita una sezione σ. Questo consente di riformulare il problema in termini di
una connessione su U × G. Se γ
e(t) = (γ(t),
g(t)) èun generico sollevamento di
γ in U × G, il suo vettore tangente sarà γ̇(t), dg
dt . Identificando Tg G con g,
dg
dt
d
come elemento dell’algebra di Lie è rappresentato da g −1 dt
g. La condizione
che γ
e sia orizzontale è espressa da
Adg−1 ◦ωU (γ̇) + g −1
d
g=0
dt
e dunque il sollevamento soddisfa le richieste se e solo se
d
g + ωU (γ̇) g = 0
dt
(2.14)
B
Dato un punto iniziale l’equazione differenziale ammette un’unica soluzione in
un intorno di 0, e il teorema è dimostrato.
Oss 2.4.2: Se si aggiunge l’ipotesi che G sia compatto, la soluzione dell’equazione differenziale (2.14) è globale: se infatti essa cessasse di esistere a un tempo
t0 , allora in un intorno di tale istante dovrebbe uscire da qualsiasi compatto
contenuto nel dominio, il quale però, essendo prodotto di compatti, lo è a sua
volta. Nel seguito supporrò dunque che G sia un gruppo compatto, in modo che
i trasporti paralleli esistano sempre globalmente.
CAPITOLO 2. CONNESSIONI
45
Applicando il teorema un numero finito di volte è possibile rilassare la condizione di differenziabilità di γ chiedendo solo che sia C ∞ a tratti. Il risultato
vale quindi anche per curve ottenute per concatenazione: date α e β curve
differenziabili con α(1) = β(0) è ben definita γ data da:

1

 α(2t)
per 0 ≤ t ≤
2
γ(t) =
1

 β(2t − 1)
per ≤ t ≤ 1
2
γ è differenziabile a tratti, e il teorema con l’ipotesi rilassata può essere applicato
ad essa.
Se è dato un sollevamento orizzontale γ
e di γ con punto iniziale u0 , per
ogni g ∈ G le proprietà della connessione fanno sì che γ
e(t) g sia un sollevamento
orizzontale con punto iniziale u0 g. Dunque è sufficiente sollevare γ con un punto
iniziale u0 qualsiasi per costruire in maniera immediata quello da u0 g, per ogni
g. Un sollevamento globale (cioè definito su tutto l’intervallo [0, 1]) di γ induce
una corrispondenza biunivoca tra le fibre di γ(0) e γ(1). Indicando con Γ(γ) la
bigezione associata alla curva, per ogni g ∈ G varrà Γ(γ)(u g) = (Γ(γ)(u)) g. Se
si indica con γ −1 (t) la curva γ(1 − t), γ
e−1 è ancora una curva orizzontale, poiché
il suo vettore tangente è l’opposto di quello di γ
e e di conseguenza è orizzontale.
Dunque Γ(γ −1 ) (Γ(γ)u0 ) = u0 e Γ(γ) Γ(γ −1 )u1 = u1 , il che dimostra che la
corrispondenza è biunivoca. Infine, se γ1 ∗γ2 è la concatenazione di due cammini,
vale Γ(γ1 ∗γ2 )(u0 ) = Γ(γ2 ) (Γ(γ1 )(u0 )). Dunque i Γ(γ) con γ un cammino chiuso
con punto base p formano un sottogruppo di G, poiché le osservazioni appena
fatte mostrano la chiusura per prodotto e per inverso. In questo caso indicherò
con τγ la bigezione di π −1 (p) su se stesso indotta dalla curva. Se M è connessa,
essendo localmente diffeomorfa ad Rn è connessa per archi C ∞ a tratti, e se q
è un altro punto su M un qualsiasi cammino α che lo colleghi a p induce un
isomorfismo tra i sottogruppi di G associati ai due punti. Data una curva chiusa
γ in q, infatti, la concatenazione α ∗ γ ∗ α−1 fornisce l’isomorfismo. È dunque
ben posta la seguente:
Def 2.4.1 (Gruppo di olonomia): Sia P un G-fibrato su una varietà M connessa, ω una connessione su P . Per ogni punto u ∈ P si chiama gruppo di olonomia
di ω in u, indicato con Φu (ω), il sottogruppo di G definito da:
Φu (ω) = { g ∈ G : τγ (u) = u g per qualche cammino chiuso γ }
Essendo i Φu (ω) isomorfi tra loro, spesso si omette il riferimento al punto base
e si parla semplicemente del gruppo di olonomia di ω.
Si chiama olonomia ristretta in u il sottogruppo Φ0u ottenuto limitando γ
alla sola classe dei cammini omotopi a quello costante.
Es 2.4.1: Il trasporto parallelo sulla sfera unitaria (rispetto alla connessione
di Levi-Civita) lungo le curve a latitudine costante mostra che il gruppo di
olonomia è S 1 . Infatti, per definizione della connessione, il trasporto parallelo
in questo caso conserva i prodotti scalari, e quindi Φ ⊆ SO2 . D’altronde, il
trasporto di un vettore alla latitudine θ dà come olonomia 2π cos(θ): Φ include
quindi un intorno dell’elemento neutro di S 1 , e la tesi segue dal fatto che ogni
gruppo di Lie connesso è generato da un suo qualsiasi aperto.
Capitolo 3
Piattezza
L’olonomia occupa una posizione centrale nello studio delle connessioni: una
volta definita la sua azione è naturale chiedersi da quali proprietà di un arco
γ dipenda il trasporto parallelo lungo di essa, oppure, equivalentemente, sotto
quali ipotesi l’olonomia associata ad un cammino sia nulla. La piattezza della
connessione è una condizione che garantisce la banalità locale del trasporto
parallelo; globalmente questo non sarà comunque vero in generale, ma esisterà
una stretta relazione tra olonomia e omotopia.
3.1
Ancora sulla curvatura nel caso affine
Il tensore di curvatura di una connessione affine è già stato introdotto, ma
senza una riflessione sul suo significato. Esso gioca un ruolo determinante nello studio dell’olonomia, e pertanto merita a questo punto una trattazione più
approfondita.
Oss 3.1.1: In maniera euristica, se la variazione dei coefficienti Γkij lungo una
curva γ è sufficientemente piccola, la soluzione del problema di Cauchy (2.6)
può essere approssimata con:
X i (γ(t)) = X0i − X0j Γijk (γ(t)) xk (t) − xk (0)
dove xk (t) è la rappresentazione in coordinate di γ(t). Vale infatti X i (0) = X0i ,
e
dΓijk k
d i
X = −X0j
x (t) − xk (0) − X0j Γijk (γ(t))ẋk ' −X0j Γijk (γ(t))ẋk
dt
dt
Dunque in prima approssimazione la funzione suggerita risolve il problema di
Cauchy.
Siano p ∈ M , U un intorno parametrizzato di p con xi le coordinate di p e
X ∈ Tp M rappresentato da X i . Siano inoltre εi , δ i ∈ Rn due vettori, a cui si
voglia dare il significato di perturbazioni del punto p, e dunque sufficientemente
piccoli nel senso dell’osservazione fatta sopra. I punti q, s ed r di coordinate
rispettivamente xi + εi , xi + δ i e xi + εi + δ i definiscono un rettangolo i cui lati
46
CAPITOLO 3. PIATTEZZA
sono le curve
47
γ1 (t) = xi + tεi
γ2 (t) = xi + εi + tδ i
γ3 (t) = xi + tδ i
γ2 (t) = xi + δ i + tεi
Il trasporto parallelo di X lungo γ1 dà in q un vettore approssimato dalle
coordinate X i − Γijk (p)εk X j . Trasportando questo lungo γ2 si ottiene in r:
X i − Γijk (p)εk X j − Γilm (q)δ m X l − Γljk (p)εk X j '
∂ i h m
Γ
ε
δ X l − Γljk (p)εk X j '
' X i − Γijk (p)εk X j − Γilm (p) +
lm
h
∂x
∂ i
i
h
' X i − Γijk (p)X j εk − Γijk (p)X j δ k −
Γ
−
Γ
(p)Γ
(p)
X l εk δ m
hm
lk
∂xk lm
approssimato tramite uno sviluppo in Taylor e trascurando i termini di grado
superiore al secondo in εi e δ i . Trasportando invece lungo γ3 e γ4 si ottiene
∂ i
i
h
Γ
−
Γ
(p)Γ
(p)
X l εk δ m
X i − Γijk (p)X j εk − Γijk (p)X j δ k −
hk
lm
∂xm lk
e la differenza tra i due trasporti è:
∂ i
∂ i
i
h
i
h
i
Γ
−
Γ
−
Γ
(p)Γ
(p)
+
Γ
(p)Γ
(p)
X l εk δ m = Rlkm
X l εk δ m
hm
lk
hk
lm
∂xk lm ∂xm lk
In questo approccio euristico, dunque, il tensore di curvatura esprime la differenza tra i trasporti paralleli di X lungo due curve diverse, ottenute scambiando
due direzioni fissate. Questo giustifica il nome di tale tensore: è intuitivamente ragionevole aspettarsi che la non commutatività di questi trasporti paralleli
dipenda dal fatto che lo spazio è curvo, mentre ad esempio in Rn , che è piatto,
ci si può aspettare che il parallelismo non dipenda dal percorso lungo il quale
viene valutato.
Questo esempio chiarisce il significato geometrico della curvatura, ma non
suggerisce in che modo definirla nel caso di connessioni su fibrati principali. A
questo scopo è utile riprendere la deifnizione nel caso affine:
R(X, Y )Z = DX DY Z − DY DX Z − D[X,Y ] Z
Una volta fissato il campo Z, la derivata covariante DX Z è una funzione lineare
di X, e può essere vista come una forma differenziale. Scrvendo questa forma
come ωZ , l’equazione sopra diventa:
R(X, Y )Z = DX (ωZ (Y )) − DY (ωZ (X)) − ωZ ([X, Y ])
Questa richiama una nota espressione per la valutazione del differenziale di una
1-forma:
(dω)(X, Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ])
In effetti, le due scritture sono formalmente analoghe: in un caso si tratta di una
forma a valori in R per cui è ben definita l’usuale derivata direzionale, mentre
nell’altro il codominio è lo spazio (tangente a) Tp M , e per derivare quantità di
questo tipo è necessario ricorrere alla connessione. La curvatura R(·, ·)Z può
essere quindi vista come il differenziale della forma ωZ nel senso dato dalla
derivata covariante.
CAPITOLO 3. PIATTEZZA
3.2
48
Curvatura di una 1-forma di connessione
Avendo in mente le osservazioni appena fatte, è possibile definire la curvatura
di una 1-forma di connessione ω come la 2-forma a valori in g data dal suo
differenziale, in un senso che ora va approfondito meglio.
Sulle forme differenziali su P è ben definita l’usuale derivata esterna, che
però non ha niente a che vedere con la struttura indotta dalla connessione. Si
usa quindi definire la derivata covariante di una forma ω ∈ Ωr (P ) come
(Dω) (X1 , . . . , Xn ) = (dω) X1H , . . . , XnH
dove XiH denota la proiezione di X su Hu . Questa definizione ha senso anche
per forme a valori in uno spazio vettoriale: è immediato verificare che se questa
è rappresentata in una base e1 , . . . , en come ω = ω i ⊗ ei allora è ben definita
dω = (dω i ) ⊗ ei .
Def 3.2.1 (Curvatura di una connessione): Sia ω una 1-forma di connessione
su un fibrato principale P . Si chiama curvatura di ω la 2-forma Ω data dalla
sua derivata covariante.
La curvatura eredita dalle proprietà della connessione la sua condizine di
invarianza per traslazione: se g ∈ G, allora Rg∗ Ω = Adg− 1 ◦Ω. Infatti:
Rg∗ Ω(X, Y ) = Ω (Rg∗ X, Rg∗ Y ) =
H
= dω Rg∗ X H , Rg∗Y
=
= Rg∗ dω X H , Y H =
= d(Rg∗ ω) X H , Y H =
= d(Adg−1 ◦ω) X H , Y H =
= Adg−1 ◦dω X H , Y H =
= Adg−1 ◦Ω(X, Y )
Trattando le forme differenziali a valori in un’algebra di Lie si usa introdurre
il commutatore tra due forme. Se T1 , . . . , Tn è una base di g, e se σ = σ i ⊗ Ti ,
τ = τ i ⊗ Ti sono una p-forma ed una q-forma, si definisce:
[σ, τ ] = σ i ∧ τ j ⊗ [Ti , Tj ]
e si può verificare che [σ, τ ] = σ ∧ τ − (−1)pq τ ∧ σ. Dunque per ogni p-forma σ
vale [σ, σ] = 2σ ∧ σ per p dispari, 0 altrimenti.
Come nel caso delle connessioni affini vale il seguente:
Thm 3.2.1 (Equazione di struttra di Cartan): Se ω è una 1-forma di connessione su un fibrato principale P , allora la sua curvatura soddisfa
dω = Ω − ω ∧ ω
CAPITOLO 3. PIATTEZZA
49
Dim: Valutando ω ∧ ω in X, Y si ha
2(ω ∧ ω)(X, Y ) = [ω, ω](X, Y ) = [Ti , Tj ] ⊗ ω i ∧ ω j (X, Y ) =
= [Ti , Tj ] ω i (X)ω j (Y ) − ω j (X)ω i (Y ) =
= [ω(X), ω(Y )] − [ω(Y )ω(X)] = 2[ω(X), ω(Y )]
Dunque la tesi è equivalente a
dω(X, Y ) = Ω(X, Y ) − [ω(X), ω(Y )]
per ogni X, Y ∈ Tu P . Per le proprietà di linearità e alternanza delle forme
differenziali basta dimostrare l’asserto nei seguenti casi:
• X, Y ∈ Hu : allora ω(X) = ω(Y ) = 0. Inoltre, in questo caso particolare
Ω coincide proprio con il differenziale di ω, e la tesi è verificata.
• X ∈ Hu e Y ∈ Vu : per la bilinearità del commutatore anche in questo
caso [ω(X), ω(Y )] = 0, e Ω(X, Y ) = 0 dato che Y H = 0. Per valutare
dω(X, Y ) è possibile estenderli a campi in un intorno del punto in analisi
ed applicare:
dω(X, Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) = X(ω(Y )) − ω([X, Y ])
Essendo Y verticale, il campo può essere scelto come quello indotto da
V ∈ g: in questo modo ω(Y ) = V , una costante, e dω(X, Y ) si riduce
a −ω([X, Y ]). D’altra
parte tale vettore è orizzontale: lo si scriva come
limt→0 Rg(t)∗ X − X /t con g(t) una curva in G in modo che il tangente
di u g(t) sia Y . Allora Rg(t)∗ X è orizzontale, e così anche [X, Y ].
• X, Y ∈ Vu : allora Ω(X, Y ) = 0. In modo analogo al passo precedente si
ha dω(X, Y ) = −ω([X, Y ]). Sia A = ω([X, Y ]): allora
A = ω([X, Y ]) = ω([ω(X)# , ω(Y )# ] = ω([ω(X), ω(Y )]# ) = [ω(X), ω(Y )]
da cui finalmente dω(X, Y ) = −[ω(X), ω(Y )].
B
Segue immediatamente dall’equazione di struttura di Cartan la seguente:
Thm 3.2.2 (Identità di Bianchi): Se Ω è 2-forma di connessione di ω, allora
DΩ = 0
dove D denota la derivata covariante.
Dim: Il differenziale di Ω è dato da
dΩ = d (dω + ω ∧ ω) = (dω) ∧ ω − ω ∧ (dω)
B
Di conseguenza, dato che DΩ(X, Y, Z) = dΩ(X H , Y H , Z H ), e che ω(V H ) si
annulla per ogni V , si ha la tesi.
CAPITOLO 3. PIATTEZZA
50
Sia σ una sezione locale di P . Come alla connessione ω la sezione associa
una 1-forma A ∈ Ω1 (M ) ⊗ g, così è possibile rappresentare la curvatura per
mezzo di una 2-forma F definita come il pull-back di Ω tramite σ. Se Fi ed
Fj sono le forme locali rispetto a due sezioni σi e σj , con σj (p) = tij (p) σi (p),
allora vale
Fj = dAj + Aj ∧ Aj =
= d(Rt−1 ∗ ◦ Ai +
ij
t−1
ij dtij )
−1
+ (Rt−1 ∗ ◦ Ai + t−1
ij dtij ) ∧ (Rt−1 ∗ ◦ Ai + tij dtij ) =
ij
ij
= Rt−1 ∗ ◦ (dAi + Ai ∧ Ai ) = Rt−1 ∗ ◦ Fi
ij
ij
Le equazioni dimostrate sopra impongono delle condizioni anche su queste
forme locali: quella di Cartan è data da
dA = dσ ∗ ω = σ ∗ (dω) = σ ∗ Ω + (σ ∗ ω) ∧ (σ ∗ ω) = F + A ∧ A
Per quanto riguarda l’identità di Bianchi si ha invece:
dF = σ ∗ (dΩ) = σ ∗ ((dω) ∧ ω − ω ∧ (dω)) = (dA) ∧ A − A ∧ (dA) = F ∧ A − A ∧ F
da cui
dF + [A, F] = 0
Definendo DF come dF + [A, F] si ottiene un’identità formalmente identica a
quella di Bianchi:
DF = 0
3.3
Condizioni equivalenti alla piattezza
Come osservato nella sezione 3.1, la curvatura di una connessione affine esprime
la dipendenza del trasporto parallelo dal cammino scelto. Ci si potrebbe quindi
aspettare che tale dipendenza venga meno nel caso in cui la curvatura si annulli
identicamente: questo è vero soltanto localmente.
Def 3.3.1: Si dice che una connessione è piatta se la sua curvatura è nulla. Si
usa anche dire che un fibrato è piatto se su di esso è definita una connessione e
non si corrono rischi di ambiguità.
Prima di proseguire occorre introdurre della terminologia comune nell’ambito della geometria differenziale. Sia data una varietà M di dimensione n, e
sia assegnato, per ogni punto p ∈ M , un sottospazio τ (p) di dimensione d di
Tp M . Se M può essere ricoperta tramite aperti sui quali siano definite d campi
vettoriali lisci che formino basi per τ (p), allora si dice la famiglia di questi spazi
costituisce una distribuzione d-dimensionale su M . La condizione sull’esistenza
dei campi vettoriali serve per fare in modo che, in un senso intuitivo, τ (p) vari in
modo liscio su M . Una distribuzione può essere vista anche come un sottofibrato
tel tangente ad M . Una distribuzione si dice involutiva se, comunque date X, Y
sezioni di τ come sottofibrato (cioè due campi vettoriali i cui valori in qualsiasi
p appartengano a τ (p)) anche il loro commutatore lo è. In modo più stringato,
una distribuzione si dice involutiva se è chiusa rispetto al commutatore.
Data una distribuzione ha senso chiedersi se per ogni punto p ∈ M esista
una sottovarietà N 3 p il cui tangente sia τ (q) in ogni punto q ∈ N . Una tale
CAPITOLO 3. PIATTEZZA
51
sottovarietà è chiamata varietà integrale, ed è detta massimale se è connessa
e non ne esiste un’altra che la contenga. Naturalmente, se una distribuzione
ammette una varietà integrale allora è involutiva: due sezioni di τ possono essere
viste come campi vettoriali su N , e il loro commutatore non dipenderà dal fatto
che lo si valuti rispetto alla struttura di M o a quella di N . Di conseguenza, la
loro parentesi di Lie sarà un campo tangente ad N , e in quanto tale sarà una
sezione di τ . Non è ovvia l’altra implicazione, che invece discende dal seguente:
Thm 3.3.1 (Frobenius): Se τ è una distribuzione involutiva d-dimensionale
allora ogni punto p ∈ M ammette un intorno U e una carta φ : U → Rn il
cui differenziale mappa τ sulla distribuzione su Rn che consta dei sottospazi
generati dai primi d vettori della base canonica.
Una carta come quella di cui l’esistenza è garantita dal teorema di Frobenius
induce una partizione di U in sottoinsiemi della forma φ−1 (Rd × { x }). Se M è
ricoperta da carte di questo tipo, in modo che per ogni overlapping tra due carte
le decomposizioni indotte sull’intersezione coincidano, si ha una partizione di
M detta foliazione. Ciascuna delle sottovarietà (nel senso degli imbedding) che
ricoprono M in questo modo è detta foglia. Il teorema di Frobenius garantisce
quindi l’esistenza di una foliazione cui τ sia tangente, a condizione che questa
sia involutiva.
Se su un fibrato principale P è data una connessione, gli spazi orizzontali
formano una distribuzione: se T1 , . . . , Tn è una base di g, si completi T1# , . . . , Tn#
a base liscia di Tu P su un aperto opportuno. Le proiezioni dei vettori aggiunti
formano una base liscia di Hu . Indicherò con H tale distribuzione. Vale allora:
Thm 3.3.2: La distribuzione data dalla connessione è involutiva se e solo se
questa è piatta.
Dim:
Il punto chiave della dimostrazione sarà l’equazione di struttura di
Cartan.
Siano X, Y campi orizzontali su un aperto di P . Allora
dω(X, Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) = −ω([X, Y ])
Se ω è piatta, allora l’equazione di struttura dà
−ω([X, Y ]) = [ω(X), ω(Y )] = 0
Dunque [X, Y ] è orizzontale, e la distribuzione è involutiva. Viceversa, se vale
questa condizione allora ω([X, Y ]) = 0, e quindi
0 = Ω(X, Y ) + [ω(X), ω(Y )] = Ω(X, Y )
B
D’altra parte se uno tra X e Y è verticale vale Ω(X, Y ) = dω(X H , Y H ) = 0.
Per bilinearità si conclude che Ω ≡ 0.
Dal teorema di Frobenius, poi, segue che una connessione è piatta se e solo se
induce una foliazione tangente alla distribuzione degli spazi orizzontali. Questa
è la condizione cruciale che avrà importanti conseguenze sull’olonomia di ω.
CAPITOLO 3. PIATTEZZA
3.4
52
Olonomia di una connessione piatta
Sia F una foliazione orizzontale. Una prima proprietà di F è la seguente: poiché Rg∗ Hu = Hu g , H è invariante per traslazioni. Ne segue che anche F lo è.
Sia V un aperto coordinato in P con una carta che soddisfa la definizione di
foliazione. Al variare di g ∈ G gli insiemi Vg = V g definiscono un ricoprimento
di π −1 (π(V )), ciascuno dei quali fornisce una carta che rispetta la foliazione,
essendo questa invariante sotto l’azione destra. Queste carte permettono di dare
un diffeomorfismo tra π(V ) × G e π −1 (π(V )) che manda la foliazione F nella
partizione in insiemi del tipo π(V ) × { G }. Si ha dunque una banalizzazione
locale di π tramite mappe che rispettano la struttura della foliazione. Ogni punto p ∈ M ammette un tale intorno banalizzante, e tutte queste trivializzazioni
sono tra loro compatibili nel senso che la transizione dall’una all’altra manda le
foglie di Ui × G in quelle di Uj × G. Ne segue che le mappe di transizione sono
funzioni da Ui in G costanti.
Fatte queste premesse, è possibile introdurre una nuova struttura differenziale su P , con una topologia diversa da quella originale, che corrisponde ad
una discretizzazione del gruppo G. Sia dato un ricoprimento { Ui }i∈I di M con
delle banalizzazioni φi come quelle descritte nel precedente paragrafo. A meno
di restringere gli Ui è lecito assumere che si tratti di aperti connessi coordinati,
e dunque diffeomorfi a sottoinsiemi Wi di Rn tramite ψi . La nuova topologia su
P sarà quella indotta dalle carte
ψi,g :φ(Ui × { g })
φ(p, g)
- Wi
- ψi (p)
È facile vedere che queste mappe definiscono un atlante su P . Inoltre, le banalizzazioni per π possono essere viste in questa nuova struttura come delle
mappe C ∞ rispetto a quella su Ui × G data dalla topologia discreta su G: in
questo senso il procedimento ora svolto corrisponde ad una discretizzazione di
G. Il fatto che le mappe di transizione siano costanti è una condizione necessaria e sufficiente affinché siano continue, e in questo caso sono differenziabili.
Se u ∈ φ(Ui × { g }), la carta induce un isomorfismo canonico tra lo spazio
tangente in u rispetto a questa nuova struttura e il sottospazio Hu del tangente
in quella vecchia. Dunque π rimane differenziabile per costruzione, e questa
osservazione permette di concludere che viene preservata anche la surgettività
del differenziale, che ora diviene addirittura un isomorfismo. Si ha dunque una
nuova struttura di fibrato di P su M , con la stessa proiezione. Infine, le foglie di
F sono aperte in quanto per costruzione sono date da unioni di aperti coordinati, e connesse per archi. Infatti, se γ(t) è un arco in una foglia F , differenziabile
rispetto alla struttura originale, le sue rappresentazioni in coordinate tramite le
banalizzazioni locali danno curve lisce con seconda componente costante. Sono
dunque C ∞ rispetto alla struttura di Ui × G con G discreto, e ricostruendo γ si
ha la tesi, ricordando che inizialmente F era connesso e localmente diffeomorfo
ad Rn , dunque connesso per archi. Le foglie sono quindi le componenti connesse
di P rispetto alla nuova topologia.
Sia ora p ∈ M , u ∈ π −1 (p), F la foglia passante per u. La mappa di
proiezione può essere ristretta ad F , e poiché Tu F è isomorfo a Tp M tramite π∗
segue dal teorema della mappa inversa che esistono un intorno U di p in M ed
CAPITOLO 3. PIATTEZZA
53
uno di u in P , indicato con U 0 , tali che π ristretta a U 0 ∩ F è un diffeomorfismo
su U . A meno di restringere gli intorni si potrà supporre che ciascuno dei due
sia connesso. Se ora u
e è un altro punto di π −1 (p) ∩ F , l’azione destra dà un
0
diffeomorfismo tra U ∩ F e un opportuno aperto connesso contenente u
e, sul
quale π si restringe a sua volta ad un diffeomorfismo su U . Dunque per ogni
g ∈ G per cui valga u g ∈ π −1 (p) le traslazioni di U 0 ∩ F danno aperti disgiunti
e connessi su cui π si restringe ad un diffeomorfismo su U . Sotto queste ipotesi
tali traslazioni sono tutte e sole le componenti connesse di π −1 (U ). Dunque
ogni punto la cui fibra intersechi F ha un intorno banalizzante nel senso dei
rivestimenti. D’altronde, sotto l’ipotesi che M sia connessa, dato un qualsiasi
punto q ∈ M esiste un arco γ che lo connette a p. Se γ
e è il suo sollevamento
orizzontale con punto iniziale u, questo giace interamente su F : γ
e(1) appartiene
a π −1 (q) ∩ F . Se ne conclude che π, ristretto ad F , dà un rivestimento. Tutta
la teoria riguardante questi oggetti può essere quindi richiamata a questo punto
per lo studio dell’olonomia di ω 1 .
Richiamo qualche risultato dalla teoria dei rivestimenti. Ogni cammino chiuso γ in M con punto base p può essere sollevato in modo unico a γ
e a meno di
scegliere il punto di partenza u. Naturalmente il secondo estremo di γ
e appartiene
alla fibra di p, ma non è detto che coincida con u: sotto l’ipotesi di connessione
di F (in questo caso valida per definizione di foglia) dato comunque un punto
u0 ∈ π −1 (p) esiste un arco in F che lo collega a u, e la sua proiezione darà un
cammino chiuso il cui sollevamento termina in u0 . È però vero che i sollevamenti di due cammini omotopicamente equivalenti con punto base u coincidono
anche nel secondo estremo, e sono a loro volta equivalenti: questo dà un’azione
destra di π1 (M ) sulla fibra di p, detta di monodromia. Essa è transitiva, grazie
all’osservazione fatta poco sopra. Se poi è dato un cammino chiuso e omotopicamente banale in F con punto base u, anche la sua proiezione lo sarà: questo
dà un omomorfismo iniettivo ϕ : π1 (F ) → π1 (M ). L’azione di monodromia dà
invece un omomorfismo surgettivo ψ : π1 (M ) → Φ(ω): se esiste un trasporto
parallelo che porta u in u0 , allora questo giace su F , e di conseguenza u0 ∈ F .
Se il trasporto è fatto su un cammino chiuso allora la proiezione dà un laccio
in M , la cui classe di omotopia agisce su u mandandolo in u0 . Il nucleo di tale
morfismo è dato dalla famiglia dei cammini in M il cui sollevamento è pure
chiuso in F : si tratta dell’immagine di π1 (f ) tramite ϕ. Vale quindi l’esattezza
della seguente successione:
0
- π1 (F )
ϕπ1 (M )
ψ-
Φ(ω)
- 0
Si può dunque concludere:
Thm 3.4.1:
quoziente
Il gruppo di olonomia di una connessione piatta ω è isomorfo al
π1 (M )/ϕ (π1 (F ))
o più succintamente
π1 (M )/π1 (F )
dove F è un qualsiasi elemento della foliazione indotta dalla distribuzione H.
1 Questi argomenti sono stati trattati nei corsi istituzionali nel caso C 0 , ma valgono anche
in contesto differenziabile.
CAPITOLO 3. PIATTEZZA
54
Il fatto che la costruzione fatta non dipenda dalla scelta specifica della foglia è di facile dimostrazione: basta ricordare che la foliazione è invariante per
traslazione destra e che π = π ◦ Rg .
Es 3.4.1: Sia ω una connessione sul toro come quella introdotta nell’esempio
2.3.1. Il campo che genera la distribuzione, come detto, è integrabile e dà
delle curve sul toro definite su tutto R. Poiché S 1 ha dimensione 1 deve valere
[ω(X), ω(Y )] = 0 per ogni X, Y . Dunque l’equazione di struttura dà Ω = dω.
Essendo ω = φdt + g −1 dg, con φ costante, varrà dω = 0, e la connessione è
piatta. Il gruppo di monodromia dipende fortemente da φ: si tratterà sempre
di un gruppo ciclico, e sarà finito se e solo se il rapporto tra φ e 2π è razionale.
Innanzi tutto, le curve integrali del campo non sono altro che i sollevamenti
orizzontali di γ(t) = e2iπt su S 1 , che ne genera il gruppo fondamentale. Se
una di queste curve si autointerseca allora è periodica: la sua velocità è infatti
determinata dalla posizione, e per la parte di unicità del teorema di CauchyLipschitz due curve che in uno stesso punto abbiano la stessa velocità e risolvano
lo stesso problema coincidono.
I sollevamenti corrispondono alle curve su [0, 1]×
S 1 date da t 7→ t, ei(θ+tφ) : l’azione di monodromia di nγ è quindi data da
t, eiθ 7→ t, ei(θ+nφ) . Se il rapporto tra φ e 2π non è razionale, tale azione è
libera, e pertanto il morfismo di Z in Φ(ω) è iniettivo. Essendo questo surgettivo
per quanto argomentato sopra, si tratta di un isomorfismo: il gruppo di olonomia
è quindi Z. Se invece φ e 2π sono in rapporto razionale, esiste un n ∈ Z
positivo per cui la curva si richiude. Scegliendo n minimo si ottiene che il
nucleo dell’azione è il sottogruppo nZ, e si ha Φ(ω) ' Z/nZ.
Capitolo 4
Teorie di gauge
Alla luce della teoria esposta finora è possibile costruire un modello della teoria
dell’elettrodinamica in termini di connessioni su fibrati principali, come esempio
di teoria di gauge.
4.1
Background fisico
Quanto svolto di seguito vuole essere una giustificazione sintetica del formalismo
usato nelle prossime sezioni; per ulteriori dettagli si vedano [2], [3] e [7].
Richiamo brevemente qualche elemento di relatività ristretta. In questa
teoria l’usuale spazio R3 viene sostituito dallo spazio di Minkowski, cioè R4 con
la metrica espressa da


1 0
0
0
0 −1 0
0

gij = 
0 0 −1 0 
0 0
0 −1
Le variabili spaziali sono espresse da xµ , con µ = 0, 1, 2, 3: x0 rappresenta il
tempo moltiplicato per la costante c (la velocità della luce, talvolta posta a 1 tramite un’opportuna scelta delle unità di misura) mentre le altre coordinate sono
quelle usuali. In questo modo, i cambiamenti di sistema di riferimento non sono
elementi di SO3 , ma di quello che si chiama gruppo di Lorentz, formato dalle
trasformazioni che preservano questo prodotto scalare. Naturalmente, qualsiasi
prodotto scalare tra vettori in R4 tramite questa metrica è indipendente dalla
scelta del sistema di riferimento.
Dato che questo nuovo modello si basa su una geometria diversa da quella
classica di R3 , è naturale aspettarsi che le vecchie grandezze vettoriali, come
velocità e momento, non siano invarianti sotto le trasformazioni di Lorentz, e in
definitiva non siano quantità fisicamente consistenti. Certamente non potranno
essere più considerate come vettori, poiché il nuovo sistema è in dimensione
quattro. A questo scopo vengono introdotti i cosiddetti “quadrivettori”, il cui
primo esempio è quello di posizione, ottenuto da quello classico per l’aggiunta
di una componente ct.
Sia data una curva nello spazio di Minkowski: essa rappresenterà il moto
di un oggetto rispetto a un dato sistema di riferimento. Come curva parame55
CAPITOLO 4. TEORIE DI GAUGE
56
trizzata essa ammetterà un vettore “velocità” intesa come la derivata rispetto
al parametro; questo non potrà essere identificato con il tempo, poiché secondo
il modello in uso esso dipende dal sistema di riferimento, e dunque le derivate
rispetto a questo non rappresenteranno dei vettori ben definiti. A questo scopo occorre utilizzare una variabile intrinseca, cioè indipendente dalla scelta del
sistema di riferimento, e un buon candidato può essere:
1p 2 2
1p µ
x gµµ xµ =
c t − x2
τ=
c
c
Paramentrizzando la curva rispetto alla variabile τ , detta tempo proprio, e
derivando, si ottiene quello che si usa chiamare quadrivettore velocità, le cui
componenti spaziali sono γv i , e quella temporale è γc, dove
γ=r
1
v2
c2
In generale, la derivata rispetto al tempo proprio è uguale a quella rispetto a t
moltiplicata per γ.
In maniera simile vengono definiti degli altri quadrivettori, le cui componenti spaziali sono proporzionali a grandezze vettoriali della meccanica classica, mentre quella temporale è un’opportuna quantità che nel vecchio modello
rappresentava uno scalare. Ad esempio:
1−
• il quadrivettore impulso P è definito come la velocità moltiplicata per la
massa. Le componenti spaziali sono quelle del momento classico moltiplicate per γ, quella temporale è E/c (E essendo l’energia);
• il quadrivettore forza è la derivata rispetto a τ dell’impulso;
• il quadrivettore densità di corrente ha componenti γρc e γJµ ;
• il potenziale vettore è ottenuto accostando a quello classico il campo φ.
Il campo elettromagnetico viene espresso in questo formalismo da un unico
tensore a due indici F ij , in modo che la forza di Lorentz possa essere descritta
semplicemente facendolo agire sul quadrivettore sorgente:
dpi
= Jj F ij
dτ
Imponendo questo e scegliendo un sistema di misura in cui c = 1 si ottiene:


0 −Ex −Ey −Ez
Ex
0
Bz −By 

F ij = 
Ey −Bz
0
Bx 
Ez By −Bx
0
In termini del potenziale vettore si ha F = dA come forma differenziale, cioè
Fij = ∂i Aj − ∂j Ai .
Anche in questo nuovo modello è possibile descrivere la dinamica tramite un
principio di azione stazionaria, e di conseguenza tramite le equazioni di EuleroLagrange che sono equivalenti ad essa. Per la particella libera, ad esempio, si
scrive l’azione come
Z
Z
mc2
2
dt
S = − mc dτ = −
γ
CAPITOLO 4. TEORIE DI GAUGE
57
che è stazionaria quando la lunghezza della traiettoria è minima rispetto alla
metrica di Minkowski. La lagrangiana sarà quindi L = −mc2 /γ, e si può verificare che la variabile coniugata a q µ è pµ , e le equazioni di Hamilton in questo
caso hanno la stessa forma che nel caso classico.
È evidente a questo punto che non sempre ha senso sommare due grandezze che classicamente sono scalari: bisogna prima assicurarsi che lo rimangano
relativisticamente. Ad esempio, se E è l’energia di una particella e V è un potenziale, essendo la prima una componente di un quadrivettore la somma delle
due non sarà uno scalare, poiché cambiando il sistema di riferimento la nuova
E sarà data da termini che coinvolgono le componenti di p. Nel caso in cui il
potenziale è quello scalare di un campo elettromagnetico, invece, dal momento
che questo è la coordinata temporale del potenziale vettore avrà senso sommarlo all’energia, a condizione che anche al momento venga aggiunto il potenziale
vettore: l’oggetto ottenuto sarà un ben definito quadrivettore.
4.1.1
Equazioni di Hamilton e di Schrödinger
Sia H l’hamiltoniana di una particella carica in un sistema in cui non siano presenti campi elettromagnetici: classicamente, se questa non dipende dal tempo
rappresenta l’energia della particella. Si introduca ora un quadrivettore (covariante) potenziale elettromagnetico A = φdt + Aµ dxµ , e si considerino le nuove
coordinate momento definite da
p∗µ = pµ + Aµ (t, q)
Allora è possibile descrivere la dinamica del nuovo sistema tramite queste coordinate e l’hamiltoniana
H ∗ (q, p∗ , t) = H(q, p∗ − eA, t) − eφ(t, q)
e le equazioni sono le solite, usando le nuove variabili al posto delle vecchie.
Poiché si potrà avere una dipendenza di H dal tempo, si aggiunge un’equazione:
 ∗
∂H ∗
dp


=−


dt
∂q



dq
∂H ∗
=

dt
∂p∗



∗
∗


 dH = ∂H
dt
∂t
Dunque le equazioni della fisica sono in definitiva quelle classiche, purché
la variabili in uso vengano opportunamente modificate. Per la dimostrazione
rimando a [2].
Una cosa simile avviene in meccanica quantistica. In questo contesto, le
grandezze misurabili, dette “osservabili”, sono rappresentate da operatori autoaggiunti che agiscono su uno spazio di Hilbert complesso i cui elementi sono
i possibili stati del sistema, indicati con |ψi. Si postula che i possibili esiti
di un’operazione di misura siano gli autovalori dell’operatore, e gli autovettori associati rappresentino stati in cui l’osservabile assuma il valore assegnato
(gli autostati del sistema). Uno stato generico sarà combinazione lineare di autostati o, quando questi siano in numero infinito, sarà rappresentato da una
CAPITOLO 4. TEORIE DI GAUGE
58
distribuzione. Quando viene misurata un’osservabile si dice che lo stato collassa
nell’autostato corrispondente al valore ottenuto.
Si consideri per semplicità l’operatore corrispondente alla misura della posizione di una particella che si muove su R. Per quanto detto, il risultato della
misura dà un autovalore x per l’operatore, corrispondente all’autostato che si
indica con |xi. In questo modo si ha una corrispondenza tra i punti della retta, indicati con x, e gli elementi |xi della base spettrale dell’osservabile. Ad
ogni stato |ψi viene associata la “funzione d’onda” ψ(x), il cui valore è dato
dal prodotto scalare hx|ψi tra lo stato stesso e l’autostato corrispondente alla
posizione x. Tale funzione rappresenta le coordinate dello stato, come vettore,
rispetto alla base formata dagli autostati dell’operatore posizione in R. Aggiungendo l’ipotesi che se due vettori sono multipli l’uno dell’altro tramite uno
scalare complesso non nullo allora esprimono lo stesso stato, si può assumere
che R|ψi sia unitario. In questo caso, dato che la norma quadra di |ψi è data
2
da R |ψ(x)| dx, l’integrando è una distribuzione di probabilità che viene interpretata come quella che lo stato, una volta che sia misurata la posizione,
collassi nell’autostato associato a x. Il caso di particelle a più gradi di libertà
può essere affrontato in maniera simile, prestando attenzione alle complicazioni
tecniche, ottenendo nuovamente una distribuzione di probabilità sullo spazio in
cui si muove la particella.
Data l’hamiltoniana H, l’evoluzione temporale della funzione d’onda è descritta dall’equazione di Schrödinger:
i~
∂ψ
= Hψ
∂t
Per presentare un semplice esempio, sia
H(x, p) =
p2
+ V (x)
2m
In coordinate cartesiane si assume che p agisca come una derivata:
pµ = −i~
∂
∂xµ
metre V agisce semplicemente per prodotto. Allora l’equazione di Schrödinger
diviene:
2 X 2
∂ψ
~
∂ ψ
+Vψ
i~
=−
µ 2
∂t
2m
µ (∂x )
Considero ora la dinamica di una particella carica in presenza di campi
elettromagnetici rappresentati da un potenziale vettore. Per analogia con il
caso relativistico classico (cioè non quantistico) riscrivo l’equazione sostituendo
al momento p e all’hamiltoniana H che si avrebbero in assenza di campi quelli
ottenuti sommando i contributi dovuti ad A. Si ha dunque:
i~
∂
−
∂t
ie
~
2 X
2
~
∂
ie
φ ψ=−
Aµ ψ + V ψ
−
µ
2m
∂x
~
µ
Il potenziale vettore non è determinato dai campi: la fisica del sistema rimane
invariata se ad Aµ si somma ∂µ χ, dove ∂µ = ∂/∂xµ e χ è una qualsiasi funzione
CAPITOLO 4. TEORIE DI GAUGE
59
scalare definita su R4 , cioè se si applica quella che si chiama una trasformazione
di gauge. Ci si può chiedere allora come cambia la soluzione dell’equazione di
Schrödinger a seguito di questa trasformazione. Se ψ risolve l’equazione per il
potenziale A, allora
ie
χ ψ
exp
~
la risolve per A + dχ.
4.2
L’elettrodinamica come teoria di gauge
La fisica di un sistema elettrondinamico è quindi invariante sotto trasformazioni
del tipo
Aµ 7→ Aµ + ∂µ χ
purché anche la ψ venga modificata secondo
ie
ψ 7→ exp
ψ
~
Delle trasformazioni simili erano già state incontrate nel contesto delle connessioni su fibrati principali. Se tij è la mappa di transizione tra due banalizzazioni locali φi e φj , le forme di connessione locali trasformano come
Aj = Adt−1 ◦Ai + t−1
ij dtij
ij
t−1
ij dtij
dove ricordo che la scrittura
sta a rappresentare il campo vettoriale
invariante su G che in tij assume il valore dato da dtij . Se il gruppo è abeliano
l’azione di Adt−1 è banale e scompare. Se poi il fibrato è associato ad uno
ij
vettoriale, la derivata covariante è rappresentata semplicemente da
∂µ + Aj µ = ∂µ + Ai µ +
∂tij
∂xµ
Questo suggerisce di descrivere l’elettrodinamica secondo il modello che segue. La funzione d’onda ψ può essere considerata come una sezione di un fibrato
vettoriale complesso di dimensione 1, la cui struttura andrà specificata in seguito 1 . La trasformazione di ψ quando si cambia il potenziale è un prodotto per un
numero complesso unitario: si potrà quindi pensare che una scelta della gauge
corrisponda a un cambiamento della banalizzazione locale del fibrato tramite la
mappa di transizione data dall’elemento di U (1) rappresentato da exp(ieχ/~).
Si chiederà dunque che il gruppo di struttura del fibrato sia proprio U (1), che è
abeliano. Se si indica con A la quantità complessa iA si ottiene una 1-forma di
connessione locale: essendo il potenziale un vettore covariante reale, moltiplicarlo per l’unità immaginaria fornirà in effetti una forma differenziale a valori
in iR, l’algebra di Lie di U1 . La trasformazione Aµ 7→ Aµ + i∂µ χ mostra che A
rappresenta in effetti una connessione sul fibrato principale associato a quello
di cui ψ è una sezione. Segue che l’operatore
e
e
Aµ = ∂µ + i −
Aµ
∂µ + −
~
~
1 Se si immagina di lavorare su tutto R4 , senza singolarità nei campi, il fibrato è necessariamente banale, per via di un teorema di omotopia che garantisce l’esistenza di un unico fibrato
su uno spazio retraibile una volta che sia fissata la fibra.
CAPITOLO 4. TEORIE DI GAUGE
60
è una derivata covariante a tutti gli effetti. L’equazione di Schrödinger può
quindi essere riscritta in termini di connessioni come
i~D0 ψ = −
~2
2m
X
3
Dµ2 ψ + V ψ
µ=1
dove Dµ rappresenta la derivata covariante rispetto alla variabile xµ . Questa
scrittura è formalmente identica a quella originale senza potenziale vettore: come il principio di inerzia conserva la sua forma nel caso di varietà generiche a
condizione di sostituire la derivata covariante con quella indotta dalla connessione di Levi-Civita, così anche l’equazione di Scrödinger viene modificata soltanto
indtroducendo la differenziazione covariante data dai potenziali.
In quest’ottica, segue immediatamente dall’equazione di struttura di Cartan
che il tensore dei campi F µν è proporzionale alla forma locale di curvatura:
F = dA = idA = iF
La connessione rappresentata dai potenziali è piatta se e solo se i campi si
annullano identicamente. Applicando l’identità di Bianchi si ottiene:
0 = (dF )µνλ = ∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ
Sostituendo opportunamente gli indici questo dà le due equazioni di Maxwell
omogenee, che sono quindi legate alla struttura geometrica del modello. L’informazione fisica sarà data dalle altre due equazioni, che possono essere ottenute
tramite quelle di Eulero-Lagrange, o equivalentemente dal principio di azione
stazionaria, legato alla fisica più che alla geometria del modello.
Per studiare gli effetti elettromagnetici si propone quindi un nuovo modello
geometrico, che consiste nel considerare, anziché lo spazio di Minkowski, un
fibrato su di esso con fibra C, e nel definire un’opportuna connessione sul suo
principale associato. In questo modo, la scelta della gauge corrisponde a una
banalizzazione locale del fibrato, mentre la funzione d’onda ψ di uno stato si
riduce ad una sezione del fibrato vettoriale (o ad una sua rappresentazione
locale), e il potenziale vettore è una 1-forma locale di connessione. Il tensore
dei campi, che sembra quasi passare in secondo piano (e in effetti avrà rilevanza
secondaria per questa teoria), rappresenta la forma locale della curvatura: la
sua rappresentazione non dipende dalla scelta della gauge, e al variare delle
coordinate trasforma come un tensore. Incidentalmente, questo è in accordo
con il fatto che classicamente l’arbitrarietà sta solo nella scelta del potenziale,
che deve comunque essere tale da non cambiare i campi. Per questa ragione in
passato si è ritenuto che fossero questi a portare l’informazione fisica rilevante,
mentre il potenziale non era visto che come un mero artificio matematico utile
per semplificare le equazioni.
Quando lo spazio base è R4 il fibrato è banale. In questo caso particolare
è possibile una scelta globale della gauge, e tanto la funzione d’onda quanto il
potenziale sono definiti su tutto lo spazio. Ci possono però essere delle situazioni
(come quella del monopolo magnetico, afforntata poco più avanti) in cui questo
non è possibile, e si rende necessario sfruttare appieno la struttra di fibrato
dando delle trivializzazioni locali che consentano di definire vari potenziali locali,
che trasformeranno secondo le regole note imposte dalle mappe di transizione.
CAPITOLO 4. TEORIE DI GAUGE
4.3
61
Il monopolo di Dirac
La teoria dell’elettromagnetismo, pur non prevedendo l’esistenza di un monopolo
magnetico, non la nega nemmeno; in altre parole non è in disaccordo con la
possibilità che sperimentalmente possa essere trovata della “carica magnetica”.
Dirac si pose il problema di descrivere il comportamento di un simile oggetto
qualora esistesse.
Si consideri una carica magnetica g localizzata nell’origine del sistema di
riferimento, in condizioni statiche. Le equazioni di Maxwell (espresse in cgs)
per questo sistema sono:

∇ · E(t, r) = 0



 ∇ · B(t, r) = 4πgδ(r)

∇ × E(t, r) = 0



∇ × B(t, r) = 0
Le equazioni sono disaccoppiate, e quelle per il campo magentico sono formalmente identiche a quelle dell’elettrostatica. Il campo magnetico fuori dall’origine
sarà quindi:
g
B(t, r) = 3 r
r
Va osservato che ha senso studiare solo la regione esterna all’origine, e questo
non solo perché il campo non è definito in quel punto, ma anche per una ragione
teorica. Il modello introdotto sopra mostrava che le equazioni di Maxwell omogenee discendono naturalmente dall’identità di Bianchi, e sono pertanto legate
alla struttura geometrica dell’ambiente. Se la fisica di una certa regione può
essere descritta tramite un potenziale vettore allora la distribuzione di carica
magnetica in tale spazio deve annullarsi. In altre parole, il modello introdotto
può descrivere i fenomeni dovuti alla presenza di monopolo magnetico, ma solo
fuori dalla regione in cui questo è concentrato.
Nell’ipotesi che il sistema sia statico (rispetto ad un particolare riferimento)
la componente temporale è trascurabile, e ha senso restringere lo spazio a R3 .
Occorre inoltre rimuovere l’origine: ha quindi senso scegliere la sfera S 2 come
ambiente in cui studiare i fenomeni dovuti alla presenza del monopolo. Il tutto
sarà quindi espresso in termini di un fibrato su S 2 con fibra C e del suo principale
associato, la cui struttura andrà stabilita in seguito. Dato che la sfera privata
di un qualsiasi punto è diffeomorfa al piano e in particolare è retraibile, sui due
aperti ottenuti rimuovendo rispettivamente i due poli Nord e Sud (cioè ±ẑ) è
possibile trovare delle banalizzazioni del fibrato, e dunque dei potenziali estesi
a tutta la regione. Non sarà invece possibile trovarne uno definito sull’intera
sfera, poiché altrimenti per il teorema di Gauss si avrebbe:
Z
Z
Z
4πg =
B · n̂ ds =
∇ × A · n̂ ds =
A · dl = 0
S2
S2
∂S 2
I due potenziali
AN = g
−ydx + xdy
r(r + z)
AS = g
ydx − xdy
r(r − z)
sono definiti rispettivamente sulle calotte Nord e Sud, e il loro rotore è effettivamente il campo magnetico B sul dominio di ciascuno. Fuori dall’asse z è ben
CAPITOLO 4. TEORIE DI GAUGE
62
definita la differenza tra queste due forme: ciò permetterà di costruire la mappa
di transizione da un aperto banalizzante all’altro.
AN − AS = g
−2ydx + 2xdy
r (r2 − z 2 )
e passando a coordinate sferiche si ha
AN − AS =
2g
dφ = ∇(2gφ)
r sin θ
La trasformazione è quindi data dal potenziale di gauge χ = 2gφ. Da qui si può
riottenere il risultato del teorema di Gauss da cui si era partiti:
Z
Z
Z
B · n̂ ds =
B · n̂ ds +
B · n̂ ds =
S2
S 2 ∩{ z≥0 }
S 2 ∩{ z≤0 }
Z
Z
=
∇ × AN · n̂ ds +
∇ × AS · n̂ ds =
UN
2π
US
Z
=
(AN − AS ) dφ = 4πg
0
Si supponga ora che nella regione perturbata dalla presenza del monopolo
magnetico venga introdotta una carica elettrica di prova sufficientemente piccola da non modificare apprezzabilmente i campi. Questo è teoricamente possibile
a prescindere dall’ipotesi che non esista una carica elettrica non nulla di modulo
arbitrariamente piccolo, poiché in questa eventualità basta sovrapporre più monopoli magnetici in modo da soddisfare la condizione. Se q è il valore di questa
carica, l’equazione di Schrödinger per questo sistema, diviene
i~
∂ψN
=−
∂t
~2
2m
X
µ
∂
−
∂xµ
iq
~
2
(AN )µ
ψN
per la calotta Nord, e analogamente per quella Sud. La regola che trasforma
ψN in ψS è data dunque da
q 2qg
φ ψS
ψN = exp i χ ψS = exp i
~
~
Da qui si ricava la funzione di transizione
2qg
φ
tSN = exp i
~
Se il modello è buono, tSN rappresenta una ben definita funzione di φ, e in
quanto tale dev’essere 2π-periodica. Questo equivale alla condizione di quantizzazione:
2qg
∈Z
~
Ecco dunque una prima previsione ricavata da questa teoria: cariche elettrica
e magnetica sono quantizzate. Infatti, fissando il valore di q si ottiene una
condizione su g che le impone di avere un valore multiplo intero di una data
costante, e dunque esiste una carica fondamentale g0 per cui il valore di qualsiasi
CAPITOLO 4. TEORIE DI GAUGE
63
monopolo magnetico sia g = kg0 per qualche k ∈ Z. In modo del tutto analogo
si ricava la quantizzazione della carica elettrica. Questo risultato è del tutto
indipendente da quello mostrato da Millikan in laboratorio, e anzi non dà alcuna
previsione sul valore di queste cariche fondamentali. Ciò che si può concludere
è che, se la teoria di gauge per l’elettrodinamica è un buon modello, e se esiste
nell’universo un monopolo magnetico, allora le cariche elettrica e magnetica
sono quantizzate.
4.4
L’effetto Aharonov-Bohm
Non è mai stata provata fino ad oggi l’esistenza di alcuna carica magnetica. I
risultati della sezione precedente potrebbero essere visti come fini a se stessi,
senza significato fisico in quanto basati solo su ipotesi sperimentalmente prive
di fondamento. In definitiva, quell’esempio non giustifica fino in fondo l’introduzione della teoria di gauge elettrodinamica, o per lo meno non la rende davvero
necessaria. Quello che viene presentato di seguito, invece, è un risultato che ha
trovato un riscontro sperimentale, e può quindi essere più convincente.
Uno dei primi risultati sperimentali nell’ambito della meccanica quantistica
fu quello messo in luce dalla cosiddetta “esperienza della doppia fenditura”. Agli
inizi del XIX secolo Young aveva fatto passare della luce attraverso due fenditure
verticali su una parete, rilevando su uno schermo una figura di interferenza ed
evidenziando così il comportamento ondulatorio dei fotoni (benché allora non
si usasse questo linguaggio). Analogamente, questo nuovo esperimento consiste
nello sparare attraverso una doppia fenditura un fascio di elettroni, ottenendo
anche in questo caso un fenomeno di interferenza.
Classicamente questo fenomeno non ha senso: se l’elettrone è una particella massiva è naturale aspettarsi che la distribuzione rilevata sullo schermo sia
concentrata in due punti corrispondenti alle fenditure. Secondo la meccanica
quantistica, invece, questo ha perfettamente senso. Se si suppone che un certo
elettrone abbia superato il piano su cui sono incise le fenditure, senza però sapere
da quale delle due sia passato, il suo stato potrà essere scritto come combinazione lineare dei due fondamentali |ψ1 i e |ψ2 i, ciascuno dei quali rappresenta
il caso in cui la particella abbia attraversato una delle due fessure. Tali stati,
essendo autovettori per l’operatore hermitiano che rappresenta l’osservazione
della fenditura da cui è passato l’elettrone, sono ortogonali. Se si suppone che
le situazioni siano equiprobabili, allora:
√
2
(|ψ1 i + |ψ2 i)
|ψi =
2
√
dove la costante 2/2 serve da normalizzazione. Sulla base dei principdio di
Huygens, ciascuno dei due stati fondamentali può essere descritto come quello
di una sorgente, posta nella relativa fenditura, che emette elettroni in maniera
isotropa. Le due funzioni d’onda sono ottenute l’una dall’altra tramite uno shift
del dominio, e la fase relativa tra di esse fa sì che sommandole si abbia l’effetto
di interferenza rilevato sperimentamente.
Inserendo dietro le fenditure, in una zona in cui gli elettroni non possano entrare, un solenoide molto lungo attraversato da corrente, si ottiene un fenomeno
molto curioso, che porta il nome di “effetto Aharonov-Bohm”. Benché la teoria
classica non preveda alcuna variazione rispetto al caso precedente (nella regione
CAPITOLO 4. TEORIE DI GAUGE
64
esterna al solenoide il campo elettromagnetico è trascurabile), sperimentalmente si osserva uno shift della figura di interferenza proporzionale al flusso Φ del
campo magnetico nel solenoide, misurato considerando positivo il verso dell’asse
z verso l’alto.
Fenditura 2
γ2
P
Solenoide
Sorgente
γ1
Fenditura 1
La trattazione fisica può essere svolta nel modo che segue. Le due funzioni
d’onda ψ1 (x) e ψ2 (x) corrispondenti ai due autostati dell’operaore che misura da quale fenditura sia passato l’elettrone sono identiche nella sorgente. Si
ipotizza che l’emissione di particelle sia isotropa e abbia propagazione sferica;
sotto la condizione che la distanza tra le fessure sia trascurabile rispetto alle lunghezze caratteristiche dell’apparato sperimentale (distanza sorgente-fenditure e
fenditure-schermo) si può approssimare il comportamento nei punti di interesse,
in condizioni di particella libero, come quello di un’onda piana. Scelgo un sistema di riferimento in cui il piano delle fenditure corrisponde a x = 0, e i punti in
cui queste si trovano siano individuati dai vettori r1 ed r2 , mentre la sorgente
è posta in rS . Lo scopo della trattazione è studiare cosa avviene in un punto P
sullo schermo, individuato da rP .
Per prima cosa occorre valutare le due funzioni d’onda in r1 ed r2 rispetto
ad una particolare scelta di gauge. Per ora è comodo usarne una in cui il
potenziale vettore è identicamente nullo nel semipiano delimitato dalle fenditure
e contenente la sorgente. In questo modo vale
ψj (ri ) = ψj (rS ) eik·(rj −rS )
dove il vettore k è una costante che caratterizza la propagazione degli elettroni,
mentre i è l’unità immaginaria e j è un indice che varia tra 1 e 2 (cioè identifica
lo stato che si sta considerando). Fin qui non vi è stata nessuna influenza da
parte del solenoide.
Si suppongano note le funzioni d’onda nei punti corrispondenti alle fenditure per una differente scelta di gauge, quella cioè in cui il potenziale si annulla
identicamente nell’altro semipiano. Qui si sta ipotizzando che il solenoide sia
sufficientemente sottile da renderne trascurabile la sezione. Allora i valori delle
funzioni in P sono ottenuti nuovamente in maniera analoga al caso senza solenoide, e cioè moltiplicando per il termine di fase eik·(rP −rj ) . Anche qui non c’è
alcun contributo dalla presenza del solenoide. Questo però diviene importante
CAPITOLO 4. TEORIE DI GAUGE
65
quando si cambia la gauge: passando dalla prima alla seconda ogni funzione
d’onda viene sfasata di un termine che dipende dal potenziale di gauge χ, che
può essere espresso come integrale di linea della differenza tra i potenziali. In
questo modo la ψj (rj ), rispetto alla seconda gauge, diviene:
Z rj
ie
A · dl
ψj (rS ) eik·(rj −rS ) exp
~ rS
In definitiva, le funzioni d’onda in P sono le stesse del caso senza solenoide, a
meno di una fase determinata dal potenziale. Questo può essere rilevante se la
fase relativa tra le due viene modificata. La variazione di tale fase rispetto al
caso senza solenoide è data da
Z
Z
ie
ie
exp
A · dl +
A · dl
~ −γ1
~ γ2
Il percorso −γ1 + γ2 può essere chiuso con un qualsiasi arco γ3 nella regione in
cui il potenziale è nullo, senza dare alcun contributo. La fase cercata diviene
dunque
Z
e ie
A · dl = exp −i Φ
exp
~ γ2 +γ3 −γ1
~
Segue che la figura d’interferenza risulta shiftata di una lunghezza proporzionale
al flusso del campo magnetico attraverso una spira del solenoide.
Il fenomeno può essere descritto geometricamente nel modo che segue. La
regione di interesse è quella esterna al solenoide, e ha la stesso tipo di omotopia
di una circonferenza, perciò il fibrato da introdurre avrà spazio base S 1 (e fibra
C, come sempre). I due stati fondamentali |ψ1 i e |ψ2 i corrispondono ad archi di
circonferenza γ1 e γ2 che connettono un punto S, che rappresenta la sorgente,
a P , posto sullo schermo, in cui si vogliono valutare le nuove funzioni d’onda.
Suppongo che la fenditura corrispondente al percorso γ1 sia posta in y = −d,
l’altra, invece, in y = d, con d > 0, in modo che γ1 − γ2 dia la circonferenza
percorsa in verso antiorario partendo dalla sorgente. Queste sono ottenute dalle
vecchie (|ψ1 iV e |ψ2 iV ) moltiplicandole per una fase eiφ(x) , cioè una sezione
del fibrato principale associato a quello in uso, con la condizione che questa
sia trasportata parallelamente lungo gli archi. Questo giustifica la restrizione
dello spazio ad un suo retratto per deformazione: dato che la curvatura della
connessione è rappresentata dai campi, che in questo caso sono nulli nella regione
di interesse, il trasporto parallelo lungo una curva non dipende che dalla sua
classe di omotopia. Per questo sistema è possibile scegliere un potenziale globale:
le condizioni che questo deve soddisfare sono che il suo rotore sia nullo, e che il
suo integrale lungo la circonferenza, percorsa in senso antiorario, dia iΦ 2 . La
forma
−ydx + xdy
A = iΦ
2πr2
soddisfa tali richieste. L’equazione del trasporto parallelo lungo la curva γ(s)
sarà
d exp (iφ(γ(s))) e
exp (−iφ(γ(s)))
− Aγ̇(s) = 0
ds
~
2 Il
flusso deve essere uguale all’integrale di linea del potenziale A = −iA. Moltiplicando
per i si ha la relazione data.
CAPITOLO 4. TEORIE DI GAUGE
66
da cui si ricava che, se lo sfasamento tra |ψiV e |ψi in γ(0) è φ0 , allora in γ(1)
vale
Z
e
iφ0 +
Ads
~ γ
Se si applica quanto detto supponendo nota la fase relativa tra ψ1 vecchia e
nuova in P , allora quella in S sarà
Z
Z
e
e
Ads = iφ0 −
Ads
iφ0 +
~ −γ1
~ γ1
Poiché per ipotesi ψ1 (S) = ψ2 (S), la fase relativa di |ψ2 i rispetto al valore
vecchio è data da
Z
Z
Z
e
e
e
e
iφ0 −
Ads +
Ads = iφ0 +
Ads = iφ − i Φ
~ γ1
~ γ2
~ γ2 −γ1
~
Dunque la fase relativa tra i due stati fondamentali di questo sistema è quella
del caso senza solenoide con un contributo aggiuntivo pari a −ieΦ/~. Se Φ è
un multiplo intero di h/e, allora sullo schermo non si rileva alcuna differenza
rispetto al caso precedente, poiché il nuovo contributo non influisce sull’esponenziale. Se però questo non vale, la figura di interferenza deve cambiare, e
in effetti l’evidenza sperimentale ha mostrato che questo è realmente ciò che
avviene.
Questo è un esempio in cui si manifesta la rilevanza fisica del potenziale
vettore, che classicamente non aveva altro significato che quello di un semplice
strumento matematico per manipolare le equazioni che determinano i campi,
veri protagonisti della teoria di Maxwell. Nella meccanica quantistica questi
devono invece passare in secondo piano poiché non sono in grado di descrivere
fino in fondo la fisica di fenomeni come quello appena analizzato, in cui la
presenza di potenziali non banali è in grado di influenzare un sistema nonostante
i campi siano identicamente nulli nella regione di interesse. Se da un punto
fisico questo può sorprendere (e in effetti questo risultato fu accolto con stupore
dalla comunità scientifica), matematicamente non presenta alcuna novità. Si
tratta semplicemente di un caso in cui una connessione, seppur piatta, presenta
olonomia non banale, ossia non tutti i cammini che si richiudano nello spazio
base fanno lo stesso una volta sollevati orizzontalmente. Se si considera una
regione sufficientemente piccola allora i trasporti paralleli sono tutti non banali,
ma appena entra in gioco una curva non retraibile questo non è più vero, e
l’effetto Aharonov-Bohm rappresenta un esempio fisico di questo fenomeno.
4.5
Continua...
La formulazione presentata ora dell’elettrodinamica non è che un esempio particolare di teoria di gauge. Più in generale, si possono presentare situazioni fisiche
in cui il sistema in analisi abbia dei gradi di libertà teorici in più rispetto a quelli
effettivamente osservabili. Nel caso trattato finora, questa variabile “in eccesso”
è il potenziale di gauge χ, che nella soluzione delle equazioni si manifesta chiaramente, ma che fisicamente non rappresenta nulla di evidentemente concreto. I
gradi di libertà in più vengono parametrizzati punto per punto da un opportuno
gruppo di Lie G, formato dalle trasformazioni che lasciano invariato il resto del
CAPITOLO 4. TEORIE DI GAUGE
67
sistema; scelto il gruppo viene definito un G-fibrato principaleP sulla varietà
M che rappresenta l’ambiente in cui si svolgono i fenomeni in analisi. Nel caso
presentato sopra, la variabile aggiuntiva era il potenziale di gauge χ, che varia
su R, sostituito poi da iR (un’algebra di Lie) e infine da U(1). Vengono poi introdotte delle 1-forme locali Ai a valori in g, con le regole di trasformazione che
permettano di definire una connessione su P . Da queste nascono immediatamente le 2-forme Fi che rappresentano la curvatura, legate ad Ai dall’equazione
di struttura di Cartan
Fi = dAi + Ai ∧ Ai
(4.1)
Il secondo termine della parte destra dell’equazione sparisce se G, detto gruppo
di gauge, è abeliano, ma in generale è rilevante. Riscritta per componenti, la
(4.1) diviene (omettendo l’indice i):
Fµν = ∂µ Aν − ∂ν Aµ + [Aµ , Aν ]
Questa differisce dall’equazione che definisce il tensore campo elettromagnetico
per la presenza del termine [Aµ , Aν ], che in effetti è stato trascurato osservando
esplicitamente che questo è legittimo essendo U(1) commutativo.
Si ha poi l’identità di Bianchi:
dFi + [Ai , Fi ] = 0
Tutte queste relazioni, ricavate in precedenza in modo puramente matematico, assumono significati fisici ben precisi, esattamente come nel caso dell’elettrodinamica l’identità di Bianchi rappresenta le due equazioni di Maxwell
omogenee.
Un celebre esempio di teoria di gauge non abeliana è quella di Yang-Mills,
in cui il gruppo di struttura considerato è U(2).
Bibliografia
[1] Tohru Eguchi, Peter B. Gilkey, e Andrew J. Hanson. Gravitation, gauge theories and differential geometry. North Holland publishing company,
1980.
[2] Theodore Frankel. The geometry of physics. Cambridge University Press,
2004.
[3] Herbert Goldstein, Charles Poole, e John Safko. Classical mechanics (third
edition). Addison Wesley, 2002.
[4] Noel Jeffrey Hicks. Notes on differential geometry. Van Nostrand Company,
1965.
[5] David Lovelock e Hanno Rund. Tensors, differential forms, and variational
principles. Dover Publications, Inc., New York, 1975.
[6] Marco Manetti. Topologia. Springer, 2008.
[7] David Morin. Introduction to classical mechanics, 2004.
[8] Shigeyuki Morita. Geometry of characteristic classes. American Mathematical Society, 2001.
[9] Mikio Nakahara. Geometry, topology and physics. Taylor and Francis
Group, 2003.
[10] Clifford Henry Taubes. Differential Geometry. Oxford Graduate Texts in
Mathematics, 2011.
68