Connessioni e teorie di gauge
Transcript
Connessioni e teorie di gauge
Università di Pisa FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI Corso di Laurea Triennale in Matematica Tesi di laurea triennale Connessioni e teorie di gauge Candidato: Relatore: Alessandro Malusà Chiarissimo prof. Riccardo Benedetti Anno Accademico 2011–2012 Sommario e convenzioni Il mio obiettivo in questo lavoro è stato quello di approfondire un argomento che non solo fosse interessante di per sé, ma che si prestasse anche ad applicazioni alla fisica. Con gli strumenti acquisiti in questo percorso mi è stato possibile formalizzare in maniera per così dire “pulita” alcuni problemi classici della meccanica trattata nei corsi di base e affrontare argomenti più avanzati dell’elettrodinamica nel contesto della meccanica quantistica. Nel primo capitolo affronto le proprietà fondamentali dei fibrati su una varietà M , ponendo particolare attenzione ai due principali punti di vista possibili: l’uno globale, l’altro locale. Nel primo, la struttura è rappresentata da una mappa di proiezione definita su uno spazio totale E a valori in M con delle proprietà di banalizzazione per certi aspetti molto simili a quelle dei rivestimenti. Il secondo, invece, consiste nella ricostruzione del fibrato per mezzo di incollamenti di insiemi della forma U × F , dove U è aperto in M , secondo le regole imposte dalle mappe di transizione. Un aspetto molto importante, trattato alla fine, è la possibilità di ricondurre qualsiasi fibrato a uno principale che ne riassume molte proprietà. Questo oggetto permette già di dare una formulazione compiuta ai problemi di corpo rigido. Passo poi alle connessioni, trattando prima quelle affini su varietà generiche e passando poi a quelle su fibrati principali. Le prime generalizzano a varietà qualsiasi la nozione di derivata covariante, già affrontata durante i corsi, come un oggetto che consente di formalizzare consistentemente l’idea che un dato campo vettoriale sia parallelo lungo una direzione, ed eventualmente di valutarne le “variazioni”: in questo modo è possibile dare una formulazione del principio d’inerzia anche per ambienti diversi da quello usuale di Rn . Nel contesto dei fibrati principali viene introdotto uno strumento simile, espresso in due possibili modi equivalenti: tramite un’opportuna distribuzione o una 1-forma a valori in un’algebra di Lie, richiedendo in entrambi i casi delle buone proprietà di traslazione. Vengono definiti i sollevamenti paralleli e l’olonomia. Tutto questo viene affrontato con una particolare attenzione per le regole di trasformazione delle rappresentazioni locali degli oggetti in analisi: questo sarà un punto chiave nell’affrontare le applicazioni a problemi fisici avanzati. Nel capitolo successivo approfondisco la nozione di curvatura, accennata nello studio delle derivate covarianti, estendendola al caso delle connessioni su fibrati principali. In termini della forma differenziale ad essa associata è possibile parlare di fibrati piatti, cioè a curvatura nulla, e dimostrare che, in questo caso, la distribuzione associata alla connessione è integrabile. In questo modo risulta ben definita una foliazione dello spazio totale, che consente di definire un opportuno rivestimento di M che lega l’olonomia all’omotopia dello spazio. 1 SOMMARIO E CONVENZIONI 2 Tutto questo viene impiegato nell’ultima parte per costruire un modello per l’elettrodinamica come teoria di gauge, in termini di una connessione data dal potenziale vettore. Tramite esempi classici come quello del monopolo di Dirac e dell’effetto Aharonov-Bohm illustro le applicazioni di quanto visto a questo contesto, dando una previsione teorica astratta e dando una descrizione consistente di un fenomeno effettivamente osservato in laboratorio. Salvo precisazioni ulteriori, in quello che segue assumo che tutte le varietà siano C ∞ , così come tutte le mappe. Userò indistintamente le espressioni “liscio”, “differenziabile” e “C ∞ ”. Prima di iniziare l’esposizione, vorrei lasciare un saluto e un ringraziamento alla memoria del professor Pino Vigna Suria, dell’Università degli Studi di Trento, venuto a mancare la scorsa primavera. Indice 1 Fibrati 1.1 Qualche esempio introduttivo . . . . . 1.2 Due parole sui rivestimenti . . . . . . 1.3 Definizioni e prime proprietà . . . . . 1.3.1 Punto di vista globale . . . . . 1.3.2 Punto di vista locale . . . . . . 1.4 Operazioni sui fibrati . . . . . . . . . . 1.4.1 Pullback di un fibrato . . . . . 1.4.2 Operazioni su fibrati vettoriali 1.5 Fibrati principali . . . . . . . . . . . . 1.6 Curiosità e considerazioni a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 6 6 7 10 12 12 13 14 17 2 Connessioni 2.1 Motivazioni; principio d’inerzia . . . . . . . . . . . 2.1.1 Il punto di vista delle coordinate . . . . . . 2.2 Connessioni affini . . . . . . . . . . . . . . . . . . . 2.2.1 La derivata covariante in sottovarietà di Rn 2.2.2 Connessioni affini su varietà generiche . . . 2.2.3 Il caso di varietà riemanniane . . . . . . . . 2.3 Connessioni su fibrati principali . . . . . . . . . . . 2.3.1 Derivata covariante indotta . . . . . . . . . 2.4 Olonomia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 23 24 25 28 35 38 42 44 3 Piattezza 3.1 Ancora sulla curvatura nel caso affine . 3.2 Curvatura di una 1-forma di connessione 3.3 Condizioni equivalenti alla piattezza . . 3.4 Olonomia di una connessione piatta . . 4 Teorie di gauge 4.1 Background fisico . . . . . . . 4.1.1 Equazioni di Hamilton 4.2 L’elettrodinamica come teoria 4.3 Il monopolo di Dirac . . . . . 4.4 L’effetto Aharonov-Bohm . . 4.5 Continua... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 46 48 50 52 . . . . . . . . . . e di Schrödinger di gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 57 59 61 63 66 Bibliografia . . . . . . . . . . . . 68 3 Capitolo 1 Fibrati La struttura di fibrato è molto utile per formalizzare e descrivere alcune idee che in matematica e fisica ricorrono spesso. 1.1 Qualche esempio introduttivo Di seguito riporto alcune situazioni in cui questo oggetto si rende necessario, per mettere in luce i bisogni che portano a introdurre tale strumento. Es 1.1.1 (Fibrato tangente): Data M una varietà di dimensione n è possibile definire, punto per punto, lo spazio tangente: si tratta di uno spazio vettoriale della stessa dimensione di M . Vorremmo costruire un oggetto che esprima bene l’idea di aver “incollato” una copia di un certo spazio vettoriale a ogni punto, e che permetta di parlare in maniera consistente di campi vettoriali e della loro eventuale regolarità. Uno spazio costruito come unione disgiunta dei Tp M al variare di p ∈ M è del tutto inadeguato a questo scopo: esso non ha alcuna ovvia struttura differenziabile ereditata da M , nè una topologia soddisfacente. C’è bisogno di qualcosa di più raffinato. Se p è un punto di M , esisterà un isomorfismo tra Tp M ed Rn , ma in generale non uno canonico; analogamente, spazi tangenti ad M in punti distinti sono a loro volta differenti, e non possono essere identificati. È però possibile dare una base di Tp M , e quindi un particolare isomorfismo con Rn , quando in un intorno del punto è definito un sistema di coordinate: in questo caso una base sarà definita sullo spazio tangente in ciascuno dei punti dell’intorno. Consideriamo due aperti coordinati Ui e Uj della varietà, e supponiamo che questi si intersechino. Lo Jacobiano del cambio di carta fornisce una trasformazione delle coordinate dello spazio tangente, ed essendo M una varietà C ∞ anche questa trasformazione sarà differenziabile. Se le carte sono date da ϕi(j) : Ui(j) → F Ai(j) , con Ai e Aj aperti di Rn , questo fornisce delle funzioni φi(j) : T M := p∈M Tp M → Ai(j) × Rn che possonoFessere considerate delle parametrizzazioni C ∞ : Ui e Uj si intersecano in U = p∈Ui ∩Uj Tp M , ed è ben definita una funzione φ : φi (U ) → φj (U ) che risulta essere C ∞ . Abbiamo quindi una struttura differenziabile su T M che permette di vedere questo spazio come incollamento di aperti della forma Ai × Rn , cioè una varietà di dimensione 2n. Inoltre, nelle carte così costruite, le prime n coordinate della parametrizzazione 4 CAPITOLO 1. FIBRATI 5 identificano un punto di M , mentre le altre n individuano un vettore tangente nello stesso. Sarà naturale considerare solo carte che godano di questa proprietà, poiché permettono di individuare in maniera immediata lo spazio a cui ciascun vettore appartiene. Es 1.1.2 (Corpo rigido): Considero il moto di un corpo rigido nello spazio tridimensionale. Nell’approssimazione di un punto materiale, la posizione sarà determinata completamente dalle coordinate del centro di massa rispetto a un fissato sistema di riferimento, ma se si considera un corpo esteso occorre tenere conto di ulteriori gradi di libertà legati alle possibili rotazioni. È utile considerare una fissata posizione privilegiata, in cui il centro di massa dell’oggetto sia nell’origine del sistema di riferimento, e sia orientato in un qualsiasi modo. Questo permette, fissato un qualunque punto P , di traslare l’oggetto dall’origine in P e di considerare l’orientazione ottenuta in questo punto come riferimento. A questo punto, una qualsiasi posizione dell’oggetto con centro di massa in P è determinata biunivocamente dalla rotazione intorno al punto che trasforma l’orientazione di riferimento in quella data. Per passare dal punto materiale al corpo esteso, quindi, basta associare ad ogni posizione non solo le coordinate del centro di massa, ma anche un elemento di SO3 che ne esprima l’orientazione. Si potrà dunque pensare lo spazio delle configurazioni come uno spazio euclideo a cui sia incollata, punto per punto, una copia di SO3 . Viene naturale a questo punto immaginare che lo spazio che descrive questa situazione possa essere R3 × SO3 con la sua struttura di varietà differenziabile. Una situazione simile, ma più complessa, è quella di un corpo esteso il cui centro di massa è libero di muoversi sulla superficie di una sfera, con l’ulteriore vincolo che le rotazioni possibili siano solo attorno all’asse radiale della sfera. Anche in questo caso per determinare una generica configurazione non è sufficiente la posizione del centro di massa. Se si dispone, in ogni punto, di un’orientazione di riferimento, un’altra generica può essere espressa tramite una rotazione del piano, cioè un elemento di S 1 (' SO2 ). Nel caso visto sopra è sufficiente un’orientazione di riferimento solo nell’origine, poiché questo permette di costruirne una in ogni altro punto in maniera canonica, ma sulla sfera non è ovvio come procedere per avere lo stesso risultato. In R3 si è sfruttato il fatto che, comunque dati due punti, esiste un’unica traslazione che manda il primo nel secondo, e sulla sfera vale un risultato simile: se p e q sono due punti sulla sfera non diametralmente opposti, allora esiste un’unica rotazione che manda p in q fissando l’ortogonale ai due punti (come raggi vettori). Dunque, data un’orientazione di riferimento in un punto qualsiasi, ad esempio il polo nord PN = (0, 0, 1), è possibile costruirne una in ogni punto, eccetto quello diametralmente opposto. Se il centro di massa dell’oggetto non è nel polo sud PS = (0, 0, −1), quindi, la sua posizione sarà individuata da quella del centro di massa e da una rotazione del piano: questo permette di vedere lo spazio delle configurazioni per cui il centro di massa non sia il polo sud come il prodotto (S 2 \ { PS }) × S 1 . Analogamente, per le configurazioni con il centro di massa diverso dal polo nord si ha (S 2 \ { PN }) × S 1 . Non è chiaro se l’intero spazio delle configurazioni possa essere rappresentato come S 2 × S 1 , ma sicuramente è possibile ricoprire la sfera con aperti per cui questa decomposizione vale. Nelle situazioni esposte negli esempi qui sopra si rende necessario introdur- CAPITOLO 1. FIBRATI 6 re un oggetto che permetta di formalizzare l’idea di incollare a ogni punto di una certa varietà M una copia di una qualche struttura (ad esempio il gruppo che esprime le simmetrie di un corpo libero di muoversi in M ), in maniera globalmente consistente. Questo permetterebbe, inoltre, di parlare di regolarità di funzioni che assegnano ad ogni punto un elemento della struttura ad esso associata: questo corrisponde, nei due esempi visti, a campi vettoriali e rotazioni. 1.2 Due parole sui rivestimenti La struttura di fibrato richiama quella di rivestimento, affrontata nei corsi istituzionali. Per tale motivo vale la pena riprendere le proprietà fondamentali di questa costruzione prima di introdurre la definizione precisa di fibrato. Def 1.2.1: Siano X, E due spazi topologici, π : E → X una funzione continua. Si dice che π è un rivestimento se ogni punto p ∈ X ammette un intorno aperto U tale che, per ogni V componente connessa della controimmagine di U , la restrizione π|V : V → U sia un omeomorfismo. Si chiamano aperti trivializzanti quelli che realizzano questa proprietà. Se E è localmente connesso, un rivestimento permette di ricoprire E con aperti della forma Ui × Fi , dove gli Ui sono aperti di X, mentre gli Fi rappresentano degli spazi discreti (con abuso di notazione, in questa sezione intenderò con questa espressione “totalmente sconnessi”). Dal seguente diagramma, in cui p denota la proiezione sul primo fattore, si piò concludere che, per qualsiasi punto x ∈ Ui , lo spazio di Fi è omeomorfo alla fibra di x tramite π. Infatti, la proiezione p0 : Ui × Fi → Fi sul secondo fattore induce un omeomorfismo tra Fi e la controimmagine di x tramite p (si tratta di una bigezione tra spazi discreti), mentre la funzione f è un omeomorfismo sull’immagine. Per la commutatività del diagramma, questo induce una bigezione tra Fi e π −1 (x), spazio discreto rispetto alla topologia di sottospazio: si ha l’omeomorfismo cercato. Ui × Fi f E p π - ? X Dunque, ogni punto x di X ammette un intorno (aperto) U la cui immagine possa essere descritta come U × π −1 (x). Sarà questa la proprietà fondamentale dei fibrati. 1.3 Definizioni e prime proprietà Le questioni riguardanti i fibrati su M possono essere formulate sfruttando due diversi punti di vista equivalenti, ciascuno dei quali risulta essere più o meno vantaggioso a seconda del contesto. Il primo è globale, e si concentra su di una CAPITOLO 1. FIBRATI 7 seconda varietà E e una mappa di proiezione su M , con proprietà analoghe a quelle dei rivestimenti, a meno di rimuovere l’ipotesi che le fibre locali siano discrete. Il secondo, invece, è di carattere locale, e consiste nel ricostruire la varietà E incollando insiemi della forma Ui × F , con Ui aperti di M con la fibra F , identificando i punti tramite opportune mappe. 1.3.1 Punto di vista globale Considero una varietà M , e suppongo siano date un’altra varietà E e una funzione differenziabile π : E → M con differenziale surgettivo. Suppongo inoltre che la fibra di ogni punto p ∈ M (non lo specificherò più, ma salvo indicazioni ulteriori intenderò sempre tramite π) sia diffeomorfa ad una fissata varietà F , che chiamerò genericamente fibra, con la seguente proprietà: esistono un ricoprimento aperto { Ui }i∈I di M e una famiglia di diffeomorfismi φi : Ui × F → π −1 (Ui ) in modo che il seguente diagramma sia commutativo (pi denota la proiezione sul primo fattore): Ui × F φi π −1 (Ui ) pi π - ? Ui Gli aperti di tale ricoprimento saranno detti “trivializzanti”, e le mappe φi “trivializzazioni locali”. Supponiamo che due aperti trivializzanti Ui e Uj si intersechino: le φi e φj inducono due diffeomorfismi (per i quali non cambio notazione), a priori distinti, tra (Ui ∩ Uj ) × F e π −1 (Ui ∩ Uj ). Avrò dunque un diffeomorfismo di (Ui ∩ Uj ) × F in sè dato da φ−1 i ◦ φj , che inoltre conserva la prima componente, e questo permette di associare ad ogni punto p ∈ Ui ∩Uj una mappa tij (p) : F → F data da f 7→ tij (p) f tale che φ−1 ◦ φj (p, f ) = (p, tij (p) f ). Tale mappa sarà i nuovamente un diffeomorfismo: in effetti, dall’ipotesi che φi lo sia segue che la sua restrizione a { p } × F è differenziabile e iniettiva, e così per la sua inversa. Sulla fibra F non è stata formulata alcuna ipotesi, se non, naturalmente, quella che sia una varietà. Tale spazio può avere della struttua ulteriore, come quella di gruppo, spazio vettoriale o metrico: in tal caso avrà senso richiedere che, punto per punto, la mappa tij preservi anche questa struttura, e cioè che tij (p) appartenga a un opportuno sottogruppo si quello dei diffeomorfismi di F in sè (potrà trattarsi di automorfismi di gruppo o spazio vettoriale o di insometrie, in questi casi). Si potrà aggiungere l’ipotesi che tale gruppo abbia a sua volta una struttura differenziabile: questo farà sì che tij possa essere definita come una mappa da Ui ∩ Uj nel gruppo G considerato, e avrà senso l’ipotesi che anche queste siano differenziabili. Una struttura di questo tipo è proprio ciò che occorre per affrontare i problemi sopra menzionati. Riassumo nella seguente definizione ciò che fin qui è stato detto: Def 1.3.1 (Fibrato): Siano E, M ed F varietà di classe C ∞ , G un sottogruppo di Lie dei diffeomorfismi di F in sè. Si dice che la mappa π : E → M definisce un CAPITOLO 1. FIBRATI 8 fibrato su M con fibra tipica F e gruppo di transizione G se valgono le seguenti proprietà: 1. π è differenziabile e il suo differenziale è surgettivo; 2. La controimmagine di ogni punto p ∈ M (indicata come Fp , la fibra di π in p) è diffeomorfa a F ; 3. M ammette un ricoprimento tramite aperti { Ui }i∈I per i quali esistano diffeomorfismi φi : Ui × F → π −1 (Ui ) in modo che l’immagine di ogni coppia (p, f ) appartenga a Fp , e che per ogni Ui , Uj che si intersechino non banalmente esista una fuzione tij : Ui ∩ Uj → G tale che, per ogni (p, f ) ∈ (Ui ∩ Uj ) × F valga φ−1 i ◦ φj (p, f ) = (p, tij (p) f ). In tal caso, si dice che E è lo spazio totale del fibrato, M lo spazio base, π è chiamata proiezione, mentre gli Ui sono detti aperti trivializzanti, ciascuna φi trivializzazione locale, e infine le mappe tij sono chiamate mappe di transizione. G è detto gruppo di transizione o di struttura (in contesto fisico “di gauge”). Si usa chiamare dimensione del fibrato quella di F , e se questo non può dare luogo ad ambiguità si scrive dim E = dim F . Sia U ⊆ M un aperto, s : U → E una funzione differenziabile. Si dice che s è una sezione locale del fibrato se π ◦ s è la mappa identica di U : in altre parole, s è una sezione se l’immagine di ogni punto appartiene alla sua fibra. Dato un punto p ∈ M , esiste sempre una sezione locale in un suo intorno: se (Ui , φi ) è un aperto trivializzante contenente p, f un qualsiasi elemento della fibra, si può considerare la mappa sf : Ui → E che manda m ∈ M in φi (m, f ). Per definizione di trivializzazione questa mappa è in effetti una sezione locale in (un intorno di) p. L’esistenza di una sezione globale, invece, non è sempre garantita, ed è anzi uno dei problemi principali nello studio di un fibrato. Es 1.3.1: Se M ed N sono varietà, il loro prodotto cartesiano M × N ha una naturale struttura di fibrato su ciascuna delle due, tramite le rispettive proiezioni. Qualsiasi funzione differenziabile f : M → N induce una sezione globale s : m 7→ (m, f (m)) (analogamente per g : N → M ). Es 1.3.2: Il cilindro C e il nastro di Möbius N , costruiti identificando i due bordi verticali del quadrato [0, 1] × (0, 1), rispettivamente preservando e invertendo l’orientazione, forniscono due esempi di fibrati sulla circonferenza S 1 . Infatti, in entrambi i casi la proiezione sul primo fattore induce mappe πC e πN a valori in S 1 ' [0, 1]/ ∼, dove ∼ è la relazione che identifica gli estremi. qN N πN [0, 1] × (0, 1) qC C πC ? ? ? qS 1 - 1 1 qS 1 S [0, 1] × { 1/2 } S Nel diagramma, qN , qS 1 e qC denotano le proiezioni ai quozienti. Si verifica immediatamente che πC e πN sono di classe C ∞ e che i rispettivi differenziali CAPITOLO 1. FIBRATI 9 sono surgettivi. Siano U1 = (0, 1) e U2 = [0, 1] \ { 1/2 }: le immagini di questi insiemi tramite qS 1 danno un ricoprimento aperto della circonferenza. Sono ben definite le seguenti mappe: le prime due in maniera immediata, le altre passando per il quoziente: φ1,C : qS 1 (U1 ) × (0, 1) → C (qS 1 (x), y) 7→ qC (x, y) φ1,N : qS 1 (U1 ) × (0, 1) → N (qS 1 (x), y) 7→ qN (x, y) φ2,C : qS 1 (U2 ) × (0, 1) → C (qS 1 (x), y) 7→ qC (x, y) ( qN (x, y) per x < 1/2 (qS 1 (x), y) 7→ qN (x, 1 − y) per x > 1/2 φ2,N : qS 1 (U2 ) × (0, 1) → N Queste mappe sono differenziabili, godono delle proprietà delle trivializzazioni locali, e le prime componenti dei loro domini ricoprono S 1 . Siano GC = { 1 } con l’azione banale su (0, 1), e GN = { ±1 }, dove −1 agisce mandando y in 1 − y, tC : qS 1 (Ui ) ∩ qS 1 (Uj ) → GC la costante 1, tN : qS 1 (Ui ) ∩ qS 1 (Uj ) → GN che vale 1 nei punti della forma qS 1 (x) con x < 1/2, −1 altrimenti. Allora le due proiezioni πC e πN danno fibrati su S 1 con le trivializzazioni indicate, gruppi di transizione GC e GN e mappe di transizione tC e tN . Es 1.3.3: Sia M una varietà differenziabile n-dimensionale, e sia T M definito come nell’esempio 1.1.1, π : T M → M la mappa che manda ogni elemento di Tp M in p. La rappresentazione in coordinate della proiezione mostra la differenziabilità di π e la surgettività del suo differenziale, e chiaramente la fibra di ogni punto p è Tp M , isomorfa (e dunque diffeomorfa) a Rn . Dato un atlante di M la costruzione già fatta permette di individuare delle trivializzazioni locali, le cui mappe di transizione sono date dallo Jacobiano dei cambi di carta. Il gruppo di transizione sarà dunque GLn (R). In letteratura esistono diverse definizioni di classi di mappe tra fibrati. Per questa trattazione sarà sufficiente la seguente: π π0 Def 1.3.2 (Morfismo di fibrati): Siano dati E → M , E 0 → M due fibrati, f : E → E 0 una funzione differenziabile. Si dice che f è un morfismo di fibrati se π 0 ◦ f = π, cioè se il seguente diagramma commuta: f E - E0 π0 - π M Se f è un diffeomorfismo tra E ed E 0 come varietà, allora si dice che è un isomorfismo di fibrati. La condizione che f sia un morfismo di fibrati equivale a richiedere che mandi le fibre di π in quelle di π 0 . Questa definizione di isomorfismo permette di confrontare due fibrati e permetterà di classificarli. Un fibrato si dice banale se è equivalente a M × F , con la naturale struttura di fibrato accennata nell’esempio 1.3.1. Un esempio di fibrato banale su S 1 è il CAPITOLO 1. FIBRATI 10 cilindro, mentre il nastro di Möbius non può esserlo: se lo fosse, come varietà sarebbe diffeomorfo a S 1 × (0, 1), cosa che non vale. Oss 1.3.1L: e notazioni impiegate per indicare i fibrati sono varie: talvolta vengono denotati tramite la 5-upla (E, π, M, F, G), mentre a volte si usa la notaπ zione E → M , o semplicemente E. Naturalmente, specificare soltanto lo spazio base e la fibra tipica non determina il fibrato, come mostra l’esempio 1.3.2. Nemmeno lo spazio totale E, da solo, determina la struttura di fibrato, dato che, ad esempio, nel caso del prodotto cartesiano tra spazi distinti fornisce un fibrato su ciascuno. Addirittura può non essere sufficiente nemmeno indicare E ed M : le mappe eikt : S 1 → S 1 , con k intero non nullo, definiscono fibrati sulla circonferenza non isomorfi tra loro (la fibra ha cardinalità |k|). D’altra parte, è fondamentale specificare anche il gruppo di transizione, poiché al variare di questo può darsi che cambi la classe di banalizzazioni locali permesse. Ad esempio, in maniera del tutto analoga al cilindro, anche il toro ammette una struttura di fibrato su S 1 con la stessa circonferenza come fibra, con gli aperti banalizzanti e le banalizzazioni locali costruite nello stesso modo. Se come gruppo di transizione si ammette quello delle isometrie della circonferenza, la φ2 potrà essere sostituita con una mappa che manda (x, y) in φ2 (x, ρ(y)), dove ρ è una riflessione: in questo caso t12 (x) = ρ in ogni punto, anziché l’identità. Se però si desidera considerare solo il gruppo delle rotazioni della circonferenza, la famiglia di trivializzazioni costruita non soddisfa le richieste. Nonostante queste considerazioni, spesso indicando un generico fibrato si alleggerisce la notazione omettendo di specificare alcune delle sue caratteristiche, purché questo non comprometta la consistenza della trattazione. Io adotterò π E → M. 1.3.2 Punto di vista locale Oss 1.3.2: Se { (Ui , φi ) }i∈I è un ricoprimento di M tramite aperti trivializzanti, le mappe di transizione tij godono delle seguenti due proprietà: • tii = Id per ogni i ∈ I; • tij tjk = tik per ogni i, j, k per cui Ui ∩ Uj ∩ Uk 6= ∅. Infatti, applicando la definizione, si ha, per ogni p ∈ Ui ∩ Uj ∩ Uk , f ∈ F : (p, (tij tjk (p)) f ) = (p, tij (p) (tjk (p) f )) = = φ−1 i φj (p, tjk (p) f ) = −1 = φ−1 i φj φj φk (p, f ) = = φ−1 i φk (p, f ) = = (p, tik (p) f ) In effetti, queste proprietà caratterizzano le mappe di transizione: una volta fissati M , F e G e dato un ricoprimento aperto { Ui }i∈I di M e delle funzioni CAPITOLO 1. FIBRATI 11 tij : Ui ∩ Uj → G con le proprietà ora enunciate, esiste un fibrato che abbia le tij come mappe di transizione. Thm 1.3.3: Siano M , F varietà di dimensione r ed s rispettivamente, G un gruppo di Lie che agisce a sinistra su F in modo liscio, { Ui }i∈I un ricoprimento aperto di M e tij : Ui ∩ Uj → G tali che, per ogni i, j, k ∈ I, tii = e (elemento neutro di G) e tij tjk = tik . Allora esiste un fibrato con base M , fibra tipica F e gruppo di transizione G con tij come mappe di transizione; inoltre, tale fibrato è unico a meno di isomorfismo. F Dim: Sia E = i∈I Ui × F , ∼ la relazione binaria su E definita nel seguente modo: se (p1 , f1 ) ∈ Ui × F , (p2 , f2 ) ∈ Uj × F , allora (p1 , f1 ) ∼ (p2 , f2 ) se e solo se p1 = p2 e f1 = tij f2 . Tale relazione è riflessiva, poiché tii = Id, e transitiva, dato che tij tjk = tik . Inoltre, per ogni i, j ∈ I vale t−1 ij = tji : tij tji = tii = Id e viceversa. Da questo segue la simmetria di ∼, che risulta essere quindi una relazione di equivalenza. Sia E definito come E/ ∼. Per come è definita ∼, la proiezione sul primo fattore di ciascun Ui passa al quoziente, e induce una funzione π : E → M . Inoltre, per ogni i ∈ I la proiezione al quoziente su E fornisce una mappa φi : Ui × F → E per cui banalmente (π ◦ φi )(p, f ) = p. Se { (Vj , µj ) }j∈J , { (Wh , νh ) }h∈H sono atlanti rispettivamente di M ed F , allora { ((Ui ∩ Vj ) × Wh , µij × νh ) }, dove µij rappresenta µj ristretta a Ui ∩ Vj , è un atlante su E. Le µij × νh inducono mappe anche su aperti Aijk in E. Se Aijk interseca non banalmente Almn , le carte inducono una funzione η (di cui ometto gli indici) da µj (Ui ∩ Vj ) × νh (Wh ) in µm (Ul ∩ Vm ) × νn (Wn ). Il fatto che gli aperti si intersechino significa che Ui ∩ Vj interseca Ul ∩ Vm , mentre Wh interseca til (Wn ). Si avrà −1 −1 η(x, y) = (µlm µ−1 (y)) ij (x), νm (νk ◦ til (µij (x))) che per la differenziabilità delle mappe coinvolte è a sua volta di classe C ∞ . Queste carte mostrano che la proiezione π è anch’essa differenziabile e il differenziale è surgettivo, e questo dimostra la struttura di fibrato dell’oggetto costruito, dato che le trivializzazioni locali sono già state introdotte e sono banalmente differenziabili. Inoltre, per come è stato costruito E, le mappe di transizione sono quelle richieste. π0 Sia ora E 0 → M un fibrato con fibra tipica F e le tij come mappe di transizione. Allora le trivializzazioni locali ψi degli aperti Ui definiscono una mappa ψ : E → E 0 di classe C ∞ , che passa al quoziente e induce una ψ̃ : E → E 0 differenziabile. Poiché le ψi sono diffeomorfismi sull’immagine, ciascuna di esse ammette inversa differenziabile ψi−1 a valori in E. Per definizione di mappe di transizione, passando al quoziente in E le ψi−1 coincidono dove i domini si intersecano e permettono quindi di costruire l’inversa di ψ, anch’essa differenziabile. Questo rende ψ un diffeomorfismo tra E ed E 0 , che manda banalmente fibre in fibre, ed è dunque un isomorfismo di fibrati. B Oss 1.3.4: Il risultato ora dimostrato non implica che la costruzione fatta con due famiglie distinte di mappe dia luogo a fibrati non isomorfi: riprendendo la trattazione del cilindro fatta nell’esempio 1.3.2, ad esempio, scegliendo tij = CAPITOLO 1. FIBRATI 12 − Id per i 6= j si otterrebbe un fibrato isomorfo. Per vederlo, basta considerare al posto di φ2,C la funzione che manda (x, y) in φ2,C (x, 1 − y). In generale, è sempre vero che le mappe tij = Id per ogni i, j ∈ I danno luogo al fibrato banale, ma non vale l’implicazione inversa. La definizione 1.3.1 propone un punto di vista globale: l’idea di fibrato su M con fibra F viene introdotta tramite una nuova varietà E ed una mappa di proiezione π, e l’attenzione è focalizzata sulle proprietà di questi due oggetti. Il risultato appena mostrato, invece, apre la strada a un diverso approccio, che pone l’accento sugli aspetti locali della nuova struttura: un fibrato viene costruito incollando spazi della forma Ui × F , secondo le regole espresse dalle mappe di transizione. I due punti di vista si equivalgono, ed è quindi possibile adottare di volta in volta il più comodo. Oss 1.3.5: Di fatto, quando si definisce il fibrato tangente ad una varietà, la costruizione che si fa è quella locale: dato un atlante di M , se due aperti coordinati si intersecano lo Jacobiano del cambio di carta fornisce una funzione dall’intersezione in GLn (R), dove n è la dimensione di M . La famiglia di queste mappe soddisfa le ipotesi richieste. 1.4 Operazioni sui fibrati Dati uno o più fibrati può essere utile saperne costruire degli altri a partire da π questi. Se ad esempio è dato E → M , è naturale aspettarsi che un embedding di una varietà N in M induca in qualche modo una struttura di fibrato anche su N . Inoltre, come è stato definito uno strumento che consente di trattare consistentemente i campi di vettori tangenti ad una varietà, così sarà possibile costruirne altri per i vettori appartenenti a spazi legati al tangente, ad esempio il suo duale, e i prodotti tensoriali tra questi. Alcune di tali costruzioni danno l’occasione di vedere esempi di situazioni in cui vengono adottate le due diverse prospettive della teoria dei fibrati. 1.4.1 Pullback di un fibrato π Siano E → M un fibrato, N una varietà ed f : N → M una mappa differenziabile. Dal momento che π permette, euristicamente, di incollare a ogni punto di M una copia di F , ci si può aspettare che f permetta di fare lo stesso su N , associando a ogni n la fibra di f (n). Ad esempio, se f è un embedding, questo permette di considerare non solo lo spazio tangente ad n in N , ma anche tutto il tangente a f (n) in M . Un altro caso che può essere interessante è quello di una curva γ in M che esprime il moto di un oggetto nella varietà, con F un gruppo che ne esprime le simmetrie: la traiettoria può non essere iniettiva, ma ha senso considerare a ogni tempo la fibra del punto in cui ci si trova. Una tale costruzione è possibile, ed è detta pullback di π: la definirò adottando il punto di vista globale. Sia f ∗ (M ) definita come il sottoinsieme di N ×E dei punti (p, u) tali che f (p) = π(u), π1 e π2 le restrizioni a questo insieme delle due proiezioni sui fattori di N × E. Se { (Ui , φi ) }i∈I è un ricoprimento banalizzante per M , la controimmagine di Ui tramite f è aperta in N per ogni i, e gli CAPITOLO 1. FIBRATI 13 insiemi di questa forma ricoprono N . Dato (p, u) ∈ f ∗ (E) tale che f (p) ∈ Ui , è possibile definire ψi : f −1 (Ui ) × F → f ∗ (E) tramite ψi−1 (p, u) = (p, fi ) dove fi è la seconda componente di φ−1 i (u). Questo fornisce una bigezione tra f −1 (Ui ) × F e π1−1 (f −1 (Ui )), e mostra che π1 è banale su f −1 (Ui ). Se p ∈ f −1 (Ui ) ∩ f −1 (Ui ), allora fi = tij fj : dato che queste mappe sono lisce, le rappresentazioni delle transizioni tra le ψi tramite coordinate in N ed F sono a loro volta C ∞ , e questa costruzione permette di definire una struttura differenziale su f ∗ (E) che renda regolari tutte le funzioni ora definite, in modo che π1 definisca un fibrato. Le mappe di transizione tij sono definite per composizione con f . 1.4.2 Operazioni su fibrati vettoriali A fianco dei campi vettoriali, tra i primi oggetti che vengono definiti quando si introducono le varietà ci sono le forme differenziali: mappe che associano ad ogni punto p ∈ M un funzionale sul tangente. In maniera del tutto analoga al fibrato tangente, si può definire il cotangente, la cui fibra sarà il duale dello spazio tangente. π Def 1.4.1 (Fibrato vettoriale): Si dice vettoriale un fibrato E → M la cui fibra tipica è uno spazio vettoriale V e con gruppo di transizione G un sottogruppo di Lie di GL(V ). In generale, a ogni fibrato vettoriale può essere associato il suo duale, cioè un altro fibrato la cui fibra è lo spazio duale di V . Richiamo un risultato di algebra lineare: se V è uno spazio vettoriale e f ∈ End(V ), esiste un’unica f ∗ ∈ End(V ∗ ) tale che, per ogni ϕ ∈ V ∗ e per ogni v ∈ V valga (f ∗ (ϕ))(v) = f (ϕ(v)) Inoltre, (IdV )∗ = IdV ∗ , e per f, g ∈ End(V ) vale (f ◦ g)∗ = g ∗ ◦ f ∗ . Infatti, per ogni ϕ ∈ V ∗ , v ∈ V : ∗ (f ◦ g) (φ) (v) =φ ((f ◦ g) (v)) = =φ (f (g (v))) = = (f ∗ (φ)) (g (v)) = = (g ∗ (f ∗ (φ))) (v) = = ((g ∗ ◦ f ∗ ) (φ)) (v) Siano { tij } le mappe di transizione associate al ricoprimento banalizzante π { (Ui , φi ) }i∈I del fibrato vettoriale E → M : definisco τij = t∗ji . Queste funzioni soddisfano le ipotesi del teorema 1.3.3, e permettono quindi di definire il fibrato duale E ∗ . Da un altro risultato di algebra lineare risulta che, per ogni endomorfismo f di uno spazio vettoriale V , esiste un’unica mappa Λk f ∈ End(Λk V ) tale che (Λk f )(v1 ∧ · · · ∧ vk ) = f (v1 ) ∧ · · · ∧ f (vk ) CAPITOLO 1. FIBRATI 14 Si verifica che, se f, g ∈ End(V ), allora Λk (f ◦ g) = (Λk f ) ◦ (Λk g), e che Λk (IdV ) = IdΛk V ; di conseguenza, se f è invertibile lo sarà anche Λk f , e vale Λk (f −1 ) = (Λk f )−1 . π Dato E → M un fibrato vettoriale con fibra V e mappe di transizione tij rispetto a un certo ricoprimento banalizzante { (Ui , φi ) }i∈I , per ogni p ∈ M si ha Λk tij ∈ GL(Λk V ): ancora una volta sono soddisfatte le ipotesi del teorema 1.3.3, ed è ben definito il fibrato Λk E con la potenza esterna Λk V come fibra tipica. Usando queste due costruzioni si può formalizzare il fibrato delle k-forme differenziali su una varietà M : da T M si passa a T ∗ M , il fibrato duale, e poi si passa alla potenza esterna k-esima. Per il fibrato di tutte le forme differenziali, invece, manca ancora un passaggio. π π0 Siano E → M ed E 0 → M 0 due fibrati vettoriali (non necessariamente sulla stessa varietà) con fibre V e V 0 . Questi inducono una struttura di fibrato su M × M 0 con fibra V ⊕ V 0 . Se { (Ui , φi ) }i∈I e { (Vj , ψj ) }j∈J sono rispettivi ricoprimenti banalizzanti, gli aperti della forma Wij = Ui ×Vj ricoprono M ×N . Dette tii0 e sjj 0 le mappe di transizione, su Wij ∩ Wi0 j 0 sono ben definite rii0 jj 0 che agiscono su V ⊕ V 0 componente per componente. Ancora una volta, si può definire quello che si usa chiamare il fibrato prodotto, indicato con E × E 0 . In maniera del tutto analoga si può definire un fibrato su M × M 0 con fibra V ⊗ V 0 . Se M = M 0 , identificando M con la diagonale ∆ ⊆ M × M tramite l’immersione ι, il pullback del fibrato prodotto dà quella che si chiama somma di Whitney (o somma diretta) E ⊕ E 0 , e analogamente si ottiene il prodotto tensore E ⊗ E 0 . Naturalmente queste due costruzioni possono essere ripetute con un qualsiasi numero finito di fibrati: in questo modo si ottiene il fibrato delle forme differenziali su M sommando tutte le potenze k-esime non banali. Benché ristretti alla sola classe dei fibrati vettoriali, questi esempi danno un’idea dell’utilità del punto di vista locale presentato sopra, fatta eccezione per la somma di Whitney e per il prodotto tensore, che coinvolgono un pullback. 1.5 Fibrati principali π Def 1.5.1 (Fibrato principale): Un fibrato E → M è detto principale se la fibra coincide con il gruppo di transizione G, e l’azione è quella sinistra naturalmentee indotta dalla struttura di gruppo. Tali fibrati sono detti anche G-fibrati su M , e spesso il loro spazio totale si indica con P anziché con E. Nei fibrati principali è ben definita un’azione destra di G su P . Sia u ∈ P , U un intorno banalizzante di p = π(u) con trivializzazione φ, g ∈ G tale che φ(p, g) = u. Per ogni a ∈ G, si definisce: u a = φ(p, ga) Il punto u a dipende in effetti solo da a e u, e non dalla particlare scelta di U o di φ. Se infatti V è un altro intorno banalizzante di p, ψ è la trivializzazione, con u = ψ(p, h) e t è la mappa di transizione, avrò: φ(p, ga) = ψ(p, t(ga)) = ψ(p, (tg)a) = ψ(p, ha) CAPITOLO 1. FIBRATI 15 Inoltre, si tratta proprio di un’azione destra, poiché (u a) b = φ(p, ga) b = φ(p, (ga)b) = φ(p, g(ab)) = u ab Oss 1.5.1: L’azione ora definita preserva le fibre: segue immediatamente dalla definizione che π(u) = π(u a) per ogni u ∈ E, a ∈ G. Essa è libera e transitiva su ogni fibra, cioè dati comunque punti u1 , u2 ∈ Fp esiste un unico a ∈ G tale che u1 a = u2 : se φ è un’opportuna trivializzazione locale, con φ(p, g) = u1 e φ(p, h) = u2 , basterà scegliere a = g −1 h, questa è l’unica scelta possibile. Questa azione è liscia, dato che localmente può essere scritta come composizione di mappe C ∞ : u a = φ π (u) , π2 φ−1 (u) a dove π2 denota la proiezione sul secondo fattore. Il seguente risultato, seppure molto semplice, merita di essere messo in eviπ denza per via delle sue implicazioni. La struttura di E → M , come è già stato osservato, è determinata completamente dalle mappe di transizione: sembra ragionevole che, se queste non vengono modificate, molte proprietà del fibrato siano conservate quando si cambia la fibra tipica. Può essere molto interessante avere un modo canonico per ricondursi a un caso particolare, come quello dei fibrati principali, che sia più facile da trattare o che si presti a costruzioni più ricche e flessibili, ed è questo l’obiettivo del prossimo teorema. Thm 1.5.2: Date due varietà M ed F e un gruppo di Lie G agente a sinistra su F in maniera liscia, esiste una corrispondenza biunivoca tra le classi di isomorfismo di fibrati su M con fibra F e gruppo di transizione G e quelle di G-fibrati su M . Inoltre, tale corrispondenza è canonica. π Dim: Sia dato E → M un fibrato con fibra F e gruppo di transizione G, { (Ui , φi }i∈I un ricoprimento banalizzante. Se { tij } è la famiglia delle mappe di transizione rispetto a questo ricoprimento, esiste un unico G-fibrato, a meno di isomorfismo, con le stesse mappe di transizione rispetto al ricoprimento { Ui }, essendo banalmente vere le ipotesi del teorema 1.3.3. In maniera del tutto analoga, dato un qualsiasi G-fibrato ne esiste uno e uno solo, sempre a meno di isomorfismo, che soddisfi le richieste. B Due fibrati ottenuti l’uno dall’altro tramite la costruzione descritta nella dimostrazione sono detti associati. L’importanza del risultato risiede nel fatto che molte proprietà di un fibrato sono riassunte in quelle del suo associato. Una di queste, ad esempio, è la banalità: infatti, questa è equivalente all’esistenza di un ricoprimento banalizzante le cui mappe di transizione mandino costantemente nell’identità di G. Oss 1.5.3: Dato il G-fibrato P , la costruzione di quello associato con fibra F può essere fatta in maniera alternativa definendo lo spazio totale come quoziente di un prodotto. Più precisamente, se ρ è l’azione di G su F (l’omomorfismo di G in un opportuno gruppo di trasformazioni di F che ne definisce l’azione), si indica con P ×ρ F lo spazio P × F quozientato sulla relazione di equivalenza data da (u, f ) ∼ (u g, ρ(g)−1 f ); è ben definita una mappa di proiezione π e data CAPITOLO 1. FIBRATI 16 da [(u, f )] 7→ π(u). Una trivializzazione locale φi di P può essere impiegata per definirne una di questa nuova mappa: si definisce ψi (p, f ) = [(φi (p, e), f )]. Se φj è una trivializzazione il cui dominio interseca quello di φi , varrà: ψj (p, f ) = [(φj (p, e), f )] = [(φi (p, tij (p)), f )] = = [(φi (p, e) tij (p), f )] = [(φi (p, e), ρ (tij (p)) f )] = ψi (p, ρ (tij (p)) f ) Dunque le mappe di transizione di questo fibrato sono le stesse di P . Questa costruzione esplicita sarà utile studiando le connessioni per far ereditare a P ×ρ F della struttura definita su P . Vale la pena osservare che esiste una corrispondenza biunivoca tra le sezioni σ di P ×ρ F e le mappe σ P : P → F che soddisfano σ P u g −1 = ρ(g)σ P (u). Sia data ad esempio una sezione σ del fibrato. Allora per ogni u ∈ P esiste un unico f ∈ F tale che σ(π(u)) sia la classe di (p, f ): sia f = σ P (u). Per ogni g ∈ G la proiezione di u g è uguale a quella di u, e di conseguenza σ(π(u)) = σ(π(u g)), e (u g, f 0 ) rappresenta la stessa classe di (u, f ) se e solo se f 0 = ρ(g)−1 f . Data invece una mappa σ P con le proprietà richieste è immediato verificare la buona definizione di σ(p) = [(u, σ P (u))] per qualsiasi u ∈ Fp . Un risultato interessante è il seguente: Thm 1.5.4: Un fibrato vettoriale di dimensione n con gruppo G = GL(V ) è banale se e solo se ammette n sezioni linearmente indipendenti. Questo segue da un altro teorema, tenendo conto del fatto che un G-fibrato è banale se e solo se lo è un suo associato: Thm 1.5.5: globale. Un fibrato principale è banale se e solo se ammette una sezione Dim: Il G-fibrato banale M × G, fissato un qualsiasi elemento g ∈ G, ammette l’ovvia sezione s : p 7→ (p, g). Sia ora s una sezione globale del G-fibrato P . Sarà ben definita una mappa f : M × G → P data da: f (p, g) = s(p) g La differenziabilità di f discende da quelle di s e dell’azione; le proprietà di quest’ultima mostrano anche la sua bigettività. L’inversa può essere scritta localmente come composizione di mappe C ∞ , e risulta quindi anch’essa differenziabile. Dunque f è un diffeomorfismo tra M × G e P , e per costruzione preserva le fibre: è un isomorfismo di fibrati. B Anche quando un fibrato principale non è banale, emulando la dimostrazione appena vista si può dare una procedura per costruire in modo naturale, data una sezione locale s, una trivializzazione sul suo dominio. Si usa chiamare canonica questa banalizzazione. Dim (Teorema 1.5.4): È sufficiente mostrare che in un fibrato vettoriale E n sezioni globali indipendenti corrispondono ad una sezione globale del principale associato: questo è equivalente alla banalità di P , che a sua volta coimplica quella di E. Se V è la fibra di E, una base di V induce un isomorfismo λ tra V ed CAPITOLO 1. FIBRATI 17 Rn e uno tra GL(V ) e GLn (R) che indico con µ, il quale è anche diffeomorfismo. Sia { (Ui , φi ) }i∈I un ricoprimento banalizzante di E con mappe di transizione tij , le µ(tij ) definiscono una famiglia di mappe di transizione per un fibrato E 0 su M con fibra Rn e gruppo GLn (R). Se le ψi sono le trivializzazioni locali naturalmente associate alla costruzione di E 0 è ben definita una mappa f : E → E 0 tale che per ogni i f (φi (p, v)) = ψi (p, λ(v)) Infatti, se p ∈ Ui ∩ Uj , vale ψj (p, λ(v)) = ψi (p, µ(tij (p)) λ(v)) = ψi (p, λ(tij (p) v)) f è un diffeomorfismo e preserva le fibre, ed è quindi un isomorfismo di fibrati. In maniera analoga si mostra che il fibrato P 0 associato ad E 0 è isomorfo a P tramite una mappa naturale definita nello stesso modo di f . L’ipotesi ulteriore che V sia Rn e che G sia GLn (R), dunque, non lede la generalità dell’enunciato. Siano ora s1 , . . . , sn sezioni globali indipendenti su E, e per ogni aperto banalizzante Ui , p ∈ Ui , sia vik (p) tale che k φ−1 i (sk (p)) = (p, vi (p)) Detta Mi (p) la matrice ottenuta accostando gli n vettori colonna vik (p), risulta ben definita la mappa σ(p) = φi (p, Mi (p)) Dato che i vik (p), fissati p e i, formano una base di Rn , Mi (p) è una matrice invertibile. La verifica della buona definizione di σ, a questo punto, è immediata: dalle sk si ricava quindi una sezione globale di P . La costruzione vista, infine, può essere invertita per mostrare l’implicazione inversa. B 1.6 Curiosità e considerazioni a posteriori Es 1.6.1 (Il “teorema della palla pelosa”): Una conseguenza dell’ultimo teorema enunciato, ad esempio, è l’equivalenza tra il cosiddetto teorema della palla pelosa, secondo il quale ogni campo vettoriale tangente ad S 2 si annulla almeno in un punto, e la non banalità del fibrato tangente di S 2 . Infatti, se esistesse un campo tangente mai nullo sarebbe facile costruirne un secondo ortogonale ad esso, e questi darebbero due sezioni globali indipendenti del fibrato tangente. Per dimostrare il teorema, quindi, è sufficiente studiare T S 2 , o anche il suo principale associato. Sia π : SO3 → S 2 la mappa data da g 7→ g e1 , dove la sfera è quella unitaria in R3 , ed e1 è il primo vettore della sua base canonica. Dato che l’azione è C ∞ , π è differenziabile. Si avrà che Tg SO3 = Lg∗ (TId SO3 ) per ogni g, dove Lg è la naturale azione destra di g su SO3 : identificando TId SO3 con l’algebra di Lie so3 , e indicando con Jei i suoi generatori standard, si ottiene che per ogni g ∈ G il tangente in g è generato dai Lg∗ Jei . Siano inoltre γi le curve date da Lg ◦ exp(tJi ) per un certo g fissato. Con questa notazione è facile mostrare che il differenziale di π è surgettivo, e che la fibra di ogni punto è diffeomorfa ad S 1 : avrò che π ◦γ2 e π ◦γ3 sono trasversali in quanto giacciono su piani distinti la cui CAPITOLO 1. FIBRATI 18 intersezione è ortogonale a Tπ(g) S 2 (rappresentano le due rotazioni attorno agli assi dati da g e2 e g e3 ), e i loro vettori tangenti al tempo 0 generano Tπ(g) S 2 , da cui la surgettività di dπ. Inoltre, π(h) = π(g) se e solo se π(h−1 g) = e1 , cioè h−1 g fissa e1 sulla sfera. Questo significa che la fibra di π(g) è il laterale g SO2 , dove SO2 è identificato con il sottogruppo di Lie di SO3 delle rotazioni di Span(e2 , e3 ): ogni fibra è quindi diffeomorfa a SO2 ' S 1 . Dato un punto p ∈ S 2 \ { ±e1 } è possibile costruire in modo canonico una rotazione gp della sfera p che manda e1 in p, scegliendo quella che fissa l’ortogonale. Se p = (x, y, z), r = y 2 + z 2 e θ = arccos(x), tale rotazione è data da yJe2 + zJe3 gp = exp θ r e dipende quindi in maniera liscia da p, e questo vale anche scegliendo ge1 = Id. Questo permette di costruire la trivializzazione C ∞ di π tramite la mappa φ1 :(S 2 \ { −e1 }) × SO2 (p, τ ) - SO3 - gp τ In maniera analoga può essere definita φ2 su S 2 \{ e1 }, associando ad ogni punto una rotazione che vi mandi −e1 anziché e1 . A questo scopo basta considerare g−p e scegliere φ2 (p, τ ) = g−p τ . Questo dimostra che la π definita sopra definisce una struttura di fibrato; non è stato però imposto che sia principale, cioè che il gruppo strutturale sia S 1 . In effetti, con questa scelta delle trivializzazioni questo non vale: se φ1 (p, τ ) = φ2 (p, σ), allora: gp τ = g−p σ =⇒ τ = gp−1 g−p σ Le mappe di transizione sono dunque della forma gp−1 g−p , che non è una rotazione di Span(e2 , e3 ) poiché ne inverte l’orientazione (e1 va in −e1 ). Se allora h = exp(πJe2 ), cioè la rotazione di un angolo piatto intorno all’asse di e2 , modificando φ2 in modo che sia φ2 (p, τ ) = g−p hτ le mappe di transizione diventano della forma gp−1 g−p h e sono in effetti rotazioni del piano. SO3 , dunque, è stato fornito di una struttura di fibrato principale su S 2 con fibra tipica S 1 , identificata con il gruppo delle rotazioni del piano ortogonale a e1 . Inoltre, si può dimostrare che questo fibrato è isomorfo a quello associato a T S 2 . In effetti, il tangente della sfera ammette delle trivializzazioni locali costruite in modo analogo a φ1 e φ2 : identificando nuovamente R2 con Span(e2 , e3 ), siano: ψ1 (p, v) = gp (v)ψ2 (p, v) = (g−p h)(v) (1.1) dove i domini delle ψ1 sono quelli ovvi. A questo punto è evidente, avendo definito le trivializzazioni dei due fibrati in analisi come l’azione di uno stesso CAPITOLO 1. FIBRATI 19 oggetto sugli elementi delle rispettive fibra tipiche, che le mappe di transizione π sono le stesse. SO3 → S 2 è quindi isomorfo al fibrato principale associato a 2 TS . Infine, quello introdotto ora non è un fibrato banale: se lo fosse, il suo spazio totale sarebbe diffeomorfo a S 2 × S 1 , cosa che però non è vera. Esiste infatti un omomorfismo continuo e surgettivo da S 3 , come sottogruppo moltiplicativo del corpo dei quaternioni, su SO3 , dato dall’azione per coniugio sull’iperpiano dei quaternioni puramente immaginari. Il nucleo di tale morfismo è { ± Id }, e si può mostrare che la topologia quoziente di S 3 / { ± Id } è la stessa di SO3 . Questo spazio, quindi, è ottenuto come quoziente di S 3 (il quale è semplicemente connesso) per l’azione propriamente discontinua del gruppo generato dalla mappa antipodale. Tale gruppo è isomorfo a Z/2Z, e per un teorema sulla teoria dei rivestimenti si ha che questo è isomorfo al primo gruppo di omotopia si SO3 . D’altronde, π1 (S 2 ×S 1 ) è isomorfo al prodotto diretto dei singoli gruppi di omotopia, ed è quindi { Id } × Z ' Z. Dunque SO3 non è omeomorfo a S 2 × S 1 , e di conseguenza i due fibrati non sono isomorfi. Es 1.6.2 (Ancora sul corpo rigido): Alla luce di quanto visto fin qui si possono fare diverse osservazioni sull’esempio 1.1.2. È chiaro che, in entrambi i casi, l’oggetto che occorreva formalizzare è un fibrato, rispettivamente su R3 e su S 2 , con fibre SO3 e SO2 ' S 1 . Da quanto detto risultava intuitivamente chiaro che il primo possa essere scritto come R3 × SO3 , mentre non era ancora evidente se valga una condizione analoga per il secondo: con il linguaggio ora introdotto si può dire che il primo è un fibrato banale, e che non è ovvio se lo sia anche il secondo. I due gruppi SO3 ed S 1 erano stati introdotti per esprimere le simmetrie di oggetti che si muovono tangenzialmente agli spazi in analisi: una rotazione di questi oggetti corrisponde ad una dello spazio tangente ad R3 o ad S 2 rispettivamente. Osservato questo, se ne conclude che i fibrati che occorrono in queste situazioni sono quelli principali associati a T R3 e a T S 2 . Stando così le cose, la congettura che il primo fosse banale è dimostrata, mentre il secondo non può esserlo. Un’altra osservazione interessante è questa: il modo in cui sono state costruite le trivializzazioni locali di questi fibrati (per quanto non fossero stati definiti come tali) è in sostanza quello menzionato nel precedente paragrafo, sulla falsa riga della dimostrazione del teorema 1.5.5. Infatti, una volta scelto un punto di T R3 è stato riconosciuto un modo canonico per costruire a partire da questo una sezione (in questo caso globale) del fibrato, e da questa la banalizzazione. Trattando il caso della sfera, invece, non era evidente come scegliere una tale sezione in modo che fosse globale (in effetti un tale oggetto non esiste, come visto), ma è stato comunque possibile mettere in evidenza la struttura di fibrato scegliendone due locali. L’ipotesi che i moti di rotazione fossero tangenziali allo spazio, fatta in questi due casi, non è generale. Ad esempio, nel secondo caso si sarebbe potuto assumere che il corpo potesse ruotare liberamente intorno al proprio baricentro: il fibrato che descrive questa situazione non è quello associato al tangente di S 2 . In questo caso, una rotazione dell’oggetto può essere associata ad una dello spazio tangente nei punti di S 2 , ma non alla sfera stessa, bensì ad R3 , in cui essa è immersa. In questo modo appare evidente che l’oggetto “giusto” è il fibrato CAPITOLO 1. FIBRATI 20 associato al pullback di T R3 tramite l’embedding della sfera nello spazio tridimensionale. Tale fibrato, peraltro, è banale: il pullback menzionato ammette tre sezioni globali ortonormali date da quelle di T R3 . Costruzioni di questo tipo possono essere applicate spesso in fisica per esprimere le simmetrie di un dato sistema meccanico. Negli esempi visti sopra il fibrato considerato è quello associato a un tangente: quest’ultima condizione è specifica di queste situazioni, e in generale i fibrati considerati saranno sì principali, ma senza il bisogno che siano associati ad altri più semplici. Capitolo 2 Connessioni Da qui in avanti adotterò la convenzione di Einstein per le sommatorie: se in prodotto compare due volte lo stesso indice, una volta in alto e una in basso, si intende che la quantità vada sommata su tutti i possibili valori di quell’indice, salvo indicazioni contrarie. 2.1 Motivazioni; principio d’inerzia In uno spazio affine A i vettori sono definiti in modo astratto come elementi della sua giacitura V : si può sempre parlare di “vettore da un punto a un altro” o di “vettore applicato a un punto” senza bisogno di dare ulteriori specificazioni sullo spazio a cui questi appartengono, perché si tratta sempre dello stesso (la giacitura per l’appunto). In questo modo non c’è difficoltà nel definire i campi vettoriali come funzioni da A in V , né vi è alcuna ambiguità quando si parla di “campi costanti”. Inoltre, spazi di questo tipo ereditano da Rn anche una struttura differenziale, tramite la quale lo spazio tangente in qualsiasi punto è canonicamente isomorfo alla giacitura. La nozione di campo vettoriale, in questo contesto, è ben definita senza bisogno di distinguere un tangente per ogni punto, né occorre introdurre alcuna struttura ulteriore sulla collezione di questi spazi: in definitiva non è evidente il bisogno di parlare di fibrati. In una generica varietà M le cose non sono così semplici: vettori tangenti in punti distinti non possono essere confrontati, né tanto meno sommati, in quanto appartengono a spazi definiti separatamente. Questa è la ragione per cui, in principio, è stato definito il fibrato tangente. Passando a contesti più ampi, poi, ci si può imbattere in altre situazioni che si presentano lo stesso problema, ossia in cui ha senso considerare in ogni punto di M una copia di un certo oggetto F , ma per qualche ragione è necessario tenerle tutte distinte al variare del punto in considerazione. La nozione di fibrato è stata introdotta in definitiva per risolvere questo problema, e ha permesso di definire come sezioni di una certa mappa le funzioni che a ogni punto assegnano un elemento della sua copia di F . Si pone però un altro problema: mentre nel caso degli spazi affini ha senso parlare di campi vettoriali costanti, questo non è possibile in generale, dal momento che vettori applicati in punti distinti non possono essere confrontati. L’introduzione del fibrato tangente, in questo caso, non è di aiuto: questo è 21 CAPITOLO 2. CONNESSIONI 22 definito come uno spazio localmente diffeomorfo a U × Rn , U aperto in M , ma per avere un’identificazione tra il tangente in un punto e lo spazio delle coordinate c’è bisogno di una trivializzazione locale. Questa nella maggior parte dei casi non è canonica: non è stato stabilito alcun criterio per preferire una banalizzazione ad un’altra, e anzi sono state introdotte le mappe di transizione per confrontarle nel caso in cui non sia possibile sceglierne una particolare. Inoltre, quando un fibrato tangente non è banale (come si è visto nel caso della sfera, ad esempio), non esiste un’identificazione globalmente coerente. Tutte queste considerazioni valgono in generale per fibrati qualsiasi. Un altro oggetto che perde di significato passando da spazio affine a varietà è quello di retta. I primi sono definiti come oggetti su cui la giacitura agisce secondo determinate regole, ed ha sempre senso, dati un punto p e un vettore non nullo v, considerare la famiglia del punti della forma p + λv al variare di λ su R, e chiamare retta questo oggetto, come sottoinsieme su cui Span(v) agisce secondo le stesse regole degli spazi affini. Nel contesto delle varietà, invece, i vettori naturalmente legati agli spazi hanno un significato diverso, e il loro ruolo è quello di descrivere l’andamento delle curve passanti per un dato punto. Se negli spazi affini ha senso introdurre questo secondo significato dando loro una struttura differenziale, il contrario non vale: in una generica varietà non è ovvio come dare un’azione dello spazio tangente in modo da poter fare costruzioni analoghe. Cambiano leggermente punto di vista, però, e pensando alle rette affini come curve parametrizzate, esse rappresentano le soluzioni di una particolare classe di problemi di Cauchy: quelli della forma ( γ̇ = v γ(0) = p In altre parole, le rette sono le curve integrali dei campi costanti. Questo riconduce al problema precedente, ossia quello di stabilire cosa significhi che un campo è costante: se non ha senso questo, non è nemmeno possibile parlare di rette come curve con vettore tangente costante. Da un punto di vista fisico questa osservazione costituisce un problema non indifferente, poiché compromette il senso del principio di inerzia, secondo il quale un corpo lasciato a se stesso conserva il proprio stato di moto o di quiete, cioè in definitiva la propria velocità (come grandezza vettoriale). L’intuizione suggerisce che lo spazio fisico possa essere descritto come R3 (affine), e in questo modo la formulazione del principio d’inerzia secondo cui un corpo che non venga perturbato da alcuna forza ha velocità costante ha effettivamente senso. Appena si abbandona questo modello, però, essa perde di significato, e in effetti limitandosi a questo si corre il rischio di essere troppo restrittivi. Tanto per cominciare, riprendendo la situazione dell’esempio 1.1.2, ci si può chiedere che significato assuma il principio d’inerzia per un corpo vincolato a muoversi su di una sfera (o su una generica superficie) se si dimentica lo spazio circostante e ci si restringe a questa. È chiaro che in queste condizioni l’oggetto non potrà muoversi in linea retta come si è abituati a vedere in R3 . Si potrebbe obiettare che si tratta di un esempio artificioso, e che di fatto un tale corpo è soggetto alle forze vincolari della superficie, e perciò non costituisce una seria minaccia al principio d’inerzia, ma vale sempre la domanda: che significato può assumere tale principio se si considerano spazi diversi da R3 ? CAPITOLO 2. CONNESSIONI 23 La seguente considerazione può essere più illuminante: perché, nonostante la nostra percezione sia locale, assumiamo che l’intero spazio possa essere rappresentato da R3 ? In effetti questa ipotesi non è ben giustificata, e sarebbe del tutto legittimo descrivere lo spazio come una generica 3-varietà Riemanniana. In questo modo, anche se le regioni che consideriamo si comportano come uno spazio affine, nulla vieta che problemi su scala più ampia impongano un punto di vista diverso, e, ancora una volta, vanifichino la nostra formulazione del principio d’inerzia, almeno da un punto di vista teorico. Occorrerebbe dunque un oggetto che permetta di esprimere l’idea che un certo campo vettoriale (in questo caso la velocità) definito almeno lungo una curva “rimanga costante” lungo di essa, benché i valori assunti istante per istante non possano essere confrontati. Questo è soltanto un esempio, in un contesto limitato, di come si renda necessario uno strumento per studiare alcune proprietà dei campi vettoriali. In generale, dato un fibrato, può essere interessante domandarsi anche cosa significhi che una certa sezione “non vari” lungo una data curva. A questo scopo vengono introdotte le connessioni. 2.1.1 Il punto di vista delle coordinate Nella definizione di varietà, o di struttura differenziabile, è richiesta l’esistenza locale di sistemi di coordinate compatibili, nel senso che i cambi di carta debbano essere C ∞ . La maggior parte delle argomentazioni che si fanno oggi nello studio di questi oggetti, le coordinate sono viste come oggetti transitori che vengono introdotti all’occorrenza e dimenticati appena possibile. Esiste un punto di vista, caro alla tradizione passata, utile in alcuni contesti, e largamente impiegato in fisica, che si concentra invece sulle coordinate, e secondo il quale molti oggetti vengono definiti attraverso di esse. Ad esempio, campi vettoriali, tensoriali e forme differenziali vengono introdotti attraverso le regole secondo cui le coordinate di questi oggetti variano nel passaggio da un sistema di coordinate a un altro. In questo modo, il vettore tangente a una curva γ è definito, in un particolare sistema di coordinate xk (k = 1, . . . , n), dall’espressione: γ̇ = dxi ei dt dove xi (t) sono le coordinate del punto γ(t), mentre il differenziale di una funzione scalare φ, come forma differenziale, è definita da: dφ = ∂φ i dx ∂xi In quest’ottica, gli oggetti vengono confusi con le loro rappresentazioni in coordinate, e una stessa quantità, se misurata rispetto a sistemi diversi, può cambiare. Questo principio è ben evidente in contesto fisico: le coordinate di uno stesso vettore cambiano a seconda dello specifico sistema di riferimento, e la forma di una stessa funzione può cambiare nello stesso modo. Si dirà che φ è una funzione scalare, o semplicemente uno scalare, se le sue rappresentazioni in coordinate si corrispondono per valore: ad esempio, la temperatura soddisfa questa condizione, mentre una funzione hamiltoniana, in generale, la viola. Questa definizione equivale sostanzialmente alla richiesta che φ sia una ben definita funzione su M , a valori reali. Date n funzioni scalari, poi, è chiaro che queste CAPITOLO 2. CONNESSIONI 24 non possano in generale rappresentare le coordinate di un vettore: le funzioni costanti ad esempio hanno la medesima rappresentazione in qualsiasi sistema, ma è evidente che il campo ek , fissato qualche k, dipende fortemente dalla scelta delle coordinate, benché sia identificato dall’n-upla di funzioni costanti φi ≡ δik . Si dirà dunque che una famiglia di funzioni rappresentate da X k rispetto a un h dato sistema di coordinate xk e da X rispetto a xh se vale h X = ∂xh k X ∂xk Questa è l’usuale regola di cambiamento di coordinate per i vettori. Adottando la definizione intrinseca di spazio tangente, questo risultato può essere dimostrato come teorema: secondo questo punto di vista assume invece il valore di una definizione. In maniera analoga si parla di campi tensoriali qualsiasi, ed è da questo contesto che nascono le espressioni di vettori “co-” e “controvarianti”: un vettore non è definito in maniera intrinseca, ma come una collezione di coordinate, e la sua natura è determinata dalle regole con cui queste trasformano se misurate rispetto a sistemi diversi. In questo punto di vista il problema sollevato nel precedente paragrafo, cioè quello di confrontare vettori in punti diversi o di studiare il parallelismo di un campo lungo una curva, potrebbe non essere tanto evidente. Si potrebbe essere tentati, dati un campo vettoriale X, una curva γ e un sistema di coordinate in un opportuno intorno di γ(0), di definire la derivata di X lungo γ come il vettore che abbia per componenti le derivate temporali delle componenti di X(γ(t)). Se nell’ottica precedente tutto questo non poteva essere fatto per un problema di cattiva definizione, ora tutto questo ha senso ed è lecito: la rappresentazione di X in coordinate non è altro che una funzione definita su un aperto di Rn e a valori in Rn , mentre la rappresentazione di γ è una curva in questo aperto, lungo la quale ha senso derivare la definizione. Quello che non è vero in generale, però, è che ciò che si ottiene sia un “vettore” nel senso ora introdotto: non è detto cioè che questa operazione, rispetto a due sistemi distinti, dia risultati compatibili, cioè che si ottengano oggetti che variano secondo le date regole di trasformazione. In effetti, si può verificare che: j ∂ 2 xj ∂xl h ∂xj ∂xl ∂X h ∂X = X + k ∂xl ∂xh ∂xk ∂xh ∂xk ∂xl ∂x (2.1) e la violazione alla regola di trasformazione è data dal primo termine della quantità a destra. Dunque non è ben definita la derivazione del campo lungo la direzione data da ek , nel senso che l’oggetto che si ottiene non è di natura vettoriale. Un modo per aggirare questo ostacolo è quello di definire un nuovo operatore differenziale che faccia le veci dell’usuale derivata parziale, in modo che il termine indesiderato sia dovuto alla trasformazione dell’operatore, e non a quella dell’oggetto ottenuto per derivazione. Questo punto di vista è trattato in maniera approfondita e dettagliata (presentando anche i calcoli qui omessi) in [5]. 2.2 Connessioni affini Alla luce delle considerazioni fatte nel precedente paragrafo, occorre definire un oggetto che consenta di stabilire quando un certo campo vettoriale tangente a CAPITOLO 2. CONNESSIONI 25 una varietà M definito su una curva γ sia parallelo a se stesso in ogni punto, e in caso contrario di misurarne la variazione nel tempo. Prima di definire assiomaticamente un simile strumento è utile considerare un caso particolarmente semplice: quello delle varietà immerse in Rn . 2.2.1 La derivata covariante in sottovarietà di Rn Sia M un’ipersuperficie di Rn , cioè una sottovarietà di dimensione n − 1. Nei corsi istituzionali di introduzione alla geometria sono stati definiti la mappa di Gauss associata ad una parametrizzazione regolare e l’operatore forma, o di Weingarten 1 . Richiamo rapidamente che la prima è definita come l’applicazione che assegna ad ogni punto di un aperto parametrizzato di M l’unico vettore unitario N ortogonale ad essa che completi a base positiva quella indotta sul tangente dalle coordinate locali. N (p) ha una dipendenza multilineare e alternante dagli elementi del riferimento su Tp M e pertanto dà una mappa differenziabile a valori in S n−1 definita sull’aperto. Il tangente ad M in p e quello alla sfera nella sua immagine coincidono (come sottospazi vettoriali di Rn ), pertanto l’applicazione lineare indotta L può essere vista come un endomorfismo di Tp M , che porta il nome appunto di operatore di Weingarten. Esso è autoaggiunto rispetto al prodotto scalare naturalmente indotto da quello standard dello spazio ambiente, e per il teorema spettrale ammette una base ortonormale di autovettori, detti direzioni principali, mentre gli autovalori, tutti reali, si chiamano curvature principali. Il loro prodotto, ossia il determinante di L, porta il nome di curvatura gaussiana di M . D’ora in avanti adotterò la convenzione, comune nel linguaggio delle varietà C ∞ , per cui lo spazio tangente ad M in un punto è quello delle derivazioni. In questo modo, la velocità γ̇(t) di una curva è identificata con l’operatore che assegna ad ogni funzione f : M → R la derivata di f ◦ γ al tempo t. Per un generico vettore X ∈ Tp M , quindi, la notazione Xf assume questo significato, a meno di scegliere un’opportuna curva che passi per p al tempo 0 con velocità X; f X, invece, indica l’usuale prodotto per scalare di X per il valore di f in p. Se Y è un campo vettoriale definito in un intorno di p ∈ M , X un vettore in p, lo strumento più immediato per valutare la variazione di Y lungo X in p è la derivata direzionale del campo come applicazione da M in Rn . Questo dà come risultato un nuovo vettore DX Y di Rn . Se X e W sono vettori in un punto p, Y , Z campi vettoriali ed f una funzione, definiti in un intorno di p, vale: DX (Y + Z) = DX Y + DX Z DX+W Y = DX Y + DW Y DX (f Y ) = f DX Y + (Xf )Y (2.2) Df X Y = f DX Y La seconda e la quarta proprietà esprimono la linearità di DX Y come funzione della sola X, mentre la prima e la terza rappresentano un analogo per la regola di Leibnitz per D, e cioè il fatto che questo operatore agisce su Y come una derivata. Se poi X è un campo liscio, anche quello così ottenuto lo è. Va osservato che, in generale, l’operatore D non dà vettori tangenti a M : se ad esempio γ(t) è la curva piana data da (cos(t), sin(t)), il suo vettore velocità è 1 Questo per le superfici regolari in R3 , ma non c’è difficoltà nel passaggio al caso generale. CAPITOLO 2. CONNESSIONI 26 Y (t) = (− sin(t), cos(t)), e Dγ̇(0) Y (t) = (− cos(t), − sin(t)), che non è tangente alla circonferenza parametrizzata da γ. D’altra parte, un qualsiasi vettore in un punto di M può essere decomposto in modo unico come somma di uno tangente alla varietà ed uno ortogonale ad essa, e ha perfettamente senso la seguente: Def 2.2.1 (Derivata covariante): Siano p un punto di una sottovarietà M di Rn , X un vettore tangente ad M in p e Y un campo definito in un intorno di p (in M ). Si chiama derivata covariante di Y lungo X il vettore DX Y dato dalla componente di DX Y tangente ad M . L’oggetto così definito valuta la derivata di Y , come mappa in Rn anziché come sezione del fibrato tangente, lungo qualsiasi curva che abbia velocità X, e ne trascura la componente ortogonale ad M . Euristicamente, l’informazione che si ottiene in questo modo è la variazione di Y che potrebbe essere misurata da un osservatore che vive in M senza accorgersi che questa è immersa in Rn . Dati X ed Y come sopra, varrà costantemente hN, Y i = 0, da cui: 0 = X hN, Y i = hN, DX Y i + hL(X), Y i Questo implica che la coordinata di DX Y ortogonale ad M (data dal prodotto scalare con N essendo questo unitario e ortogonale a Tp M ) è data dall’opposto di hL(X), Y i, e dunque che DX Y = DX Y + hL(X), Y i N = DX Y + hX, L(Y )i N Questa relazione porta il nome di equazione di Gauss. Dalla linearità di L segue che la derivata covariante gode delle stesse proprietà enunciate per D. La definizione ora data fornisce già uno strumento utile per formalizzare il semplice problema fisico del moto vincolato, e in definitiva di formulare il principio d’inerzia per punti materiali soggetti a vincoli olonomi. Un oggetto libero di muoversi nello spazio tridimensionale, cioè su cui non agisca alcuna forza esterna, soddisfa la relazione v̇ = 0, dove v indica il vettore velocità. Se invece il moto è ristretto a una superficie, l’assenza di altre forze che quella di reazione del vincolo è equivalente alla richiesta che l’accelerazione sia ortogonale a questo: la condizione è dunque che Dv v abbia componente tangenziale nulla ad ogni tempo, cioè Dv v = 0. In questo modo, quindi, il principio d’inerzia conserva la sua forma originale, a meno di considerare la derivata della velocità lungo la traiettoria in un senso diverso da quello solito: occorre impiegare la nuova derivata covariante, naturalmente legata alla struttura del vincolo, anziché quella usuale a cui si è abituati in R3 . Siano dati X, Y e Z campi vettoriali qualsiasi, definiti su uno stesso intorno (in Rn ) di un punto p. Applicando la definizione di derivata di Lie a ciascuna componente di Z si ottiene: DX (DY Z) − DY (DX Z) − D[X,Y ] Z = 0 Se si suppone che i tre campi siano tangenti ad un’ipersuperficie in Rn , la derivata direzionale D può essere riscritta tramite l’equazione di Gauss in termini della derivata covariante D e della metrica riemanniana che M eredita dallo spazio ambiente. Sostituendo nella relazione appena scritta e ricomponendo Z CAPITOLO 2. CONNESSIONI 27 si ottiene: DX (DY Z) = DX DY Z − hL(Y ), Zi N = = DX DY Z − hL(Y ), Zi N − hL(X), DY Xi N = = DX DY Z − hL(Y ), Zi L(X) − (X hL(Y ), Zi + hL(X), DY Xi)N DY (DX Z) = DY DX Z − hL(X), Zi L(Y ) − (Y hL(X), Zi + hL(Y ), DX Y i)N D[X,Y ] Z = D[X,Y ] Z − hL([X, Y ]), Zi N Sommando e separando i contribuiti tangenziali ad M da quelli ortogonali si ottengono le equazioni: DX DY Z − DY DX Z − D[X,Y ] Z = hL(Y ), Zi L(X) − hL(X), Zi L(Y ) DX L(Y ) − DY L(X) − L([X, Y ]) = 0 (2.3a) (2.3b) dove nella (2.3b) sono stati sommati i coefficienti con cui compariva N nella somma, e sono state applicate la bilinearità del prodotto scalare e l’arbitrarietà di Z. La (2.3a) si chiama equazione della curvatura di Gauss, la (2.3b), invece, equazione di Codazzi (o Codazzi-Mainardi). L’equazione della curvatura di Gauss mette in evidenza che, dati X, Y e Z tangenti ad M , in un punto p fissato l’oggetto R(X, Y )Z := DX DY Z − DY DX Z − D[X,Y ] Z dipende solo dai valori dei campi in p, ed è lineare in ciascuno argomento. Inoltre, R è espresso in termini della sola derivata covariante, senza riferimenti espliciti all’embedding di M in Rn (a cui l’operatore di Weingarten è prodondamente legato), e sembra in qualche senso definito a partire dalla sola struttura intrinseca di M dato che, come osservato sopra, la stessa derivata covariante è stata introdotta nel tentativo di studiare delle proprietà delle superficie che prescindono dalla sua immersione. Un risultato classico ed interessante è il seguente: Thm 2.2.1 (Theorema Egregium di Gauss): La curvatura di una superficie in R3 può essere espressa in termini della metrica riemanniana e della derivata covariante. Dim: Se p ∈ M e X, Y ∈ Tp M formano una base ortonormale, allora K(p), la curvatura gaussiana in p, è data da hR(X, Y )Y, Xi. Infatti: hR(X, Y )Y, Xi = hhL(Y ), Y i L(X) − hL(X), Y i L(Y ), Xi = = hL(Y ), Y i hL(X), Xi − hL(X), Y i hL(Y ), Xi = det L = K(p) B La curvatura gaussiana di un’ipersuperficie è stata inizialmente definita a partire dall’operatore di Weingarten: ora questo teorema mostra che, almeno nel caso particolare di superfici nello spazio tridimensionale, essa può essere espressa in termini di oggetti che, almeno euristicamente, sono legati alla natura intrinseca di M , cioè alla sua metrica e alla derivata covariante. Si può CAPITOLO 2. CONNESSIONI 28 mostrare, poi, che quest’ultima può essere costruita a partire dalla metrica stessa, a prescindere dall’immersione e dall’operatore D dal quale era iniziata la discussione (si veda la sezione 2.2.3). Di conseguenza, la curvatura gaussiana può essere espressa in funzione della sola metrica riemanniana della superficie, benché inizialmente sia stata introdotta in termini di oggetti strettamente legati all’embedding. 2.2.2 Connessioni affini su varietà generiche Quanto visto nella sezione precedente, limitato al caso ristretto di ipersuperfici in Rn , servirà ora a giustificare delle nuove definizioni. Sia dunque M una generica varietà differenziabile. Def 2.2.2 (Connessione affine): Per connessione affine su M si intende un operatore D che, dati un vettore X ∈ Tp M e un campo Y in un intorno U di p, assegna loro un vettore DX Y tale che soddisfi le condizioni (2.2). È inoltre richiesto che, se X è un campo su U , DX Y definisca a sua volta un campo C ∞ . Sono naturali, a questo punto, le seguenti: Def 2.2.3 (Trasporto parallelo): Un campo vettoriale X definito lungo una curva γ si dice parallelo (rispetto alla connessione D) se vale DT X ≡ 0 T = γ̇ essendo il vettore tangente a γ. Se X è definito su un aperto, e soddisfa la condizione data, si dice che è parallelo lungo γ. Def 2.2.4 (Geodetica): Una curva γ si dice geodetica se il suo vettore tangente T è parallelo: DT T ≡ 0 Se e1 , . . . , en sono campi vettoriali linearmente indipendenti definiti in un aperto U (cioè formano una base del tangente che varia in modo liscio sull’aperto), sono naturalmente definite n forme differenziali ω 1 , . . . , ω n caratterizzate da hω i , ej i = δji . Inoltre, la linearità di DX Y rispetto a X, saranno ben definite delle forme ωji caratterizzate da: hωji , Xi = hω i , DX ej i Questo consente di introdurre quello che si usa chiamare il “punto di vista di Cartan”, che consiste nello studio delle connessioni per mezzo di forme differenziali. Questo punto di vista sarà ripreso più avanti per studiare i tensori di curvatura e torsione, e poi ancora per proporre un collegamento tra la teoria delle connessioni su fibrati e il punto di vista locale adottato nelle teorie di gauge. Una volta dati campi ei come sopra, le proprietà di D consentono di determinare completamente la connessione una volta noti i coefficienti Γkij definiti CAPITOLO 2. CONNESSIONI 29 da: Dei ej = Γkij ek Infatti, se X = X i ei e Y = Y j ej , varrà: DX Y = DX (Y j ej ) = = X(Y j )ej + Y j DX ej = = X(Y j )ej + Y j DX i ei ej = = (X(Y k ) + Γkij X i Y j )ek Secondo il punto di vista di Cartan questi coefficienti Γkij sono quelli che individuano le forme ωji : da hωji , ek i = hω i , Dek ej i = Γikj segue l’uguaglianza ωji = Γikj ω k . Dato che ogni carta permette di definire una base del tangente in ciascun punto dell’aperto, ad ogni sistema di coordinate possono essere associati i coefficienti della connessione Γkij . È evidente che, dato un aperto coordinato U e una qualsiasi famiglia di n3 funzioni, esiste un’unica connessione D su U i cui coefficienti rispetto alle date coordinate siano quelle assegnate. Può essere interessante, dati due aperti coordinati con intersezione non vuota e delle funk zioni Γkij e Γij associate rispettivamente ai due sistemi, sotto quali ipotesi queste famiglie definiscano la stessa connessione sull’intersezione delle carte; equivalentemente, questo corrisponde a cercare le regole di trasformazione dei coefficienti di una connessione. Siano ϕ, ψ coordinate definite su uno stesso aperto U , con ϕ(p) = (x1 (p), . . . , xn (p)) ψ(p) = (y 1 (p), . . . , y n (p)) e basi associate rispettivamente (ei ) ed (fj ). Allora vale: fj = ∂xi ei ∂y j k da cui, essendo rispettivamente Γkij e Γij i coefficienti di D associati ai sistemi: k Γij ∂xm k em =Γij fk = Dfi fj = ∂y k h ∂x ∂ 2 xh ∂xl ∂xh eh = eh + i j Del eh = =Dfi j i j ∂y ∂y ∂y ∂y ∂y 2 m l h ∂ x ∂x ∂x = + i j Γm em ∂y i ∂y j ∂y ∂y lh k Da questa relazione è possibile ricavare Γij , ricordando che lo Jacobiano del cambio di carta è invertibile: k Γij = ∂xl ∂xh ∂y k m ∂ 2 xm ∂y k Γlh + i j m i j m ∂y ∂y ∂x ∂y ∂y ∂x (2.4) Dunque questa è la regola di trasformazione dei coefficienti di una connessione. D’altra parte, naturalmente, dato un aperto coordinato U e una famiglia di CAPITOLO 2. CONNESSIONI 30 funzioni Γkij , esisterà un’unica connessione che abbia queste come coefficienti. Questa potrà essere estesa ad un altro aperto coordinato con altri coefficienti se e solo se le due famiglie soddisfano la regola di trasformazione, poiché solo in questo caso definiscono la stessa connessione sull’intersezione. Il secondo termine della (2.4) somiglia a quello “indesiderato” in (2.1): in effetti, sostituendo l’operatore D alle “derivate direzionali” (mal definite) del campo considerato in quel contesto, si ottiene una regola di trasformazione che, tenendo conto della relazione tra i coefficienti della connessione nelle varie carte, mostra che il risultato ottenuto è in effetti un vettore, secondo il senso del punto di vista delle coordinate. Naturalmente, dare le regole di trasformazione per i coefficienti Γkij è equivalente a dare quelle per le forme ωji . Se le ω ij sono le forme associate al sistema ψ, ricordando che in questo caso ω i = dxi e ω j = dy j , si dovrà avere: i ω ij =Γkj dy k = l ∂x ∂xh ∂y i m ∂ 2 xm ∂y i ∂y k a = Γ + dx = ∂y k ∂y j ∂xm lh ∂y k ∂y j ∂xm ∂xa m k i h ∂ ∂x ∂y ∂y i l ∂x ∂y m = δa j Γ + dxa = ∂y ∂xm lh ∂y k ∂y j ∂xa ∂xm m ∂x ∂y i ∂xh ∂y i m l Γlh dx + d = j = m m ∂y ∂x ∂x ∂y j ∂y i ∂xm ∂xh ∂y i m ω + d = j ∂y ∂xm h ∂xm ∂y j (2.5) Questa equazione dà le condizioni affinché, date delle 1-forme su aperti della varietà, queste possano essere usate per costruire una connessione. Nel contesto delle teorie di gauge questo punto di vista si rivela fondamentale. Oss 2.2.2: Fissato un sistema di coordinate, le ωji sono forme differenziali a tutti gli effetti: l’introduzione delle loro regole di trasformazione è resa necessaria dal fatto che le forme associate a due carte sono a priori del tutto indipendenti. Queste regole, quindi, non esprimono come siano rappresentate le ωji di una carta rispetto ad un’altra (il che sarebbe banale, perché le regole di trasformazione di una 1-forma sono note), bensì il legame tra queste e quelle di un altro aperto coordinato. La rappresentazione della connessione tramite questi coefficienti permette di mostrare degli interessanti risultati di esistenza e unicità di campi paralleli e geodetiche. Thm 2.2.3: Sia data γ : [a, b] → M una curva liscia, e sia X0 ∈ Tp M , con p = γ(a). Allora esiste un unico campo vettoriale X definito lungo γ, parallelo e tale che X(γ(0)) = X0 . Oss 2.2.4: Per “campo vettoriale definito lungo γ” intendo una mappa differenziabile definita su [a, b] che assegna a ogni t un vettore X(t) ∈ Tγ(t) M . Secondo il linguaggio dei fibrati, un oggetto come questo non è altro che un sollevamento di γ rispetto alla proiezione del fibrato tangente: quello che si cerca, infatti, CAPITOLO 2. CONNESSIONI 31 è una nuova curva, definita sullo stesso dominio di γ ma a valori nello spazio totale del fibrato, in modo che π ◦ X = γ. Non è detto che un campo in questo senso possa essere esteso un aperto contenente la traccia di γ: ad esempio la curva potrebbe non essere iniettiva, e X potrebbe avere valori diversi a tempi in cui questa passa dallo stesso punto. Dim (teorema 2.2.3): Ogni punto t ∈ [a, b] ammette un intorno connesso controimmagine di un aperto coordinato. A meno di scegliere un’opportuna famiglia finita di sottoinsiemi di questo tipo (la cui esistenza è garantita dalla compattezza dell’intervallo), si può supporre che la traccia di γ giaccia per intero in un aperto coordinato. Dato un generico campo vettoriale X, la sua derivata covariante lungo il vettore T della velocità di γ è espressa in coordinate da: dX k + Γkij (γ(t))ẋi X j ek DT X = T (X k ) + Γkij (γ(t))T i X j ek = dt dove le xi (t) rappresentano le coordinate di γ(t). Il problema del trasporto parallelo è dunque ricondotto a quello di Cauchy: k dX + Γkij (γ(t))ẋi X j = 0 (2.6) dt i X (a) = X0i Questo problema ammette un’unica soluzione (per via del teorema di CauchyLipschitz), e questa può essere estesa a tutto l’intervallo poiché l’equazione è lineare. B Questo risutlato permette di parlare in maniera consistente di trasporto parallelo di un vettore lungo una curva. Dati due punti p, q ∈ M , un arco γ che li connette e un vettore X ∈ Tp M , quindi, è possibile costruire un unico X 0 ∈ Tq M per parallelismo lungo l’arco. Tuttavia, la scelta del cammino è tutt’altro che indifferente: il ruolo giocato da questa sarà uno degli argomenti del prossimo capitolo. Thm 2.2.5: Se p ∈ M , X0 ∈ Tp M , esistono una costante reale positiva ε e un’unica geodetica γ : (−ε, ε) → M passante in p al tempo 0 con vettore velocità X. Dim: Data una curva γ a valori in un intorno parametrizzato di p, con vettore velocità T , vale: DT T = T (T k ) + Γkij (γ(t))T i T j ek = ẍk + Γkij (γ(t))ẋi ẋj ek Una curva γ realizza dunque la tesi del teorema se e solo se k k i j ẍ + Γij (γ(t))ẋ ẋ = 0 γ(0) = p γ̇(0) = X0 CAPITOLO 2. CONNESSIONI 32 Esplicitando le coordinate di γ questo sistema assume la forma di un problema di Cauchy; da qui, nuovamente per il teorema di Cauchy-Lipschitz, si ha la tesi. B Una volta che sia data una connessione su una varietà è naturale cercare di estendere l’operatore in modo da poter derivare campi tensoriali generici, anziché solo quelli vettoriali. Il principio guida in questa estensione sarà la regola di Leibnitz: come si è richiesto che DX (f Y ) = X(f )Y + f DX Y , così sarà naturale imporre che, dati campi tensoriali T1 e T2 valga DX (T1 ⊗ T2 ) = (DX T1 ) ⊗ T2 + T1 ⊗ (DX T2 ) oltre alle regole di linearità. Inoltre, se ω è una 1-forma e Y un campo, è naturale chiedere che valga X(hω, Y i) = hDX ω, Y i + hω, DX Y i (2.7) In coordinate, scegliendo X = ei , Y = ej e ω = dxk e applicando la (2.7) si ottiene 0 = hDei dxk , ej i + Γkij =⇒ Dei dxk = −Γij k dxj Queste regole sono sufficienti per determinare completamente la derivata covariante di qualsiasi campo tensoriale lungo una direzione. I tensori di curvatura e torsione Nel caso delle ipersuperfici l’equazione di curvatura di Gauss permette di confrontare un oggetto espresso esclusivamente in termini della derivata covariante con una che dipende dalla struttura metrica e dall’immersione, e questo consente in dimensione 2 di dimostrare il Theorema Egregium, secondo il quale la curvatura dipende solo da questo oggetto (fissata la metrica). Sia data una connessione su M , e siano fissati campi vettoriali X e Y . La mappa R(X, Y ) : Z 7→ DX DY Z − DY DX Z − D[X,Y ] Z fornisce un quarto campo il cui valore dipende linearmente da quello di Z puntualmente, e non da quelli assunti in un intorno. La linearità per somma è infatti evidente, mentre quella per prodotto per scalare è data dalla somma di: DX DY Z = f DX DY + X(f )DY Z + X(Y (f ))Z + Y (f )DX Z −DY DX Z = −f DY DY Z − Y (f )DX Z − Y (X(f ))Z − X(f )DY Z −D[X,Y ] Z = −f D[X,Y ] Z − [X, Y ](f )Z Se poi e1 , . . . , en sono campi vettoriali indipendenti, la rappresentazione di Z rispetto a questa base mostra che R(X, Y )Z in un punto p dipende solo dai valori in p delle coordinate. Dunque R così definito assegna ai campi vettoriali X e Y un campo tensoriale del tipo (1, 1). Inoltre, R(X, Y ) dipende in modo bilineare da X e Y (la verifica è analoga a quella appena fatta e non presenta alcun particolare interesse, pertanto la ometto). Dunque R è un tensore del tipo (1, 3) su M . Def 2.2.5 (Tensore di curvatura): tensore R dato da Si chiama curvatura di una connessione il R(X, Y )Z = DX DY Z − DY DX Z − D[X,Y ] Z CAPITOLO 2. CONNESSIONI 33 Dalle proprietà di linearità della derivata covariante rispetto alla direzione e dall’antisimmetria della parentesi di Lie è immediato verificare che R è alternante rispetto a X e Y . Per questa ragione si usa dire che la curvatura è una 2-forma a valori in End(T M ). In questa nuova notazione, l’equazione di curvatura di Gauss è scritta come: R(X, Y )Z = hL(Y ), Zi L(X) − hL(X), Zi L(Y ) L’equazione di Codazzi, invece, non può essere espressa nello stesso modo, poiché le quantità coinvolte mescolano la derivata covariante con gli altri oggetti legati alla struttura di varietà immersa. Si usa però dare la seguente: Si chiama torsione di una connessione il Def 2.2.6 (Tensore di torsione): tensore dato da: Tor(X, Y ) = DX Y − DY X − [X, Y ] Anche in questo caso le verifiche delle proprietà di linearità sono immediate e poco interessanti, e pertanto le ometto. Come per il tensore di curvatura, anche questo è antisimmetrico rispetto ai due argomenti. Siano U un aperto ed e1 , . . . , en n campi vettoriali indipendenti, come nell’introduzione del punto di vista di Cartan. Le proprietà di linearità e alternanza dei tensori ora definiti consentono di rappresentarli come R(X, Y )ej = Rji (X, Y )ei Tor(X, Y ) = T i (X, Y )ei dove le Rji e le T i sono opportune 2-forme. Queste saranno naturalmente legate alle ω i e alle ωji introdotte sopra: le equazioni che esprimono questa relazione sono chiamate equazioni di struttura di Cartan, e sono equivalenti alle definizioni dei tensori. Rji (X, Y )ei =R(X, Y )ej = =DX DY ej − DY DX ej − D[X,Y ] ej = =DX ωji (Y )ei − DY ωji (X)ei − ωji ([X, Y ])ei = =X(ωji (Y ))ei + ωji (Y )ωik (X)ek − Y (ωji (X))ei − ωji (X)ωik (Y )ek + − ωji ([X, Y ])ei = = hdωji , X, Y i + hωki i ∧ ωjk , X, Y ei Da qui si ricava una delle equazioni di Cartan: dωji = Rji − ωki ∧ ωjk (2.8) L’altra può essere ottenuta in modo del tutto analogo dalla definizione di torsione: dω i = T i − ωji ∧ ω j (2.9) CAPITOLO 2. CONNESSIONI 34 L’ultimo punto di vista ancora da analizzare è quello delle coordinate. Supponendo che la base e1 , . . . , en sia quella indotta da un sistema di coordinate, si avrà ω i = dxi ωji = Γikj dxk i T i = Tjk dxj ⊗ dxk i Rji = Rjkh dxk ⊗ dxh (2.10) i i dove si può facilmente riconoscere che Tjk = T i (ej , ek ) e che Rjkh = Rji (ek , eh ). In questa notazione, le equazioni strutturali di Cartan assumono la forma: ∂Γijk ∂Γijh i − + Γirk Γrjh − Γirh Γrjk Rjkh = dωji + ωri ∧ ωjr (ek , eh ) = k h ∂x ∂x i Tjk = dω i + ωri ∧ ω r (ej , e, k) = Γikj − Γijk Confronto tra connessioni e connessioni affini su una varietà M . Applicando la definizione si Siano D, D può mostrare facilmente che l’operatore e X Y := DX Y − D eX Y (D − D) è lineare in ciascuna entrata, anche per coefficienti non costanti. La linearità in X segue infatti da quella di ciascuna connessione, così come quella per somma in Y . Inoltre, l’operatore commuta con il prodotto per scalare in Y , infatti: e X (f Y ) = (D − D) e X Y + X(f )Y − X(f )Y = (D − D) e XY (D − D) Da questo segue che la differenza B tra due qualsiasi connessioni su M è un campo tensoriale del tipo (1, 2). Inoltre, è immediato verificare che, dati una e definito connessione D e un campo tensoriale T di tipo (1, 2), l’operatore D come D + T è una connessione. Questo permette di considerare sull’insieme delle connessioni su M una struttura di spazio affine su T21 (M ). e sono due connessioni che definiscono lo stesso trasporto Lemma 2.2.6: Se D, D parallelo (cioè tali che un campo X è parallelo lungo γ rispetto a D se e solo se e allora sono uguali. lo è rispetto a D), Dim: Sia p ∈ M , con X0 , Y ∈ Tp M , e sia X il trasporto parallelo di X0 rispetto a D lungo una curva che abbia Y come vettore tangente. Allora X è parallelo e e dunque anche rispetto a D, e Y X = B(Y, X(p)) = B(Y, X0 ) 0 = DY X − D Per l’arbitrarietà di X0 e Y si conclude che B ≡ 0, e dunque la tesi. B Questo risultato permette di affermare che una connessione affine è biunivocamente determinata dal suo trasporto parallelo. Per verificare che due connessioni siano uguali, quindi, è sufficiente mostrare che i campi paralleli rispetto all’una lo sono anche rispetto all’altra, e viceversa. CAPITOLO 2. CONNESSIONI 35 Il tensore differenza può essere scomposto in maniera unica come somma di uno simmetrico e uno antisimmetrico rispetto ai due indici covarianti. Sia B = S + A tale scomposizione: una proprietà interessante di A è che può essere espresso in termini dei soli tensori di torsione delle due connessioni: 2A(X, Y ) = B(X, Y ) − B(Y, X) = e X Y − DY X + D e Y X − [X, Y ] + [X, Y ] = = DX Y − D g = Tor(X, Y ) − Tor(X, Y) È particolarmente interessante il caso in cui B = A, cioè B è antisimmetrico: in questo caso, se γ è una geodetica rispetto alla connessione D, varrà e T T = DT T − B(T, T ) = DT T , e dunque γ è una geodetica anche rispetto D e Viceversa, se le due connessioni hanno le stesse geodetiche, dato un veta D. tore X qualsiasi varrà B(X, X) = 0: per mostrarlo è sufficiente considerare la geodetica con velocità X al tempo 0. Questo risultato mostra che non è possibile ricostruire una connessione conoscendo solo le sue geodetiche: essa sarà determinata a meno di un campo di torsione. Inoltre, data una connessione qualsiasi è possibile costruirne una con le stesse geodetiche e torsione assegnata, e questa sarà unica. 2.2.3 Il caso di varietà riemanniane Nel seguito, per ogni oggetto espresso tramite più indici, indicherò il simmetrizzato rispetto a due di essi racchiudendoli tra parentesi tonde, e l’antisimmetrizzato con le quadre. Ad esempio, si potranno esprimere i coefficienti del tensore di torsione come Tijk = 2Γk[ij] . Il lavoro svolto finora costituisce un buon punto di partenza nella ricerca dello strumento che occorre per studiare problemi come quelli presentati all’inizio, poiché mette in luce le proprietà che deve avere l’oggetto cercato per soddisfare le nostre richieste ed elabora alcuni aspetti di linguaggio utili nella sua manipolazione. Tuttavia, in quanto visto finora non è stato presentato alcun risultato di esistenza e unicità di connessioni, e anzi le ultime osservazioni del paragrafo precedente mostrano che un tale risultato non può esistere, a meno di imporre delle ulteriori restrizioni sulla connessione da costruire. A priori non ci sono delle condizioni naturali da aggiungere, ma nel caso in cui la varietà su cui si lavora abbia della struttura aggiuntiva può darsi che sia questa a suggerirle. Il contesto in cui si affrontano generalmente i problemi di meccanica è quello delle varietà provviste di una metrica riemanniana o pseudo-riemanniana. In questo caso è ragionevole richiedere che, se X e Y sono campi vettoriali paralleli lungo una curva γ, il prodotto scalare di questi sia costante. Tale condizione può essere espressa chiedendo che il tensore metrico sia parallelo lungo qualsiasi direzione. Sia infatti γ una curva in un aperto coordinato di M con γ(0) = p, X, Y campi vettoriali lungo γ ottenuti per trasporto parallelo di due vettori X0 e Y0 qualsiasi. Allora varrà: 0 = DV (g(X, Y )) = V k (Dek g) = V k X i Y j (Dek g)ij Dall’arbitrarietà dei tre vettori segue che ∂gij − Γhki ghj − Γhkj gih = 0 ∂xk CAPITOLO 2. CONNESSIONI 36 Permutando ciclicamente gli indici i,j e k si ha ∂gki − Γhjk ghi − Γhji gkh = 0 ∂xj ∂gjk − Γhij ghk − Γhik gjh = 0 ∂xi Con opportune combinazioni lineari di queste equazioni si ottiene: − ∂gij ∂gki ∂gjk h h + + + Tki ghj + Tkj gih − 2Γh(ij) ghk = 0 ∂xk ∂xj ∂xi Dato che il tensore gij ha rango massimo, esisterà g ij tale che gij g jk = δik : questo permette di esplicitare Γh(ij) moltiplicando tutta l’equazione per g hk /2. Definendo ( ) h ∂gki ∂gjk 1 hk ∂gij + = g − k + 2 ∂x ∂xj ∂xi ij si ha: Γkij = ( ) k ij + 1 k k T + Tji + Tij 2 ij (2.11) Questa è la condizione che garantisce che una connessione la cui curvatura sia rappresentata dai coefficienti Tijk sia compatibile con la struttura metrica. Resta ancora in dubbio l’esistenza di una tale connessione. Se si riesce a far vedere che i ( ) k ij sono i coefficienti di una connessione, allora si sarà dimostrato che, per ogni tensore di coefficienti Tijk antisimmetrico rispetto a i e j, i Γkij come in (2.11) definiscono una connessione. Dunque, a meno di quest’ultimo passaggio, che si riduce a una lunga manipolazione di indici e derivate, si può dimostrare che esiste un’unica connessione simmetrica (cioè a curvatura nulla) rispetto alla quale il tensore metrico sia parallelo. Def 2.2.7 (Connessione di Levi-Civita): Si chiama connessione di Levi-Civita di una varietà (pseudo-)riemanniana l’unica connessione simmetrica che preserva la metrica. Es 2.2.1 (Ancora sulla derivata covariante in ipersuperfici di Rn ): La connessione data dalla derivata covariante nel caso di ipersuperfici preserva i prodotti scalari: se X e Y sono paralleli lungo γ, con γ̇(0) = T , si ha: T (hX, Y i) = hDT X, Y i + hX, DT Y i = hDT X, Y i + hX, DT Y i = 0 e dunque hX, Y i è costante lungo γ. Il passaggio intermedio è giustificato dal fatto che la derivata tramite D e quella con D differiscono per un vettore ortogonale alla superficie, che non contribiusce quindi ai prodotti scalari. Inoltre, la connessione è anche simmetrica: DX Y − DY X = DX Y + hL(X), Y i N − DY X − hL(Y ), Xi N = [X, Y ] CAPITOLO 2. CONNESSIONI 37 dove è stata applicata la simmetria di L. Dunque la connessione di Levi-Civita generalizza a varietà riemanniane qualsiasi la derivata covariante vista in questo caso particolare. Es 2.2.2 (Il pendolo di Foucault): Uno degli esperimenti più famosi della storia della fisica fu quello che provò che la terra “non è ferma”, cioè che il sistema di riferimento ad essa associato non è inerziale. L’esperimento consistette nell’osservazione del moto di un pendolo vincolato ad un punto fisso rispetto alla terra, cioè libero di muoversi sulla superficie di una sfera ferma nel suo sistema di riferimento, con una piccola perturbazione iniziale rispetto al punto di equilibrio stabile. Se la terra fosse ferma, nel senso precisato sopra, allora il moto del pendolo sarebbe descritto in prima approssimazione da un vettore X(t) ∈ Tp S 2 che risolva il problema di Cauchy: g Ẍ = − X l X(0) = X0 Ẋ(0) = 0 p Seguirebbe X(t) = cos(ωt)X0 , dove ω = g/l . La teoria fin qui esposta permette di dare, invece, una previsione per il caso in cui esista un sistema di riferimento inerziale solidale al centro della terra, ma rispetto al quale questa ruoti intorno ad una retta, che senza perdita di generalità può essere supposto essere l’asse z, con velocità angolare Ω. Se R è il raggio terrestre e θ è la latitudine a cui si trova il pendolo, dunque, il moto del vincolo sarà dato dalla curva γ(t) = R (cos(Ωt) sin(θ), sin(Ωt) sin(θ), cos(θ)) Le equazioni del moto del pendolo in questo caso diventano piuttosto complesse, ma è possibile affrontare il problema in un altro modo trattandolo da un punto di vista intrinseco. Quella che nel caso precedente era la derivata temporale valutava la variazione di un vettore nel tempo; in questo caso, il vettore X(t) appartiene a Tγ(t) S 2 , che varia nel tempo, e occorre quindi sostituire la derivata rispetto al tempo con quella covariante. Se v è la velocità di γ il problema assume la forma: g Dv Dv X = − l X X(0) = X0 Dv X(0) = 0 Nel caso precedente la soluzione era data da un vettore costante modulato da un fattore oscillante cos(ωt), e sarà quindi ragionevole cercare una soluzione della forma X(t) = cos(ωt)V (t) con V un campo parallelo lungo γ. In effetti si ha: Dv Dv (cos(ωt)V (t)) = Dv (cos(ωt)Dv V (t) − ω sin(ωt)V (t)) = −ω 2 cos(ωt)V (t) e l’equazione differenziale è soddisfatta. Il problema è risolto se si sceglie V (0) = X0 : in ultima analisi si tratta di trasportare X0 parallelamente lungo la curva γ. La soluzione di questo problema è un vettore la cui rappresentazione rispetto CAPITOLO 2. CONNESSIONI 38 alle coordinate sferiche è dato da una rotazione di quella di X0 con velocità angolare cos(θ) 2 . Da un punto di vista fisico, questa non è la soluzione esatta del problema, nemmeno nell’approssimazione fatta scrivendo il primo problema di Cauchy. In effetti, la terra è soggetta ad altri moti oltre a quello intorno al proprio asse, e il pendolo di Foucault ne risentirà. 2.3 Connessioni su fibrati principali La nozione di connessione affine ammette una descrizione alternativa in termini del fibrato tangente della varietà su cui si sta lavorando, e questa permetterà poi una generalizzazione ad un contesto più ampio. Il problema fondamentale che ha spinto all’introduzione di questo strumento è stato quello di valutare la variazione di un campo vettoriale lungo una curva, o di costruire, dati un cammino e un vettore in un suo punto, un campo a “variazione nulla” lungo questo. Il problema è non banale in quanto non è possibile confrontare vettori in punti diversi, cioè elementi di fibre distinte, il che è legato, in definitiva, al fatto che non esiste in generale un’identificazione canonica tra la fibra tipica e quelle puntuali. In questo linguaggio, un campo vettoriale lungo una curva può essere definito semplicemente come un sollevamento di questa al fibrato: introdurre un trasporto parallelo, ad esempio, equivale a costruire un criterio per sollevare i cammini su M scelto il punto di partenza in T M . Nel caso dei rivestimenti questo è facile, poiché la proiezione è un omeomorfismo locale, e scelto un punto nella fibra di γ(0) esiste un unico sollevamento a partire dal punto assegnato. Nei fibrati la cosa è più complessa, poiché la fibra non è discreta e non vi è alcuna identificazione tra aperti di M e sottoinsiemi di T M : per questa ragione è necessario introdurre della struttura ulteriore. Vale la pena ora fare qualche osservazione sulla struttura dello spazio tanπ gente a E in un punto fissato, per un generico fibrato E → M . Siano p ∈ M , −1 u ∈ π (p), e si consideri Tu E. Per le proprietà della mappa di proiezione, e per il teorema della mappa implicita, la fibra Fp = π −1 (p) ha una struttura di sottovarietà di E, e avrà quindi senso considerare il suo tangente Tu Fp come sottospazio di Tu E. Esso coincide con ker(π∗ |Tu ): dato che π|Fp è costante dovrà valere Tu Fp ⊆ ker(π∗ |Tu E ), e poiché entrambi gli spazi hanno la stessa dimensione di F si conclude. Dunque ogni punto dello spazio totale ammette un’immersione canonica del tangente di F in quello di E: tale copia di Tf F è usualmente indicata con Vu . Inoltre, vale naturalmente l’isomorfismo di spazi vettoriali Tu E ' Tp M ⊕ Tf F , dove f può essere scelto in modo arbitrario, ad esempio a partire da una trivializzazione locale intorno a p. Mentre Tf F può essere identificato come un sottospazio di Tu E, però, non vale lo stesso per Tp M : proprio in questo consiste il nostro problema. Sia ora M una varietà con una connessione affine, e siano dati un vettore X0 ∈ Tp M e una base e1 , . . . , en del tangente in p. Scegliendo γ1 , . . . , γn curve con γi (0) = p e γ˙i (0) = ei , sarà possibile trasportare X0 parallelamente lungo queste ottenendo i campi X1 , . . . , Xn . Si può vedere, allora, che i vettori velocità dei (γi , X ◦ γi ) generano un sottospazio di T(p,X0 ) (T M ) in somma diretta con 2 Questo problema è stato affrontato dettagliatamente dal punto di vista matematico in un corso di introduzione alla geometria differenziale, e perciò ne ometto lo svolgimento. CAPITOLO 2. CONNESSIONI 39 il tangente alla fibra, e cioè forniscono l’identificazione di Tp M in T(p,X0 ) (T M ). Per mostrarlo, basta osservare che, essendo π ◦ (γi , Xi ◦ γi ) = γi , deve valere 0 anche π∗ (γi , Xi ◦ γi ) (0) = γ˙i (0) = ei . Poiché questi formano una base di Tp M , ed essendo in numero di n, questi vettori sono linearmente indipendenti; per ragioni di dimensione, poi, vale la decomposizione in somma diretta con Vu . Il sottospazio così costruito viene spesso indicato con Hu : esso non dipende dalla particolare scelta della base e1 , . . . , en , per via della linearità della derivata covariante rispetto alla direzione, ed è pertanto ben definito. Va notato che questa costruzione fornisce delle identificazioni a livello di spazi tangenti, senza però definire alcuna sezione locale di π. È naturale aspettarsi che le condizioni di linearità per la derivata covariante imponga delle relazioni tra gli spazi Hu in punti diversi di Fp . Se u0 = (p, Y0 ), la base e1 , . . . , en fornisce campi Y1 , . . . , Yn che permettono di caratterizzare Hu0 . Essendo Dei (Xi + Yi ) = Dei Xi + Dei Yi , segue che una base di H(p,X0 +Y0 ) è data dalle velocità delle curve Xi + Yi . Inoltre, se c è una costante, i campi cXi sono paralleli e le loro velocità danno una base di H(p,cX) . Per passare alle connessioni su fibrati principali, conviene analizzare un attimo il fibrato dei riferimenti P associato a T M . La connessione su M consente di trasportare non solo vettori, ma anche basi del tangente, e questo permette di dare una decomposizione Tu P = Vu ⊕ Hu come nel caso del fibrato tangente. Siano X1 , . . . , Xn vettori linearmente indipendenti in p ∈ M , estesi a campi paralleli lungo gli ei 3 , con una trivializzazione che associa alla base formata dagli Xi la matrice Xij . Se u = (p, X1 (p), . . . , Xn (p)) e ghk ∈ GL(Rn ), allora vale Hu g = Rg∗ Hu (2.12) Infatti, Yhj = Xij ghi è una matrice che rappresenta dei campi Yh = Xi ghi in p, per i quali vale: Dej Yh = Dej Xi ghi = Dej Xi ghi = 0 poiché i coefficienti ghi sono costanti e gli Xi sono paralleli lungo gli ej . Dunque, poiché l’azione destra di ghi sui Dej X i è il differenziale di quella sugli X i , vale la relazione (2.12). Tutto questo giustifica la seguente: π Def 2.3.1 (Connessione su un fibrato principale): Se P → M è un G-fibrato principale, si chiama connessione su P una decomposizione in somma diretta di Tu P come Vu ⊕ Hu , al variare di u in P , dove Vu è il nucleo del differenziale della proiezione π, tale che: • le proiezioni su Vu e Hu preservano la differenziabilità dei campi vettoriali; • per ogni g ∈ G vale Hu g = Rg∗ Hu . Questa scomposizione assume un significato ben preciso: dato un sollevamento di una curva γ in M , si dirà che questo è parallelo se il suo vettore tangente T appartiene ad Hu ad ogni tempo. In caso contrario, la proiezione di T su Vu è un buon candidato a misurare la variazione del sollevamento lungo 3 Con questo si richiede che per ogni i e ogni j sia dato un campo lungo la direzione data da ej , che valga Xi in p. CAPITOLO 2. CONNESSIONI 40 la curva, essendo un vettore tangente alla fibra. È esattamente questo lo scopo della decomposizione. Se P è un G-fibrato principale, l’azione destra fornisce per ogni u un’identificazione canonica tra Vu e l’algebra di Lie g. Dato A ∈ g, l’esponenziale dà una curva in G passante per l’identità al tempo 0 con velocità A(Id): l’azione u exp(tA) dà una curva differenziabile γ in P con γ(0) = u. Mandando A nel vettore tangente a γ al tempo 0, denotato con A# , si ottiene un isomorfismo tra i due spazi vettoriali. Avendo in mente questa corrispondenza, è possibile adottare un nuovo punto di vista nella trattazione delle connessioni su fibrati principali. Dato che in questo caso l’analogo della derivata covariante è giocato dalla proiezione su Vu , il quale è identificato con g, la struttura di connessione può essere data da quella che si usa chiamare una 1-forma a valori in g, formalmente un elemento di T ∗ P ⊗ g, cioè un oggetto che assegna ad ogni punto di P una mappa lineare dal suo tangente in g. Nel caso di una connessione su P , secondo la prima definizione, vale naturalmente che la proiezione su Vu fissa puntualmente questo spazio. Inoltre, Rg∗ induce un isomorfismo tra Hu e Hu g , e dunque vale πV (Rg∗ X) = Rg∗ X − πH (Rg∗ X) = Rg∗ X − Rg∗ (πH X) = Rg∗ (πV X) Vale la pena ricordare che nell’algebra di Lie (Rg∗ ) A(h) = Adg−1 A (h). π Def 2.3.2 (1-forma di connessione): Sia P → M un fibrato principale: si dice che ω ∈ Ω1 (P ) ⊗ g è una 1-forma di connessione su P se è differenziabile e: • ω(A# ) = A; • Rg∗ ω = Adg−1 ◦ω Data una 1-forma di connessione è facile costruire in ogni punto uno spazio Hu come ker ωu . Dato che ωu è surgettiva, la dimensione del suo nucleo è la stessa di M , e dunque Hu dà in effetti la somma diretta con Vu , ed essendo ∞ ω differenziabile anche la decomposizione di un campo liscio ne darà due C . ∗ Inoltre, se X ∈ Hu e g ∈ G, allora ω (Rg∗ X) = Rg ω X = Adg−1 (ω(X)): ancora una volta per ragioni di dimensione segue che Hu g = Rg∗ Hu , e questo mostra che i due punti di vista presentati sono equivalenti. Nel seguito confonderò le due nozioni di connessione di 1-forma associata. La nozione di connessione espressa tramite 1-forma si presta meglio dell’altra a parallelismi col caso affine: assegnare ad ogni punto di un aperto di M un elemento della sua fibra equivale a dare una sezione locale del fibrato P . Sia questa σ, e X ∈ Tp M : la “derivata” di σ lungo X sarà espressa da ω (σ∗ X) = (σ ∗ ω) X. Es 2.3.1: Il toro può essere visto comeun opportuno quoziente di [0, 1] × S 1 , identificando il punto 0, eiθ con 1, eiθ : questo significa richiudere il cilindro su se stesso in modo da identificare gli estremi di ogni segmento “orizzontale”. Intuitivamente, se invece che in questo modo si incollassero i due estremi ruotando il secondo, cioè identificando (0, eiθ ) con 1, ei(θ+φ) per un qualche φ fissato, si otterrebbe un oggetto “diverso”, in un qualche senso da precisare meglio. La cosa si rende più evidente se anziché una circonferenza si considera un poligono P : in questo caso si ha un prisma anziché un cilindro, senza le due CAPITOLO 2. CONNESSIONI 41 basi. Un modo di richiudere il prisma è quello di identificare ciascun lato l di P × { 0 } con quello corrispondente in P × { 1 }; un altro è quello di applicare una permutazione ciclica σ agli spigoli di P × { 1 } e di incollare l a σ(l). Ci chiediamo allora in quale senso possa essere descritta in modo matematicamente rigorosa questa differenza intuitiva tra i due diversi quozienti. Tornando al caso del cilindro, la topologia non distingue i due quozienti, cioè essi sono omeomorfi, e anzi diffeomorfi. Infatti, la mappa t, eiθ 7→ t, ei(θ+tφ) è un diffeomorfismo del cilindro in sé che passa al quoziente, e induce l’equivalenza cercata. Nemmeno come fibrati su S 1 (ottenuto come quoziente dell’intervallo) i due oggetti sono distinti: la mappa fornita sopra è un isomorfismo. Sia γ(t) = t un cammino sul segmento [0, 1]. Poiché il cilindro è un fibrato principale banale sull’intervallo, con un’ovvia connessione data da g −1 dg, cioè il differenziale della proiezione sul secondo fattore, dato eiθ ∈ S 1 esiste un solle iθ vamento naturale di γ con punto base 0, e : quello con seconda componente costante. Passando al quoziente γ viene trasformata in un loop che viene sollevato a una curva sul cilindro: questa dipenderà da quale dei due quozienti del cilindro è stato scelto. In un caso, il laccio si chiude, nell’altro questo non è vero in generale, e lo sarà solo per φ multiplo intero di 2π. La differenza tra queste strutture è ora evidente: il quoziente fa sì che il toro erediti dal cilindro una connessione che dipende dalla scelta di φ. Per approfon2 dire ulteriormente, passo a considerare il cilindro “ingrassato” (−ε, 1+ε)×S an 1 iθ ziché [0, 1] × S : il quoziente sarà ottenuto identificando δ, e con 1 + δ, eiθ 1 1 per ogni δ compreso tra −ε ed ε. Sia ψ : [0, 1] × S → [0, 1] × S data da iθ i(θ−tφ) t, e 7→ t, e , p la mappa di proiezione sul quoziente “standard”: allora p ◦ ψ è la proiezione sul toro ottenuto ruotando il secondo estremo. Poiché ψ è un diffeomorfismo, la connessione standard sul cilindro può essere trasformata tramite ψ tramite il pull-back dell’inversa, ottenendo: ∗ ψ −1 (g −1 dg)(t, iθ) = g −1 dg ψ −1 ∗ (t, iθ) = (φdt + g −1 dg)(t, iθ) dove il tangente di S 1 è identificato con iR e quello del toro con il prodotto iR × iR. Passando al quoziente si può vedere che, definendo la connessione ω := φdt + g −1 dg ∗ sul toro, si ha (p ◦ ψ) ω = g −1 dg, la connessione canonica del cilindro. Questa connessione è la stessa che si ottiene definendo gli spazi Hu come quelli generati dai vettori (−i, iφ): si ha infatti ω(−iφ, i) = −iφ+iφ = 0. Questi vettori formano un campo globale sul toro, che può sempre essere integrato dando curve definite su tutto l’asse reale. Nel caso delle connessioni affini è stato sviluppato il punto di vista di Cartan, che consiste, dato un riferimento di T M che vari in modo liscio su un intorno U di un punto p, nel definire delle 1-forme ωji su U da cui è possibile ricostruire localmente la connessione. Viste tutte insieme, queste possono definire n forme differenziali a valori in Tp M , ciascuna delle quali esprime la derivata covariante di una delle direzioni del riferimento. Le regole di trasformazione di queste ωji , poi, consentono di definire una connessione su M dando delle forme locali compatibili. CAPITOLO 2. CONNESSIONI 42 Anche nel caso in analisi ora è possibile una costruzione analoga: ad una connessione ω è possibile associare delle 1-forme locali su M a valori in g dalle quali sia possibile ricostruire quella su P , e viceversa una famiglia di forme compatibili definisce una connessione sul fibrato. Il punto di partenza della prospettiva suggerita da Cartan è un’opportuna famiglia di campi vettoriali, cioè di sezioni locali di T M : sia allora σ una sezione di P . L’obiettivo di σ in questo caso non è quello di dare in ogni punto un elemento di G, ma di fornire una trivializzazione locale di P , cosa che è possibile grazie alla struttura di fibrato principale (si veda la dimostrazione del teorema 1.5.5). Naturalmente, la forma indotta su U sarà il pull-back di ω tramite σ. Se invece A è una 1-forma a valori in g definita su U , la sezione σ permette di sollevarla ad una connessione ω su P |U : la costruzione può essere fatta definendo ω e su U × G e poi passando a P tramite la trivializzazione locale. Naturalmente, T(p,g) (U × G) = Tp U ⊕ Tg G: se X è un vettore in (p, g) definisco ω e (X) come somma di due contributi provenienti dalla sua decomposizione. La proiezione su Tg G, che può essere scritta come dg, dà un vettore tangente in g: per vederlo come elemento dell’algebra di Lie occorre valutare nell’origine il campo invariante che vale dg(X) in g, così che il contributo della componente parallela a G è g −1 dg. La proiezione su Tp U è data ∗ ∗ A) X è un ben definito elemento dell’algebra di Lie. Tuttavia, : (πU invece da πU ∗ A non soddisfa le condizioni la forma differenziale definita da ω e = g −1 dg + πU di traslazione richieste dalla definizione di connessione, e per questo si compone il secondo termine con l’azione di G su g per aggiunzione: ∗ ω e := g −1 dg + Adg−1 ◦ (πU A) È immediato verificare che, se ι è l’immersione U 3 u 7→ (u, 0) ∈ U × G, allora ι∗ ω e = A. Passando a P |U si ottiene la 1-forma locale: ωU = Adg−1 ◦π ∗ A + g −1 dg dove g = g(u) rappresenta l’elemento di G per cui vale u = σ(π(u)) g. L’invarianza sotto l’azione di G segue per costruzione, così come la condizione σ ∗ (ωU ) = A. Rimangono da studiare le regole di trasformazione che garantiscono che due 1-forme locali Ai e Aj definite rispettivamente su Ui e Uj diano tramite le sezioni σi e σj la stessa connessione ω = ωUi ∩Uj . Per ogni p ∈ Ui ∩ Uj sia tij (p) tale che σj (p) = σi (p) tij (p). Si avrà allora: Aj (p) = σj∗ (ω (σj (p))) = σj∗ (ω (σi (p) tij (p))) = = σj∗ Adt−1 ◦π ∗ Ai + t−1 ij dtij = ij = Adt−1 ◦Ai + ij (2.13) t−1 ij dtij Vale la pena notare che la (2.5) è formalmente analoga a questa condizione: di fatto esprime in coordinate una trasformazione del tutto simile a questa (l’una per la derivata covariante in una varietà, l’altra per la 1-forma di connessione su un fibrato principale). 2.3.1 Derivata covariante indotta La derivata covariante è stata introdotta per studiare il comportamento dei campi vettoriali tangenti ad M , ed in seguito è stata estesa a campi tensoriali. CAPITOLO 2. CONNESSIONI 43 In generale, ha senso parlare di derivata covariante nel caso di fibrati vettoriali qualsiasi, come di un oggetto che soddisfi le proprietà (2.2). Una connessione su un principale P induce su qualsiasi fibrato vettoriale associato E = P ×ρ V una derivata covariante, cioè un oggetto che associa ad una sezione σ di E e un campo vettoriale tangente X una seconda sezione di E. A σ è associata una mappa σ P : P → V il cui differenziale fornisce una funzione σ P ∗ : T P → V . Dati un punto p ∈ M e un qualsiasi u nella sua fibra, la connessione su P dà un isomorfismo tra Tp M e Hu tramite il differenziale della proiezione π. A meno di scegliere il punto u nella fibra di p, dunque, esiste un’immersione ιu di Tp M in Tu P , e per composizione una mappa da Tp M in V . Scegliendo u g al posto di u si ha, per le proprietà della connessione, ιu g = Rg∗ ◦ ιu . Dunque: σ P ∗ ◦ ιu g = σ P ∗ ◦ Rg∗ ◦ ιu = σ P ◦ Rg ∗ ◦ ιu = Lρ(g)−1 ◦ σ P ◦ ιu = = Lρ(g)−1 ∗ ◦ σ P ∗ ◦ ιu = Lρ(g)−1 ◦ σ P ∗ ◦ ιu essendo Lρ(g)−1 lineare. Dunque è ben definita (DX σ)(p) = u, σ P ∗ ιu (X) La linearità in X è banale, come quella in σ rispetto alla somma. Rimane P da verificare la regola di Leibnitz: se f è una funzione su M allora (f σ) = P (f ◦ π) σ . Di conseguenza P (f σ) = f σ P ∗ + σ P ⊗ π ∗ (df ) ∗ da cui DX (f σ)(p) = u, f σ P ι (X) ∗ u + X(f )σ P (u) = f DX (σ)(p) + X(f )σ(p) e questo conclude. Può essere utile a questo punto saper rappresentare la derivata covariante associata ad ω in termini della 1-forma locale A legata alla sezione σ. Sia γ : [0, 1] → M una curva con vettore tangente X al tempo 0, γ e un sollevamento di γ in P con vettore tangente orizzontale in 0. Per un’opportuna curva in G vale γ e(t) = σ(t) g(t), dove σ(t) = σ(γ(t)). Data una base e01 , . . . , e0m di V , σ induce m sezioni indipendenti di E, e di conseguenza una base di V lungo γ: ei (t) = σ(t), e0i = γ e(t), g(t)−1 e0i Derivando la seconda componente rispetto al tempo si ottiene: dg d g(t)−1 e0i = −g(t)−1 g(t)−1 e0i dt dt Valutando al tempo 0 si ha DX ei = γ e(0) g(0)−1 , A(X) e0i dove A(X), essendo un elemento di g, agisce su V come una mappa lineare. Sia dunque A(X) rappresentato in forma matriciale da A(X)e0i = Aji (X)e0j CAPITOLO 2. CONNESSIONI 44 e sostituendo in DX ei si trova: DX ei = Ak ji X k ej dove l’indice k è legato alla scrittura di A in coordinate come Ak dxk . Per un generico campo Y = Y i ei si ottiene DX Y = X(Y i )ei + Ak ji Yi X k ej che ricorda la vecchia forma della derivata covariante espressa tramite i coefficienti Γkij . 2.4 Olonomia Anche nel caso di connessioni su fibrati principali vale un risultato di esistenza ed unicità del trasporto parallelo, cioè di un sollevamento a P dei cammini in M che dia come risultato curve i cui vettori tangenti siano sempre orizzontali, cioè in Hu . Thm 2.4.1 (Trasporto parallelo): Se P è un fibrato principale con una connessione ω, γ : [0, 1] → M una curva differenziabile, u0 ∈ π −1 (γ(0)) allora esistono ε > 0 ed un unico sollevamento γω di γ a P con punto iniziale u0 e vettore velocità in Hu ad ogni tempo, definito su [0, ε). Dim: Come nella dimostrazione del teorema 2.2.3 si potrà supporre senza perdita di generalità che la traccia di γ sia contenuta in un aperto U su cui sia definita una sezione σ. Questo consente di riformulare il problema in termini di una connessione su U × G. Se γ e(t) = (γ(t), g(t)) èun generico sollevamento di γ in U × G, il suo vettore tangente sarà γ̇(t), dg dt . Identificando Tg G con g, dg dt d come elemento dell’algebra di Lie è rappresentato da g −1 dt g. La condizione che γ e sia orizzontale è espressa da Adg−1 ◦ωU (γ̇) + g −1 d g=0 dt e dunque il sollevamento soddisfa le richieste se e solo se d g + ωU (γ̇) g = 0 dt (2.14) B Dato un punto iniziale l’equazione differenziale ammette un’unica soluzione in un intorno di 0, e il teorema è dimostrato. Oss 2.4.2: Se si aggiunge l’ipotesi che G sia compatto, la soluzione dell’equazione differenziale (2.14) è globale: se infatti essa cessasse di esistere a un tempo t0 , allora in un intorno di tale istante dovrebbe uscire da qualsiasi compatto contenuto nel dominio, il quale però, essendo prodotto di compatti, lo è a sua volta. Nel seguito supporrò dunque che G sia un gruppo compatto, in modo che i trasporti paralleli esistano sempre globalmente. CAPITOLO 2. CONNESSIONI 45 Applicando il teorema un numero finito di volte è possibile rilassare la condizione di differenziabilità di γ chiedendo solo che sia C ∞ a tratti. Il risultato vale quindi anche per curve ottenute per concatenazione: date α e β curve differenziabili con α(1) = β(0) è ben definita γ data da: 1 α(2t) per 0 ≤ t ≤ 2 γ(t) = 1 β(2t − 1) per ≤ t ≤ 1 2 γ è differenziabile a tratti, e il teorema con l’ipotesi rilassata può essere applicato ad essa. Se è dato un sollevamento orizzontale γ e di γ con punto iniziale u0 , per ogni g ∈ G le proprietà della connessione fanno sì che γ e(t) g sia un sollevamento orizzontale con punto iniziale u0 g. Dunque è sufficiente sollevare γ con un punto iniziale u0 qualsiasi per costruire in maniera immediata quello da u0 g, per ogni g. Un sollevamento globale (cioè definito su tutto l’intervallo [0, 1]) di γ induce una corrispondenza biunivoca tra le fibre di γ(0) e γ(1). Indicando con Γ(γ) la bigezione associata alla curva, per ogni g ∈ G varrà Γ(γ)(u g) = (Γ(γ)(u)) g. Se si indica con γ −1 (t) la curva γ(1 − t), γ e−1 è ancora una curva orizzontale, poiché il suo vettore tangente è l’opposto di quello di γ e e di conseguenza è orizzontale. Dunque Γ(γ −1 ) (Γ(γ)u0 ) = u0 e Γ(γ) Γ(γ −1 )u1 = u1 , il che dimostra che la corrispondenza è biunivoca. Infine, se γ1 ∗γ2 è la concatenazione di due cammini, vale Γ(γ1 ∗γ2 )(u0 ) = Γ(γ2 ) (Γ(γ1 )(u0 )). Dunque i Γ(γ) con γ un cammino chiuso con punto base p formano un sottogruppo di G, poiché le osservazioni appena fatte mostrano la chiusura per prodotto e per inverso. In questo caso indicherò con τγ la bigezione di π −1 (p) su se stesso indotta dalla curva. Se M è connessa, essendo localmente diffeomorfa ad Rn è connessa per archi C ∞ a tratti, e se q è un altro punto su M un qualsiasi cammino α che lo colleghi a p induce un isomorfismo tra i sottogruppi di G associati ai due punti. Data una curva chiusa γ in q, infatti, la concatenazione α ∗ γ ∗ α−1 fornisce l’isomorfismo. È dunque ben posta la seguente: Def 2.4.1 (Gruppo di olonomia): Sia P un G-fibrato su una varietà M connessa, ω una connessione su P . Per ogni punto u ∈ P si chiama gruppo di olonomia di ω in u, indicato con Φu (ω), il sottogruppo di G definito da: Φu (ω) = { g ∈ G : τγ (u) = u g per qualche cammino chiuso γ } Essendo i Φu (ω) isomorfi tra loro, spesso si omette il riferimento al punto base e si parla semplicemente del gruppo di olonomia di ω. Si chiama olonomia ristretta in u il sottogruppo Φ0u ottenuto limitando γ alla sola classe dei cammini omotopi a quello costante. Es 2.4.1: Il trasporto parallelo sulla sfera unitaria (rispetto alla connessione di Levi-Civita) lungo le curve a latitudine costante mostra che il gruppo di olonomia è S 1 . Infatti, per definizione della connessione, il trasporto parallelo in questo caso conserva i prodotti scalari, e quindi Φ ⊆ SO2 . D’altronde, il trasporto di un vettore alla latitudine θ dà come olonomia 2π cos(θ): Φ include quindi un intorno dell’elemento neutro di S 1 , e la tesi segue dal fatto che ogni gruppo di Lie connesso è generato da un suo qualsiasi aperto. Capitolo 3 Piattezza L’olonomia occupa una posizione centrale nello studio delle connessioni: una volta definita la sua azione è naturale chiedersi da quali proprietà di un arco γ dipenda il trasporto parallelo lungo di essa, oppure, equivalentemente, sotto quali ipotesi l’olonomia associata ad un cammino sia nulla. La piattezza della connessione è una condizione che garantisce la banalità locale del trasporto parallelo; globalmente questo non sarà comunque vero in generale, ma esisterà una stretta relazione tra olonomia e omotopia. 3.1 Ancora sulla curvatura nel caso affine Il tensore di curvatura di una connessione affine è già stato introdotto, ma senza una riflessione sul suo significato. Esso gioca un ruolo determinante nello studio dell’olonomia, e pertanto merita a questo punto una trattazione più approfondita. Oss 3.1.1: In maniera euristica, se la variazione dei coefficienti Γkij lungo una curva γ è sufficientemente piccola, la soluzione del problema di Cauchy (2.6) può essere approssimata con: X i (γ(t)) = X0i − X0j Γijk (γ(t)) xk (t) − xk (0) dove xk (t) è la rappresentazione in coordinate di γ(t). Vale infatti X i (0) = X0i , e dΓijk k d i X = −X0j x (t) − xk (0) − X0j Γijk (γ(t))ẋk ' −X0j Γijk (γ(t))ẋk dt dt Dunque in prima approssimazione la funzione suggerita risolve il problema di Cauchy. Siano p ∈ M , U un intorno parametrizzato di p con xi le coordinate di p e X ∈ Tp M rappresentato da X i . Siano inoltre εi , δ i ∈ Rn due vettori, a cui si voglia dare il significato di perturbazioni del punto p, e dunque sufficientemente piccoli nel senso dell’osservazione fatta sopra. I punti q, s ed r di coordinate rispettivamente xi + εi , xi + δ i e xi + εi + δ i definiscono un rettangolo i cui lati 46 CAPITOLO 3. PIATTEZZA sono le curve 47 γ1 (t) = xi + tεi γ2 (t) = xi + εi + tδ i γ3 (t) = xi + tδ i γ2 (t) = xi + δ i + tεi Il trasporto parallelo di X lungo γ1 dà in q un vettore approssimato dalle coordinate X i − Γijk (p)εk X j . Trasportando questo lungo γ2 si ottiene in r: X i − Γijk (p)εk X j − Γilm (q)δ m X l − Γljk (p)εk X j ' ∂ i h m Γ ε δ X l − Γljk (p)εk X j ' ' X i − Γijk (p)εk X j − Γilm (p) + lm h ∂x ∂ i i h ' X i − Γijk (p)X j εk − Γijk (p)X j δ k − Γ − Γ (p)Γ (p) X l εk δ m hm lk ∂xk lm approssimato tramite uno sviluppo in Taylor e trascurando i termini di grado superiore al secondo in εi e δ i . Trasportando invece lungo γ3 e γ4 si ottiene ∂ i i h Γ − Γ (p)Γ (p) X l εk δ m X i − Γijk (p)X j εk − Γijk (p)X j δ k − hk lm ∂xm lk e la differenza tra i due trasporti è: ∂ i ∂ i i h i h i Γ − Γ − Γ (p)Γ (p) + Γ (p)Γ (p) X l εk δ m = Rlkm X l εk δ m hm lk hk lm ∂xk lm ∂xm lk In questo approccio euristico, dunque, il tensore di curvatura esprime la differenza tra i trasporti paralleli di X lungo due curve diverse, ottenute scambiando due direzioni fissate. Questo giustifica il nome di tale tensore: è intuitivamente ragionevole aspettarsi che la non commutatività di questi trasporti paralleli dipenda dal fatto che lo spazio è curvo, mentre ad esempio in Rn , che è piatto, ci si può aspettare che il parallelismo non dipenda dal percorso lungo il quale viene valutato. Questo esempio chiarisce il significato geometrico della curvatura, ma non suggerisce in che modo definirla nel caso di connessioni su fibrati principali. A questo scopo è utile riprendere la deifnizione nel caso affine: R(X, Y )Z = DX DY Z − DY DX Z − D[X,Y ] Z Una volta fissato il campo Z, la derivata covariante DX Z è una funzione lineare di X, e può essere vista come una forma differenziale. Scrvendo questa forma come ωZ , l’equazione sopra diventa: R(X, Y )Z = DX (ωZ (Y )) − DY (ωZ (X)) − ωZ ([X, Y ]) Questa richiama una nota espressione per la valutazione del differenziale di una 1-forma: (dω)(X, Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) In effetti, le due scritture sono formalmente analoghe: in un caso si tratta di una forma a valori in R per cui è ben definita l’usuale derivata direzionale, mentre nell’altro il codominio è lo spazio (tangente a) Tp M , e per derivare quantità di questo tipo è necessario ricorrere alla connessione. La curvatura R(·, ·)Z può essere quindi vista come il differenziale della forma ωZ nel senso dato dalla derivata covariante. CAPITOLO 3. PIATTEZZA 3.2 48 Curvatura di una 1-forma di connessione Avendo in mente le osservazioni appena fatte, è possibile definire la curvatura di una 1-forma di connessione ω come la 2-forma a valori in g data dal suo differenziale, in un senso che ora va approfondito meglio. Sulle forme differenziali su P è ben definita l’usuale derivata esterna, che però non ha niente a che vedere con la struttura indotta dalla connessione. Si usa quindi definire la derivata covariante di una forma ω ∈ Ωr (P ) come (Dω) (X1 , . . . , Xn ) = (dω) X1H , . . . , XnH dove XiH denota la proiezione di X su Hu . Questa definizione ha senso anche per forme a valori in uno spazio vettoriale: è immediato verificare che se questa è rappresentata in una base e1 , . . . , en come ω = ω i ⊗ ei allora è ben definita dω = (dω i ) ⊗ ei . Def 3.2.1 (Curvatura di una connessione): Sia ω una 1-forma di connessione su un fibrato principale P . Si chiama curvatura di ω la 2-forma Ω data dalla sua derivata covariante. La curvatura eredita dalle proprietà della connessione la sua condizine di invarianza per traslazione: se g ∈ G, allora Rg∗ Ω = Adg− 1 ◦Ω. Infatti: Rg∗ Ω(X, Y ) = Ω (Rg∗ X, Rg∗ Y ) = H = dω Rg∗ X H , Rg∗Y = = Rg∗ dω X H , Y H = = d(Rg∗ ω) X H , Y H = = d(Adg−1 ◦ω) X H , Y H = = Adg−1 ◦dω X H , Y H = = Adg−1 ◦Ω(X, Y ) Trattando le forme differenziali a valori in un’algebra di Lie si usa introdurre il commutatore tra due forme. Se T1 , . . . , Tn è una base di g, e se σ = σ i ⊗ Ti , τ = τ i ⊗ Ti sono una p-forma ed una q-forma, si definisce: [σ, τ ] = σ i ∧ τ j ⊗ [Ti , Tj ] e si può verificare che [σ, τ ] = σ ∧ τ − (−1)pq τ ∧ σ. Dunque per ogni p-forma σ vale [σ, σ] = 2σ ∧ σ per p dispari, 0 altrimenti. Come nel caso delle connessioni affini vale il seguente: Thm 3.2.1 (Equazione di struttra di Cartan): Se ω è una 1-forma di connessione su un fibrato principale P , allora la sua curvatura soddisfa dω = Ω − ω ∧ ω CAPITOLO 3. PIATTEZZA 49 Dim: Valutando ω ∧ ω in X, Y si ha 2(ω ∧ ω)(X, Y ) = [ω, ω](X, Y ) = [Ti , Tj ] ⊗ ω i ∧ ω j (X, Y ) = = [Ti , Tj ] ω i (X)ω j (Y ) − ω j (X)ω i (Y ) = = [ω(X), ω(Y )] − [ω(Y )ω(X)] = 2[ω(X), ω(Y )] Dunque la tesi è equivalente a dω(X, Y ) = Ω(X, Y ) − [ω(X), ω(Y )] per ogni X, Y ∈ Tu P . Per le proprietà di linearità e alternanza delle forme differenziali basta dimostrare l’asserto nei seguenti casi: • X, Y ∈ Hu : allora ω(X) = ω(Y ) = 0. Inoltre, in questo caso particolare Ω coincide proprio con il differenziale di ω, e la tesi è verificata. • X ∈ Hu e Y ∈ Vu : per la bilinearità del commutatore anche in questo caso [ω(X), ω(Y )] = 0, e Ω(X, Y ) = 0 dato che Y H = 0. Per valutare dω(X, Y ) è possibile estenderli a campi in un intorno del punto in analisi ed applicare: dω(X, Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) = X(ω(Y )) − ω([X, Y ]) Essendo Y verticale, il campo può essere scelto come quello indotto da V ∈ g: in questo modo ω(Y ) = V , una costante, e dω(X, Y ) si riduce a −ω([X, Y ]). D’altra parte tale vettore è orizzontale: lo si scriva come limt→0 Rg(t)∗ X − X /t con g(t) una curva in G in modo che il tangente di u g(t) sia Y . Allora Rg(t)∗ X è orizzontale, e così anche [X, Y ]. • X, Y ∈ Vu : allora Ω(X, Y ) = 0. In modo analogo al passo precedente si ha dω(X, Y ) = −ω([X, Y ]). Sia A = ω([X, Y ]): allora A = ω([X, Y ]) = ω([ω(X)# , ω(Y )# ] = ω([ω(X), ω(Y )]# ) = [ω(X), ω(Y )] da cui finalmente dω(X, Y ) = −[ω(X), ω(Y )]. B Segue immediatamente dall’equazione di struttura di Cartan la seguente: Thm 3.2.2 (Identità di Bianchi): Se Ω è 2-forma di connessione di ω, allora DΩ = 0 dove D denota la derivata covariante. Dim: Il differenziale di Ω è dato da dΩ = d (dω + ω ∧ ω) = (dω) ∧ ω − ω ∧ (dω) B Di conseguenza, dato che DΩ(X, Y, Z) = dΩ(X H , Y H , Z H ), e che ω(V H ) si annulla per ogni V , si ha la tesi. CAPITOLO 3. PIATTEZZA 50 Sia σ una sezione locale di P . Come alla connessione ω la sezione associa una 1-forma A ∈ Ω1 (M ) ⊗ g, così è possibile rappresentare la curvatura per mezzo di una 2-forma F definita come il pull-back di Ω tramite σ. Se Fi ed Fj sono le forme locali rispetto a due sezioni σi e σj , con σj (p) = tij (p) σi (p), allora vale Fj = dAj + Aj ∧ Aj = = d(Rt−1 ∗ ◦ Ai + ij t−1 ij dtij ) −1 + (Rt−1 ∗ ◦ Ai + t−1 ij dtij ) ∧ (Rt−1 ∗ ◦ Ai + tij dtij ) = ij ij = Rt−1 ∗ ◦ (dAi + Ai ∧ Ai ) = Rt−1 ∗ ◦ Fi ij ij Le equazioni dimostrate sopra impongono delle condizioni anche su queste forme locali: quella di Cartan è data da dA = dσ ∗ ω = σ ∗ (dω) = σ ∗ Ω + (σ ∗ ω) ∧ (σ ∗ ω) = F + A ∧ A Per quanto riguarda l’identità di Bianchi si ha invece: dF = σ ∗ (dΩ) = σ ∗ ((dω) ∧ ω − ω ∧ (dω)) = (dA) ∧ A − A ∧ (dA) = F ∧ A − A ∧ F da cui dF + [A, F] = 0 Definendo DF come dF + [A, F] si ottiene un’identità formalmente identica a quella di Bianchi: DF = 0 3.3 Condizioni equivalenti alla piattezza Come osservato nella sezione 3.1, la curvatura di una connessione affine esprime la dipendenza del trasporto parallelo dal cammino scelto. Ci si potrebbe quindi aspettare che tale dipendenza venga meno nel caso in cui la curvatura si annulli identicamente: questo è vero soltanto localmente. Def 3.3.1: Si dice che una connessione è piatta se la sua curvatura è nulla. Si usa anche dire che un fibrato è piatto se su di esso è definita una connessione e non si corrono rischi di ambiguità. Prima di proseguire occorre introdurre della terminologia comune nell’ambito della geometria differenziale. Sia data una varietà M di dimensione n, e sia assegnato, per ogni punto p ∈ M , un sottospazio τ (p) di dimensione d di Tp M . Se M può essere ricoperta tramite aperti sui quali siano definite d campi vettoriali lisci che formino basi per τ (p), allora si dice la famiglia di questi spazi costituisce una distribuzione d-dimensionale su M . La condizione sull’esistenza dei campi vettoriali serve per fare in modo che, in un senso intuitivo, τ (p) vari in modo liscio su M . Una distribuzione può essere vista anche come un sottofibrato tel tangente ad M . Una distribuzione si dice involutiva se, comunque date X, Y sezioni di τ come sottofibrato (cioè due campi vettoriali i cui valori in qualsiasi p appartengano a τ (p)) anche il loro commutatore lo è. In modo più stringato, una distribuzione si dice involutiva se è chiusa rispetto al commutatore. Data una distribuzione ha senso chiedersi se per ogni punto p ∈ M esista una sottovarietà N 3 p il cui tangente sia τ (q) in ogni punto q ∈ N . Una tale CAPITOLO 3. PIATTEZZA 51 sottovarietà è chiamata varietà integrale, ed è detta massimale se è connessa e non ne esiste un’altra che la contenga. Naturalmente, se una distribuzione ammette una varietà integrale allora è involutiva: due sezioni di τ possono essere viste come campi vettoriali su N , e il loro commutatore non dipenderà dal fatto che lo si valuti rispetto alla struttura di M o a quella di N . Di conseguenza, la loro parentesi di Lie sarà un campo tangente ad N , e in quanto tale sarà una sezione di τ . Non è ovvia l’altra implicazione, che invece discende dal seguente: Thm 3.3.1 (Frobenius): Se τ è una distribuzione involutiva d-dimensionale allora ogni punto p ∈ M ammette un intorno U e una carta φ : U → Rn il cui differenziale mappa τ sulla distribuzione su Rn che consta dei sottospazi generati dai primi d vettori della base canonica. Una carta come quella di cui l’esistenza è garantita dal teorema di Frobenius induce una partizione di U in sottoinsiemi della forma φ−1 (Rd × { x }). Se M è ricoperta da carte di questo tipo, in modo che per ogni overlapping tra due carte le decomposizioni indotte sull’intersezione coincidano, si ha una partizione di M detta foliazione. Ciascuna delle sottovarietà (nel senso degli imbedding) che ricoprono M in questo modo è detta foglia. Il teorema di Frobenius garantisce quindi l’esistenza di una foliazione cui τ sia tangente, a condizione che questa sia involutiva. Se su un fibrato principale P è data una connessione, gli spazi orizzontali formano una distribuzione: se T1 , . . . , Tn è una base di g, si completi T1# , . . . , Tn# a base liscia di Tu P su un aperto opportuno. Le proiezioni dei vettori aggiunti formano una base liscia di Hu . Indicherò con H tale distribuzione. Vale allora: Thm 3.3.2: La distribuzione data dalla connessione è involutiva se e solo se questa è piatta. Dim: Il punto chiave della dimostrazione sarà l’equazione di struttura di Cartan. Siano X, Y campi orizzontali su un aperto di P . Allora dω(X, Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) = −ω([X, Y ]) Se ω è piatta, allora l’equazione di struttura dà −ω([X, Y ]) = [ω(X), ω(Y )] = 0 Dunque [X, Y ] è orizzontale, e la distribuzione è involutiva. Viceversa, se vale questa condizione allora ω([X, Y ]) = 0, e quindi 0 = Ω(X, Y ) + [ω(X), ω(Y )] = Ω(X, Y ) B D’altra parte se uno tra X e Y è verticale vale Ω(X, Y ) = dω(X H , Y H ) = 0. Per bilinearità si conclude che Ω ≡ 0. Dal teorema di Frobenius, poi, segue che una connessione è piatta se e solo se induce una foliazione tangente alla distribuzione degli spazi orizzontali. Questa è la condizione cruciale che avrà importanti conseguenze sull’olonomia di ω. CAPITOLO 3. PIATTEZZA 3.4 52 Olonomia di una connessione piatta Sia F una foliazione orizzontale. Una prima proprietà di F è la seguente: poiché Rg∗ Hu = Hu g , H è invariante per traslazioni. Ne segue che anche F lo è. Sia V un aperto coordinato in P con una carta che soddisfa la definizione di foliazione. Al variare di g ∈ G gli insiemi Vg = V g definiscono un ricoprimento di π −1 (π(V )), ciascuno dei quali fornisce una carta che rispetta la foliazione, essendo questa invariante sotto l’azione destra. Queste carte permettono di dare un diffeomorfismo tra π(V ) × G e π −1 (π(V )) che manda la foliazione F nella partizione in insiemi del tipo π(V ) × { G }. Si ha dunque una banalizzazione locale di π tramite mappe che rispettano la struttura della foliazione. Ogni punto p ∈ M ammette un tale intorno banalizzante, e tutte queste trivializzazioni sono tra loro compatibili nel senso che la transizione dall’una all’altra manda le foglie di Ui × G in quelle di Uj × G. Ne segue che le mappe di transizione sono funzioni da Ui in G costanti. Fatte queste premesse, è possibile introdurre una nuova struttura differenziale su P , con una topologia diversa da quella originale, che corrisponde ad una discretizzazione del gruppo G. Sia dato un ricoprimento { Ui }i∈I di M con delle banalizzazioni φi come quelle descritte nel precedente paragrafo. A meno di restringere gli Ui è lecito assumere che si tratti di aperti connessi coordinati, e dunque diffeomorfi a sottoinsiemi Wi di Rn tramite ψi . La nuova topologia su P sarà quella indotta dalle carte ψi,g :φ(Ui × { g }) φ(p, g) - Wi - ψi (p) È facile vedere che queste mappe definiscono un atlante su P . Inoltre, le banalizzazioni per π possono essere viste in questa nuova struttura come delle mappe C ∞ rispetto a quella su Ui × G data dalla topologia discreta su G: in questo senso il procedimento ora svolto corrisponde ad una discretizzazione di G. Il fatto che le mappe di transizione siano costanti è una condizione necessaria e sufficiente affinché siano continue, e in questo caso sono differenziabili. Se u ∈ φ(Ui × { g }), la carta induce un isomorfismo canonico tra lo spazio tangente in u rispetto a questa nuova struttura e il sottospazio Hu del tangente in quella vecchia. Dunque π rimane differenziabile per costruzione, e questa osservazione permette di concludere che viene preservata anche la surgettività del differenziale, che ora diviene addirittura un isomorfismo. Si ha dunque una nuova struttura di fibrato di P su M , con la stessa proiezione. Infine, le foglie di F sono aperte in quanto per costruzione sono date da unioni di aperti coordinati, e connesse per archi. Infatti, se γ(t) è un arco in una foglia F , differenziabile rispetto alla struttura originale, le sue rappresentazioni in coordinate tramite le banalizzazioni locali danno curve lisce con seconda componente costante. Sono dunque C ∞ rispetto alla struttura di Ui × G con G discreto, e ricostruendo γ si ha la tesi, ricordando che inizialmente F era connesso e localmente diffeomorfo ad Rn , dunque connesso per archi. Le foglie sono quindi le componenti connesse di P rispetto alla nuova topologia. Sia ora p ∈ M , u ∈ π −1 (p), F la foglia passante per u. La mappa di proiezione può essere ristretta ad F , e poiché Tu F è isomorfo a Tp M tramite π∗ segue dal teorema della mappa inversa che esistono un intorno U di p in M ed CAPITOLO 3. PIATTEZZA 53 uno di u in P , indicato con U 0 , tali che π ristretta a U 0 ∩ F è un diffeomorfismo su U . A meno di restringere gli intorni si potrà supporre che ciascuno dei due sia connesso. Se ora u e è un altro punto di π −1 (p) ∩ F , l’azione destra dà un 0 diffeomorfismo tra U ∩ F e un opportuno aperto connesso contenente u e, sul quale π si restringe a sua volta ad un diffeomorfismo su U . Dunque per ogni g ∈ G per cui valga u g ∈ π −1 (p) le traslazioni di U 0 ∩ F danno aperti disgiunti e connessi su cui π si restringe ad un diffeomorfismo su U . Sotto queste ipotesi tali traslazioni sono tutte e sole le componenti connesse di π −1 (U ). Dunque ogni punto la cui fibra intersechi F ha un intorno banalizzante nel senso dei rivestimenti. D’altronde, sotto l’ipotesi che M sia connessa, dato un qualsiasi punto q ∈ M esiste un arco γ che lo connette a p. Se γ e è il suo sollevamento orizzontale con punto iniziale u, questo giace interamente su F : γ e(1) appartiene a π −1 (q) ∩ F . Se ne conclude che π, ristretto ad F , dà un rivestimento. Tutta la teoria riguardante questi oggetti può essere quindi richiamata a questo punto per lo studio dell’olonomia di ω 1 . Richiamo qualche risultato dalla teoria dei rivestimenti. Ogni cammino chiuso γ in M con punto base p può essere sollevato in modo unico a γ e a meno di scegliere il punto di partenza u. Naturalmente il secondo estremo di γ e appartiene alla fibra di p, ma non è detto che coincida con u: sotto l’ipotesi di connessione di F (in questo caso valida per definizione di foglia) dato comunque un punto u0 ∈ π −1 (p) esiste un arco in F che lo collega a u, e la sua proiezione darà un cammino chiuso il cui sollevamento termina in u0 . È però vero che i sollevamenti di due cammini omotopicamente equivalenti con punto base u coincidono anche nel secondo estremo, e sono a loro volta equivalenti: questo dà un’azione destra di π1 (M ) sulla fibra di p, detta di monodromia. Essa è transitiva, grazie all’osservazione fatta poco sopra. Se poi è dato un cammino chiuso e omotopicamente banale in F con punto base u, anche la sua proiezione lo sarà: questo dà un omomorfismo iniettivo ϕ : π1 (F ) → π1 (M ). L’azione di monodromia dà invece un omomorfismo surgettivo ψ : π1 (M ) → Φ(ω): se esiste un trasporto parallelo che porta u in u0 , allora questo giace su F , e di conseguenza u0 ∈ F . Se il trasporto è fatto su un cammino chiuso allora la proiezione dà un laccio in M , la cui classe di omotopia agisce su u mandandolo in u0 . Il nucleo di tale morfismo è dato dalla famiglia dei cammini in M il cui sollevamento è pure chiuso in F : si tratta dell’immagine di π1 (f ) tramite ϕ. Vale quindi l’esattezza della seguente successione: 0 - π1 (F ) ϕπ1 (M ) ψ- Φ(ω) - 0 Si può dunque concludere: Thm 3.4.1: quoziente Il gruppo di olonomia di una connessione piatta ω è isomorfo al π1 (M )/ϕ (π1 (F )) o più succintamente π1 (M )/π1 (F ) dove F è un qualsiasi elemento della foliazione indotta dalla distribuzione H. 1 Questi argomenti sono stati trattati nei corsi istituzionali nel caso C 0 , ma valgono anche in contesto differenziabile. CAPITOLO 3. PIATTEZZA 54 Il fatto che la costruzione fatta non dipenda dalla scelta specifica della foglia è di facile dimostrazione: basta ricordare che la foliazione è invariante per traslazione destra e che π = π ◦ Rg . Es 3.4.1: Sia ω una connessione sul toro come quella introdotta nell’esempio 2.3.1. Il campo che genera la distribuzione, come detto, è integrabile e dà delle curve sul toro definite su tutto R. Poiché S 1 ha dimensione 1 deve valere [ω(X), ω(Y )] = 0 per ogni X, Y . Dunque l’equazione di struttura dà Ω = dω. Essendo ω = φdt + g −1 dg, con φ costante, varrà dω = 0, e la connessione è piatta. Il gruppo di monodromia dipende fortemente da φ: si tratterà sempre di un gruppo ciclico, e sarà finito se e solo se il rapporto tra φ e 2π è razionale. Innanzi tutto, le curve integrali del campo non sono altro che i sollevamenti orizzontali di γ(t) = e2iπt su S 1 , che ne genera il gruppo fondamentale. Se una di queste curve si autointerseca allora è periodica: la sua velocità è infatti determinata dalla posizione, e per la parte di unicità del teorema di CauchyLipschitz due curve che in uno stesso punto abbiano la stessa velocità e risolvano lo stesso problema coincidono. I sollevamenti corrispondono alle curve su [0, 1]× S 1 date da t 7→ t, ei(θ+tφ) : l’azione di monodromia di nγ è quindi data da t, eiθ 7→ t, ei(θ+nφ) . Se il rapporto tra φ e 2π non è razionale, tale azione è libera, e pertanto il morfismo di Z in Φ(ω) è iniettivo. Essendo questo surgettivo per quanto argomentato sopra, si tratta di un isomorfismo: il gruppo di olonomia è quindi Z. Se invece φ e 2π sono in rapporto razionale, esiste un n ∈ Z positivo per cui la curva si richiude. Scegliendo n minimo si ottiene che il nucleo dell’azione è il sottogruppo nZ, e si ha Φ(ω) ' Z/nZ. Capitolo 4 Teorie di gauge Alla luce della teoria esposta finora è possibile costruire un modello della teoria dell’elettrodinamica in termini di connessioni su fibrati principali, come esempio di teoria di gauge. 4.1 Background fisico Quanto svolto di seguito vuole essere una giustificazione sintetica del formalismo usato nelle prossime sezioni; per ulteriori dettagli si vedano [2], [3] e [7]. Richiamo brevemente qualche elemento di relatività ristretta. In questa teoria l’usuale spazio R3 viene sostituito dallo spazio di Minkowski, cioè R4 con la metrica espressa da 1 0 0 0 0 −1 0 0 gij = 0 0 −1 0 0 0 0 −1 Le variabili spaziali sono espresse da xµ , con µ = 0, 1, 2, 3: x0 rappresenta il tempo moltiplicato per la costante c (la velocità della luce, talvolta posta a 1 tramite un’opportuna scelta delle unità di misura) mentre le altre coordinate sono quelle usuali. In questo modo, i cambiamenti di sistema di riferimento non sono elementi di SO3 , ma di quello che si chiama gruppo di Lorentz, formato dalle trasformazioni che preservano questo prodotto scalare. Naturalmente, qualsiasi prodotto scalare tra vettori in R4 tramite questa metrica è indipendente dalla scelta del sistema di riferimento. Dato che questo nuovo modello si basa su una geometria diversa da quella classica di R3 , è naturale aspettarsi che le vecchie grandezze vettoriali, come velocità e momento, non siano invarianti sotto le trasformazioni di Lorentz, e in definitiva non siano quantità fisicamente consistenti. Certamente non potranno essere più considerate come vettori, poiché il nuovo sistema è in dimensione quattro. A questo scopo vengono introdotti i cosiddetti “quadrivettori”, il cui primo esempio è quello di posizione, ottenuto da quello classico per l’aggiunta di una componente ct. Sia data una curva nello spazio di Minkowski: essa rappresenterà il moto di un oggetto rispetto a un dato sistema di riferimento. Come curva parame55 CAPITOLO 4. TEORIE DI GAUGE 56 trizzata essa ammetterà un vettore “velocità” intesa come la derivata rispetto al parametro; questo non potrà essere identificato con il tempo, poiché secondo il modello in uso esso dipende dal sistema di riferimento, e dunque le derivate rispetto a questo non rappresenteranno dei vettori ben definiti. A questo scopo occorre utilizzare una variabile intrinseca, cioè indipendente dalla scelta del sistema di riferimento, e un buon candidato può essere: 1p 2 2 1p µ x gµµ xµ = c t − x2 τ= c c Paramentrizzando la curva rispetto alla variabile τ , detta tempo proprio, e derivando, si ottiene quello che si usa chiamare quadrivettore velocità, le cui componenti spaziali sono γv i , e quella temporale è γc, dove γ=r 1 v2 c2 In generale, la derivata rispetto al tempo proprio è uguale a quella rispetto a t moltiplicata per γ. In maniera simile vengono definiti degli altri quadrivettori, le cui componenti spaziali sono proporzionali a grandezze vettoriali della meccanica classica, mentre quella temporale è un’opportuna quantità che nel vecchio modello rappresentava uno scalare. Ad esempio: 1− • il quadrivettore impulso P è definito come la velocità moltiplicata per la massa. Le componenti spaziali sono quelle del momento classico moltiplicate per γ, quella temporale è E/c (E essendo l’energia); • il quadrivettore forza è la derivata rispetto a τ dell’impulso; • il quadrivettore densità di corrente ha componenti γρc e γJµ ; • il potenziale vettore è ottenuto accostando a quello classico il campo φ. Il campo elettromagnetico viene espresso in questo formalismo da un unico tensore a due indici F ij , in modo che la forza di Lorentz possa essere descritta semplicemente facendolo agire sul quadrivettore sorgente: dpi = Jj F ij dτ Imponendo questo e scegliendo un sistema di misura in cui c = 1 si ottiene: 0 −Ex −Ey −Ez Ex 0 Bz −By F ij = Ey −Bz 0 Bx Ez By −Bx 0 In termini del potenziale vettore si ha F = dA come forma differenziale, cioè Fij = ∂i Aj − ∂j Ai . Anche in questo nuovo modello è possibile descrivere la dinamica tramite un principio di azione stazionaria, e di conseguenza tramite le equazioni di EuleroLagrange che sono equivalenti ad essa. Per la particella libera, ad esempio, si scrive l’azione come Z Z mc2 2 dt S = − mc dτ = − γ CAPITOLO 4. TEORIE DI GAUGE 57 che è stazionaria quando la lunghezza della traiettoria è minima rispetto alla metrica di Minkowski. La lagrangiana sarà quindi L = −mc2 /γ, e si può verificare che la variabile coniugata a q µ è pµ , e le equazioni di Hamilton in questo caso hanno la stessa forma che nel caso classico. È evidente a questo punto che non sempre ha senso sommare due grandezze che classicamente sono scalari: bisogna prima assicurarsi che lo rimangano relativisticamente. Ad esempio, se E è l’energia di una particella e V è un potenziale, essendo la prima una componente di un quadrivettore la somma delle due non sarà uno scalare, poiché cambiando il sistema di riferimento la nuova E sarà data da termini che coinvolgono le componenti di p. Nel caso in cui il potenziale è quello scalare di un campo elettromagnetico, invece, dal momento che questo è la coordinata temporale del potenziale vettore avrà senso sommarlo all’energia, a condizione che anche al momento venga aggiunto il potenziale vettore: l’oggetto ottenuto sarà un ben definito quadrivettore. 4.1.1 Equazioni di Hamilton e di Schrödinger Sia H l’hamiltoniana di una particella carica in un sistema in cui non siano presenti campi elettromagnetici: classicamente, se questa non dipende dal tempo rappresenta l’energia della particella. Si introduca ora un quadrivettore (covariante) potenziale elettromagnetico A = φdt + Aµ dxµ , e si considerino le nuove coordinate momento definite da p∗µ = pµ + Aµ (t, q) Allora è possibile descrivere la dinamica del nuovo sistema tramite queste coordinate e l’hamiltoniana H ∗ (q, p∗ , t) = H(q, p∗ − eA, t) − eφ(t, q) e le equazioni sono le solite, usando le nuove variabili al posto delle vecchie. Poiché si potrà avere una dipendenza di H dal tempo, si aggiunge un’equazione: ∗ ∂H ∗ dp =− dt ∂q dq ∂H ∗ = dt ∂p∗ ∗ ∗ dH = ∂H dt ∂t Dunque le equazioni della fisica sono in definitiva quelle classiche, purché la variabili in uso vengano opportunamente modificate. Per la dimostrazione rimando a [2]. Una cosa simile avviene in meccanica quantistica. In questo contesto, le grandezze misurabili, dette “osservabili”, sono rappresentate da operatori autoaggiunti che agiscono su uno spazio di Hilbert complesso i cui elementi sono i possibili stati del sistema, indicati con |ψi. Si postula che i possibili esiti di un’operazione di misura siano gli autovalori dell’operatore, e gli autovettori associati rappresentino stati in cui l’osservabile assuma il valore assegnato (gli autostati del sistema). Uno stato generico sarà combinazione lineare di autostati o, quando questi siano in numero infinito, sarà rappresentato da una CAPITOLO 4. TEORIE DI GAUGE 58 distribuzione. Quando viene misurata un’osservabile si dice che lo stato collassa nell’autostato corrispondente al valore ottenuto. Si consideri per semplicità l’operatore corrispondente alla misura della posizione di una particella che si muove su R. Per quanto detto, il risultato della misura dà un autovalore x per l’operatore, corrispondente all’autostato che si indica con |xi. In questo modo si ha una corrispondenza tra i punti della retta, indicati con x, e gli elementi |xi della base spettrale dell’osservabile. Ad ogni stato |ψi viene associata la “funzione d’onda” ψ(x), il cui valore è dato dal prodotto scalare hx|ψi tra lo stato stesso e l’autostato corrispondente alla posizione x. Tale funzione rappresenta le coordinate dello stato, come vettore, rispetto alla base formata dagli autostati dell’operatore posizione in R. Aggiungendo l’ipotesi che se due vettori sono multipli l’uno dell’altro tramite uno scalare complesso non nullo allora esprimono lo stesso stato, si può assumere che R|ψi sia unitario. In questo caso, dato che la norma quadra di |ψi è data 2 da R |ψ(x)| dx, l’integrando è una distribuzione di probabilità che viene interpretata come quella che lo stato, una volta che sia misurata la posizione, collassi nell’autostato associato a x. Il caso di particelle a più gradi di libertà può essere affrontato in maniera simile, prestando attenzione alle complicazioni tecniche, ottenendo nuovamente una distribuzione di probabilità sullo spazio in cui si muove la particella. Data l’hamiltoniana H, l’evoluzione temporale della funzione d’onda è descritta dall’equazione di Schrödinger: i~ ∂ψ = Hψ ∂t Per presentare un semplice esempio, sia H(x, p) = p2 + V (x) 2m In coordinate cartesiane si assume che p agisca come una derivata: pµ = −i~ ∂ ∂xµ metre V agisce semplicemente per prodotto. Allora l’equazione di Schrödinger diviene: 2 X 2 ∂ψ ~ ∂ ψ +Vψ i~ =− µ 2 ∂t 2m µ (∂x ) Considero ora la dinamica di una particella carica in presenza di campi elettromagnetici rappresentati da un potenziale vettore. Per analogia con il caso relativistico classico (cioè non quantistico) riscrivo l’equazione sostituendo al momento p e all’hamiltoniana H che si avrebbero in assenza di campi quelli ottenuti sommando i contributi dovuti ad A. Si ha dunque: i~ ∂ − ∂t ie ~ 2 X 2 ~ ∂ ie φ ψ=− Aµ ψ + V ψ − µ 2m ∂x ~ µ Il potenziale vettore non è determinato dai campi: la fisica del sistema rimane invariata se ad Aµ si somma ∂µ χ, dove ∂µ = ∂/∂xµ e χ è una qualsiasi funzione CAPITOLO 4. TEORIE DI GAUGE 59 scalare definita su R4 , cioè se si applica quella che si chiama una trasformazione di gauge. Ci si può chiedere allora come cambia la soluzione dell’equazione di Schrödinger a seguito di questa trasformazione. Se ψ risolve l’equazione per il potenziale A, allora ie χ ψ exp ~ la risolve per A + dχ. 4.2 L’elettrodinamica come teoria di gauge La fisica di un sistema elettrondinamico è quindi invariante sotto trasformazioni del tipo Aµ 7→ Aµ + ∂µ χ purché anche la ψ venga modificata secondo ie ψ 7→ exp ψ ~ Delle trasformazioni simili erano già state incontrate nel contesto delle connessioni su fibrati principali. Se tij è la mappa di transizione tra due banalizzazioni locali φi e φj , le forme di connessione locali trasformano come Aj = Adt−1 ◦Ai + t−1 ij dtij ij t−1 ij dtij dove ricordo che la scrittura sta a rappresentare il campo vettoriale invariante su G che in tij assume il valore dato da dtij . Se il gruppo è abeliano l’azione di Adt−1 è banale e scompare. Se poi il fibrato è associato ad uno ij vettoriale, la derivata covariante è rappresentata semplicemente da ∂µ + Aj µ = ∂µ + Ai µ + ∂tij ∂xµ Questo suggerisce di descrivere l’elettrodinamica secondo il modello che segue. La funzione d’onda ψ può essere considerata come una sezione di un fibrato vettoriale complesso di dimensione 1, la cui struttura andrà specificata in seguito 1 . La trasformazione di ψ quando si cambia il potenziale è un prodotto per un numero complesso unitario: si potrà quindi pensare che una scelta della gauge corrisponda a un cambiamento della banalizzazione locale del fibrato tramite la mappa di transizione data dall’elemento di U (1) rappresentato da exp(ieχ/~). Si chiederà dunque che il gruppo di struttura del fibrato sia proprio U (1), che è abeliano. Se si indica con A la quantità complessa iA si ottiene una 1-forma di connessione locale: essendo il potenziale un vettore covariante reale, moltiplicarlo per l’unità immaginaria fornirà in effetti una forma differenziale a valori in iR, l’algebra di Lie di U1 . La trasformazione Aµ 7→ Aµ + i∂µ χ mostra che A rappresenta in effetti una connessione sul fibrato principale associato a quello di cui ψ è una sezione. Segue che l’operatore e e Aµ = ∂µ + i − Aµ ∂µ + − ~ ~ 1 Se si immagina di lavorare su tutto R4 , senza singolarità nei campi, il fibrato è necessariamente banale, per via di un teorema di omotopia che garantisce l’esistenza di un unico fibrato su uno spazio retraibile una volta che sia fissata la fibra. CAPITOLO 4. TEORIE DI GAUGE 60 è una derivata covariante a tutti gli effetti. L’equazione di Schrödinger può quindi essere riscritta in termini di connessioni come i~D0 ψ = − ~2 2m X 3 Dµ2 ψ + V ψ µ=1 dove Dµ rappresenta la derivata covariante rispetto alla variabile xµ . Questa scrittura è formalmente identica a quella originale senza potenziale vettore: come il principio di inerzia conserva la sua forma nel caso di varietà generiche a condizione di sostituire la derivata covariante con quella indotta dalla connessione di Levi-Civita, così anche l’equazione di Scrödinger viene modificata soltanto indtroducendo la differenziazione covariante data dai potenziali. In quest’ottica, segue immediatamente dall’equazione di struttura di Cartan che il tensore dei campi F µν è proporzionale alla forma locale di curvatura: F = dA = idA = iF La connessione rappresentata dai potenziali è piatta se e solo se i campi si annullano identicamente. Applicando l’identità di Bianchi si ottiene: 0 = (dF )µνλ = ∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ Sostituendo opportunamente gli indici questo dà le due equazioni di Maxwell omogenee, che sono quindi legate alla struttura geometrica del modello. L’informazione fisica sarà data dalle altre due equazioni, che possono essere ottenute tramite quelle di Eulero-Lagrange, o equivalentemente dal principio di azione stazionaria, legato alla fisica più che alla geometria del modello. Per studiare gli effetti elettromagnetici si propone quindi un nuovo modello geometrico, che consiste nel considerare, anziché lo spazio di Minkowski, un fibrato su di esso con fibra C, e nel definire un’opportuna connessione sul suo principale associato. In questo modo, la scelta della gauge corrisponde a una banalizzazione locale del fibrato, mentre la funzione d’onda ψ di uno stato si riduce ad una sezione del fibrato vettoriale (o ad una sua rappresentazione locale), e il potenziale vettore è una 1-forma locale di connessione. Il tensore dei campi, che sembra quasi passare in secondo piano (e in effetti avrà rilevanza secondaria per questa teoria), rappresenta la forma locale della curvatura: la sua rappresentazione non dipende dalla scelta della gauge, e al variare delle coordinate trasforma come un tensore. Incidentalmente, questo è in accordo con il fatto che classicamente l’arbitrarietà sta solo nella scelta del potenziale, che deve comunque essere tale da non cambiare i campi. Per questa ragione in passato si è ritenuto che fossero questi a portare l’informazione fisica rilevante, mentre il potenziale non era visto che come un mero artificio matematico utile per semplificare le equazioni. Quando lo spazio base è R4 il fibrato è banale. In questo caso particolare è possibile una scelta globale della gauge, e tanto la funzione d’onda quanto il potenziale sono definiti su tutto lo spazio. Ci possono però essere delle situazioni (come quella del monopolo magnetico, afforntata poco più avanti) in cui questo non è possibile, e si rende necessario sfruttare appieno la struttra di fibrato dando delle trivializzazioni locali che consentano di definire vari potenziali locali, che trasformeranno secondo le regole note imposte dalle mappe di transizione. CAPITOLO 4. TEORIE DI GAUGE 4.3 61 Il monopolo di Dirac La teoria dell’elettromagnetismo, pur non prevedendo l’esistenza di un monopolo magnetico, non la nega nemmeno; in altre parole non è in disaccordo con la possibilità che sperimentalmente possa essere trovata della “carica magnetica”. Dirac si pose il problema di descrivere il comportamento di un simile oggetto qualora esistesse. Si consideri una carica magnetica g localizzata nell’origine del sistema di riferimento, in condizioni statiche. Le equazioni di Maxwell (espresse in cgs) per questo sistema sono: ∇ · E(t, r) = 0 ∇ · B(t, r) = 4πgδ(r) ∇ × E(t, r) = 0 ∇ × B(t, r) = 0 Le equazioni sono disaccoppiate, e quelle per il campo magentico sono formalmente identiche a quelle dell’elettrostatica. Il campo magnetico fuori dall’origine sarà quindi: g B(t, r) = 3 r r Va osservato che ha senso studiare solo la regione esterna all’origine, e questo non solo perché il campo non è definito in quel punto, ma anche per una ragione teorica. Il modello introdotto sopra mostrava che le equazioni di Maxwell omogenee discendono naturalmente dall’identità di Bianchi, e sono pertanto legate alla struttura geometrica dell’ambiente. Se la fisica di una certa regione può essere descritta tramite un potenziale vettore allora la distribuzione di carica magnetica in tale spazio deve annullarsi. In altre parole, il modello introdotto può descrivere i fenomeni dovuti alla presenza di monopolo magnetico, ma solo fuori dalla regione in cui questo è concentrato. Nell’ipotesi che il sistema sia statico (rispetto ad un particolare riferimento) la componente temporale è trascurabile, e ha senso restringere lo spazio a R3 . Occorre inoltre rimuovere l’origine: ha quindi senso scegliere la sfera S 2 come ambiente in cui studiare i fenomeni dovuti alla presenza del monopolo. Il tutto sarà quindi espresso in termini di un fibrato su S 2 con fibra C e del suo principale associato, la cui struttura andrà stabilita in seguito. Dato che la sfera privata di un qualsiasi punto è diffeomorfa al piano e in particolare è retraibile, sui due aperti ottenuti rimuovendo rispettivamente i due poli Nord e Sud (cioè ±ẑ) è possibile trovare delle banalizzazioni del fibrato, e dunque dei potenziali estesi a tutta la regione. Non sarà invece possibile trovarne uno definito sull’intera sfera, poiché altrimenti per il teorema di Gauss si avrebbe: Z Z Z 4πg = B · n̂ ds = ∇ × A · n̂ ds = A · dl = 0 S2 S2 ∂S 2 I due potenziali AN = g −ydx + xdy r(r + z) AS = g ydx − xdy r(r − z) sono definiti rispettivamente sulle calotte Nord e Sud, e il loro rotore è effettivamente il campo magnetico B sul dominio di ciascuno. Fuori dall’asse z è ben CAPITOLO 4. TEORIE DI GAUGE 62 definita la differenza tra queste due forme: ciò permetterà di costruire la mappa di transizione da un aperto banalizzante all’altro. AN − AS = g −2ydx + 2xdy r (r2 − z 2 ) e passando a coordinate sferiche si ha AN − AS = 2g dφ = ∇(2gφ) r sin θ La trasformazione è quindi data dal potenziale di gauge χ = 2gφ. Da qui si può riottenere il risultato del teorema di Gauss da cui si era partiti: Z Z Z B · n̂ ds = B · n̂ ds + B · n̂ ds = S2 S 2 ∩{ z≥0 } S 2 ∩{ z≤0 } Z Z = ∇ × AN · n̂ ds + ∇ × AS · n̂ ds = UN 2π US Z = (AN − AS ) dφ = 4πg 0 Si supponga ora che nella regione perturbata dalla presenza del monopolo magnetico venga introdotta una carica elettrica di prova sufficientemente piccola da non modificare apprezzabilmente i campi. Questo è teoricamente possibile a prescindere dall’ipotesi che non esista una carica elettrica non nulla di modulo arbitrariamente piccolo, poiché in questa eventualità basta sovrapporre più monopoli magnetici in modo da soddisfare la condizione. Se q è il valore di questa carica, l’equazione di Schrödinger per questo sistema, diviene i~ ∂ψN =− ∂t ~2 2m X µ ∂ − ∂xµ iq ~ 2 (AN )µ ψN per la calotta Nord, e analogamente per quella Sud. La regola che trasforma ψN in ψS è data dunque da q 2qg φ ψS ψN = exp i χ ψS = exp i ~ ~ Da qui si ricava la funzione di transizione 2qg φ tSN = exp i ~ Se il modello è buono, tSN rappresenta una ben definita funzione di φ, e in quanto tale dev’essere 2π-periodica. Questo equivale alla condizione di quantizzazione: 2qg ∈Z ~ Ecco dunque una prima previsione ricavata da questa teoria: cariche elettrica e magnetica sono quantizzate. Infatti, fissando il valore di q si ottiene una condizione su g che le impone di avere un valore multiplo intero di una data costante, e dunque esiste una carica fondamentale g0 per cui il valore di qualsiasi CAPITOLO 4. TEORIE DI GAUGE 63 monopolo magnetico sia g = kg0 per qualche k ∈ Z. In modo del tutto analogo si ricava la quantizzazione della carica elettrica. Questo risultato è del tutto indipendente da quello mostrato da Millikan in laboratorio, e anzi non dà alcuna previsione sul valore di queste cariche fondamentali. Ciò che si può concludere è che, se la teoria di gauge per l’elettrodinamica è un buon modello, e se esiste nell’universo un monopolo magnetico, allora le cariche elettrica e magnetica sono quantizzate. 4.4 L’effetto Aharonov-Bohm Non è mai stata provata fino ad oggi l’esistenza di alcuna carica magnetica. I risultati della sezione precedente potrebbero essere visti come fini a se stessi, senza significato fisico in quanto basati solo su ipotesi sperimentalmente prive di fondamento. In definitiva, quell’esempio non giustifica fino in fondo l’introduzione della teoria di gauge elettrodinamica, o per lo meno non la rende davvero necessaria. Quello che viene presentato di seguito, invece, è un risultato che ha trovato un riscontro sperimentale, e può quindi essere più convincente. Uno dei primi risultati sperimentali nell’ambito della meccanica quantistica fu quello messo in luce dalla cosiddetta “esperienza della doppia fenditura”. Agli inizi del XIX secolo Young aveva fatto passare della luce attraverso due fenditure verticali su una parete, rilevando su uno schermo una figura di interferenza ed evidenziando così il comportamento ondulatorio dei fotoni (benché allora non si usasse questo linguaggio). Analogamente, questo nuovo esperimento consiste nello sparare attraverso una doppia fenditura un fascio di elettroni, ottenendo anche in questo caso un fenomeno di interferenza. Classicamente questo fenomeno non ha senso: se l’elettrone è una particella massiva è naturale aspettarsi che la distribuzione rilevata sullo schermo sia concentrata in due punti corrispondenti alle fenditure. Secondo la meccanica quantistica, invece, questo ha perfettamente senso. Se si suppone che un certo elettrone abbia superato il piano su cui sono incise le fenditure, senza però sapere da quale delle due sia passato, il suo stato potrà essere scritto come combinazione lineare dei due fondamentali |ψ1 i e |ψ2 i, ciascuno dei quali rappresenta il caso in cui la particella abbia attraversato una delle due fessure. Tali stati, essendo autovettori per l’operatore hermitiano che rappresenta l’osservazione della fenditura da cui è passato l’elettrone, sono ortogonali. Se si suppone che le situazioni siano equiprobabili, allora: √ 2 (|ψ1 i + |ψ2 i) |ψi = 2 √ dove la costante 2/2 serve da normalizzazione. Sulla base dei principdio di Huygens, ciascuno dei due stati fondamentali può essere descritto come quello di una sorgente, posta nella relativa fenditura, che emette elettroni in maniera isotropa. Le due funzioni d’onda sono ottenute l’una dall’altra tramite uno shift del dominio, e la fase relativa tra di esse fa sì che sommandole si abbia l’effetto di interferenza rilevato sperimentamente. Inserendo dietro le fenditure, in una zona in cui gli elettroni non possano entrare, un solenoide molto lungo attraversato da corrente, si ottiene un fenomeno molto curioso, che porta il nome di “effetto Aharonov-Bohm”. Benché la teoria classica non preveda alcuna variazione rispetto al caso precedente (nella regione CAPITOLO 4. TEORIE DI GAUGE 64 esterna al solenoide il campo elettromagnetico è trascurabile), sperimentalmente si osserva uno shift della figura di interferenza proporzionale al flusso Φ del campo magnetico nel solenoide, misurato considerando positivo il verso dell’asse z verso l’alto. Fenditura 2 γ2 P Solenoide Sorgente γ1 Fenditura 1 La trattazione fisica può essere svolta nel modo che segue. Le due funzioni d’onda ψ1 (x) e ψ2 (x) corrispondenti ai due autostati dell’operaore che misura da quale fenditura sia passato l’elettrone sono identiche nella sorgente. Si ipotizza che l’emissione di particelle sia isotropa e abbia propagazione sferica; sotto la condizione che la distanza tra le fessure sia trascurabile rispetto alle lunghezze caratteristiche dell’apparato sperimentale (distanza sorgente-fenditure e fenditure-schermo) si può approssimare il comportamento nei punti di interesse, in condizioni di particella libero, come quello di un’onda piana. Scelgo un sistema di riferimento in cui il piano delle fenditure corrisponde a x = 0, e i punti in cui queste si trovano siano individuati dai vettori r1 ed r2 , mentre la sorgente è posta in rS . Lo scopo della trattazione è studiare cosa avviene in un punto P sullo schermo, individuato da rP . Per prima cosa occorre valutare le due funzioni d’onda in r1 ed r2 rispetto ad una particolare scelta di gauge. Per ora è comodo usarne una in cui il potenziale vettore è identicamente nullo nel semipiano delimitato dalle fenditure e contenente la sorgente. In questo modo vale ψj (ri ) = ψj (rS ) eik·(rj −rS ) dove il vettore k è una costante che caratterizza la propagazione degli elettroni, mentre i è l’unità immaginaria e j è un indice che varia tra 1 e 2 (cioè identifica lo stato che si sta considerando). Fin qui non vi è stata nessuna influenza da parte del solenoide. Si suppongano note le funzioni d’onda nei punti corrispondenti alle fenditure per una differente scelta di gauge, quella cioè in cui il potenziale si annulla identicamente nell’altro semipiano. Qui si sta ipotizzando che il solenoide sia sufficientemente sottile da renderne trascurabile la sezione. Allora i valori delle funzioni in P sono ottenuti nuovamente in maniera analoga al caso senza solenoide, e cioè moltiplicando per il termine di fase eik·(rP −rj ) . Anche qui non c’è alcun contributo dalla presenza del solenoide. Questo però diviene importante CAPITOLO 4. TEORIE DI GAUGE 65 quando si cambia la gauge: passando dalla prima alla seconda ogni funzione d’onda viene sfasata di un termine che dipende dal potenziale di gauge χ, che può essere espresso come integrale di linea della differenza tra i potenziali. In questo modo la ψj (rj ), rispetto alla seconda gauge, diviene: Z rj ie A · dl ψj (rS ) eik·(rj −rS ) exp ~ rS In definitiva, le funzioni d’onda in P sono le stesse del caso senza solenoide, a meno di una fase determinata dal potenziale. Questo può essere rilevante se la fase relativa tra le due viene modificata. La variazione di tale fase rispetto al caso senza solenoide è data da Z Z ie ie exp A · dl + A · dl ~ −γ1 ~ γ2 Il percorso −γ1 + γ2 può essere chiuso con un qualsiasi arco γ3 nella regione in cui il potenziale è nullo, senza dare alcun contributo. La fase cercata diviene dunque Z e ie A · dl = exp −i Φ exp ~ γ2 +γ3 −γ1 ~ Segue che la figura d’interferenza risulta shiftata di una lunghezza proporzionale al flusso del campo magnetico attraverso una spira del solenoide. Il fenomeno può essere descritto geometricamente nel modo che segue. La regione di interesse è quella esterna al solenoide, e ha la stesso tipo di omotopia di una circonferenza, perciò il fibrato da introdurre avrà spazio base S 1 (e fibra C, come sempre). I due stati fondamentali |ψ1 i e |ψ2 i corrispondono ad archi di circonferenza γ1 e γ2 che connettono un punto S, che rappresenta la sorgente, a P , posto sullo schermo, in cui si vogliono valutare le nuove funzioni d’onda. Suppongo che la fenditura corrispondente al percorso γ1 sia posta in y = −d, l’altra, invece, in y = d, con d > 0, in modo che γ1 − γ2 dia la circonferenza percorsa in verso antiorario partendo dalla sorgente. Queste sono ottenute dalle vecchie (|ψ1 iV e |ψ2 iV ) moltiplicandole per una fase eiφ(x) , cioè una sezione del fibrato principale associato a quello in uso, con la condizione che questa sia trasportata parallelamente lungo gli archi. Questo giustifica la restrizione dello spazio ad un suo retratto per deformazione: dato che la curvatura della connessione è rappresentata dai campi, che in questo caso sono nulli nella regione di interesse, il trasporto parallelo lungo una curva non dipende che dalla sua classe di omotopia. Per questo sistema è possibile scegliere un potenziale globale: le condizioni che questo deve soddisfare sono che il suo rotore sia nullo, e che il suo integrale lungo la circonferenza, percorsa in senso antiorario, dia iΦ 2 . La forma −ydx + xdy A = iΦ 2πr2 soddisfa tali richieste. L’equazione del trasporto parallelo lungo la curva γ(s) sarà d exp (iφ(γ(s))) e exp (−iφ(γ(s))) − Aγ̇(s) = 0 ds ~ 2 Il flusso deve essere uguale all’integrale di linea del potenziale A = −iA. Moltiplicando per i si ha la relazione data. CAPITOLO 4. TEORIE DI GAUGE 66 da cui si ricava che, se lo sfasamento tra |ψiV e |ψi in γ(0) è φ0 , allora in γ(1) vale Z e iφ0 + Ads ~ γ Se si applica quanto detto supponendo nota la fase relativa tra ψ1 vecchia e nuova in P , allora quella in S sarà Z Z e e Ads = iφ0 − Ads iφ0 + ~ −γ1 ~ γ1 Poiché per ipotesi ψ1 (S) = ψ2 (S), la fase relativa di |ψ2 i rispetto al valore vecchio è data da Z Z Z e e e e iφ0 − Ads + Ads = iφ0 + Ads = iφ − i Φ ~ γ1 ~ γ2 ~ γ2 −γ1 ~ Dunque la fase relativa tra i due stati fondamentali di questo sistema è quella del caso senza solenoide con un contributo aggiuntivo pari a −ieΦ/~. Se Φ è un multiplo intero di h/e, allora sullo schermo non si rileva alcuna differenza rispetto al caso precedente, poiché il nuovo contributo non influisce sull’esponenziale. Se però questo non vale, la figura di interferenza deve cambiare, e in effetti l’evidenza sperimentale ha mostrato che questo è realmente ciò che avviene. Questo è un esempio in cui si manifesta la rilevanza fisica del potenziale vettore, che classicamente non aveva altro significato che quello di un semplice strumento matematico per manipolare le equazioni che determinano i campi, veri protagonisti della teoria di Maxwell. Nella meccanica quantistica questi devono invece passare in secondo piano poiché non sono in grado di descrivere fino in fondo la fisica di fenomeni come quello appena analizzato, in cui la presenza di potenziali non banali è in grado di influenzare un sistema nonostante i campi siano identicamente nulli nella regione di interesse. Se da un punto fisico questo può sorprendere (e in effetti questo risultato fu accolto con stupore dalla comunità scientifica), matematicamente non presenta alcuna novità. Si tratta semplicemente di un caso in cui una connessione, seppur piatta, presenta olonomia non banale, ossia non tutti i cammini che si richiudano nello spazio base fanno lo stesso una volta sollevati orizzontalmente. Se si considera una regione sufficientemente piccola allora i trasporti paralleli sono tutti non banali, ma appena entra in gioco una curva non retraibile questo non è più vero, e l’effetto Aharonov-Bohm rappresenta un esempio fisico di questo fenomeno. 4.5 Continua... La formulazione presentata ora dell’elettrodinamica non è che un esempio particolare di teoria di gauge. Più in generale, si possono presentare situazioni fisiche in cui il sistema in analisi abbia dei gradi di libertà teorici in più rispetto a quelli effettivamente osservabili. Nel caso trattato finora, questa variabile “in eccesso” è il potenziale di gauge χ, che nella soluzione delle equazioni si manifesta chiaramente, ma che fisicamente non rappresenta nulla di evidentemente concreto. I gradi di libertà in più vengono parametrizzati punto per punto da un opportuno gruppo di Lie G, formato dalle trasformazioni che lasciano invariato il resto del CAPITOLO 4. TEORIE DI GAUGE 67 sistema; scelto il gruppo viene definito un G-fibrato principaleP sulla varietà M che rappresenta l’ambiente in cui si svolgono i fenomeni in analisi. Nel caso presentato sopra, la variabile aggiuntiva era il potenziale di gauge χ, che varia su R, sostituito poi da iR (un’algebra di Lie) e infine da U(1). Vengono poi introdotte delle 1-forme locali Ai a valori in g, con le regole di trasformazione che permettano di definire una connessione su P . Da queste nascono immediatamente le 2-forme Fi che rappresentano la curvatura, legate ad Ai dall’equazione di struttura di Cartan Fi = dAi + Ai ∧ Ai (4.1) Il secondo termine della parte destra dell’equazione sparisce se G, detto gruppo di gauge, è abeliano, ma in generale è rilevante. Riscritta per componenti, la (4.1) diviene (omettendo l’indice i): Fµν = ∂µ Aν − ∂ν Aµ + [Aµ , Aν ] Questa differisce dall’equazione che definisce il tensore campo elettromagnetico per la presenza del termine [Aµ , Aν ], che in effetti è stato trascurato osservando esplicitamente che questo è legittimo essendo U(1) commutativo. Si ha poi l’identità di Bianchi: dFi + [Ai , Fi ] = 0 Tutte queste relazioni, ricavate in precedenza in modo puramente matematico, assumono significati fisici ben precisi, esattamente come nel caso dell’elettrodinamica l’identità di Bianchi rappresenta le due equazioni di Maxwell omogenee. Un celebre esempio di teoria di gauge non abeliana è quella di Yang-Mills, in cui il gruppo di struttura considerato è U(2). Bibliografia [1] Tohru Eguchi, Peter B. Gilkey, e Andrew J. Hanson. Gravitation, gauge theories and differential geometry. North Holland publishing company, 1980. [2] Theodore Frankel. The geometry of physics. Cambridge University Press, 2004. [3] Herbert Goldstein, Charles Poole, e John Safko. Classical mechanics (third edition). Addison Wesley, 2002. [4] Noel Jeffrey Hicks. Notes on differential geometry. Van Nostrand Company, 1965. [5] David Lovelock e Hanno Rund. Tensors, differential forms, and variational principles. Dover Publications, Inc., New York, 1975. [6] Marco Manetti. Topologia. Springer, 2008. [7] David Morin. Introduction to classical mechanics, 2004. [8] Shigeyuki Morita. Geometry of characteristic classes. American Mathematical Society, 2001. [9] Mikio Nakahara. Geometry, topology and physics. Taylor and Francis Group, 2003. [10] Clifford Henry Taubes. Differential Geometry. Oxford Graduate Texts in Mathematics, 2011. 68