L`Ultimo Teorema di Fermat - Dipartimento di Matematica

Transcript

L`Ultimo Teorema di Fermat - Dipartimento di Matematica
L’Ultimo Teorema di Fermat
Massimo Bertolini
10 dicembre 2007
1
Introduzione
Le vicende che hanno portato alla soluzione dell’Ultimo Teorema di Fermat si sono sviluppate lungo un arco temporale di oltre tre secoli e rappresentano un’avventura intellettuale straordinaria. La storia ha inizio intorno al 1630, quando il matematico francese Pierre de Fermat lascia la
seguente annotazione, a margine di una traduzione latina dell’Arithmetica
di Diofanto:
Cubum autem in duos cubos, aut quadrato quadratum in duos quadrato
quadratos, et generaliter nullam in infinitum ultra quadratum potestatem in
duos ejusdem nominis fas est dividere: cujus rei demonstrationem mirabilem
sane detexi. Hanc marginis exiguitas non caperet.
Rappresentare un cubo come somma di due cubi significa, in termini
matematici, risolvere l’equazione X 3 + Y 3 = Z 3 . Più in generale, Fermat
considera il problema di rappresentare una potenza n-esima come somma
di due potenze n-esime, ossia considera tutte le equazioni della forma
X n + Y n = Z n,
(1)
dove l’esponente n è un intero positivo maggiore di 2 (cioè appartenente
all’insieme infinito di interi 3, 4, 5, 6, . . .). Egli afferma, detto in linguaggio
matematico moderno, che l’equazione (1) non ha soluzioni (X, Y, Z) negli
interi relativi diversi da zero (ovvero i numeri ±1, ±2, ±3, ±4, . . .), per tutti
gli esponenti interi n > 2. La condizione XY Z 6= 0 assicura che la potenza
n-esima non nulla Z n venga realmente divisa nella somma di due potenze
n-esime. L’ipotesi n > 2 è necessaria per la validità dell’enunciato: se
n = 2, l’equazione X 2 + Y 2 = Z 2 (che esprime la relazione pitagorica tra le
1
lunghezze dei cateti e dell’ipotenusa di un triangolo rettangolo) ha soluzioni
intere, per esempio la terna (3, 4, 5).
Per completare la dimostrazione dell’enunciato di Fermat, noto come
Ultimo Teorema di Fermat (UTF), sono serviti 350 anni di ricerche. E’ stato molto dibattuto se Fermat avesse realmente trovato una “dimostrazione
mirabile, ma troppo lunga per poter essere contenuta nel margine di una
pagina dell’Arithmetica”. Ormai, restano pochi dubbi in proposito: si ritiene che Fermat fosse erroneamente convinto che la sua dimostrazione nel
caso n = 4, certamente corretta e basata sul metodo della discesa infinita,
potesse essere estesa ad un qualunque esponente n; il fatto che gli altri suoi
lavori ignorino il caso generale dell’UTF e si concentrino sui casi n = 3, 4,
sembra confermare questa supposizione. L’UTF, dunque, ai tempi di Fermat
non era realmente un teorema; si trattava invece di un’enunciato ritenuto
vero ma non dimostrato, cioè di una congettura. La prima dimostrazione
completa dell’UTF è stata pubblicata nel 1995; si ottiene combinando un
lavoro di Andrew Wiles [W] con un lavoro in collaborazione tra Richard Taylor e lo stesso Wiles [T-W]. La dimostrazione ha richiesto l’utilizzo di teorie
profonde ed estremamente sofisticate nell’ambito dell’algebra, della geometria e dell’analisi matematica, sviluppate nel corso dei decenni precedenti
da diversi matematici.
Dire che la storia dell’UTF abbia inizio con Fermat nel 1630 non è
del tutto accurato: questo problema trova le sue radici nello studio delle
soluzioni intere o razionali di certe equazioni algebriche che compaiono nell’Arithmetica di Diofanto, matematico greco del 250 A.D. Specularmente, è
azzardato affermare che la storia delle ricerche ispirate dall’UTF si concluda
nel 1995: le idee introdotte da Wiles stanno prepotentemente indirizzando
il lavoro di ricerca dei primi anni del XXI secolo su questioni centrali nella
teoria dei numeri, quali la congettura di Serre (la cui dimostrazione è stata completata recentemente da Khare e Wintenberger) e la congettura di
Sato-Tate (dimostrata in questi ultimi anni grazie al lavoro di Clozel, Harris, Shepherd-Barron e Taylor); si veda la sezione 7 per maggiori dettagli su
questi lavori. Quanto detto illustra come la ricerca sui temi davvero fondamentali della matematica possegga un respiro millenario e come i ricercatori
di punta di un dato momento storico si muovano sulle spalle dei giganti del
passato.
Poche questioni hanno affascinato i matematici dilettanti quanto l’UTF:
ciò è indubbamente dovuto alla semplicità disarmante di questo problema,
che sembra a prima vista essere accessibile a metodi diretti ed elementari. La
capacità di produrre innumerevoli problemi di questo tipo, cioè dall’aspetto
2
semplice ed elementare, e tuttavia estremamente difficili a scardinarsi, al
punto da restare per lungo tempo (anche centinaia di anni) nello stato di
congettura, è una peculiarità della teoria dei numeri. Una difficoltà, nello
studio di questi problemi, consiste nell’incardinarli a strutture matematiche
sufficientemente ricche da suggerire possibili tecniche dimostrative (che sono
spesso sofisticate e provengono da diversi rami della matematica).
Come accennato sopra, l’UTF può essere classificato come appartenente
al dominio delle equazioni diofantee (cioè di quelle equazioni algebriche a
coefficienti interi per le quali si ricerchino soluzioni intere o razionali). Più
precisamente, un problema diofanteo consiste nello studio delle soluzioni
intere o razionali di un sistema di equazioni algebriche
fj (X1 , . . . , Xn ) = 0,
j = 1, . . . , m,
(2)
dove fj (X1 , . . . , Xn ) è un polinomio a coefficienti interi nelle indeterminate
X1 , . . . , Xn . L’UTF può allora essere visto come una famiglia (infinita) di
equazioni diofantee, dipendenti dal parametro n. Questa classificazione di
massima non basta tuttavia per associare all’UTF le corrette strutture matematiche, se si considera il fatto che vi sono famiglie infinite di equazioni
diofantee che ammettono soluzioni non banali. Si vedrà nei capitoli successivi come la teoria delle curve modulari, per il tramite della congettura di Shimura-Taniyama, abbia permesso di agganciare l’UTF a strutture
matematiche fondamentali, rendendone cosı̀ possibile la dimostrazione.
2
Cenni storici
Questa sezione ha lo scopo di mettere in evidenza alcuni momenti in cui
la storia dell’UTF si è intrecciata con l’evoluzione della teoria dei numeri
verso la sua forma attuale. Per informazioni storiche dettagliate, il lettore
è invitato a consultare il libro di Edwards [Edw]; per ulteriori informazioni,
si vedano anche l’articolo di Cox [C] e l’introduzione all’articolo di Darmon,
Diamond e Taylor [DDT].
Un protagonista di questi sviluppi è il matematico Ernst Eduard Kummer; grazie ai risultati ottenuti intorno al 1850, egli fu colui che durante
il XIX secolo maggiormente si avvicinò alla dimostrazione dell’UTF. I predecessori di Kummer si dedicarono allo studio di casi particolari dell’UTF:
oltre al caso n = 4 trattato dallo stesso Fermat, Eulero, nel 1753, ottenne
la dimostrazione del caso n = 3; circa settant’anni dopo Dirichlet e Legendre trattarono l’equazione di esponente 5 e successivamente Lamé quella di
3
esponente 7. Le dimostrazioni di questi singoli casi divennero sempre più
complicate col crescere dell’esponente, cosı̀ che fu presto chiara l’importanza di introdurre nuove idee per studiare l’intera famiglia delle equazioni di
Fermat. Ad eccezione di un risultato parziale di Sophie Germain intorno al
1820, i risultati di Kummer rappresentano il primo tentativo di affrontare
l’intera questione, mediante l’uso di tecniche sofisticate della teoria algebrica dei numeri. Va anche detto che gli studi di Kummer furono soprattutto
motivati dal desiderio di generalizzare risultati precedenti di Gauss (sulla
reciprocità quadratica).
Prima di descrivere sommariamente il lavoro di Kummer premettiamo
una semplice osservazione: poiché ogni intero positivo n maggiore di 2 è
divisibile per 4 oppure per un numero primo dispari (un numero primo è
un intero maggiore di 1 divisibile solo per 1 e per sé stesso), tenuto conto
del caso n = 4 dell’UTF risolto dallo stesso Fermat, concludiamo che è
sufficiente dimostrare l’UTF per i soli esponenti primi dispari.
Consideriamo allora l’equazione
X p + Y p = Z p,
(3)
2πi/p
dove p è un primo dispari. Se ζ indica
=
√ la radice p-esima dell’unità e
cos(2π/p) + i sin(2π/p), dove i = −1 è l’unità immaginaria (ζ è dunque
un numero complesso diverso da 1 con la proprietà che ζ p = 1), vale la
fattorizzazione
(X + Y )(X + ζY )(X + ζ 2 Y ) · · · (X + ζ p−1 Y ) = Z p ,
(4)
come si verifica con un calcolo diretto. Ragionando per assurdo, Kummer
cerca di ottenere una contraddizione – utilizzando l’uguaglianza (4) – a partire dall’ipotesi che l’equazione (3) ammetta una soluzione in interi (a, b, c)
con abc 6= 0. Infatti, sostituendo (X, Y, Z) con (a, b, c) nell’equazione (4), si
ottiene
(a + b)(a + ζb)(a + ζ 2 b) · · · (a + ζ p−1 b) = cp .
(5)
Ciò conduce a lavorare con l’insieme Ap dei numeri complessi della forma
a0 + a1 ζ + a2 ζ 2 + · · · + ap−1 ζ p−1 , dove i coefficienti a0 , . . . , ap−1 sono interi.
Il fatto che il secondo membro di (5) sia una potenza p-esima suggerisce la
questione se ogni fattore a primo membro sia anch’esso la potenza p-esima di
un numero complesso dell’insieme Ap (nel qual caso si può poi dedurre una
contraddizione). E’ possibile ottenere risposte (essenzialmente) affermative
nel caso in cui gli elementi di Ap godano di una proprietà analoga al principio
di fattorizzazione unica per gli interi positivi, che afferma che ogni intero
4
siffatto si fattorizza, in modo unico a meno dell’ordine dei fattori, come
prodotto di numeri primi. Tuttavia, la fattorizzazione unica vale in Ap
quando p è un primo minore di 23; è invece falsa per tutti gli altri primi (che
sono in numero infinito). Ragionando lungo queste linee, Kummer ottiene
una serie di fondamentali scoperte, che lo portano a generalizzare il concetto
di numero, introducendo la nozione di ideale (anche detto numero ideale).
Utilizzando gli ideali di Ap , egli definisce il numero delle classi di ideali,
un intero positivo hp che misura di quanto il principio di fattorizzazione
unica non valga in Ap (più hp è grande e più il principio fallisce in Ap ;
è invece valido precisamente quando hp è uguale a 1). Inoltre, Kummer
dimostra una generalizzazione del principio di fattorizzazione unica per gli
ideali di Ap (questo risultato è un prototipo dei teoremi sulla decomposizione
primaria ottenuti dalla moderna algebra commutativa). Applicando tutto
questo all’UTF, lungo le linee degli argomenti accennati sopra, Kummer
dimostra che l’UTF vale per gli esponenti p tali che p non divide l’intero hp .
Un primo p siffatto è detto regolare, mentre è chiamato irregolare altrimenti.
Questo risultato spinge Kummer a ricercare un criterio per stabilire se un
primo p sia o meno regolare: a questo scopo mette in relazione i numeri di
Bernoulli Bn , ossia i numeri razionali definiti dalla formula
∞
X Bn
x
=
xn ,
ex − 1 n=1 n!
con il numero delle classi di ideali, dimostrando che p è regolare se p non
divide il numeratore di B2 , B4 , . . . , Bp−3 , e viceversa. Questo criterio permette di dimostrare che per p < 100, i soli primi irregolari sono 37, 59 e 67;
per tutti gli altri vale l’UTF. In effetti, argomenti euristici sembrano indicare che i primi regolari siano circa il 60 percento del totale; però, a tutt’oggi
non è dimostrato che i primi regolari siano infiniti (mentre, curiosamente, è
nota l’infinità dei primi irregolari).
Gli studi di Kummer hanno dato origine ad una fertile linea di ricerca,
che si è estesa nel XX secolo; sviluppi e varianti del criterio di Kummer,
combinati con l’uso del calcolatore, hanno permesso di verificare l’UTF per
gli esponenti primi minori di 4 milioni [BCEM]; inoltre, si è dimostrato
che un eventuale controesempio all’UTF (con p > 4000000) coinvolgerebbe
soluzioni di (3) di grandezza inaccessibile.
Il criterio di Kummer può essere compreso per mezzo della formula analitica per il numero delle classi di ideali, che collega hp con i valori di certe
serie (dette serie L di Dirichlet). Vale la pena di osservare come una simile
formula analitica, per oggetti più complicati di quelli studiati da Kummer –
5
come pure il metodo della discesa infinita di Fermat – abbia avuto un ruolo
centrale nella dimostrazione di Wiles dell’UTF.
Un’altra linea di ricerca con applicazioni notevoli all’UTF ha inizio intorno al 1920, con la formulazione della Congettura di Mordell, dimostrata
da Gerd Faltings nel 1983 [F]. La summenzionata congettura afferma che
ogni equazione algebrica
f (x, y) = 0
(6)
di genere maggiore di 1 ha al più un numero finito di soluzioni nei numeri razionali. Il genere g dell’equazione (6) è un intero non negativo
legato al grado d del polinomio f (x, y): in generale vale la disuguaglianza
g ≤ (d − 1)(d − 2)/2 e si ha un’uguaglianza in questa relazione precisamente quando l’equazione è non singolare. Si noti che quanto detto ha un
contenuto geometrico, dato che (6) è l’equazione di una curva piana e la
condizione di non singolarità significa che i punti della curva sono sufficientemente regolari. In questi termini, la congettura di Mordell afferma che le
curve del tipo considerato hanno solo un numero finito di punti a coordinate
razionali, detti punti razionali. Ponendo
fn (x, y) = xn + y n − 1 = 0,
(7)
si ottiene la seguente applicazione all’equazione di Fermat (1). Intanto, si
può verificare che fn (x, y) = 0 è sempre non singolare e dunque il suo genere
g = (n − 1)(n − 2)/2 è maggiore di 1 se n > 3. Usando la trasformazione
di coordinate x = X/Z, y = Y /Z ed eliminando i denominatori, si passa da
(7) a (1). Ne viene che ogni soluzione nei razionali della prima equazione dà
luogo ad un’unica soluzione (a meno del segno) in interi relativamente primi,
cioè senza fattori in comune, della seconda equazione, e viceversa. (E’ chiaro
che da una soluzione intera di (1) se ne ottengono infinite moltiplicando
le componenti per uno stesso fattore intero.) In definitiva, il teorema di
Faltings implica che l’equazione di Fermat ha un numero finito di soluzioni
in interi relativamente primi.
Questo tipo di risultato è ancora lontano dal dimostrare l’UTF; tuttavia,
usando il teorema di Faltings, Granville [Gr] e Heath-Brown [HB] hanno
dimostrato che l’UTF vale per un insieme di esponenti interi n di densità
uno, cioè la percentuale di esponenti per i quali l’UTF può essere falso
tende a zero per n tendente ad infinito (osserviamo che questo non implica
la validità dell’UTF per un numero infinito di esponenti primi).
Il teorema di Faltings è un risultato fondamentale sui punti razionali delle curve; la sua applicazione all’UTF descritta sopra collega dunque
6
quest’ultimo ad un risultato centrale della teoria dei numeri e della geometria aritmetica moderne. Per un altro verso, alla fine degli anni 80 del secolo
scorso, si è evidenziato come l’UTF sia conseguenza (almeno per esponenti
grandi) di importanti congetture in teoria dei numeri, rappresentando quindi un importante banco di prova per la loro validità. Per citare solo alcune
delle congetture a cui stiamo alludendo, ricordiamo la ‘congettura abc’, la
‘disuguaglianza di Bogomolov-Miyaoka-Yau’ per le superfici aritmetiche e
la ‘congettura di Shimura-Taniyama’ sulla modularità delle curve ellittiche.
La dimostrazione di Wiles e Taylor dell’UTF passa per la dimostrazione
di quest’ultima congettura. Pertanto, la prossima sezione è dedicata ad
una descrizione della congettura di Shimura-Taniyama, mentre la sezione
successiva spiega perchè l’UTF ne è conseguenza.
3
La congettura di Shimura-Taniyama
Seguendo Mazur [M1], si può descrivere la congettura di Shimura-Taniyama
come un enunciato che postula l’esistenza di una relazione, del tutto inaspettata, tra due diversi tipi di spazi di orbite. Il primo spazio si incontra descrivendo le curve ellittiche – una classe di curve piane definite da equazioni
cubiche – come tori complessi. Il secondo spazio si ottiene dall’identificazione dei punti del semipiano superiore rispetto all’azione di certe trasformazioni lineari frazionarie; questa costruzione dà luogo ad una famiglia di
curve algebriche, dette curve modulari. La congettura di Shimura-Taniyama
afferma che ogni curva ellittica a coefficienti razionali è ‘immagine’ di un’opportuna curva modulare.
Indichiamo con C l’insieme dei numeri complessi,
cioè i numeri della
√
forma a + ib, dove a e b sono numeri reali e i = −1 è l’unità immaginaria.
Possiamo anche rappresentare gli elementi di C come i numeri della forma
aω1 + bω2 , con a e b numeri reali, per una qualunque scelta di numeri
complessi non nulli ω1 e ω2 tali che ω1 /ω2 non sia un numero reale. (La
forma algebrica a + ib si ottiene dunque scegliendo ω1 = 1 e ω2 = i.)
Un reticolo Λ è un sottoinsieme di C i cui elementi sono della forma
aω1 + bω2 , con ω1 e ω2 come sopra, dove i coefficienti a e b sono numeri
interi. Fissato un reticolo Λ, l’orbita di un numero complesso z rispetto a
Λ è l’insieme
z + Λ = {z + aω1 + bω2 : a e b interi}.
(8)
Indichiamo l’insieme di tutte le orbite con C/Λ. In modo equivalente, l’insieme C/Λ si ottiene identificando tra loro i numeri costruiti applicando
7
ad un dato numero complesso z una qualunque sequenza delle traslazioni
T1 : z 7→ z + ω1 e T2 : z 7→ z + ω2 . Geometricamente, lo spazio delle orbite
C/Λ è il toro complesso (una ‘ciambella con un buco’) ottenuto identificando i lati opposti del parallelogramma nel piano complesso avente per vertici
i numeri 0, ω1 , ω2 e ω1 + ω2 .
Dato un qualunque punto P0 di C/Λ, è possibile definire opportune
identificazioni di regioni Ω di C/Λ contenenti P0 con dischi aperti del piano
complesso, cioè regioni della forma Dr = {z = a + ib : a2 + b2 < r2 } con
r > 0, in modo tale che P0 corrisponda al centro 0 del disco. Ne viene che
una funzione F (a valori complessi) definita su Ω può essere identificata
con una funzione f su un disco Dr . Diciamo che F è olomorfa su Ω se f
è derivabile (in senso complesso) in tutti i punti di Dr . Più generalmente,
ammetteremo che f possa essere della forma g(z)/z n , per un intero positivo
n, con g(z) derivabile in ogni punto di Dr e g(0) 6= 0. La F corrispondente
a f è detta meromorfa su Ω; il punto P0 (in cui F non è definita) è una
singolarità chiamata polo (di ordine n). Infine, diciamo che una funzione F
su C/Λ è olomorfa, rispettivamente meromorfa, se è possibile ricoprire C/Λ
con regioni Ω del tipo considerato sopra, in modo tale che la restrizione di
F a ciascun Ω sia olomorfa, rispettivamente meromorfa.
Un modo equivalente di introdurre le nozioni precedenti si basa sull’osservazione che una funzione F su C/Λ definisce una funzione f su C
periodica rispetto a Λ (cioè vale l’uguaglianza f (z) = f (z + λ) per ogni
elemento λ del reticolo). Allora, F è olomorfa se f è derivabile in tutti i
punti di C; analogamente, si descrive il concetto di funzione meromorfa.
(Per maggiori dettagli su queste nozioni, invitiamo il lettore a consultare
il libro di Ahlfors [A] sull’analisi complessa.)
Per ogni reticolo Λ, la teoria di Weierstrass (vedere ad esempio [L])
definisce una funzione ℘(z) su C, periodica rispetto a Λ, che è olomorfa nei
punti di C − Λ ed ha un polo (di ordine 2) in ogni punto di Λ. La proprietà
fondamentale di ℘(z), detta funzione ℘ di Weierstrass, risiede nel fatto che
℘(z) e la sua derivata prima ℘0 (z) soddisfano una relazione algebrica cubica
della forma
℘0 (z)2 = 4℘(z)3 + A℘(z) + B,
dove A e B sono due numeri complessi definiti a partire da Λ e il polinomio
cubico 4x3 + Ax + B ha zeri distinti. La curva piana
y 2 = 4x3 + Ax + B
(9)
è chiamata curva ellittica. I punti del toro C/Λ si identificano con i punti a
coordinate complesse di (9), secondo la corrispondenza che associa l’orbita
8
P = z + Λ al punto di coordinate (℘(z), ℘0 (z)). Poiché ℘ e ℘0 hanno un
polo nei punti del reticolo Λ, l’orbita P = Λ corrisponde al punto all’infinito
su (9), ottenuto facendo tendere ad infinito le coordinate (x, y) del punto
mobile sulla curva.
Viceversa, data una qualunque curva ellittica, si dimostra che i suoi
punti a coordinate complesse si identificano mediante la procedura indicata
sopra con i punti di un toro C/Λ, per un’opportuna scelta del reticolo Λ.
Per enunciare la congettura di Shimura-Taniyama, è necessario introdurre un altro tipo di spazio di orbite. Sia
H = {z = a + bi ∈ C : b > 0}
il semipiano superiore dei numeri complessi con parte immaginaria positiva.
Definiamo le trasformazioni T : z 7→ z + 1 e S : z 7→ −1/z di H. Si vede
che applicando successivamente, in sequenze arbitrarie, le trasformazioni S
e T , si ottengono tutte le trasformazioni del tipo
γ : z 7→
az + b
,
cz + d
(10)
dove a, b, c e d sono interi tali che ad − bc = 1. Indichiamo con Γ0 (1)
l’insieme di queste trasformazioni 1 .
E’ utile osservare che S e T non commutano, nel senso che applicando
prima S e poi T , si ottiene la trasformazione T S : z 7→ (z −1)/z; applicando
invece S e T nell’ordine inverso, si ottiene ST : z 7→ −1/(z + 1), diversa da
T S. (Al contrario, le traslazioni T1 e T2 , considerate nella definizione delle
curve ellittiche come tori complessi, commutano: T1 T2 e T2 T1 coincidono
entrambe con la traslazione z 7→ z + ω1 + ω2 .)
Introduciamo ora lo spazio delle orbite
H/Γ0 (1),
ottenuto identificando tra loro i punti di H che si ottengono da un dato
punto applicando le trasformazioni γ definite in (10); dunque, gli elementi
di H/Γ0 (1) sono le orbite
{
az + b
: a, b, c, d interi, ad − bc = 1},
cz + d
dei diversi elementi z di H.
1
Γ0 (1) è un gruppo rispetto alla composizione di trasformazioni
9
(11)
Com’è fatto lo spazio H/Γ0 (1)? Uno studio dettagliato dell’azione delle
trasformazioni di Γ0 (1) su H mostra che ogni orbita (11) contiene un punto
della regione
D = {z = a + ib ∈ H : −1/2 ≤ a ≤ 1/2 e a2 + b2 ≥ 1}.
(I punti di D sono i punti di H che stanno nella striscia verticale −1/2 ≤ a ≤
1/2 e nello stesso tempo si trovano all’esterno o sul bordo del disco unitario.)
Inoltre, le sole identificazioni tra punti di D indotte da elementi di Γ0 (1)
si ottengono identificando i punti delle semirette verticali che delimitano la
striscia, simmetrici rispetto all’asse y (basta usare T o la traslazione inversa
z 7→ z − 1 per passare da una semiretta all’altra), e in aggiunta identificando i punti sull’arco di cerchio che delimita inferiormente D, simmetrici
rispetto all’asse y (usare qui la trasformazione S). (Per dettagli, consultare
il libro di Lang [L].) Lo spazio ottenuto da D effettuando le identificazioni
descritte sopra è una superficie sferica privata di un punto e può anche
essere identificato all’occorrenza, mediante proiezione stereografica, con il
piano complesso. Indicheremo con X0 (1) la sfera ottenuta ‘compattificando’
lo spazio H/Γ0 (1) con l’aggiunta di un singolo punto.
Come detto poc’anzi, i punti di H/Γ0 (1) possono essere identificati con
quelli del piano complesso C; ma C può anche essere visto come l’insieme
dei punti a coordinate complesse di una retta, nello stesso modo in cui i
numeri reali possono essere identificati con i punti della retta reale. (Queste
osservazioni possono forse confondere il lettore, dato che stiamo dicendo
che un piano ed una retta sono la stessa cosa; l’apparente contraddizione
si risolve notando che C, cioè l’insieme dei numeri complessi z = a + ib,
ha dimensione reale 2, in quanto servono due parametri reali a e b per descrivere z e dunque dal punto di vista della geometria reale C è un piano;
d’altra parte, bastando un solo parametro complesso – z stesso – per descrivere z, concludiamo che C ha dimensione complessa 1 e che nell’ambito
della geometria complessa C è una retta.) In definitiva, da un punto di
vista algebrico, lo spazio X0 (1) è l’insieme dei punti complessi di una retta
(proiettiva), cioè una curva definita da un’equazione lineare (con l’aggiunta
di un punto all’infinito).
Ricordando la discussione sul genere di una curva svolta nella sezione
2, la curva in questione ha genere 0, essendo descritta da un’equazione di
primo grado; invece le curve ellittiche, descritte dall’equazione (9), hanno
genere 1. (Il fatto che gli zeri del polinomio 4x3 + Ax + B siano distinti
assicura che le curve ellittiche siano non singolari.)
La costruzione di X0 (1) si presta ad una generalizzazione. Dato un
10
intero N ≥ 1, indichiamo con Γ0 (N ) l’insieme delle trasformazioni (10) il
cui coefficiente c è divisibile per N 2 e con H/Γ0 (N ) lo spazio delle orbite
definito in modo analogo a H/Γ0 (1), utilizzando Γ0 (N ) invece di Γ0 (1).
In questo modo si ottiene una superficie (nel senso della geometria reale)
che può essere compattificata con l’aggiunta di una numero finito di punti,
detti cuspidi; la indicheremo con X0 (N ). Analogamente al caso di X0 (1),
la superficie X0 (N ) può essere identificata con l’insieme dei punti complessi
di una curva, detta curva modulare di livello N ; si tratta in generale di
una curva più complicata di X0 (1), dato che il suo genere g non è limitato
superiormente al crescere di N .
Tornando alla descrizione come superficie, X0 (N ) è una ‘ciambella con
g buchi’. In generale, il genere di una curva può anche essere definito come
il numero dei buchi presenti nella superficie che descrive i punti complessi
della curva stessa; da questo punto di vista, X0 (1) ha genere 0 perché la
sfera non ha buchi, mentre una curva ellittica ha genere 1 perché si identifica
con un toro complesso.
Esattamente come nel caso dei tori C/Λ, possiamo identificare opportunamente regioni Ω di X0 (N ), contenenti un dato punto P0 , con dischi aperti
del piano complesso, in modo tale che P0 corrisponda ai centri dei dischi.
Ciò permette di definire la nozione di funzione olomorfa su X0 (N ), e quella
di funzione olomorfa da X0 (N ) a un toro C/Λ.
Possiamo ora enunciare la congettura formulata dai matematici Goro
Shimura e Yutaka Taniyama. Diciamo che una curva ellittica è definita sui
razionali se i coefficienti A e B nell’equazione (9) sono numeri razionali.
Congettura 3.1 (Shimura-Taniyama). Sia E una curva ellittica definita
sui razionali e sia C/Λ il toro complesso che si identifica con i punti a
coordinate complesse di E. Allora esiste una funzione olomorfa non costante
da X0 (N ) a C/Λ, per una scelta opportuna dell’intero positivo N .
Concludiamo questa sezione con una descrizione esplicita, in termini di
certi integrali, di una funzione olomorfa non costante
ϕ : X0 (N ) −→ C/Λ,
la cui esistenza è postulata per un N opportuno dalla congettura 3.1. Dall’esistenza di ϕ, si deduce l’esistenza di un differenziale non nullo ω(z) =
2πif (z)dz sul semipiano H, con le seguenti proprietà:
2
Γ0 (N ) è un sottogruppo di Γ0 (1)
11
1. ω(z) è invariante rispetto all’azione di Γ0 (N ), cioè vale l’uguaglianza
ω(
az + b
) = ω(z)
cz + d
per ogni trasformazione z 7→ (az + b)/(cz + d) di Γ0 (N );
2. la funzione f (z) è olomorfa su H e si annulla nelle cuspidi di X0 (N );
3. f (z) ammette uno sviluppo in serie di Fourier della forma
f (z) =
∞
X
an e2πinz ,
n=1
dove i coefficienti an sono interi e a1 = 1.
Le prime due proprietà esprimono il fatto che ω(z) definisce un differenziale
olomorfo su X0 (N ). Inoltre, l’invarianza di ω(z) rispetto a Γ0 (N ) implica
l’invarianza di f (z) rispetto alla traslazione T : z 7→ z + 1, cioè il fatto
che f (z + 1) = f (z); questa proprietà di periodicità di f (z) ne garantisce
la rappresentabilità come serie di Fourier. Sia i∞ il punto all’infinito su
H, ottenuto facendo tendere ad infinito, nella direzione positiva, il punto
corrente sull’asse verticale. Dato un punto P su X0 (N ), indichiamo con τ
un qualunque elemento dell’orbita di P ; vale allora la formula
Z τ
ϕ(P ) =
ω(z) + Λ,
(12)
i∞
ricordando la notazione z + Λ introdotta nell’equazione (8) per descrivere
gli elementi di C/Λ.
(La descrizione del differenziale ω(z) data sopra comporta l’invarianza di
ω(z) rispetto all’azione di certe corrispondenze su X0 (N ), dette operatori di
Hecke, che per semplicità non definiamo. Nel seguito del testo, ogniqualvolta
prenderemo in considerazione differenziali analoghi a ω(z), ammetteremo
tacitamente che una simile proprietà di invarianza sia verificata.)
Osserviamo infine che il genere g di X0 (N ) può essere alternativamente
descritto come il numero massimo di differenziali olomorfi indipendenti3
su X0 (N ). Di conseguenza, la curva X0 (N ) che compare nell’enunciato
della congettura di Shimura-Taniyama deve avere genere g ≥ 1, poiché vi è
almeno un differenziale olomorfo non nullo su di essa grazie alla discussione
svolta sopra.
3
più precisamente, indipendenti significa linearmente indipendenti nello spazio
vettoriale complesso dei differenziali olomorfi
12
4
Shimura-Taniyama implica Fermat
La strategia che ha condotto alla dimostrazione dell’UTF consiste nell’associare ad un’ipotetica soluzione dell’equazione di Fermat (3) una curva
ellittica, per poi mostrare che l’esistenza di questa curva è incompatibile
con la congettura di Shimura-Taniyama.
Più precisamente si ragiona per assurdo, supponendo che esista una
soluzione intera (a, b, c) di (3) con abc 6= 0. Sappiamo già (vedi la sezione
2) che l’UTF vale per per tutti gli esponenti più piccoli di 4 milioni; per
la validità dell’argomento che andiamo a presentare, ci basta supporre che
p sia maggiore di 7. Possiamo anche richiedere che gli interi a, b, c non abbiano fattori comuni (infatti, rimuovendo un eventuale fattore comune, si
ottiene una nuova soluzione di (3)). Inoltre, scambiando eventualmente a,
b e c, possiamo supporre che b sia pari ed a sia un intero della forma 4k − 1.
Associamo ad (a, b, c) la curva ellittica
y 2 = x(x − ap )(x + bp ),
(13)
chiamata curva di Frey.
Supponiamo vera la congettura di Shimura-Taniyama. Allora, vi è un
intero N ≥ 1 e un differenziale olomorfo non nullo ω(z) = 2πif (z)dz sulla
curva X0 (N ), con le proprietà elencate nella sezione 3, che definisce grazie
alla formula (12) una funzione olomorfa non costante da X0 (N ) ai punti a
coordinate complesse di (13) (identificati con un toro complesso). Attraverso uno studio dettagliato delle proprietà aritmetiche delle curve modulari,
Barry Mazur [M2] e Kenneth Ribet [R] hanno dimostrato l’esistenza di un
nuovo differenziale olomorfo non nullo ω 0 (z), questa volta sulla curva X0 (2),
i cui coefficienti di Fourier a0n sono congruenti modulo p ai coefficienti di
Fourier an di ω(z). Usando il collegamento tra i differenziali olomorfi su
una curva e il genere della stessa ricordato alla fine della sezione 3, concludiamo che il genere di X0 (2) deve essere almeno 1. D’altra parte, studiando
l’azione di Γ0 (2) sul semipiano superiore, si vede (in modo del tutto simile
a quanto descritto per X0 (1)) che X0 (2) è una sfera e dunque il suo genere
è 0. Ecco la contraddizione cercata!
In conclusione, l’UTF segue dalla congettura di Shimura-Taniyama, grazie al lavoro di Mazur e Ribet. Citiamo qui anche il lavoro di Gerhard Frey
[Fr], che per primo ebbe l’idea di usare la congettura 3.1 per dimostrare che
la curva (13) – già studiata da Yves Hellegouarch [Hel] – non può esistere, e
di Jean-Pierre Serre [S1], la cui congettura (su cui torneremo nella sezione 7)
13
ha ispirato il lavoro di Ribet, anticipando l’esistenza del differenziale ω 0 (z)
che compare nel precedente argomento.
A questo punto della storia – siamo nel 1990 – resta da dimostrare la
congettura di Shimura-Taniyama. Questo è il compito che si è assunto Andrew Wiles, lavorando per diversi anni in completa solitudine ed avvalendosi
infine della collaborazione di Richard Taylor.
La strategia ideata da Wiles consiste in un computo, svolto con tecniche assai sofisticate, da un lato degli elementi dell’insieme delle curve
ellittiche definite sui razionali, e dall’altro lato degli elementi del sottoinsieme costituito da quelle curve ellittiche che soddisfano la congettura di
Shimura-Taniyama, con l’obiettivo di dimostrare che i due insiemi coincidono. Ritorneremo su questa strategia nella sezione 6, dopo aver introdotto
alcuni concetti preliminari.
Conviene infine avvertire il lettore che i lavori di Mazur, Ribet, Wiles
e Taylor-Wiles citati nella bibliografia, che costituiscono il cuore della dimostrazione dell’UTF, attingono alle più raffinate tecniche sviluppate dall’algebra, dall’analisi e dalla geometria del XX secolo e risultano pertanto
accessibili a pochi specialisti. La trattazione presentata nelle pagine precedenti ha cercato di spiegare alcune delle idee emerse dal lavoro dei summenzionati matematici, evitando il più possibile di insistere sugli aspetti tecnici
della dimostrazione.
5
Appendice 1: Preliminari algebrici
Le tre appendici al testo principale di questo scritto intendono fornire alcuni strumenti di approfondimento al lettore. La prima richiama i concetti matematici necessari per meglio precisare la strategia dimostrativa di
Wiles, trattata nella seconda appendice; la terza si occupa delle conseguenze del lavoro di Wiles, ed include applicazioni alla congettura di Birch e
Swinnerton-Dyer e l’osservazione che l’uso delle tecniche di Wiles, opportunamente generalizzate, ha permesso di ottenere la dimostrazione delle
congetture di Serre e di Sato-Tate.
Sebbene il livello tecnico di queste appendici sia stato limitato il più possibile (compatibilmente con gli scopi esplicativi che ci si è posti) la loro comprensione necessita della padronanza di strumenti matematici più sofisticati
di quelli utilizzati nelle precedenti sezioni, per le quali le conoscenze matematiche richieste si riducono a poco più del concetto di funzione derivabile.
In particolare, si richiede qui che il lettore abbia una certa familiarità con
14
alcuni concetti algebrici trattati nei testi introduttivi all’algebra astratta,
come per esempio il libro di Herstein [Her], quali le definizioni di base su
gruppi, anelli, campi e spazi vettoriali.
Diciamo che un numero complesso α ∈ C è un numero algebrico se α è
lo zero di un polinomio p(x) = a0 + a1 x + . . . + an xn di grado n ≥ 1, i cui
coefficienti a0 , a1 , . . . , an appartengono al campo Q dei numeri razionali. Il
sottocampo Q[α] di C, generato su Q da un numero algebrico α, è detto
campo di numeri. In altre parole, Q[α] è il più piccolo sottocampo di C
contenente α; i suoi elementi sono le espressioni polinomiali in α a coefficienti
razionali.
Dato un numero algebrico α, sia pα (x) un polinomio a coefficienti razionali, di grado n ≥ 1 minimo, tale che pα (α) = 0. Il campo di numeri
K = Q[α] è detto di Galois se tutti gli zeri (nel campo complesso) di pα (x)
appartengono a K.
Se K è di Galois, il suo gruppo di Galois Gal(K/Q) è definito come il
gruppo degli automorfismi di K, rispetto all’operazione di composizione. (Si
ricordi che un automorfismo di K è un’applicazione bijettiva φ : K −→ K
che rispetta la somma e il prodotto in K, cioè φ(β + γ) = φ(β) + φ(γ) e
φ(βγ) = φ(β)φ(γ) per ogni scelta di elementi β e γ in K.) Si dimostra che
l’ordine di Gal(K/Q) è uguale al grado di pα (x); in particolare, il gruppo
di Galois di K è un gruppo finito.
Dati due numeri algebrici α e β, si vede che il campo Q[α, β] generato su
Q da α e β è anch’esso un campo di numeri Q[γ]; ne consegue che l’unione
insiemistica Q̄ di tutti i campi di numeri Q[α] è un sottocampo di C. Il
campo Q̄ può anche essere descritto come l’unione di tutti i campi di numeri
di Galois. Se indichiamo con Gal(Q̄/Q) il gruppo degli automorfismi di Q̄,
valgono le due proprietà seguenti:
1. Gal(Q̄/Q) è un gruppo infinito;
2. per ogni campo di numeri di Galois Q[α], vi è un omomorfismo suriettivo di gruppi πα : Gal(Q̄/Q) −→ Gal(Q[α]/Q).
La teoria delle curve ellittiche permette di costruire una classe di campi
di numeri, che avrà un ruolo fondamentale nelle considerazioni successive.
Se E è una curva ellittica, sappiamo dalla sezione 3 che l’insieme E(C)
dei punti a coordinate complesse di E si identifica con un toro complesso
C/Λ. Lo spazio delle orbite C/Λ è dotato di una struttura naturale di
gruppo (quoziente del gruppo additivo dei numeri complessi): date due
orbite z1 + Λ e z2 + Λ, la loro somma è definita come l’orbita (z1 + z2 ) + Λ.
15
Essendo questa somma commutativa, otteniamo che C/Λ, e dunque anche
E(C), è un gruppo abeliano. Notiamo che l’elemento neutro della legge
di gruppo su E(C) è il punto all’infinito O di E, poiché esso corrisponde
all’orbita Λ. E’ bene menzionare che vi è un modo equivalente, detto della
corda e tangente, di natura geometrica, per definire la somma di punti su
E (si veda il libro di Silverman [Sil] per dettagli).
Se n è un intero maggiore di 1 e P è un punto in E(C), possiamo definire
il punto nP come P +. . .+P , dove il numero di addendi in quest’espressione
è pari ad n. Consideriamo l’insieme
En = {P ∈ E(C) : nP = O}
dei punti di E annullati dalla moltiplicazione per n. Si vede subito che En è
un sottogruppo di E(C); inoltre, l’identificazione di quest’ultimo gruppo con
il toro C/Λ identifica En con il sottogruppo (1/n)Λ/Λ. Ricordando che Λ è
un gruppo della forma Zω1 ⊕Zω2 (dove Z indica gli interi relativi) otteniamo
che En è un gruppo finito, isomorfo a Z/nZ ⊕ Z/nZ. Ne viene che il gruppo
Aut(En ) degli automorfismi di En è isomorfo al gruppo (non commutativo)
GL2 (Z/nZ) delle matrici invertibili 2 × 2, a coefficienti nell’anello Z/nZ.
Supponiamo ora che E sia definita sui razionali. In questo caso, si trova
che il campo Q(En ), generato su Q dalle coordinate dei punti nell’insieme
En , è un campo di numeri di Galois. Più precisamente, si verificano i fatti
seguenti:
1. le coordinate di ogni punto P in En sono numeri algebrici e quindi il
campo da esse generato su Q è un campo di numeri, contenuto in Q̄;
2. dato P in En e un elemento σ del gruppo di Galois Gal(Q̄/Q), il punto
σ(P ) ottenuto applicando σ alle coordinate di P appartiene ad En .
Segue che σ induce un automorfismo ρn (σ) del gruppo En , mediante la
regola
ρn (σ)(P ) = σ(P ),
(14)
per ogni P in En . In conclusione, il gruppo di Galois Gal(Q(En )/Q) si identifica con un sottogruppo di Aut(En ), e quindi anche di GL2 (Z/nZ). Salvo
che in casi speciali, Gal(Q(En )/Q) ‘tende’ ad essere uguale ad Aut(En ) e
dunque ad essere non commutativo.
Notiamo un’altra proprietà del gruppo Gal(Q(En )/Q). Se ` è un numero
primo che non divide nNE , dove NE è un intero positivo detto conduttore
di E, definito unicamente in termini di E (cf. [Sil]), è possibile definire
16
in questo gruppo un particolare elemento, indicato con σn (`) e chiamato
elemento di Frobenius in `. Per definire σn (`), si dimostra che vi è un
sottogruppo di Gal(Q(En )/Q) isomorfo al gruppo di Galois di un campo
finito di caratteristica `; σn (`) è l’automorfismo che corrisponde in questa
identificazione all’automorfismo x 7→ x` in caratteristica `. Va detto che
σn (`) non è ben definito in generale (solo la classe dei suoi coniugati lo è);
tuttavia, se vediamo σn (`) come una matrice 2 × 2 a coefficienti in Z/nZ,
la sua traccia Tr(σn (`)) è un elemento di Z/nZ del tutto ben definito.
Si noti infine l’analogia tra la costruzione di Q(En ) e quella del campo
Q(ζn ), ottenuto aggiungendo a Q le soluzioni dell’equazione xn − 1 = 0,
cioè le radici n-esime dell’unità. Tuttavia, a differenza di Gal(Q(En )/Q),
il gruppo Gal(Q(ζn )/Q) è sempre un gruppo abeliano, essendo isomorfo al
gruppo moltiplicativo (Z/nZ)× delle unità dell’anello Z/nZ.
6
Appendice 2: I campi Q(En) e la strategia
di Wiles
Cominciamo con una riformulazione della congettura di Shimura-Taniyama
in termini dei campi Q(En ) definiti nella sezione 5. Se E è una curva ellittica che verifica la congettura di Shimura-Taniyama, esiste un differenziale
olomorfo ω(z) = 2πif (z)dz associato ad E con le proprietà elencate nella
sezione 3. Questo differenziale è determinato dai suoi coefficienti di Fourier
{am : m ≥ 1}.
Il lavoro di Martin Eichler e Goro Shimura dimostra che per ogni intero n ≥ 2 e per ogni primo ` che non divide n e il conduttore NE , si ha
l’uguaglianza
Tr(σn (`)) = a` (mod n),
(15)
dove a` (mod n) indica la classe dell’intero a` in Z/nZ e σn (`) è l’elemento
di Frobenius in ` (NE e σn (`) sono introdotti nella sezione 5). Si noti che
al variare di n, la formula (15) determina i coefficienti a` per tutti gli ` che
non dividono NE ; inoltre, si dimostra che la conoscenza di questi coefficienti
basta per descrivere completamente il differenziale ω(z).
Viceversa, se esiste un differenziale olomorfo ω(z) (con le proprietà elencate nella sezione 3) i cui coefficienti di Fourier verificano le equazioni (15)
per ogni n ≥ 2, allora la congettura di Shimura-Taniyama è vera per la curva E. La validità di quest’affermazione è alla base della strategia di Wiles.
La sua dimostrazione dipende, oltre che dalla teoria di Eichler-Shimura,
dal lavoro di Faltings [F] sulla congettura di Mordell descritto nella sezione
17
2 (e dal lavoro precedente di Serre), che permette di concludere che E è
essenzialmente determinata dai campi Q(En ), al variare di n.
A questo punto, Wiles procede classificando tutti i campi che si costruiscono in modo analogo a Q(En ); inoltre, all’interno di quest’insieme, caratterizza il sottoinsieme costituito da quei campi che soddisfano un’equazione
analoga a (15); dall’uguaglianza dei due insiemi segue, grazie alle considerazioni precedenti, la dimostrazione della congettura 3.1. Più precisamente,
Wiles riduce l’uguaglianza dei due insiemi considerati alla dimostrazione di
un analogo della formula analitica per il numero delle classi di ideali ottenuta da Kummer (vedi sezione 2). La differenza cruciale risiede nel fatto che la
formula di Kummer è intimamente legata ai campi Q(ζn ) aventi gruppo di
Galois abeliano; la formula di Wiles coinvolge funzioni L costruite a partire
dai gruppi di punti En sulle curve ellittiche e dunque associate a campi con
gruppo di Galois non abeliano.
Osserviamo infine che la dimostrazione di Wiles e Taylor-Wiles della
congettura di Shimura-Taniyama si applica soltanto ad una sottoclasse delle
curve ellittiche definite sui razionali, le cosiddette curve ellittiche semistabili, che include le curve di Frey necessarie per la dimostrazione dell’UTF;
l’estensione di questi metodi a tutte le curve ellittiche è ottenuta nel lavoro
[BCDT] di Breuil, Conrad, Diamond e Taylor.
7
Appendice 3: Conseguenze del lavoro di
Wiles
Il metodo introdotto da Wiles per dimostrare che i campi Q(En ) sono associati ai differenziali ω(z) sulle curve modulari X0 (N ) (nel senso precisato
nella sezione 6) si è dimostrato estremamente potente e flessibile, ed ha
ispirato la soluzione di altri importanti problemi aperti.
La congettura di Serre, formulata nel lavoro [S1], è uno di questi problemi. Ricordiamo anzitutto che la costruzione dei campi Q(En ) si basa
sull’osservazione che il gruppo En , isomorfo a Z/nZ ⊕ Z/nZ, è dotato di
un’azione del gruppo di Galois Gal(Q̄/Q), cioè esiste un omomorfismo di
gruppi
ρn : Gal(Q̄/Q) −→ Aut(En )
(16)
del gruppo di Galois di Q̄ nel gruppo degli automorfismi di En (si veda a
questo proposito la formula (14)). Se τ indica l’automorfismo di Q̄ ottenuto
per restrizione del coniugio complesso (che manda a+ib in a−ib), si vede che
il determinante dell’elemento ρn (τ ) (identificato come sopra con una matrice
18
di GL2 (Z/nZ)) è uguale a −1. Generalizzando le definizioni precedenti,
consideriamo ora omomorfismi del tipo
ρ : Gal(Q̄/Q) −→ Aut(F ⊕ F),
(17)
dove F è un campo finito di caratteristica p (per esempio, il campo finito
con p elementi Z/pZ), tali che il determinante di ρ(τ ) sia uguale a −1.
Facciamo l’ipotesi che non vi siano sottospazi propri di F ⊕ F invarianti
rispetto a tutti gli automorfismi nell’insieme ρ(Gal(Q̄/Q)) (anche nel caso
in cui F venga rimpiazzato da un’altro campo finito che lo contiene).
E’ possibile definire, come nel caso di ρn , la traccia degli elementi di
Frobenius σ(`) per tutti i primi ` che non dividono un dato intero positivo
(qui, σ(`) è un elemento del gruppo di Galois del campo di numeri Q(ρ),
definito come il sottocampo di Q̄ su cui gli elementi del nucleo di ρ agiscono
come l’identità).
La congettura di Serre afferma che gli omomorfismi ρ sono associati a
differenziali olomorfi ω(z), nel senso che vale l’analogo dell’equazione (15),
con le seguenti precisazioni: (i) sono ammessi differenziali ω(z) della forma
più generale 2πif (z)dz k (nella formulazione della congettura di ShimuraTaniyama si ha k = 1); (ii) si richiede che ω(z) sia invariante rispetto
alle trasformazioni di un certo sottogruppo di indice finito di Γ0 (N ); (iii) i
coefficienti di Fourier an di f (z) non appartengono necessariamente a Z ma,
più generalmente, ad un sottoanello O di un campo di numeri tale che esista
un ideale massimale m con O/m isomorfo a F. Fatte queste precisazioni,
l’analogo dell’equazione (15) diventa allora
Tr(σ(`)) = a`
(mod m).
La dimostrazione della congettura di Serre, completata da Chandrashekar
Khare e Jean-Pierre Wintenberger (si vedano le loro pre-pubblicazioni [KW1],
[KW2]) si basa su varianti e generalizzazioni dei metodi di Wiles e TaylorWiles, combinate con un argomento induttivo estremamente ingegnoso.
Un’altra applicazione dei metodi originati dalle idee di Wiles è la dimostrazione della congettura di Sato-Tate, conseguenza dei lavori di Clozel,
Harris, Shepherd-Barron e Taylor [CHT], [HST], [T].
Data una curva ellittica E definita sui razionali, possiamo supporre che
l’equazione (9) di E abbia coefficienti in Z, applicando un’opportuna trasformazione sulle coordinate (x, y) . Per ogni primo `, la riduzione modulo `
dei coefficienti A e B dà luogo ad una curva cubica E(`) a coefficienti nel
campo finito Z/`Z.
19
Per tutti gli ` che non dividono un opportuno intero positivo ∆E (divisibile per il conduttore NE ), si vede che E(`) è una curva ellittica definita
sul campo Z/`Z (cioè E(`) è non singolare). In questo caso, indichiamo con
n` (E) il numero di punti su E(`) a coordinate in Z/`Z (includendo tra essi
il punto all’infinito) e definiamo il coefficiente
a` (E) = ` + 1 − n` (E).
(18)
La disuguaglianza di Hasse (vedi [Sil]) fornisce una stima per il valore
assoluto di a` (E):
√
|a` (E)| ≤ 2 `.
(19)
√
Ne viene l’uguaglianza a` (E) = 2 ` cos θ` (E), per un unico valore dell’angolo θ` (E) con 0 ≤ θ` (E) ≤ π. Facciamo l’ipotesi che tutti gli endomorfismi
di E si ottengano come moltiplicazione per un intero in Z (cf. [Sil]). La
congettura di Sato-Tate, formulata nella prima metà degli anni 60, afferma che gli angoli θ` (E) sono uniformemente distribuiti nell’intervallo [0, π],
rispetto alla misura (2/π) sin2 θdθ. (Rimandiamo al libro di Serre [S2] per
maggiori dettagli.)
Sebbene il contenuto di quest’affermazione riguardi le curve ellittiche, la
strategia dimostrativa contenuta nei lavori citati sopra (che dimostrano la
congettura di Sato-Tate sotto un’ipotesi aggiuntiva su E, ma ammettendo
in compenso anelli dei coefficienti più generali) si basa su una difficile estensione delle idee di Wiles ad oggetti geometrici più generali delle curve modulari, chiamati varietà di Shimura. Il punto di partenza della dimostrazione
consiste nell’osservare che vale l’uguaglianza (conseguenza di (15))
a` (E) = a` , ` 6 |∆E ,
(20)
dove gli a` sono i coefficienti di Fourier del differenziale ω(z) associato ad
E dalla congettura di Shimura-Taniyama. Di conseguenza, gli angoli θ` (E)
possono essere descritti in termini di differenziali su X0 (N ); tuttavia, la dimostrazione dell’equidistribuzione dei θ` (E) passa per una generalizzazione
dei coefficienti a` (E), realizzata attraverso la cosiddetta ‘rappresentazione
prodotto simmetrico’, che a sua volta può essere descritta per mezzo di
una generalizzazione dei differenziali ω(z) ottenuta con l’uso delle varietà
di Shimura.
Veniamo infine a parlare della congettura di Birch e Swinnerton-Dyer,
considerato uno dei più importanti problemi aperti della matematica contemporanea (a questo proposito, si veda per esempio la descrizione dei ‘Millenium Problems’ proposti dal Clay Mathematical Institute [CLAY]). Indichiamo con E(Q) l’insieme dei punti a coordinate razionali su una curva
20
ellittica E definita sui razionali. La legge di gruppo sull’insieme E(C) dei
punti a coordinate complesse di E (data dall’identificazione di E(C) con
un toro complesso C/Λ) induce una struttura di gruppo sul sottoinsieme
E(Q). Il teorema di Mordell-Weil (vedi [Sil]) afferma che E(Q) è un gruppo abeliano finitamente generato, cioè è isomorfo ad un gruppo della forma
ZrE ⊕T , dove T è un gruppo abeliano finito. L’intero non negativo rE , detto
rango di E, è un invariante misterioso ed elusivo; la congettura di Birch e
Swinnerton-Dyer lo descrive per mezzo di un oggetto di natura analitica, la
funzione L di E. Questa è la funzione in una variabile complessa s, definita
dal prodotto infinito
Y
1
L(E, s) =
.
(21)
1 − a` (E)`−s + `1−2s
`-∆E
(La definizione consueta della funzione L include anche i fattori corrispondenti ai divisori primi di ∆E ; la funzione L ‘incompleta’ qui considerata è
comunque sufficiente per la nostra trattazione.) La disuguaglianza di Hasse
(19) permette di dimostrare che L(E, s) converge ad una funzione olomorfa
sul semipiano dei numeri complessi z = a + ib con a > 3/2. La congettura
di Birch e Swinnerton-Dyer afferma che:
1. L(E, s) si estende ad una funzione olomorfa su tutto il piano complesso;
2. l’ordine di annullamento (dell’estensione) di L(E, s) nel punto s = 1
è uguale al rango rE di E.
(Vi è una versione più precisa di questa congettura, che collega il primo
coefficiente non nullo nello sviluppo in serie di Taylor di L(E, s) in s = 1 a
certi invarianti aritmetici della curva E.)
L’ordine di annullamento di L(E, s) in s = 1 è l’unico intero r ≥ 0 tale
che l’estensione di L(E, s) al piano complesso sia della forma (s − 1)r g(s),
dove g(s) è una funzione olomorfa su C con g(1) 6= 0.
La validità della congettura di Shimura-Taniyama implica la prima parte
della congettura precedente. Specificamente, l’equazione (20) stabilisce una
relazione tra L(E, s) e i coefficienti di Fourier del differenziale ω(z), le cui
proprietà analitiche consentono di ottenere l’estensione di L(E, s) al piano
complesso.
La seconda parte della congettura di Birch e Swinnerton-Dyer è nota solo
nel caso particolare in cui l’ordine di annullamento di L(E, s) sia uguale a
0 o 1, grazie ai lavori di Gross-Zagier [GZ] e Kolyvagin [Ko]. Nel caso in
21
cui l’ordine di annullamento di L(E, s) sia maggiore di 1, la congettura è a
tutt’oggi completamente aperta e rappresenta una sfida per la matematica
del XXI secolo.
Riferimenti bibliografici
[A]
L. Ahlfors, Complex analysis. An introduction to the theory of
analytic functions of one complex variable. McGraw-Hill Book
Company, Inc., New York-Toronto-London, 1953. xii+247 pp.
[BCDT] C. Breuil, B. Conrad, F. Diamond, R. Taylor, On the modularity
of elliptic curves over Q: wild 3-adic exercises. J. Amer. Math. Soc.
14 (2001), no. 4, 843–939.
[BCEM] J. Buhler, R. Crandall, R. Ernvall, T. Metsänkylä, Irregular
primes and cyclotomic invariants to four million. Math. Comp. 61
(1993), no. 203, 151–153.
[CLAY] http://www.claymath.org/millennium/
[C]
D. Cox, Introduction to Fermat’s last theorem. Amer. Math.
Monthly 101 (1994), no. 1, 3–14.
[DDT] H. Darmon, F. Diamond, R. Taylor, Fermat’s last theorem. Elliptic curves, modular forms and Fermat’s last theorem (Hong Kong,
1993), 2–140, Int. Press, Cambridge, MA, 1997.
[Edw] H.M. Edwards, Fermat’s last theorem. A genetic introduction to algebraic number theory. Corrected reprint of the 1977 original. Graduate Texts in Mathematics, 50. Springer-Verlag, New York, 1996.
xvi+410 pp.
[F]
G. Faltings, Endlichkeitsätze für abelsche Varietäten
Zahlkörpern, Inventiones Math. 73 (1983) 349-366.
[Fr]
G. Frey, Links between stable elliptic curves and certain Diophantine
equations. Ann. Univ. Sarav. Ser. Math. 1 (1986), no. 1, iv+40 pp.
[Gr]
A. Granville, The set of exponents, for which Fermat’s Last Theorem
is true, has density one, Comptes Rendus/Mathematical Reports,
Academy of Science, Canada, 7 (1985) 55-60.
22
über
[GZ]
B.H. Gross, D.B. Zagier, Heegner points and derivatives of L-series.
Invent. Math. 84 (1986), no. 2, 225–320.
[HB]
D. Heath-Brown, Fermat’s Last Theorem is true for “almost all”
exponents, Bullettin London Math. Society 17 (1985) 15-16.
[Hel]
Y. Hellegouarch, Points d’ordre 2ph sur les courbes elliptiques. Acta
Arith. 26 (1974/75), no. 3, 253–263.
[Her]
I.N. Herstein, Algebra, Editori Riuniti, 2003.
[Ko]
V.A. Kolyvagin, Euler systems. The Grothendieck Festschrift, Vol.
II, 435–483, Progr. Math. 87, Birkhäuser Boston, Boston, MA, 1990.
[KW1] C. Khare, J-P. Wintenberger, Serre’s modularity conjecture (I),
preprint, http://www-irma.u-strasbg.fr/∼wintenb/
[KW2] C. Khare, J-P. Wintenberger, Serre’s modularity conjecture (II),
preprint, http://www-irma.u-strasbg.fr/∼wintenb/
[L]
S. Lang, Elliptic functions. With an appendix by J. Tate. Second
edition. Graduate Texts in Mathematics, 112. Springer-Verlag, New
York, 1987. xii+326 pp.
[M1]
B. Mazur, Number theory as gadfly. Amer. Math. Monthly 98
(1991), no. 7, 593–610.
[M2]
B. Mazur, Modular curves and the Eisenstein ideal. Inst. Hautes
Etudes Sci. Publ. Math. No. 47 (1977), 33–186 (1978).
[R]
K.A. Ribet, On modular representations of Gal(Q̄/Q) arising from
modular forms. Invent. Math. 100 (1990), no. 2, 431–476.
[S1]
J-P. Serre, Sur les représentations modulaires de degré 2 de
Gal(Q̄/Q). Duke Math. J. 54 (1987), no. 1, 179–230.
[S2]
J-P. Serre, Abelian `-adic representations and elliptic curves. With
the collaboration of Willem Kuyk and John Labute. Revised reprint
of the 1968 original. Research Notes in Mathematics, 7. A K Peters,
Ltd., Wellesley, MA, 1998. 199 pp.
[Sil]
J.H. Silverman, The arithmetic of elliptic curves. Graduate Texts in
Mathematics, 106. Springer-Verlag, New York, 1986. xii+400 pp.
23
[CHT] L. Clozel, M. Harris, R. Taylor, Automorphy for some ladic lifts of automorphic mod l representations, preprint,
http://www.math.harvard.edu/∼rtaylor/
[HST] M. Harris, N. Shepherd-Barron, R. Taylor, A family of
Calabi-Yau varieties and potential automorphy, preprint,
http://www.math.harvard.edu/∼rtaylor/
[T]
R.
Taylor,
Automorphy
for
some
l-adic
automorphic
mod
l
representations.
II,
http://www.math.harvard.edu/∼rtaylor/
lifts
of
preprint,
[T-W] R. Taylor, A. Wiles, Ring theoretic properties of certain Hecke
algebras, Annals Math. 141 (1995) 553-572.
[W]
A. Wiles, Modular elliptic curves and Fermat’s Last Theorem,
Annals Math. 141 (1995) 443-551.
24