1 La gerarchia BBGKY (Bogoliubov, Born, Green, Kirkwood, Yvon

Transcript

1 La gerarchia BBGKY (Bogoliubov, Born, Green, Kirkwood, Yvon
FISICA DEI FLUIDI
Lezione 3 - 11 Maggio 2012
1
La gerarchia BBGKY (Bogoliubov, Born, Green, Kirkwood,
Yvon
Per l’esame è richiesta solo la procedura generale di derivazione della gerarchia, i conti sono
facoltativi.
Partendo dall’equazione di Liouville è possibile derivare un’equazione di evoluzione per la
funzione densità a R molecole, tuttavia, come vedremo, tale equazione dipende dalla funzione
densità a R+1 molecole. Dunque se per esempio volessimo scrivere unequazione di evoluzione
per f1 , inevitabilmente ci troveremo di fronte al fatto che tale equazione contiene f2 e quindi
risulta necessario scrivere unequazione di evoluzione per la f2 , che dipenderà a sua volta da
f3 e cosı̀ via. La gerarchia di queste equazioni prende il nome di gerarchia di BBGKY. Il
numero di queste equazioni risulta essere pari a N dunque anche questa gerarchia di equazioni
non risulta particolarmente utile se si vuole effettivamente fare un calcolo realistico di una
proprità macroscopica di un gas o liquido. Come vedremo sarà necessario troncare quindi
questa gerarchia di equazioni alla prima equazione e questo ovviamente necessiterà alcune
ipotesi aggiuntive.
Iniziamo con il definire la funzione densità di probabilità ridotta a R molecole, fR =
fR (z1 , z2 , ..., zR , t) dove zi = (qi , pi ):
Z
fR = fN (z1 , z2 , ..., zN , t)dzR+1 dzR+2 , ..., dzN
(1)
Il nostro interesse sarà poi rivolto verso
Z
f1 (z1 ) = fN (z1 , z2 , ..., zN , t)dz2 dz3 , ..., dzN
e
(2)
Z
f2 (z1 , z2 ) =
fN (z1 , z2 , ..., zN , t)dz3 dz4 , ..., dzN
(3)
Ricordiamo ancora una volta che f1 dz1 rappresenta la probabilità di trovare la molecola 1 in
un volume dz1 centrato in z1 al tempo t. Anche fR come fN sarà simmetrica rispetto allo
scambio di due molecole. Supporremo ora che le molecole siano sfere rigide di diametro σ,
questo implica che due molecole sono impenetrabili e la loro distanza (da centro a centro)
può essere al più σ. Dunque la funzione di distribuzione ridotta ad una particella deve essere
ottenuta attraverso l’integrazione della funzione di distribuzione a N particelle su uno spazio
delle fasi ridotto (ossia privato della regione in cui due sfere sono sovrapposte):
Z
σ
f1 (z1 ) =
fN (z1 , z2 , ..., zN , t)dz2 dz3 , ..., dzN
(4)
Ω
e
f2σ (z1 , z2 )
Z
=
Ω0
fN (z1 , z2 , ..., zN , t)dz3 dz4 , ..., dzN
(5)
dove Ω è definito come:
Ω = {|x1 − x2 | > σ; |x1 − x3 | > σ; ...; |x1 − xN | > σ}
(6)
dunque chiamando Ωr = |x1 − xr | > σ, allora Ω = Ω2 xΩ3 x...xΩN e Ω0 = Ω3 xΩ4 x...xΩN .
Per evitare complicazioni non necessarie da qui in avanti l’apice σ verrà omesso. Risulta
anche piuttosto utile, come appena visto, tornate alle variabili posizione xi e velocità vi , dove
questi sono vettori tridimensionali e l’indice i va da 1 a N . Prima di effettuare l’integrale
è necessario discutere le condizioni al contorno per la funzione densità di probabilità. Per
quanto riguarda le velocità, l’integrale viene fatto su tutto lo spazio delle velocità, dunque la
funzione densità di probabilità. è nulla sui contorni in quanto la probabilità di trovare una
particella con velocità ±∞ è nulla. Per quanto riguarda l’integrazione sulla posizione si può
pensare di estendere il gas ad un volume maggiore di quello realmente occupato e dunque
la funzione densità di probabilità risulta essere nuovamente nulla sul contorno superiore.
Tuttavia nell’ipotesi di sfere rigide con un certo diametro σ, sarà necessario escludere quella
parte dello spazio in cui le molecole sono parzialmente sovrapposte.
Riscriviamo dunque l’equazione di Liouville:
3N
∂fN X
+
∂t
i=1
∂fN
∂fN
q̇i +
ṗi
∂qi
∂pi
=0
(7)
e usando le variabili x = q e p = mv e ṗ = F
N
∂fN X
+
∂t
i=1
1 ∂fN
∂fN
· vi +
· Fi
∂xi
m ∂vi
=0
(8)
dove Fi rappresenta la forza netta che agisce sulla molecola i-esima. Per convenienza e
semplicità considereremo il caso in cui non agiscono forze esterne sul sistema; dunque Fi è
dato solo dalla forza esercitata sulla molecola i-esima dalle altre molecole del sistema. In
meccanica statistica si assume normalmente che le forze tra le particelle sono derivabili da
un potenziale a due particelle, cosicchè la forza esercitata sulla molecola i dalla molecola j è
data dal potenziale φij che è una funzione della sola distanza rij = |xi − xj |. Si ha dunque
che:
N
X
∂φij
Fi = −
(9)
∂xi
j=16=i
Per ottenere l’equazione per la funzione di distribuzione ridotta f1 si integra l’equazione di
Liouville sul dominio Ω:
Z N ∂fN X ∂fN
1 ∂fN
+
· vi +
· Fi dx2 dx3 ...dxN dv2 dv3 ...dvN = 0
(10)
∂t
∂xi
m ∂vi
Ω
i=1
Il primo termine si integra facilmente e si ottiene:
Z
∂fN
∂f1
dx2 dx3 ...dxN dv2 dv3 ...dvN =
∂t
Ω ∂t
(11)
Per quanto riguarda l’ultimo termine nella (10) si ha che:
N Z
X
Zi=1
Ω
1 ∂fN
· Fi dx2 dx3 ...dxN dv2 dv3 ...dvN =
m ∂vi
1 ∂fN
· F1 dx2 dx3 ...dxN dv2 dv3 ...dvN +
m
∂v1
Ω
N Z
X
1 ∂fN
· Fi dx2 dx3 ...dxN dv2 dv3 ...dvN
Ω m ∂vi
(12)
i=2
Ora
∂φ1N
∂φ12 ∂φ13
+
+ ... +
F1 = −
∂x1
∂x1
∂xN
dunque il primo termine a secondo membro nella equazione (12) diventa:
Z
1 ∂fN
∂φ12 ∂φ13
∂φ1N
−
·
+
+ ... +
dx2 dx3 ...dxN dv2 dv3 ...dvN =
∂x1
∂x1
∂xN
Ω m ∂v1
Z
N −1
∂fN ∂φ12
−
·
dx2 dx3 ...dxN dv2 dv3 ...dvN =
m
∂x1
Ω ∂v1
Z
Z
N −1
∂
∂φ12
−
fN dx3 ...dxN dv3 ...dvN ·
dx2 dv2 =
m
∂v
∂x1
0
1
|x1 −x2 |>σ
Ω
Z
∂f2 ∂φ12
N −1
·
dx2 dv2
−
m
∂x1
|x1 −x2 |>σ ∂v1
(13)
(14)
dove la prima uguaglianza è legata al fatto che la funzione fN è simmetrica rispetto alle
sue variabili, dunque se cambio il pedice 3 con 2, e 4 con 2 e cosi via, ho N − 1 contributi
identici. Per la seconda uguaglianza invece si è utilizzato il fatto che ora solo fN dipende
da x3 , x4 , ..., xN , v3 , v4 , ..., xN e dunque l’integrale su quelle variabili, che è un integrale sullo
spazio Ω0 , agisce solo su fN .
Per il secondo termine a destra dell’uguale nell’equazione (12) si ha che
N Z
X
1 ∂fN
· Fi dx2 dx3 ...dxN dv2 dv3 ...dvN =
m ∂vi
i=2 Ω
N Z
X
1 ∂
· fN Fi dx2 dx3 ...dxN dv2 dv3 ...dvN
Ω m ∂vi
(15)
i=2
Utilizzando il teorema della divergenza si ha che questo integrale è nullo perché ci si trova
a calcolare un integrale su una superficie (ricordiamo che applichiamo il teorema della divergenza all’integrale di volume sulle velocità) sulla quale fN è nullo. Infatti, ricordiamo
che funzione densità di probabilità è nulla ai contorni perché la probabilità di trovare una
particella con velocità infinita è nulla. Consideriamo ora il termine che più ci interessa nella
equazione (10) e scriviamolo nel seguente modo:
N Z X
∂fN
· vi dx2 dx3 ...dxN dv2 dv3 ...dvN =
∂xi
i=1 Ω
N Z X
∂
· (vi fN ) dx2 dx3 ...dxN dv2 dv3 ...dvN =
∂xi
i=1 Ω
Z ∂
· (v1 fN ) dx2 dx3 ...dxN dv2 dv3 ...dvN +
Ω ∂x1
N Z X
∂
· (vi fN ) dx2 dx3 ...dxN dv2 dv3 ...dvN
+
Ω ∂xi
(16)
i=2
Trattiamo separatamente i due termini. Per risolvere il primo di questi integrali sarebbe
opportuno fare filtrare l’integrale all’interno della deriva fatta rispetto a x1 in modo da potere
cosi ottenere la funzione densità di probabilità a due particelle. Tuttavia tale operazione non
è fattibile in quanto il volume su cui si integra dipende da x1 in quanto è dato dal prodotto
di tutti i volumi |x1 − xr | > σ con r = 1, ..., N . Questa operazione non è lecita a meno
che non si inserisca un termine di superficie che tenga conto di questo fatto. Si utilizza
dunque una generalizzazione del teorema di Leibniz che riportiamo qui di seguito nel caso
unidimensionale:
Z b(y)
Z b
∂
∂
db
da
F (x, y)dx =
F (x, y)dx + F (b, y) − F (a, y)
(17)
∂y x=a(y)
∂y
dy
dy
a
Generalizzato al caso di un volume si ha che:
Z
Z
Z
∂
∂
F (x, y)dx =
F (x, y)dx +
F (x, y)uA · dA
∂y V (y)
V ∂y
A
(18)
dove uA rappresenta la variazione del contorno rispetto a y. Nel nostro caso il volume è dato
dal prodotto dei volumi |x1 − xr | > σ con r = 2, ..., N . Se consideriamo il singolo volume con
r per esempio fissato a 2 allora si ha:
Z
Z
∂
∂
·
F(x1 , x2 )dx2 =
· F(x1 , x2 )dx2 −
∂x1 |x1 −x2 |>σ
|x1 −x2 |>σ ∂x1
Z
(19)
F(x1 , x2 ) · dA
|x1 −x2 |=σ
Qui il segno meno indica il fatto che il volume escluso è interno alla superficie e il vettore
superficie per definizione punta verso l’esterno della superficie stessa. Ora il nostro caso è
ancora più complicato perché la funzione F = v1 fN e noi abbiamo un integrale su (N − 1)
variabili x2 , x3 , ..., xN e rispettive velocità e le superfici sono N − 1. Quindi si avrà
Z ∂
· (v1 fN ) dx2 dx3 ...dxN dv2 dv3 ...dvN =
Ω ∂x1
Z Z
∂
fN v1 · dS2 dx3 dx4 ...dxN dv2 dv3 dv4 dvN +
· (v1 f1 ) +
∂x1
S2
Z Z
fN v1 · dS3 dx2 dx4 ...dxN dv2 dv3 dv4 dvN + ...+
+
S3
Z Z
+
fN v1 · dSN dx2 dx3 ...dx(N −1) dv2 dv3 dv4 dvN =
(20)
SN
N
X
∂
· (v1 f1 ) +
∂x1
Z Z
f2 v1 · dSi dvi
Si
i=2
Qui Si indica la superficie |x1 −xi | = σ. f2 è la funzione densità di probabilità a due particelle
che per i = 2 è funzione di f2 (x1 , x2 , v1 , v2 , t), per i = 3 è funzione di f2 (x1 , x3 , v1 , v3 ) e
cosi via. Ora siccome tutte le particelle sono uguali allora per esempio nel secondo integrale
posso rinominare la molecola 3 come molecola 2 e ottenere cosi che tutti gli (N-1) integrali
danno lo stesso contributo e quindi si ha che
Z Z
N Z Z
X
f2 v1 · dSi dvi = (N − 1)
f2 v1 · dS2 dv2
(21)
i=2
Si
S2
Consideriamo ora i restanti termini nell’integrale:
N Z X
∂
· (vi fN ) dx2 dx3 ...dxN dv2 dv3 ...dvN =
∂xi
i=2 Ω
Z Z
− (N − 1)
f2 v2 · dS2 dv2 ,
(22)
S2
dove ciascun integrale a primo membro può essere risolto con il teorema della divergenza
generando cosi (N-1) integrali tutti uguali (questo sempre perché le molecole che consideriamo sono identiche). Mettendo insieme tutti i risultati che derivano dall’integrazione
dell’equazione di Liouville su uno spazio ridotto si ottiene:
Z Z
∂f1
∂f1
+ v1 ·
+ (N − 1)
f2 (v1 − v2 ) · dS2 dv2 −
∂t
∂x 1
S2
Z
(23)
N −1
∂f2 ∂φ12
−
·
dx = 0
m
∂x1
|x1 −x2 |>σ ∂v1
Ora Boltzmann fa l’ipotesi che il potenziale sia nullo per |x1 − x2 | > σ e dunque l’ultimo
termine è nullo. Il moto delle molecole di Boltzmann corrisponde al moto di sfere rigide che
sono libere di muoversi, ossia svincolate da ogni potenziale, eccetto che per gli urti casuali
con le altre molecole. L’equazione (23) diventa quindi
Z Z
∂f1
∂f1
+ v1 ·
= (N − 1)
f2 (v2 − v1 ) · dS2 dv2
(24)
∂t
∂x 1
S2
Ricordiamo che per ottenere tale equazione abbiamo supposto il termine di potenziale
nullo al di fuori della superficie dove avviene l’urto; questo equivale a considerare il potenziale di interazione a corto range. Sebbene questa ipotesi si verifica essere valida nella fisica
dei fluidi, nella fisica del plasma, nella quale vengono considerate le particelle cariche, essa
non è giustificata in quanto le interazioni avvengono anche a distanza. L’equazione (24)
contiene a secondo membro un termine integrale, noto come integrale di collisione, che contiene la funzione densità di probabilità a due particelle. Dunque nel tentativo di semplificare
il problema abbiamo introdotto una incognita in più. Quindi il sistema non è chiuso ed è
necessario introdurre unequazione di evoluzione per la funzione densità di probabilità a due
molecole. Ricavando tale equazione ci si accorge che essa contiene la densità di probabilità a
3 particelle. In tal modo si origina dunque una gerarchia di equazioni in cui ogni equazione
dipende da quella successiva e dunque il sistema risulta chiuso solo se si considerano tutte
le equazioni della gerarchia. Questa è quella che si chiama gerarchia di Bogoliubov, Born,
Green, Kirkwood, Yvon per sfere rigide che sono quelli che indipendentemente hanno ricavato
tale sistema di equazioni. Ovviamente tale procedura non ha nessuna utilità se non vengono
introdotte ulteriori ipotesi. Per ottenere un sistema chiuso è necessario ipotizzare che gli urti
a due particelle (urti binari) sino gli unici ad essere importanti, ossia si trascureranno gli
integrali di collisione a tre particelle, questo vuole dire che l’equazione di evoluzione per la
funzione densità di probabilità a due particelle risulta essere semplicemente:
2
2
∂f2 X
1 X ∂φij ∂f2
∂f2
−
+
vi ·
·
=0
∂t
∂x i m
∂xi ∂vi
i=1
2
(25)
i,j=1
L’equazione di Boltzmann per le sfere rigide
Paretendo dalla BBGKY esistono due derivazioni formali dell’equazione di Boltzmann: una
fatta da Grad (1949) e l’altra da Kirkwood (1947). Noi utilizzeremo il metodo di Grad.
Le ipotesi necessarie per questa derivazione sono le seguenti: il numero di particelle N
deve tendere all’infinito, il diametro delle sfere deve tendere a 0 (σ → 0), in modo che il
prodotto N σ 2 rimanga finito. La densità del mezzo considerato deve essere sufficientemente
bassa in modo che le collisioni binarie sono quelle più probabili. Il potenziale tra le particelle
deve essere a corto range in modo che l’ipotesi di collisioni binarie abbia senso (se il potenziale
è a lungo range, una particella può interagire contemporaneamente con altre particelle). Il
tempo medio speso da una particella in un altro dominio deve essere molto piccolo rispetto
al tempo medio tra un urto e l’altro (questa ovviamente è legata all’ipotesi che il gas sia
sufficientemente rarefatto).
Torniamo dunque all’equazione per la densità di probabilità di particella singola, equazione
(24). Dobbiamo valutare l’integrale sulla superficie S2 ; tale integrale avrà un contributo
quando avviene un urto. Ora introduciamo la velocità relativa V = v2 − v1 . Ricordiamo che
il vettore superficie è definito positivo uscente dalla superficie; dunque se l’urto tra due particelle sta per iniziare questo vuol dire che V · dS2 < 0 mentre se un urto è appena avvenuto
allora V · dS2 > 0. Questo vuol dire che l’integrale sulla superficie S2 può essere diviso in
due contributi uno dei quali ottenuto integrando su S2+ ossia sulla parte di superficie per la
quale vale V · dS2 > 0 (ossia urto appena avvenuto) e su una superficie S2− , ossia sulla parte
della superficie per la quale vale V · dS2 < 0 (urto sta per iniziare). Ossia
Z Z
Z Z
∂f1
∂f1
f2 |V · n|dS2 dv2
+ v1 ·
= (N − 1)
f2 |V · n|dS2 dv2 −
(26)
∂t
∂x 1
S2−
S2+
Durante una collisione si ha che la variabile x2 sarà uguale a x1 + σn, (con σ il diametro di
una sfera rigida che corrisponde alla distanza tra due centri di due particelle che si stanno
urtando). Per ipotesi la f2 è continua e regolare, pur essendo discontinue le velocità durante
un urto. Avendo trascurato gli urti e il potenziale nella equazione di evoluzione per f2 , essa
risulta scritta nella forma dell’equazione di Liouville, ossia la f2 risulta essere costante lungo
una traiettoria e dunque facendo una trasformazione del tipo (28) (si veda più avanti) la
funzione rimane invariata. La f2 può dunque essere scritta nell’integrale su S2+ nel seguente
modo:
f2 (x1 , v1 , x1 + σn, v2 , t) = f2 (x1 , v0 1 , x1 + σn, v0 2 , t) = f20
(27)
dove v0 1 e v0 2 sono cosı̀ legate a v1 e v2 (si veda il paragrafo sugli urti):
v0 1 = v1 + g1 (v1 , v2 )
v0 2 + = v2 + g2 (v1 , v2 )
(28)
con le funzioni g1 e g2 dipendono dal tipo di urto considerato. Possiamo dunque scrivere:
Z Z
Z Z
∂f1
∂f1
0
+ v1 ·
= (N − 1)
f2 |V · n|dS2 dv2 −
f2 |V · n|dS2 dv2
(29)
∂t
∂x 1
S2+
S2−
Visto che abbiamo considerato il potenziale a corto range, questo implica che due particelle,
prima di collidere non hanno nessuna correlazione, ossia una particella non sa dell’esistenza
dell’altra particella ed è dunque lecito supporre che la densità di probabilità a due particelle possa essere scritta come il prodotto tra le densità di probabilità a particella singola.
Questo come vedremo è quello che oggi si chiama ipotesi di chaos molecolare, chiamato da
Boltzmann stosszahlansatz. Questa assunzione come vedremo è di notevole importanza in
quanto l’equazione (26) è reversibile, dopo questa assunzione, l’equazione risultante non ha
più questa proprietà. Le conseguenze di ciò verranno discusse in seguito. Per ora quello che
possiamo fare è scrivere la funzione di densità di probabilità a due particelle come prodotto
di due densità a particella singola (ipotesi di chaos molecolare). Si ha dunque:
f2 = f2 (x1 , v1 , x2 , v2 , t) = f1 (x1 , v1 , t)f1 (x2 , v2 , t) = f1 (1)f1 (2)
(30)
Utilizzando ora le ipotesi di Boltzmann, quindi facendo tendere a 0 il diametro delle sfere
rigide si ha che tutte le coordinate spaziali contenute come argomenti delle funzioni densità di
probabilità tendono a x1 (si ricordi che durante una collisione le due particelle sono separate
dalla distanza σ che tende a 0):
Z Z
∂f1
∂f1
+ v1 ·
= (N − 1)
[f10 (1)f10 (2) − f1 (1)f1 (2)]|V · n|dS2 dv2
(31)
+
∂t
∂x 1
S2
dove tutte le f e le f 0 che compaiono nell’integrale di collisione sono funzioni della coordinata
x1 e i due integrali si sono ricombinati in quanto mandando n in −n S2− diventa S2+ e
l’integrando non cambia. Facendo il limite N → ∞ e tenendo presente che l’integrale è su
una superficie e dunque va come σ 2 , si può trascurare 1 nella parentesi tonda a secondo
membro e il secondo membro non diverge (N σ 2 = cost per una delle ipotesi precedentemente
fatte). Si ha dunque la celebrata equazione di Boltzmann:
Z Z
∂f1
∂f1
+ v1 ·
=N
[f10 (1)f10 (2) − f1 (1)f1 (2)]|V · n|dS2 dv2
(32)
∂t
∂x 1
S2+
Questa è una equazione integro-differenziale nonlineare che ci permette di calcolare l’evoluzione
nel tempo della funzione densità di probabilità a particella singola immersa in un gas a N
particelle. Assegnata una funzione densità di probabilità al tempo t = 0, definita in tutto
lo spazio delle fasi (e dunque definita la posizione e la velocità di ciascuna delle N particelle), è possibile calcolare come la funzione densità di probabilità evolva. Nella equazione
di Boltzmann compaiono ancora le funzioni g1 e g2 che verranno determinate nella sezione
successiva.
Per brevità ometteremo il pedice nella funzione densità di probabilità a particella singola e
espliciteremo la dipendenza della funzione di densità di probabilità dalla velocità, omettendo
la dipendenza dal tempo. L’equazione di Boltzmann si scrive dunque nel seguente modo:
Z Z
∂f (v1 )
∂f (v1 )
(f (v0 1 )f (v0 2 ) − f (v1 )f (v2 ))|V · n|dS2 dv2
+ v1 ·
=N
(33)
+
∂t
∂x1
S2
dove v0 i = vi + gi con i = 1, 2. Questa è la forma più comune dell’equazione di Boltzmann.
Ricordiamo che nella derivazione dell’equazione di Boltzmann (più precisamente nella
derivazione della gerarchia BBGKY) abbiamo supposto che la forza che agisce sulla particelle
i-esima è data solo dalla forza dovuta alle altre N − 1 molecole, tralasciando la possibilità di
inserire delle forze esterne. Se queste ultime fossero state prese in considerazione dall’inizio,
si sarebbe ottenuta la seguente equazione di Boltzmann:
∂f (v1 )
∂f (v1 ) F1 (e) ∂f (v1 )
+ v1 ·
+
·
=
∂t
∂x1
m
∂v1
Z Z
=N
(f (v0 1 )f (v0 2 ) − f (v1 )f (v2 ))|V · n|dS2 dv2
(34)
S2+
2.1
Cenni sulle collisioni binarie
Qui considereremo l’urto classico tra due sfere rigide di massa identica. In tale urto sia la
quantità di moto, sia l’energia si conservano e dunque se chiamiamo v1 e v2 le velocità prima
dell’urto e v10 e v20 le velocità dopo l’urto, abbiamo che:
v1 + v2 = v10 + v20
v12 + v22 = v102 + v202
(35)
dove con vi = |vi |. Questo sistema di equazioni ha sei incognite v10 , v20 e quattro equazioni,
dunque oltre a v1 e v2 bisognerà specificare altri due parametri per definire le variabili
dopo l’urto in funzione delle variabili prima dell’urto. Per completare la descrizione dunque
introduciamo il versore n che è diretto lungo la direzione v10 − v1 (tale direzione e verso
corrispondo a quello che unisce i centri delle due sfere nell’istante dell’urto, n = (x2 −
x1 )/|x2 − x1 |). Introduciamo una quantità scalare a tale che:
sciccome v10 − v1 = v2 − v20 allora
v10 − v1 = an
(36)
v2 − v20 = an
(37)
Dunque avremo che
v10 = v1 + an
v20 = v2 − an
(38)
E’ necessario determinare a. Per fare ciò si può prendere il modulo quadro a ciascun membro
della (38) e sostituire nell’equazione di conservazione dell’energia:
v12 + v22 = v12 + v22 + 2av1 · n − 2av2 · n + a2
(39)
av2 · n − 2av1 · n = a2
(40)
da cui
che per a 6= 0, si ottiene a = V · n, dove, usando la stessa notazione di prima V = v2 − v1 .
Dunque si ha che:
v10 = v1 + n(V · n)
v20 = v2 − n(V · n)
(41)
Si noti che quando (V · n) = 0 allora la trasformazione T è una identità. Dunque le (42)
definiscono le trasformazioni che permettono di passare dalle v1 e v2 alle v10 e v20 . E’ necessario
trovare la trasformazione inversa T −1 . Sottraendo la seconda dalla prima nella (42) si ottiene:
V0 = V − 2n(V · n)
(42)
dove V0 = v20 − v10 . Moltiplicando scalarmente per n si ottiene:
V0 · n = −V · n
(43)
si ha quindi
v1 = v10 + n(V0 · n)
v2 = v20 − n(V0 · n)
(44)
Questo tipo di trasformazione per la quale T = T −1 si dice involutiva. Per questo tipo di
trasformazioni è possibile verificare che lo Jacobiano della trasformazione T e T −1 è =1:
dv1 dv2 = |J|dv10 dv20 = dv10 dv20
(45)
con
J=
0 , v0 , v0 , v0 )
∂(v1x
1y 2x 2y
=1
∂(v1x , v1y , v2x , v2y )
(46)
Ciò puó essere dimostrato calcolando esplicitamente lo Jacobiano.
Si può anche dimostrare che V non varia in modulo durante un urto, |V| = |V0 |. Per fare
ciò dimostriamo prima che v1 · v2 = v10 · v20 . Si calcoli il modulo quadro di entrambi i membri
nell’equazione di conservazione della quantità di moto:
|v1 + v2 |2 = |v10 + v20 |2
v12 + v22 + 2v1 · v2 = v102 + v202 + 2v10 · v20
(47)
siccome deve valere l’equazione di conservazione dell’energia allora v1 · v2 = v10 · v20 Ora
consideriamo
|v1 − v2 |2 = v12 + v22 − 2v1 · v2 = v102 + v202 − 2v10 · v20 = |v10 − v20 |2
(48)
e quindi |V| = |V0 |.
3
Irreversibilità e teorema H
L’equazione di Boltzmann non è sicuramente facile da risolvere analiticamente; tuttavia Boltzmann fu in grado di trovare una soluzione stazionaria, che come vedremo corrisponde alla
distribuzione
Maxwelliana delle velocità. A questo scopo introdusse la grandezza H definita
R
come f ln f dv e dimostrò che la derivata rispetto al tempo di H non è mai positiva, i.e.
∂H/∂t ≤ 0 ed è nulla solo se la distribuzione è quella di Maxwell. La dimostrazione rigorosa di tutto ciò, come spiegato in [?] è non banale e solo negli anni trenta fu fatta una
dimostrazione rigorosa. Il teorema H portò ad una sorta di paradosso nella fisica: mentre le
equazioni (dinamiche) per l’evoluzione delle particelle e pure l’equazione di Liouville (come
le equazioni nella gerarchia BBGKY) hanno la proprietà di essere reversibili, l’equazione di
Boltzmann non gode di questa proprietà. Per reversibilità in una equazione differenziale si
intende la seguente cosa: se f (x, v, t) è soluzione allora è soluzione anche f (x, −v, −t). Altrimenti detto se faccio la trasformazione t → −t e v → −v l’equazione rimane invariata.
Ora l’equazione di Boltzmann non ha questa proprietà, dunque non è invariante per trasformazioni che invertono le velocità e il tempo. Dunque la conclusione di molti contemporanei
di Boltzmann fu che la sua equazione era semplicemente sbagliata in quanto violava alcuni
principi della meccanica.
Due furono le critiche più aspre. La prima di Zermelo il quale, citando il teorema di
ricorrenza di Poincare, sosteneva l’inesattezza dell’equazione di Boltzmann. Il teorema dice
che per un qualsiasi sistema meccanico chiuso, soggetto solo a forze di tipo conservativo, ogni
stato (ossia ogni punto nello spazio delle fasi), viene rivisitato con una accuratezza desiderata
(ma non esattamente) un numero infinito di volte; quindi se io considero una certa condizione
iniziale, dopo un certo tempo la mia soluzione tornerà vicino a piacere alla condizione iniziale. In base a queste considerazioni risultava impossibile fare una derivazione del secondo
principio della termodinamica partendo dalla meccanica. Boltzmann rispose che i tempi di
ricorrenza per un gas in un cm3 che contiene 1018 molecole è dell’ordine di 1019 secondi,
ossia un tempo pari a qualche vita dell’universo. Dunque non si sta violando il teorema di
Poincarre, ma il teorema risulta essere irrilevante. Questo è noto come il paradosso della
ricorrenza di Zermelo. La seconda forte critica sull’equazione di Boltzmann è nota come il
paradosso di reversibilità di Loschmidt: come si può partendo da leggi per sistemi microscopici reversibili arrivare a leggi per osservabili macroscopiche irreversibili? Questo paradosso fu
analizzato da Thomson nel 1874. Egli notò che invertendo i tempi e le velocità si potrebbero
osservare dei fenomeni paradossali (tutte le molecole all’interno di una stanza si ordinano e
escono dalla finestra... oppure tutto il profumo diffuso in una stanza ritorna nel contenitore
da cui il profumo era inizialmente uscito). Boltzmann rispose ai sui critici ma le sue risposte
no vennero accettate da molti scienziati del tempo. Fu solo parecchi anni dopo, nel 1911,
che gli Ehrenfest pubblicarono un famoso lavoro in difesa di Boltzmann nel quale le sue idee
vennero messe su basi ferree e largamente accettate. Essi spiegarono il perché l’equazione di
Boltzmann non era in contrasto con la meccanica classica. Ciò che i critici avevano trascurato
erano alcuni aspetti fondamentali nella derivazione dell’equazione: l’equazione di Boltzmann
fornisce una descrizione probabilistica piuttosto che una descrizione meccanica. Non bisogna
dimenticare che per derivare l’equazione di Boltzmann si è partiti da una funzione densità
di probabilità fN che poi è stata ridotta a f1 integrando nello spazio delle fasi, perdendo
delle informazioni. E’ possibile dimostrare che solo tale processo porta all’irreversibilità. Inoltre lipotesi di stossahlansatz chiaramente introduce un effetto non meccanico nell’equazione.
Questa ipotesi è di natura stocastica e non ha nessuna base di tipo meccanico e quindi ci
si può aspettare che l’equazione di Boltzmann possa portare a dei risultati non attesi dalla
sola meccanica. Negli anni 50 e 60 ci furono una serie di lavori sperimentali e numerici che
permisero di verificare che la grandezza H definita da Boltzmann effettivamente decresce in
media, seppur fluttuando, in modo monotono nel tempo. Le fluttuazioni decrescono quando
cresce il numero di particelle nel sistema. Se però dopo pochi urti si invertono le velocità e
si segue l’evoluzione di H si trova che questa grandezza prima cresce fino a raggiungere la
condizione iniziale per poi riprendere a decrescere. Quindi si può affermare che esistono dei
dati iniziali che portano ad un aumento temporaneo della quantità H. Tuttavia questi stati
iniziali sono caratterizzati da delle probabilità molto basse rispetto alla probabilità di uno
stato che porta ad una crescita di H.
Per dimostrare il teorema H di Boltzmann è necessario prima studiare alcune proprietà
dell’equazione di Boltzmann, in particolare nella sezione successiva si studieranno gli invarianti d’urto per l’equazione di Boltzamnn.
3.1
Invarianti d’urto e costanti del moto
La procedura necessaria per derivare le equazioni macroscopiche consiste nel moltiplicare
l’equazione di Bolzmann per la variabile di interesse e integrare sulle velocità. Dunque risulta
importante studiare l’integrale:
Z
J(f (v1 ))φ(v1 )dv1
(49)
dove J(f (v1 )) è l’integrale d’urto:
Z Z
(f (v0 1 )f (v0 2 ) − f (v1 )f (v2 ))|V · n|dS2 dv2
J(f (v1 )) = N
S2+
(50)
Sfruttando le proprietà di simmetria dell’integrale, riscriveremo l’integrale in diversi modi del
tutto equivalenti che ci permetteranno poi di affermare che l’integrale è nullo, per ogni f ,
tutte le volte che:
φ(v1 ) + φ(v2 ) = φ(v0 1 ) + φ(v0 2 )
(51)
Se l’integrale è nullo vuole dire che l’equazione si può scrivere in forma di legge di conservazione e quindi la quantità
Z
f (v)φ(v)dv
(52)
è una quantità conservata dall’equazione, ossia durante l’evoluzione di f (v), tale quantità
non cambia, pur cambiando f .
Se consideriamo l’integrale in (53) e scambiamo v1 con v2 l’integrale non cambia dunque
può essere riscritto come
Z Z
I0 = N
φ(v2 )(f (v0 1 )f (v0 2 ) − f (v1 )f (v2 ))|V · n|dS2 dv2 dv1 = I1
(53)
S2+
Ora rinominando le variabile v1 con v0 1 e v2 con v0 2 otteniamo:
Z Z
I0 = N
φ(v0 2 )(−f (v0 1 )f (v0 2 ) + f (v1 )f (v2 ))|V0 · n|dS2 dv0 2 dv0 1
(54)
dove si tiene conto del fatto che dv0 2 dv0 1 = dv2 dv1 e |V0 | = |V| allora
Z Z
I0 = N
φ(v0 2 )(−f (v0 1 )f (v0 2 ) + f (v1 )f (v2 ))|V · n|dS2 dv2 dv1 = I2
(55)
S2+
S2+
si può fare un ultimo cambio di variabile e scambiare nella (54) dv0 1 dv0 2 per ottenere:
Z Z
I0 = N
φ(v0 1 )(−f (v0 1 )f (v0 2 ) + f (v1 )f (v2 ))|V · n|dS2 dv2 dv1 = I3
(56)
+
S2
Quindi l’integrale I0 può essere scritto come (I0 + I1 + I2 + I3 )/4 ottenendo cosı̀:
Z Z
1
I0 = N
(φ(v1 ) + φ(v2 ) − φ(v0 1 ) − φ(v0 2 ))
+
4
S2
0
(57)
0
(f (v 1 )f (v 2 ) − f (v1 )f (v2 ))|V · n|dS2 dv2 dv1
Qualunque sia f l’integrale è nullo se la (51) è verificata. Dunque la (51) è condizione
sufficiente affinchè l’integrale sia nullo. Le funzioni φ che soddisfano tale proprietà si chiamano
invarianti d’urto. E’ facile intuire che il numero di particelle (o l’integrale della funzione
densità di probabilità), ottenuta con φ(v) = 1 sia un invariante d’urto. La stessa cosa può
essere detta per la quantità di moto, φ(v) = mv e per l’energia φ(v) = mv 2 /2. L’integrale
di collisione è stato ottenuto attraverso le leggi dell’urto elastico per le quali sia la quantità
di moto sia l’energia sono conservate, dunque questo risultato è atteso. Quello che è meno
ovvio (e noi non dimostreremo) è che queste sono le uniche quantità conservate. La forma più
generale dell’invariante d’urto è dunque data da una combinazione lineare delle tre quantità
conservate:
1
φ = a + mb · v + mv 2
(58)
2
Questo risultato fu ottenuto già da Boltzamnn come unica soluzione dell’equazione (51),
facendo l’ipotesi che la φ fosse derivabile due volte. Solo più recentemente (negli anni 90) fu
fatta una dimostrazione del tutto generale.