Appunti sulla relazione di dispersione E(k) nei cristalli

Transcript

M. RUDAN — APPUNTI SULLA RELAZIONE DI DISPERSIONE NEI CRISTALLI
1
Appunti sulla relazione di
dispersione E(k) nei cristalli
M. Rudan
I. L A
L
quindi
FUNZIONE LAGRANGIANA
A legge del moto di un punto materiale di massa m si
scrive
F = ma ,
(1)
in cui le componenti dell’accelerazione a saranno indicate nel
seguito con ẍi (t), i = 1, 2, 3. La forza F dipende, nel caso più
generale, dalle componenti xi (t) della posizione r del punto
materiale, dalle componenti ẋi (t) della velocità u = ṙ di esso,
e dal tempo t. Di conseguenza, le tre componenti scalari della
legge del moto (1) hanno la forma
ẍi =
1
Fi (r, ṙ, t) ,
m
i = 1, 2, 3 .
(2)
Dal momento che nelle (2) la forma delle Fi è assegnata, le
(2) costituiscono un sistema di tre equazioni differenziali del
secondo ordine nel tempo, nelle incognite xi . Le tre equazioni
sono tra loro accoppiate poiché i secondi membri contengono
anche le componenti della posizione e della velocità con indici
diversi da i. Le (2) sono lineari nelle derivate seconde ẍi ,
mentre sono lineari o meno nelle xi e ẋi a seconda della
forma delle Fi .
Le (2) possono riscriversi in una forma notevole introducendo
la funzione lagrangiana L. Essa è una funzione scalare L =
L(r, ṙ, t) tale che le tre equazioni differenziali
d ∂L
∂L
=
,
dt ∂ ẋi
∂xi
i = 1, 2, 3
(3)
siano ordinatamente identiche alle (2). Le (3) sono dette
equazioni di Lagrange.
Non è detto che per espressioni delle Fi assegnate ad arbitrio
esista una lagrangiana. Tuttavia, se le forze derivano da
un’energia potenziale V = V (r), cioè se
Fi = Fi (r) = −
∂V
,
∂xi
(4)
si verifica facilmente che la lagrangiana esiste e vale
L=T −V ,
T =
1
1
mu2 = m(ẋ21 + ẋ22 + ẋ23 ) ,
2
2
(5)
essendo T l’energia cinetica del punto materiale. Infatti, osservando che V non dipende dalle componenti della velocità,
si trova
∂T
∂L
=
= mẋi ,
(6)
∂ ẋi
∂ ẋi
E. De Castro Advanced Research Center on Electronic Systems, e Dipartimento di Elettronica, Informatica e Sistemistica, Università di Bologna, Viale
Risorgimento 2, I-40136 Bologna.
d ∂L
= mẍi .
(7)
dt ∂ ẋi
Poi, osservando che T non dipende dalle componenti della
posizione, si trova
∂V
∂L
=−
= Fi .
(8)
∂xi
∂xi
Uguagliando la (8) alla (7) si ottiene la (2) per ciascun indice
i, il che dimostra che le (3) sono equivalenti alle (2). Si
noti che nel caso particolare considerato come esempio (cioè
Fi = −∂V /∂xi ) le componenti della forza non dipendono
dalla velocità del punto materiale e non hanno una dipendenza
esplicita dal tempo.
Le (3) sono dette equazioni di Lagrange, e la funzione pi =
pi (t) definita, per ogni indice i, dalla
∂L
,
(9)
∂ ẋi
è detta momento coniugato alla coordinata xi . Le due funzioni
xi (t) e pi (t) sono anche dette variabili canoniche coniugate.
Quanto detto si generalizza al caso in cui, anziché un solo
punto materiale, si considera un sistema di N punti materiali
interagenti. Supponendo per semplicità che il sistema non sia
soggetto a vincoli, i gradi di libertà di esso saranno s = 3N .
Indicando con r j il vettore posizione del jmo punto materiale,
j = 1, . . . , N , la componente della forza e la lagrangiana si
scriveranno
pi =
Fi = Fi (r1 , ṙ1 , . . . , rN , ṙ N , t) ,
(10)
L = L(r1 , ṙ 1 , . . . , r N , ṙN , t) ,
(11)
dove l’indice i della componente della forza varia su tutti i
gradi di libertà del sistema, cioè i = 1, . . . , s. La definizione
del momento pi coniugato alla coordinata xi è data sempre
dalla (9), e le equazioni di Lagrange sono identiche alle (3) con
l’unica differenza che la lagrangiana dipende dalla posizione
e dalla velocità di tutti i punti materiali, e l’indice i varia su
tutti i gradi di libertà:
∂L
d ∂L
=
,
i = 1, . . . , s .
(12)
dt ∂ ẋi
∂xi
Se la forza deriva da un’energia potenziale V (r 1 , . . . , rN ), si
ha
∂V
Fi = Fi (r 1 , . . . , rN ) = −
,
(13)
∂xi
e vale ancora la (5) con
T =
N
X
1
j=1
2
mj u2j ,
uj = |ṙj | .
(14)
2
Si può notare che applicando la (9) al caso in cui la forza
deriva da un’energia potenziale si ottiene, per il punto materiale di indice j, pj = mj uj , dove pj è il vettore formato dalle
tre componenti momento del punto materiale considerato. In
altri termini, il momento di un punto materiale coincide con la
quantità di moto di esso. Questo risultato non è generale, ma
vale solo nel caso di forze derivanti da un’energia potenziale
e se si adotta un sistema di coordinate cartesiane ortogonali.
Dal momento che L dipende dalle qi e dalle q̇i , oltre che dal
tempo, le (21,22) esprimono pi e ṗi in funzione delle qi , delle
q̇i , e del tempo. Inoltre, dalla (19) si trova che
II. C OORDINATE GENERALIZZATE
Il sistema di coordinate cartesiane ortogonali non è l’unico
possibile, e spesso è più conveniente usare un sistema diverso. Di conseguenza, è necessario determinare come si
trasformano le relazioni del paragrafo I in seguito a una
trasformazione di coordinate. Le nuove coordinate verranno
indicate con qi , i = 1, . . . , s e saranno chiamate coordinate
generalizzate. Le corrispondenti derivate rispetto al tempo,
q̇i , saranno chiamate velocità generalizzate. Si noti che le qi
non hanno necessariamente le dimensioni di una lunghezza (si
pensi ad esempio al caso delle coordinate polari), e quindi le
q̇i non hanno necessariamente le dimensioni del rapporto fra
una lunghezza e un tempo. Le leggi di trasformazione dalle
coordinate cartesiane ortogonali alle nuove coordinate sono
relazioni del tipo
qi = qi (x1 , . . . , xs , t) ,
i = 1, . . . , s.
(15)
Il tempo può apparire esplicitamente nelle (15) perché il nuovo
sistema di riferimento può essere mobile rispetto al vecchio.
Si suppone che le (15) siano invertibili, cioè che esistano le
[qi ] [pi ] = [L] [t] ,
(23)
dove si sono usate le parentesi quadre per indicare le dimensioni. Le dimensioni della lagrangiana nel sistema cartesiano
ortogonale sono quelle di un’energia (si pensi all’esempio
delle forze derivanti da un’energia potenziale). Dal momento
che una trasformazione di coordinate non modifica le dimensioni della funzione trasformata, dalla (23) segue che il
prodotto di due variabili canoniche coniugate ha sempre le
dimensioni del prodotto di un’energia per un tempo. Tale
prodotto viene chiamato azione. Nell’esempio del paragrafo
I si ha pi = mẋi e la proprietà espressa dalla (23) si verifica
immediatamente.
III. L A
FUNZIONE HAMILTONIANA
Come si è detto prima, la (21) esprime pi in funzione delle
qi , delle q̇i e del tempo:
pi = pi (q1 , q̇1 , . . . , qs , q̇s , t) ,
i = 1, . . . , s .
(24)
Se il sistema delle (24) è invertibile, da esso si possono
ricavare le q̇i in funzione delle qi , delle pi e del tempo:
q̇i = q̇i (q1 , p1 , . . . , qs , ps , t) ,
i = 1, . . . , s .
Si consideri ora la funzione definita dalla
s
X
pi q̇i − L ,
H=
(25)
(26)
i=1
xi = xi (q1 , . . . , qs , t) ,
i = 1, . . . , s.
(16)
Una volta assegnate le (15), si calcolano le
q̇i = q̇i (x1 , ẋ1 , . . . , xs , ẋs , t) ,
i = 1, . . . , s
(17)
semplicemente applicando le regole della derivazione. Nello
stesso modo, dalle (16) si calcolano le
ẋi = ẋi (q1 , q̇1 , . . . , qs , q̇s , t) ,
i = 1, . . . , s .
(18)
A questo punto si possono introdurre le (16) e le (18) nella
(12), ottenendo le equazioni di Lagrange espresse in funzione
delle coordinate generalizzate. Il risultato notevole è che la
forma delle equazioni resta identica:
∂L
d ∂L
=
,
dt ∂ q̇i
∂qi
i = 1, . . . , s ,
(19)
con
L = L(q1 , q̇1 , . . . , qs , q̇s , t) .
(20)
Per il momento coniugato a qi si usa lo stesso simbolo
introdotto nel caso delle coordinate cartesiane ortogonali:
pi =
∂L
,
∂ q̇i
i = 1, . . . , s .
(21)
Combinando la (21) con la (19) si ottiene
ṗi =
∂L
,
∂qi
i = 1, . . . , s .
nella quale, grazie alle (25), le velocità generalizzate sono
espresse in fuzione delle coordinate generalizzate qi e dei
momenti coniugati pi . Ne risulta
(22)
H = H(q1 , p1 , . . . , qs , ps , t) .
(27)
La funzione H è detta funzione hamiltoniana del sistema di
punti materiali considerato. Si può dimostrare che, usando la
funzione hamiltoniana, si ottengono le equazioni di Hamilton
q̇i =
∂H
,
∂pi
ṗi = −
∂H
,
∂qi
i = 1, . . . , s ,
(28)
che sono equivalenti alle equazioni di Lagrange (19) per la
descrizione della dinamica del sistema considerato. Si può
notare che ogni coppia (28) rappresenta due equazioni differenziali del primo ordine nel tempo nelle incognite qi e pi ,
mentre ognuna delle (19) è un’equazione del secondo ordine
nelle qi (che sia del secondo ordine è evidente dal fatto che
la lagrangiana contiene le q̇i , e quindi la derivazione rispetto
al tempo che appare al primo membro delle (19) produce le
derivate seconde delle qi ). In altri termini, il sistema di s
equazioni del secondo ordine della formulazione lagrangiana
è sostituito da un sistema di 2s equazioni del primo ordine
nella formulazione hamiltoniana.
Le condizioni iniziali necessarie per risolvere il problema sono
2s sia nella formulazione lagrangiana che in quella hamiltoniana. Infatti, nel primo caso le equazioni da risolvere sono
s, ma ciascuna richiede due condizioni perché è del secondo
3
ordine (tipicamente qi (t = 0) e q̇i (t = 0)). Nel secondo caso
le equazioni da risolvere sono 2s, ma ciascuna richiede solo
una condizione perché è del primo ordine (qi (t = 0) per la
prima equazione della coppia e pi (t = 0) per la seconda).
Nel caso delle forze derivabili da un’energia potenziale V , e
usando le coordinate cartesiane ortogonali, si trova
in cui l’ultima relazione si trova dalla legge del moto F =
ma esprimendo l’accelerazione come derivata della velocità.
D’altra parte, l’ultimo termine a destra della (35) vale
H =T +V ,
(29)
dove nel caso del singolo punto materiale si ha
T =
1 2
1 2
p =
(p + p22 + p23 ) ,
2m
2m 1
V = V (r) .
(30)
Invece, per un sistema di N punti materiali si ha
T =
N
X
1 2
pj ,
2m
j
j=1
V = V (r 1 , . . . , r N ) .
(31)
Per esempio, applicando le equazioni di Hamilton (28) alla
(30) si trova, dalla prima,
q̇i =
∂H
∂T
=
= ẋi ,
∂pi
∂pi
(32)
∂V
∂H
=−
= Fi .
∂qi
∂qi
(33)
e dalla seconda
ṗi = −
D’altra parte, come osservato nel paragrafo II, in questo caso
si ha anche pi = mẋi . Quindi, inserendo questa relazione
nella prima delle (32) e combinando il risultato con la (33), si
trova la legge del moto mẍi = Fi . Lo stesso risultato si trova
quando si considera un sistema di N punti materiali anziché
un singolo punto materiale.
Si noti che, nell’esempio della forza derivabile da un’energia
potenziale, l’espressione dell’energia cinetica T della formulazione hamiltoniana in coordinate cartesiane ortogonali, data
dalla prima delle (30) nel caso del singolo punto materiale,
si ricava da quella della formulazione lagrangiana, cioè la
prima delle (5), semplicemente sostituendo u2 con p2 /m2 .
Analogamente, per un sistema di N punti materiali si passa
dalla (14) alla (31) sostituendo u2j con p2j /m2j .
Un’altra proprietà che si dimostra nel caso di forze derivabili
da un’energia potenziale è che l’hamiltoniana non dipende
esplicitamente dal tempo ed è una costante del moto. Usando
le coordinate cartesiane ortogonali,
H = H(x1 , p1 , . . . , xs , ps ) = cost .
(34)
In altri termini, nonostante che tutte le coordinate e tutti i momenti siano in generale variabili nel tempo, essi si combinano
nell’hamiltoniana in modo tale che quest’ultima resti costante.
Prendendo ad esempio il caso del singolo punto materiale,
questa proprietà si dimostra facilmente considerando il lavoro
esercitato dalla forza F durante un intervallo infinitesimo di
tempo dt a partire dall’istante t, durante il quale il punto
materiale varia la propria posizione della quantità dr. Osservando che dr = udt, dove u è la velocità del punto materiale
all’istante t, il lavoro vale
F • dr = F • udt = mu̇ • udt ,
(35)
mu̇ • udt =
1
1
m d(u • u)
dt = md(u2 ) =
d(p2 ) . (36)
2
dt
2
2m
Inoltre, ricordando che le componenti della forza sono le
derivate dell’energia potenziale cambiate di segno, il primo
termine a sinistra della (35) vale
F • dr = − grad V • dr = −dV ,
(37)
e quindi rappresenta la variazione dell’energia potenziale del
punto materiale dovuta allo spostamento dr. Perciò la (35)
implica che nell’intervallo di tempo dt sia nulla la variazione
della quantità p2 /(2m) + V . Di conseguenza, la somma
p2 /(2m)+V è una costante del moto. Come noto, tale costante
è detta energia totale e viene di solito indicata col simbolo E.
Un’ultima osservazione, sempre relativa a una forza derivabile
da un’energia potenziale, è la seguente. Ciò che determina
il moto di un punto materiale è la forza, mentre l’energia
potenziale è una funzione ausiliaria che permette di esprimere
le leggi del moto con un formalismo più generale. Dal momento che l’energia potenziale, se esiste, è quella funzione
definita in modo tale che la forza ne sia il gradiente, è evidente
che l’energia potenziale V è definita a meno di una costante
additiva arbitraria. Al contrario, l’energia cinetica T è definita
senza costanti arbitrarie. Di conseguenza, sempre nel caso in
cui la forza deriva da un’energia potenziale, anche l’energia
totale H = T + V = E è definita a meno di una costante
additiva arbitraria. Il valore della costante non ha nessun
effetto sulla descrizione del moto. Questa, infatti, è ottenuta
con le equazioni di Hamilton (28), nelle quali la costante
additiva viene comunque eliminata quando si calcolano le
derivate parziali. In ogni caso, quando si studia un problema
dinamico la costante additiva dell’energia potenziale viene
automaticamente assegnata quando si prescrive la dipendenza
funzionale di V dalle coordinate, e ciò fissa di conseguenza
anche il valore dell’energia totale, che come ricordato prima
è una costante del moto.
IV. C OMMENTI
La trattazione svolta finora ha introdotto concetti, in particolare quello di funzione lagrangiana e funzione hamiltoniana,
la cui importanza non può essere apprezzata del tutto sulla
base del semplice esempio delle forze ricavabili da un’energia
potenziale. Infatti, tale esempio può essere trattato con le
tecniche della fisica elementare, e le generalizzazioni descritte
non sembrano apportare vantaggi sostanziali. Al contrario,
la formulazione lagrangiana e hamiltoniana della meccanica
sono estremamente importanti, perché si applicano senza
modificazioni anche al caso di forze più generali di quelle
esaminate nell’esempio, e in qualunque sistema di coordinate.
Inoltre, esse consentono di ricavare direttamente informazioni
importanti sul sistema in esame, ad esempio, sulle costanti
del moto e sulle proprietà d’invarianza dovute a particolari
simmetrie del sistema. Infine, il formalismo lagrangiano e
hamiltoniano può essere esteso a sistemi che non sono formati
da particelle, ad esempio i campi, e allo studio dei problemi
quantistici.
Quanto detto nei precedenti paragrafi si riferisce a una descrizione della dinamica basata sul concetto di punto materiale
e sull’ipotesi che gli effetti relativistici siano trascurabili.
Quando si studiano i dispositivi a stato solido, si trova che gli
effetti relativistici sono ancora trascurabili perché le velocità
delle particelle all’interno di un materiale sono comunque
molto piccole rispetto a quella della luce. Invece non sono più
trascurabili gli effetti quantistici, dal momento che le particelle
devono essere studiate su scala atomica. Di conseguenza è
necessario generalizzare la trattazione dei precedenti paragrafi.
Per procedere, è utile considerare la funzione hamiltoniana
di un singolo punto materiale, nel caso di forze derivabili da
un’energia potenziale. Essa è una costante del moto E che,
secondo quanto detto alla fine del paragrafo III, può essere
considerata completamente definita una volta che sia assegnata
la dipendenza dell’energia potenziale V (r) dalle coordinate.
Si può notare che per il calcolo della costante E è sufficiente
assegnare le condizioni iniziali del moto. Infatti, assegnando i
valori di p1 , p2 e p3 all’istante iniziale si fissa il valore iniziale
dell’energia cinetica T , e assegnando i valori di x1 , x2 e x3
all’istante iniziale si fissa il valore iniziale di quella potenziale.
A questo punto l’energia totale E = T + V è assegnata, e
mantiene lo stesso valore indipendentemente dall’evoluzione
successiva delle variabili dinamiche xi e pi .
Si fissi ora un generico istante di tempo, e si consideri una
posizione fissa r 0 dello spazio. L’energia potenziale si riduce
perciò a una costante nota V0 e, di conseguenza, l’energia totale diventa una funzione delle sole componenti del momento:
E = E(p) =
1
(p2 + p22 + p23 ) + V0 .
2m 1
(38)
Naturalmente questa relazione non è più utile per descrivere
la dinamica del punto materiale, dal momento che il tempo
e il punto sono stati fissati. Lo scopo della (38) è quello di
mettere in evidenza la relazione funzionale fra E e p. Per
chiarirne il significato si può pensare che l’istante fissato sia
quello iniziale, t = 0, e che il punto r 0 sia la posizione
iniziale del punto materiale. Per completare l’assegnazione
delle condizioni iniziali del moto devono essere fissate anche
le componenti di p a t = 0. Dal momento che esse possono
essere assegnate ad arbitrio, agl’infiniti valori iniziali possibili
delle componenti di p corrispondono infiniti valori iniziali di
T e quindi infiniti valori della costante E. La (38) fornisce
appunto la relazione con cui si calcola E.
Come si vedrà nel paragrafo V, è proprio la relazione E(p)
che viene profondamente modificata quando si passa al caso
della dinamica di un elettrone in un cristallo. Per questo, è
opportuno mettere in evidenza alcune proprietà della (38):
1) Non ci sono limiti ai possibili valori delle componenti
di p e, di conseguenza, non ci sono limiti ai valori di E
maggiori o uguali a V0 .
2) La relazione E(p) è pari nelle componenti di p, cioè
per ogni indice i si ha E(−pi ) = E(pi ).
3) Le componenti di p, e di conseguenza E, variano con
continuità nei rispettivi domini.
4
V. D INAMICA
DI UN ELETTRONE IN UN CRISTALLO
Per quello che riguarda i cristalli, che sono oggetto di questa
trattazione, si suppongono noti i seguenti concetti:
1) Con riferimento al reticolo diretto: nodo, vettore caratteristico ai , vettore di traslazione l, vettore generico r,
cella elementare, volume τl = a1 • a2 ∧ a3 della cella
elementare.
2) Con riferimento al reticolo reciproco scalato: nodo,
vettore caratteristico 2πbi (con b1 = a2 ∧ a3 /τl ecc.),
vettore di traslazione g, vettore generico k, cella elementare, volume τg = (2π)3 b1 • b2 ∧ b3 della cella
elementare, zone di Brillouin.
3) Relazioni fra le grandezze elencate nei precedenti punti,
ad esempio τl τg = (2π)3 .
Dal momento che il volume τl non dipende dalla forma della
cella elementare, si può sempre considerare il cristallo come
formato dall’unione di celle elementari di forma prismatica
aventi i lati di lunghezza uguale ai moduli di a1 , a2 e a3
rispettivamente. Indicando con N1 il numero di celle secondo
la direzione di a1 , con N2 e N3 gli analoghi numeri secondo
le altre due direzioni, il numero totale delle celle del cristallo
sarà Nc = N1 N2 N3 , e il volume del cristallo sarà Ω = Nc τl .
Quando si descrive la dinamica di un elettrone in un cristallo
si può ancora assumere che su di esso agiscano forze derivabili
da un’energia potenziale. A sua volta, questa energia potenziale è la somma di tre contributi: il primo è dovuto alla presenza del cristallo, ed è periodico con la stessa periodicità del
reticolo diretto; il secondo è dovuto a eventuali perturbazioni
esterne; il terzo è dovuto alle collisioni.
La parte periodica dell’energia potenziale del singolo elettrone
è prodotta principalmente dalla presenza dei nuclei, che in
prima approssimazione si considerano fissi nelle posizioni di
equilibrio. In realtà i nuclei vibrano intorno alle posizioni di
equilibrio, e ciò rende più complicata l’interazione di essi con
gli elettroni. Di ciò è possibile tener conto successivamente,
e quindi le vibrazioni non verranno per ora considerate.
Un secondo contributo al potenziale periodico è dovuto alla
presenza di tutti gli altri elettroni del cristallo. Grazie al fatto
che il numero di tali elettroni è molto grande, è possibile
tener conto dell’effetto che il campo, da essi prodotto, ha
sull’elettrone considerato, per mezzo di un campo medio che
si somma a quello prodotto dai nuclei. Questo approccio
è di fondamentale importanza perché permette di ridurre il
calcolo alla soluzione del problema dinamico di una singola
particella, anziché risolvere simultaneamente il problema di
tutti gli elettroni accoppiati fra loro.
Il secondo contributo all’energia potenziale è quello dovuto
a eventuali perturbazioni esterne, che sono causate da un
campo elettrico impresso e quindi sono derivabili da un
potenziale. Il calcolo si estende senza difficoltà al caso in cui
siano presenti anche forze magnetiche. La trattazione si basa
sull’ipotesi, sempre verificata in pratica, che le forze esterne
possano considerarsi spazialmente costanti nella regione in
cui non è trascurabile la funzione d’onda della particella (a
differenza di quelle dovute ai nuclei, che variano di molti
ordini di grandezza all’interno di una distanza interatomica).
In tal modo si può risolvere preventivamente il problema della
5
dinamica in presenza dei soli nuclei, aggiungendo poi l’effetto
delle forze esterne con una trattazione perturbativa rispetto al
caso già risolto.
Una volta conclusa la trattazione perturbativa, si ottiene la
descrizione della dinamica del cosiddetto volo libero della
particella, cioè del moto della particella nell’intervallo che
intercorre tra due collisioni. Per “collisione” s’intende una
qualunque delle possibili interazioni che la particella può
subire nel suo moto attraverso il cristallo, ad esempio:
trasporto nei semiconduttori in molti casi di rilevante
interesse applicativo.
La trattazione della parte statistica esula dagli scopi di questi
appunti, che invece si propongono d’illustrare le relazioni che
descrivono il volo libero della singola particella, mettendo in
evidenza le differenze rispetto alla trattazione classica descritta
nei paragrafi I, II, III, IV.
Per cominciare, anche nel caso della particella in un cristallo
è definibile una funzione hamiltoniana H = T + V , nella
quale V = V (r) è l’energia potenziale dovuta alle sole
forze esterne. L’effetto del potenziale periodico dei nuclei,
considerati fissi, è invece inglobato nell’energia cinetica T .
Come anticipato sopra, l’effetto delle collisioni non è qui
considerato dal momento che si vuole descrivere la dinamica
del volo libero. Il vettore r da cui dipende l’energia potenziale
non rappresenta più la posizione istantanea della particella,
ma il valor medio della posizione calcolato usando come
funzione peso il quadrato del modulo della funzione d’onda
della particella all’istante considerato. Il vettore r appartiene
al reticolo diretto. A sua volta, l’energia cinetica T risulta
essere una funzione del vettore k, detto vettore d’onda, che
ha le dimensioni dell’inverso di una lunghezza e appartiene al
reticolo reciproco scalato. Il prodotto h̄k, dove h̄ = h/(2π)
è la costante di Planck ridotta e h la costante di Planck, è il
valor medio del momento della particella calcolato anche qui
con la funzione d’onda della particella all’istante considerato
(in questo caso, tuttavia, la funzione peso non è il quadrato
del modulo della funzione d’onda).
Poichè il moto è conservativo, la funzione hamiltoniana è una
costante del moto H = E, dove E è l’energia totale. Come
si è fatto nel caso classico, si fissi ora un generico istante di
tempo, e si consideri una posizione fissa r 0 del reticolo diretto.
L’energia potenziale si riduce perciò a una costante nota V0
e, di conseguenza, l’energia totale diventa una funzione delle
sole componenti del vettore d’onda:
1) Collisione con i nuclei. Come detto prima, i nuclei
non sono fissi nelle posizioni di equilibrio, ma vibrano
intorno a queste. Mentre delle interazioni con i nuclei
considerati fissi si è già tenuto conto nei calcoli in cui
l’energia potenziale viene considerata periodica, deve
essere ora aggiunto il calcolo dell’effetto delle vibrazioni
dei nuclei. L’esito della collisione di una particella, ad
esempio un elettrone, con i nuclei, è descrivibile come
un trasferimento di energia e momento fra l’elettrone e
l’insieme di tutti i nuclei del cristallo.
2) Collisione con un’impurezza o un difetto presente nel
cristallo.
3) Interazione con una radiazione elettromagnetica incidente. Questo effetto è descritto come una collisione
della particella con un fotone, e viene trattato in modo
simile all’interazione con i nuclei.
4) Interazione fra particelle, ad esempio l’interazione
elettrone-elettrone.
5) Altri tipi, ad esempio l’interazione con un’interfaccia
(molto importante nei dispositivi a canale superficiale).
La trattazione delle collisioni è alquanto complicata non solo
perché ci sono diversi tipi di collisione, ma anche perché le
forze coinvolte sono molto intense (quindi non è applicabile
una soluzione perturbativa) e non sono periodiche (quindi
non sono applicabili le proprietà dei sistemi periodici che
invece possono essere sfruttate nella parte di calcolo in cui i
nuclei sono considerati fissi). D’altra parte, la trattazione delle
collisioni è essenziale per descrivere correttamente il trasporto
di corrente nei cristalli. Tipicamente, il completamento della
trattazione si svolge in due passi:
1) A partire dalla dinamica della singola particella, si
applica una descrizione statistica basata sulla funzione di
distribuzione delle particelle. Il risultato di questo passo
è l’equazione che descrive l’evoluzione della funzione
di distribuzione in assenza di collisioni.
2) Vengono aggiunti gli effetti delle collisioni mediante
un ulteriore termine, detto termine di collisione, che
descrive la variazione nel tempo della funzione di distribuzione prodotta dalle collisioni. Il calcolo del termine
di collisione è svolto con le tecniche proprie della
meccanica quantistica, tipicamente usando una procedura di calcolo della probabilità di transizione fra due
stati quantici che viene indicata come regola d’oro di
Fermi. L’equazione complessiva cosı̀ ottenuta descrive
l’evoluzione della funzione di distribuzione in presenza
di collisioni e viene detta equazione del trasporto di
Boltzmann. Si trova che tale equazione descrive con
un ottimo grado di approssimazione le proprietà del
E = E(k) = T (k) + V0 .
(39)
Naturalmente questa relazione non è più utile per descrivere la
dinamica del punto materiale, dal momento che il tempo e il
punto sono stati fissati. Lo scopo della (39) è quello di mettere
in evidenza la relazione funzionale fra E e k. Tale relazione è
profondamente diversa dalla E(p) del caso classico data dalla
(38). Si ha infatti che:
1) La funzione E(k) è periodica con un intervallo di
periodicità pari alla prima zona di Brillouin. In altri
termini, se k è un vettore appartenente alla prima zona
di Brillouin, allora per qualunque vettore di traslazione
g si ha E(k+g) = E(k). La ragione di questa proprietà
è che E(k) è l’autovalore di un’equazione differenziale
i cui coefficienti sono periodici nel reticolo diretto.
2) La funzione E(k) è polidroma. In altri termini, per
ogni k esistono diversi valori possibili dell’energia totale
E1 (k), E2 (k), . . .. La ragione di questa proprietà è che
la particella è confinata in un volume finito rappresentato
dal reticolo diretto. Il minimo di E è strettamente
maggiore del minimo di V . Per un generico indice r,
la funzione Er (k) è detta ramo della E(k). L’insieme
dei valori coperti da Er al variare di k nella prima zona
di Brillouin è detto banda di energia. A seconda del tipo
di cristallo, possono esistere parti dell’asse delle energie
non coperte da nessuna banda; tali parti si chiamano gap.
Perciò, a differenza del caso classico in cui l’energia
totale può assumere tutti i valori compatibili con quello
dell’energia potenziale, nel caso quantistico esistono
valori di energia che la particella non può avere, che
sono appunto quelli che cadono nei gap.
3) La relazione E(k) è pari nelle componenti di k, cioè per
ogni indice i si ha E(−ki ) = E(ki ). Questa proprietà è
del tutto identica a quella già osservata nel caso classico.
Essa deriva dall’invarianza della funzione hamiltoniana
per inversione del tempo, che vale in tutti i casi.
4) A differenza del caso classico, in cui il momento p varia
con continuità nel proprio dominio (che è infinito), il vettore d’onda k varia per salti discreti nel proprio dominio
(che è la prima zona di Brillouin). La ragione è dovuta
all’ipotesi che, per ciascuna direzione ai , le proprietà
fisiche della prima faccia del cristallo (che è quella che
passa per l’origine del sistema di riferimento r) siano
uguali a quella dell’ultima faccia (che è quella che dista
Ni ai dalla prima). Questa ipotesi, ragionevole dal punto
di vista fisico, viene detta ipotesi delle condizioni al
contorno periodiche. Essa conduce alla quantizzazione
di k, che risulta funzione di tre indici interi n1 , n2 , n3
secondo la relazione
k=
n1
n2
n3
2π b1 +
2π b2 +
2π b3 ,
N1
N2
N3
(40)
ni = 0, 1, 2, . . . , Ni − 1. Di conseguenza, non solo la
funzione E(k) è ripartita in rami E1 (k), E2 (k), . . .
contati da un indice discreto, ma anche i valori di
energia di ciascuna banda Er (k) sono quantizzati. I
valori quantizzati di energia di ciascuna banda (cioè le
energie Er (n1 , n2 , n3 ) che si ottengono tenendo fisso r
e variando gl’indici ni indipendentemente da 0 a Ni −1)
sono detti livelli energetici della banda.
Dal momento che ogni indice ni nella (40) può indipendentemente assumere Ni valori diversi, il numero di vettori k distinti all’interno della prima zona di Brillouin sarà
N1 N2 N3 = Nc . I vertici di tali vettori formano all’interno
della prima zona di Brillouin un insieme di punti che, per
ciascuna direzione 2πbi , sono equidistanti, dato che si passa
da uno qualunque di essi a quelli adiacenti modificando di
un’unità l’indice intero ni . Dunque, la densità di tali punti
si ottiene semplicemente dividendo Nc per il volume τg della
prima zona di Brillouin. Il risultato Nc /τg viene anche pensato
come la densità dei vettori k.
Col termine stato elettronico s’intende l’insieme di quattro
indici n1 , n2 , n3 , ns , dove i primi tre indici sono quelli che
definiscono il vettore k nella (40), mentre ns è un indice
associato allo spin dell’elettrone. Per assegnati valori degli altri
tre indici, ns può assumere solo due valori distinti. Quindi, il
numero di possibili stati elettronici distinti nella prima zona
di Brillouin sarà il doppio del numero di vettori k distinti.
Analogamente, la densità degli stati nello spazio del vettore k
6
sarà il doppio della densità dei vettori k:
Qk = 2
Ω/τl
Ω
Nc
=2
= 3.
τg
τg
4π
(41)
I calcoli che portano alla determinazione di E(k) sono sempre
svolti nell’ipotesi che le proprietà fisiche del cristallo non
dipendano dal punto. Di conseguenza, data una generica quantità estensiva dello spazio r, la corrispondente densità nello
stesso spazio si ottiene semplicemente dividendo il valore della
quantità estensiva in esame per il volume Ω del cristallo. In
particolare, la densità degli stati nello spazio a sei dimensioni
(r, k) si ottiene dalla (41) come
Qk
1
=
.
(42)
Ω
4π 3
Si potrebbe obiettare che in realtà l’andamento del drogante
in un semiconduttore non è quasi mai costante, e quindi
cade in difetto l’ipotesi di cristallo uniforme. In realtà la (42)
continua a valere anche per un semiconduttore non uniforme,
nel modo illustrato qui di seguito. Infatti, dal momento che la
concentrazione degli atomi di drogante è comunque piccola
rispetto a quella degli atomi del semiconduttore, si trova
che gli stati elettronici di un semiconduttore drogato possono
essere espressi come l’unione degli stati del semiconduttore
non drogato, che danno luogo alla struttura a bande già
discussa (quindi indipendente dalla posizione r e dotata della
densità (42)), e di stati aggiuntivi introdotti dal drogante, la cui
densità dipende dal punto secondo la distribuzione spaziale del
drogante e la cui energia si colloca in un gap. In conclusione, la
densità degli stati del semiconduttore drogato è la somma della
(42) e di una funzione del punto, nota perché ricavabile dalla
distribuzione del drogante. È opportuno aggiungere che, anche
in una condizione di equilibrio del semiconduttore, in presenza
di una concentrazione non uniforme di drogante le funzioni di
distribuzione della banda di conduzione e di valenza diventano
anch’esse funzioni del punto. In altri termini, in un caso non
uniforme gli stati disponibili nelle bande sono gli stessi del
caso uniforme, ma in generale gli elettroni si distribuiscono
in essi con una concentrazione spaziale non uniforme. Di
conseguenza, anche nel caso dell’equilibrio le grandezze che
derivano dalla funzione di distribuzione quali, ad esempio, le
concentrazioni degli elettroni e delle lacune, risultano essere
funzioni del punto.
La definizione di stato elettronico data sopra può apparire
alquanto esoterica rispetto a quella classica, dove lo stato
di una particella è definito come l’insieme dei valori delle
variabili dinamiche che ne definiscono il moto a un certo
istante, cioè le componenti della posizione e del momento
all’istante considerato. In realtà la definizione quantistica è
analoga a quella classica. Infatti, usando una definizione più
generale, lo stato quantistico di una particella è costituito da
una funzione d’onda calcolata a un certo istante. Usando le
coordinate cartesiane e considerando una particella vincolata
in una regione finita dello spazio, questa funzione dipende da
r e da indici discreti. Se si prescinde dallo spin, che non ha
un corrispettivo classico, gli altri indici forniscono k e, come
detto in precedenza, h̄k è il valor medio del momento della
particella calcolato usando la funzione d’onda.
Q=
VI. M ASSA
EFFICACE
Come si è detto nel paragrafo V, anche nel caso della
particella in un cristallo è definibile una funzione hamiltoniana
H = T + V , nella quale V = V (r) è l’energia potenziale
dovuta alle sole forze esterne. L’effetto del potenziale periodico dei nuclei, considerati fissi, è invece inglobato nell’energia
cinetica T (k). L’hamiltoniana produce relazioni dinamiche
valide all’interno di un volo libero. In coordinate cartesiane
la forma di tali relazioni è
∂H
∂T
ẋi =
=
= ui ,
(43)
∂h̄ki
∂h̄ki
h̄k̇i = −
∂V
∂H
=−
= Fi .
∂xi
∂xi
(44)
La velocità di componenti ui = ẋi definita dalle (43) viene
anche detta velocità di gruppo. Analogamente al caso classico,
anche nel caso qui considerato la conservazione dell’energia si
dimostra calcolando il lavoro esercitato dalla forza F durante
un intervallo infinitesimo di tempo dt a partire dall’istante t,
durante il quale il valor medio della posizione della particella
varia della quantità dr. Osservando che dr = udt, con u
calcolata all’istante t, il lavoro vale
F • dr = F • u dt = h̄k̇ • u dt ,
(45)
dove si è usata la (44). D’altra parte, h̄k̇dt = dh̄k. Combinando questa relazione con la (43) si trova
F • dr = dh̄k • gradh̄k T = dT ,
(46)
dove l’ultimo passaggio è reso possibile dal fatto che T
dipende da k e non da r. Inoltre, ricordando che le componenti
della forza sono le derivate dell’energia potenziale cambiate
di segno, il primo termine a sinistra della (45) vale
F • dr = − grad V • dr = −dV ,
(47)
e quindi rappresenta la variazione dell’energia potenziale della
particella materiale dovuta alla variazione dr. Perciò la (45)
implica che nell’intervallo di tempo dt sia nulla la variazione
della quantità T + V . Di conseguenza, la somma T + V è
una costante del moto, che anche qui è l’energia totale della
particella.
Conviene notare che la derivazione che porta a questo risultato
non richiede in nessun modo che venga prescritta la relazione
funzionale T = T (k). La stessa osservazione poteva essere
fatta anche nel caso classico, in cui il teorema dell’energia si
sarebbe potuto dimostrare senza introdurre la relazione T =
(p21 + p22 + p23 )/(2m). Invece, quello che viene meno nel caso
qui considerato è la relazione di proporzionalità fra momento
e velocità, che nel caso classico si scrive pi = mui ed è
dovuta alla relazione quadratica fra T e le componenti di p.
Invece T (k) non è quadratica, ma mostra una piú complicata
relazione funzionale fra T e k, che dipende dal tipo di cristallo.
Di conseguenza, i due vettori u e h̄k non sono in generale
proporzionali fra loro: la relazione u = u(k) si calcola caso
per caso a partire dalla (43) come u = (1/h̄) gradk H.
È anche interessante determinare quale sia la relazione corrispondente alla F = ma del caso classico che, come si
ricorderà, è ricavabile dalle equazioni di Hamilton usando la
7
definizione ai = u̇i e sfruttando la proporzionalità diretta
fra pi e ui (che qui invece cade in difetto). Nel caso qui
considerato, la generica componente ai dell’accelerazione si
ricava derivando ui rispetto al tempo:
ai = u̇i =
∂ui
∂ui
∂ui
h̄k̇1 +
h̄k̇2 +
h̄k̇3 ,
∂h̄k1
∂h̄k2
∂h̄k3
(48)
dove si è moltiplicato e diviso per h̄ ogni termine in modo da
mettere in evidenza le componenti della forza. Ricordando la
u = (1/h̄) gradk H e usando la (44) si trasforma la precedente
nella
2
1
∂ H
∂2H
∂2H
ai = 2
F1 +
F2 +
F3 . (49)
∂ki ∂k1
∂ki ∂k2
∂ki ∂k3
h̄
Nelle (48,49) i coefficienti delle componenti della forza hanno
le dimensioni dell’inverso di una massa. Indicando con ζ̂ il
tensore 3 × 3 simmetrico di componenti
ζij =
1 ∂2H
h̄2 ∂ki ∂kj
(50)
e invertendo ζ̂, si trova il tensore massa efficace m̂∗ = ζ̂ −1 ,
anch’esso simmetrico. In conclusione, la relazione F = ma
del caso classico qui diventa
F = m̂∗ a .
(51)
Naturalmente gli elementi di m̂∗ continuano a dipendere da k
e quindi dal tempo, dato che nell’evoluzione del moto della
particella il vettore k dipende dal tempo. Perciò la sostituzione
della (51) alla coppia di equazioni di Hamilton (43,44) non
comporta alcuna semplificazione del problema. D’altra parte
occorre ricordare che le (43,44) sono applicabili solamente
durante il volo libero della particella, il che di fatto restringe
la validità di tali equazioni a intervalli di tempo estremamente
brevi. Ad esempio, a temperatura ambiente il volo libero in un
semiconduttore come il silicio ha una durata dell’ordine del ps
o meno. Di conseguenza, si può ammettere che la variazione
di k durante un volo libero sia abbastanza piccola da rendere
accettabile la sostituzione di H con uno sviluppo in serie di
potenze nelle componenti ki troncato al second’ordine, con
le derivate calcolate nei valori delle ki all’istante iniziale del
volo libero. In questo modo, le componenti del tensore di
massa efficace diventano delle costanti proprie del volo libero
considerato.
Se per lo sviluppo di H troncato al second’ordine si sceglie
un punto di minimo di un ramo di E(k), la situazione si semplifica ulteriormente dal momento che la parte al prim’ordine
dello sviluppo si annulla, e la parte al second’ordine risulta
una forma quadratica definita positiva. Come noto, una forma
quadratica simmetrica e definita positiva è sempre diagonalizzabile con autovalori reali e positivi. Di conseguenza,
è possibile passare dall’attuale sistema di riferimento nello
spazio k a un nuovo riferimento, in cui il tensore massa
efficace inverso assume la forma


0
0
1/m∗1
1/m∗2
0 ,
ζ̂ =  0
(52)
0
0
1/m∗3
8
in cui i termini diagonali m∗i sono strettamente positivi e hanno
un valore che dipende dal minimo considerato. A sua volta, il
tensore di massa assume la forma
 ∗

m1 0
0
m̂∗ =  0 m∗2 0  .
(53)
0
0 m∗3
Considerazioni di carattere statistico mostrano che la maggior
parte degli elettroni della banda di conduzione dei semiconduttori tendono a occupare stati prossimi ai minimi assoluti
di tale banda. Perciò, lo sviluppo troncato al second’ordine
nell’intorno dei minimi assoluti conduce effettivamente a una
semplificazione dello studio della dinamica di tali elettroni.
Ci si può chiedere se uno sviluppo troncato analogo a quello
discusso qui sopra debba essere calcolato anche per la dipendenza di H dal punto r dovuta all’energia potenziale V . Ciò
non è in realtà necessario, dal momento che la trattazione
delle forze esterne si basa, come detto nel paragrafo V, su un
approccio perturbativo. Tale approccio comporta che le forze
esterne abbiano una dipendenza molto debole dal punto, tanto
da poter essere considerate costanti all’interno del volo libero.
Per concludere, si può osservare che uno sviluppo di
E(k) troncato al second’ordine può essere calcolato anche
nell’intorno di un massimo di una banda. Questo calcolo viene
effettivamente svolto per descrivere la dinamica delle lacune, e
conduce anche in questo caso a un tensore di massa diagonale.
Considerazioni che esulano dallo scopo di questi appunti
mostrano che nella descrizione della dinamica delle lacune
è necessario introdurre un segno negativo nella definizione
degli elementi del tensore di massa. Ciò compensa il fatto
che nell’intorno di un massimo le derivate seconde di E(k)
sono negative.
Dal momento che l’operazione di diagonalizzazione comporta
la scelta di un nuovo sistema di riferimento nello spazio k,
è necessario scegliere contemporaneamente un nuovo riferimento nello spazio r. Infatti, i due gruppi di vettori caratteristici del reticolo diretto e del reticolo reciproco scalato
dipendono l’uno dall’altro.
Indicando con ka il vettore d’onda del minimo considerato, lo
sviluppo troncato al secondo ordine (omettendo per semplicità
l’indice del ramo) ha la forma
E(k) ≃ Ea +
h̄2 δk22
h̄2 δk32
h̄2 δk12
+
+
,
2ma1
2ma2
2ma3
(54)
dove Ea = E(ka ), δki = ki − kai , e l’indice a delle masse
indica che le derivate seconde della (50) sono calcolate per
k = ka . Questo risultato viene anche indicato col termine
approssimazione delle bande paraboliche. Confrontando la (54)
con la (39) e osservando che nel minimo deve essere T = 0,
si trova che si deve identificare Ea con V0 e la differenza
E − Ea come lo sviluppo intorno a ka dell’energia cinetica
dell’elettrone, troncato al second’ordine. Se la banda considerata è quella di conduzione, allora si usa il simbolo EC al
posto di Ea per indicare il valore del minimo assoluto (o dei
minimi assoluti, se ne esistono diversi), e si usa il simbolo Ee
per indicare l’energia cinetica E − EC .
Si può anche notare l’analogia formale fra la (54) e la (38) del
caso classico. Usando la notazione tensoriale si può riscrivere
la (54) come
E(k) ≃ Ea +
h̄2
δk • ζ̂δk ,
2
(55)
dove ζ̂ è dato dalla (52) con mi = mai . Inoltre, usando la
u = (1/h̄) gradk H e osservando che gradk H = gradk E si
ricava, dalla (55),
h̄δk = m̂∗ u ,
(56)
dove m̂∗ è dato dalla (53) con mi = mai . Combinando questo
risultato con le equazioni di Hamilton (43,44) si trova
Fi = h̄k̇i = m∗ia u̇i = m∗ia ẍi
(57)
cioè, in forma tensoriale, F = m̂∗ a con il tensore di massa
costante. Si riconosce cosı̀ che nell’intorno di un minimo di
una banda la relazione fra momento e velocità e quella fra
forza e accelerazione sono lineari, come nel caso classico.
Tuttavia, a causa del fatto che i termini di m̂∗ possono
essere diversi fra loro, le (56,57) sono in generale anisotrope.
Ciò implica, in particolare, che un elettrone soggetto a
una forza esterna F non è necessariamente accelerato nella
stessa direzione della forza. Questo risultato non è particolarmente sorprendente se si pensa che nella relazione T (k) è
nascosto l’effetto del potenziale periodico, la cui forza agisce
sull’elettrone simultaneamente a F .
VII. D ENSIT À
DEGLI STATI IN ENERGIA
Si consideri un generico vettore k della prima zona di
Brillouin, e un secondo vettore di componenti ki +dki ottenute
variando di quantità infinitesime le componenti di k. In
questo modo si definisce un volumetto d3 k = dk1 dk2 dk3 .
Ricordando la (41), il numero di stati nel volumetto sarà
dN = Qk d3 k. L’uso di infinitesimi potrebbe essere considerato improprio dal momento che le componenti di k dipendono
da indici discreti. Tuttavia, si deve osservare che il numero di
celle elementari del reticolo è molto grande: ad esempio, la
concentrazione del silicio è dell’ordine di 5 × 1022 atomi/cm3 ,
pari a 50×109 atomi/µm3 , quindi la concentrazione di celle in
una direzione è dell’ordine di 103 celle/µm. Di conseguenza
è accettabile l’uso di quantità infinitesime e delle derivate che
intervengono nelle considerazioni che seguono. Si consideri
ora una terna di funzioni

 α = α(k1 , k2 , k3 )
β = β(k1 , k2 , k3 ) ,
(58)

η = η(k1 , k2 , k3 )
che si suppongono invertibili, cioè tali che esistano le

 k1 = k1 (α, β, η)
k2 = k2 (α, β, η) .

k3 = k3 (α, β, η)
(59)
Se si considerano le (58) come le relazioni di una trasformazione di coordinate, vale come noto la
d3 k = |J| dα dβ dη ,
(60)
9
dove J(α, β, η) è il determinante jacobiano della trasformazione di coordinate:


∂k1 /∂α ∂k1 /∂β ∂k1 /∂η
J =  ∂k2 /∂α ∂k2 /∂β ∂k2 /∂η  .
(61)
∂k3 /∂α ∂k3 /∂β ∂k3 /∂η
corredata da opportune condizioni al contorno e iniziali. In
particolare, trattandosi di un’equazione del primo ordine nel
tempo, deve essere prescritta la condizione iniziale
Dal momento che Qk = Ω/(4π 3 ) è costante rispetto a k e
quindi non è influenzato dalla trasformazione, si avrà
dN = Qk d3 k = Qk |J| dα dβ dη .
(62)
La (62) mostra che il prodotto Qk |J| è la densità degli stati
nello spazio (α, β, η). Se ora si integrano ambo i membri della
(62) su α e β,
ZZ
ZZ
dN = dη Qk
|J| dα dβ ,
(63)
il primo membro della (63) rappresenta, per costruzione, il
numero di stati nell’intervallo dη. Di conseguenza, la quantità
ZZ
g(η) = Qk
|J(α, β, η)| dα dβ
(64)
è la densità degli stati nello spazio η. Di particolare rilevanza
è il caso in cui si sceglie η(k) = Er (k), in cui Er è un
ramo di E(k). In questo caso, g = g(E) è la densità degli
stati in energia del ramo considerato, e γ(E) = g(E)/Ω
è la corrispondente densità degli stati in energia e volume.
Le altre due funzioni α e β si scelgono in modo conveniente a seconda della forma di Er . Ad esempio, se il ramo
ha simmetria sferica, cioè se Er (k) = Er (|k|), conviene
scegliere una trasformazione in coordinate polari in cui α
e β sono i due angoli. Si noti che la relazione (54) che
si ottiene nell’approssimazione delle bande paraboliche può
essere √
sempre ridotta a una forma sferica usando le quantità
h̄ δki / 2mai come variabili ausiliarie.
VIII. F UNZIONE D ’ ONDA
Nei precedenti paragrafi si è usato il termine funzione
d’onda e si sono descritte qualitativamente le operazioni
di media con cui si calcolano alcune grandezze dinamiche
d’interesse. In questo paragrafo e nei successivi sono esposti
gli aspetti formali della teoria.
Come in precedenza, si considera la dinamica di una singola
particella di massa m, soggetta a una forza derivabile da
un’energia potenziale V che in generale si suppone dipendere
anche dal tempo. Per evitare conflitti di simboli, le coordinate
spaziali saranno indicate qui con ξ ≡ (ξ1 , ξ2 , ξ3 ). Sarà perciò
V = V (ξ, t).
Una volta assegnata V , si definisce l’operatore hamiltoniano
2
h̄
.
H=−
∇2 + V ,
(65)
2m ξ
dove il pedice indica che le derivate sono calcolate rispetto
alle variabili ξ. La dinamica della particella è descritta, nel
modo che sarà meglio specificato più avanti, dalla funzione
d’onda ψ = ψ(ξ, t). Tale funzione si determina risolvendo
l’equazione di Schrödinger dipendente dal tempo
Hψ = jh̄
∂ψ
,
∂t
(66)
ψ0 (ξ) = ψ(ξ, t = t0 ) ,
(67)
dove t0 è un generico istante che può farsi coincidere con
l’origine del tempo.
Per quanto riguarda le coordinate spaziali, l’equazione di
Schrödinger è del secondo ordine. Le condizioni al contorno
sono prescritte caso per caso a seconda del problema considerato. A questo proposito conviene preliminarmente osservare
alcuni aspetti dell’equazione:
• La (66) ha i coefficienti complessi, quindi la soluzione ψ
è complessa.
• La (66) è omogenea. Dal momento che le condizioni
al contorno, come risulterà subito, sono anch’esse omogenee, la soluzione è definita a meno di una costante
moltiplicativa arbitraria.
• Poiché la (66) è del secondo ordine rispetto alle coordinate spaziali, ψ e le sue derivate prime ∂ψ/∂ξi
sono spazialmente continue. Invece, le derivate seconde
possono essere discontinue, a seconda della forma di V .
• La soluzione della (66) potrebbe contenere dei termini
che ne fanno divergere il modulo. Se ciò avviene, tali
termini vanno scartati perché sono incompatibili col significato fisico di ψ (quest’ultimo è discusso piú sotto).
Date queste premesse, per discutere le condizioni al contorno
è necessario considerare separatamente i possibili casi.
1) Il dominio spaziale della ψ è finito. In altri termini, è
disponibile un’informazione sulla natura del problema
trattato, che consente di affermare che ψ è identicamente
nulla al di fuori di un certo dominio Ω. Di conseguenza,
a causa della continuità, la funzione d’onda deve annullarsi sul contorno di Ω. La condizione al contorno è
perciò omogenea. Una volta scartati gli eventuali termini
divergenti,
risulterà finito, oltre che reale, l’integrale
R
2 2
|ψ|
d
ξ.
Ω
2) Il dominio spaziale della ψ
R è infinito, ma la forma
di ψ è tale che l’integrale Ω |ψ|2 d2 ξ è finito. Se ciò
avviene, è necessario che ψ sia evanescente quando il
modulo di ξ diventa arbitrariamente grande. Anche in
questo caso le condizioni al contorno sono omogenee
(asintoticamente). È opportuno
notare che, in linea di
R
principio, l’integrale Ω |ψ|2 d2 ξ di questo caso e del
precedente dipende dal tempo. Di ciò sarà discusso piú
sotto.
3) Il dominio spaziale della Rψ è infinito, e la forma di
ψ è tale che l’integrale Ω |ψ|2 d2 ξ diverge. Se ciò
avviene, non è a causa del fatto che |ψ|2 diverga (infatti,
come detto prima, eventuali termini divergenti devono
essere scartati a priori). Per far divergere l’integrale è
sufficiente che ψ tenda asintoticamente a una costante,
o addirittura sia asintoticamente evanescente, ma con
un decadimento troppo debole. Questo caso può presentarsi, e va trattato a parte: tipicamente, l’analisi delle
condizioni al contorno viene svolta usando un dominio
finito, che poi viene fatto crescere indefinitamente. Si
10
trova anche in questo caso che ψ è definita a meno di
una costante moltiplicativa arbitraria.
Nel paragrafo IX sono svolte alcune considerazioni che permettono d’identificare il significato fisico di ψ.
di ψ. Si noti anche che la (76) stabilisce le dimensioni di
ψ: infatti, |ψ|2 ha le dimensioni dell’inverso di un volume.
L’esistenza della condizione di normalizzazione permette di
ricavare il significato fisico di ψ nel modo che segue:
•
IX. E QUAZIONE
DI CONTINUIT À
Dall’equazione di Schrödinger (66) può ricavarsi
un’equazione formalmente identica a un’equazione di
continuità. Per questo, si considerano la (66) e la complessa
coniugata. Osservando che H è reale si trova
∂ψ
1
=
Hψ ,
∂t
jh̄
∂ψ ∗
1
= − Hψ ∗ .
∂t
jh̄
(68)
•
Calcolando la derivata temporale di |ψ|2 = ψψ ∗ si ricava
∂|ψ|2
∂ψ
∂ψ ∗
1
= ψ∗
+ψ
=
(ψ ∗ Hψ − ψ Hψ ∗ ) .
∂t
∂t
∂t
jh̄
(69)
Sostituendo la (65) nella (69) e cancellando i termini contenenti V si trova
∂|ψ|2
jh̄
(70)
ψ ∗ ∇2 ψ − ψ ∇2 ψ ∗ .
=
∂t
2m
D’altra parte vale l’identità
ψ ∗ ∇2 ψ − ψ ∇2 ψ ∗ = div (ψ ∗ ∇ψ − ψ∇ψ ∗ )
(71)
da cui, definendo il vettore
. jh̄
(ψ∇ψ ∗ − ψ ∗ ∇ψ) ,
Jψ =
2m
si ottiene l’equazione di continuità
•
(72)
∂|ψ|2
+ div J ψ = 0 .
(73)
∂t
Si noti che nella definizione (72) di J ψ compare la differenza
dei vettori ψ∇ψ ∗ e ψ ∗ ∇ψ, che sono l’uno il complesso
coniugato dell’altro. La loro differenza è perciò immaginaria.
Di conseguenza, l’unità immaginaria j della (72) rende J ψ
reale, come deve essere osservando il primo membro della
(73).
Per discutere il significato della (73) conviene riprendere
l’esame delle condizioni al contorno. Se si integra la (73) su
un generico dominio Ω si trova
Z
Z
Z
∂|ψ|2 3
d
2 3
d ξ=
J ψ • ν dΣ , (74)
|ψ| d ξ = −
dt Ω
Ω ∂t
Σ
dove Σ è il contorno di Ω e ν il versore normale uscente da Σ.
Se si considerano i due casi di condizioni al contorno discusse
prima, l’annullarsi di ψ al contorno comporta l’annullamento
di J ψ su Σ. Perciò si annulla l’ultimo membro della (74) e si
ha
Z
d
ψ(ξ ∈ Σ, t) = 0 ⇒
|ψ|2 d3 ξ = 0 ,
(75)
dt Ω
R
cioè Ω |ψ|2 d3 ξ = const. A questo punto si può usare la
costante moltiplicativa arbitraria per imporre la condizione
Z
|ψ|2 d3 ξ = 1 ,
(76)
ψ(ξ ∈ Σ, t) = 0 ⇒
Ω
che viene chiamata condizione di normalizzazione. Si noti che,
nei due casi considerati, Ω è l’intero dominio di definizione
Si postula che la funzione d’onda ψ possa venire usata
per la descrizione della dinamica della particella. Dunque
essa deve fornire un’informazione, fra l’altro, sulla posizione istantantea di questa.
Alla funzione d’onda è associata una quantità reale |ψ|2
che, con l’eccezione delR possibile caso di non normalizzabilità, ha la proprietà Ω |ψ|2 d3 ξ = 1. Questa proprietà
è analoga a quella delle distribuzioni di probabilità.
Si postula che l’integrando |ψ(ξ, t)|2 d3 ξ, che evidentemente è un numero compreso fra 0 e 1, sia la probabilità
infinitesima che all’istante t la particella sia nel volume
infinitesimo d3 ξ. Da ciò segue che |ψ|2 è la densità
di probabilità. Inoltre, per un generico volume finito
Ω′ ⊂ Ω, l’integrale
Z
|ψ|2 d3 ξ ≤ 1
(77)
0≤
Ω′
è la probabilità che all’istante t la particella sia nel
volume Ω′ . Se si indica con Σ′ il contorno di Ω′ ,
applicando la (73) si trova anche
Z
Z
d
|ψ|2 d3 ξ = −
J ψ • ν dΣ′ ,
(78)
dt Ω′
Σ′
dove il secondo membro è in generale non nullo perché
Ω′ è diverso da Ω. Questa relazione permette di individuare il significato di J ψ . Infatti, il primo membro della
(78) è la variazione nel tempo della probabilità di localizzare la particella in Ω′ . Per analogia con l’equazione
di continuità della dinamica macroscopica si pensa allora che la probabilità di localizzazione della particella
fluisca attraverso il contorno di Ω′ . Il vettore J ψ viene
perciò chiamato densità di flusso di probabilità. Conviene
aggiungere che nel caso della dinamica macroscopica
i concetti statistici si applicano a una collettività di
particelle, mentre qui essi si applicano a una particella
singola. Nonostante l’analogia formale, ci sono perciò
differenze sostanziali fra i due casi.
A conclusione di questa parte si può osservare che, nel caso di
normalizzabilità della funzione d’onda, l’integrale di |ψ|2 su
tutto il dominio di definizione è indipendente dal tempo. Ciò
scioglie la riserva indicata sopra. Inoltre, l’interpretazione di
|ψ|2 come densità di probabilità giustifica il fatto che eventuali
soluzioni divergenti dell’equazione di Schrödinger debbano
essere scartate.
Le considerazioni fin qui svolte devono essere modificate nel
caso in cui la funzione d’onda non sia normalizzabile. Se ciò
avviene, infatti, l’integrale di |ψ|2 esteso a tutto lo spazio
diverge. Tuttavia, convergono gl’integrali estesi su volumi
finiti, ad esempio Ω′ e Ω′′ . È perciò possibile calcolare il
rapporto di tali integrali,
Z
Z
|ψ|2 d3 ξ = α
|ψ|2 d3 ξ .
(79)
Ω′
Ω′′
11
Al rapporto α si attribuisce il significato di rapporto delle
probabilità di localizzazione della particella nei due volumi
indicati.
generalizzare il calcolo dei valori di aspettazione al caso in
cui le variabili dinamiche coinvolte non siano le coordinate.
Il caso piú importante è quello del momento coniugato alla
coordinata ξi . Per calcolarne il valore di aspettazione si deve
introdurre l’operatore momento
X. VALORI DI ASPETTAZIONE
Una volta introdotto il significato probabilistico della funzione d’onda, esso può essere usato per determinare le medie
statistiche di quantità dinamiche d’interesse. Per cominciare
si considerano variabili dinamiche che dipendono solo dalle
coordinate ξi . In particolare, il caso più semplice è quello
delle coordinate stesse: la media statistica della coordinata ξi
secondo una funzione d’onda normalizzabile ψ è definita da
R
2 3
. Ω ξi |ψ| d ξ
.
(80)
hξi i = R
|ψ|2 d3 ξ
Ω
È importante rilevare che gl’integrali della (80) sono calcolati
su tutto il dominio Ω di definizione di ψ, e che la (80) ha senso
solo per funzioni d’onda normalizzabili. A questo punto si può
sempre considerare ψ normalizzata, e la definizione assume la
piú semplice forma
Z
.
hξi i =
ξi |ψ|2 d3 ξ .
(81)
Ω
La media statistica definita dalle (80,81) è detta valore di
aspettazione. Più in generale, il valore di aspettazione di una
generica funzione f (ξ) che dipende solo dalle coordinate
spaziali è definito da
Z
.
f (ξ) |ψ|2 d3 ξ .
(82)
hf i =
Ω
Si noti che le quantità dinamiche di cui si calcolano i valori
di aspettazione non contengono necessariamente il tempo.
Tuttavia i loro valori di aspettazione dipendono in generale dal
tempo, dato che ψ dipende dal tempo. Nel caso dell’energia
potenziale V (ξ, t), il valore di aspettazione
Z
.
V (ξ, t) |ψ|2 d3 ξ .
(83)
hV i =
Ω
dipende dal tempo a causa della dipendenza da esso sia di V
che di ψ.
A proposito del calcolo dei valori di aspettazione è opportuno specificare quanto segue. Nonostante la loro natura di
coordinate spaziali, le quantità ξi non hanno il significato
di “posizione della particella”. Esse sono semplicemente le
coordinate in cui sono definite le funzioni trattate dalla teoria. Perciò, sarebbe fuorviante pensare tali quantità come se
fossero funzioni del tempo, ξi = ξi (t), alla stregua delle componenti xi (t) della posizione di una particella in meccanica
classica introdotte nel paragrafo I. Il significato di “posizione
della particella” si ricupera attraverso il valore di aspettazione
hξi i(t), come illustrato nell’esempio del paragrafo XI.
Un’altra osservazione è che la (82) può essere riscritta
Z
.
ψ ∗ f (ξ) ψ d3 ξ .
(84)
hf i =
Ω
Naturalmente non c’è alcuna differenza fra la (82) e la
(84). Tuttavia, la forma (84) è piú utile perché permette di
∂
.
p̂i = −jh̄
,
∂ξi
(85)
e usare la forma (84) del valore di aspettazione sostituendo p̂i
a f:
Z
∂ψ 3
.
ψ∗
hp̂i i = −jh̄
d ξ.
(86)
∂ξi
Ω
È evidente che se si fosse calcolato hp̂i i con la forma (82) si
sarebbe ottenuto un risultato diverso, dato che
ψ∗
∂(ψψ ∗ )
∂ψ
6=
.
∂ξi
∂ξi
(87)
La forma corretta è la (84). Questa può allora essere generalizzata considerando, al posto della funzione f , un generico
operatore A:
Z
.
ψ ∗ Aψ d3 ξ ,
(88)
hAi =
Ω
e la (86) può essere considerata un’applicazione della (88), con
A = −jh̄ ∂/∂ξi . In generale, si assume che operatori A come
quello introdotto sopra agiscano sulle coordinate spaziali, ma
non sul tempo. Essi tuttavia possono contenere il tempo
come parametro, come ad esempio nel caso dell’operatore
hamiltoniano (65), che contiene il tempo attraverso l’energia
potenziale V .
Conviene aggiungere che la (88) è una relazione fisicamente
accettabile solo se il primo membro è reale: esso deve infatti
rappresentare una quantità misurabile sperimentalmente. La
condizione che il primo membro della (88) sia reale impone
che il secondo membro sia uguale al proprio complesso
coniugato. Ciò limita la classe degli operatori accettabili a
quelli che verificano la proprietà
Z
Z
∗
(Aψ) ψ d3 ξ =
ψ ∗ Aψ d3 ξ .
(89)
Ω
Ω
Su questo aspetto saranno dati maggiori dettagli nel paragrafo
XII. Conviene osservare che la (88) implica
e quindi
D
hA − hAii = 0 ,
(90)
E (A − hAi)2 = A2 − hAi2 ,
(91)
dove il quadrato dell’operatore è definito dalla relazione
.
A2 ψ = A(Aψ).
Come ulteriore esempio si possono considerare polinomi nelle
componenti del momento. Ad esempio, il valore di aspettazione del quadrato di una componente del momento si
calcola a partire dall’operatore
∂2
.
p̂2i = p̂i p̂i = −h̄2 2 .
∂ξi
(92)
Dalla (92) si ricava
h̄2 2
1
p̂21 + p̂22 + p̂23 = −
∇ ,
2m
2m ξ
(93)
che mostra come il primo termine dell’operatore hamiltoniano
è l’operatore associato all’energia cinetica della particella. Di
conseguenza,
Z
1 2
h̄2
hp̂1 + p̂22 + p̂23 i = −
ψ ∗ ∇2ξ ψ d3 ξ
(94)
2m
2m Ω
è il valore di aspettazione dell’energia cinetica.
XI. PACCHETTO
GAUSSIANO
Una funzione d’onda normalizzabile è detta anche pacchetto
d’onde. Usando per semplicità un dominio monodimensionale
−∞ < ξ < +∞, un caso particolarmente importante è quello
di un pacchetto che, a un fissato istante t0 , ha la forma
"
#
2
(ξ − x)
1
exp jkξ −
,
(95)
ψ0 (ξ) = p√
4s2
2π s
dove x, s e k sono parametri assegnati, i primi due dei quali
hanno le dimensioni di una lunghezza, il terzo ha le dimensioni
dell’inverso di una lunghezza. Inoltre, s è definito positivo,
mentre x e k possono assumere qualunque valore. Evidentemente, un’espressione come la (95) non contiene informazioni
sufficienti a descrivere l’evoluzione di ψ negl’istanti successivi
a t0 . Per determinare tale evoluzione è infatti necessario
risolvere la (66) dopo aver prescritto l’energia potenziale V .
La (95) può essere allora considerata una possibile condizione
iniziale della (66). Si trova
#
"
2
1
(ξ
−
x)
,
(96)
|ψ0 (ξ)|2 = √
exp −
2s2
2π s
che è una gaussiana. Per questo, una funzione d’onda della
forma (95) prende il nome di pacchetto gaussiano. Ricordando
che
Z +∞
√
(97)
exp −µ2 dµ = π ,
−∞
si trova che il pacchetto è normalizzato:
Z +∞
|ψ0 (ξ)|2 dξ = 1 .
(98)
−∞
Il valore di aspettazione di ξ si trova ponendo A = ξ nella
(88):
Z +∞
Z +∞
∗
hξi =
ψ0 ξψ0 dξ =
(ξ − x + x) |ψ0 |2 dξ . (99)
−∞
−∞
L’ultimo membro della (99) si spezza nella somma di due
integrali, il primo dei quali ha nell’integrando il fattore ξ − x.
Esso è nullo perché l’integrando è prodotto di una funzione
pari e di una dispari, e l’intervallo d’integrazione è simmetrico
rispetto all’origine. Il secondo integrale, grazie alla condizione
di normalizzazione (98), fornisce
hξi = x .
(100)
Il valore di aspettazione del momento si trova ponendo A =
p̂ = −jh̄ d/dξ nella (88):
Z +∞
dψ0
∗
hp̂i =
ψ0 −jh̄
dξ
(101)
dξ
−∞
12
in cui, per la (95),
dψ0
−jh̄
=
dξ
ξ−x
+ h̄k ψ0 .
jh̄
2s2
(102)
Anche la (101) si spezza nella somma di due integrali, il primo
dei quali ha nell’integrando il fattore ξ − x. Procedendo come
sopra si trova
hp̂i = h̄k .
(103)
Le (100,103) forniscono il significato dei parametri x e k,
rispettivamente, Per il significato di s, che è la deviazione
standard della gaussiana (96), si può ricordare che
√
Z +∞
π
2
2
µ exp −µ dµ =
,
(104)
2
−∞
da cui
E
D
(ξ − hξi)2 = s2 ,
rD
E
(ξ − hξi)2 = s .
(105)
Ancora, il valore di aspettazione del quadrato del momento si
trova ponendo A = p̂ p̂ nella (88):
Z +∞
dψ0
d
−jh̄
dξ .
(106)
hp̂2 i =
ψ0∗ −jh̄
dξ
dξ
−∞
Grazie alla (102), la quantità fra parentesi quadre nella (106)
vale
!
2
1
(ξ − x)
ξ−x
2
2
k + 2−
[. . .] = h̄
ψ0 . (107)
+ 2jk
2s
4s4
2s2
Inserendo la (107) nella (106) si trova che l’ultimo termine
non contribuisce all’integrale perché contiene il fattore ξ − x.
Usando la (104) si trova
1
2
2
2
k + 2 .
hp̂ i = h̄
(108)
4s
Combinando la (108) con la (103) si trova, grazie alla (91),
h̄2
= p̂2 − hp̂i2 = 2 .
(109)
4s
Infine, combinando la (109) con la (105), si trova l’importante
risultato
rD
E h̄
ED
2
2
(p̂ − hp̂i) = .
(ξ − hξi)
(110)
2
D
2
(p̂ − hp̂i)
E
Il calcolo che conduce alla (110) si può generalizzare al caso
di una qualunque funzione d’onda ψ normalizzabile, e senza
limitare l’analisi a un dominio monodimensionale. Si trova il
seguente risultato:
rD
E h̄
ED
(p̂i − hp̂i i)2 ≥ ,
(111)
(qi − hqi i)2
2
dove qi è una generica coordinata canonica, p̂i è l’operatore
associato al momento coniugato a qi , e il segno di uguaglianza
vale per il pacchetto gaussiano. A differenza della (110), la
(111) può essere dimostrata senza conoscere la forma del pacchetto, e rappresenta l’espressione matematica del principio di
indeterminazione o principio di Heisenberg.
XII. O PERATORI HERMITIANI
Un operatore A può essere usato per costruire un’equazione
agli autovalori. In questo paragrafo, e nei successivi in cui
si tratta di equazioni agli autovalori, si sottintende sempre
che le uniche coordinate che compaiono nell’operatore siano
quelle spaziali, o perché A opera su di esse, o perché dipende
funzionalmente da queste. Perciò, e differenza del caso piú
generale trattato nel paragrafo X, qui l’operatore A non
contiene il tempo.
L’insieme degli autovalori costituisce lo spettro dell’operatore.
La forma dell’equazione è
Avn = An vn ,
(112)
dove An è l’autovalore e vn l’autofunzione. Poiché la
(112) è omogenea, le autofunzioni sono definite a meno
di una costante moltiplicativa arbitraria (alla (112) si applicano le stesse considerazioni sull’omogeneità delle condizioni
al contorno svolte nel paragrafo VIII per l’equazione di
Schrödinger). Dal momento che un operatore ha piú di un
autovalore, anzi, in generale ne ha infiniti, si usa un indice n
per contare gli autovalori. In realtà, a seconda dell’operatore,
del dominio su cui viene risolta la (112), e delle condizioni al
contorno, possono presentarsi diversi casi: ciascun autovalore
può risultare identificato da un solo indice discreto, oppure
da un gruppo di indici discreti (in tal caso si parla di spettro
discreto); ovvero, ciascun autovalore può risultare identificato
da un solo indice continuo, oppure da un gruppo di indici
continui (spettro continuo); infine, può avvenire che una parte
degli autovalori sia identificata da indici discreti, e l’altra
parte sia identificata da indici continui (spettro misto). Un
esempio semplicissimo è quello dell’operatore momento (85)
in un dominio monodimensionale, per il quale l’equazione agli
autovalori è
p dv
−jh̄
= pv ⇒ v = v(0) exp j ξ ,
(113)
dξ
h̄
con v(0) una costante arbitraria. Posto k = p/h̄ si può scrivere
l’autovalore come p = h̄k e l’autofunzione come v = vk (ξ).
Dal procedimento risolutivo dell’equazione non emerge nessun
vincolo su k, che quindi può assumere qualunque valore reale.
In conclusione, per il momento in una dimensione si ha un
singolo indice continuo, che appunto è k.
Un secondo esempio è il caso monodimensionale del quadrato
dell’operatore momento introdotto con la (92), che si suppone
agisca su autofunzioni non nulle in un intervallo 0 ≤ ξ ≤ a, e
identicamente nulle altrove. Indicando l’autovalore con h̄2 k 2 ,
per l’equazione agli autovalori si trova
r
nπ 2
d2 v
2 2
− 2 = h̄ k v ⇒ vn =
sin
ξ ,
(114)
dξ
a
a
p
dove n = 1, 2, . . . e la costante 2/a si ricava dalla normalizzazione. Dal procedimento risolutivo emerge un vincolo
dal quale si ha k = nπ/a. Perciò l’autovalore h̄2 π 2 n2 /a2 è
discreto.
Per le considerazioni svolte in questi paragrafi la distinzione
fra i tipi di spettri non è rilevante, e quindi si farà riferimento al
caso dello spettro discreto in cui ogni autovalore è identificato
da un solo indice.
13
Un’altra distinzione importante è la seguente: in certi casi
la (112) associa a ciascun autovalore An una e una sola
autofunzione vn (l’autovalore è allora detto semplice), in altri
casi essa associa a ciascun autovalore An diverse autofunzioni
(1)
(2)
vn , vn , . . . linearmente indipendenti (l’autovalore An è
allora detto degenere). Nel caso di un autovalore degenere,
il numero di autofuzioni linearmente indipendenti a esso
associate può essere finito, ad esempio M (in tal caso si parla
di autovalore degenere di ordine M), o infinito (in tal caso si
parla di autovalore degenere di ordine infinito). Si noti che,
mentre un autovalore può essere degenere, un’autofunzione è
sempre semplice, cioè appartiene a uno e uno solo degli autovalori. Inoltre, le autofunzioni sono tutte fra loro linearmente
indipendenti.
Per le considerazioni svolte in questi paragrafi la distinzione
fra autovalori semplici o degeneri non è rilevante, e quindi si
farà riferimento al caso di quelli semplici.
Nella meccanica quantistica gli autovalori degli operatori sono
quantità sperimentalmente misurabili, e quindi devono essere
reali. Per questo, come già notato nel paragrafo X, si deve
limitare la classe degli operatori accettabili. Per procedere
s’introduce la definizione di operatore hermitiano. Un operatore A è hermitiano se
Z
Z
∗
3
∗
(Ag) f d3 ξ
(115)
g Af d ξ =
Ω
Ω
per ogni coppia di funzioni f, g per le quali esistono
gl’integrali della (115). Come si vede, questa definizione
generalizza la (89). Si trova subito che un operatore reale
e puramente moltiplicativo, dipendente dalle sole coordinate
spaziali e dal tempo (come ad esempio l’energia potenziale
V ) è hermitiano. Inoltre sono hermitiani gli operatori p̂i e p̂2i ,
definiti rispettivamente dalle (85) e (92), e quindi è hermitiano
l’operatore hamiltoniano (65).
Posto f = g = vn , inserendo la (112) nella (115) si trova
Z
Z
An
|vn |2 d3 ξ = A∗n
|vn |2 d3 ξ ,
(116)
Ω
Ω
in cui gl’integrali sono strettamente positivi dal momento che
vn , essendo un’autofunzione, non può essere identicamente
nulla. Segue A∗n = An , cioè gli autovalori di un operatore
hermitiano sono reali.
Adesso si possono considerare due autovalori diversi, Am e
An . Posto f = vn , g = vm si trova, con lo stesso procedimento
di prima,
Z
Z
3
∗
∗
An
vm vn d ξ = Am
vm
vn d3 ξ .
(117)
Ω
Ω
Dal momento che gl’integrali della (117) sono uguali,
l’uguaglianza fra il primo e il secondo membro è verificata
solo se
Z
∗
vm
vn d3 ξ = 0 ,
n 6= m .
(118)
Ω
L’integrale a primo membro della (118) è detto prodotto
scalare di vn e vm , e si indica anche col simbolo hvm |vn i.
Quando il prodotto scalare di due funzioni è nullo, esse si
dicono ortogonali.
14
In conclusione, si è dimostrato che gli autovalori di un
operatore hermitiano sono reali e che le autofunzioni appartenenti ad autovalori diversi sono fra loro ortogonali. Si può
dimostrare che, nel caso di autovalori degeneri, le autofunzioni
linearmente indipendenti appartenenti allo stesso autovalore si
possono scegliere in modo da essere a due a due ortogonali.
Perciò si può affermare che le autofunzioni di un operatore hermitiano sono sempre a due a due ortogonali. Se, inoltre, sono
normalizzabili, cioè vale per ogni n la relazione hvn |vn i = 1,
allora si dice che le autofunzioni costituiscono un sistema
ortonormale di funzioni.
Si dimostra facilmente che, per un operatore hermitiano A, il
valore di aspettazione di A2 = AA è non negativo. Infatti,
Z
Z
2
(Aψ)∗ (Aψ) d3 ξ , (119)
ψ ∗ A (Aψ) d3 ξ =
A =
Un insieme di funzioni vn che consente lo sviluppo (121) è
detto completo. Dalla definizione (124) discende immediatamente che, per un dato insieme completo di funzioni vn , i
coefficienti sn con cui si calcola lo sviluppo sono unici.
Usando la (121) si può dimostrare che se un operatore ha gli
autovalori reali, allora esso è hermitiano. Perciò, la condizione
che A sia hermitiano è necessaria e sufficiente perché gli
autovalori An siano reali. Sempre usando la (121) si trova
X
|ψ|2 = ψ ∗ ψ =
s∗m (t)sn (t) vm (ξ)∗ vn (ξ) .
(125)
Ω
Ω
dove l’integrando dell’ultimo membro vale |Aψ|2 e quindi
è non negativo. La proprietà vale evidentemente anche per
l’operatore A − hAi. Perciò, ricordando la (91), si trova per
un operatore A hermitiano la relazione
2
2
A ≥ hAi .
(120)
XIII. C OMPLETEZZA DELLE AUTOFUNZIONI
È noto che funzioni che soddisfano opportuni vincoli di
integrabilità possono essere sviluppate in serie o in integrale
di Fourier. Ora, le funzioni seno e coseno non sono le uniche
che consentono di ottenere lo sviluppo di una funzione. Si può
dimostrare che possono essere usate, naturalmente cambiando
opportunamente la definizione dei coefficienti dello sviluppo,
le autofunzioni degli operatori hermitiani tipici della meccanica quantistica.
Piú precisamente, sotto opportune condizioni di integrabilità
della funzione d’onda, che qui si supporranno sempre verificate, quest’ultima può essere espressa con la serie
X
ψ(ξ, t) =
sn (t) vn (ξ) ,
(121)
mn
Integrando la (125) su tutto il dominio e
l’ortonormalità delle vn si trova
Z
X
|ψ|2 d3 ξ =
|sn (t)|2 ,
Ω
N →∞
Ω
n
L’espressione dei coefficienti sn (t) si trova moltiplicando
scalarmente la (121) per vm . Assumento che le autofunzioni
siano normalizzate, per cui hvm |vn i = δmn , si trova
Z
X
∗
vm
(ξ)ψ(ξ, t) d3 ξ =
sn (t) δmn = sm (t) ,
(123)
Ω
n
per ogni m, cioè
sn (t) = hvn |ψi .
(124)
(126)
n
che generalizza una nota proprietà degli sviluppi di Fourier
e prende il nome di teorema di Parseval. Ricordando quanto
detto nel paragrafo IX, quando l’integrale viene calcolato su
tutto il dominio il primo membro della (126) è indipendente
dal tempo, e quindi anche il secondo membro si riduce a una
costante. Se, inoltre, ψ è normalizzata, allora si ha
X
|sn (t)|2 = 1 .
(127)
n
Questa relazione consente di attribuire un significato notevole
ai coefficienti sn : ricordando che lo sviluppo (121) è svolto
nelle autofunzioni di A, si trova che |sn (t)|2 è la probabilità
che all’istante t la quantità dinamica associata ad A abbia il
valore An . Inoltre, attraverso i coefficienti sn (t) si può dare un
significato notevole al valore di aspettazione (88). Usando la
(121) e ricordando che A non opera sul tempo si trova infatti
X
∗
ψ ∗ Aψ =
s∗m (t) sn (t) vm
(ξ) Avn (ξ) =
mn
=
X
∗
s∗m (t) sn (t) An vm
(ξ) vn (ξ) ,
(128)
mn
n
dove le vn sono le autofunzioni di un operatore hermitiano A.
Come nel paragrafo XII si considera per semplicità il caso di
autovalori semplici e identificati da un solo indice discreto, ma
la (121) si generalizza agli altri casi. L’indice n corre su tutti
i possibili valori, in modo che la serie (121) contenga tutte
le autofuzioni vn . Tipicamente, la convergenza della
serie si
P(N
)
verifica in media, nel senso che, indicando con
una
n
somma ridotta di N termini della serie, si ha
2
Z (N )
X
lim
sn (t) vn (ξ) d3 ξ = 0 .
(122)
ψ(ξ, t) −
usando
da cui, integrando su tutto il dominio,
X
X
hAi =
s∗m (t)sn (t) An δmn =
|sn (t)|2 An .
mn
(129)
n
Il valore di aspettazione dell’operatore A è perciò la media
pesata degli autovalori di questo, in cui il peso dell’autovalore
An è |sn (t)|2 .
XIV. D INAMICA
DEI VALORI DI ASPETTAZIONE
Per determinare l’evoluzione temporale del valore di aspettazione si deve calcolare la (88) oppure la (129) a ogni istante.
Di conseguenza, è necessario calcolare preventivamente la
funzione d’onda a ogni istante, risolvendo l’equazione di
Schrödinger dipendente dal tempo (66). È tuttavia possibile
scrivere alcune relazioni che mettono in luce aspetti formali
della teoria, senza la necessità di risolvere la (66). Per questo,
si considerino preliminarmente due operatori hermitiani A e
B, e un terzo operatore C definito dalla relazione
ABf − BAf = j Cf ,
(130)
15
valida per qualunque funzione f a cui possano applicarsi gli
operatori (spesso l’indicazione esplicita della funzione f viene
omessa). L’operatore C è detto commutatore di A e B. Si
dimostra che C è anch’esso hermitiano. Se A e B sono tali
che C = 0, allora essi vengono detti commutativi. Ad esempio,
p̂ = −jh̄ d/dξ e p̂2 sono commutativi. Al contrario, ξ e p̂ non
sono commutativi, dato che
df
d(ξf )
ξ −jh̄
+ jh̄
= j h̄f ,
(131)
dξ
dξ
In realtà l’analogia col caso classico non può essere sfruttata
ai fini pratici: come si vede dalla (137), per conoscere la
forza media hFi i bisogna conoscere la funzione d’onda, e
quindi bisogna aver preventivamente risolto l’equazione di
Schrödinger. Solo se la forza ha una variazione spaziale cosı̀
lenta da poter essere considerata costante nella regione in
cui è significativa la funzione d’onda, allora si può usare la
semplificazione (detta approssimazione di Ehrenfest)
Z
Z
∂V 3
∂V
|ψ|2
hFi i = −
d ξ≃−
|ψ|2 d3 ξ , (139)
∂ξi
∂ξi
Ω
Ω
cioè in questo caso C = h̄ 6= 0. Per procedere, si consideri un
operatore A che non contiene il tempo (l’estensione al caso
in cui A contiene il tempo è immediata). La derivata rispetto
al tempo del valore di aspettazione di A si trova a partire
dalla definizione (88). Scambiando la derivata con l’integrale
si ottiene
Z ∗
∂ψ
∂ψ
d
∗
d3 ξ .
(132)
hAi =
Aψ + ψ A
dt
∂t
∂t
Ω
Usando le (68) si trasforma la (132) nella
Z
j
d
hAi =
ψ ∗ (H A − A H) ψ d3 ξ .
dt
h̄ Ω
(133)
La (133) mostra che tutti gli operatori che non contengono il
tempo e commutano con l’hamiltoniano hanno un valore di
aspettazione che si conserva nel tempo.
Un’applicazione notevole della (133) si ha scegliendo A = ξi
oppure A = p̂i . Nel primo caso, si trova subito che ξi commuta
con l’energia potenziale V e con gli addendi dell’operatore
cinetico (93) che non contengono l’indice i. Perciò
H ξi − ξi H = −
h̄
h̄2 ∂
=
p̂i .
m ∂ξi
jm
(134)
Inserendo questa nella (133) con A = ξi si trova
d
1
hξi i =
hp̂i i .
(135)
dt
m
Nel secondo caso, p̂i commuta con l’operatore cinetico (93),
ma non con l’energia potenziale V . Perciò
H p̂i − p̂i H = jh̄
∂V
.
∂ξi
Inserendo questa nella (133) con A = p̂i si trova
Z
∂V 3
d
|ψ|2
d ξ = hFi i ,
hp̂i i = −
dt
∂ξi
Ω
(136)
(137)
dove Fi = −∂V /∂ξi è la ima componente della forza. È
interessante notare come le (135,137) somiglino alle relazioni
dinamiche classiche. Infatti, se s’identifica dhξi i/dt con la ima
componente della velocità del pacchetto e hp̂i i con la ima
componente della sua quantità di moto, la (135) riproduce la
relazione classica fra quantità di moto e velocità. A sua volta,
la (137) generalizza la relazione classica fra la derivata temporale di una componente della quantità di moto e l’omologa
componente della forza. Derivando rispetto al tempo la (135)
e inserendo il risultato nella (137) si trova la generalizzazione
della legge di Newton:
2
hFi i = m
d
hξi i .
dt2
(138)
dove le parentesi quadre Rindicano che la forza è calcolata in
ξ = hξi. Ricordando che Ω |ψ|2 d3 ξ = 1 si ricava la legge di
Newton.
XV. E Q .
DI
S CHR ÖDINGER
INDIPENDENTE DAL TEMPO
Si consideri la (121), in cui per ora le funzioni vn (ξ) sono
le autofunzioni di un generico operatore, e si sostituisca la
serie nell’equazione di Schrödinger dipendente dal tempo (66).
Ricordando che H non opera sul tempo si ottiene
X
n
sn (t) Hvn (ξ) =
X
n
jh̄
dsn (t)
vn (ξ) .
dt
(140)
Se ora si considera il caso conservativo, cioè quello in cui
l’energia potenziale V non dipende dal tempo, l’operatore
hamiltoniano risulta anch’esso indipendente dal tempo e
quindi è origine di un’equazione agli autovalori. Le autofunzioni di H saranno indicate con wn per distinguerle da quelle
degli altri casi. Gli autovalori, che hanno le dimensioni di
un’energia, saranno indicati con En . In definitiva,
Hwn (ξ) = En wn (ξ) .
(141)
La (141) è detta equazione di Schrödinger indipendente dal
tempo. Dal momento che l’operatore hamiltoniano è associato
all’energia totale, i suoi autovalori En sono possibili valori
dell’energia totale della particella. Sostituendo la (141) nella
(140) e raccogliendo, si trova
X dsn
En
(142)
+j
sn wn = 0 .
dt
h̄
n
Poiché il primo membro della (140) si annulla per ogni ξ, e le
funzioni wn sono fra loro linearmente indipendenti, la (140)
è verificata solo se si annullano individualmente i termini fra
parentesi. In conclusione,
En
t .
(143)
sn (t) = cn exp −j
h̄
Sostituendo la (143) nella (121), si trova per il caso conservativo
X
En
ψ(ξ, t) =
cn wn (ξ) exp −j
t .
(144)
h̄
n
Ricordando l’interpretazione dei coefficienti sn (t) data nel
paragrafo XIII, la probabilità che l’autovalore (in questo caso
l’energia totale della particella) sia En è data da |sn (t)|2 =
|cn |2 , quindi è indipendente dal tempo. Il valore di aspettazione dell’energia totale è in questo caso
X
En − Em
hHi =
c∗m cn En exp −j
t δmn =
h̄
mn
X
=
|cn |2 En .
(145)
n
La (145) mostra che nel caso conservativo il valore di aspettazione dell’energia totale è una costante del moto, come peraltro
si poteva dedurre ponendo A = H nella (133) e osservando
che un operatore commuta con sè stesso.
Se, in seguito a un’ulteriore informazione (resa disponibile, ad
esempio, da una misura), è noto che a un certo istante l’energia
totale della particella è l’autovalore imo Ei , la (145) diviene
compatibile con tale informazione ponendo |cn |2 = δin .
In altri termini, la media degli autovalori dell’energia totale
coincide con il singolo autovalore Ei . La relazione |ci |2 = 1
individua il numero complesso ci a meno della fase, che risulta
indeterminata. Peraltro, la probabilità che l’energia totale della
particella sia Ei è determinata solo dal modulo di ci , quindi
la fase di ci non fornisce alcuna informazione. In conclusione,
si può considerare nulla la fase di ci e porre ci = 1.
Si consideri sempre il caso in cui è noto che a un generico
istante t0 l’energia totale della particella assume il valore Ei .
Se, negl’istanti successivi a t0 , la dinamica della particella
continua a essere descritta dallo stesso hamiltoniano (in altri termini, se non intervengono perturbazioni), la funzione
d’onda per t ≥ t0 si ottiene ponendo cn = δin nello sviluppo
(144). Infatti, come detto in precedenza, lo sviluppo della
funzione d’onda secondo un dato insieme di autofunzioni è
unico. Perciò i coefficienti dello sviluppo, che in questo caso
sono le costanti cn , devono coincidere con quelli dell’istante
iniziale. Ponendo per semplicità t0 = 0 si trova
Ei
ψ(ξ, t) = wi (ξ) exp −j t .
(146)
h̄
In particolare, in questo caso il valore dell’energia totale resta
sempre Ei , e il valore medio degli autovalori dell’energia
totale coincide con Ei .
Per concludere si può notare quanto segue: l’insieme delle
autofunzioni wn di un hamiltoniano conservativo è completo,
è quindi anch’esso può essere usato per lo sviluppo di una
funzione d’onda piú generale (cioè corrispondente a un caso
non conservativo). In altri termini, ricordando la (121), vale
uno sviluppo della forma
X
ψ(ξ, t) =
sn (t) wn (ξ) ,
sn (t) = hwn |ψi . (147)
n
In diverse considerazioni è utile far apparire nella (147), oltre
che le autofunzioni wn , anche gli autovalori En a cui queste
corrispondono. Ciò può ottenersi introducendo un insieme di
funzioni ausiliarie an (t) definite da
En
.
t ,
(148)
an (t) = sn (t) exp j
h̄
da cui
ψ(ξ, t) =
X
n
En
t .
an (t) wn (ξ) exp −j
h̄
(149)
16
XVI. D EDUZIONE DELL’ EQUAZIONE DI S CHR ÖDINGER
The method used by Schrödinger to determine the timeindependent equation (141) can be synthesized as follows.
In classical mechanics, besides the Lagrangian and the Hamiltonian approaches, there is another method based upon the socalled Hamilton-Jacobi equation. The unknown of the latter
is a function S = S(q, t), which is related to the components
of the momentum by
pi =
∂S
.
∂qi
(150)
After replacing the components pi with ∂S/∂qi within the
Hamiltonian function, the latter becomes a function of the
generalized coordinates and time only. The dependence on the
coordinates is both explicit and, through S, implicit. One can
then demonstrate that the Hamilton equations can be replaced
by the Hamilton-Jacobi equation
∂S
∂S
∂S
,...,
,t = 0,
(151)
+ H q1 , . . . , qn ,
∂t
∂q1
∂qn
where a system of particles with n degrees of freedom is considered. The above is a first-order differential equation in the
unknown function S (called Hamilton principal function). The
equation must be supplemented with n+1 integration constants
because there are n+1 independent variables q1 , . . . , qn , t. One
of these constants is necessarily an additive constant on S,
because only the first derivatives of S appear in the equation.
Once S is found, one is able to reconstruct the time evolution
of all qi and pi .
In the conservative case H(q1 , . . . , qn , p1 , . . . , pn ) = E =
const one easily sees that the Hamilton-Jacobi equation can
be separated by letting
∂W
,
∂qi
∂W
∂W
H q1 , . . . , qn ,
=E,
,...,
∂q1
∂qn
S = W − E t,
pi =
(152)
(153)
with W = W (q1 , . . . , qn ) the Hamilton characteristic function.
Consider by way of example a single particle of mass m. Using
the rectangular coordinates xi and a Hamiltonian function of
the form
p2
H=
+ V (x1 , x2 , x3 , t) , p2 = p21 + p22 + p23 , (154)
2m
the Hamilton-Jacobi equation reads
| grad S|2
∂S
+
+ V (x1 , x2 , x3 , t) = 0 .
(155)
∂t
2m
If V is independent of time, then H = E and the separation
S = W − E t yields ∂S/∂t = −E, grad S = grad W = p. It
follows
| grad W |2
+ V (x1 , x2 , x3 ) = E .
(156)
2m
On notes that W and S have the dimensions of the product of
a momentum by a coordinate, that is, an action. Like S, also
W is defined apart from an additive constant. Also, the form
of | grad W | is uniquely defined by that of V − E. In turn, E
is prescribed by the initial conditions of the particle’s motion.
17
Now, consider the case where E ≥ V within a closed domain
Ω whose boundary is ∂Ω. As grad W is real, the motion of
the particle is confined within Ω, and grad W vanishes at the
boundary ∂Ω.
The Hamilton-Jacobi equation for W may be recast in a
different form by introducing an auxiliary function w such
that
w = w0 exp(W/µ) ,
(157)
where the prime indicates the derivative with respect to x.
The left hand side of the equation may be considered the
generating function g = g(w, w′ , x) of a functional, defined
over an interval of the x axis that may extend to infinity:
Z b 2
µ
′ 2
2
(163)
(w ) + (V − E) w dx .
G[w] =
2m
a
with µ a constant having the dimensions of an action. The
other constant w0 is used for prescribing the dimensions of
w. Apart from this, the choice of w0 is arbitrary due to the
arbitrariness of the additive constant of W . Taking the gradient
of both sides yields µ grad w = w grad W , with w 6= 0 due
to the definition. As grad W vanishes at the boundary, grad w
vanishes there as well. As a consequence, w is constant over
the boundary. The Hamilton-Jacobi equation takes the form
µ2 | grad w|2
+ V (x1 , x2 , x3 ) = E ,
(158)
2m
w2
which determines | grad w/w| as a function of V − E. Rearranging the above and observing that div(w grad w) =
w∇2 w + | grad w|2 provides
µ2 div(w grad w) − w∇2 w + (V − E) w2 = 0 . (159)
2m
Integrating over Ω and remembering that grad w vanishes at
the boundary one finds
Z
µ2 2
∇ w + (V − E) w dΩ = 0 .
(160)
w −
2m
Ω
The term in brackets of the above equation does not necessarily
vanish. In fact, the form of w is such that only the integral as a
whole vanishes. On the other hand, by imposing that the term
in brackets vanishes, and replacing µ with h̄, the Schrödinger
equation independent of time is obtained:
h̄2 2
∇ w + (V − E) w = 0 .
(161)
2m
This result shows that the Schrödinger equation derives from a
stronger constraint than that prescribed by the Hamilton-Jacobi
equation.
An immediate consequence of replacing the integral relation
with the differential equation is that the domain of w is not
limited any more by the condition E ≥ V , but may extend to
infinity. As a consequence, it is not necessary any more that
the boundary conditions of w are prescribed over ∂Ω.
Another consequence is that, if the boundary conditions are
such that w vanishes over the boundary (which, as said above,
may also be placed at infinity), then the equation is solvable
only for specific values of E, that form its spectrum of
eigenvalues. Moreover it can be demonstrated, basing on the
form of the Schrodinger equation, that the condition E ≥ Vmin
must be fulfilled.
It is interesting to note another relation between the
Schrödinger and the Hamilton-Jacobi equations. For the sake
of simplicity one takes the one-dimensional case of the
Hamilton-Jacobi equation expressed in terms of w:
−
µ2
(w′ )2 + [V (x) − E] w2 = 0 ,
2m
(162)
One finds
d µ2 ′
∂g
d ∂g
=
w ,
= 2 (V − E) w , (164)
′
dx ∂w
dx m
∂w
showing that the Schrödinger equation is actually the EulerLagrange equation
d ∂g
∂g
=
(165)
′
dx ∂w
∂w
of the functional G. This result holds also in the higherdimensional cases.
The conclusion of this reasoning is that the Hamilton-Jacobi
equation provides the function w that makes G to vanish,
whereas the Schrödinger equation provides the function (or
the functions) w for which G has an extremum.

Appunti sulla relazione di dispersione E(k) nei cristalli

Transcript

Documenti analoghi

assenso proprietario

lo spazio virtuale

Nuove coordinate bancarie FM GROUP Italia

situazione patrimoniale anno 2012

Critica di Heisenberg al concetto di traiettoria

Certificato di destinazione urbanistica.

al comune di trieste chiede il rilascio del certificato di destinazione

Liceali scienziati del Cern (ma solo per un giorno)

V appello 2011

ChatRoulette A brand new service for one-on