Calcoli di energia libera - Dipartimento di Fisica G. Occhialini

Transcript

Calcoli di energia libera - Dipartimento di Fisica G. Occhialini
Calcoli di energia libera
Federico Fogolari
Dipartimento Scientifico e Tecnologico
Universita’ di Verona
Ca’ Vignal 1, Strada Le Grazie 15
37134 Verona, Italy
tel. ++39-045-8027906
fax. ++39-045-8027929
email: [email protected]
http://www.scienze.univr.it/˜fogolari
Sommario
• Esempi
• Richiami di termodinamica statistica
• Cicli termodinamici
• Approcci: Thermodynamic integration
• Approcci: Perturbation method
• Approcci: potenziali di forza media
F. Fogolari
Milano, 21-22 Aprile 2004 – 2
Esempi tipici
• Predizione della struttura (conformazione) di una proteina o di
parti di questa
• Predizione delle costanti di legame fra due molecole (ad es. un
farmaco ed una proteina)
• Predizione dell’effetto di una mutazione su una energia di legame
Approcci tipici prevedono:
• La generazione dei modelli molecolari (eventualmente con dinamica molecolare o Monte Carlo)
• La valutazione della energia libera corrispondente ai diversi modelli
F. Fogolari
Milano, 21-22 Aprile 2004 – 3
Approccio naive
• Campionare lo spazio conformazionale (MD o MC...)
• Definire gli stati macroscopici di interesse (es. molecole legate
e non legate, oppure proteina foldata e non foldata)
• Calcolare i rapporti di probabilita’ e calcolare le energie libere
relative
• ∆GA−→B = −kT ln B
A
Problemi:
• cinetica lenta (sulla scala dei tempi accessibile al calcolo) dei
processi
− ∆G
kT
• rapporti di probabilita’ bassi (P ≈ e
F. Fogolari
)
Milano, 21-22 Aprile 2004 – 4
Meccanica statistica
• Ensemble N,V,T −→ Helmholtz excess free energy:
F = −kT ln(
R −E
kT
e
)
N
V
• La probabilita’ di una conformazione obbedisce alla distribuzione
di Boltzmann: P =
−E
e kT
R −E
e kT
R −E E
N
• Inserendo al denominatore V = e kT e kT ottengo F come me-
dia statistica sull’insieme:
R −E
kT
e
1
F = −kT ln( R
E = kT ln <
E E ) = −kT ln R
− kT
e kT
P e kT
e
F. Fogolari
E
kT
e
>
Milano, 21-22 Aprile 2004 – 5
Problemi
• Campionamento efficace dello spazio conformazionale
• Stimare efficacemente i contributi entropici (ad es. i rotameri...)
• Le medie statistiche sono tipicamente dominate dalle fluttuazioni
In pratica i calcoli di energia libera sono utili solo quando si calcolano differenze in F piuttosto che valori assoluti.
Le conformazioni o i diversi sistemi che si confrontano devono essere molto simili
E’ necessario che tutti i contributi non voluti e soggetti a fluttuazioni
si cancellino per differenza.
F. Fogolari
Milano, 21-22 Aprile 2004 – 6
Cicli termodinamici
F. Fogolari
Milano, 21-22 Aprile 2004 – 7
Thermodynamic integration
• Charging process, coupling parameter. L’idea e’ quella di descrivere il processo attraverso un parametro λ. Ad es. la carica
o la mutazione di un gruppo chimico o in generale dei termini
di energia. Il punto iniziale e finale del processo hanno λ 0 e 1
rispettivamente
•
Z(λ = 1)
∆F = −kT ln(
) = F1 − F0
Z(λ = 0)
•
F (λ) = −kT ln(Z(λ))
•
∆F =
F. Fogolari
Z
dλdF (λ)
=
dλ
Z
d(λd − kT ln Z(λ))
=
dλ
Z
dE
dλ <
>λ
dλ
Milano, 21-22 Aprile 2004 – 8
Thermodynamic integration
• Ad es. E = E0 + λ∆E (linear coupling). Un esempio potrebbe
essere quello in cui la funzione E viene mutata a
Eharm =
X
k(Ri − Req )2
(Einstein’s solid). In pratica E(λ) = E0(1 − λ) + λEharm. Questo
puo’ essere utile se il calcolo si fa per due conformazioni (sufficientemente stabili) della stessa molecola.
• A0 −→ Aharm ←− A1
• In questo modo posso confrontare l’energia libera corrispondente
a due conformazioni diverse (....!!!!).
• Altri esempi includono la trasformazione ”alchemica” ad es. di
H in CH3, o la crescita di una cavita’ in acqua o la carica di un
gruppo di atomi.
• continua oppure a multiconfigurazione
F. Fogolari
Milano, 21-22 Aprile 2004 – 9
Perturbation method
R −E
kT
• A = −kT ln e
R − E1
kT
• ∆A = −kT ln e
• ∆A = −kT ln
R
R − E0
kT
− −kT ln e
E
E
E
− 1 + 0 − 0
e kT e kT e kT
R − E0
e kT
• ∆A = −kT ln <
∆E
e kT
>0 (forward)
−∆E
e kT
• ∆A = kT ln <
>1 (backward)
In pratica funziona solo se ∆E e’ DAVVERO solo una perturbazione.
F. Fogolari
Milano, 21-22 Aprile 2004 – 10
Potenziale di forza media
• La probabilita’ che un sistema composto da N particelle sia nello
stato descritto dalle coordinate (~
r1 , ~
r2, ..., ~
rN ) e’ dato da:
dP =
−E(~
r1 ,~
r2 ,...,~
rN )
kT
e
d~
r1, d~
r2, ..., d~
rN
R
−E(~
r1 ,~
r2 ,...,~
rN )
kT
e
d~
r1, d~
r2, ..., d~
rN
• Il potenziale di forza media e’ definito come segue:
−W (~
r1 ,...,~
rn )
kT
e
R
n
V
e
=
R
−E(~
r1 ,...,~
rn ,~
rn+1 ,...,~
rN )
kT
d~
rn+1, ..., d~
rN
−E(~
r1 ,...,~
rn ,~
rn+1 ,...,~
rN )
kT
e
d~
r1, ..., d~
rn, d~
rn+1, ..., d~
rN
• Questo potenziale W e’ tale che la derivata del potenziale rispetto
ad R coincide con la forza media sulla coordinata R.
• Viceversa, se osservo una distribuzione spaziale g(R) diversa
dalla distribuzione casuale attesa interpreto questa come dovuta
ad un potenziale efficace.
F. Fogolari
Milano, 21-22 Aprile 2004 – 11
Esempi e problemi
• In pratica posso considerare una variabile (ad es. un angolo torsionale) e generare un istogramma con i conteggi corrispondenti
a tutti i valori ed estrarre il pmf:
ρ(r)
W (r) = −kT ln(
)
ρ0(r)
• Problema: W (r) varia tipicamente su diversi kT che si traducono
in differenze di ordini di grandezza sui conteggi.
• In generale c’e’ il problema del campionamento.
• I potenziali di forza media su singole variabili sono spesso correlati e questo pone dei problemi nell’utilizzo simultaneo di piu’
potenziali di forza media.
F. Fogolari
Milano, 21-22 Aprile 2004 – 12
Umbrella sampling
• Forzare il campionamento di zone energeticamente sfavorite.
Es. il rotamero con φ ≈ φ0
Introduco un potenziale fittizio con un minimo attorno φ0. (Posso
variare φ0 in modo continuo).
E 0 = E + k(φ − φ0)2 = E + R
• Problema: W (r) varia tipicamente su diversi kT che si traducono
in differenze di ordini di grandezza sui conteggi.
• La probabilita’ P e’ legata a P 0
E
R R
E
R R
E
R
R
P0
e− kT e− kT e− kT
e− kT e− kT e− kT e+ kT
=
E R −E −R =
R −E −R
−
P
e kT e kT e kT
e kT e kT
R
+ kT
0
>(E+R)
−kT ln P = −kT lnP − R + kT ln < e
F. Fogolari
Milano, 21-22 Aprile 2004 – 13
Approssimazioni
• L’approssimazione piu’ comune consiste nello scomporre l’energia
libera per un processo in diversi contributi e poi cercare di stimare questi contributi in qualche modo.
• La scomposizione dell’energia libera in diverse componenti NON
ha, in generale, una base statistica solida, ma in pratica funziona
molto meglio dei metodi visti sopra.
∆A = ∆U − T ∆S
∆Asolution = ∆Avacuum + ∆Asolvation
∆Avacuum = ∆EM M − T (∆S(i.d.f.) + ∆S(r.t.d.f ))
∆Asolvation = ∆Aelectrostatic + ∆Ahydrophobic
• Le difficolta’ maggiori consistono nella stima dell’entropia e nella
stima delle energie di solvatazione.
F. Fogolari
Milano, 21-22 Aprile 2004 – 14
Approcci semplici per l’entropia
• ∆S puo’ essere stimato approssimativamente attraverso le restrizioni ai gradi di liberta’. Ad es. per un angolo torsionale con 3
possibili stati che passa ad un solo stato nel legame ∆S = k ln 1
3.
∆χ
Due molecole rigide che si legano: ∆S = k ln VC.M.bound
+
k
ln
V
8π 2
0
• Altri approcci considerano i modi normali della molecola e trattano la molecola come un oscillatore armonico (problema raggiungere il minimo di energia...)
• Un altro approccio considera l’insieme delle conformazioni generato con MD, MC o metodi computazionali e considerano ogni
struttura come rappresentativa di una colonia di strutture simili
e ne valutano l’entropia....
F. Fogolari
Milano, 21-22 Aprile 2004 – 15
Modelli impliciti di solvente
• Considerare esplicitamente il solvente nell’analisi termodinamica
e’ difficile a causa delle fluttuazioni e delle approssimazioni.
• L’analisi termodinamica viene condotta con un modello implicito
di solvente
• La probabilita’ che un sistema composto da N particelle sia nello
stato descritto dalle coordinate (~
r1 , ~
r2, ..., ~
rN ) e’ dato da:
dP =
−E(~
r1 ,~
r2 ,...,~
rN )
kT
e
d~
r1, d~
r2, ..., d~
rN
R
−E(~
r1 ,~
r2 ,...,~
rN )
kT
d~
r1, d~
r2, ..., d~
rN
e
• Integrando sui gradi di liberta’ del solvente (~
rn+1, ..., ~
rN ) posso
cercare di trattare il solvente in modo implicito.
F. Fogolari
Milano, 21-22 Aprile 2004 – 16
Modelli impliciti di solvente
Una derivazione elegante usa il potenziale chimico:
µ0
M = −RT ln(
ZM S
∗
ZM =
=
ZS
QM S − P ∆V
e RT )
0
VM S C QS
1
~ ,R
~
R − E(R
M S)
~
RT
e
dR
rS
M , d~
~ )
R − E(R
S
~
e RT dR
S
~
~
~
~ )
R − EM (R
M R − EM S (RM ,RS ) − ES (RS )
~ S dR
~M
RT
RT
RT dR
e
e
e
∗
ZM =
~ )
R − E(R
S
~S
e RT dR
∗ =
ZM
Z
~ )+W (R
~ )
EM (R
M
M
−
~M
RT
e
dR
~ M ) = −RT ln(
W (R
~ ,R
~
~
R − EM S (R
M S ) − ES (RS )
~
RT
RT dR
e
e
R
F. Fogolari
~ )
E(R
− RTS ~
e
dRS
S
)
Milano, 21-22 Aprile 2004 – 17
Modelli impliciti di solvente
• Problema: stimare ∆Gsolv in maniera accurata.
• Approssimazioni comuni: ∆G viene stimata come somma di un
contributo puramente elettrostatico (alla Born) e un contributo
puramente idrofobico (ad es. proporzionale alla superficie esposta):
• ∆Gsolv = ∆Gsolv,es + ∆Gsolv,np
F. Fogolari
Milano, 21-22 Aprile 2004 – 18