Calcoli di energia libera - Dipartimento di Fisica G. Occhialini
Transcript
Calcoli di energia libera - Dipartimento di Fisica G. Occhialini
Calcoli di energia libera Federico Fogolari Dipartimento Scientifico e Tecnologico Universita’ di Verona Ca’ Vignal 1, Strada Le Grazie 15 37134 Verona, Italy tel. ++39-045-8027906 fax. ++39-045-8027929 email: [email protected] http://www.scienze.univr.it/˜fogolari Sommario • Esempi • Richiami di termodinamica statistica • Cicli termodinamici • Approcci: Thermodynamic integration • Approcci: Perturbation method • Approcci: potenziali di forza media F. Fogolari Milano, 21-22 Aprile 2004 – 2 Esempi tipici • Predizione della struttura (conformazione) di una proteina o di parti di questa • Predizione delle costanti di legame fra due molecole (ad es. un farmaco ed una proteina) • Predizione dell’effetto di una mutazione su una energia di legame Approcci tipici prevedono: • La generazione dei modelli molecolari (eventualmente con dinamica molecolare o Monte Carlo) • La valutazione della energia libera corrispondente ai diversi modelli F. Fogolari Milano, 21-22 Aprile 2004 – 3 Approccio naive • Campionare lo spazio conformazionale (MD o MC...) • Definire gli stati macroscopici di interesse (es. molecole legate e non legate, oppure proteina foldata e non foldata) • Calcolare i rapporti di probabilita’ e calcolare le energie libere relative • ∆GA−→B = −kT ln B A Problemi: • cinetica lenta (sulla scala dei tempi accessibile al calcolo) dei processi − ∆G kT • rapporti di probabilita’ bassi (P ≈ e F. Fogolari ) Milano, 21-22 Aprile 2004 – 4 Meccanica statistica • Ensemble N,V,T −→ Helmholtz excess free energy: F = −kT ln( R −E kT e ) N V • La probabilita’ di una conformazione obbedisce alla distribuzione di Boltzmann: P = −E e kT R −E e kT R −E E N • Inserendo al denominatore V = e kT e kT ottengo F come me- dia statistica sull’insieme: R −E kT e 1 F = −kT ln( R E = kT ln < E E ) = −kT ln R − kT e kT P e kT e F. Fogolari E kT e > Milano, 21-22 Aprile 2004 – 5 Problemi • Campionamento efficace dello spazio conformazionale • Stimare efficacemente i contributi entropici (ad es. i rotameri...) • Le medie statistiche sono tipicamente dominate dalle fluttuazioni In pratica i calcoli di energia libera sono utili solo quando si calcolano differenze in F piuttosto che valori assoluti. Le conformazioni o i diversi sistemi che si confrontano devono essere molto simili E’ necessario che tutti i contributi non voluti e soggetti a fluttuazioni si cancellino per differenza. F. Fogolari Milano, 21-22 Aprile 2004 – 6 Cicli termodinamici F. Fogolari Milano, 21-22 Aprile 2004 – 7 Thermodynamic integration • Charging process, coupling parameter. L’idea e’ quella di descrivere il processo attraverso un parametro λ. Ad es. la carica o la mutazione di un gruppo chimico o in generale dei termini di energia. Il punto iniziale e finale del processo hanno λ 0 e 1 rispettivamente • Z(λ = 1) ∆F = −kT ln( ) = F1 − F0 Z(λ = 0) • F (λ) = −kT ln(Z(λ)) • ∆F = F. Fogolari Z dλdF (λ) = dλ Z d(λd − kT ln Z(λ)) = dλ Z dE dλ < >λ dλ Milano, 21-22 Aprile 2004 – 8 Thermodynamic integration • Ad es. E = E0 + λ∆E (linear coupling). Un esempio potrebbe essere quello in cui la funzione E viene mutata a Eharm = X k(Ri − Req )2 (Einstein’s solid). In pratica E(λ) = E0(1 − λ) + λEharm. Questo puo’ essere utile se il calcolo si fa per due conformazioni (sufficientemente stabili) della stessa molecola. • A0 −→ Aharm ←− A1 • In questo modo posso confrontare l’energia libera corrispondente a due conformazioni diverse (....!!!!). • Altri esempi includono la trasformazione ”alchemica” ad es. di H in CH3, o la crescita di una cavita’ in acqua o la carica di un gruppo di atomi. • continua oppure a multiconfigurazione F. Fogolari Milano, 21-22 Aprile 2004 – 9 Perturbation method R −E kT • A = −kT ln e R − E1 kT • ∆A = −kT ln e • ∆A = −kT ln R R − E0 kT − −kT ln e E E E − 1 + 0 − 0 e kT e kT e kT R − E0 e kT • ∆A = −kT ln < ∆E e kT >0 (forward) −∆E e kT • ∆A = kT ln < >1 (backward) In pratica funziona solo se ∆E e’ DAVVERO solo una perturbazione. F. Fogolari Milano, 21-22 Aprile 2004 – 10 Potenziale di forza media • La probabilita’ che un sistema composto da N particelle sia nello stato descritto dalle coordinate (~ r1 , ~ r2, ..., ~ rN ) e’ dato da: dP = −E(~ r1 ,~ r2 ,...,~ rN ) kT e d~ r1, d~ r2, ..., d~ rN R −E(~ r1 ,~ r2 ,...,~ rN ) kT e d~ r1, d~ r2, ..., d~ rN • Il potenziale di forza media e’ definito come segue: −W (~ r1 ,...,~ rn ) kT e R n V e = R −E(~ r1 ,...,~ rn ,~ rn+1 ,...,~ rN ) kT d~ rn+1, ..., d~ rN −E(~ r1 ,...,~ rn ,~ rn+1 ,...,~ rN ) kT e d~ r1, ..., d~ rn, d~ rn+1, ..., d~ rN • Questo potenziale W e’ tale che la derivata del potenziale rispetto ad R coincide con la forza media sulla coordinata R. • Viceversa, se osservo una distribuzione spaziale g(R) diversa dalla distribuzione casuale attesa interpreto questa come dovuta ad un potenziale efficace. F. Fogolari Milano, 21-22 Aprile 2004 – 11 Esempi e problemi • In pratica posso considerare una variabile (ad es. un angolo torsionale) e generare un istogramma con i conteggi corrispondenti a tutti i valori ed estrarre il pmf: ρ(r) W (r) = −kT ln( ) ρ0(r) • Problema: W (r) varia tipicamente su diversi kT che si traducono in differenze di ordini di grandezza sui conteggi. • In generale c’e’ il problema del campionamento. • I potenziali di forza media su singole variabili sono spesso correlati e questo pone dei problemi nell’utilizzo simultaneo di piu’ potenziali di forza media. F. Fogolari Milano, 21-22 Aprile 2004 – 12 Umbrella sampling • Forzare il campionamento di zone energeticamente sfavorite. Es. il rotamero con φ ≈ φ0 Introduco un potenziale fittizio con un minimo attorno φ0. (Posso variare φ0 in modo continuo). E 0 = E + k(φ − φ0)2 = E + R • Problema: W (r) varia tipicamente su diversi kT che si traducono in differenze di ordini di grandezza sui conteggi. • La probabilita’ P e’ legata a P 0 E R R E R R E R R P0 e− kT e− kT e− kT e− kT e− kT e− kT e+ kT = E R −E −R = R −E −R − P e kT e kT e kT e kT e kT R + kT 0 >(E+R) −kT ln P = −kT lnP − R + kT ln < e F. Fogolari Milano, 21-22 Aprile 2004 – 13 Approssimazioni • L’approssimazione piu’ comune consiste nello scomporre l’energia libera per un processo in diversi contributi e poi cercare di stimare questi contributi in qualche modo. • La scomposizione dell’energia libera in diverse componenti NON ha, in generale, una base statistica solida, ma in pratica funziona molto meglio dei metodi visti sopra. ∆A = ∆U − T ∆S ∆Asolution = ∆Avacuum + ∆Asolvation ∆Avacuum = ∆EM M − T (∆S(i.d.f.) + ∆S(r.t.d.f )) ∆Asolvation = ∆Aelectrostatic + ∆Ahydrophobic • Le difficolta’ maggiori consistono nella stima dell’entropia e nella stima delle energie di solvatazione. F. Fogolari Milano, 21-22 Aprile 2004 – 14 Approcci semplici per l’entropia • ∆S puo’ essere stimato approssimativamente attraverso le restrizioni ai gradi di liberta’. Ad es. per un angolo torsionale con 3 possibili stati che passa ad un solo stato nel legame ∆S = k ln 1 3. ∆χ Due molecole rigide che si legano: ∆S = k ln VC.M.bound + k ln V 8π 2 0 • Altri approcci considerano i modi normali della molecola e trattano la molecola come un oscillatore armonico (problema raggiungere il minimo di energia...) • Un altro approccio considera l’insieme delle conformazioni generato con MD, MC o metodi computazionali e considerano ogni struttura come rappresentativa di una colonia di strutture simili e ne valutano l’entropia.... F. Fogolari Milano, 21-22 Aprile 2004 – 15 Modelli impliciti di solvente • Considerare esplicitamente il solvente nell’analisi termodinamica e’ difficile a causa delle fluttuazioni e delle approssimazioni. • L’analisi termodinamica viene condotta con un modello implicito di solvente • La probabilita’ che un sistema composto da N particelle sia nello stato descritto dalle coordinate (~ r1 , ~ r2, ..., ~ rN ) e’ dato da: dP = −E(~ r1 ,~ r2 ,...,~ rN ) kT e d~ r1, d~ r2, ..., d~ rN R −E(~ r1 ,~ r2 ,...,~ rN ) kT d~ r1, d~ r2, ..., d~ rN e • Integrando sui gradi di liberta’ del solvente (~ rn+1, ..., ~ rN ) posso cercare di trattare il solvente in modo implicito. F. Fogolari Milano, 21-22 Aprile 2004 – 16 Modelli impliciti di solvente Una derivazione elegante usa il potenziale chimico: µ0 M = −RT ln( ZM S ∗ ZM = = ZS QM S − P ∆V e RT ) 0 VM S C QS 1 ~ ,R ~ R − E(R M S) ~ RT e dR rS M , d~ ~ ) R − E(R S ~ e RT dR S ~ ~ ~ ~ ) R − EM (R M R − EM S (RM ,RS ) − ES (RS ) ~ S dR ~M RT RT RT dR e e e ∗ ZM = ~ ) R − E(R S ~S e RT dR ∗ = ZM Z ~ )+W (R ~ ) EM (R M M − ~M RT e dR ~ M ) = −RT ln( W (R ~ ,R ~ ~ R − EM S (R M S ) − ES (RS ) ~ RT RT dR e e R F. Fogolari ~ ) E(R − RTS ~ e dRS S ) Milano, 21-22 Aprile 2004 – 17 Modelli impliciti di solvente • Problema: stimare ∆Gsolv in maniera accurata. • Approssimazioni comuni: ∆G viene stimata come somma di un contributo puramente elettrostatico (alla Born) e un contributo puramente idrofobico (ad es. proporzionale alla superficie esposta): • ∆Gsolv = ∆Gsolv,es + ∆Gsolv,np F. Fogolari Milano, 21-22 Aprile 2004 – 18