in#vitro#(#in#vivo# in#silico

Transcript

in#vitro#(#in#vivo# in#silico
in#vitro#(#in#vivo#
in#silico#
Biochimica computazionale
I sistemi chimici sono generalmente troppo
inomogenei e complessi per essere trattati
analiticamente
Sono necessarie
Simulazioni numeriche del comportamento
del sistema per produrre insiemi statistici
di configurazioni che rappresentano lo stato
del sistema: meccanica statistica
Dinamica Molecolare Classica
Il termine dinamica molecolare classica indica una
estensione al caso dinamico della meccanica molecolare
classica:
le molecole vengono caratterizzate computazionalmente
in funzione di parametri che esprimono le loro
caratteristiche fisiche per mezzo delle leggi che
appartengono al mondo della fisica classica
Dinamica Molecolare Classica (MD)
Una simulazione di Dinamica Molecolare classica
fornisce le posizioni di tutti gli atomi del sistema
(centinaia di migliaia particelle) per una durata di
centinaia di nanosecondi
Viene generalmente utilizzata per
•  ottenere informazioni su proprietà dinamiche
delle macromolecole
• interpretare dati sperimentali
•  ottenere misure di grandezze all'equilibrio
•  seguire l'evoluzione temporale del sistema
Trp$Cage)
• 
• 
• 
NLYIQWLKDGGPSSGRPPPS))
)Il)Trp$cage)è)una)miniproteina)di)20)residui)disegnata)per)il)fast(folding#
Una)breve)α$helix,)una)3.10)helix,)e)un)C$terminal)poly$proline)si)impaccano)
su)un)Trp)nella)α$helix)
La)miniproteina)si)ripiega)in)4)ns)
Designing) a) 20$residue) protein) Neidigh,)
J.W.,) Fesinmeyer,) R.M.,) Andersen,) N.H.)
Nat.)Struct.)Biol.)2002,)9,)425$30.)
L'arte2del2Trasporto2dell’acqua2nelle2acquaporine2
Le)acquaporine)sono)canali)di)membrana)tetramerici)che)svolgono)un)ruolo)criSco)nel)controllo)
del)contenuto)d’acqua)delle)cellule.)QuesS)canali)sono)completamente)impermeabili)a)specie)
cariche,) come) i) protoni.) Questa) proprietà,) fondamentale) per) la) conservazione) del) potenziale)
eleYrochimico)della)membrana,)non)è)facilmente)spiegabile,)poiché)di)solito)i)protoni)possono)
essere)trasferiS)facilmente)con)le)molecole)d’acqua)aYraverso)i)canali)di)membrana.))
I)risultaS)delle)simulazioni)hanno)fornito)una)nuova)visione)del)meccanismo)che)è)alla)base)di)
questa)struYura.)Le)molecole)d’acqua)che)passano)aYraverso)il)canale)sono)costreYe,)da)forze)
eleYrostaSche) (generate) da) 2) Asparagine) conservate),) a) funzionare) solo) come) donatori) di)
legame) a) idrogeno) in) entrambe) le) direzioni) di) ingresso) ed) uscita) del) canale,) disponendosi) in)
modo)tale)da)impedire)la)traslocazione)protonica)in)entrambe)i)versi.))
Scala)temporali)dei)moS)delle)proteine)
ed)MD)
Vibrazioni elastiche delle
proteine
α-Helix folding
β-Hairpin folding
Bond stretching
fs)
Protein folding
ps)
MD
ns)
μs)
ms)
s)
Tempo
E' ancora difficile simulare un intero processo di protein folding usando un
metodo MD convenzionale!
Ma la dinamica molecolare richiede un enorme
costo computazionale
Per motivi di stabilità numerica non posso simulare salti
temporali (Δt) maggiori di 1-2 femtosecondi (10-15 sec).
Procedo quindi facendo evolvere il sistema solo a piccoli
passi per ogni ciclo di calcoli
Un grande numero di molecole d'acqua deve essere usato
nelle simulazioni MD di biomolecole
Il numero di coppie di atomi che coinvolgono le interazioni
tra atomi non legati aumenta nell'ordine di N2 (dove N è il
numero di atomi)
E' difficile simulare per un tempo molto lungo,
generalmente vengono effettuate simulazioni
di decine o centinaia di nanosecondi…
Al momento dimenticate di simulare
il folding attraverso MD!
Perché il processo impiega dai millisecondi alle decine di secondi…
Alcune Applicazioni
Simulare una proteina attraverso MD permette di
conoscere a fondo la sua struttura tridimensionale ed
aiuta a comprendere, spiegare, e a volte anche modificare
ed utilizzare, la sua attività biologica
Attraverso MD si possono monitorare i cambiamenti
conformazionali anche di proteine che sono parte delle
MEMBRANE BIOLOGICHE per comprenderne le modalità di
interazione con il doppio strato lipidico o il meccanismo di
trasporto
Effettuare MUTAZIONI puntiformi e simulare attraverso
MD il wild type assieme al mutante può fornire indicazioni utili
per la comprensione della funzione associata al residuo o ai
residui mutati
La simulazione MD permette di studiare le variazioni
conformazionali indotte dall’interazione della proteina con
uno o più LIGANDI, che attivano o disattivano la sua
funzione biologica
Le numerose grandezze calcolabili con la Dinamica Molecolare si possono
classificare come:
Strutturali
•  funzione di distribuzione radiale g(r),
•  densità,
•  variazione di distanze atomo-atomo,
•  variazione di angoli tra atomi,
•  variazione di angoli diedri,
•  variazione del numero di legami a idrogeno,
•  variazione del raggio di girazione,
•  variazione della superficie accessibile al solvente,
•  Root Mean Square Fluctuations,
•  Root Mean Square Deviation,
•  evoluzione delle strutture secondarie
Energetiche
•  energia libera di solvatazione,
•  capacità termica, entalpia di vaporizzazione
Dinamiche
•  costante di diffusione,
•  viscosità
Il calcolo della RDF o g(r) risponde
a questa domanda, "dato un atomo
in una posizione, quanti atomi mi
aspetto di trovare ad una distanza
r da esso?" o più precisamente tra
una distanza r ed r + dr.
Rappresentazione o topologia molecolare
•  Per fare calcoli sulle molecole dobbiamo specificare:
– Tipi atomici
•  Esiste più di un tipo per elemento atomico
– Posizioni atomiche
•  Coordinate cartesiane (x,y,z)
•  Coordinate interne (es. lunghezze di legame,
angoli, diedri)
– Connettività
– Cariche atomiche (cariche parziali)
Force Fields
•  Una funzione del potenziale ed un set di parametri
usati per descrivere tutte le interazioni all'interno di
un sistema di particelle
Campi di forze empirici e meccanica molecolare
• 
Descrivono l’interazione di
atomi o di gruppi di atomi
•  I
parametri
sono
detti
“empirici”,
sono
cioè
determinati sperimentalmente
sulle molecole
•  Esempi:
GROMOS FF (van Gusteren)
CHARMM FF (M. Karplus)
AMBER FF (Kollman)
Bond stretching (stiramento del legame)
•  Approssimazione del potenziale Morse con un modello “elastic spring”
•  La legge di Hooke è una ragionevole approssimazione se vicina alla
distanza di legame di riferimento l0
l
K
l
Moto prodotto da
questo potenziale
costante di forza
distanza
Sir Robert Hooke
Angle Bending (piegamento dell’angolo)
•  Deviazione degli angoli dal loro angolo di riferimento θ0 , spesso
descritto sempre dalla legge di Hooke:
θ"
k
θ
Moto prodotto da
questo potenziale
costante di forza
angolo di legame
Sir Robert Hooke
•  Le costanti di forza sono molto più piccole di quelle del bond stretching
Moto prodotto
da questo
potenziale
Torsional o Dihedral Term
(Termine di Torsione)
ω
•  Funzione di potenziale per la rotazione
attorno ad un legame chimico:
Vn
n
ω
γ
altezza della "barriera"
molteplicità, numero di
massimi o minimi in una
rotazione completa
angolo di torsione
fattore di fase
All'istante iniziale la funzione assume un valore che, pur essendo descritto dallo stesso
termine, può essere diverso per diedri diversi, γ (gamma) rappresenta la fase iniziale
Angoli di torsione ed energia
Vn#=)altezza)della)"barriera")
n)=)molteplicità,)numero)di)massimi)o)minimi)in)una)rotazione)
completa)
ω)=)angolo)di)torsione)
γ) =) faYore) di) fase,) all'istante) iniziale) la) funzione) assume) un)
valore) che,) pur) essendo) descriYo) dallo) stesso) termine,) può)
essere)diverso)per)diedri)diversi,)γ)(gamma))rappresenta)la)fase)
iniziale)
I diedri impropri
Gli angoli diedri impropri: impediscono ai carboni chirali
ed agli anelli planari di modificare la loro geometria
durante la simulazione
HIS:)CA$N$C$CB)
ALA:)C$CA$N$O)
PRO:)CA$N$C$CB)
PHE:)CG$CD1$CE2$CZ)
Esempi di angoli diedri impropri
Deformazione dell'angolo diedro improprio
k
ξ
costante di forza
ampiezza dell'angolo diedro improprio
L'angolo diedro ξ (csi) è definito come l'angolo tra il piano contenente
i,j,k e quello contenente j,k,l.
Viene utilizzato per mantenere gli atomi in struttura tetraedrica o
planare
Lennard Jones (Van der Waals) non-bonded interactions
(Interazioni non legate)
Sir John Lennard Jones
•  Agiscono solo a corta distanza
•  Interazione attrattiva dovuta a dipoli indotti
tra atomi non carichi ~ r6
•  Quando gli atomi diventano troppo vicini i loro
gusci di valenza cominciano a sovrapporsi e si
respingono ~ r12
Johannes Diderik Van der Waals
σ (sigma) ed ε (epsilon) sono specifiche per il
tipo di particelle interagenti
Parte
repulsiva
Parte
attrattiva
Interazioni)di))
Van)der)Waals))
e)raggi)atomici)
gecko)da)50)a)150gr)
1)seta)=)200μN)=)20mg;))
2.000.0002sete2=2400N2=240Kg2
Electrostatic interactions (Interazioni Elettrostatiche)
•  Elementi elettronegativi attraggono elettroni più di altri
elementi meno elettronegativi
•  La distribuzione di carica è espressa da cariche frazionarie
•  Le interazioni elettrostatiche sono spesso calcolate attraverso
la legge di Coulomb:
Charles Augustin de Coulomb
+
+
q
r
-
Esempio)di)un)semplice)Campo)di)Forze)(Force)Field))
TOTAL)POTENTIAL)ENERGY)=)ν)
+
+
+
+
+
L’)approssimazione)adiabaSca)))))
E’)lecito)chiedersi)quanto)sia)vero)che)il)moto)degli)atomi)è)determinato)solo)da)
una)energia)potenziale)che)dipende)solo2dalle2posizioni2dei2nuclei:2che2fine2hanno2
faJo2gli2eleJroni?22
In)realtà)gli)eleYroni)sono)presenS,)ma)un)solido)argomento)teorico)ci)garanSsce)
che)possiamo2incorporarne2gli2effeN)in2un2potenziale2interOatomico2effeNvo.22
Gli) eleYroni) sono) molto) più) leggeri) dei) nuclei) (almeno) 1800) volte) nel) caso) più)
sfavorevole))e)di)conseguenza)il)loro)moto)è)assai)più)veloce)di)quello)dei)nuclei.))
Possiamo) assumere) che) in) ogni) istante) gli) eleYroni) resSno) nel) loro) stato)
fondamentale,) corrispondente) alla) posizione) istantanea) dei) nuclei)
(approssimazione2adiabaSca2o2di2BornOOppenheimer).))
In)meccanica,)il)termine)adiabaSco2si)riferisce)a)sistemi)dove)la)variazione)di)forze)
e)di)vincoli)che)agiscono)su)di)essi)si)produce)molto)lentamente)rispeYo)ad)altri)
determinaS) parametri) temporali) (il) moto) degli) eleYroni,) sempre) in) equilibrio)
rispeYo)ai)nuclei).)))
Molecular Mechanics - Energy Minimization
• L’energia del sistema viene minimizzata, ovvero il
sistema cerca di rilassare
• Il sistema rilassa verso un minimo lolace (local minimum
o LM).
Una struttura a bassa energia
corrisponde ad un insieme di
lunghezze ed angoli di legame aventi
un basso valore di energia sterica.
Tale valore è spesso il compromesso di
diverse forze che in maniera
competitiva
determinano
nel
complesso un basso valore dell’energia
sterica totale.
Il processo di minimizzazione si
realizza attraverso variazioni delle
posizioni di ogni atomo.
Molecular Dynamics (MD)
In molecular dynamics viene fornita energia al sistema
usando una temperatura costante (i.e. constant average
kinetic energy).
Condizioni Iniziali per MD
Per cominciare una simulazione
Molecolare occorrono:
di
Dinamica
un set di coordinate di partenza (di solito prese da dati
sperimentali, come X-ray o NMR, o da computer modeling)
Delle
Temperature
iniziali,
ovvero delle velocità iniziali
selezionate in maniera casuale
dalla distribuzione gaussiana di
Maxwell-Boltzmann,
che
descrive la distribuzione delle
velocità di un atomo in funzione
della temperatura
Il motore della dinamica molecolare classica
La forza che subisce l’atomo i si può ricavare dal potenziale V di
interazione tra le particelle del sistema:
Fi = - δV / δri
Ed ora facciamo muovere gli atomi!
Le velocità atomiche vi sono correlate alla temperatura assoluta T
attraverso l’energia cinetica totale
mi è la massa dell’atomo, kb è la costante di Boltzmann e la somma è
N atomi. Le nuove posizioni e velocità degli atomi sono calcolate
dove
su
risolvendo l’equazione del moto, usando le vecchie posizioni e velocità, e le
accelerazioni. Le accelerazioni sono collegate alla forza dalla seconda legge
di Newton.
Sir Isaac Newton
e le forze sono correlate alla derivata del potenziale utilizzato per la
minimizzazione energetica
Conoscendo l’accelerazione è possibile ottenere la velocità per
integrazione rispetto al tempo
Le nuove posizioni atomiche e le nuove velocità derivano dalla
meccanica classica
Il time step ∆t deve essere il più piccolo possibile, per
permettere alle forze e alle velocità di rimanere costanti ad ogni
passo d’integrazione. Valori tipici di un ∆t per le macromolecole
variano da 0.5 a 2.0 femtosecondi (10-15 secondi).
Molecular Dynamics Simulation
r
t0
t1
trajectory
ti
tn
t
Il Time step
Il passo di integrazione (o time step) deve essere:
•  il più grande possibile per simulare il moto del sistema
per un tempo più lungo
a parità di numero di passi
effettuati
•  sufficientemente piccolo da garantire la corretta
integrazione delle equazioni del moto
Possiamo classificare le diverse forze di interazione tra
gli atomi del nostro sistema in base alla loro frequenza di
oscillazione (o al loro tempo di rilassamento)
Per motivi di stabilità numerica la grandezza del Δt deve
essere circa un decimo del moto più veloce nel sistema.
Poichè nella simulazione di una proteina i moti di stiramento
del legame O-H o C-H sono i moti più veloci nel sistema di
simulazione delle biomolecole (tempo di rilassamento 10 fs),
Δt dovrebbe essere normalmente impostato a 0.5 fs
Si procede allora bloccando questi moti attraverso dei
vincoli, per considerare il tempo di rilassamento dei moti di
stiramento dell’angolo di legame (tempo di rilassamento
40fs)
Grazie a questo artificio il time step MD (Δt) può quindi
essere impostato a 1-2 fs (10-15 sec)
coordinate
velocità
topologia
MD
Parametri di input
force field
traiettorie
analisi
Il programma conosce la “topologia” della proteina
Il programma conosce le “costanti di forza” da associare alla proteina
Il programma possiede tutte le informazioni per simulare la proteina
Modelli a solvente implicito
L’acqua non è inclusa come molecole reali ma è rappresentata da un
potenziale extra sulla superficie accessibile al solvente
•  Vantaggi:
•  solo il 50% più lento di un calcolo nel vuoto
•  ~10 volte più veloce di una simulazione MD con acqua esplicita
•  Svantaggi:
•  Rappresenta veramente l’acqua? La discussione è ancora aperta
Modelli a solvente esplicito
•  Le molecole d’acqua sono incluse esplicitamente come molecole
individuali
•  Descrivere bene il comportamento dell’acqua non è semplice
•  Aumenta notevolmente le necessità computazionali
Escherichia coli Cu,Zn SOD nel box di simulazione
Condizioni Periodiche al contorno o
Periodic Boundary Conditions (PBC)
•  Le PBC sono usate per simulare sistemi solvatati estesi o cristalli.
•  Nei sistemi solvatati, le PBC prevengono che il solvente “evapori in silico"
Algoritmo usato in un box
centrato sullo zero
IF (R(I) .GT. BOXL2) R(I) = R(I) - BOXL
IF (R(I) .LT. -BOXL2) R(I) = R(I) + BOXL
Posso diminuire il numero di particelle ed ottenere lo
stesso effetto al contorno definendo box non cubici
Truncated octahedron
Rhombic dodecahedron
Cube
Hexagonal prism
Raggio di cut-off
Le interazioni di non-legame sia di tipo Lennard-Jones che
elettrostatiche possono essere trascurate oltre una certa
distanza tra le particelle interagenti
Raggio di cut-off
Cioè introduco un cut-off sferico attorno a ciascuna
particella e calcolo soltanto le interazioni di coppia entro la
sfera
Le dimensioni del BOX di simulazione
• Lo spigolo di un box cubico deve essere comunque maggiore di due
volte il raggio di cut-off utilizzato nella simulazione (Lbox > 2 rcut)
• Questo per evitare che la particella i interagisca contemporaneamente
con j e con una sua copia
Interazioni2eleJrostaSche2
L‘uso) del) cut$off) porta) ad) errori) nel) calcolo) delle) interazioni) eleYrostaSche,)
specialmente)per)distribuzione)di)cariche)con)forte)dipolo)eleYrico)come)le)α$eliche)o)
molecole)cariche)come)il)DNA.))
Il) metodo) ParScle2 Mesh2
Ewald2 (PME)2 permeYe) di)
calcolare) con) maggiore)
precisione) le) interazioni)
eleYrostaSche)separandole)
in:)
$ una) componente) a) corto)
raggio,) calcolata) nello)
spazio)reale))
$ Una) componente) a) lungo)
raggio) calcolata) nello)
spazio)di)Fourier)
Il)diagramma)di)flusso))
di)un)programma)di)Dinamica)Molecolare)
Un file di controllo di AMBER
MD with position restraints Title
&cntrl
IMIN =0,
Flag to run minimization.
NTC=2,
bond interactions involving H-atoms omitted.
TOL=0.00001,
Relative geometrical tolerance for coordinate resetting in shake.
NTF=2,
NTF Flag for force evaluation, 2 bond interactions involving H-atoms omitted.
NTX=1,
Option to read the initial coordinates, velocities and box size from the "inpcrd" file.
IREST=0,
Flag to restart the run. 0 = No effect (default).
NTB=2,
Periodic boundary. If NTB .EQ. 2 constant pressure.
NTP=1,
Flag for constant pressure dynamics.
NPSCAL=1,
Method for pressure scaling of the atomic coordinates. = 1Molecule scaling.
PRES0=1.0,
reference pressure (in units of bars, where 1 bar ~ 1 atm) at which the system is maintained.
TAUP=0.2,
Pressure relaxation time (in ps).
VLIMIT=20.0,
Any component of the velocity that is greater than abs(VLIMIT) will be reduced to VLIMIT.
NSTLIM=25000,
Number of MD-steps per run to be performed.
DT=0.0005,
The time step (psec).
NTCM=1,
Flag for the removal of translational and rotational motion at the beginning of the simulation.
TEMP0=100.0,
Reference temperature at which the system is to be kept.
TEMPI=100.0,
Initial temperature. The velocities are assigned from a Maxwellian distribution.
IG=71277,
The MD starting velocity is dependent on the random number generator seed.
NTT=1,
Switch for temperature scaling.
TAUTP=0.2,
Time constant for heat bath coupling for the SOLUTE.
SCEE = 1.2,
1-4 electrostatic scale factor.
NSNB=10,
After NSNB steps the non-bonded pair list will be updated.
CUT=9.0,
The primary cutoff distance for the non-bonded pairs.
NTPR = 10,
Flag for printing energy related quantities.
NTWX = 0,
Flag for packing the coordinates.
NTWV = 0,
For every NTWV steps the velocities will be written in file 'PVEL'.
NTWE = 0,
Every NTWE steps energy info is written in file 'PEN' in formatted form.
NTR=1,
Flag for restraining specified atoms in Cartesian space using a harmonic potential.
IOUTFM=0
Format of velocity, coordinate, and energy sets.
&end
Restraints
500.0
RES 1 #
END
END
Schema generale della procedura
paper
Riassumendo
MD campiona un minimo locale esplorando conformazioni
Le)proteine)campionano)molS)soYostaS)conformazionali))
gerarchicamente)ordinaS))
H.)Frauenfelder)et)al.,)Science)229))(1985))337)
Molecular2Dynamics2Codes)
hYp://www.gromacs.org)
Berendsen,) H.J.C.,) van) der) Spoel,) D.) and) van) Drunen,) R.,) GROMACS:2 A2 messageOpassing2
parallel2molecular2dynamics2implementaSon.)Comp.)Phys.)Comm.)91)(1995),)43$56.)
hYp://www.amber.ucsf.edu/amber/amber.html)
D.A.) Pearlman,) D.A.) Case,) J.W.) Caldwell,) W.S.) Ross,) T.E.) Cheatam) III,) S.) DeBolt,) D.)
Ferguson,) G.) Seibel) and) P.) Kollman.) AMBER,2 a2 package2 of2 computer2 programs2 for2
applying2 molecular2 mechanics,2 normal2 mode2 analysis,2 molecular2 dynamics2 and2 free2
energy2 calculaSons2 to2 simulate2 the2 structural2 and2 energeSc2 properSes2 of2 molecules.)
Comp.)Phys.)Commun.)91,)1$41)(1995).)
hYp://www.ks.uiuc.edu/Research/namd)
L.)Kalé,)R.)Skeel,)M.)Bhandarkar,)R.)Brunner,)A.)Gursoy,)N.)Krawetz,)J.)Phillips,)A.)Shinozaki,)
K.) Varadarajan) and) K.) Schulten.) NAMD2:2 Greater2 scalability2 for2 parallel2 molecular2
dynamics.)J.)Comput.)Phys.,)151,)283$312)(1999).)
hYp://yuri.harvard.edu/)
CHARMM:2 A2 Program2 for2 Macromolecular2 Energy,2 MinimizaSon,2 and2 2 Dynamics2
CalculaSons,) J.# Comp.# Chem.# 4,) 187$217) (1983),) ) by) B.) R.) Brooks,) R.) E.) Bruccoleri,) B.) D.)
Olafson,)D.)J.)States,))S.)Swaminathan,)and)M.)Karplus. )
Un)esempio)di)MD)con)il)programma)Ballview)
del)pepSde)DGFWGK)
dinamica2molecolare2O2procedura2di2clustering2O2docking2molecolare2
Molecular Dynamics
Molecular docking
Concludendo2
• La)meccanica)e)la)dinamica)molecolare)rappresentano,)come)la)maggior)
parte) delle) metodologie) di) modellisSca) molecolare) uSlizzate) in) ambito)
bioinformaSco,)tentaSvi)di)simulazione)del)mondo)reale)
• Come) tali) queste) tecniche) fanno) uso) necessariamente) di) molte)
semplificazioni)del)sistema)
• E’) quindi) uSle) considerare) i) limiS) impliciS) di) meccanica) e) dinamica)
molecolare)e)tenerne)conto)ogni)qual)volta)si)debbano)analizzare)i)daS)
provenienS)da)tali)approcci)
• Per)quanto)accurata)possa)sembrare)la)simulazione,)è)bene)considerare)
che)essa)non)può)mai)sosStuirsi)al)dato)sperimentale)
• Invece) queste) metodologie) possono) indirizzare) l’iter) sperimentale) ed)
aiutare)a)razionalizzare)i)risultaS)oYenuS)))