in#vitro#(#in#vivo# in#silico
Transcript
in#vitro#(#in#vivo# in#silico
in#vitro#(#in#vivo# in#silico# Biochimica computazionale I sistemi chimici sono generalmente troppo inomogenei e complessi per essere trattati analiticamente Sono necessarie Simulazioni numeriche del comportamento del sistema per produrre insiemi statistici di configurazioni che rappresentano lo stato del sistema: meccanica statistica Dinamica Molecolare Classica Il termine dinamica molecolare classica indica una estensione al caso dinamico della meccanica molecolare classica: le molecole vengono caratterizzate computazionalmente in funzione di parametri che esprimono le loro caratteristiche fisiche per mezzo delle leggi che appartengono al mondo della fisica classica Dinamica Molecolare Classica (MD) Una simulazione di Dinamica Molecolare classica fornisce le posizioni di tutti gli atomi del sistema (centinaia di migliaia particelle) per una durata di centinaia di nanosecondi Viene generalmente utilizzata per • ottenere informazioni su proprietà dinamiche delle macromolecole • interpretare dati sperimentali • ottenere misure di grandezze all'equilibrio • seguire l'evoluzione temporale del sistema Trp$Cage) • • • NLYIQWLKDGGPSSGRPPPS)) )Il)Trp$cage)è)una)miniproteina)di)20)residui)disegnata)per)il)fast(folding# Una)breve)α$helix,)una)3.10)helix,)e)un)C$terminal)poly$proline)si)impaccano) su)un)Trp)nella)α$helix) La)miniproteina)si)ripiega)in)4)ns) Designing) a) 20$residue) protein) Neidigh,) J.W.,) Fesinmeyer,) R.M.,) Andersen,) N.H.) Nat.)Struct.)Biol.)2002,)9,)425$30.) L'arte2del2Trasporto2dell’acqua2nelle2acquaporine2 Le)acquaporine)sono)canali)di)membrana)tetramerici)che)svolgono)un)ruolo)criSco)nel)controllo) del)contenuto)d’acqua)delle)cellule.)QuesS)canali)sono)completamente)impermeabili)a)specie) cariche,) come) i) protoni.) Questa) proprietà,) fondamentale) per) la) conservazione) del) potenziale) eleYrochimico)della)membrana,)non)è)facilmente)spiegabile,)poiché)di)solito)i)protoni)possono) essere)trasferiS)facilmente)con)le)molecole)d’acqua)aYraverso)i)canali)di)membrana.)) I)risultaS)delle)simulazioni)hanno)fornito)una)nuova)visione)del)meccanismo)che)è)alla)base)di) questa)struYura.)Le)molecole)d’acqua)che)passano)aYraverso)il)canale)sono)costreYe,)da)forze) eleYrostaSche) (generate) da) 2) Asparagine) conservate),) a) funzionare) solo) come) donatori) di) legame) a) idrogeno) in) entrambe) le) direzioni) di) ingresso) ed) uscita) del) canale,) disponendosi) in) modo)tale)da)impedire)la)traslocazione)protonica)in)entrambe)i)versi.)) Scala)temporali)dei)moS)delle)proteine) ed)MD) Vibrazioni elastiche delle proteine α-Helix folding β-Hairpin folding Bond stretching fs) Protein folding ps) MD ns) μs) ms) s) Tempo E' ancora difficile simulare un intero processo di protein folding usando un metodo MD convenzionale! Ma la dinamica molecolare richiede un enorme costo computazionale Per motivi di stabilità numerica non posso simulare salti temporali (Δt) maggiori di 1-2 femtosecondi (10-15 sec). Procedo quindi facendo evolvere il sistema solo a piccoli passi per ogni ciclo di calcoli Un grande numero di molecole d'acqua deve essere usato nelle simulazioni MD di biomolecole Il numero di coppie di atomi che coinvolgono le interazioni tra atomi non legati aumenta nell'ordine di N2 (dove N è il numero di atomi) E' difficile simulare per un tempo molto lungo, generalmente vengono effettuate simulazioni di decine o centinaia di nanosecondi… Al momento dimenticate di simulare il folding attraverso MD! Perché il processo impiega dai millisecondi alle decine di secondi… Alcune Applicazioni Simulare una proteina attraverso MD permette di conoscere a fondo la sua struttura tridimensionale ed aiuta a comprendere, spiegare, e a volte anche modificare ed utilizzare, la sua attività biologica Attraverso MD si possono monitorare i cambiamenti conformazionali anche di proteine che sono parte delle MEMBRANE BIOLOGICHE per comprenderne le modalità di interazione con il doppio strato lipidico o il meccanismo di trasporto Effettuare MUTAZIONI puntiformi e simulare attraverso MD il wild type assieme al mutante può fornire indicazioni utili per la comprensione della funzione associata al residuo o ai residui mutati La simulazione MD permette di studiare le variazioni conformazionali indotte dall’interazione della proteina con uno o più LIGANDI, che attivano o disattivano la sua funzione biologica Le numerose grandezze calcolabili con la Dinamica Molecolare si possono classificare come: Strutturali • funzione di distribuzione radiale g(r), • densità, • variazione di distanze atomo-atomo, • variazione di angoli tra atomi, • variazione di angoli diedri, • variazione del numero di legami a idrogeno, • variazione del raggio di girazione, • variazione della superficie accessibile al solvente, • Root Mean Square Fluctuations, • Root Mean Square Deviation, • evoluzione delle strutture secondarie Energetiche • energia libera di solvatazione, • capacità termica, entalpia di vaporizzazione Dinamiche • costante di diffusione, • viscosità Il calcolo della RDF o g(r) risponde a questa domanda, "dato un atomo in una posizione, quanti atomi mi aspetto di trovare ad una distanza r da esso?" o più precisamente tra una distanza r ed r + dr. Rappresentazione o topologia molecolare • Per fare calcoli sulle molecole dobbiamo specificare: – Tipi atomici • Esiste più di un tipo per elemento atomico – Posizioni atomiche • Coordinate cartesiane (x,y,z) • Coordinate interne (es. lunghezze di legame, angoli, diedri) – Connettività – Cariche atomiche (cariche parziali) Force Fields • Una funzione del potenziale ed un set di parametri usati per descrivere tutte le interazioni all'interno di un sistema di particelle Campi di forze empirici e meccanica molecolare • Descrivono l’interazione di atomi o di gruppi di atomi • I parametri sono detti “empirici”, sono cioè determinati sperimentalmente sulle molecole • Esempi: GROMOS FF (van Gusteren) CHARMM FF (M. Karplus) AMBER FF (Kollman) Bond stretching (stiramento del legame) • Approssimazione del potenziale Morse con un modello “elastic spring” • La legge di Hooke è una ragionevole approssimazione se vicina alla distanza di legame di riferimento l0 l K l Moto prodotto da questo potenziale costante di forza distanza Sir Robert Hooke Angle Bending (piegamento dell’angolo) • Deviazione degli angoli dal loro angolo di riferimento θ0 , spesso descritto sempre dalla legge di Hooke: θ" k θ Moto prodotto da questo potenziale costante di forza angolo di legame Sir Robert Hooke • Le costanti di forza sono molto più piccole di quelle del bond stretching Moto prodotto da questo potenziale Torsional o Dihedral Term (Termine di Torsione) ω • Funzione di potenziale per la rotazione attorno ad un legame chimico: Vn n ω γ altezza della "barriera" molteplicità, numero di massimi o minimi in una rotazione completa angolo di torsione fattore di fase All'istante iniziale la funzione assume un valore che, pur essendo descritto dallo stesso termine, può essere diverso per diedri diversi, γ (gamma) rappresenta la fase iniziale Angoli di torsione ed energia Vn#=)altezza)della)"barriera") n)=)molteplicità,)numero)di)massimi)o)minimi)in)una)rotazione) completa) ω)=)angolo)di)torsione) γ) =) faYore) di) fase,) all'istante) iniziale) la) funzione) assume) un) valore) che,) pur) essendo) descriYo) dallo) stesso) termine,) può) essere)diverso)per)diedri)diversi,)γ)(gamma))rappresenta)la)fase) iniziale) I diedri impropri Gli angoli diedri impropri: impediscono ai carboni chirali ed agli anelli planari di modificare la loro geometria durante la simulazione HIS:)CA$N$C$CB) ALA:)C$CA$N$O) PRO:)CA$N$C$CB) PHE:)CG$CD1$CE2$CZ) Esempi di angoli diedri impropri Deformazione dell'angolo diedro improprio k ξ costante di forza ampiezza dell'angolo diedro improprio L'angolo diedro ξ (csi) è definito come l'angolo tra il piano contenente i,j,k e quello contenente j,k,l. Viene utilizzato per mantenere gli atomi in struttura tetraedrica o planare Lennard Jones (Van der Waals) non-bonded interactions (Interazioni non legate) Sir John Lennard Jones • Agiscono solo a corta distanza • Interazione attrattiva dovuta a dipoli indotti tra atomi non carichi ~ r6 • Quando gli atomi diventano troppo vicini i loro gusci di valenza cominciano a sovrapporsi e si respingono ~ r12 Johannes Diderik Van der Waals σ (sigma) ed ε (epsilon) sono specifiche per il tipo di particelle interagenti Parte repulsiva Parte attrattiva Interazioni)di)) Van)der)Waals)) e)raggi)atomici) gecko)da)50)a)150gr) 1)seta)=)200μN)=)20mg;)) 2.000.0002sete2=2400N2=240Kg2 Electrostatic interactions (Interazioni Elettrostatiche) • Elementi elettronegativi attraggono elettroni più di altri elementi meno elettronegativi • La distribuzione di carica è espressa da cariche frazionarie • Le interazioni elettrostatiche sono spesso calcolate attraverso la legge di Coulomb: Charles Augustin de Coulomb + + q r - Esempio)di)un)semplice)Campo)di)Forze)(Force)Field)) TOTAL)POTENTIAL)ENERGY)=)ν) + + + + + L’)approssimazione)adiabaSca))))) E’)lecito)chiedersi)quanto)sia)vero)che)il)moto)degli)atomi)è)determinato)solo)da) una)energia)potenziale)che)dipende)solo2dalle2posizioni2dei2nuclei:2che2fine2hanno2 faJo2gli2eleJroni?22 In)realtà)gli)eleYroni)sono)presenS,)ma)un)solido)argomento)teorico)ci)garanSsce) che)possiamo2incorporarne2gli2effeN)in2un2potenziale2interOatomico2effeNvo.22 Gli) eleYroni) sono) molto) più) leggeri) dei) nuclei) (almeno) 1800) volte) nel) caso) più) sfavorevole))e)di)conseguenza)il)loro)moto)è)assai)più)veloce)di)quello)dei)nuclei.)) Possiamo) assumere) che) in) ogni) istante) gli) eleYroni) resSno) nel) loro) stato) fondamentale,) corrispondente) alla) posizione) istantanea) dei) nuclei) (approssimazione2adiabaSca2o2di2BornOOppenheimer).)) In)meccanica,)il)termine)adiabaSco2si)riferisce)a)sistemi)dove)la)variazione)di)forze) e)di)vincoli)che)agiscono)su)di)essi)si)produce)molto)lentamente)rispeYo)ad)altri) determinaS) parametri) temporali) (il) moto) degli) eleYroni,) sempre) in) equilibrio) rispeYo)ai)nuclei).))) Molecular Mechanics - Energy Minimization • L’energia del sistema viene minimizzata, ovvero il sistema cerca di rilassare • Il sistema rilassa verso un minimo lolace (local minimum o LM). Una struttura a bassa energia corrisponde ad un insieme di lunghezze ed angoli di legame aventi un basso valore di energia sterica. Tale valore è spesso il compromesso di diverse forze che in maniera competitiva determinano nel complesso un basso valore dell’energia sterica totale. Il processo di minimizzazione si realizza attraverso variazioni delle posizioni di ogni atomo. Molecular Dynamics (MD) In molecular dynamics viene fornita energia al sistema usando una temperatura costante (i.e. constant average kinetic energy). Condizioni Iniziali per MD Per cominciare una simulazione Molecolare occorrono: di Dinamica un set di coordinate di partenza (di solito prese da dati sperimentali, come X-ray o NMR, o da computer modeling) Delle Temperature iniziali, ovvero delle velocità iniziali selezionate in maniera casuale dalla distribuzione gaussiana di Maxwell-Boltzmann, che descrive la distribuzione delle velocità di un atomo in funzione della temperatura Il motore della dinamica molecolare classica La forza che subisce l’atomo i si può ricavare dal potenziale V di interazione tra le particelle del sistema: Fi = - δV / δri Ed ora facciamo muovere gli atomi! Le velocità atomiche vi sono correlate alla temperatura assoluta T attraverso l’energia cinetica totale mi è la massa dell’atomo, kb è la costante di Boltzmann e la somma è N atomi. Le nuove posizioni e velocità degli atomi sono calcolate dove su risolvendo l’equazione del moto, usando le vecchie posizioni e velocità, e le accelerazioni. Le accelerazioni sono collegate alla forza dalla seconda legge di Newton. Sir Isaac Newton e le forze sono correlate alla derivata del potenziale utilizzato per la minimizzazione energetica Conoscendo l’accelerazione è possibile ottenere la velocità per integrazione rispetto al tempo Le nuove posizioni atomiche e le nuove velocità derivano dalla meccanica classica Il time step ∆t deve essere il più piccolo possibile, per permettere alle forze e alle velocità di rimanere costanti ad ogni passo d’integrazione. Valori tipici di un ∆t per le macromolecole variano da 0.5 a 2.0 femtosecondi (10-15 secondi). Molecular Dynamics Simulation r t0 t1 trajectory ti tn t Il Time step Il passo di integrazione (o time step) deve essere: • il più grande possibile per simulare il moto del sistema per un tempo più lungo a parità di numero di passi effettuati • sufficientemente piccolo da garantire la corretta integrazione delle equazioni del moto Possiamo classificare le diverse forze di interazione tra gli atomi del nostro sistema in base alla loro frequenza di oscillazione (o al loro tempo di rilassamento) Per motivi di stabilità numerica la grandezza del Δt deve essere circa un decimo del moto più veloce nel sistema. Poichè nella simulazione di una proteina i moti di stiramento del legame O-H o C-H sono i moti più veloci nel sistema di simulazione delle biomolecole (tempo di rilassamento 10 fs), Δt dovrebbe essere normalmente impostato a 0.5 fs Si procede allora bloccando questi moti attraverso dei vincoli, per considerare il tempo di rilassamento dei moti di stiramento dell’angolo di legame (tempo di rilassamento 40fs) Grazie a questo artificio il time step MD (Δt) può quindi essere impostato a 1-2 fs (10-15 sec) coordinate velocità topologia MD Parametri di input force field traiettorie analisi Il programma conosce la “topologia” della proteina Il programma conosce le “costanti di forza” da associare alla proteina Il programma possiede tutte le informazioni per simulare la proteina Modelli a solvente implicito L’acqua non è inclusa come molecole reali ma è rappresentata da un potenziale extra sulla superficie accessibile al solvente • Vantaggi: • solo il 50% più lento di un calcolo nel vuoto • ~10 volte più veloce di una simulazione MD con acqua esplicita • Svantaggi: • Rappresenta veramente l’acqua? La discussione è ancora aperta Modelli a solvente esplicito • Le molecole d’acqua sono incluse esplicitamente come molecole individuali • Descrivere bene il comportamento dell’acqua non è semplice • Aumenta notevolmente le necessità computazionali Escherichia coli Cu,Zn SOD nel box di simulazione Condizioni Periodiche al contorno o Periodic Boundary Conditions (PBC) • Le PBC sono usate per simulare sistemi solvatati estesi o cristalli. • Nei sistemi solvatati, le PBC prevengono che il solvente “evapori in silico" Algoritmo usato in un box centrato sullo zero IF (R(I) .GT. BOXL2) R(I) = R(I) - BOXL IF (R(I) .LT. -BOXL2) R(I) = R(I) + BOXL Posso diminuire il numero di particelle ed ottenere lo stesso effetto al contorno definendo box non cubici Truncated octahedron Rhombic dodecahedron Cube Hexagonal prism Raggio di cut-off Le interazioni di non-legame sia di tipo Lennard-Jones che elettrostatiche possono essere trascurate oltre una certa distanza tra le particelle interagenti Raggio di cut-off Cioè introduco un cut-off sferico attorno a ciascuna particella e calcolo soltanto le interazioni di coppia entro la sfera Le dimensioni del BOX di simulazione • Lo spigolo di un box cubico deve essere comunque maggiore di due volte il raggio di cut-off utilizzato nella simulazione (Lbox > 2 rcut) • Questo per evitare che la particella i interagisca contemporaneamente con j e con una sua copia Interazioni2eleJrostaSche2 L‘uso) del) cut$off) porta) ad) errori) nel) calcolo) delle) interazioni) eleYrostaSche,) specialmente)per)distribuzione)di)cariche)con)forte)dipolo)eleYrico)come)le)α$eliche)o) molecole)cariche)come)il)DNA.)) Il) metodo) ParScle2 Mesh2 Ewald2 (PME)2 permeYe) di) calcolare) con) maggiore) precisione) le) interazioni) eleYrostaSche)separandole) in:) $ una) componente) a) corto) raggio,) calcolata) nello) spazio)reale)) $ Una) componente) a) lungo) raggio) calcolata) nello) spazio)di)Fourier) Il)diagramma)di)flusso)) di)un)programma)di)Dinamica)Molecolare) Un file di controllo di AMBER MD with position restraints Title &cntrl IMIN =0, Flag to run minimization. NTC=2, bond interactions involving H-atoms omitted. TOL=0.00001, Relative geometrical tolerance for coordinate resetting in shake. NTF=2, NTF Flag for force evaluation, 2 bond interactions involving H-atoms omitted. NTX=1, Option to read the initial coordinates, velocities and box size from the "inpcrd" file. IREST=0, Flag to restart the run. 0 = No effect (default). NTB=2, Periodic boundary. If NTB .EQ. 2 constant pressure. NTP=1, Flag for constant pressure dynamics. NPSCAL=1, Method for pressure scaling of the atomic coordinates. = 1Molecule scaling. PRES0=1.0, reference pressure (in units of bars, where 1 bar ~ 1 atm) at which the system is maintained. TAUP=0.2, Pressure relaxation time (in ps). VLIMIT=20.0, Any component of the velocity that is greater than abs(VLIMIT) will be reduced to VLIMIT. NSTLIM=25000, Number of MD-steps per run to be performed. DT=0.0005, The time step (psec). NTCM=1, Flag for the removal of translational and rotational motion at the beginning of the simulation. TEMP0=100.0, Reference temperature at which the system is to be kept. TEMPI=100.0, Initial temperature. The velocities are assigned from a Maxwellian distribution. IG=71277, The MD starting velocity is dependent on the random number generator seed. NTT=1, Switch for temperature scaling. TAUTP=0.2, Time constant for heat bath coupling for the SOLUTE. SCEE = 1.2, 1-4 electrostatic scale factor. NSNB=10, After NSNB steps the non-bonded pair list will be updated. CUT=9.0, The primary cutoff distance for the non-bonded pairs. NTPR = 10, Flag for printing energy related quantities. NTWX = 0, Flag for packing the coordinates. NTWV = 0, For every NTWV steps the velocities will be written in file 'PVEL'. NTWE = 0, Every NTWE steps energy info is written in file 'PEN' in formatted form. NTR=1, Flag for restraining specified atoms in Cartesian space using a harmonic potential. IOUTFM=0 Format of velocity, coordinate, and energy sets. &end Restraints 500.0 RES 1 # END END Schema generale della procedura paper Riassumendo MD campiona un minimo locale esplorando conformazioni Le)proteine)campionano)molS)soYostaS)conformazionali)) gerarchicamente)ordinaS)) H.)Frauenfelder)et)al.,)Science)229))(1985))337) Molecular2Dynamics2Codes) hYp://www.gromacs.org) Berendsen,) H.J.C.,) van) der) Spoel,) D.) and) van) Drunen,) R.,) GROMACS:2 A2 messageOpassing2 parallel2molecular2dynamics2implementaSon.)Comp.)Phys.)Comm.)91)(1995),)43$56.) hYp://www.amber.ucsf.edu/amber/amber.html) D.A.) Pearlman,) D.A.) Case,) J.W.) Caldwell,) W.S.) Ross,) T.E.) Cheatam) III,) S.) DeBolt,) D.) Ferguson,) G.) Seibel) and) P.) Kollman.) AMBER,2 a2 package2 of2 computer2 programs2 for2 applying2 molecular2 mechanics,2 normal2 mode2 analysis,2 molecular2 dynamics2 and2 free2 energy2 calculaSons2 to2 simulate2 the2 structural2 and2 energeSc2 properSes2 of2 molecules.) Comp.)Phys.)Commun.)91,)1$41)(1995).) hYp://www.ks.uiuc.edu/Research/namd) L.)Kalé,)R.)Skeel,)M.)Bhandarkar,)R.)Brunner,)A.)Gursoy,)N.)Krawetz,)J.)Phillips,)A.)Shinozaki,) K.) Varadarajan) and) K.) Schulten.) NAMD2:2 Greater2 scalability2 for2 parallel2 molecular2 dynamics.)J.)Comput.)Phys.,)151,)283$312)(1999).) hYp://yuri.harvard.edu/) CHARMM:2 A2 Program2 for2 Macromolecular2 Energy,2 MinimizaSon,2 and2 2 Dynamics2 CalculaSons,) J.# Comp.# Chem.# 4,) 187$217) (1983),) ) by) B.) R.) Brooks,) R.) E.) Bruccoleri,) B.) D.) Olafson,)D.)J.)States,))S.)Swaminathan,)and)M.)Karplus. ) Un)esempio)di)MD)con)il)programma)Ballview) del)pepSde)DGFWGK) dinamica2molecolare2O2procedura2di2clustering2O2docking2molecolare2 Molecular Dynamics Molecular docking Concludendo2 • La)meccanica)e)la)dinamica)molecolare)rappresentano,)come)la)maggior) parte) delle) metodologie) di) modellisSca) molecolare) uSlizzate) in) ambito) bioinformaSco,)tentaSvi)di)simulazione)del)mondo)reale) • Come) tali) queste) tecniche) fanno) uso) necessariamente) di) molte) semplificazioni)del)sistema) • E’) quindi) uSle) considerare) i) limiS) impliciS) di) meccanica) e) dinamica) molecolare)e)tenerne)conto)ogni)qual)volta)si)debbano)analizzare)i)daS) provenienS)da)tali)approcci) • Per)quanto)accurata)possa)sembrare)la)simulazione,)è)bene)considerare) che)essa)non)può)mai)sosStuirsi)al)dato)sperimentale) • Invece) queste) metodologie) possono) indirizzare) l’iter) sperimentale) ed) aiutare)a)razionalizzare)i)risultaS)oYenuS)))