Lorenzo Bernacchioni

Transcript

Università degli Studi di Bologna
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di laurea in Fisica
MODELLI DINAMICI PER IL
RIPIEGAMENTO DELLA
PROTEINA
Tesi di Laurea di: Lorenzo BERNACCHIONI
Relatore: Prof. Armando BAZZANI
Co-Relatore: Prof. Sandro RAMBALDI
Parole Chiave
protein folding, dinamica molecolare, catene di corpi rigidi
algoritmo di integrazione, quaternioni
I Sessione
Anno Accademico 2003/2004
Indice
Introduzione
7
1 Proteine e ripiegamento
11
1.1
Il problema del Protein Folding . . . . . . . . . . . . .
11
1.2
La proteina . . . . . . . . . . . . . . . . . . . . . . . .
13
1.2.1
Amminoacidi . . . . . . . . . . . . . . . . . . .
13
1.2.2
Struttura secondaria . . . . . . . . . . . . . . .
17
1.3
Interazioni fisiche . . . . . . . . . . . . . . . . . . . . .
17
1.4
Un primo sguardo al modello
18
. . . . . . . . . . . . . .
2 Quaternioni
2.1
21
Algebra dei quaternioni . . . . . . . . . . . . . . . . . .
23
2.1.1
Osservazioni . . . . . . . . . . . . . . . . . . . .
26
2.2
Applicazioni dei quaternioni . . . . . . . . . . . . . . .
28
2.3
Dinamica Molecolare e Quaternioni . . . . . . . . . . .
29
2.3.1
Riferimento per un corpo rigido . . . . . . . . .
30
I quaternioni nel modello per la proteina . . . . . . . .
31
2.4
3 Dinamica Molecolare e algoritmi di integrazione
33
3.1
Introduzione . . . . . . . . . . . . . . . . . . . . . . . .
33
3.2
Generalità sugli integratori . . . . . . . . . . . . . . . .
33
3.3
Metodologie di integrazione . . . . . . . . . . . . . . .
34
3.3.1
Approccio atomico . . . . . . . . . . . . . . . .
34
3.3.2
Approccio molecolare . . . . . . . . . . . . . . .
35
3.4
Dinamica e integratori per una catena
3
. . . . . . . . .
38
4 Integratore per un pendolo sferico
4.1 Dinamica . . . . . . . . . . . . . . . . . . . . . . . . .
39
39
4.1.1
Pendolo sferico . . . . . . . . . . . . . . . . . .
39
4.1.2
Corpo rigido . . . . . . . . . . . . . . . . . . . .
41
4.2 Algoritmo per il pendolo sferico . . . . . . . . . . . . .
42
Integratore al 2o Ordine . . . . . . . . . . . . .
43
4.2.1
4.2.2
o
Integratore al 3 Ordine . . . . . . . . . . . . .
44
4.3 Catena di pendoli sferici . . . . . . . . . . . . . . . . .
45
4.4 Test al calcolatore . . . . . . . . . . . . . . . . . . . . .
47
4.4.1
Risultati . . . . . . . . . . . . . . . . . . . . . .
5 Modello per la proteina
47
51
5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . .
51
5.2 Potenziali . . . . . . . . . . . . . . . . . . . . . . . . .
52
5.3 Bagno termico . . . . . . . . . . . . . . . . . . . . . . .
55
5.3.1
Dinamica di Langevin . . . . . . . . . . . . . .
56
5.3.2
Dinamica di Langevin all’interno dell’algoritmo
58
5.3.3
Test termodinamico . . . . . . . . . . . . . . . .
58
5.4 Similarità χ . . . . . . . . . . . . . . . . . . . . . . . .
60
6 Simulazioni e risultati
63
6.1 Ipotesi teoriche sul protein folding . . . . . . . . . . . .
63
6.2 Simulazione . . . . . . . . . . . . . . . . . . . . . . . .
64
6.2.1
Sequenza . . . . . . . . . . . . . . . . . . . . . .
65
6.2.2
Dimensionalità . . . . . . . . . . . . . . . . . .
68
6.2.3
Modalità della simulazione . . . . . . . . . . . .
68
6.3 Analisi . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
6.3.1
Classificazione dei minimi . . . . . . . . . . . .
69
6.3.2
Grafici Energia-Popolazione . . . . . . . . . . .
71
6.3.3
Grafici Energia-Similarità-Popolazione . . . . .
71
6.3.4
Sequenza idrofoba
. . . . . . . . . . . . . . . .
74
6.4 Risultati . . . . . . . . . . . . . . . . . . . . . . . . . .
75
Conclusioni
77
4
Appendice A
79
Appendice B
83
Bibliografia
89
5
6
Introduzione
In questo lavoro di tesi si affronta il problema della costruzione di un
modello tridimensionale dinamico per una catena di elementi connessi
ed interagenti in grado di emulare il processo di ripiegamento di una
proteina noto come protein folding.
Tale processo, scoperto e investigato dalla biofisica sperimentale fin
dagli anni ’70, rappresenta ancora oggi una sorta di paradosso insoluto dal punto di vista teorico.
Stabilire il nesso tra la sequenza di amminoacidi che compongono una
data proteina e la configurazione spaziale (responsabile della specifica
attività biologica) assunta al termine di ogni ripiegamento, è l’obiettivo principale di fisici e biologi.
Ciò rappresenterebbe uno strumento diretto per elaboare e sintetizzare
proteine con specifiche funzionalità biologiche a partire dalla codifica
(ricavabile dal DNA) delle sequenze amminoacide.
Nel Capitolo 1 si introduce il problema del protein folding dal punto
di vista fenomenologico: si descrivono gli aspetti salienti della fisica
della proteina, le sue strutture, i suoi costituenti, si delineano infine le
possibili metodologie di ricerca fra le quali, appunto, la modellistica
computazionale.
La prima questione da risolvere per la costruzione di un modello dinamico è la creazione di un integratore che risolva il moto di quella
che possiamo per il momento definire una catena di aste connesse.
Questo è l’obiettivo principale di questa tesi.
Secondariamente l’integratore verrà messo alla prova su di una catena che, dotata degli opportuni potenziali di interazione, simulerà un
filamento di amminoacidi in grado di ripiegare correttamente.
7
Per far sı̀ che la distanza tra elementi contigui sia preservata implicitamente, la catena viene fatta evolvere sotto l’azione di rotazioni
nello spazio.
Tali rotazioni saranno compiute tramite operatori matematici noti
come quaternioni.
Questi oggetti, la cui algebra fu investigata per la prima volta da Sir.
Hamilton nel secolo scorso, identificano una estensione quadridimensionale dei numeri complessi; la loro composizione dà una rappresentazione non singolare delle rotazioni in R3 particolarmente efficiente
dal punto di vista computazionale.
Il Capitolo 2 è quindi una parentesi matematica che descrive i quaternioni e la loro applicazione per la manipolazione di oggetti nello spazio.
La particolare versatilità dei quaternioni nella programmazione e nel
calcolo gli ha resi uno degli strumenti maggiormente utilizzati per le
simulazioni di Dinamica Molecolare; a riguardo, nel Capitolo 3 verrà
data una panoramica dei principali algoritmi di integrazione utilizzati
in questo campo e, genericamente, per la soluzione del moto di un corpo rigido. Maggiori dettagli ed esempi sono inclusi nelle Appendici.
Nel Capitolo 4 viene presentato l’integratore che verrà poi utilizzato
nel corso delle simulazioni.
Per prima cosa si affronta il problema del moto di una singola asta;
ad ogni passo di integrazione le forze esterne modificano la velocità
angolare la quale, a sua volta, induce una rotazione planare della posizione dell’asta compiuta attraverso la composizione di quaternioni.
L’algoritmo è strutturato con uno schema molto simile a quello denominato leap-frog per la risoluzione di moti puramente traslazionali;
il passo temporale è suddiviso in tappe intermedie la cui composizione
fa raggiungere all’integratore una precisione di ordine O(h 3 ), dove h
è il passo di integrazione.
Per estendere il problema da una ad N aste è necessario trovare il
contributo da sommarsi alle forze esterne dato dalle reazioni vincolari
che si propagano lungo la catena e che la mantengono connessa.
8
La stabilità dell’algoritmo è stata testata nel caso del comune pendolo
sferico e della catena di pendoli sferici nel campo uniforme di gravità.
Nel Capitolo 5 si opera la modellizzazione della proteina. Il variegato e complesso mondo fenomenologico della chimica organica viene
drasticamente semplificato con la costruzione di potenziali “fittizi” che
riflettono gli aspetti più rilevanti dell’interazione tra amminoacidi.
Lo stesso codice del filamento, composto in realtà dai 20 tipi di amminoacidi presenti in natura, viene ridotto alla composizione di 3 uniche
classi definite in base alla idrofobicità.
La presenza del solvente acquoso dentro al quale si svolgono gli esperimenti di ripiegamento della proteina viene simulata con una dinamica
browniana (o di Langevin) che riproduce gli urti casuali delle molecole
d’acqua e la dispersione energetica sotto l’effetto della frizione.
Alle equazioni differenziali deterministiche (o Lagrangiane) viene cosı̀
aggiunta una componente stocastica che unisce all’aspetto meccanico
del sistema il contributo termodinamico.
L’introduzione del cosiddetto bagno termico è stata suffragata da
prove di simulazione di moto browniano per le quali si riscontra una
buona attinenza fra i valori di oscillazione cinetica media e della distribuzione maxwelliana delle velocità registrati e le aspettative teoriche.
Ora abbiamo tutti gli ingredienti per procedere con le simulazioni di
ripiegamento.
Nell’ultimo Capitolo il problema del protein folding è ripreso ed analizzato da un punto di vista teorico.
La trattazione cinematico-termodinamica di un sistema a molti gradi
di libertà capace di trovare autonomamente e, soprattutto, in un lasso
di tempo breve rispetto alla scala temporale, una e un’unica configurazione di equilibrio detta stato nativo presenta molteplici difficoltà
concettuali.
Le simulazioni di protein folding compiute in questo lavoro sono state
eseguite su di un filamento relativamente breve (22 amminoacidi) la
cui configurazione nativa simile a una forcina è nota come β-sheet e
che rappresenta il prototipo di quello che possiamo definire un buon
9
ripiegatore.
In ogni simulazione tale proteina è immersa in un bagno termico a
temperatura costante.
Si è focalizzata l’attenzione sulla distribuzione dei punti di equilibrio
raggiunti dal sistema al termine dell’intervallo di tempo necessario al
ripiegamento e alla termalizzazione con l’ambiente.
Queste configurazioni vengono classificate in base alla loro distanza energetica (minimi del potenziale) e alla loro distanza configurazionale
dallo stato nativo; quest’ultima grandezza (χ) rappresenta una stima
per la similarità fra due elementi dello spazio 3N-dimensionale delle
configurazioni fornendo per essa un unico valore reale.
Dall’analisi statistica compiuta sui risultati di differenti serie di simulazioni indipendenti a temperatura costante emerge per la suddetta
sequenza la presenza di una configurazione di equilibrio di gran lunga
più frequente e coincidente, come ci si può aspettare, con lo stato nativo β-sheet. Il relativo valore del potenziale coincide con il minimo
meccanico dell’energia del sistema.
Al crescere della temperatura nello spettro di popolazione compaiono
minimi situati in una regione configurazionalmente ed energeticamente
prossima allo stato nativo, che definiamo regione metastabile.
Il sistema all’equilibrio, sotto l’azione delle sollecitazioni termiche,
evolve visitando i minimi all’interno di detta regione come ci si può
aspettare dalle ipotesi teoriche sull’attraversamento delle barriere di
potenziale che li separano.
Tutti i codici dei programmi di simulazione, archiviazione dei dati, statistica, immagini e animazione sono stati scritti in linguaggio C++;
per la parte grafica si è fatto uso delle librerie OpenGL.
10
Capitolo 1
Proteine e ripiegamento
1.1
Il problema del Protein Folding
La proteina è un eteropolimero formato da una catena di amminoacidi
la cui sequenza ordinata ne identifica la natura.
Sotto normali condizioni fisiologiche (solvente acquoso, pH neutro e
temperatura ambiente) la proteina ha la proprietà di ripiegarsi (folding) fino ad assumere una configurazione di equilibrio che ne determina gran parte delle proprietà biochimiche; tale configurazione è detta
stato nativo.
Intervenendo dall’esterno la proteina può essere denaturata con
agenti chimici o riscaldamento e, al ripristinarsi delle condizioni ottimali dell’ambiente, torna ad assumere la configurazione di stato nativo
(Figura 1.1).
Nel gergo tecnico la sequenza codificata di amminoacidi è denominata
struttura primaria, mentre la configurazione tridimensionale assunta dal filamento è detta struttura terziaria.
Il legame diretto esistente tra struttura primaria e terziaria fu scoperto alla fine degli anni ’50 da Anfinsen [1] e da allora restano ancora
aperte due importanti problematiche riassumibili nelle domande:
• In che modo la struttura terziaria è codificata in quella primaria?
• Data una struttuta terziaria, quali sono le strutture primarie che
la ammettono come stato nativo?
11
Figura 1.1: Esempio di rappresentazione grafica della struttura
terziaria. Immagine tratta dal sito web del TCB Group, University
of Illinois.
note con il termine di Protein Folding Problem e Inverse Folding
Problem.
Comprendere la dinamica soggiacente al processo del ripiegamento è
di grandissimo interesse biomedico per la costruzione (design) di nuove
proteine con funzioni biologiche desiderate a partire dalla conoscenza
della semplice sequenza di amminoacidi.
Dal punto di vista teorico ciò significa comprenedere la causalità nello
schema
sequenza primaria −→ struttura terziaria −→ proprietà biologiche
Ottenere la struttura terziaria, ossia visualizzarne l’immagine tridimensionale, infatti, comporta lunghe e costose operazioni di laboratorio come la cristallografia a raggi X o la risonanza magnetica nucleare
(NMR); per ricavare la struttura primaria invece ci si avvale di processi molto meno dispendiosi attraverso la codifica del relativo gene di
DNA.
Quindi, ammesso di sapere come la struttura terziaria implichi determinate proprietà biologiche, queste ultime, tramite la comprensione
del meccanismo del protein folding, sarebbero direttamente correlabili
a un codice sequenziale per il quale si dispone di un database vastissimo e in continua crescita.
12
Uno degli approcci per la risoluzione del problema del protein folding
si fonda sull’analisi diretta di questo database alla ricerca di correlazioni statistiche tra struttura primaria e terziaria.
Per far questo algoritmi di elaborazione a reti neurali vengono previamente “addestrati” mediante campioni già noti.
Un secondo approccio, che sarà quello esaminato in questo lavoro di
tesi, si basa sulla costruzione di un modello in grado di simulare il
comportamento della proteina.
1.2
La proteina
Le proteine sono catene costituite da amminoacidi connessi da legami
peptidici.
In natura sono presenti 20 varietà di amminoacidi ed essendo la proteina tipicamente costituita da almeno un centinaio di amminoacidi,
esiste idealmente un potenziale esorbitante di possibili strutture primarie; basti pensare che una generica catena di 100 elementi puo essere
generata in 20100 ≈ 10130 codici differenti.
La natura sotto la costante pressione evolutiva ha selezionato una piccolissima frazione di tali sequenze favorendo quelle a cui è associato
uno stato nativo stabile; in prima istanza chiameremo queste proteine
buoni ripiegatori.
La caratterizzazione di un buono o di un cattivo ripiegatore è una delle
tematiche cruciali per il problema del protein folding e verrà discussa
nel Capitolo 6.
1.2.1
Amminoacidi
L’amminoacido è un composto organico formato da un atomo di carbonio centrale (Cα ) al quale sono connessi un gruppo carbossilico, un
gruppo aminico, un gruppo H e una catena laterale R che varia con
13
il tipo di amminoacido.
Nella tabella 1.3 sono elencati i 20 amminoacidi con le relative catene
laterali che vanno dalla più semplice della Glicina formata da un solo
atomo di idrogeno alle più complesse come la Isoleucina o la Triptofanina.
Solitamente la prima classificazione viene fatta in base alla idrofobicità, una delle caratteristiche salienti in presenza di un solvente acquoso. Gli amminoacidi lungo il filamento, infatti, tendono a disporsi
e impacchettarsi in modo da formare un nucleo (core) idrofobico che
minimizzi la superficie esposta al solvente ricoperto da una superficie
idrofilica.
Le conformazioni spaziali assunte dai gruppi attorno al nucleo Cα (detto residuo) sono quelle energeticamente favorite (dette rotameri) e
sono catalogate in vaste librerie. In generale ogni amminoacido può
essere sintetizzato stabilmente in due conformazioni speculari : chiralità L (sinistrorsa) e chiralità D (destrorsa) (Figura 1.2).
Per isotropia dello spazio amminoacidi con differenti chiralità hanno proprietà chimico-biologiche identiche. Per legarsi chimicamente,
però, sono necessari amminoacidi con la stessa chiralità. Ciò comporta l’ipotetica formazione di distinte proteine L e D; d’altronde anche
per una corretta interazione biologica fra filamenti distintiè necessaria
la stessa chiralità.
In natura tutte le proteine sono composte da amminoacidi L e, non
essendovi alcuna ragione apparente, sembra esservi stata una sorta di
scelta evoluzionistica casuale che ha selezionato la chiralità sinistrorsa
per gli organismi di questo pianeta1 .
I legami peptidici tra amminoacidi contigui lungo la catena avvengono tra l’atomo N del gruppo aminico che cede un ione H+ e l’atomo
C del gruppo carbossilico che cede lo ione OH- con la conseguente
condensazione di una molecola d’acqua.
1
La esobiologia si interessa nella ricerca di amminoacidi con chiralità D
all’interno di meteoriti.
14
Figura 1.2:
chiralità.
Schema strutturale dell’amminoacido nelle opposte
Amminoacidi contigui rimangono cosı̀ imperniati tramite questi legami sull’asse dei quali sono liberi di ruotare.
Come vedremo il modello standard tridimensionale schematizza ogni
amminoacido come un punto identificabile con l’atomo Cα e con un’
etichetta di appartenenza ad una delle tre classi: idrofobica (B), idrofilica (L) e neutra (N), passando cosı̀ da un codice a 20 lettere a un
codice a 3 lettere.
Questa drastica semplificazione permette di facilitare la modellizzazione
dei potenziali di interazione con l’introduzione del minor numero di
parametri necessari ad riprodurre le principali caratteristiche fisiche.
La scala di idrofobicità rappresenta grossolanamente la prima caratterizzazione fisica degli amminoacidi all’interno della sequenza e in
questo modello sarà scelta come unica per la classificazione (Capitolo
5).
In generale le proprietà chimiche degli amminoacidi concorrono solo
nella formazione della struttura terziaria della proteina e non influenzano direttamente le sue qualità biologiche. Vale a dire: se due sequenze diverse formano la stessa struttura terziaria di fatto formano
la stessa proteina.
15
Figura 1.3: Codice, composizione, struttura e massa espressa in Dalton
(g/mol) per i 20 tipi di amminoacidi
Figura 1.4: Struttura secondaria composta da tratti di α-elica (tratto
a zig-zag) e β-sheet (freccia) associata ad una sequenza primaria nel
codice a 20 lettere.
16
1.2.2
Struttura secondaria
La sequenza degli amminoacidi è caratterizzata su piccola scala dalla
comparsa di conformazione ricorrenti quali la α− elica e la β− sheet
composti approssimativamente da una decina di elementi. Come raffigurato in Figura 1.4 il codice della struttura primaria della proteina
può essere spezzato e raggruppato in blocchi che costituiscono la struttura secondaria.
La struttura terziaria della proteina può quindi essere schematizzabile
con la composizione di oggetti ricorrenti orientati (eliche o strisce)
connessi da tratti di filamento (loop) non riconducibili ad esse.
È importante sottolineare come già in questo primo passo di aggregazione
non vi sia un nesso diretto fra sequenza di amminoacidi e α -eliche o
β -sheet, vale a dire tra sequenza primaria e secondaria.
Sequenze diverse di amminoacidi possono dare luogo localmente alle
stesse strutture secondarie e concorrere globalmente a diverse terziarie.
La struttura secondaria rappresenta perciò un ponte tra la primaria
e la terziaria; di notevole aiuto per il riconoscimento e la classificazione
delle proteine ci offre una base di partenza o un test di prova per
modelli e simulazioni con sequenze brevi.
Come si vedrà nel Capitolo 6, la sequenza campione utilizzata per le
simulazioni di ripiegamento sarà composta da 22 amminoacidi il cui
stato nativo corrisponde alla β -sheet rappresentata in Figura 6.2 (a).
Oltre la struttura terziaria, su scale più estese, la combinazione di
due o più filamenti di amminoacidi dà luogo a complessi intrecci di
filamenti a cui viene dato il nome di struttura quaternaria.
1.3
Interazioni fisiche
Per dare una interpretazione dinamica del processo di ripiegamento è
necessario individuare le forze che determinano la struttura terziaria.
I legami che connettono i diversi gruppi dell’amminoacido e il legame
peptidico tra amminoacidi contigui lungo la catena sono tutti covalen17
ti e rappresentano un contributo costante che si cancella calcolando
differenze energetiche tra diverse configurazioni.
Le interazioni non covalenti restanti sono tre ordini di grandezza più
deboli e sono i motori effettivi nella dinamica del folding.
Schematizzando:
• Repulsione a corto range: fra coppie di atomi che si avvicinano
al punto da sovrapporre i rispettivi orbitali elettronici; la repulsione cresce enormemente e mantiene gli amminoacidi a debita
distanza.
• Forze elettrostatiche : fra coppie di atomi parzialmente ioniz-
zati in accordo con le leggi Coulombiane e con le modulazioni
dielettriche del mezzo circostante.
• Interzioni van der Waals : mutuate dagli effetti di polarizzazione
indotta.
• Ponti a idrogeno : fra coppie di atomi elettronegativi; sono responsabili della crezione di strutture locali come le α - eliche e
le β - sheet.
• Interazione idrofobica : generata dai dipoli presenti nel solvente;
l’acqua trasmette forze effettive fra atomi non polari e induce la
creazione di un nucleo idrofobico.
1.4
Un primo sguardo al modello
Diamo ora una breve introduzione sugli aspetti legati alla modellizzazione che verrà discussa approfonditamente nel Capitolo 5.
La struttura terziaria è individuata dalle coordinate spaziali dei residui
Cα avendo cosı̀ ridotto gli amminoacidi a oggetti puntiformi.
Ogni residuo è vincolato a mantenersi a distanza fissa da quello che lo
precede nella sequenza; la sua posizione relativa è perciò individuata
dalle due coordinate angolari sulla sfera di raggio costante centrata
18
nel residuo precedente.
Modelli semplificati studiano la proteina discretizzando le possibili posizioni angolari del generico residuo rispetto al precedente; assumendo
che tali posizioni siano ad esempio 7, una proteina costituita da 100
amminoacidi ha a disposizione 7100 possibili configurazioni e fra tutte
queste, al variare delle condizioni iniziali e dell’ambiente esterno, è
in grado di assumere, tramite il ripiegamento, la configurazione dello
stato nativo.
Lo stato nativo è presumibilmente il minimo assoluto in un panorama
energetico che dipende da un elevato numero di gradi di libertà.
La simulazione computazionale ha lo scopo di gettare luce sulla conformazione di questo panorama (presenza di minimi locali, loro disposizione e stabilità, presenza di traiettorie preferenziali che facilitino il
ripiegamento) in relazione alla sequenza assegnata.
Il problema è strutturalmente inaffrontabile dal basso, ossia a partire
dai costituenti atomici dei singoli amminoacidi; la complessità del sistema ne fa perdere il controllo, inoltre il divario di scala temporale che
contrappone processi locali e globali rende necessario un adattamento
dei passi di integrazione a tempi ridottissimi (≃ 10−15 s) aggravando
ulteriormente il carico computazionale.
Gli amminoacidi, in quella che si può definire una modellistica standard sono perciò i costituenti primi della proteina; masse puntiformi
vincolate e soggette a potenziali configurazionali creati per emulare le
reali interazioni esistenti.
Ammettendo di poter disporre dei potenziali da introdurre nel modello, il primo problema è quello di costruire un integratore dinamico
efficiente in grado di descrivere l’evoluzione temporale di un sistema
di punti vincolati.
Il problema del vincolo può essere aggirato sostituendo le ipotetiche
aste rigide che connettono i residui con oscillatori armonici ad alta frequenza; in questo caso il problema di una catena di N residui è ridotto
al problema di N punti nello spazio soggetti alla dinamica newtoniana;
ci si trova però di fronte al problema di dover innalzare fortemente la
19
rigidità elastica delle molle e conseguentemente ridurre il passo di integrazione per assecondarne la dinamica veloce a spese dell’efficienza
di calcolo.
D’altro canto considerando le aste rigide è necessario avvalersi di un
integratore che preservi il vincolo delle distanze tra residui contigui.
La costruzione di un integratore con queste caratteristiche è uno dei
principali scopi di questo lavoro.
Un’ altra classe di modelli detta a reticolo (o lattice models) elude
questo problema schematizzando le posizioni dei residui all’interno di
una griglia tridimensionale di caselle; le posizioni angolari di residui
contigui sono cosı̀ discretizzate e la dinamica assume un’ impronta
probabilistica con enormi agevolazioni computazionali.
Da questi modelli si possono ottenere importanti risultati pur se la
marcata semplificazione pone limiti al parallelismo con la meccanica
della proteina reale.
Estendendo la dinamica ad uno spazio continuo (fuori-reticolo, offlattice) il modello di riferimento per molti lavori ([20], [21], [19]) svolti
negli ultimi anni è quello di Thirumalai - Honeycutt [18] che utilizzeremo ed esamineremo dettagliatamente nel Capitolo 5.
Per la conservazione delle distanze l’algoritmo di integrazione farà uso
di rotazioni nello spazio. Tali rotazioni, come è stato detto nell’Introduzione, verranno compiute attraverso operatori vettoriali noti come
quaternioni.
Nel prossimo Capitolo verrà esposta tale algebra e vaerrà chiarito
il motivo di un cosı̀ largo sviluppo nel campo del calcolo e della
elaborazione grafica tridimensionale.
20
Capitolo 2
Quaternioni
Nel 1843 Sir William Hamilton presentò alla Royal Irish Academy
una ricerca personale in cui veniva proposto un tentativo di generalizzazione dei numeri complessi come strumento di manipolazione della
geometria spaziale.
L’idea di Hamilton trae spunto dall’isomorfismo esistente tra il gruppo (C, ·) , campo complesso e moltiplicazione, e le rotazioni sul piano.
Un numero c ∈ C, formato da parte reale e immaginaria (x, ıy) iden-
tifica un vettore bidimensionale che giace sul piano complesso; alla
moltiplicazione tra elementi é associata la rotazione su tale piano dei
rispettivi vettori.
Ricordiamo brevemente che tramite la notazione di Eulero ogni
numero complesso è esprimibile come
c = a + ıb = R cos(θ) + ıR sin(θ) = Reıθ
(2.1)
e il prodotto di una coppia di complessi come
′
c · c′ = R · R′ eı(θ+θ )
(2.2)
Se R′ = 1, ossia c′ è unitario, il prodotto corrisponde ad una rotazione
del vettore c (Figura 2.1).
Hamilton si propose di trovare un gruppo (Q, ◦) che estendesse
questo isomorfismo alle rotazioni nello spazio tridimensionale.
c ∈ C ⇐⇒ Rotazioni 2D
21
φ’
Im
C*C’
C
φ
C’
φ’
Re
Figura 2.1: Al prodotto tra numeri complessi corrisponde una
rotazione sul piano.
q ∈ Q ⇐⇒ Rotazioni 3D
Che dimensionalità dare agli elementi di Q ?
Se alla rotazione 2D è associato un binomio (x, ıy), pensò Sir Hamilton, a quelle 3D deve essere associato un trinomio. Bisognava dotare
l’elemento q di una terza parte oltre a quella reale e immaginaria e
costruire quindi un corredo di regole algebriche consistenti per definire
il gruppo (Q, ◦). Sir Hamilton non riuscı̀ a venirne a capo e concluse,
oltre al fatto che la topologia gioca brutti scherzi, che un trinomio non
era sufficiente a suoi scopi.
Associato alle rotazioni 3D vi è uno spazio Q popolato da quadrinomi
composti da una parte reale e tre distinte parti immaginarie ı, , k.
A tale quadrinomio Hamilton diede il nome di quaternione.
1
1
In una lettera ad un collega Sir Hamilton racconta di come, dopo una decina
d’anni di laboriose riflessioni, fu folgorato dall’idea risolutiva mentre camminava
con la moglie lungo il Royal Canal di Dublino. Preso dall’eccitazione, incise con
un temperino la nota formula ı2 = 2 = k 2 = ı k = −1 su una pietra del ponte
che successivamente i suoi alunni ribattezzarono Quaternion Bridge.
22
2.1
Algebra dei quaternioni
Lo spazio Q è generato da una unità reale (1, oppure omesso) e
tre unità immaginarie ı  k.
Un elemento di tale spazio è perciò
univocamente individuato da quattro variabili indipendenti.
q = q0 + q1 ı + q2  + q3 k = (q0 , q1 , q2 , q3 )
La somma e il prodotto esterno per uno scalare che compaiono
nella suddetta espressione sono definite in analogia con l’algebra ordinaria; (Q, +, ·) risulta perciò uno spazio vettoriale isomorfo a R4 .
Introduciamo ora il prodotto interno tra elementi di Q costruendolo a
partire da regole algebriche fondamentali con cui si combinano le tre
unità immaginarie.
ı2 = 2 = k 2 = −1
(2.3a)
ı ·  = − · ı = k
(2.3b)
 · k = −k ·  = ı
(2.3c)
k · ı = −ı · k = 
(2.3d)
Con riferimento a tali regole il prodotto tra due elementi
q = (q0 , q1 , q2 , q3 ), p = (p0 , p1 , p2 , p3 )
risulta essere una combinazione lineare delle rispettive coordinate
q ◦ p = (q0 p0 − q1 p1 − q2 p2 − q3 p3 )
+ î(q0 p1 + q1 p0 + q2 p3 − q3 p2 )
(2.4)
+ ĵ(q0 p2 − q1 p3 + q2 p0 + q3 p1 )
+ k̂(q0 p3 + q1 p2 − q2 p1 + q3 p0 )
esprimibile nella forma matriciale

q0 −q1
 q1 q0
q◦p=
 q2 q3
q3 −q2

p0
−q2 −q3


−q3 q2   p1
q0 −q1   p2
p3
q1
q0
23




(2.5)

q0
p0 −p1 −p2 −p3


 p1 p0
p3 −p2   q1
=
 p2 −p3 p0
p1   q2
q3
p3 p2 −p1 p0





(2.6)
Si dimostra facilmente che l’ operazione binaria interna in Q del
prodotto risulta associativa e distributiva rispetto alla somma, ma,
come si osserva nelle eq. 2.5 e 2.6, incontrovertibilmente non commutativa (né anticommutativa). A ragione di ciò si ricordi che la
commutatività di cui godono le rotazioni 2D (Equazione 2.2) è una
proprietà che viene intrinsecamente persa nelle rotazioni 3D dove il
risultato di una combinazione di rotazioni dipende dall’ ordine con
cui sono concatenate.
Sebbene le quattro variabili qi i = 0 . . . 3 siano indipendenti e di
conseguenza l’ugulianza tra due elementi di Q implichi la simultanea
ugualianza di quattro quantità reali, risulta utile identificare il generico quaternione q come l’unione di una parte reale (q0 ) e di una parte
vettoriale rappresentata dal trinomio immaginario
îq1 + ĵq2 + k̂q3 = ~q
Si noti come la curiosa coincidenza di simbolismo tra le unità immaginarie ı, , k e i consueti versori euclidei î, ĵ, k̂ getti le fondamenta del
dualismo tra un’ algebra estesa dei complessi e lo spazio tridimensionale.
Dall’ algebra di C possiamo importare l’operatore di coniugazione
estendendolo alle tre dimensioni immaginarie
q = (q0 , −q1 , −q2 , −q3 ) = (q0 , −~q)
(2.7)
e introdurre quindi la norma di un quaternione definita come
kqk2 = q ◦ q = q02 + q12 + q22 + q32
Se kqk2 = 1 il quaternione è detto unitario.
Il campo (Q, +, ·) dotato della metrica d(q, p) =
un’algebra di Banach.
24
p
(2.8)
kq − pk rappresenta
Mettiamo ora in corrispondenza lo spazio R3 con lo spazio Q definendo per il generico vettore ~x ∈ R3 il corrispettivo quaternione
x = (0, ~x) e dato l’omeomorfismo esistente tra R3 e il sottospazio
vettoriale
QR3 = {q ∈ Q | q0 = 0}
ci permettiamo di identificare concettualmente e notazionalmente il
quaternione x ∈ QR3 con il vettore ~x.
Ora abbiamo tutti gli ingredienti per illustrare come l’algebra quaternionale racchiusa nelle leggi di combinazione 2.3 possa essere una rappresentazione non singolare del gruppo delle rotazioni SO(3) 2 .
Enunciamo il seguente
Teorema 1 Dato un vettore ~x ∈ R3 e un quaternione unitario q
q ◦ ~x ◦ q è ancora un elemento di R3
e la trasformazione
~x → q ◦ ~x ◦ q
(2.9)
rappresenta un rotazione.
Seguendo la traccia di Hamilton, si può verificare che ogni quaternione
unitario può essere associato ad un versore v̂ e ad un angolo α nella
forma
α
α
def
qv,α = (cos , v̂ · sin )
2
2
Come corollario al Teorema 1 vale quindi
(2.10)
Corollario 1 Dato ~x ∈ R3 e qv,α
~x → qv,α ◦ ~x ◦ qv,α
(2.11)
rappresenta una rotazione antioraria del vettore ~x compiuta rispetto
al versore v̂ di un angolo α.
La composizione di due rotazioni si ottiene, per proprietà associativa, dal prodotto di due quaternioni
q2 (q1~x q1 )q2 = (q2 q1 )~x (q1 q2 )
2
Si può generalizzare l’algebra dei quaternioni assumendo che esista una base
{1, e1 , e2 , e3 } che soddisfi la condizione ei · ej = −δij + ǫijk ek .
25
x’
x
α
v
k
x’ = q x q
q = cos(α/2) + v sin(α/2)
i
j
Figura 2.2: Al prodotto tra quaternioni è associata una rotazione nello
spazio ~x → ~x′ di un angolo α attorno all’asse individuato da v̂.
2.1.1
Osservazioni
D’ ora in avanti, dove non vi siano ambiguità, verrà omesso l’operatore
◦.
Per prima cosa riscriviamo le Eq. 2.5 e 2.6 in notazione vettoriale.
Dati q = (q0 , ~q) e p = (p0 , ~p) il loro prodotto si esprime


r0 = q0 · p0 − ~q · ~p
r = (r0 , ~r) dove


~r = q0 · ~p + p0 · ~q + ~q × ~p
(2.12)
dove sono utilizzati il prodotto scalare e vettoriale ordinari.
• Si può notare come q ◦ p = p ◦ q ⇔ ~q k p~. A corollario di ciò si
ottiene che due rotazioni commutano solo se posseggono un asse
comune.
qv,α qv,β ~x qv,β qv,α = qv,β qv,α ~x qv,α qv,β
(2.13)
• Cambiando il versore v̂ con il suo opposto e l’angolo α con il suo
complemento a π si ottiene il quaternione q−v,π−α = −qv,α . Di
conseguenza ogni coppia {q, −q} da luogo alla stessa rotazione,
proprietà comune all’algebra delle matrici di Pauli e in generale
caratteristica di quelle che vengono dette skew algebra
26
v
v x
α
x
x’
Figura 2.3: Rotazione planare (v̂ ⊥ ~x) di un angolo α. ~x′ = ~x cos α +
(v̂ × ~x) sin α.
• Un caso particolare di rotazione si ha quando essa è planare ossia
quando vi è ortogonalità tra vettore oggetto e asse di rotazione;
vale il seguente
Teorema 2 1 Dati un vettore ~x ∈ R3 e un quaternione unitario qv,α
con v̂ ⊥ ~x si ha
qv,α ~x qv,α = qv,2α ~x
(2.14)
Battezziamo la 2.14 espressione ridotta per la rotazione.
Dimostrazione Sviluppiamo brevemente l’algebra dei quaternioni
per una rotazione planare .
qv,2α ~x = (cos α, v̂ · sin α) · (0, ~x)
= (−~xv̂ sin α, ~x cos α + (v̂ × ~x) sin α)
(2.15)
= (0, ~x cos α + (v̂ × ~x) sin α)
che, come mostrato in Figura 2.3, rappresenta appunto la rotazione
antioraria di ~x rispetto all’asse v̂.
• Osserviamo infine che applicando l’espressione ridotta nel caso
in cui v̂ 6⊥ ~x continua a valere la conservazione della norma
kqv,2α ~xk = k~xk
27
(2.16)
ma poichè
(qv,2α~x)0 6= 0 ⇒ qv,2α~x ∈
/ R3
(2.17)
essa cessa di rappresentare una rotazione in R3 .
2.2
Applicazioni dei quaternioni
Dal punto di vista teorico la quadridimensionalità di questi oggetti
trova vaste applicazioni in fisica moderna: in relatività generale per le
assonanze con la geometria di Minkowsky, in meccanica quantistica si
sfrutta l’isomorfismo tra quaternioni e matrici di Pauli per lo sviluppo di teorie unificatrici di campo forte e elettrodebole; le equazioni
di Maxwell ad esempio si scrivono come un’unica equazione d’onda
quaternionale non omogenea e l’ equazione di Klein Gordon come un
semplice oscillatore armonico quaternionale; in matematica tramite
successioni iterative di quaternioni si possono generare insiemi frattali
tridimensionali (il set di Julia consueto è una figura 2D e si genera con
una successione di numeri complessi)
Dal punto di vista tecnico e tecnologico, i quaternioni sono un veloce strumento di calcolo per la manipolazione geometrica dello spazio
tridimensionale.
Elenchiamo dispositivi di controllo nella robotica, percezione e riconoscimento di immagini per l’intelligenza artificiale e la neuroscienza, dinamica dei vortici nelle simulazioni meteorologiche, altimetri,
giroscopi e altra strumentazione a bordo di aereoplani, elicotteri e,
con mio grande rammarico, missili teleguidati; triangolazioni per il
sistema satellitare GPS, reti radar e ingegneria aereospaziale.
Infine c’è il grande supporto dato alla computer grafica: dalle simulazioni di dinamica molecolare agli effetti speciali di Hollywood fino
alle evoluzioni turbinanti della visione soggettiva in videogiochi come
Tomb Raider.
Questo sodalizio tra quaternioni e calcolo computazionale è dovuto
principalmente a due fattori.
1. La rappresentazione non singolare del gruppo delle rotazioni
28
rende possibile la descrizione della geometria sferica tramite una
sola mappatura, evitando cosı̀ la delicata operazione del cambio
di carta necessaria in presenza di singolarità.
2. La rotazione, espressa in forma quaternionale, è una combinazione di somme e moltiplicazioni le quali, confrontate con il
carico computazionale necessario per gli sviluppi trigonometrici,
rendono più agevole il calcolo.
2.3
Dinamica Molecolare e Quaternioni
La dinamica molecolare (MD) descrive un gas di molecole considerandole alla stregua di corpi rigidi.
Di conseguenza all’ integrazione del moto traslazionale va sovrapposta
quella del moto rotazionale per ogni singola molecola.
Come sappiamo quest’ ultimo è intrinsecamente più complicato del
primo a causa della dipendenza posizionale delle velocità angolari e
dalla non-separabilità della relativa Hamiltoniana.
Perciò se si vuole ottenere e simulare al calcolatore l’evoluzione di un
gran numero (∼ 106 ) di molecole è naturale pensare che l’algoritmo
integratore del moto debba essere veloce.
I principali metodi di integrazione per il moto del corpo rigido in
dinamica molecolare sono parametrizzati in termini di
• Angoli di Eulero
• Quaternioni
• Matrice degli assi principali
• Vincoli atomici
Quest’ultimo tratta la dinamica del corpo rigido come la composizione
di moti puramente traslazionali dei singoli atomi (puntiformi) che si
muovono sotto l’azione delle forze potenziali e delle le forze vincolari
introdotte per mantenere costanti le distanze interatomiche. Tale approccio è riconosciuto essere il migliore in termini di stabilità ed è
29
per questo considerato come il modello di confronto per lo sviluppo di
nuovi integratori. Lo svantaggio risiede nel carico di calcolo indotto
dai complicati sistemi non lineari da risolvere ad ogni passo temporale
per ogni molecola e dal conseguente calo di efficienza al crescere del
numero di atomi per molecola.
L’integrazione numerica con angoli di Eulero è poco efficiente a causa
delle singolarità presenti nelle equazioni che impongono cambi di carta durante il processo di calcolo. Da questo inconveniente sono esenti
l’approccio matriciale e quello quaternionale che sono entrambi utilizzati in dinamica molecolare come alternativa al metodo dei vincoli
interatomici. Il moto viene parametrizzato tramite rispettivamente 6
e 4 variabili indipendenti , ma l’integrazione deve affrontare il problema della conservazione del vincolo di ortonormalità per le matrici e
di norma unitaria per i quaternioni.
Questo vincolo può essere imposto forzatamente ad ogni passo di integrazione tramite riscalature o proiezioni, oppure essere implicitamente
garantito utilizzando trasformazioni che lo conservano.
Una discussione approfondita dei diversi integratori verrà fatta nel
prossimo Capitolo e in Appendice B.
2.3.1
Riferimento per un corpo rigido
L’orientazione di un corpo rigido è univocamente determinata dall’orientazione del sistema ad esso solidale esprimibile con una matrice 3×3
ortonormale A che ha per colonne i versori degli assi principali
Generalizzando la rotazione quaternionale di un vettore
~x → q ~x q
a quella di una matrice
A → qA q
si può individuare l’orientazione spaziale di un riferimento mobile che
abbia come versori di base la terna (eˆ1 , eˆ2 , eˆ3 ) rispetto ad un sistema
fisso di base (î, ĵ, k̂) tramite il quaternione q.
30






|
|
|
| | |
| | |
A =  eˆ1 eˆ2 eˆ3  = q  î ĵ k̂  q =  q î q q ĵ q q k̂ q  = q I q
| | |
|
|
|
| | |
(2.18)
Istante per istante sia la matrice A che il quaternione q individuano
l’orientazione del corpo rotante, ma mentre per A sono necessarie 6
variabili indipendenti, utilizzando q il moto può essere parametrizzato
dalle sue 4 coordinate integrando il sistema di equazioni differenziali
q̇ =
1
q·ω
2
(2.19)
accoppiato con il sistema di equazioni di Eulero per le componenti di
ω
τxb
ω˙x =
+
Ixx
Iyy − Izz
Ixx
ωx ωz
x→y→z
(2.20)
La soluzione a questo sistema (non lineare) è vincolata a rimanere
sulla sfera unitaria S3 , ossia si deve verificare
kq(t)k = 1
∀t
(2.21)
Il mantenimento di questo vincolo costituisce una delle questioni spinose
per un algoritmo di integrazione quaternionale e verrà affrontata e
discussa in Appendice B.
2.4
I quaternioni nel modello per la proteina
Come è stato accennato nell’Introduzione la catena polimerica di amminoacidi che costituisce la proteina è modellizzata come una successione di oggetti puntiformi connessi da legami rigidi. L’intento sarà
quello di riuscire a trattare singolarmente ognuno di questi oggetti.
Potremmo definire tale sistema corpo semirigido, ossia un set di corpi
rigidi vincolati a mantenere un punto in comune con i contigui (le estremità dove risiedono gli amminoacidi); nella fattispecie questi corpi
rigidi sono puntiformi, ma non adimensionali in quanto il vincolo li
31
rende idealmente associabili ad una asta monodimensionale (sottile)
la cui massa è concentrata ad un’ estremità.
Mettiamo in luce un tratto saliente della questione: la trattazione
dinamica illustrata in Sezione 2.3.1 non si presta al caso di un asta
monodimensionale. Tale oggetto rappresenta infatti un corpo rigido
degenere e la sua patologia, racchiusa nella sua monodimensionalità,
si manifesta nelle seguenti constatazioni che si implicano mutuamente
• L’asta non individua un sistema di riferimento, poichè ad essa è
associato un vettore, non una terna.
• La matrice di inerzia della singola asta è singolare.
• Sono sufficienti due coordinate per individuare l’orientazione di
una asta.
3
• Il vettore asta è invariante rispetto ad una rotazione (o rivoluzione)
attorno al suo asse.
• La posizione dell’asta ê (supposta unitaria) rispetto ad un ver-
sore di riferimento (ad esempio k̂) non è univocamente associata
ad un solo quaternione, ossia esistono infiniti q tali che
q k̂ q = ê
dove ê è il vettore asta.
Di conseguenza per la dinamica di questa catena di asticelle non faremo uso di equazioni del tipo 2.19; la configurazione del sistema verrà
descritta da un set di vettori ê ∈ R3 .
Ai quaternioni verrà dato il compito operatoriale di aggiornare tale
configurazione ad ogni passo di integrazione, senza che essi assumano
il ruolo di variabili dinamiche.
Per risolvere la dinamica di una singola asta procederemo nel Capitolo
4 analizzando per prima cosa il caso del pendolo sferico e, successivamente, di una catena di pendoli connessi.
3
Utilizzando i consueti angoli di Eulero di precessione, nutazione e rivoluzione
(ϕ, θ, ψ), per parametrizzare la posizione dell’asta sono sufficienti due angoli
(ϕ, θ, ·)
32
Capitolo 3
Dinamica Molecolare e
algoritmi di integrazione
3.1
Introduzione
Gran parte dei problemi di fisica chimica, biochimica e biologia presuppongono la risoluzione di esperimenti al calcolatore che simulino
processi che possiamo generalmente definire di dinamica molecolare
(MD); il gas o il liquido in esame è normalmente studiato come una
collezione di corpi rigidi in interazione. Anche se la trattazione di tale
problema ha origini tutt’altro che recenti, lo sviluppo di un algoritmo
di integrazione stabile ed efficiente richiama ancora oggi gli sforzi di
fisici e matematici.
3.2
Generalità sugli integratori
Le svariate metodologie di integrazione si qualificano principalmente
in base all’ ordine della precisione e al peso del calcolo.
Altri punti di forza sono la stabilità, ossia la gestione di eventuali
situazioni critiche che eviti l’incorrere di singolarità numeriche e, in
visione di un vasto e diversificato utilizzo, la versatilità e la adattabilità dell’algoritmo alla conduzione di diversi esperimenti (energia,
temperatura, pressione costanti, ecc...).
Con particolare riguardo ai sistemi vincolati, un algoritmo può garan33
tire il mantenimento del vincolo in modo implicito o esplicito. Nel
primo caso il ciclo del passo di integrazione è strutturato in modo
da preservare intrinsecamente il vincolo; nel secondo caso al termine
di ogni ciclo viene compiuta una (piccola) modifica delle variabili dinamiche che vengono forzatamente proiettate sulla varietà descritta
dalle equazioni di vincolo.
Come esempio particolare, per un sistema hamiltoniano è possibile
trovare un integratore simplettico
1
che ha la qualità di conservare
implicitamente tutti gli invarianti geometrici del moto (invarianti di
Cartan). Di conseguenza in un sistema che ammette integrali primi la
loro conservazione è garantita a meno di fluttuazioni numeriche proporzionali al passo di integrazione.
Precisione, velocità di calcolo, stabilità, simpletticità e mantenimento implicito dei vincoli sono qualità non necessariamente esclusive;
trovare un algoritmo con determinati requisiti, rappresenta la sfida
matematica alla base della progettazione di un integratore.
3.3
Metodologie di integrazione
In questa sezione viene presentata una panoramica qualitativa delle
più comuni strategie algoritmiche in campo molecolare.
Per un approfondimento matematico specifico si rimanda all’ Appendice A e B.
3.3.1
Approccio atomico
Il metodo tutt’ora largamente più utilizzato in MD è quello dei vincoli atomici; ogni molecola del sistema è un aggregato di atomi (puntiformi) la cui traiettoria nello spazio delle fasi è integrata secondo
le equazioni di Newton; la conservazione della struttura molecolare è
1
la matrice di trasformazione S ad ogni passo temporale verifica la condizione
di simpletticità SJST = J.
34
garantita dall’introduzione di forze vincolari che mantengono costanti
le distanze interatomiche ad ogni passo di integrazione.
Nell’approccio atomico la maggior parte degli algoritmi (il più utilizzato dei quali è il metodo SHAKE [8]) si avvale dell’aggiunta di
termini nell’Hamiltoniana fattorizzati da moltiplicatori di Lagrange.
A questo punto lo schema di integrazione può essere ricondotto al comune metodo Verlet (con le sue varianti velocity-Verlet e leap-frog) che
rappresenta lo standard per l’evoluzione di moti puramente traslazionali (vedi Appendice A).
Naturalmente l’aggiunta delle condizioni vincolari accresce il numero
di equazioni, generalmente non lineari, e il peso di calcolo computazionale
rendendo inefficiente questa strategie per strutture molecolari molto
complesse.
Per aggirare questa difficoltà Ahlrichs e Brode [10] sviluppano un
metodo (detto degli assi principali ) con il quale la generica struttura
atomica viene sostituita da 4 pseudo-particelle (3 per molecole planari,
2 per molecole lineari) rigidamente ancorate agli assi del corpo; fatto
ciò il moto è integrato come sopra.
3.3.2
Approccio molecolare
Le limitazioni imposte dalla strutturalità molecolare nel caso dei vincoli atomici sono assenti in una trattazione dinamica della molecola
come corpo rigido; l’integrazione delle relative equazioni garantisce
implicitamente la conservazione delle distanze interatomiche e il moto
si traduce nella composizione di una traslazione e di una rotazione
rispetto al baricentro.
Il moto traslazionale del centro di massa è generalmente integrato con
metodo Verlet o affini.
L’applicazione di questi schemi presuppone che la derivata posizionale
sia indipendente dalla posizione stessa o similmente che l’accelerazione
sia indipendente dalla velocità.
Questa condizione è intrinsecamente violata nel caso delle variabili
35
di orientazione, siano esse angoli di Eulero, matrici di rotazione o
quaternioni, dove vi è un esplicita dipendenza dell’accelerazione angolare dalla velocità.
Per l’orientazione di un corpo rigido, come si è detto nel Capitolo 1,
sono possibili diverse parametrizzazioni;
• angoli di Eulero
• quaternioni
• matrice di rotazione
Angoli di Eulero La parametrizzazione diretta tramite angoli di
eulero utilizza il numero minimo di 3 coordinate che, al contrario delle
6 coordinate della matrice di rotazione e le 4 del quaternione, soggette
rispettivamente ai vincoli di ortonormalitá e di norma unitaria, risultano non vincolate.
Il principale inconveniente che emerge da questo tipo di rappresentazione sono le singolarità presenti nelle zone polari a cui si deve far
fronte mediante un adeguato cambio di mappa (ad esempio una inversione degli assi).
E’ stato proposto recentemente [11] un metodo di splitting completamente simplettico e reversibile in cui l’hamiltoniana viene separata in
quattro termini e tramite il quale il moto risultante del corpo rigido
si scompone nella concatenazione di rotazioni planari.
Quaternioni Nell’ambito dell’approccio molecolare alla MD, la parametrizzazione quaternionale proposta da Evans [12] per i moti rotazionali del
corpo rigido è largamente la più diffusa.
Come si è appena detto non è possibile utilizzare lo schema Verlet
per l’evoluzione delle 4 variabili qi ; l’hamiltoniana in rappresentazione
quaternionale risulta inoltre non separabile ed è quindi necessario l’utilizzo di schemi non simplettici come Runge-Kutta o Gear predictorcorrector, solitamente al quarto ordine.
36
Un metodo di integrazione alternativo è stato introdotto da Fincham
[13] e rappresenta il primo tentativo di trasportare lo schema leap-frog
in campo rotazionale meritandosi l’appellativo di leapfrog-like.
Il metodo Fincham risulta efficiente nel caso di simulazioni a temperatura costante, ma le fluttuazioni energetiche nelle simulazioni a
energia costante sono molto grandi paragonate a quelle implementate
con i vincoli atomici.
Inoltre in questo metodo non vi è conservazione implicita della norma
del quaternione il quale viene sottoposto ad una forzosa procedura di
riscalatura ad ogni ciclo perchè vi sia rigidità molecolare.
Recentemente un nuovo metodo a velocità angolari leapfrog-like è stato sviluppato da Omelyan [7]. Lo schema può essere adattato sia a
quaternioni che a matrici di rotazione come variabili di orientazione e
prevede una conservazione implicita delle norme.
L’algoritmo originale prevede la risoluzione iterativa di un sistema
non lineare ad ogni ciclo che, pur essendo computazionalmente meno
onerosa di quella necessaria per ottenere le forze vincolari nell’approccio atomico, rappresenta un inconveniente per simulazioni a lunga durata.
Successivamente lo stesso Omelyan ha presentato una variante modificata del suo integratore [14] nella quale il sistema non lineare viene
risolto semi-analiticamente e che mostra eccellente stabilità nelle simulazioni a energia costante.
Approfondimenti tecnici sui metodi di integrazione Evans, Fincham e
Omelyan citati sono riportati in Appendice B.
Matrice di rotazione Kol presenta infine un algoritmo [15] in cui
la matrice di rotazione non è parametrizzata, ma le 6 coordinate sono
fatte evolvere direttamente.
L’approccio che viene fatto è di tipo Hamiltoniano per cui alla matrice
di rotazione che individua l’orientazione del corpo viene affiancato un
37
momento coniugato corrispondente.
Alla Hamiltoniana che ne deriva viene aggiunto un termine che coinvolge un moltiplicatore di Lagrange matriciale per assicurare l’ortonormalità della matrice e la rigidità della molecola.
Tale metodo in assonanza con SHAKE è stato battezzato R-SHAKE
(Rotational Shake) ed è approfonditamente discusso in Appendice B.
3.4
Dinamica e integratori per una catena
Come è stato discusso nel Capitolo 1 i composti polimerici come la proteina e il DNA possono essere trattati meccanicamente come catene
di elementi incernierati.
Esiste già una vasta gamma di studi teorici riguardanti la dinamica di
corpi rigidi connessi [16] e applicati sull’assemblaggio e l’articolazione
di bielle, perni e pistoni per scopi ingegneristici.
L’approccio [17] si basa sulla traduzione del concetto di contatto in
un set di forze e momenti vincolari in grado di mantenere tale contatto. Per prima cosa i tipi di contatti (punto comune, asse comune,
superficie comune, punto su asse, punto su superficie ecc...) vengono
trasformati in equazioni lineari che vincolano le variabili del moto.
Le forze e momenti trasmessi dalle strutture rigide dell’oggetto sono
le soluzioni del sistema che ne deriva.
Nel modello standard per la proteina Honeycutt-Thirumalai si è in
presenza di una collezione di aste con mutue connessioni punto-punto
alle estremità occupate dai residui.
Il procedimento preso in esame in questo modello è del tutto simile e
verrà illustrato dettagliatamente nel Capitolo 4.
38
Capitolo 4
Integratore per un pendolo
sferico
Siamo in presenza di una massa puntiforme soggetta a forze esterne
vincolata a muoversi sulla superficie di una sfera.
Come è noto, anche se il problema è integrabile analiticamente, la
soluzione fa ricorso a funzioni ellittiche spinose dal punto di vista
computazionale; è preferibile perciò la ricerca di una integrazione numerica più maneggevole.
Trattiamo un punto vincolato a distanza fissa dall’origine alla stregua
di un corpo rigido unidimensionale (che chiameremo asta) la cui massa è concentrata su di una estremità. Individuare l’orientazione dell’
asta equivale a individuare la posizione del punto sulla sfera.
4.1
Dinamica
4.1.1
Pendolo sferico
Definiamo
ê
vettore (versore) che indidua l’asta (supposta di lunghezza unitaria).
~ω
~
L
velocità angolare
momento angolare
Tutti i vettori sono definiti rispetto ad un riferimento esterno.
39
Figura 4.1: Pendolo sferico. n̂ individua il piano istantaneo di
rotazione, t̂ la direzione tangente.
Come è stato anticipato nel Capitolo 3 l’asta (un qualsiasi oggetto
unidimensionale) rappresenta un corpo rigido degenere; il suo tensore
d’inerzia ha determinante nullo rispetto a qualsiasi polo e, come illus~ eω
trato in Figura 4.1, i vettori L
~ sono paralleli e perpendicolari al
piano di rotazione istantanea dell’asta.
Notiamo che non viene tolta generalità al problema supponendo la
massa dell’asta unitaria e concentrata alla sua estremità.
Sotto tale ipotesi, con riferimento alla Figura 4.1, otteniamo.
~v ≡ ~e˙ = ω
~ × ê = |ω|t̂
(4.1)
Dalla definizione di momento angolare
~ ≡
L
X
i
mi · ~ri × ~vi
(4.2)
dove la sommatoria è estesa alle particelle che compongono il corpo
rigido, si ha nel nostro caso
~ ≡ m · ê × ~v =
L
m · |ω| · ê × t̂ =
|ω|n̂ = ~ω
Il momento angolare risulta coincidere con la velocità angolare.
40
(4.3)
Questo risultato valido per oggetti unidimensionali semplifica notevolmente l’integrazione del sistema rispetto al caso generico del corpo
rigido.
4.1.2
Corpo rigido
Definiamo con A la matrice di rotazione che identifica la posizione
del corpo (degli assi principali d’inerzia) rispetto agli assi del sistema
esterno (una trattazione analoga può essere fatta indifferentemente
per il quaternione).
La matrice A permette di trasportare qualsiasi vettore dal riferimento
esterno a quello solidale (accentato)
~ω ′ = A~ω
~ ′ = AL
~
L
e
(4.4)
ricordiamo inoltre che
~ = J ~ω
L
(4.5)
dove J rappresenta la matrice d’inerzia riferita agli assi del laboratorio
legata alla matrice d’inerzia degli assi principali J′ dalla relazione
J = A † J′ A
(4.6)
Descriveremo la dinamica del corpo rigido dall’evoluzione delle grandezze
A e ~ω per le quali ricaviamo le variazioni temporali.
Ȧ = ~ω × A
(4.7)
(il prodotto vettoriale è distribuito sulle colonne della matrice) o in
forma matriciale

0
ωz −ωy
0
ωx 
Ȧ = Ω · A dove Ω =  −ωz
ωy −ωx
0

(4.8)
~˙ = ~τ
L
(4.9)
Dalla meccanica sappiamo che
41
dove τ rappresenta il momento delle forze totale.
Accoppiando le equazioni (4.8) e (4.9) si ottiene il sistema di equazioni
di Eulero per il moto del corpo rigido.
Nel metodo di impronta leapfrog-like di Fincham [13] l’algoritmo è
strutturato

h
h
~
~

L(t) = L(t − 2 ) + 2 ~τ (t)


A(t + h) = A(t) + hȦ(t +
(4.10)
h
)
2
Rimandando all’Appendice B per i dettagli, osserviamo nel sistema
(4.10):
• la seconda equazione deve essere risolta iterativamente poichè,
come si osserva in (4.7) e confermemente alle caratteristiche
dei moti rotazionali, la derivata temporale della posizione ha
dipendenza posizionale.
• essa deve inoltre poter garantire la rigidità del corpo conservando
la ortonormalità di A.
4.2
Algoritmo per il pendolo sferico
Il sistema (4.10) si semplifica notevolmente se si passa al caso degenere
dell’asta (o pendolo sferico). La relazione (4.3) premette di tradurre
~ in una equazione per ~ω e, paralimmediatamente l’equazione per L
lelamente ad un aggiornamento di tale vettore, si provvederà ad ogni
passo d’integrazione all’avanzamento del vettore ê.
Il sistema da integrare è il seguente

˙

ê = ~ω × ê
(4.11)

˙
~ω = ~τ (~ω , ê)
dove ~τ = ê × f~(ê, w)
~ rappresenta il momento totale delle forze agenti1 .
1
sono incluse anche le forze vincolari lungo l’asta qualora sia imperniata
(pendolo) o connessa ad altre aste (catena).
42
L’integrazione sarà portata ad un ordine di errore h3 e garantirà implicitamente la conservazione di kê(t)k tramite un avanzamento
compiuto con rotazioni sul piano ortogonale a ω
~.
4.2.1
Integratore al 2o Ordine
Procediamo con lo sviluppo di Taylor per un incremento h del vettore
e (per semplicità si omette il cappelletto)
h2
ė(t) + o(h3 ) =
2
h2
e(t) + h(ω(t) × e(t)) + [ω̇ × e + ω × (ω × e)] + o(h3 )
2
(4.12)
e(t + h) = e(t) + hė(t) +
Se ω è costante, il moto rotazionale uniforme di ê si integra facilmente nel modo (vedi Capitolo 2)
e(t) = qω,α(t) e0 q̄ω,α(t) = q(ω,2α(t)) e0
(4.13)
Alla seconda identità si giunge sfruttando l’ortogonalità di ê e ~ω e
usando la forma ridotta (1.10).
Dato l’incremento h definiamo il quaternione che compie la rotazione
q(ω, h) = cos α + ω̂ sin α con α = |ω|h
(4.14)
L’equazione (4.13) si discretizza perciò
e(t + h) = q(ω, h)e(t)
(4.15)
Proseguiamo l’analisi intoducendo l’esponenziale ottenuto dallo sviluppo di seni e coseni e le parentesi di Poisson per l’operatore quaternionale che, come sappiamo, non commuta.
Si dimostra che
h
h
ωh
ωh
ωh
q(ω, ) ê q̄(ω, ) = exp
ê exp −
= exp [ , · ]ê
2
2
2
2
2
(4.16)
Si ottiene che
h
h
h
h
e(t + h) = exp [( )ω(t + )] e(t) exp [−( )ω(t + )] + o(h3 ) (4.17)
2
2
2
2
43
t
t+h/2
t+h
t
t+h/2
t+h
t
t+h/2
t+h
e
ω
τ
Figura 4.2: Evoluzione della posizione e, velocità angolare ω e momento delle forze τ all’interno del passo di integrazione ordine 2. Le
frecce indicano il calcolo a partire da grandezze note (in grigio).
coincide con lo sviluppo di ê al secondo ordine scritto in (4.12).
Per completare l’algoritmo è necessario aggiornare ω al tempo t + h
secondo uno schema leapfrog-like
h
h
h
h
ω(t+h) = ω(t)+hτ (t+ ) dove τ (t+ ) = e(t+ )×f (t+ ) (4.18)
2
2
2
2
L’algoritmo, utilizzando la forma ridotta
2
si compone perciò di un
passo intermedio (midstep)

h
h
∗

ω (t + 2 ) = ω(t) + 2 τ (t)
(4.19)

 ∗
e (t + h2 ) = q(ω(t), h2 ) e(t)
e di un passo completo (fullstep)

h
∗
3

ω(t + h) = ω(t) + hτ (t + 2 ) + o(h )
(4.20)


e(t + h) = q(ω ∗ (t + h2 ), h) e(t) + o(h3 )
Il passo di integrazione per l’ordine 2 è schematizzato in Figura 4.2.
4.2.2
Integratore al 3o Ordine
Per passare ad ordini superiori si espande lo sviluppo (4.12) in
e(t + h) = e(t) + hė(t) +
h2
h3 ...
e (t) + o(h4 )
ë(t) +
2
6
2
(4.21)
Con la discretizzazione dell’evoluzione temporale si perde in linea di principio
l’ortogonalità tra ê(t) e ω(t + h2 ) che non sono più simultanei. L’errore che si
commette risulta comunque largamente inferiore alla precisione raggiunta.
44
e si suddivide il passo h in opportuni avanzamenti parziali per ω e
rotazioni concatenate per ê che mantengono la unitarietà della trasformazione.
Il passo completo è dato da

h ∗
h
h
h
2h
4

e(t + h) = q[ω(t) + 3 τ (t + 2 ), 3 ] q[ω(t) + 4 τ (t), 3 ] e(t) + o(h )


ω(t + h) = ω(t) +
3h ∗
τ (t
4
+
2h
)
3
+ h4 τ (t) + o(h4 )
(4.22)
dove il termine τ ∗ (t + h2 ) deve essere fornito all’ordine o(h2 ) tramite
) deve essere fornito all’ordine o(h3 )
midstep mentre il termine τ ∗ (t+ 2h
3
tramite un fullstep relativo al passo
2h
.
3
L’evoluzione e(t) −→ e(t + h) al terzo ordine comporta un totale di 4
cicli.
4.3
Catena di pendoli sferici
Il moto di una catena composta da N pendoli è integrabile come il
moto di N pendoli indipendenti a patto di conoscere le forze vincolari
che si trasmettono lungo la stessa.
Tali forze si estraggono risovendo un sistema che imponga che il moto relativo di due masse contigue sia puramente rotazionale (velocità
tangente all’asta che le connette e accelerazione solo centripeta).
Le forze vincolari possono trasmettersi solo lungo le aste,
~ i = φi êi
φ
L’accelerazione della massa mi vale perciò
~ai = F~itot = f~i + φi êi − φi−1~ei−1
(4.23)
dove f~i sono le forze sterne e F~itot le forze totali.
Affinchè l’accelerazione relativa sia solo centripeta deve valere
êi · (~ai+1 − ~ai ) = − (~vi+1 − ~vi )2 = − ω~i 2
45
(4.24)
Inserendo (4.23) in (4.24) si ricava il sistema lineare tridiagonale
φi−1 (êi êi−1 ) − 2φi + φi+1 (êi êi+1 ) = − êi (f~i+1 − f~i ) − ω~i 2
(4.25)
dove il termine a destra è noto.
Il sistema 4.25 permette di ottenere i coefficienti delle forze vincolari
φi e conseguentemente le forze totali Fitot (esterne + vincolari) agenti
su ogni massa mi .
I momenti delle forze τi da introdurre nei sistemi 4.20 (2o ordine) o
4.22 (3o ordine) sono ricavati
tot
τi = êi × (Fi+1
− Fitot )
(4.26)
Il calcolo dei momenti τi , essendo essi una funzione di ei e ωi , va
compiuto separatamente all’interno di un ciclo di integrazione ogni
qual volta sia necessario, ad esempio
h
h
h
τ (t + ) = τ [e(t + ), ω(t + )].
2
2
2
Data perciò una catena di N aste, si integrano indipendentemente
i moti relativi di ogni massa mi rispetto alla precedente mi−1


e˙i = ωi × ei
(4.27)


ω̇i = τi (ω1...N , e1...N )
la posizione assoluta del punto i-esimo al tempo t è data da
~ i (t) =
R
i−1
X
êi (t)
j=0
e la sua velocità
~vi (t) = ~vi−1 (t) + ~ωi (t) × êi (t)
Ricordiamo che l’ordine dell’errore di integrazione è riferito ai vet~
tori locali ê e non alle posizioni globali R.
Lo stesso vale per le velocità locali (angolari) ~ω e globali ~v .
46
10
h = 0.004
-7
∆E
E
h = 0.002
10
-8
h = 0.001
-9
10
h = 0.0005
0
20
40
tempo
60
80
100
Figura 4.3: Deriva energetica per l’integraore al 3o ordine nel caso
del pendolo semplice (N=1) con differenti passi di integrazione h. In
ordinata in scala logaritmica lo scarto energetico relativo.
4.4
Test al calcolatore
Per la programmazione si è fatto uso del linguaggio C + + che dispone
dell’utilizzo di classi sulle quali strutturare l’algebra voluta (composizione di quaternioni e vettori).
Sono stati compiuti ripetuti test sull’integratore per verificare e confrontare la stabilità al variare del passo h (Figura 4.3), dello schema
di integrazione (Figura 4.5) e del numero di aste (Figura 4.4 e 4.6).
È stato sperimentato in aggiunta un algoritmo che prevede la modulazione del passo di integrazione in relazione al crescere della cinetica
del sistema (come riferimento si prende max(ω~i ) ad ogni passo) in modo da mantenere la raffinatezza di integrazione consona all’ incremento
delle velocità delle aste (vedi Figura 4.7).
4.4.1
Risultati
Gli esperimenti di ripiegamento della proteina (Capitolo 6) prevedono
un’ analisi statistica fatta su di un gran numero di simulazioni (metodo MonteCarlo).
La scelta dello schema e del passo di integrazione è perciò fatta anche
47
6×10
-5
∆E
E
N=4
4×10
2×10
-5
-5
N=3
N=2
0
50
N=1
60
70
80
90
100
tempo
Figura 4.4: Deriva energetica dell’integratore ordine 3 con h = 0.005
per una catena di N pendoli. In ordinata lo scarto energetico relativo.
1e-06
∆E
E
1e-08
1e-10
1e-12
1,0e-03
1,0e-04
h
Figura 4.5: Deriva energetica per gli integratori ordine 2 (linea a punti)
e 3 (linea tratto-punto) in relazione alla riduzione del passo h. In
ordinata l’errore relativo massimo a t = 100.
48
1e-04
∆E
E
1e-05
1e-06
0
2
4
8
6
10
N
Figura 4.6: Deriva energetica dell’integratore ordine 3 con h = 0.005 al
variare del numero N di aste. In ordinata lo scarto energetico relativo
massimo a t = 100 in scala logaritmica.
5. .10-5
∆E
E
ordine 3
0
ordine 2
h modulato
-5
-5. 10
ordine 2
-1 .10
0
10
20
tempo
30
-4
40
Figura 4.7: Deriva energetica per una catena di 50 pendoli con differenti schemi di integrazione. In nero lo schema con passo h modulato
al variare di ωmax . Nella configurazione iniziale la catena è orizzontale, acquistando velocità si ha (t = 30s) lo shock cinetico del ”colpo
di frusta“ sull’ultimo elemento della catena. L’integratore ordine 3
reagisce meglio dell’ ordine 2 con h modulato. In ordinata lo scarto
relativo.
49
in relazione alla velocità di calcolo.
Il tempo macchina 3 richiesto per l’evoluzione del moto di una catena di 10 pendoli fino a t = 100 per l’integratore ordine 3 con passo
h = 0.005 è di circa 5 secondi.
Vale a dire che il tempo necessario per un singolo passo è di circa
2.5 · 10−4 secondi.
L’integratore al terzo ordine compie quattro cicli interni per passo
mentre al secondo ordine solamente due (full-step e mid-step). Perciò
nel caso del pendolo (campo costante) il tempo di calcolo cresce linearmente con il numero di aste coinvolte raddoppiandosi se si passa
dal secondo al terzo ordine.
Nel modello della proteina verranno introdotte interazioni a coppie; di
conseguenza la misura delle distanze reciproche fa sı̀ che il tempo di
calcolo cresca come ∼ N 2 . Per economizzare i processi, dato il veloce
decadimento a zero del potenziale a lungo range, verrà eseguito un
cut-off compatibile con la dinamica.
Nel prossimo Capitolo verrà descritta inoltre la procedura di integrazione adottata in presenza di contributi stocastici che simulino la
presenza di un bagno termico.
3
processore PentiumIII 866M Hz
50
Capitolo 5
Modello per la proteina
5.1
Introduzione
La difficoltà nella costruzione di un modello per la proteina sta nel
definire un set di potenziali che colga gli aspetti salienti della dinamica con l’introduzione del minor numero di parametri.
Gran parte dei modelli off-lattice, ossia al continuo, interpretano le
interazioni come forze che intervengono tra coppie di amminoacidi.
La proteina è schematizzata come una catena di punti identificabili
con i residui Cα dove si considera concentrata la massa dell’amminoacido (considerata costante e unitaria).
Le catene laterali R non sono prese in considerazione; quello che rimane è perciò la spina dorsale (backbone) del filamento formata dai
legami peptidici.
Una ulteriore semplificazione si attua restringendo la varietà delle classi di apparteneza degli amminoacidi coinvolti rispetto alle 20 presenti
nel mondo organico.
La trattazione più semplice è probabilmente quella fatta nel modello
H-P dove gli amminoacidi sono divisi in due tipologie in base alla loro
tendenza idrofobica (H) o polare (P).
Stillinger su questo schema ha costruito un modello minimale (toymodel ) dove i residui si muovono in uno spazio bidimensionale [23].
Il modello Thirumalai-Honeycutt [18], al quale fa riferimento questo
lavoro, coinvolge tre classi di amminoacidi: idrofobici (B), idrofilici (L)
51
Figura 5.1: Rappresentazione del filamento di proteasi del Virus HIV.
Immagine tratta dal sito web del dipartimento di Chimica, Università
del Wisconsin.
e neutri (N); le sequenze sono espressa perciò in codici di tre lettere.
5.2
Potenziali
Nella Sezione 1.3 sono state elencate le principali forze che agiscono
nella fisica della proteina e che ora vanno tradotte in potenziali per il
modello.
Il legame peptidico presente tra residui contigui è già rappresentato
dalle forze vincolari del modello a catena che conserva le distanze.
Nei modelli ad approccio atomico tale legame è simulato con potenziali armonici quadratici e quartici ad alta frequenza.
Schematizziamo i restanti potenziali ricordando che chiarificazioni riguardo a dimensionalità e unità di misura verranno fornite nel prossimo
Capitolo (Sezione 6.2.2). Per chiarezza riportiamo in anticipo i valori
delle unità riportate sui grafici che seguono; l’energia (i potenziali V )
è espressa in unità energetiche ε ≃ 9600J/mol; le distanze sono in
52
unità metriche a ≃ 4Å corrispondente alla distanza tra elementi del
filamento; il tempo è in unità τ ≃ 1ps.
Angolo di legame Tra due segmenti contigui di catena, ossia tra i
residui i - i+2, poniamo una molla armonica ideale che a riposo forma
un angolo θ0 = 105o fra i segmenti.
p
1
(5.1)
Vθ = Kθ (d − d0 )2 con d0 = 2 − 2 cos θ0
2
La costante Kθ = 20ε/rad2 dove ε rappresenta l’unità energetica
del sistema. Questa interzione è quantitativamente la più intensa
ed è temporalmente la prima ad intervenire nel processo di folding
inducendo la formazione locale di “strisce a zig-zag”.
Angolo diedrale Tre segmenti contigui individuano due piani fra i
quali definiamo l’ angolo diedrale φ il cui potenziale
Vφ = A(1 + cos φ) + B(1 + cos 3φ)
(5.2)
ha un minimo principale (trans) e due minimi transienti (gauche)(vedi
Figura 5.2).
L’angolo φ rappresenta la rotazione attorno all’asse del legame peptidico che connette due amminoacidi.
Le costanti sono fissate A = B = 1.2ε eccetto nel caso in cui siano
presenti due o più residui neutri nel qual caso A = 0, B = 0.2ε;
questo induce la formazione di tornanti (turn regions) che separano
due β-sheet dando luogo alle tipica struttura a forcina (vedi prossimo
Capitolo).
Potenziale Lennard-Jones Per esprimere le interazioni a lungo
range viene utilizzato un potenziale che schematizza una forte repulsione idrofobica a stretta vicinanza e una debole attrazione che decade
rapidamente con la distanza.
Il potenziale Lennard-Jones caratterizza di per se una comune tipologia di modelli molecolari interpretando in modo soddisfacente le tipiche
53
V
minimo principale
0
90
minimi transienti
180
270
φ
360
Figura 5.2: Potenziale relativo all’angolo diedrale; la linea tratteggiata
corrisponde al potenziale in presenza di due o più residui N. (la scala
energetica non è riportata).
peculiarità delle interazioni a coppie 1 .
Sappiamo dalla fisica organica che le semplici interazioni a due corpi
sono limitanti; del resto, al livello descrittivo di questo modello, esse
danno una descrizione fisica ragionevolmente buona; le interazioni a
tre o più corpi, inoltre, sono raramente utilizzate in Dinamica Molecolare per il loro alto costo in termini di tempo di calcolo.
Il potenziale Lennard-Jones è correntemente definito
1
1
VLJ = 4εS1 12 − S2 6
r
r
(5.3)
dove le costanti introdotte ponderano l’ omofilia delle tre classi:
• S1 = S2 = 1 per l’interazione B-B
• S1 = 2/3, S2 = −1 per le interazioni L-L e L-B
• S1 = 1 , S2 = 0 per tutte le interazioni che coinvolgono residui
N
1
Gli studi (Bobetic Baker Maitland Smith, 1971) effettuati su una grande base
di dati sperimentali (scattering, spettroscopia, proprietà dello stato solido ...) hanno permesso di estrarre la curva del tipico potenziale a coppie tra elementi atomici
(Potenziale BBMS studiato per atomi di Argon).
54
300
V
N-X
200
100
0
L-L
B-B
0,8
1
1,2
r
1,4
Figura 5.3: Potenziale Lennard-Jones. Idrofobi (B), Idrofili (L), Neutri (N), generico (X). In ordinata la grandezza è in unità energetiche
ε, in ascissa in unità metriche a.
L’interazione B-B è l’unica delle tre a possedere una componente attrattiva che, come si vede in Figura 5.3, forma un minimo di potenziale
a r ≃ 0.9.
Questo potenziale è stato modificato con un cut-off smussato a r = 5
per agevolare i processi di calcolo.
In Figura 5.4(b) si osservano i valori dei tre potenziali suddetti nel
corso di una simulazione. Il potenziale Lennard-Jones, che come si può
notare fornisce il contributo energetico inferiore, è in realtà decisivo
nella formazione della struttura terziaria del filamento.
Come è stato discusso nel Capitolo 4, l’integratore scelto per le simulazioni del modello per la proteina è quello ordine 3 con passo h =
0.005.
5.3
Bagno termico
Gli esperimenti sul ripiegamento della proteina sono condotti in presenza di solventi, perlopiù soluzioni acquose a temperatura ambiente
e pH neutro.
Il mezzo polare induce meccanismi di interazione tra coppie di am55
0
∆E
E
3.10 -5
(a)
0
20
40
60
80
(b)
100
6 .10-5
60
40
V
20
0
0
20
40
tempo
60
80
100
Figura 5.4: (a) Deriva energetica dell’integratore ordine 3 per una proteina composta da 22 residui (N=21) in assenza di bagno termico (energia costante). In ordinata lo scarto relativo. (b) Potenziali dell’angolo di legame (nero), angolo diedrale (blu), Lennard-Jones (rosso).
Passo h = 0.005. In ordinata l’energia in unità ε. In entrambi i
grafici il tempo in unità τ .
minoacidi che sono già state inclusi nel modello tramite il potenziale
Lennard-Jones.
Resta da considerare il contributo termodinamico del solvente che
schematizzi gli urti tra molecole d’acqua ed elementi del filamento.
In gran parte delle simulazioni di dinamica molecolare il bagno termico viene schematizzato con la cosiddetta dinamica di Langevin per il
limite di bassa frizione o dinamica browniana [25].
Utilizzeremo per la catene di residui l’analoga procedura che si applica
per insiemi di molecole libere (non soggette a vincoli rigidi) dopo aver
apportato alcune modifiche ed averne verificato la validità.
5.3.1
Dinamica di Langevin
Su di una particella immersa in un liquido agiscono una forza di
frizione (damping) e una forza dipendente da una variabile stocastica (rumore).
La rappresentazione più semplice nel limite di bassa frizione è espressa
56
(caso unidimensionale)


ẋ = v


(5.4)
v̇ = f (x, v, t) − γ v + ξ
dove f è il campo di forze noto, γ è il parametro d’attrito nella formulazione di Stokes, ξ è una variabile stocastica con una distribuzione a
media nulla
hξ(t)i = 0
(5.5)
e funzione di correlazione proporzionale alla funzione δ.
hξ(t)ξ(t′)i = q 2 δ(t − t′ )
(5.6)
ξ è detta anche forza di Langevin o, date le condizioni 5.5 e 5.6, rumore bianco.
Il sistema 5.4 si traduce nella equazione di Fokker-Planck per la
funzione di distribuzione ρ(v, t) che indica la probabilità di trovare
una velocità compresa nell’intervallo (v, v + dv).
∂(vρ)
∂2ρ
∂ρ
=γ
+ 2q 2 2
∂t
∂v
∂v
La soluzione dell’eq. 5.7 nel caso stazionario
(5.7)
∂ρ
∂t
= 0 ci dà la dis-
tribuzione di velocità ρ(v) all’equilibrio termico.
La media quadratica della velocità vale
hv 2i =
q2
2γ
e per il teorema di equipartizione
1 q2
1
1
= kT
(5.8)
hEi = mhv 2 i = m
2
2 2γ
2
Questo risultato, estendibile al caso tridimensionale, mette in relazione
i parametri γ e q con la temperatura T (la costante di Boltzmann k è
assorbita nella grandezza T ).
q2
(5.9)
2γ
Ancora una volta, dettagli sulle dimensionalità e le unità di misura
T =
della simulazione verrano esposti nel prossimo Capitolo.
57
5.3.2
Dinamica di Langevin all’interno dell’algoritmo
La dinamica del sistema è quindi composta da una parte deterministica (Lagrangiana) e da una parte stocastica rappresentata dagli urti
casuali (browniani).
Per integrare quest’ultima si traduce l’impatto casuale delle molecole
del solvente in un impulso (kick) che modifica istantaneamente le variabili dinamiche ~ωi al termine di ogni passo.
Le forze stocastiche ξ~ dell’eq. 5.4 (esteso al caso 3D) sono generate
alla fine del ciclo di integrazione Lagrangiano descritto nella Sezione
4.2.
Per la compatibilità vincolare le forze ξ~ sono trasformate in momenti delle forze con una procedura simile a quella descritta in 4.3 con
la differenza che sono escluse dall’eq. 4.25 le componenti inerziali ~ωi2
poichè esse non svolgono funzione in una interazione istantanea.
Il sistema tridiagonale si traduce in
φi−1 (êi êi−1 ) − 2φi + φi+1 (êi êi+1 ) = − êi (f~i+1 − f~i )
(5.10)
e da qui, in analogia con 4.25, estraiamo i momenti delle forze ~τR .
Le velocità angolari ωi vengono cosı̀ aggiornate con la sostituzione
~ω −→ ~ω +
√
h~τR
(5.11)
dove i vettori ~τR sono i momenti random la cui interazione, seguendo
√
l’analogia con la dinamica browniana, è pesata dal coefficiente h.
5.3.3
Test termodinamico
Per validare l’interpretazione dinamica che si è data al bagno termico
e verificare la consistenza della simulazione dal punto di vista termodinamico e statistico eseguiamo una prova di moto browniano.
Dopo aver ”spento” tutti i potenziali (angolare, diedrale, LennardJones), un filamento di polimero (N=21) è lasciato evolvere sotto
l’azione degli urti e della frizione del solvente.
58
20
(a)
15
<K> 10
5
0
0
0,1
0,2
T
0,3
0,4
0,5
2
(b)
1,5
ρ
1
0,5
0
0
1
0,5
1,5
||v||
Figura 5.5: (a) Valori dell’energia cinetica media per un filamento di
N=21 aste all’equilibrio termodinamico sotto la unica azione del bagno
termico (urti+frizione); in grassetto la retta hK(T )i = 2N2+3 kb T . K e
T sono espresse in unità energetiche ε. (b) Relativa distribuzione delle
velocità (modulo) di un singolo
2 elemento del filamento; in grassetto la
v
4πv2
. In ascissa la velocità è espressa in
curva ρ(v) = (3πT )3/2 exp − 3T
a · τ −1 .
59
Dopo un breve intervallo di termalizzazione, il sistema raggiunge l’equilibrio con l’ambiente con una energia che oscilla intorno al valore
medio hK(T )i.
Come si vede in Figura 5.5 l’andamento di hK(T )i è ben descritto
dalla retta
Ng
2N + 3
kb T =
kb T
(5.12)
2
2
dove Ng rappresenta il numero di gradi di libertà della catena (2 gradi
hK(T )i =
di rotazione per ogni asta più 3 gradi di traslazione per il centro di
massa) in accordo con la legge di equipartizione per sistemi in equilibrio.
Una ulteriore verifica si ha sulla distribuzione maxwelliana delle velocità per un singolo elemento della catena. Come si osserva in Figura
5.5, l’istogramma dei dati raccolti riproduce la curva
4πv 2
v2
ρ(v) =
exp −
(3πT )3/2
3T
(5.13)
di una particella che, in presenza di vincolo, possiede 2 gradi di libertà.
5.4
Similarità χ
Il problema del ripiegamento della proteina esamina il nesso esistente
tra la sequenza di residui assegnata (struttura primaria) e il raggiungimento di una configurazione tridimensionale di equilibrio (struttura
terziaria).
Per questa analisi è utile costruire una funzione che valuti il grado di
similarità tra la configurazione raggiunta e lo stato nativo relativo alla
sequenza.
Affinchè la similarità sia invariante per rotazione, le variabili in gioco
sono le distanze inter-residuali rij .
Definiamo la distanza configurazionale [28]:
n−2 X
n
X
2
χ=1−
Θ(ǫ − |rij − rijN |)
2 + n(n − 3) i=1 j=i+2
(5.14)
dove n è il numero di residui, rijN sono le distanze inter-residuali dello
stato nativo, Θ è la funzione a gradino di Heaviside e il parametro ǫ
60
1
χ
0,8
0,6
0,4
0,2
0
0
20
40
tempo
60
80
100
Figura 5.6: χ(t) durante un processo di folding per un filamento di
21 elementi a T=0.1. A t ≃ 70 viene stabilmente raggiunta la configurazione di stato nativo. Il tempo in ascissa è espresso in unità
temporali τ .
(fissato a 0.2) fa si che si trascurino piccole oscillazioni intorno allo
stato nativo sotto l’azione del bagno termico.
Il fattore
2
2+n(n−3)
normalizza il conteggio delle sommatorie sul numero
di coppie esaminate (sono escluse le coppie di residui contigui), cosicchè χ = 0 corrisponde ad una struttura perfettamente coincidente
mentre per χ & 0.8 si ha una struttura del tutto dissimile.
In Figura 5.6 si osserva l’evoluzione temporale di χ durante un processo di folding.
61
62
Capitolo 6
Simulazioni e risultati
6.1
Ipotesi teoriche sul protein folding
Gli esperimenti compiuti sul ripiegamento della proteina sono condotti
attraverso la denaturazione della proteina (alterazioni dell’ambiente,
tipicamente innalazamento della temperatura) e studiano il ripristino
spontaneo della struttura terziaria e delle relative attività enzimatiche
[2].
Ciò conduce all’ipotesi che il ripiegamento del filamento polimerico sia
un processo termodinamico particolarmente delicato e che per la sua
completa comprensione sia necessaria una visione globale del panorama energetico del sistema.
La cosiddetta ipotesi termodinamica afferma che la struttura tridimensionale a cui si giunge al termine del ripiegamento (stato nativo) è
quella corrispondente al minimo assoluto dell’energia libera di Gibbs.
Si delinea cosı́ la visione di un profilo energetico a imbuto (funnel landscape) in cui ogni cammino dinamico conduce rapidamente al minimo
suddetto senza che il sistema rimanga intrappolato negli stati metastabili dei minimi locali.
L’approccio cinematico delle simulazioni , d’altra parte, suggerisce la
presenza di barriere energetiche che ostacolano il percorso del sistema
nella ricerca dello stato nativo.
A riguardo, Levinthal [29] stabilisce su base teorica che il tempo per
la ricerca casuale cinematica dello stato di minima energia libera da
63
parte di filamenti anche di moderate dimensioni cresce smisuratamente
e incompatibilmente con i tempi biologici (ordine che va dal millisecondo al secondo).
Per risolvere questo paradosso l’intricato e multidimensionale panorama energetico dovrebbe essere caratterizzato da un numero ridottissimo di cammini preferenziali (pathways) che incanalano il sistema
direttamente verso la stato nativo evitando una lunga ricerca casuale.
Thirumalai [18] avanza una seconda ipotesi sulla base dell’approccio
cinematico.
L’ ipotesi metastabile presuppone la presenza di una regione localizzata di minimi energeticamente distinti, ma configurazionalmente
prossimi allo stato nativo.
Tali minimi metastabili sono confinati da tenui barriere di potenziali
che non precludono occasionali transizioni all’interno della regione.
In questo modo il sistema, una volta concluso il ripiegamento, evolve
visitando statisticamente minimi energeticamente differenti, ma che
conservano un forte carattere di similarità con lo stato nativo.
Ciò equivale a dire che da uno stato denaturato (non ripiegato, random
coil) esistono molteplici cammini che conducono a una zona metastabile pseudo-nativa.
6.2
Simulazione
Come è stato detto nel Capitolo 1, per un approccio cinematicamente
controllato del protein folding sono state adottate diverse metodologie
di simulazione mirate a gettare luce sui diversi aspetti del problema.
Il modello tridimensionale off-lattice di Honeycutt & Thirumalai, ricostruito in questa tesi, è stato utilizzato per svariati tipi di ricerca
sulle correlazioni tra i parametri di ingresso nella simulazione (tipologia e coefficienti delle interazioni, metodo di codifica e assegnazione
della sequenza di amminoacidi, procedura termodinamica e coeffiecienti per il bagno termico, etc..) e valori ricavati all’uscita (configu64
razione, frequenza e stabilità dei minimi visitati, tempi di rilassamento, similarità χ con lo stato nativo, panorami energetici, etc..).
Con l’analisi statistica elaborata su di un gran numero di simulazioni
indipendenti (metodo MonteCarlo) è possibile cosı̀ evidenziare le influenze che hanno sul processo, ad esempio, le caratteristiche del solvente [35], le mutazioni nella sequenza primaria [20] o la parametrizzazione dei potenziali [33] [34] e avanzare ipotesi sulla dinamica soggiacente: carattere diffusivo del moto [32], contrapposizione (frustrazione) tra ordine locale e globale della configurazione [30] [31], distinzione fra sequenze relative a buoni o cattivi ripegatori.
In questo lavoro si é focalizzata l’attenzione sulla ricerca
dei minimi dell’energia meccanica del sistema per una sequenza associata ad un presumibile buon ripiegatore tramite
un metodo MonteCarlo con simulazioni in un bagno termico
a temperatura costante.
Le posizioni di equilibrio raggiunte a seguito del ripiegamento sono
state archiviate in registri di variabili a cui può avere accesso un programma di visualizzazione della struttura (vedi Figura 6.1).
Tramite un’ analisi con ripetute simulazioni indipendenti, ad ogni minimo è stata associata una probabilità o popolazione; in una ideale rappresentazione del panorama energetico ad un minimo molto popolato
dovrebbe corrispondere un bacino di attrazione ampio a cui converge
un gran numero di cammini e una buca di potenziale profonda che
imprigioni stabilmente il sistema.
6.2.1
Sequenza
Studi condotti sull’accessibilità cinetica dei minimi e sulla loro stabilità
[36] mostrano come queste si rivelino ben correlabili al parametro σ
65
Figura 6.1: Configurazioni di equilibrio raggiunte al termine della
simulazione
definito
Tθ − TF
0<σ<1
(6.1)
Tθ
dove Tθ e TF rappresentano la temperatura del bagno sotto alla quale
σ=
statisticamente avvengono rispettivamente il collasso e il ripiegamento.
A piccoli valori di σ corrispondono ripiegatori veloci con un bacino
d’attrazione dominante (Native Basin of Attraction) ossia buoni ripiegatori, mentre ad alti valori di σ corrispondono sequenze con molte
trappole cinetiche (minimi locali o Competing Basin of Attraction).
La sequenza utilizzata principalmente in queste simulazioni, denominata Beta21, è costituita da 22 elementi residuali (21 aste che rappresentano i legami peptidici tra gli amminoacidi) il cui codice a tre
lettere è riportato in Figura 6.2.
Lo stato nativo di Beta21 è la caratteristica β-sheet che rappresenta il
ricorrente elemento topologico della struttura secondaria (vedi Capitolo 1). I due residui neutri al centro della sequenza favoriscono, tramite
il potenziale diedrale (5.2), la formazione del cardine nella struttura
a forcina; l’attrazione idrofobica induce le due metà del filamento a
porsi parallelamente.
Per Beta21 si ha σ = 0.14, indice di un buon ripiegatore [36].
A titolo di confronto è stato esaminato anche il tipico prototipo di
cattivo ripiegatore costituito da una catena completamente idrofobica
(Figura 6.2 c ).
66
Figura 6.2:
(a) La configurazione dello stato nativo
per Beta21 è una β-sheet.
Il codice della sequenza è
LBNBBBLBBBNNBBLBLBBBLB = (LB)N(B)3 L(B)3 (N)2 B(BL)2 (B)3 (LB)
dove alle lettere B, L, N corrispondono residui idrofobici (rosso),
idrofilici (blu) e neutri (bianco). (b) La configurazione dello stato nativo per Beta45 è una β-sheet tripla. (c) La sequenza completamente
idrofobica (B)21 è un esempio di cattivo ripiegatore.
67
6.2.2
Dimensionalità
Nello sviluppo del modello e nel corso della simulazione, tutte le
grandezze sono state espresse in unità di misura ridotte.
Con semplici riscalature queste possono essere ricondotte a tre unità
di base [37]: massa M, lunghezza a ed energia ε .
M rappresenta la massa molecolare media per un amminoacido (vedi
Tabella 1.3) uguale a 110 g/mol; a è la distanza inter-residuale media
uguale a 3.8 Å; ε = 2.3 kcal/mol = 9628 J/mol è l’unità di misura
energetica con la quale sono espressi i valori sui grafici.
p
Consistentemente l’unità di tempo ridotta τ = ε/Ma2 corrisponde
approssimativamente ad 1 ps.
La temperatura, assorbendo la costante k di Boltzmann, è espressa in
unità di energia T ∗ = kT /ε .
I tempi di folding ottenuti per le simulazioni isoterme risultano di gran
lunga più brevi rispetto a quelli reali (& ms). Ciò è dovuto in parte ai
valori di viscosità del solvente (vedi prossimo Paragrafo) e per il resto
alle macroscopiche semplificazioni adottate nel modello.
6.2.3
Modalità della simulazione
Sono state effettuate diverse serie di simulazioni indipendenti per differenti temperature mantenute costanti.
Le configurazione iniziale è generata associando ad ogni vettore di
partenza êi (t = 0) una direzione casuale nell’ottante (+, +, +) in modo che essa riproduca un filamento steso.
Si osserva che nelle condizioni di temperatura scelte, la proteina Beta21
impiega circa 100τ per termalizzare; l’istantanea della configurazione
di equilibrio raggiunta è presa a t = 200τ insieme al valore del minimo
energetico. Il coefficiente di viscosità del solvente è fissato al valore
γ = 0.05τ −1 che, tradotto in unità reali, dà una frizione circa 10 volte
più intensa di quella dell’acqua a 25oC [22]; ciò riduce i tempi di calcolo, ma non altera sostanzialmente il risultato dell’analisi del processo
di ripiegamento.
68
Con le considerazioni fatte nel Capitolo 4, per l’integrazione della dinamica si adotta l’algoritmo del 3o ordine con un passo di integrazione
h = 0.005τ . Il tempo reale di calcolo per una simulazione è dell’ordine
del minuto1 .
Sono state processate per la sequenza Beta21 tre serie da 1000 simulazioni, rispettivamente alla temperatura T = 0.05, T = 0.10 e
T = 0.15; quest’ultima corrisponde in unità reali all’incirca alla temperatura ambiente.
6.3
6.3.1
Analisi
Classificazione dei minimi
Ogni simulazione fornisce una istantanea della configurazione tridimensionale a t = 200τ e il corrispondente valore del potenziale.
Un algoritmo procede alla classificazione dei minimi in base alla loro
distanza energetica e alla similarità χ.
Due configurazioni C1 C2 sono considerate identiche se la similarità
χ (C1 , C2 ) 6 0.05 e se contemporaneamente i potenziali differiscono
per meno di uno scarto energetico ∆V ≃ ∆K ≃ hKi =
21kb T dove T è la temperatura del bagno.
2N +3
2
kb T ≃
Quest’ultima stima è basata sulla comparabilità numerica esistente fra
le oscillazioni del potenziale V e dell’energia cinetica K per un sistema
in equilibrio oscillante e sulla relazione di equipartizione riportata in
5.12. Le oscillazioni V (t) per un filamento in equilibrio a diverse temperature sono graficate in Figura 6.4.
Naturalmente anche l’ampiezza delle oscillazioni χ(t) variano con T
(Figura 6.3). Il valore costante dello scarto di discriminazione ∆χ =
0.05 è stato scelto in modo non critico considerando che due configuraioni all’interno di questo range di similarità hanno la stessa conformazione tridimensionale, nella fattispecie, gli stessi valori di equilibrio
degli angoli diedrali.
1
processore PentiumIII 866 MHz
69
1
0,8
χ
0,6
0,4
0,2
0
zona metastabile
0
100
50
200
150
250
tempo
Figura 6.3: Fluttuazioni di χ rispetto alla configurazione finale (in
questo caso t = 250τ ) durante simulazioni a T = 0.05 (blu), T = 0.15
(rosso), T = 0.3 (viola); per T = 0.15 la χ oscilla all’interno della
zona metastabile delimitata dalle linee tratteggiate; per T = 0.3 la
temperatura è troppo alta per consentire un corretto ripiegamento, la
proteina si trova in uno stato random coil (filamento caotico).
5
0
fluttuazioni di V
-5
V
-10
-15
-20
50
100
150
200
250
tempo
Figura 6.4: Fluttuazioni di V nelle stesse condizioni del grafico in
Figura 6.3. T = 0.05 (blu), T = 0.15 (rosso), T = 0.3 (viola). Nel
riquadro sono riportati i segmenti di scarto ∆V che verranno utilizzati
come discriminanti per la classificazione dei minimi.
70
6.3.2
Grafici Energia-Popolazione
Con tale procedura di classificazione dei minimi configurazionali raccolti si ottiene cosı̀ uno spettro delle popolazioni per diverse temperature del bagno.
Il grafico in Figura 6.5 è caratterizzato dalla presenza di un picco in
corrispondenza del minimo assoluto dell’ energia meccanica del sistema. La relativa configurazione tridimensioanle visibile in Figura 6.2
corrisponde, come ci si poteva aspettare, alla struttura nativa a forcina della sequenza Beta21.
L’aumento della temperatura da T = 0.05 a T = 0.15 comporta una
sostanziale crescita della popolazione dello stato nativo.
Le oscillazioni dell’energia cinetica all’equilibrio termico per una simulazione a temperatura maggiore crescono in accordo con l’Eq. 5.12
e facilitano lo scavalcamento delle barriere di potenziale che intrappolano il sistema nei minimi locali.
A T = 0.15 notiamo inoltre la comparsa di minimi locali energeticamente prossimi allo stato nativo; per un analisi più approfondita introduciamo nello spettro la distanza configurazionale (similarità) definita
nel Capitolo 5.
6.3.3
Grafici Energia-Similarità-Popolazione
Stabilita l’esistenza di un minimo privilegiato che denominiamo stato
nativo, possiamo estrarre per i minimi locali la loro distanza configurazionale o similarità (vedi 5.4) ottenendo cosı̀ una panoramica ”bidimensionale” dello spettro popolativo di Beta21 (Figure 6.7 e 6.6).
Come si può notare, i minimi enegeticamente prossimi allo stato nativo, evidenziati anche in Figura 6.5, sono allo stesso tempo configurazionalmente simili.
Possiami definire minimi metastabili quelli la cui similarità o distanza
configurazionale con lo stato nativo è compresa tra 0.05 (sotto al quale
la similarità è considerata identità) e 0.1 (arbitrario).
71
30
%
25
Stato nativo
20
minimi metastabili a T=0.15
15
10
5
0
-20
-10
-15
-5
0
V
Figura 6.5: Spettro delle popolazioni per i minimi configurazionali della
sequenza Beta21 per T = 0.05 (blu), T = 0.1 (arancio), T = 0.15
(rosso). In ascissa il valore energetico dell’equilibrio, in ordinata la
popolazione del minimo (con il criterio di classificazione riportato in
6.3.1) su un totale di 1000 simulazioni. Si evidenzia la comparsa di
minimi locali metasatabili (scarto di similarità χ ⊂ [0.05, 0.1], vedi
6.3.3) in prossimità dello stato nativo per T = 0.15. Le configurazioni
di stato nativo per le tre temperature coincidono (χ ≃ 0); lo scarto
energetico è dovuto al contributo termico medio dato al potenziale.
72
0
V
zona metastabile
-5
Stato Nativo
-10
-15
-20
T=0.05
-25
-0,2
0
0,2
0,4
0,6
χ
0,8
Figura 6.6: Spettro energia-similarità-popolazione per i minimi configurazionali a T = 0.05. Il raggio dei cerchi è proporzionale alla popolazione, il simbolo + al centro del cerchio individua il punto (χ, V )
dove χ è la similarità con lo stato nativo, V è l’energia del minimo.
Delimitata da linee tratteggiate la regione entro la quale i minimi locali
sono considerati metastabili. È visibile un minimo metastabile.
0
V
zona metastabile
-5
Stato Nativo
-10
-15
T=0.15
-20
-25
0
0.1
0,2
0,4
0,6
χ
0,8
Figura 6.7: Spettro energia-similarità-popolazione per i minimi
configurazionali a T = 0.15. Sono visibili 3 minimi metstabili
73
-30
-25
-20
-15
-10
V
-5
0
8
%6
4
2
0
V
5
0
-5
-10
-15
-20
-25
-30
-35
zona metastabile
0
0,2
0,4
0,6
χ
0,8
Figura 6.8: Spettro delle popolazioni e spettro energia-similarità per
una serie di simulazioni a T = 0.15 per la sequenza completamente
idrofoba (B)21 . Il minimo energetico assoluto è stato assunto come
stato nativo di riferimento anche se non risulta essere coincidente con
il massimo della popolazione.
Le tre configurazioni metastabili possiedono locali alterazioni sugli angoli diedrali (spesso nel tornante della forcina) che le rendono distinguibili nella classificazione, anche se nelle immagini visibili in Figura
6.9 appaiono sostanzialmente uguali.
Come si osserva in Figura 6.3 le fluttuazioni termiche a T = 0.15 fanno
si che χ oscilli prevalentemente all’interno della regione metastabile.
L’istantanea a t = 200τ fotografa il filamento in una delle sue possibili
permutazioni; la frequenza con la quale ricorre ognuna di esse è correlabile alla permanenza temporale in quella configurazione in accordo con
la teoria di Kramers [38] sulla probabilità di transizione e in qualche
modo ricalca l’ipotesi di metastabilità avanzata da Thirumalai.
6.3.4
Sequenza idrofoba
Per avere un raffronto qualitativo sulla bontà del ripiegatore Beta21 è
stata eseguita una ulteriore serie di simulazioni a T = 0.15 per la sequenza completamente idrofoba (B)21 rappresentata in Figura 6.2(c).
74
Figura 6.9: Configurazioni metastabili a T = 0.15. La differenza energetica è dell’ordine 20 kb T . La mutua similarità è compresa
nell’intervallo [0.05, 0.1].
Gli spettri di popolazione ottenuti riportati in Figura 6.8 delineano la
radicale differenza del panorama energetico fra buono e cattivo ripiegatore e l’assenza per quest’ultimo di una configurazione probabilisticamente dominante.
6.4
Risultati
Una spiegazione teorica riguardo alla dinamica evolutiva del sistema
all’interno del panorama energetico esula dagli obiettivi preliminari di
questo lavoro.
Lo studio presentato in questo ultimo Capitolo inoltre è un’ analisi
meccanica e non termodinamica del processo.
Una distinzione non trascurabile sta nel fatto che la classificazione dei
minimi qui compiuta si basa sull’energia interna e non sull’energia libera di Gibbs a cui fa riferimento l’ipotesi termodinamica discussa nel
Paragrafo 6.1.
Si può comunque pensare che le visioni dello scenario da queste due
ottiche non siano troppo dissimili o comunque complementari. Il fatto
ad esempio che il minimo meccanico assoluto sia anche il più frequente
lo rende identificabile anche come il minimo assoluto dell’energia libera.
Le simulazioni condotte danno risulati in accordo con le aspettative
del modello per quanto riguarda la presenza di una configurazione
preferenziale, ossia l’esistenza di uno stato nativo.
75
beta21
sequenza
idrofoba
T
χ<0.05
χ<0.1
χ>0.7
0.05
18 %
25 %
7%
0.1
25 %
29 %
10 %
0.15
30 %
63 %
11 %
0.15
3%
3%
81 %
Figura 6.10: Percentuale delle simulazioni con Beta21 che al termine del processo (t = 200τ ) sono in una configurazione identica
(χ 6 0.05), molto simile (χ 6 0.1, zona metastabile) o completamente
dissimile (χ > 0.7) allo stato nativo. Nell’ultimo riquadro in grigio
i valori per le simulazioni compiute con la sequenza completamente
idrofoba (B)21 .
Dalla tabella riportata in Figura 6.10 emerge una valutazione quantitativa della bontà del ripiegatore Beta21 tramite le percentuali di
successo nel processo di ripiegamento divise in fasce di similarità in
contrapposizione con quelle per la sequenza idrofoba (B)21 .
Ricordiamo che per ∆χ 6 0.1 due strutture appaiono indistinguibili.
Per quanto riguarda l’aspetto termodinamico della simulazione in questo
lavoro non si è compiuta un’analisi approfondita sulla cruciale influenza della temperatura dell’ ambiente. Osservando i dati nella tabelle
6.10 ci limitiamo a concludere che il processo di ripiegamento appare
molto sensibile al cambio di T indice dell’incidenza di un fattore entropico sulla scelta della configurazione di minimo.
Il valore della temperatura per la quale nelle nostre simulazioni si ha il
più alto successo (T = 0.15 corrispondente circa alla temperatura ambiente) risulta coerente con gli esperimenti reali compiuti sui filamenti.
76
Conclusioni
La modellizzazione della proteina necessita la costruzione di un algoritmo per la dinamica di una catena di punti connessi che identificano
gli amminoacidi.
La struttura semi-rigida di questo oggetto si presta ad essere parametrizzata mediante angoli e la sua dinamica fatta evolvere tramite rotazioni
nello spazio.
L’utilizzo dei quaternioni che si fa all’interno dell’algoritmo proposto
rappresenta il contributo originale dato in questo lavoro di tesi.
La topologia della catena composta di elementi unidimensionali (aste)
fa sı̀ che una completa parametrizzazione in senso quaternionale sia
ridondante; essa potrebbe rivelarsi particolarmente utile per una trattazione degli amminoacidi come corpi rigidi non puntiformi.
Le variabili dinamiche, nel nostro caso, restano i vettori che individuano i segmenti della catena e le relative velocità angolari; i quaternioni intervengono all’interno dello schema producendo l’avanzamento
rotazionale delle posizioni.
Il secondo contributo di questo lavoro nella creazione dell’integratore
sta nel sistema di calcolo delle forze vincolari che si propagano lungo
la catena e la mantengono connessa.
L’integratore è strutturato in modo da raggiungere localmente (sulle
posizioni relative) un errore al terzo ordine preservando implicitamente
le distanze tra elementi contigui.
I test di prova compiuti per il caso di una catena di N pendoli connessi mostrano una deriva energetica lineare dell’ordine di una parte su
centomila dopo un periodo di 100τ con h = 0.005τ (N 6 10). L’errore
cresce linearmente con l’aumento del numero di elementi.
77
I tempi di calcolo in presenza di campo costante crescono linearmente
con N, quadraticamente nel caso di interazioni a coppie per le quali
è necessaria la misura delle distanze reciproche, raddoppiano nel passaggio dal secondo al terzo ordine nello schema di integrazione.
La non triviale introduzione di una componente stocastica nella dinamica (rumore o bagno termico) è gestita sull’impronta della dinamica di Langevin nel limite di bassa frizione.
Opportune modifiche sono apportate nel trasporto della trattazione
dalle variabili cartesiane (x , v ) a quelle della catena (ê, ~ω ).
Come verifica del procedimento i test sul moto browniano di un filamento immerso in un solvente a temperatura costante riproducono con
buona fedeltà le caratteristiche statistiche attese teoricamente (distribuzione maxwelliana delle velocità, equipartizione dell’energia).
Utilizzando tale integratore viene costruito il modello per la proteina.
Gli esperimenti condotti sulla sequenza campione Beta21 rivelano la
presenza di un’alta probabilità di comparsa della caratteristica β-sheet
corrispondente allo stato nativo della sequenza.
Tale probabilità è modulata dalla temperatura del bagno termico.
Ad esempio per una simulazione isoterma a temperatura T = 0.15
(circa la temperatura ambiente) il 30% dei processi di ripiegamento
conducono a configurazioni che differiscono per meno del 5%
2
dallo
stato nativo, il 63% per meno del 10%, solo il 10% per più del 70%.
Per la sequenza (B)21 tipicamente associata ad un cattivo ripiegatore,
identificando lo stato nativo con il minimo energetico assoluto si ottiene che circa il 3% dei processi conducono a strutture che differiscono
per meno del 10%, almeno l’81% per più del 70%.
Il modello che si è costruito dà risultati che confermano l’affidabilità
dell’integratore accoppiato ad una componente stocastica (dinamica
di Langevin) e che si dimostrano coerenti e in linea con le simulazioni
effettuate in altri lavori di ricerca e con gli esperimenti reali.
2
La percentuale è ricavata dalla funzione di similarità χ.
78
Appendice A
Metodo Verlet L’algoritmo rappresenta la soluzione diretta dell’equazione mr̈ = f per la trattazione di moti di oggetti puntiformi.
L’evoluzione della posizione r(t + h) si basa sulla posizione r(t), l’accelerazione a(t) e la posizione r(t − h) del passo precedente
r(t + h) = 2r(t) − r(t − h) + h2 a(t)
(6.2)
Come si può notare la velocità non compaiono poichè sono state eliminate utilizzando lo sviluppo di Taylor
h2
a(t) + ...
2
h2
r(t − h) = r(t) − hv(t) + a(t) − ...
2
r(t + h) = r(t) + hv(t) +
(6.3)
La velocità al tempo corrente v(t) potrebbe essere necessaria per calcolare la traiettoria nel caso di forze dipendenti da essa (magnetiche,
per esempio) o per stimare l’energia cinetica.
Essa può essere ottenuta
v(t) =
r(t + h) − r(t − h)
2h
(6.4)
L’equazione 6.2 è corretta con una stima locale dell’ordine O(h4 ) mentre le velocità lo sono con O(h2 ).
La caratteristica del metodo Verlet è quella di essere centrato; r(t + h)
e r(t − h) giocano un ruolo simmetirco e rendono l’algoritmo tempo-
ralmente reversibile.
Lo schema logico della procedura è illustrato in Figura 6.11.
Leap-frog I limiti del metodo Verlet risiedono nell’imprecisione con
la quale vengono maneggiate le velocità e dalla deriva numerica che
79
t−h
t+h
t
t−h
t
t+h
t−h
t
t+h
r
v
a
Figura 6.11: Schema rappresentativo del metodo Verlet. Nei riquadri
posizione r, velocità v, accelerazione a relative ai tempi t − h, t, t + h.
Le frecce indicano il calcolo a partire da grandezze note (in grigio).
emerge dall’equazione 6.2 dove un piccolo termine dell’ordine h2 è
sommato ad una differenza di grandi termini dell’ordine h0 .
Nel 1970 Hockney propose la variante denominata leap-frog, salto della
rana.
Lo schema si struttura
h
r(t + h) = r(t) + hv(t + )
2
(6.5a)
h
h
v(t + ) = v(t − ) + ha(t)
(6.5b)
2
2
Le grandezze archiviate sono la posizione e l’accelerazione correnti
r(t), a(t) e la velocità v(t − h2 ).
L’equazione 6.5b aggiorna la velocità al semi-passo successivo che
viene utilizzata in 6.5a per il calcolo della nuova posizione.
La velocità corrente può essere calcolata
1
h
h
v(t) = [v(t + ) + v(t − )]
2
2
2
(6.6)
L’eliminazione di v dal sistema 6.5a,6.5b mostra come l’algoritmo sia
algebricamente equivalente al metodo Verlet.
Velocity-Verlet L’equazione 6.6 mostra ancora come la velocità
siano maneggiate in modo non completamente soddisfacente.
Nel 1982 (Swope-Andersen-Berens-Wilson) viene proposta la variante
detta velocity-Verlet
r(t + h) = r(t) + hv(t) +
80
h2
a(t)
2
(6.7a)
t−h
t
t+h
t−h
t
t+h
t−h
t
t+h
r
v
a
Figura 6.12: Schema rappresentativo della variante Leap-frog analogo a quello in Figura 6.11. I riquadri interposti rappresentano le
grandezze ai midstep.
t
t+h/2
t+h
t
t+h/2
t+h
t
t+h/2
t+h
r
v
a
Figura 6.13: Schema rappresentativo della variante Velocity-Verlet.
h
v(t + h) = v(t) + [a(t) + a(t + h)]
(6.7b)
2
Ancora una volta eliminando v ci si riconduce al comune Verlet.
L’algoritmo richiede l’archiviazione di r(t), v(t), a(t) e si svolge in due
tappe 3 .
Da 6.7a la posizione è fatta evolvere a r(t+h) e la velocità al semipasso
è calcolata
h
h
v(t + ) = v(t) + a(t)
2
2
Si ricavano cosı̀ le velocità aggiornate
h
h
v(t + h) = v(t + ) + a(t + h)
2
2
(6.8)
(6.9)
La stabilità numerica di questa variante fa si che essa sia la più utilizzata per opportune simulazioni computazionali.
3
in modo simile all’algoritmo Gear Predictor-Corrector
81
82
Appendice B
Metodo di integrazione quaternionale Considerando il fatto che
non si possono ottenere equazioni prive di singolarità numeriche utilizzando solo 3 variabili (angoli di Eulero, per esempio) Evans [12]
nel 1977 propose l’uso delle 4 variabili quaternionali come coordinate
generalizzate.
Come è stato discusso nel Capitolo 1 il quaternione
q = (q0 , q1 , q2 , q3 )
è soggetto al vincolo
q02 + q12 + q22 + q32 = 1
(6.10)
Riconducendoci ai convenzionali angoli di Eulero, le coordinate qi sono
definite
θ
φ+ψ
cos
2
2
φ−ψ
θ
q0 = sin cos
2
2
θ
φ−ψ
q0 = sin sin
2
2
φ+ψ
θ
q0 = cos sin
2
2
q0 = cos
(6.11)
e soddisfano l’equazione differenziale


q˙0
 q˙1  1 



 q˙2  = 2 
q˙3


0
q0 −q1 −q2 −q3


q1 q0 −q3 q2   ωx
q2 q3
q0 −q1   ωy
ωz
q3 −q2 q1
q0
83




(6.12)
scritta in forma quaternionale
q̇ =
1
q·ω
2
(6.13)
dove ω rappresenta il vettore velocità angolare nel riferimento solidale con il corpo.
Le equazioni 6.12 vanno accoppiate con le equazioni di Eulero per la
dinamica del corpo rigido
τb
ω˙x = x +
Ixx
Iyy − Izz
Ixx
ωx ωz
x→y→z
(6.14)
dove τ b è il momento delle forze nel sistema solidale.
Insieme rappresentano un sistema differenziale al primo ordine risolubile numericamente.
Come abbiamo già detto la dipendenza posizionale della derivata posizionale in 6.12 rende inapplicabile il comune metodo Verlet (vedi
Appendice A); in secondo luogo vi è la questione del mantenimento
del vincolo sulla norma di q.
Una formulazione stile leap-frog per l’integrazione delle equazioni 6.12
e 6.14 è stata avanzata nel 1981 da Fincham [13].

h
h s
~s
~s

L (t) = L (t − 2 ) + 2 τ~ (t)


(6.15)
q(t + h) = q(t) + hq̇(t + h2 )
~ s riferito
dove la prima equazione coinvolge il momento angolare L
al sistema esterno per il quale vale la legge dinamica L̇s = τ s .
Le difficoltà annidate nel sistema 6.15 sono principalmente la necessità
di operare le trasformazioni tra sistema solidale ed esterno
Ls = q Lb q
e tra momento e velocità angolari
ω b = I−1 Lb
dove I è il tensore costante di inerzia nel sistema solidale.
Ciò dà luogo ad una equazione implicita da risolversi iterativamente e
84
con l’ausilio di una estrapolazione4 .
Il vincolo inoltre è preservato forzatamente con una riscalatura delle
coordinate qi al termine di ogni passo di integrazione.
Recentemente [7] Omelyan presenta un metodo di integrazione
dove tale vincolo è preservato implicitamente e che fa uso solo di interpolazioni e non di estrapolazioni.
In modo simile a 6.15 il momento angolare viene fatto avanzare al
semipasso Ls (t + h2 ) quindi si ricava la velocità angolare nel sistema
solidale
h
h
h
ω b (t + ) = I−1 q(t + ) Ls (t + )
2
2
2
(6.16)
L’orientazione aggiornata del corpo si ottiene con una trasformazione ortonormale nello spazio dei quaternioni Q.
h
h
q(t + h) = 1 − ω b (t + )
2
2
−1 h b
h
1 + ω (t + ) q(t)
2
2
(6.17)
dove 1 = (1, 0, 0, 0) e ω b = (0, ωx , ωy , ωz ) nello spazio Q.
Le equazioni 6.16 e 6.17 si risolvono iterativamente considerando che
in 6.16 ci si avvale dell’interpolazione
1
h
q(t + ) = [q(t) + q(t + h)]
2
2
(6.18)
L’algoritmo di Omelyan raggiunge una precisione e una stabilità
confrontabili a quelle ottenute tramite un approccio atomico.
Matrici di rotazione (metodo R-SHAKE) In contrapposizione
con l’utilizzo dei quaternioni o degli angoli di Eulero per i quali la
4
predizione di una variabile ad un tempo avanzato ottenuta con errori di ordine
più basso
85
matrice di rotazione A viene parametrizzata
5

q02 + q12 + q22 + q32
2(q1 q2 − q0 q3 )
2(q1 q3 + q0 q2 )
2(q2 q3 − q0 q1 )  =
A =  2(q1 q2 + q0 q3 ) q02 − q12 + q22 − q32
2
2(q1 q3 − q0 q2 )
2(q2 q3 + q0 q1 )
q0 − q12 − q22 + q32


cos ψ cos φ − cos θ sin φ sin ψ − sin ψ cos φ − cos θ sin φ cos ψ sin θ sin φ
 cos ψ sin φ + cos θ cos φ sin ψ − sin ψ sin φ + cos θ cos φ cos ψ − sin θ cos φ 
sin θ sin ψ
sin θ cos ψ
cos θ
(6.19)

in questo metodo le 6 varaibili indipendenti di A vengono fatte
evolvere direttamente sotto il vincolo
AAT = 1
(6.20)
Scriviamo la Lagrangiana per un corpo rigido rotante
L=
1
T
M
ṙcm ṙcm + T r[ȦIȦ ] − V (A, rcm ) + T r[Λ(AAT − 1)] (6.21)
2
2
dove i primi due termini rappresentano le energie cinetiche traslazionale
e rotazionale, rcm è la posizione del centro di massa, M è la massa
totale, I è il tensore di inerzia, il terzo termine è il potenziale totale e
l’ultimo termine è stato aggiunto per assicurare il mantenimento del
vincolo 6.20 tramite la matrice simmetrica Λ di moltiplicatori di Lagrange (6 condizioni di vincolo).
Per costruire le equazioni del moto definiamo il momento coniugato
(matrice 3 × 3)
Π≡
∂L
∂ Ȧ
= ȦI
(6.22)
Le equazioni di Hamilton risultano
Ȧ = Π · I−1
Π̇ = −∂A V + 2A · Λ
(6.23)
g(A) = AAT − 1 = 0
5
la matrice A trasporta le coordinate dal sistema solidale al sistema esterno
x = Axb .
s
86
A questo punto si applica l’algoritmo R-SHAKE (derivato da SHAKE)
h
h
Π(t + ) = Π(t − ) + h[2A(t)Λ(t) − ∂A(t) V ]
2
2
h
A(t + h) = A(t) + h Π(t + ) · I−1
2
g[A(t + h)] = 0
(6.24)
L’errore locale ad ogni passo di integrazione è dell’ordine O(h3 ).
Con questo metodo il vincolo è imposto forzatamente mentre è sarebbe
possibile [10] costruire una evoluzione esponenziata di A che lo mantenga implicitamente con lo svantaggio del calcolo dell’esponenziale
matriciale ad ogni passo per ogni molecola.
L’algoritmo R-SHAKE, pur presentando un errore locale maggiore per
brevi simulazioni per un fissato passo di integrazione rispetto ad un
algoritmo quaternionale, mostra maggiore stabilità e assenza di derive
energetiche per simulazioni di lunga durata a causa del suo carattere
simplettico.
87
88
Bibliografia
[1] Anfinsen C. Science 181, 223 (1973)
[2] Anfinsen C. Scheraga H.A. Adv.Prot.Chem. 29, 205 (1975)
[3] Branden C. Tooze J. Introduzione alla struttura delle proteine
Zanichelli 1993
[4] Clementi C. Effective potentials for protein folding models SISSA
1998
[5] Hamilton W.R. On Quaternions Proceedings of the Royal Irish
Academy 3, 1-16 (1847)
[6] Kuipers J.B. Quaternions and rotation sequences, Princeton
University Press, 1999
[7] Omelyan I.P. Algorithm for numerical integration of the rigid-body
equations of motion Physical Review E 58, 1169 (1998)
[8] Ryckaert J.P. Ciccotti G. Berendsen H.J.C. J. Comput. Phys. 23,
327 (1977)
[9] Andersen H.C. J. Comput. Phys. 52, 24 (1983)
[10] Ahlrichs R. Brode S. Comput. Phys. Commun. 42, 59 (1986)
[11] Dullweber A. Leimkuhler B. McLachlan R. J. Chem. Phys. 107,
5840 (1997)
[12] Evans D.J. Mol.Phys. 34 , 317 (1977)
[13] Fincham D. Mol.Simul. 8 , 165 (1992)
89
[14] Omelyan I.P. A new leapfrog integrator of rotational motion, Jan
1999
[15] Kol A. Laird B. Leimkuhler B. A symplectic Method for Rigid-Body
Molecular Simulation, March 1997
[16] Kneller G.R. Hinsen K. Phys.Rev. E 50, 1559 (1994)
[17] Kalra D. A formulation of Rigid-Body Assemblies for Computer
Graphics Modeling
[18] Honeycutt J.D. Thirumalai D. Metastability of the folded states of
globular proteins Proc.Natl.Acad.Sci.USA 87 3526 (1990)
[19] Baumketner A. Hiwatari Y. Phys.Rev. E 66, 11905 (2002)
[20] Sorenson J.M. Head-Gordon T. Proteins 37, 582 (1999)
[21] Shea J.E. et al. J. Chem. Phys. 109, 2895 (1998)
[22] Klimov D.K. Thirumalai D. Phys.Rev.Lett. 79, 317 (1997)
[23] Stillinger F.H. Head-Gordon T. Hirshfeld C.L. Phys.Rev. E 48,
1469 (1993)
[24] Kalra D. A general formulation of rigid-body assemblies for computer
graphics modeling
[25] Risken H. The Fokker-Planck Equation Springer-Verlag (1989)
[26] Turchetti G. Dinamica Classica dei sistemi fisici Zanichelli 1998
[27] Landau L.D. Lifsits E.M. Fisica statistica Editori Riuniti 1978
[28] Guo Z. Thirumalai D. Kinetics of protein folding: nucleation
mechanism, time scales and pathways Biopolymers, 36,83 (1994)
[29] Levinthal C. J. Chem. Phys. 65, 44 (1968)
[30] Nymeyer H. Garcı́a A. Onuchic J.N. Proc. Natl. Acad. Sci. USA
95, 5921 (1998)
90
[31] Rapaport D.C. Phys. Rev. E 66, 011906 (2002)
[32] Baumketner A. Hiwatari Y. Phys.Rev. E 66, 011905 (2002)
[33] Micheletti C. Seno F. Maritan A. Banavar J.R. Computational
Materials Science 20, 305 (2001)
[34] Micheletti C. Seno F. Maritan A. Banavar J.R. Learning effective
amino acid interactions through iterative stochastic techniques
[35] Klimov D.K. Thirumalai D. Phys.Rev. Lett. 79, 317 (1997)
[36] Veitshans T. Klimov D.K. Thirumalai D. Folding and design 2,
1 (1997)
[37] Zhou Y. Karplus M. J. Mol. Biol. 293, 917 (1999)
[38] Sebastian K.L. Alok K.R. Paul Phys. Rev. E 62, 927 (2000)
91

Lorenzo Bernacchioni

Transcript

Documenti analoghi

La Domenica il centro prelievi è aperto dalle ore 7.30 alle ore 9.30

cwmun-2017 - Rosina Salvo

8 - amminoacidi

DR 152 T DD 3-152 DD 2-160 Xe

Introduzione alla geometria dei quaternioni

AMMINOACIDI ESSENZIALI Dei venti amminoacidi proteici, alcuni

Universit`a di Pisa Concorso di ammissione al tirocinio formativo

Gelato GM, via libera nella UE

I verifica 2015 - Dipartimento di Fisica e Astronomia