8. Le proteine

Transcript

8. Le proteine
8. Le proteine
Il termine "proteina" (dal greco προτειος: di primaria importanza) fu coniato nel 1838 dal
chimico svedese J. Berzelius1 quando ancora si riteneva che le proteine fossero le molecole
delegate a conservare e trasmettere l'informazione genetica. Oggi é noto che sono gli acidi
nucleici a svolgere queste funzioni, ma il significato etimologico della parola rimane ancora
valido. Le proteine hanno, infatti, un ruolo fondamentale praticamente in tutti i processi
biologici.
All'inizio del Capitolo 6 abbiamo accennato alle molte diverse funzioni biologiche svolte
dalle proteine, vogliamo darne qui una grossolana classificazione.
1.
Catalisi Enzimatica: le proteine (in questo contesto sono dette enzimi) sono in grado di
far crescere (fino a qualche ordine di grandezza) la velocità di una reazione.
2.
Trasporto e Deposito: alcune proteine svolgono il ruolo di trasportatori di ioni o
piccole molecole. Tra gli esempi più importanti l'emoglobina (Hb) e la mioglobina
(Mb) che sono i trasportatori dell'ossigeno, rispettivamente negli eritrociti e nei
muscoli o la transferrina che si occupa del trasporto di ferro nel plasma.
3.
Movimento: proteine come la miosina e l'actina sono fondamentali nel processo di
contrazione muscolare, così come é dovuto all'azione di specifiche proteine il processo
di segregazione dei cromosomi durante la mitosi.
4.
Sostegno meccanico: un esempio di proteina che svolge questa funzione é il collagene
che dà elasticità e resistenza a pelle ed ossa.
1 Vedi nota 3, Capitolo 6.
5.
Protezione immunitaria: gli anticorpi, che giocano un ruolo fondamentale nel processo
di difesa degli organismi superiori dall'aggressione di agenti estranei e patogeni, sono
proteine.
6.
Produzione e trasmissione degli impulsi nervosi.: alcune particolari proteine sono
mediatrici della risposta nervosa cellulare. Per esempio la rodopsina che é un
fotorecettore proteico localizzato nei bastoncelli; o l'acetilcolina che é un mediatore
della trasmissione degli impulsi nervosi attraverso le sinapsi (le giunzioni tra cellule
nervose).
7.
Controllo della crescita e del differenziamento: negli organismi superiori la crescita e il
differenziamento sono controllati da fattori di crescita proteici.
8.
Interazione con l'ambiente: sensori proteici controllano, in tutte le cellule, il flusso di
energia e di materia.
9.
etc.
8.1 Gli aminoacidi
Le unità monomeriche con le quali sono costruiti i polimeri lineari che costituiscono le
proteine sono gli amino acidi. Un amino acido consiste di un gruppo aminico, NH2, un gruppo
carbossilico, COOH, un atomo di idrogeno, H, e un gruppo, R, detto catena laterale che é
diversa per ciascuno dei 20 amino acidi che costituiscono il repertorio2. Tutti e tre questi gruppi
sono legati ad un atomo di carbonio, il cosiddetto carbonio α (vedi Figura 8.1).
2 Venti sono gli aminoacidi di gran lunga più comuni. Anche se raramente si trovano aminoacidi
chimicamente diversi dai venti principali.
145
Figura 8.1
Come mostrato in Figura gli amino acidi, a pH neutro, sono generalmente ioni bipolari (o
zwitterioni) con il gruppo aminico protonato (-NH3+) e il gruppo carbossilico dissociato (-COO). Naturalmente lo stato di ionizzazione dell'amino acido varia con il pH. In una soluzione
fortemente acida, pH ≈ 1, il gruppo carbossilico non é dissociato, mentre il gruppo
Valori di pK
Amino acido α-COO- α-NH3+
Alanina
Arginina
Acido Aspartico
Asparagina
Cisteina
Acido Glutamico
Glutamina
Glicina
Istidina
Isoleucina
Leucina
Lisina
Metionina
Fenilalanina
Prolina
Serina
Treonina
Triptofano
Tirosina
Valina
2.3
1.8
2.0
2.0
1.8
2.2
2.2
2.4
1.8
2.4
2.4
2.2
2.3
1.8
2.0
2.1
2.6
2.4
2.2
2.3
9.9
9.0
10.0
8.8
10.8
9.7
9.1
9.8
9.2
9.7
9.6
9.2
9.2
9.1
10.6
9.2
10.4
9.4
9.1
9.6
Tabella 8.1
146
aminico é protonato, viceversa in una soluzione fortemente alcalina, pH ≈ 11, il gruppo
carbossilico é dissociato mentre il gruppo aminico é neutro. Il pK3 di ionizzazione di un gruppo
amino acido
massa4
Superficie
Volume
pK5
pI6
solubilità7
densità8
Alanina
ALA
A
71.09
115
88.6
-
6.107
16.65
1.401
Arginina
ARG
R
156.19
225
173.4
~12
10.76
15
1.1
Acido Aspartico
ASP
D
114.11
150
111.1
4.5
2.98
0.778
1.66
Asparagina
ASN
N
115.09
160
114.1
-
-
3.53
1.54
Cisteina
CYS
C
103.15
135
108.5
9.1-9.5
5.02
very high
-
Acido Glutamico
GLU
E
129.12
190
138.4
4.6
3.08
0.864
1.460
Glutamina
GLN
Q
128.14
180
143.8
-
-
2.5
-
Glicina
GLY
G
57.05
75
60.1
-
6.064
24.99
1.607
Istidina
HIS
H
137.14
195
153.2
6.2
7.64
4.19
-
Isoleucina
ILE
I
113.16
175
166.7
-
6.038
4.117
-
Leucina
LEU
L
113.16
170
166.7
-
6.036
2.426
1.191
Lisina
LYS
K
128.17
200
168.6
10.4
9.47
very high
-
Metionina
MET
M
131.19
185
162.9
-
5.74
3.381
1.340
3 Il pK é il valore di pH per il quale un gruppo dissociabile é per metà dissociato. Per maggiori dettagli
sulla definizione di pK e di curva di titolazione si veda per esempio:
http://www.psigate.ac.uk/newsite/reference/plambeck/chem1/p01173.htm
4 La massa é in dalton; la superficie in Å2 (C.Chothia, J. Mol. Biol., 105(1975)1-14) il volume in Å3(A.A.
Zamyatin, Prog. Biophys. Mol. Biol., 24(1972)107-123).
5 Il pK si riferisce alle catene laterali (C. Tanford, Adv. Prot. Chem., 17(1962)69-165).
6 Il pI (punto isoelettrico) é misurato a 25°C (The Merck Index, Merck & Co. Inc., Nahway, N.J.,
11(1989); CRC Handbook of Chem.& Phys., Cleveland, Ohio, 58(1977).
7 La solubilità é definita per g su 100g a 25°C (The Merck Index, Merck & Co. Inc., Nahway, N.J.,
11(1989); CRC Handbook of Chem.& Phys., Cleveland, Ohio, 58(1977).
8 La densità é quella del cristallo in g/ml (The Merck Index, Merck & Co. Inc., Nahway, N.J., 11(1989);
CRC Handbook of Chem.& Phys., Cleveland, Ohio, 58(1977).
147
Fenilalanina
PHE
F
147.18
210
189.9
-
5.91
2.965
-
Prolina
PRO
P
97.12
145
112.7
-
6.3
162.3
-
Serina
SER
S
87.08
115
89.0
-
5.68
5.023
1.537
Treonina
THR
T
101.11
140
116.1
-
-
very high
-
Triptofano
TRP
W
186.12
255
227.8
-
5.88
1.136
-
Tirosina
TYR
Y
163.18
230
193.6
9.7
5.63
0.0453
1.456
Valina
VAL
V
99.14
155
140.0
-
6.002
8.85
1.230
Tabella 8.2
chimico dipende dal contesto in cui esso si trova, in particolare per i due terminali amino acidici
il pK varia da amino acido a amino acido anche nel caso di amino acidi isolati (vedi Tabella
8.1). A causa del fatto che il valore del pK di dissociazione delle catene laterali dipende dal
contesto chimico, la curva di titolazione di una proteina può dare indicazioni sulla localizzazione
spaziale dell'amino acido nella proteina e, in ultima analisi, sulla struttura di quest'ultima. In
Tabella 8.2 sono riportati i pK delle catene laterali degli amino acidi isolati, mentre la Tabella
8.39 sono messi a confronto i pK dei gruppi dissociabili di alcuni amino acidi localizzati in
proteine (e quindi in contesti chimici) diverse.
Gruppo
Proteina
pK
Acido aspartico e
acido glutammico
Seroalbumina
Insulina
4.0
4.7
Istidina
β-lactoglobulina
Lisozima
Insulina
Seroalbumina
7.4
6.8
6.4
6.9
Tirosina
Insulina
9 Da: C.R.Cantor & P.R.Schimmel: "Biophysical Chemistry" W.H.Freeman and Company
148
Lisina
Seroalbumina
9.6
10.4
Seroalbumina
Lisozima
9.8
10.4
Tabella 8.3
Le proprietà fisico-chimiche dei 20 principali residui amino acidici dipendono dalla
composizione chimica delle loro catene laterali (indicate genericamente con R in Figura 8.1).
Nelle figure che seguono gli amino acidi sono raggruppati in base ad alcune caratteristiche
chimiche in:
1. Amino acidi non polari (Figura 8.2): Alanina (Ala, A); Isoleucina (Ile, I), Leucina (Leu,
L), Valina (Val, V), Metionina (Met, M), Prolina (Pro, P), Fenilalanina (Phe, F),
Triptofano (Trp, W) e Glicina (Gly, G). Due amino acidi di questo gruppo sono
considerati speciali: la Glicina e la Prolina. La Glicina, a causa del fatto che la sua
Figura 8.2
149
catena laterale é costituita da un solo atomo di idrogeno, é spesso presente in regioni
della catena polipeptidica dove sia richiesta un'elevata flessibilità. La Prolina non è
propriamente un amino acido perché la sua catena laterale si richiude sulla catena
principale, vincolando uno dei due gradi di libertà rotazionale. Questo implica che la
presenza di Prolina impedisca la formazione di α-elica.
2. Amino acidi polari dissociabili (Figura 8.3): Asparagina (Asn, N), Cisteina (Cys, C),
Glutamina (Gln, Q), Serina (Ser, S), Treonina (Thr, T) e Tirosina (Tyr, Y). In presenza di
un numero pari di Cisteine, si formano quasi sempre ponti disolfuro. Questa struttura é
così comune che il complesso Cys-S-S-Cys é detto Cistina, come se si trattasse del 21esimo amino acido.
3. Amino acidi carichi (Figura 8.4): cinque amino acidi esibiscono una carica netta nelle
loro catene laterali. Acido aspartico o Aspartato (Asp, D) e Acido Glutammico o
Glutammato (Glu, E) hanno una carica netta negativa, mentre Arginina (Arg, R), Istidina
(His, H) e Lisina (Lys, K) hanno una carica netta positiva
Figura 8.3
150
Figura 8.4
Come detto, la Glicina é l'amino acido più semplice poiché la sua catena laterale é
costituita solo da un atomo di idrogeno ed é l'unico aminoacido in cui il Cα é simmetrico.
Nell'Alanina la catena laterale é costituita da un gruppo metilico. Valina, Leucina e Isoleucina
hanno catene laterali più lunghe costituite da idrocarburi10. Queste grosse catene laterali
alifatiche sono fortemente idrofobiche. La Prolina, pur avendo anch'essa una catena laterale
alifatica, si differenzia dagli altri perché ha un gruppo iminico al posto del gruppo aminico ed é
quindi detta iminoacido. La Fenilalanina, il Triptofano e la Tirosina hanno catene laterali
aromatiche, ma la presenza di un gruppo ossidrile, -OH, dissociabile rende la Tirosina meno
idrofobica delle altre due. Il Triptofano ha un anello indolico11 unito ad un gruppo metilenico
(CH2). Due aminoacidi contengono zolfo nelle loro catene laterali, la Cisteina e la Metionina,
entrambe le loro catene laterali sono idrofobiche. Il gruppo sulfidrilico (-SH) della cisteina é
altamente reattivo e, come vedremo, ha una grande importanza strutturale. Due amino acidi,
Serina e Treonina, contengono gruppi ossidrilici. La Serina può essere considerata come una
10 Si dicono idrocarburi quelle sostanze organiche alifatiche (atomi di carbonio legati tra loro in catena
lineare o ramificata) o aromatiche (composti chimici che fanno capo al benzene in cui gli elettroni
sono delocalizzati) che contengono solo carboni e idrogeni.
11 L'indolo é un composto organico eterociclico formato da un anello benzenico e uno pirrolico.
151
versione idrossilata della Alanina e la Treonina della Valina. La presenza degli ossidrili rende i
due aminoacidi idrofilici. Alcuni amino acidi sono altamente idrofilici per la presenza di catene
laterali cariche o dissociabili a pH fisiologici. Lisina e Arginina sono cariche positivamente a pH
neutro, mentre l'Istidina può essere o no carica positivamente (vedi Tabella 8.2). Acido aspartico
o Aspartato e Acido glutammico o glutammato hanno catene laterali cariche negativamente. Da
questi due provengono due derivati neutri, Aspargina e Glutammina in cui il gruppo carbossilico
(-COOH) é rimpiazzato da un gruppo aminico (NH2) (vedi Figure 8.3 e 8.4).
8.2 Il legame peptidico e i polipeptidi.
Gli amino acidi nelle catene proteiche formano un legame tra il gruppo carbossilico di un
aminoacido e il gruppo aminico dell'amino acido che segue (Figura 8.5).
Figura 8.5
Tale legame é detto peptidico, e le catene proteiche sono dette catene polipeptidiche (Figura
8.6).
152
Figura 8.6
Come mostrato nella Figura 8.5, la formazione di un dipeptide avviene con la produzione di una
molecola d'acqua. L'equilibrio della reazione, in ambiente acquoso, é spostato verso l'idrolisi,
per cui la biosintesi richiede energia. Per ragioni legate al meccanismo direzionale di sintesi, il
gruppo aminico é considerato l'inizio della catena e il gruppo carbossilico la fine della catena.
Gli aminoacidi della catena sono detti residui.
Gli aminoacidi presenti nelle proteine sono tutti α-amino-α-carbossilici, con ciò
intendendo che il gruppo aminico é legato al carbonio adiacente al gruppo carbossilico acido,
detto carbonio α (Cα).
Tutti gli aminoacidi, con esclusione della Glicina in cui il Cα é simmetrico, hanno una
chiralità definita12, che può essere rivelata con esperimenti di dicroismo circolare. Sono in linea
di principio possibili entrambe le forme speculari (enanziomeri o stereoisomeri) di
organizzazione degli atomi attorno al Cα (vedi Figura 8.7) che sono dette isomero L (o levogiro)
e isomero D (o destrogiro). Lo steroisomero naturale di origine biologica é la configurazione L.
Infatti, sebbene siano stati occasionalmente trovati gli steroisomeri D, i ribosomi non sono in
grado di utilizzarli nella sintesi.
12 Una molecola "chirale" è una molecola che non é sovrapponibile alla sua immagine speculare, come la
mano destra e la mano sinistra.
153
Figura 8.7
La presenza di queste regolarità (come per esempio l'essere gli aminoacidi tutti α-amino-αcarbossilici e levogiri) condivise da organismi geneticamente ed evolutivamente molto distanti
tra loro, non é sempre giustificabile con meccanismi di evoluzione basati sulla selezione del più
adatto. Analizziamo alcuni esempi di regolarità illustrando alcune ipotesi formulate sulle ragioni
della loro insorgenza.
1.
Tutti gli esseri viventi (a parte qualche rarissima eccezione) usano lo stesso insieme di 20
a.a.
La spiegazione di questa regolarità é da ricercarsi nel fatto che la produzione di proteine
passa attraverso un processo di "traduzione" di una sequenza nucleotidica in una sequenza
amino acidica durante il quale si utilizza il cosiddetto Codice Genetico (vedi Fig 7.4, cap. 7).
Questo, come si é visto, é un codice a triplette che consentirebbe teoricamente la codifica di 64
a.a.. Il codice genetico é, quindi, ridondante (alcuni aminoacidi sono codificati da più di una
tripletta). L'ipotesi più attendibile é che il sistema di traduzione abbia subito un processo
evolutivo dalle doppiette alle triplette. Tale ipotesi é sostenuta, fra l'altro, dalla forte
154
degenerazione della terza posizione nel codone. La terza base della tripletta é infatti spesso
indifferente13. L'evoluzione verso un codice a triplette può essere inoltre riconducibile al
meccanismo chimico mediante il quale avviene la traduzione. Infatti poiché é cruciale che
l'associazione della sequenza nucleotidica dell'mRNA con il tRNA mediante accoppiamento
delle basi sia altamente specifica, é probabile che la doppietta non fornisse una costante di
associazione sufficientemente grande da garantire la necessaria specificità. Si è probabilmente
passati da un codice a due basi ad uno a tre altamente degenere e, in un secondo momento, la
degenerazione é stata parzialmente rimossa con l'aumento del numero di amino acidi codificati.
Inoltre, in alcuni casi si osserva che aminoacidi che condividono alcuni passi del processo
metabolico di sintesi hanno spesso triplette codificanti molto simili tra loro che suggerisce una
coevoluzione di codice genetico e metabolismo14.
2.
Gli amino acidi di origine biologica sono prodotti tutti nella forma levogira.
Si ritiene che questo sia semplicemente dovuto al fatto che l'efficienza e la competitività rispetto
alla selezione della "macchina" che presiede alla sintesi delle proteine richiede che ci sia una
configurazione standard degli amino acidi. La selezione di uno steroisomero rispetto all'altro é
stata, con ogni probabilità casuale. Non ci sono infatti ragioni ovvie per preferire uno
13 Osservando il codice in Fig.7.4 si vede che molti amino acidi sono, in pratica, codificati da una
doppietta e da una terza base qualsiasi. Per esempio: Serina, UCx (x=aminoacido qualsiasi); Leucina,
CUx; Prolina, CCx; Arginina, CGx; etc.
14 Recentemente é stata proposta una spiegazione più fondamentale dell'esistenza di un codice a triplette,
basata sull'idea che la sintesi proteica avvenga secondo le leggi del "Quantum Computing". L'ipotesi é
suggestiva e, almeno in parte, sostenuta da dati sperimentali, ma, per adesso é lungi dall'essere
universalmente accettata. Chi fosse curioso di conoscere di più sull'argomento può leggere: A.Patel
"Why genetic information processing could have a quantum basis." (2001) J Biosci. 26(2):145-51; un
altro lavoro si può trovare sul sito http://arxiv.org/PS_cache/quant-ph/pdf/0002/0002037.pdf
155
steroisomero rispetto alla sua immagine speculare. Probabilmente i due sistemi si sono sviluppati
in parallelo e il sitema L ha "vinto" la competizione solo a causa di fluttuazioni casuali che lo
hanno portato ad emergere numericamente15.
Figura 8.8
Una volta diventata prevalente, però, una modalità di per sè non rilevante come quella della
chiralità può determinare conseguenze secondarie inaspettate. É probabile che la peculiarità che
tutti gli aminoacidi naturali sono levogiri sia all'origine di un effetto biologico drammatico come
quello del Talidomide. Il Talidomide (α-ftalimidoglutarimide) é una molecola chirale (vedi
Figura 8.8). Il farmaco veniva prodotto in soluzione racemica con una proporzione (1:1) tra
enanziomero D e L. Il Talidomide venne prodotto come farmaco calmante e specialmente
15 Questo é un tipico esempio di evoluzione alla Eigen (Eigen M. and P. Schuster. (1979)"The
Hypercycle: A principle of natural self-organization", Springer, Berlin.).
156
indicato per i disturbi del sonno in gravidanza. Le conseguenze della somministrazione di
Talidomide alle donne in gravidanza é considerato uno dei più gravi disastri farmacologici dello
scorso secolo (l'uso massiccio risale agli anni '60). Infatti, il farmaco, somministrato nei primi tre
mesi di gravidanza impediva il corretto sviluppo del feto (effetto teratogeno) provocando gravi
malformazioni (quali la focomelia). Si scoprì che solo l'enanziomero D aveva effetti calmanti,
mentre l'enanziomero L aveva effetti teratogeni.
3.
Gli aminoacidi di origine biologica sono tutti nella forma α-amino-α-carbossilia.
Se si compiono degli esperimenti alla Miller (vedi Capitolo 2, paragrafo 5) si ottiene una
soluzione racemica16 di aminoacidi che contiene, in proporzioni comparabili, amino acidi di tipo
α e di tipo β (vedi Figura 8.9). Con aminoacidi di tipo β si intendono indicare quegli amino acidi
in cui il primo atomo di carbonio della catena laterale (il cosiddetto Cβ), presente in tutti gli
amino acidi a parte la Glicina (vedi Figure 8.2, 8.3 e 8.4), appartenente alla
16
Si dice racemica una soluzione in cui sono presenti in egual proporzione gli stereoisomeri L e D.
157
Figura 8.9
catena principale. Per molti aspetti gli aminoacidi β sono assolutamente equivalenti a quelli
α (lo dimostra il fatto che la produzione inorganica di aminoacidi produce in proporzioni
comparabili aminoacidi di tipo α e di tipo β). Vediamo però che tra le due forme esiste una
differenza sostanziale. Nel legame peptidico, come mostrato in Figura 8.10, tra CO e NH si
forma quello che i chimici definiscono parziale doppio legame. Questo comporta che
158
Figura 8.10
la rotazione intorno al legame CO-NH non sia libera come quella intorno ai legami semplici che
vi sono tra Cα e CO e tra Cα e NH (Fig. 8.11). Ogni aminoacido, in configurazione α provvede
quindi due gradi di libertà torsionali lungo la catena polipetidica. Nella configurazione β ogni
amino acido acquisisce un ulteriore grado di libertà dovuto alla possibile rotazione intorno
legame semplice Cα - Cβ. Tale maggiore flessibilità rende la possibilità di un "folding" spontaneo
altamente improbabile17, con ciò giustificando il processo di evoluzione che ha selezionato gli
aminoacidi della forma α.
É noto infatti che il processo di folding, mediante il quale la catena polipeptidica si avvolge (to
fold) per arrivare alla struttura tridimensionale che ne determinerà la specificità funzionale,
17 Vedi Approfondimento A12
159
Figura 8.11
può essere aiutato da altre proteine (le cosiddette chaperonine). Tuttavia esso può avvenire, e in
molti casi avviene, anche in modo spontaneo (in assenza cioè di fonti di energia esterne e/o con
mediazione di altri enzimi). É ragionevolmente ipotizzabile che, nella fase iniziale di formazione
e selezione delle prime strutture proteiche, la possibilità del folding spontaneo sia stata un
elemento selettivo decisivo.
160