8. Le proteine
Transcript
8. Le proteine
8. Le proteine Il termine "proteina" (dal greco προτειος: di primaria importanza) fu coniato nel 1838 dal chimico svedese J. Berzelius1 quando ancora si riteneva che le proteine fossero le molecole delegate a conservare e trasmettere l'informazione genetica. Oggi é noto che sono gli acidi nucleici a svolgere queste funzioni, ma il significato etimologico della parola rimane ancora valido. Le proteine hanno, infatti, un ruolo fondamentale praticamente in tutti i processi biologici. All'inizio del Capitolo 6 abbiamo accennato alle molte diverse funzioni biologiche svolte dalle proteine, vogliamo darne qui una grossolana classificazione. 1. Catalisi Enzimatica: le proteine (in questo contesto sono dette enzimi) sono in grado di far crescere (fino a qualche ordine di grandezza) la velocità di una reazione. 2. Trasporto e Deposito: alcune proteine svolgono il ruolo di trasportatori di ioni o piccole molecole. Tra gli esempi più importanti l'emoglobina (Hb) e la mioglobina (Mb) che sono i trasportatori dell'ossigeno, rispettivamente negli eritrociti e nei muscoli o la transferrina che si occupa del trasporto di ferro nel plasma. 3. Movimento: proteine come la miosina e l'actina sono fondamentali nel processo di contrazione muscolare, così come é dovuto all'azione di specifiche proteine il processo di segregazione dei cromosomi durante la mitosi. 4. Sostegno meccanico: un esempio di proteina che svolge questa funzione é il collagene che dà elasticità e resistenza a pelle ed ossa. 1 Vedi nota 3, Capitolo 6. 5. Protezione immunitaria: gli anticorpi, che giocano un ruolo fondamentale nel processo di difesa degli organismi superiori dall'aggressione di agenti estranei e patogeni, sono proteine. 6. Produzione e trasmissione degli impulsi nervosi.: alcune particolari proteine sono mediatrici della risposta nervosa cellulare. Per esempio la rodopsina che é un fotorecettore proteico localizzato nei bastoncelli; o l'acetilcolina che é un mediatore della trasmissione degli impulsi nervosi attraverso le sinapsi (le giunzioni tra cellule nervose). 7. Controllo della crescita e del differenziamento: negli organismi superiori la crescita e il differenziamento sono controllati da fattori di crescita proteici. 8. Interazione con l'ambiente: sensori proteici controllano, in tutte le cellule, il flusso di energia e di materia. 9. etc. 8.1 Gli aminoacidi Le unità monomeriche con le quali sono costruiti i polimeri lineari che costituiscono le proteine sono gli amino acidi. Un amino acido consiste di un gruppo aminico, NH2, un gruppo carbossilico, COOH, un atomo di idrogeno, H, e un gruppo, R, detto catena laterale che é diversa per ciascuno dei 20 amino acidi che costituiscono il repertorio2. Tutti e tre questi gruppi sono legati ad un atomo di carbonio, il cosiddetto carbonio α (vedi Figura 8.1). 2 Venti sono gli aminoacidi di gran lunga più comuni. Anche se raramente si trovano aminoacidi chimicamente diversi dai venti principali. 145 Figura 8.1 Come mostrato in Figura gli amino acidi, a pH neutro, sono generalmente ioni bipolari (o zwitterioni) con il gruppo aminico protonato (-NH3+) e il gruppo carbossilico dissociato (-COO). Naturalmente lo stato di ionizzazione dell'amino acido varia con il pH. In una soluzione fortemente acida, pH ≈ 1, il gruppo carbossilico non é dissociato, mentre il gruppo Valori di pK Amino acido α-COO- α-NH3+ Alanina Arginina Acido Aspartico Asparagina Cisteina Acido Glutamico Glutamina Glicina Istidina Isoleucina Leucina Lisina Metionina Fenilalanina Prolina Serina Treonina Triptofano Tirosina Valina 2.3 1.8 2.0 2.0 1.8 2.2 2.2 2.4 1.8 2.4 2.4 2.2 2.3 1.8 2.0 2.1 2.6 2.4 2.2 2.3 9.9 9.0 10.0 8.8 10.8 9.7 9.1 9.8 9.2 9.7 9.6 9.2 9.2 9.1 10.6 9.2 10.4 9.4 9.1 9.6 Tabella 8.1 146 aminico é protonato, viceversa in una soluzione fortemente alcalina, pH ≈ 11, il gruppo carbossilico é dissociato mentre il gruppo aminico é neutro. Il pK3 di ionizzazione di un gruppo amino acido massa4 Superficie Volume pK5 pI6 solubilità7 densità8 Alanina ALA A 71.09 115 88.6 - 6.107 16.65 1.401 Arginina ARG R 156.19 225 173.4 ~12 10.76 15 1.1 Acido Aspartico ASP D 114.11 150 111.1 4.5 2.98 0.778 1.66 Asparagina ASN N 115.09 160 114.1 - - 3.53 1.54 Cisteina CYS C 103.15 135 108.5 9.1-9.5 5.02 very high - Acido Glutamico GLU E 129.12 190 138.4 4.6 3.08 0.864 1.460 Glutamina GLN Q 128.14 180 143.8 - - 2.5 - Glicina GLY G 57.05 75 60.1 - 6.064 24.99 1.607 Istidina HIS H 137.14 195 153.2 6.2 7.64 4.19 - Isoleucina ILE I 113.16 175 166.7 - 6.038 4.117 - Leucina LEU L 113.16 170 166.7 - 6.036 2.426 1.191 Lisina LYS K 128.17 200 168.6 10.4 9.47 very high - Metionina MET M 131.19 185 162.9 - 5.74 3.381 1.340 3 Il pK é il valore di pH per il quale un gruppo dissociabile é per metà dissociato. Per maggiori dettagli sulla definizione di pK e di curva di titolazione si veda per esempio: http://www.psigate.ac.uk/newsite/reference/plambeck/chem1/p01173.htm 4 La massa é in dalton; la superficie in Å2 (C.Chothia, J. Mol. Biol., 105(1975)1-14) il volume in Å3(A.A. Zamyatin, Prog. Biophys. Mol. Biol., 24(1972)107-123). 5 Il pK si riferisce alle catene laterali (C. Tanford, Adv. Prot. Chem., 17(1962)69-165). 6 Il pI (punto isoelettrico) é misurato a 25°C (The Merck Index, Merck & Co. Inc., Nahway, N.J., 11(1989); CRC Handbook of Chem.& Phys., Cleveland, Ohio, 58(1977). 7 La solubilità é definita per g su 100g a 25°C (The Merck Index, Merck & Co. Inc., Nahway, N.J., 11(1989); CRC Handbook of Chem.& Phys., Cleveland, Ohio, 58(1977). 8 La densità é quella del cristallo in g/ml (The Merck Index, Merck & Co. Inc., Nahway, N.J., 11(1989); CRC Handbook of Chem.& Phys., Cleveland, Ohio, 58(1977). 147 Fenilalanina PHE F 147.18 210 189.9 - 5.91 2.965 - Prolina PRO P 97.12 145 112.7 - 6.3 162.3 - Serina SER S 87.08 115 89.0 - 5.68 5.023 1.537 Treonina THR T 101.11 140 116.1 - - very high - Triptofano TRP W 186.12 255 227.8 - 5.88 1.136 - Tirosina TYR Y 163.18 230 193.6 9.7 5.63 0.0453 1.456 Valina VAL V 99.14 155 140.0 - 6.002 8.85 1.230 Tabella 8.2 chimico dipende dal contesto in cui esso si trova, in particolare per i due terminali amino acidici il pK varia da amino acido a amino acido anche nel caso di amino acidi isolati (vedi Tabella 8.1). A causa del fatto che il valore del pK di dissociazione delle catene laterali dipende dal contesto chimico, la curva di titolazione di una proteina può dare indicazioni sulla localizzazione spaziale dell'amino acido nella proteina e, in ultima analisi, sulla struttura di quest'ultima. In Tabella 8.2 sono riportati i pK delle catene laterali degli amino acidi isolati, mentre la Tabella 8.39 sono messi a confronto i pK dei gruppi dissociabili di alcuni amino acidi localizzati in proteine (e quindi in contesti chimici) diverse. Gruppo Proteina pK Acido aspartico e acido glutammico Seroalbumina Insulina 4.0 4.7 Istidina β-lactoglobulina Lisozima Insulina Seroalbumina 7.4 6.8 6.4 6.9 Tirosina Insulina 9 Da: C.R.Cantor & P.R.Schimmel: "Biophysical Chemistry" W.H.Freeman and Company 148 Lisina Seroalbumina 9.6 10.4 Seroalbumina Lisozima 9.8 10.4 Tabella 8.3 Le proprietà fisico-chimiche dei 20 principali residui amino acidici dipendono dalla composizione chimica delle loro catene laterali (indicate genericamente con R in Figura 8.1). Nelle figure che seguono gli amino acidi sono raggruppati in base ad alcune caratteristiche chimiche in: 1. Amino acidi non polari (Figura 8.2): Alanina (Ala, A); Isoleucina (Ile, I), Leucina (Leu, L), Valina (Val, V), Metionina (Met, M), Prolina (Pro, P), Fenilalanina (Phe, F), Triptofano (Trp, W) e Glicina (Gly, G). Due amino acidi di questo gruppo sono considerati speciali: la Glicina e la Prolina. La Glicina, a causa del fatto che la sua Figura 8.2 149 catena laterale é costituita da un solo atomo di idrogeno, é spesso presente in regioni della catena polipeptidica dove sia richiesta un'elevata flessibilità. La Prolina non è propriamente un amino acido perché la sua catena laterale si richiude sulla catena principale, vincolando uno dei due gradi di libertà rotazionale. Questo implica che la presenza di Prolina impedisca la formazione di α-elica. 2. Amino acidi polari dissociabili (Figura 8.3): Asparagina (Asn, N), Cisteina (Cys, C), Glutamina (Gln, Q), Serina (Ser, S), Treonina (Thr, T) e Tirosina (Tyr, Y). In presenza di un numero pari di Cisteine, si formano quasi sempre ponti disolfuro. Questa struttura é così comune che il complesso Cys-S-S-Cys é detto Cistina, come se si trattasse del 21esimo amino acido. 3. Amino acidi carichi (Figura 8.4): cinque amino acidi esibiscono una carica netta nelle loro catene laterali. Acido aspartico o Aspartato (Asp, D) e Acido Glutammico o Glutammato (Glu, E) hanno una carica netta negativa, mentre Arginina (Arg, R), Istidina (His, H) e Lisina (Lys, K) hanno una carica netta positiva Figura 8.3 150 Figura 8.4 Come detto, la Glicina é l'amino acido più semplice poiché la sua catena laterale é costituita solo da un atomo di idrogeno ed é l'unico aminoacido in cui il Cα é simmetrico. Nell'Alanina la catena laterale é costituita da un gruppo metilico. Valina, Leucina e Isoleucina hanno catene laterali più lunghe costituite da idrocarburi10. Queste grosse catene laterali alifatiche sono fortemente idrofobiche. La Prolina, pur avendo anch'essa una catena laterale alifatica, si differenzia dagli altri perché ha un gruppo iminico al posto del gruppo aminico ed é quindi detta iminoacido. La Fenilalanina, il Triptofano e la Tirosina hanno catene laterali aromatiche, ma la presenza di un gruppo ossidrile, -OH, dissociabile rende la Tirosina meno idrofobica delle altre due. Il Triptofano ha un anello indolico11 unito ad un gruppo metilenico (CH2). Due aminoacidi contengono zolfo nelle loro catene laterali, la Cisteina e la Metionina, entrambe le loro catene laterali sono idrofobiche. Il gruppo sulfidrilico (-SH) della cisteina é altamente reattivo e, come vedremo, ha una grande importanza strutturale. Due amino acidi, Serina e Treonina, contengono gruppi ossidrilici. La Serina può essere considerata come una 10 Si dicono idrocarburi quelle sostanze organiche alifatiche (atomi di carbonio legati tra loro in catena lineare o ramificata) o aromatiche (composti chimici che fanno capo al benzene in cui gli elettroni sono delocalizzati) che contengono solo carboni e idrogeni. 11 L'indolo é un composto organico eterociclico formato da un anello benzenico e uno pirrolico. 151 versione idrossilata della Alanina e la Treonina della Valina. La presenza degli ossidrili rende i due aminoacidi idrofilici. Alcuni amino acidi sono altamente idrofilici per la presenza di catene laterali cariche o dissociabili a pH fisiologici. Lisina e Arginina sono cariche positivamente a pH neutro, mentre l'Istidina può essere o no carica positivamente (vedi Tabella 8.2). Acido aspartico o Aspartato e Acido glutammico o glutammato hanno catene laterali cariche negativamente. Da questi due provengono due derivati neutri, Aspargina e Glutammina in cui il gruppo carbossilico (-COOH) é rimpiazzato da un gruppo aminico (NH2) (vedi Figure 8.3 e 8.4). 8.2 Il legame peptidico e i polipeptidi. Gli amino acidi nelle catene proteiche formano un legame tra il gruppo carbossilico di un aminoacido e il gruppo aminico dell'amino acido che segue (Figura 8.5). Figura 8.5 Tale legame é detto peptidico, e le catene proteiche sono dette catene polipeptidiche (Figura 8.6). 152 Figura 8.6 Come mostrato nella Figura 8.5, la formazione di un dipeptide avviene con la produzione di una molecola d'acqua. L'equilibrio della reazione, in ambiente acquoso, é spostato verso l'idrolisi, per cui la biosintesi richiede energia. Per ragioni legate al meccanismo direzionale di sintesi, il gruppo aminico é considerato l'inizio della catena e il gruppo carbossilico la fine della catena. Gli aminoacidi della catena sono detti residui. Gli aminoacidi presenti nelle proteine sono tutti α-amino-α-carbossilici, con ciò intendendo che il gruppo aminico é legato al carbonio adiacente al gruppo carbossilico acido, detto carbonio α (Cα). Tutti gli aminoacidi, con esclusione della Glicina in cui il Cα é simmetrico, hanno una chiralità definita12, che può essere rivelata con esperimenti di dicroismo circolare. Sono in linea di principio possibili entrambe le forme speculari (enanziomeri o stereoisomeri) di organizzazione degli atomi attorno al Cα (vedi Figura 8.7) che sono dette isomero L (o levogiro) e isomero D (o destrogiro). Lo steroisomero naturale di origine biologica é la configurazione L. Infatti, sebbene siano stati occasionalmente trovati gli steroisomeri D, i ribosomi non sono in grado di utilizzarli nella sintesi. 12 Una molecola "chirale" è una molecola che non é sovrapponibile alla sua immagine speculare, come la mano destra e la mano sinistra. 153 Figura 8.7 La presenza di queste regolarità (come per esempio l'essere gli aminoacidi tutti α-amino-αcarbossilici e levogiri) condivise da organismi geneticamente ed evolutivamente molto distanti tra loro, non é sempre giustificabile con meccanismi di evoluzione basati sulla selezione del più adatto. Analizziamo alcuni esempi di regolarità illustrando alcune ipotesi formulate sulle ragioni della loro insorgenza. 1. Tutti gli esseri viventi (a parte qualche rarissima eccezione) usano lo stesso insieme di 20 a.a. La spiegazione di questa regolarità é da ricercarsi nel fatto che la produzione di proteine passa attraverso un processo di "traduzione" di una sequenza nucleotidica in una sequenza amino acidica durante il quale si utilizza il cosiddetto Codice Genetico (vedi Fig 7.4, cap. 7). Questo, come si é visto, é un codice a triplette che consentirebbe teoricamente la codifica di 64 a.a.. Il codice genetico é, quindi, ridondante (alcuni aminoacidi sono codificati da più di una tripletta). L'ipotesi più attendibile é che il sistema di traduzione abbia subito un processo evolutivo dalle doppiette alle triplette. Tale ipotesi é sostenuta, fra l'altro, dalla forte 154 degenerazione della terza posizione nel codone. La terza base della tripletta é infatti spesso indifferente13. L'evoluzione verso un codice a triplette può essere inoltre riconducibile al meccanismo chimico mediante il quale avviene la traduzione. Infatti poiché é cruciale che l'associazione della sequenza nucleotidica dell'mRNA con il tRNA mediante accoppiamento delle basi sia altamente specifica, é probabile che la doppietta non fornisse una costante di associazione sufficientemente grande da garantire la necessaria specificità. Si è probabilmente passati da un codice a due basi ad uno a tre altamente degenere e, in un secondo momento, la degenerazione é stata parzialmente rimossa con l'aumento del numero di amino acidi codificati. Inoltre, in alcuni casi si osserva che aminoacidi che condividono alcuni passi del processo metabolico di sintesi hanno spesso triplette codificanti molto simili tra loro che suggerisce una coevoluzione di codice genetico e metabolismo14. 2. Gli amino acidi di origine biologica sono prodotti tutti nella forma levogira. Si ritiene che questo sia semplicemente dovuto al fatto che l'efficienza e la competitività rispetto alla selezione della "macchina" che presiede alla sintesi delle proteine richiede che ci sia una configurazione standard degli amino acidi. La selezione di uno steroisomero rispetto all'altro é stata, con ogni probabilità casuale. Non ci sono infatti ragioni ovvie per preferire uno 13 Osservando il codice in Fig.7.4 si vede che molti amino acidi sono, in pratica, codificati da una doppietta e da una terza base qualsiasi. Per esempio: Serina, UCx (x=aminoacido qualsiasi); Leucina, CUx; Prolina, CCx; Arginina, CGx; etc. 14 Recentemente é stata proposta una spiegazione più fondamentale dell'esistenza di un codice a triplette, basata sull'idea che la sintesi proteica avvenga secondo le leggi del "Quantum Computing". L'ipotesi é suggestiva e, almeno in parte, sostenuta da dati sperimentali, ma, per adesso é lungi dall'essere universalmente accettata. Chi fosse curioso di conoscere di più sull'argomento può leggere: A.Patel "Why genetic information processing could have a quantum basis." (2001) J Biosci. 26(2):145-51; un altro lavoro si può trovare sul sito http://arxiv.org/PS_cache/quant-ph/pdf/0002/0002037.pdf 155 steroisomero rispetto alla sua immagine speculare. Probabilmente i due sistemi si sono sviluppati in parallelo e il sitema L ha "vinto" la competizione solo a causa di fluttuazioni casuali che lo hanno portato ad emergere numericamente15. Figura 8.8 Una volta diventata prevalente, però, una modalità di per sè non rilevante come quella della chiralità può determinare conseguenze secondarie inaspettate. É probabile che la peculiarità che tutti gli aminoacidi naturali sono levogiri sia all'origine di un effetto biologico drammatico come quello del Talidomide. Il Talidomide (α-ftalimidoglutarimide) é una molecola chirale (vedi Figura 8.8). Il farmaco veniva prodotto in soluzione racemica con una proporzione (1:1) tra enanziomero D e L. Il Talidomide venne prodotto come farmaco calmante e specialmente 15 Questo é un tipico esempio di evoluzione alla Eigen (Eigen M. and P. Schuster. (1979)"The Hypercycle: A principle of natural self-organization", Springer, Berlin.). 156 indicato per i disturbi del sonno in gravidanza. Le conseguenze della somministrazione di Talidomide alle donne in gravidanza é considerato uno dei più gravi disastri farmacologici dello scorso secolo (l'uso massiccio risale agli anni '60). Infatti, il farmaco, somministrato nei primi tre mesi di gravidanza impediva il corretto sviluppo del feto (effetto teratogeno) provocando gravi malformazioni (quali la focomelia). Si scoprì che solo l'enanziomero D aveva effetti calmanti, mentre l'enanziomero L aveva effetti teratogeni. 3. Gli aminoacidi di origine biologica sono tutti nella forma α-amino-α-carbossilia. Se si compiono degli esperimenti alla Miller (vedi Capitolo 2, paragrafo 5) si ottiene una soluzione racemica16 di aminoacidi che contiene, in proporzioni comparabili, amino acidi di tipo α e di tipo β (vedi Figura 8.9). Con aminoacidi di tipo β si intendono indicare quegli amino acidi in cui il primo atomo di carbonio della catena laterale (il cosiddetto Cβ), presente in tutti gli amino acidi a parte la Glicina (vedi Figure 8.2, 8.3 e 8.4), appartenente alla 16 Si dice racemica una soluzione in cui sono presenti in egual proporzione gli stereoisomeri L e D. 157 Figura 8.9 catena principale. Per molti aspetti gli aminoacidi β sono assolutamente equivalenti a quelli α (lo dimostra il fatto che la produzione inorganica di aminoacidi produce in proporzioni comparabili aminoacidi di tipo α e di tipo β). Vediamo però che tra le due forme esiste una differenza sostanziale. Nel legame peptidico, come mostrato in Figura 8.10, tra CO e NH si forma quello che i chimici definiscono parziale doppio legame. Questo comporta che 158 Figura 8.10 la rotazione intorno al legame CO-NH non sia libera come quella intorno ai legami semplici che vi sono tra Cα e CO e tra Cα e NH (Fig. 8.11). Ogni aminoacido, in configurazione α provvede quindi due gradi di libertà torsionali lungo la catena polipetidica. Nella configurazione β ogni amino acido acquisisce un ulteriore grado di libertà dovuto alla possibile rotazione intorno legame semplice Cα - Cβ. Tale maggiore flessibilità rende la possibilità di un "folding" spontaneo altamente improbabile17, con ciò giustificando il processo di evoluzione che ha selezionato gli aminoacidi della forma α. É noto infatti che il processo di folding, mediante il quale la catena polipeptidica si avvolge (to fold) per arrivare alla struttura tridimensionale che ne determinerà la specificità funzionale, 17 Vedi Approfondimento A12 159 Figura 8.11 può essere aiutato da altre proteine (le cosiddette chaperonine). Tuttavia esso può avvenire, e in molti casi avviene, anche in modo spontaneo (in assenza cioè di fonti di energia esterne e/o con mediazione di altri enzimi). É ragionevolmente ipotizzabile che, nella fase iniziale di formazione e selezione delle prime strutture proteiche, la possibilità del folding spontaneo sia stata un elemento selettivo decisivo. 160