La selezione genomica per la Frisona Italiana
Transcript
La selezione genomica per la Frisona Italiana
DALL’UFFICIO RICERCA E SVILUPPO La selezione genomica per la Frisona Italiana Dopo un periodo di ricerca e di prove, anche per la Frisona Italiana verrà pubblicata una nuova valutazione genetica basata sulle informazioni presenti nel DNA di un soggetto. I nuovi indici, detti “genomici”, saranno disponibili per i tori provati, ma anche per i tori giovani senza figlie. Vediamo con qualche dettaglio in più come si arriva al nuovo indice. INTRODUZIONE Entro la fine di quest’anno la genomica, branca della biologia molecolare che si occupa dello studio del genoma (patrimonio genetico) degli organismi viventi, diventerà un nuovo strumento selettivo al servizio degli allevatori di Frisona Italiana. Sino ad oggi gli strumenti utilizzati per stimare il valore genetico degli animali da reddito si basavano su due tipi di informazioni: a. Dati fenotipici (produzioni figlie) b. Anagrafica (Padre, Madre e progenie) Con l’avvento di nuove tecnologie di analisi del DNA è ora possibile “conoscere”, per ogni soggetto, una parte dei suoi geni (genotipo), stimarne il valore e calcolare un Indice Genomico. Questa nuova metodologia permette di: 1. stimare con un’attendibilità maggiore rispetto ad un indice pedigree il valore genetico di un soggetto giovane. 2. ridurre l’intervallo di generazione. 3. massimizzare la scelta dei soggetti da inviare alle prove di progenie e/o da utilizzare come padri di toro/vacca. 4. aumentare l’attendibilità dei tori in prova quando il numero di figlie è ridotto. Il calcolo di un indice genomico è basato in sintesi su: 1. genotipizzazione dei singoli soggetti. 2. raccolta fenotipi (indici genetici tradizionali – EBV). 3. stima valore dei singoli marcatori (SNP) che compongono il genotipo. 4. calcolo indice genomico diretto (DGV) e complessivo (GEBV). Vediamo nel dettaglio come la nuova metodologia è stata sviluppata in Anafi. DATI I dati utilizzati si riferiscono sia ai genotipi dei tori che ai loro indici genetici tradizionali, utilizzati come fenotipo di partenza per la stima degli effetti dei singoli marcatori. Per quanto riguarda i genotipi, questi sono stati raccolti attraverso la collaborazione dell’Anafi con due progetti di ricerca (SelMol e Prozoo), un accordo di collaborazione con tre Centri di FA italiani (Ciz, Inseme e Intermizoo), scambi di materiale con alcuni paesi europei (Irlanda e Svizzera) e con un accordo internazionale siglato con il Nord America e con l’Inghilterra. In totale sono ora disponibili circa 22 mila genotipi. NUMERO DI GENOTIPI La distribuzione dei genotipi per origine RACCOLTI ATTRAVERSO I Tabella 1 VARI PROGETTI E/O ACpuò essere osservata nella tabella 1. I genoCORDI tipi si riferiscono sia a tori già provati che a tori giovani e vacche. Va quindi ricordato PROGETTO/ACCORDO N° GENOTIPI RICEVUTI che il numero di soggetti genotipizzati è in SelMol 1035 continuo aumento in quanto i vari Centri di FA continuano a raccogliere campioni dai ProZoo 1143 vitelli, al fine di pre-selezionare i migliori. ELICA (Anafi, Ciz, Inseme, Intermizoo) 3219 MODELLO STATISTICO Per poter calcolare un indice genomico è necessario stimare il valore dei singoli marcatori (attualmente circa 50 mila) che 10 BIANCONERO . NOVEMBRE 2011 Nord-America Inghilterra Svizzera Irlanda 15715 1063 75 142 IL GLOSSARIO DELLA GENOMICA A partire dal prossimo dicembre verrà introdotta anche in Italia la prima valutazione dei tori ottenuta utilizzando parte delle informazioni presenti nel loro DNA. Non ci saranno solamente nuovi indici, ma anche nuovi termini e nuove definizioni. Per facilitare la comprensione del nuovo sistema si è pensato di creare un breve glossario con alcune delle definizioni più utilizzate. Allele: particolare variante della sequenza di DNA possibilmente responsabile di forme alternative di un carattere. Ogni individuo ha un allele paterno e uno materno, che possono essere uguali (omozigote) o diversi (eterozigote). DGV: indice genomico diretto (semplice somma degli effetti dei marcatori). compongono il genotipo di un soggetto. Questa stima presuppone l’utilizzo di un modello matematico che partendo dagli indici tradizionali di un gruppo di tori ad altà attendibilità (tori provati) fornisca delle equazioni di stima basate appunto sui marcatori individuali. Queste equazioni potranno essere utilizzate per calcolare il valore genomico dei soggetti giovani o senza progenie. Schematicamente il processo di stima può essere cosi riassunto: 1. pulizia dei dati in entrata. 2. identificazione popolazione di riferimento (tori provati). 3. stima effetti marcatori utilizzando EBV tradizionali dei tori provati. 4. calcolo indice genomico per tutti i soggetti (tori provati + soggetti giovani). Il modello utilizzato in Anafi per la stima degli effetti include non solo i 40 mila marcatori che si ottengono dopo le iniziali operazioni di editing (pulizia) ma anche un effetto cosiddetto “poligenico”, inserito nel modello attraverso le informazioni di parentela dei soggetti. Le ricerche condotte hanno infatti dimostrato che attraverso i singoli marcatori non è possibile spiegare tutta la variabilità osservata. Questa parte di variabilità può essere “recuperata” tenendo conto nel modello anche delle parentele tra i soggetti: EBV = Marcatori + Parentela Classica (10%) + errore INDICE GENOMICO Una volta ottenuto il valore dei singoli marcatori è possibile calcolare un indice genomico diretto sia per i tori con figlie che per quelli senza figlie (tori giovani). Nel caso dei tori con figlie, l’informazione genomica diretta è combinata con l’informazione tradizionale in modo da aumentarne l’attendibilità. Il risultato finale è il GEBV. Il peso delle due informazioni (genomico diretto e EBV tradizionale) dipende dal numero di figlie disponibili; all’aumentare del numero di figlie, diminuisce il peso dell’indice genomico diretto. Questo rapporto può essere osservato nella figura 1, dove è riportato per il GPFT, il peso della genomica in funzione del numero di figlie. Figura 1 TORI PROVATI. CONTRIBUTO DELL’INDICE GENOMICO DIRETTO AL GEBV IN FUNZIONE DEL NUMERO DI FIGLIE DNA: (acido deossiribonucleico). È la sostanza che costituisce il patrimonio genetico, formata dalla successione di 4 basi nucleotidiche. EBV: indice tradizionale. GEBV: combinazione dell’indice tradizionale ottenuto tramite le informazioni sulle figlie (EBV) e dell’indice genomico diretto (DGV). Gene: (unità fisica fondamentale dell’eredità). Un segmento di DNA che codifica per una funzione o alcune funzioni correlate. Genoma: l’insieme dei cromosomi contenuti in ogni cellula di un organismo. Genomica: area della biologia molecolare che si occupa dello studio del genoma degli organismi viventi. Nel caso dei tori giovani, l’indice genomico diretto (DGV) potrebbe essere combinato con l’indice pedigree (il toro giovane non ha figlie e quindi non ha un indice tradizionale disponibile). In realtà, il modello utilizzato già include l’effetto del pedigree e quindi l’eventuale combinazione potrebbe portare ad un conteggio doppio dell’informazione derivante dalla parentela classica. Per ovviare a questo problema, non ancora risolto a livello di metodologia di calcolo, è utile utilizzare l’indice genomico ottenuto direttamente dal modello, senza combinarlo con altre informazioni. ATTENDIBILITÀ Uno dei più grossi vantaggi della valutazione genomica risiede nella maggiore attendibilità degli indici ottenuti, soprattutto nel caso dei tori senza figlie. Attualmente un toro giovane viene valutato solo attraverso un indice pedigree, la cui attendibilità supera raramente il 35%. Attraverso l’uso della genomica è possibile ottenere degli indici con attendibilità intorno al 65-70%, circa il doppio rispetto a quella ottenuta con il metodo classico. Nella figura 2 si può osservare, per l’indice di selezione nazionale (PFT), la differenza di attendibilità ottenuta con la valutazione tradizionale e quella genomica sia per i tori provati (italiani od esteri) che per quelli giovani. Genotipizzazione: Il processo di determinazione del genotipo attraverso l’analisi del DNA. Si confronta una determinata sequenza con un altra. La genotipizzazione tramite SNP è la misura delle variazioni genetiche (alleli) del polimorfismo di un singolo nucleotide (SNP). Genotipo: l’insieme dei BIANCONERO . NOVEMBRE 2011 11 Figura 2 ATTENDIBILITÀ TRADIZIONALE E GENOMICA geni che compongono il DNA di un organismo o di una popolazione. Imputazione: metodologia che serve a stimare parti di genotipo mancanti, utilizzando le informazioni di individui della stessa famiglia. Nel caso dei tori giovani l’incremento medio dell’attendibilità per il PFT è di circa il 25%, mentre per i tori provati l’incremento è più ridotto. Questo è un risultato atteso perché sta ad indicare che per i tori con figlie la genomica aggiunge poco: sono le figlie che forniscono i dati per la loro stima. TREND GENETICO I risultati ottenuti con la nuova valutazione genomica possono essere confrontati con quelli della valutazione tradizionale attraverso l’analisi del trend genetico (figura 3). Figura 3 TREND GENETICO PFT - CONFRONTO TRA VALUTAZIONE TRADIZIONALE E VALUTAZIONE GENOMICA Come si può osservare nel caso dei tori provati (nati prima del 2007), l’indice genetico tradizionale e l’indice genomico sono pressoché sovrapposti. Questo è quello che ci saremmo aspettati perché l’indice genomico dei tori provati è basato principalmente sulle informazioni derivanti dalle figlie. Per quanto riguarda i tori giovani (nati dopo il 2007), l’indice genomico risulta più basso dell’attuale indice pedigree, ma anche questo è un risultato atteso, per due motivi. Innanzitutto si deve ricordare che l’attuale indice dei tori giovani è un indice pedigree, ottenuto sommando metà dell’indice paterno e metà dell’indice materno. Attualmente il modello genomico non considera la linea femminile direttamente, ma solo quella maschile (quindi i padri dei giovani tori ed i loro nonni materni). Questo approccio non è una negazione del lavoro svolto sinora sulla linea femminile, ma un primo tentativo di non inficiare il dato genomico con un indice femminile tradizionale che, soprattutto per le vacche d’élite, soffre di una certa e risaputa sovrastima. Quando anche per la popolazione femminile saranno disponibili un numero di genotipi sufficienti ed i modelli statistici saranno in grado di gestire il problema della sovrastima, questa informazione potrà essere inserita nel calcolo complessivo senza causare problemi all’indice finale. STABILITÀ TORI PROVATI Nel caso dei tori provati, un aspetto importante è quello della stabilità del loro indice tra uscite successive. Questa analisi può essere effettuata confrontando l’an- 12 BIANCONERO . NOVEMBRE 2011 Marcatori molecolari: Pezzi di DNA i cui alleli sono facilmente identificabili in laboratorio. Vengono utilizzati per seguire geni vicini. Nucleotide: Parte elementare del DNA. Pannello di marcatori molecolari SNP: kit di laboratorio utilizzato per determinare il genotipo di un certo soggetto (genotipizzazione). I kit possono contenere un numero diverso di informazioni. Il più comune è il 54K, che contiene circa 54 mila informazioni. I più recenti sono quelli ad Alta Densità (HD), che contiene oltre 800 mila informazioni ed a Bassa Densità (LD) con circa 3 mila informazioni. Polimorfismo: Presenza contemporanea nella stessa popolazione di due o più alleli o nucleotidi. SNP: (=polimorfismo di un singolo nucleoti- damento nel tempo delle differenze medie tra gli indici dei tori ottenuti sia con la valutazione tradizionale che con la valutazione genomica (figure 4 e 5). Figura 4 Figura 5 CONFRONTO TRA DIFFERENZE MEDIE INDICI APRILE 2011/ AGOSTO 2011 PER DATA DI USCITA DEL TORO. INDICI LATTE TRADIZIONALI (D.EBVM) E GENOMICI (D.GEBVM) CONFRONTO TRA DIFFERENZE MEDIE INDICI APRILE 2011/ AGOSTO 2011 PER DATA DI USCITA DEL TORO. INDICI PROTEINA TRADIZIONALI (D.EBVP) E GENOMICI (D.GEBVP) Teoricamente queste differenze dovrebbero oscillare intorno allo 0, con una maggiore variabilità nelle uscite più recenti. Questo è quello che si osserva sia nelle figure 4 e 5. L’indice genomico non introduce una minore stabilità, ma mantiene (ed anzi migliora) i risultati ottenuti sinora con la valutazione tradizionale. de). Un polimorfismo ad una specifica base o nucleotide nella sequenza del DNA. Per esempio, in un punto della sequenza del DNA dove un allele ha una A e un altro allele avrà una T. Toro provato genomico: toro con figlie il cui indice finale (GEBV) risulta dalla combinazione dell’indice tradizionale (EBV) e dell’indice g e n o m i c o d i re t t o (DGV). Toro giovane genomico: toro senza figlie il cui indice (DGV) è ottenuto direttamente dai marcatori e dal pedigree. BIANCONERO . NOVEMBRE 2011 13