La selezione genomica per la Frisona Italiana

Transcript

La selezione genomica per la Frisona Italiana
DALL’UFFICIO RICERCA E SVILUPPO
La selezione genomica
per la Frisona Italiana
Dopo un periodo di ricerca e di prove, anche per la Frisona Italiana verrà pubblicata una nuova valutazione
genetica basata sulle informazioni presenti nel DNA di un soggetto. I nuovi indici, detti “genomici”, saranno
disponibili per i tori provati, ma anche per i tori giovani senza figlie. Vediamo con qualche dettaglio in più come si arriva al nuovo indice.
INTRODUZIONE
Entro la fine di quest’anno la genomica, branca della biologia molecolare che si occupa dello studio del genoma (patrimonio genetico) degli organismi viventi, diventerà un nuovo strumento selettivo al servizio degli allevatori di Frisona Italiana. Sino
ad oggi gli strumenti utilizzati per stimare il valore genetico degli animali da reddito
si basavano su due tipi di informazioni:
a. Dati fenotipici (produzioni figlie)
b. Anagrafica (Padre, Madre e progenie)
Con l’avvento di nuove tecnologie di analisi del DNA è ora possibile “conoscere”,
per ogni soggetto, una parte dei suoi geni (genotipo), stimarne il valore e calcolare
un Indice Genomico.
Questa nuova metodologia permette di:
1. stimare con un’attendibilità maggiore rispetto ad un indice pedigree il valore genetico di un soggetto giovane.
2. ridurre l’intervallo di generazione.
3. massimizzare la scelta dei soggetti da inviare alle prove di progenie e/o da utilizzare come padri di toro/vacca.
4. aumentare l’attendibilità dei tori in prova quando il numero di figlie è ridotto.
Il calcolo di un indice genomico è basato in sintesi su:
1. genotipizzazione dei singoli soggetti.
2. raccolta fenotipi (indici genetici tradizionali – EBV).
3. stima valore dei singoli marcatori (SNP) che compongono il genotipo.
4. calcolo indice genomico diretto (DGV) e complessivo (GEBV).
Vediamo nel dettaglio come la nuova metodologia è stata sviluppata in Anafi.
DATI
I dati utilizzati si riferiscono sia ai genotipi dei tori che ai loro indici genetici tradizionali, utilizzati come fenotipo di partenza per la stima degli effetti dei singoli
marcatori.
Per quanto riguarda i genotipi, questi sono stati raccolti attraverso la collaborazione dell’Anafi con due progetti di ricerca (SelMol e Prozoo), un accordo di collaborazione con tre Centri di FA italiani (Ciz, Inseme e Intermizoo), scambi di materiale con
alcuni paesi europei (Irlanda e Svizzera) e con un accordo internazionale siglato con
il Nord America e con l’Inghilterra. In totale
sono ora disponibili circa 22 mila genotipi.
NUMERO DI GENOTIPI
La distribuzione dei genotipi per origine
RACCOLTI ATTRAVERSO I
Tabella 1 VARI PROGETTI E/O ACpuò essere osservata nella tabella 1. I genoCORDI
tipi si riferiscono sia a tori già provati che
a tori giovani e vacche. Va quindi ricordato
PROGETTO/ACCORDO
N° GENOTIPI RICEVUTI
che il numero di soggetti genotipizzati è in
SelMol
1035
continuo aumento in quanto i vari Centri di
FA continuano a raccogliere campioni dai
ProZoo
1143
vitelli, al fine di pre-selezionare i migliori.
ELICA (Anafi, Ciz, Inseme, Intermizoo) 3219
MODELLO STATISTICO
Per poter calcolare un indice genomico
è necessario stimare il valore dei singoli
marcatori (attualmente circa 50 mila) che
10
BIANCONERO . NOVEMBRE 2011
Nord-America
Inghilterra
Svizzera
Irlanda
15715
1063
75
142
IL GLOSSARIO
DELLA GENOMICA
A partire dal prossimo
dicembre verrà introdotta anche in Italia la
prima valutazione dei
tori ottenuta utilizzando parte delle informazioni presenti nel loro
DNA. Non ci saranno
solamente nuovi indici,
ma anche nuovi termini e nuove definizioni.
Per facilitare la comprensione del nuovo
sistema si è pensato di
creare un breve glossario con alcune delle definizioni più utilizzate.
Allele: particolare variante della sequenza
di DNA possibilmente responsabile di
forme alternative di
un carattere. Ogni
individuo ha un allele paterno e uno
materno, che possono essere uguali
(omozigote) o diversi
(eterozigote).
DGV: indice genomico diretto (semplice
somma degli effetti
dei marcatori).
compongono il genotipo di un soggetto. Questa stima presuppone l’utilizzo di un
modello matematico che partendo dagli indici tradizionali di un gruppo di tori ad
altà attendibilità (tori provati) fornisca delle equazioni di stima basate appunto sui
marcatori individuali. Queste equazioni potranno essere utilizzate per calcolare il
valore genomico dei soggetti giovani o senza progenie. Schematicamente il processo di stima può essere cosi riassunto:
1. pulizia dei dati in entrata.
2. identificazione popolazione di riferimento (tori provati).
3. stima effetti marcatori utilizzando EBV tradizionali dei tori provati.
4. calcolo indice genomico per tutti i soggetti (tori provati + soggetti giovani).
Il modello utilizzato in Anafi per la stima degli effetti include non solo i 40 mila
marcatori che si ottengono dopo le iniziali operazioni di editing (pulizia) ma anche
un effetto cosiddetto “poligenico”, inserito nel modello attraverso le informazioni di
parentela dei soggetti.
Le ricerche condotte hanno infatti dimostrato che attraverso i singoli marcatori
non è possibile spiegare tutta la variabilità osservata. Questa parte di variabilità può
essere “recuperata” tenendo conto nel modello anche delle parentele tra i soggetti:
EBV = Marcatori + Parentela Classica (10%) + errore
INDICE GENOMICO
Una volta ottenuto il valore dei singoli marcatori è possibile calcolare un indice genomico diretto sia per i tori con figlie che per quelli senza figlie (tori giovani).
Nel caso dei tori con figlie, l’informazione genomica diretta è combinata con l’informazione tradizionale in modo da aumentarne l’attendibilità. Il risultato finale è il
GEBV. Il peso delle due informazioni (genomico diretto e EBV tradizionale) dipende
dal numero di figlie disponibili; all’aumentare del numero di figlie, diminuisce il peso dell’indice genomico diretto. Questo rapporto può essere osservato nella figura
1, dove è riportato per il GPFT, il peso della genomica in funzione del numero di
figlie.
Figura 1
TORI PROVATI. CONTRIBUTO DELL’INDICE GENOMICO DIRETTO AL GEBV IN
FUNZIONE DEL NUMERO DI FIGLIE
DNA: (acido deossiribonucleico). È la sostanza che costituisce il
patrimonio genetico,
formata dalla successione di 4 basi nucleotidiche.
EBV: indice tradizionale.
GEBV: combinazione
dell’indice tradizionale ottenuto tramite le
informazioni sulle figlie (EBV) e dell’indice genomico diretto
(DGV).
Gene: (unità fisica fondamentale dell’eredità). Un segmento di
DNA che codifica per
una funzione o alcune funzioni correlate.
Genoma: l’insieme dei
cromosomi contenuti
in ogni cellula di un
organismo.
Genomica: area della
biologia molecolare
che si occupa dello
studio del genoma
degli organismi viventi.
Nel caso dei tori giovani, l’indice genomico diretto (DGV) potrebbe essere combinato con l’indice pedigree (il toro giovane non ha figlie e quindi non ha un indice
tradizionale disponibile). In realtà, il modello utilizzato già include l’effetto del pedigree e quindi l’eventuale combinazione potrebbe portare ad un conteggio doppio
dell’informazione derivante dalla parentela classica. Per ovviare a questo problema,
non ancora risolto a livello di metodologia di calcolo, è utile utilizzare l’indice genomico ottenuto direttamente dal modello, senza combinarlo con altre informazioni.
ATTENDIBILITÀ
Uno dei più grossi vantaggi della valutazione genomica risiede nella maggiore attendibilità degli indici ottenuti, soprattutto nel caso dei tori senza figlie. Attualmente un
toro giovane viene valutato solo attraverso un indice pedigree, la cui attendibilità
supera raramente il 35%. Attraverso l’uso della genomica è possibile ottenere degli
indici con attendibilità intorno al 65-70%, circa il doppio rispetto a quella ottenuta
con il metodo classico. Nella figura 2 si può osservare, per l’indice di selezione nazionale (PFT), la differenza di attendibilità ottenuta con la valutazione tradizionale e
quella genomica sia per i tori provati (italiani od esteri) che per quelli giovani.
Genotipizzazione: Il
processo di determinazione del genotipo
attraverso l’analisi
del DNA. Si confronta una determinata
sequenza con un altra. La genotipizzazione tramite SNP è
la misura delle variazioni genetiche (alleli)
del polimorfismo di
un singolo nucleotide
(SNP).
Genotipo: l’insieme dei
BIANCONERO . NOVEMBRE 2011
11
Figura 2
ATTENDIBILITÀ TRADIZIONALE E GENOMICA
geni che compongono il DNA di un
organismo o di una
popolazione.
Imputazione: metodologia che serve a stimare parti di genotipo mancanti, utilizzando le informazioni di individui della
stessa famiglia.
Nel caso dei tori giovani l’incremento medio dell’attendibilità per il PFT è di circa il 25%, mentre per i tori provati l’incremento è più ridotto. Questo è un risultato
atteso perché sta ad indicare che per i tori con figlie la genomica aggiunge poco:
sono le figlie che forniscono i dati per la loro stima.
TREND GENETICO
I risultati ottenuti con la nuova valutazione genomica possono essere confrontati
con quelli della valutazione tradizionale attraverso l’analisi del trend genetico (figura 3).
Figura 3
TREND GENETICO PFT - CONFRONTO TRA VALUTAZIONE TRADIZIONALE E
VALUTAZIONE GENOMICA
Come si può osservare nel caso dei tori provati (nati prima del 2007), l’indice
genetico tradizionale e l’indice genomico sono pressoché sovrapposti. Questo è
quello che ci saremmo aspettati perché l’indice genomico dei tori provati è basato
principalmente sulle informazioni derivanti dalle figlie. Per quanto riguarda i tori
giovani (nati dopo il 2007), l’indice genomico risulta più basso dell’attuale indice
pedigree, ma anche questo è un risultato atteso, per due motivi. Innanzitutto si deve
ricordare che l’attuale indice dei tori giovani è un indice pedigree, ottenuto sommando metà dell’indice paterno e metà dell’indice materno. Attualmente il modello
genomico non considera la linea femminile direttamente, ma solo quella maschile
(quindi i padri dei giovani tori ed i loro nonni materni). Questo approccio non è
una negazione del lavoro svolto sinora sulla linea femminile, ma un primo tentativo
di non inficiare il dato genomico con un indice femminile tradizionale che, soprattutto per le vacche d’élite, soffre di una certa e risaputa sovrastima. Quando anche
per la popolazione femminile saranno disponibili un numero di genotipi sufficienti
ed i modelli statistici saranno in grado di gestire il problema della sovrastima, questa
informazione potrà essere inserita nel calcolo complessivo senza causare problemi
all’indice finale.
STABILITÀ TORI PROVATI
Nel caso dei tori provati, un aspetto importante è quello della stabilità del loro
indice tra uscite successive. Questa analisi può essere effettuata confrontando l’an-
12
BIANCONERO . NOVEMBRE 2011
Marcatori molecolari:
Pezzi di DNA i cui
alleli sono facilmente identificabili in laboratorio. Vengono
utilizzati per seguire
geni vicini.
Nucleotide: Parte elementare del DNA.
Pannello di marcatori
molecolari SNP: kit
di laboratorio utilizzato per determinare il genotipo di un
certo soggetto (genotipizzazione). I kit
possono contenere
un numero diverso
di informazioni. Il più
comune è il 54K, che
contiene circa 54 mila informazioni. I più
recenti sono quelli
ad Alta Densità (HD),
che contiene oltre
800 mila informazioni
ed a Bassa Densità
(LD) con circa 3 mila
informazioni.
Polimorfismo: Presenza
contemporanea nella
stessa popolazione
di due o più alleli o
nucleotidi.
SNP: (=polimorfismo di
un singolo nucleoti-
damento nel tempo delle differenze medie tra gli indici dei tori ottenuti sia con la
valutazione tradizionale che con la valutazione genomica (figure 4 e 5).
Figura 4
Figura 5
CONFRONTO TRA DIFFERENZE MEDIE INDICI APRILE 2011/ AGOSTO 2011
PER DATA DI USCITA DEL TORO. INDICI LATTE TRADIZIONALI (D.EBVM) E GENOMICI (D.GEBVM)
CONFRONTO TRA DIFFERENZE MEDIE INDICI APRILE 2011/ AGOSTO 2011
PER DATA DI USCITA DEL TORO. INDICI PROTEINA TRADIZIONALI (D.EBVP) E
GENOMICI (D.GEBVP)
Teoricamente queste differenze dovrebbero oscillare intorno allo 0, con una
maggiore variabilità nelle uscite più recenti. Questo è quello che si osserva sia nelle
figure 4 e 5. L’indice genomico non introduce una minore stabilità, ma mantiene (ed
anzi migliora) i risultati ottenuti sinora con la valutazione tradizionale.
de). Un polimorfismo
ad una specifica base
o nucleotide nella sequenza del DNA. Per
esempio, in un punto
della sequenza del
DNA dove un allele
ha una A e un altro
allele avrà una T.
Toro provato genomico: toro con figlie
il cui indice finale
(GEBV) risulta dalla
combinazione dell’indice tradizionale
(EBV) e dell’indice
g e n o m i c o d i re t t o
(DGV).
Toro giovane genomico: toro senza figlie
il cui indice (DGV) è
ottenuto direttamente dai marcatori e dal
pedigree.
BIANCONERO . NOVEMBRE 2011
13