1-d - Familias home page

Transcript

1-d - Familias home page
Metodi statistici
in genetica forense
Interpretazione di profili STR:
misture e DNA Low Template
Bologna, 6-7 giugno 2016
Approccio Binario e
Approccio Probabilistico
Metodi
statistici
di base
Compatibilità
Esclusione
Modello
Binario
RMNE
Binary LR
(uso dei soli alleli)
Metodi statistici avanzati
Approccio Probabilistico: tutto è possibile
Modello
Semi-continuo
LRmixstudio, FST
(alleli, drop in/drop out)
Aumenta la complessità
Sempre più difficile da spiegare
Modello
Continuo
EuroForMix, STRmix, DNA
view mix (drop in, drop out,
altezza/area dei picchi)
Modello Binario
Metodi
statistici
di base
Compatibilità
Esclusione
Modello
Binario
RMNE
Binary LR
(uso dei soli alleli)
RMNE: profili non ambigui con alleli sopra la ST
LR = Pr(E|Hp)/Pr(E|Hd)
LR= 1/freq. profilo
Pr(E|Hp)<1
singolo contributore
LTDNA
Modelli
semi-continuo e continuo
Metodi statistici avanzati
Approccio Probabilistico: tutto è possibile
Modello
Semi-continuo
LRmixstudio, FST
(alleli, drop in/drop out)
LR = Pr(E|Hp)/Pr(E|Hd)
Pr(E|Hp)<1
Modello
Continuo
EuroForMix, STRmix, DNA
view mix (drop in, drop out,
altezza/area dei picchi)
Low template DNA
Procedura per interpretare un profilo misto
(Clayton rules and ISFG Recommendations)
# Step 1: identificare la presenza di una mistura sulla base di:
• Numero di alleli
- > 2 alleli per locus per più loci del profilo
(no stutters, no mutazioni somatiche e genetiche)
• Peak imbalance = profilo sbilanciato
- Heterozygote balance (Hb) < 60%
- Stutter peaks > 15%
Procedura per interpretare un profilo misto
(Clayton rules and ISFG Recommendations)
# Step 2: attribuzione allelica
- no aspecifici (stutters, picchi pull-up, spikes, Off Ladder)
- ST e AT
-no drop-out
Pull-up peaks
Spikes
Split
peaks
Procedura per interpretare un profilo misto
(Clayton rules and ISFG Recommendations)
• # Step 3: determinare il numero di contributori
- numero di alleli
- dati circostanziali del caso in esame
- possibili soggetti correlati
- maggior/minor contributore
deconvoluzione del profilo
- misture complesse (es. numero di alleli/locus > 6) profilo non
interpretabile con LR (solo RMNE)
Procedura per interpretare un profilo misto
(Clayton rules and ISFG Recommendations)
# Step 4: con due contributori posso stimare
il rapporto delle due componenti
• Calcolo Hb = φ12/φ15 dove φ = area o altezza
•
•
•
•
Mixture proportion (MX)
MX = φ12+ φ15/φ12+ φ13+ φ14+ φ15
Mixture ratio (MR)
MR= φ12+ φ15/ φ13+ φ14
MX=1097+1186/1097+253+368+1186 = 0.78 = 78%
MR= 1097+1186/253+368 = 3.67
Procedura per interpretare un profilo misto
(Clayton rules and ISFG Recommendations)
# Step 5: combinazioni genotipiche
-
tutti i possibili genotipi
unrestricted combinatorial approach
sulla base di PHR > 60% e Mx si escludono i genotipi non possibili
Restricted combinatorial approach
Possibili
genotipi
PHR
12,13
253/1097=0.23
12,14
368/1097=0.33
12,15
1097/1186=0.92
√
13,14
253/368=0.67
√
13,15
253/1186=0.21
14,15
368/1186=0.31
Procedura per interpretare un profilo misto
(Clayton rules and ISFG Recommendations)
# Step 5: confronto con il campione di riferimento
- in caso di match si valuta il peso dell’evidenza mediante
calcolo statistico idoneo
- testare le ipotesi formulate, nel caso considerare ipotesi
alternative
- la deconvoluzione del profilo risulta più complessa in caso di
alleli condivisi e in posizione stutter
Metodi statistici:
profili misti e DNA Low template
Esempio: mistura, 1 locus
Traccia
1
2
3
Non consideriamo
le altezze dei picchi
Vittima
(contributore noto)
1
2
2 contributori
Sospettato
3
RMNE: probabilità che un uomo a caso non possa essere escluso
come contributore della mistura
pi=0.2
1
2
1
2
3
RMNE = (p1+p2+p3)2 =
= p12+p22+p32+ 2p1p2+2p2p3+2p1p3= 0.36
Nessuna ipotesi
No numero di contributori
No correlazione tra contributori
No effetti stocastici (se sotto ST il locus non viene incluso)
3
LIKELIHOOD RATIO
Si formulano le ipotesi :
Hp= Vittima (V)+Sospettato(S)
Hd= Vittima (V)+sconosciuto(U)
P(E|Hp)
LR =
P(E|Hd)
1
2
1
2
3
Rapporto tra due probabilità:
 probabilità dell’evidenza (E) data l’ipotesi dell’accusa (Hp)
 probabilità dell’evidenza (E) data l’ipotesi della difesa (Hd)
LR unrestricted: considera solo gli alleli (1, 2, 3)
LR restricted: utilizza anche l’altezza dei picchi per determinare le combinazioni
possibili (Hb e Mx)
3
LIKELIHOOD RATIO
Pi=0.2
Hp= V+S
Hd= V+U
P(E|Hp)
LR = P(E|Hd)
=
1
p32+2p1p3+2p2p3
=
1
0.2
=5
Espressione corretta:
1
2
1
2
data l’evidenza, è 5 volte più probabile SE i
contributori sono V+S piuttosto che V+U, non
correlato con il sospettato.
Regola del prodotto se i loci sono indipendenti tra di loro
es. LR=LR1*LR2*LR=5*10*2=100
3
3
LR dipende dalle frequenze alleliche del sospettato
Hp= V+S
Hd= V+U
E se gli alleli del sospettato non sono frequenti?
p1= 0.3; p2= 0.25; p3= 0.05
RMNE = (p1+p2+p3)2 = (0.3+0.25+0.05)2 = 0.36
RMNE non tiene conto dei profili di riferimento e
del numero di contributori
P(E|Hp)
LR =
P(E|Hd)
=
1
P32+2p1p3+2p2p3
=
1
0.0575
LR tiene conto delle frequenze alleliche
1
2
1
2
3
Mistura
Vittima
= 17
3
Sospettato
uso migliore dei dati
RMP: Random Match Probability
Hp= V+S
Hd= V+U
Maggiore e minore contributore
e altezze dei picchi diverse
Assumendo due contributori, la vittima
spiega gli alleli 1 e 2, il secondo contributore
deve spiegare il 3
RMP = p32+2p1p3+2p2p3
1
2
1
2
3
Mistura
Vittima
LR = 1/RMP
3
Sospettato
RMNE e LR: pro e contro
RMNE
LR
+ Facile da calcolare
+ Più facile da spiegare alla
corte
+ Non richiede di stabilire il
numero di contributori
+ Utilizza tutte le informazioni
+ Stima migliore del peso
dell’evidenza
+ Possibilità di modellare
fenomeni quali drop-out e
drop-in
-Non tiene conto di tutte i
dati disponibili
- non applicabile a LTDNA
- Più difficile da spiegare alla
corte
ISFG DNA commission raccomanda l’uso della LR per le misture
Raccomandazioni ISFG DNA Commission
• Recommendation 1: The likelihood ratio is the preferred approach to mixture
interpretation. The RMNE approach is restricted to DNA profiles where the
profiles are unambiguous. If the DNA crime stain profile is low level and some
minor alleles are the same size as stutters of major alleles, and/or if drop-out is
possible, then the RMNE method may not be conservative.
• Recommendation 2: Even if the legal system does not implicitly appear to
support the use of the likelihood ratio, it is recommended that the scientist is
trained in the methodology and routinely uses it in case notes, advising the
court in the preferred method before reporting the evidence in line with the
court requirements. The scientific community has a responsibility to support
improvement of standards of scientific reasoning in the court-room.
Raccomandazioni ISFG DNA Commission
• Recommendation 3: The methods to calculate likelihood ratios of
mixtures (not considering peak area) described by Evett et al.
[13] and Weir et al. [14] are recommended.
• Recommendation 4: If peak height or area information is used to
eliminate various genotypes from the unrestricted combinatorial
method, this can be carried out by following a sequence of
guidelines based on Clayton et al. [17].
Raccomandazioni ISFG DNA Commission
• Recommendation 5: The probability of the evidence under Hp is
the province of the prosecution and the probability of the
evidence under Hd is the province of the defence. The
prosecution and defence both seek to maximise their respective
probabilities of the evidence profile. To do this both Hp and Hd
require propositions. There is no reason why multiple pairs of
propositions may not be evaluated.
Raccomandazioni ISFG DNA Commission
• Recommendation 6: If the crime profile is a major/minor mixture,
where minor alleles are the same size (height or area) as stutters
of major alleles, then stutters and minor alleles are
indistinguishable. Under these circumstances alleles in stutter
positions that do not support Hp should be included in the
assessment.
• Recommendation 7: If drop-out of an allele is required to explain
the evidence under Hp: (S = ab; E = a), then the allele should be
small enough (height/area) to justify this.
(allele deve essere sotto la soglia stocastica)
Raccomandazioni ISFG DNA Commission
• Recommendation 8: If the alleles of certain loci in the DNA profile
are at a level that is dominated by background noise, then a
biostatistical interpretation for these alleles should not be
attempted.
• Recommendation 9: In relation to low copy number, stochastic
effects limit the usefulness of heterozygous balance and mixture
proportion estimates. In addition, allelic drop-out and allelic
drop-in (contamination) should be taken into consideration of
any assessment.
Misture complesse
Calcoli complessi
Drop out e Drop in
• Fenomeni stocastici che si verificano in presenza di DNA
Low Template
• Drop out (no amplificazione di un allele) sotto la soglia
stocastica
• Drop in (falso allele) non riproducibile
• Drop in ≠ contaminazione
Probabilità di drop out Pr(D)
soglia
approccio
binario
classico
Compatibilità
soglia
Probabilità di drop out ≈ 0
Esclusione
soglia
Approccio
probabilistico
Compatibilità
soglia
0 < Pr(D) < 1
Compatibilità?
• Introduce incertezza sulla presenza o meno di un allele
• Non si ragiona più in termini di compatibilità /esclusione
Drop out
Consideriamo per semplicità un solo contributore, ma il modello è
applicabile ugualmente alle misture
Evidence
Hp: Suspect
Hd: Unknown
1
Suspect
Hp: drop-out dell’allele 2
no drop-out dell’allele 1
Eventi indipendenti
1
2
Drop out
Hp: Suspect
Hd: Unknown
Hd:
• sconosciuto ha un genotipo che
contiene l’allele 1
• può essere un genotipo 1,1 senza
drop-out, oppure essere 1,Q
dove Q è un qualsiasi allele escluso 1
con drop-out di Q
Evidence
1
1
Suspect
2
Drop out
• Evidence
Binario LR =
0
p12
1
Probabilistico LR =
• Suspect
1
2
?
p12
? = un numero tra 0 e 1
Hp: Suspect
Hd: Unknown
Evidence
Suspect
Hp: Suspect
Hd: Unknown
1
1
2
Definiamo:
- probabilità di drop out di un allele ad un locus eterozigote: d
- probabilità di drop out di entrambi gli alleli: d2
- probabilità di drop out per gli omozigoti: d’
- probabilità di non drop out: 1-d e 1-d’
Soglia analitica
con d’≤ d2
Esempio: LR considerando drop out
Evidence
Suspect
Hp: Suspect
Hd: Unknown
1
1
2
Affinchè sia vera Hp:
 l’allele 2 ha subito drop out
 l’allele 1 non ha subito drop out
Affinchè sia vera Hd lo sconosciuto
deve avere un genotipo che contenga
l’allele 1:
Genotipo Drop-out
1,1
1-d'
Probabilità del genotipo
p12
1,Q
2p1pq
(1-d)d
Q = qualsiasi allele diverso da allele 1
Assumendo che il locus abbia 5 alleli, ciascuno con frequenza pi:
Q={2,3,4,5} e pQ=p2+p3+p4+p5
P(E|Hp)=P(drop-out 2)*P(non drop-out 1)
= d(1-d)
P(E|Hd)=p12(1-d’)+2p1pq(1-d)d
P(E|Hp)
LR =
P(E|Hd)
=
d(1-d)
p12(1-d’)+2p1pq(1-d)d
Effetto della P(dropout) e delle frequenze alleliche su LR
Suspect
 p1=0.2, pQ=0.8, d=0.05, d’=0.052
1 2
LR =
0.05(1-0.05)
0.22(1- 0.052)+2*0.2*0.8(1-0.05)*0.05
= 0.86
Evidence
1
 p1=0.2, pQ=0.8, d=0.3, d’=0.32
LR =
0.3(1-0.3)
0.22(1-
0.32)+2*0.2*0.8(1-0.3)*0.3
= 2.03
 p1=0.01, pQ=0.99, d=0.05, d’=0.052
LR =
0.05(1-0.05)
0.012(1- 0.052)+2*0.01*0.99(1-0.05)*0.05
= 45.66
Drop in
Hp: Suspect
Hd: Unknown
Hp: drop-in allele 2
Hd: sconosciuto con genotipo 1,2
e no drop-in
c = probabilità di drop in di un allele
Suspect
1
Evidence
c = 0.05
p1=0.21
p2=0.21
LR = Pr(E|S)
Pr(E|U)
≈
cp2
2p1p2
c
= 2p
1
= 0.12
1
2
Esempio: LR considerando drop out e drop in
Suspect
Evidence
1
2
Hp: Suspect
Hd: Unknown
3
Affinché sia vera Hp:
 gli alleli 1 e 3 hanno subito drop out
 l’allele 2 ha subito drop in
P(E|Hp)=P(drop-out 1)*P(drop-out 3)
*P(dropin 2)= d*d*cp2
P(dropin)=c, P(dropin allele 2)=cp2
Affinché sia vera Hd lo sconosciuto può
avere qualsiasi genotipo:
Genotipo Dropout Dropin
Probabilità del genotipo
2,2
(1-d')
(1-c)
p22
2,Q
(1-d)d
(1-c)
2p2pQ
Q,Q
d'
cp2
pQ2
Q = ogni allele diverso da quello presente nella traccia
Assumendo che il locus abbia 5 alleli, ciascuno con frequenza pi:
Q={2,3,4,5} e pQ=p2+p3+p4+p5
P(E|Hd)=p22(1-c)(1-d’)+2p2pQ(1-d)d(1-c) +
pQ2*d’*cp2
LR =
d*d*cp2
p22(1-c)(1-d’)+2p2pQ(1-d)d(1-c) + pQ2*d’*cp2
Effetto della P(dropout), della P(dropin) e delle frequenze alleliche su LR
Sospettato
 p2=0.1, pQ=0.9, d=0.3, d’=0.32, c=0.05
1 3
0.3*0.3*0.05*0.1
LR =
0.12(1- 0.32)(1-0.05)+2*0.1*0.9(1-0.3)0.3(1-0.05)+0.92*0.05*0.1
= 0.01
Traccia
2
 p2=0.5, pQ=0.5, d=0.3, d’=0.32, c=0.05
LR =
0.3*0.3*0.05*0.5
0.52(1-
0.32)(1-0.05)+2*0.5*0.5(1-0.3)0.3(1-0.05)+0.52*0.05*0.5
= 0.007
 p2=0.5, pQ=0.5, d=0.8, d’=0.82, c=0.5
LR =
0.8*0.8*0.5*0.5
0.52(1-
0.82)(1-0.5)+2*0.5*0.5(1-0.8)0.8(1-0.5)+0.52*0.5*0.5
= 1.28
1) Probabilistic methods following the ‘basic model’ can be used to evaluate
the evidential weight of DNA results considering drop-out and/or drop-in.
2) Estimates of drop-out and drop-in probabilities should be based on
validation studies that are representative of the method used.
3) The weight of the evidence should be expressed following likelihood ratio
principles.
4) The use of appropriate software is highly recommended to avoid hand
calculation errors.
Semi -continuous models
 Gli
esempi
considerati
sono
(1 solo contributore, 1 solo sistema)
molto
semplificati
 Considerando più contributori e più sistemi i calcoli diventano
più complicati
approccio probabilistico
Necessario un software!!!!!
LRmix studio
Software analoghi: likeLTD (D. Balding) e FST (NYOCME, Mitchell et al)
Continuous LR models

•
•
•
Software:
TrueAllele (Perlin et al. JFS, 2011)
STRmix (Taylor et al., FSIG, 2013)
EuroForMix (Bleka Ø et al., FSIG 2016)
 Includono dati come: altezza/area dei picchi, bilanciamento degli
eterozigoti (PHR), % stutters e il rapporto tra contributori (Mx)
 Più informazioni
di simulazione
numerosi calcoli complicati e modelli
 Non è possibile il confronto con il calcolo fatto a mano