Scheda tecnica di tutti i servizi di sequenziamento Ion
Transcript
Scheda tecnica di tutti i servizi di sequenziamento Ion
Sequenziamento con il sistema ION PGM Obiettivi Il sequenziatore Ion Personal Genome Machine (PGM) e’ uno strumento altamente versatile i cui campi di applicazione sono i seguenti: • • • • • sequenziamento mirato di DNA; sequenziamento mirato di RNA; sequenziamento di PICCOLI GENOMI; METAGENOMICA; PANNELLI a RNA e DNA. Il sequenziamento mirato di DNA o RNA si applica quando si conoscono a priori specifici DNA/RNA target di interesse: i target di interesse sono quindi amplificati via PCR e usati come input nel processo di preparazione delle librerie. Il sequenziamento di piccoli genomi, come la tipizzazione virale e batterica e il sequenziamento de novo di microbi, e’ utilizzato al fine di identificare, ad esempio, nuove specie, o di monitorare la presenza di virus e batteri in condizioni di salute e di malattia o di contaminazioni ambientali. Campioni polibatterici, inoltre, possono essere analizzati rapidamente in studi di metagenomica, amplificando le regioni ipervariabili del 16S. Due set di primers, corrispondenti alle regioni V2-4-8 e V3-6, 7-9, possono essere utilizzati da soli o in combinazione facilitando l’identificazione di un ampio spettro di batteri all’interno di una popolazione mista. TM I pannelli Ampliseq a RNA/DNA sono stati, infine, sviluppati per poter effettuare il sequenziamento mirato di specifiche regioni genomiche potenzialmente connesse all’insorgenza di patologie quali cancro e malattie ereditarie a carattere mendeliano o di trascritti genici coinvolti, ad esempio, in un determinato pathway biochimico o in una particolare fase/stadio di malattia. A seconda della profondità’ di sequenziamento desiderata e in funzione dell’applicazione scelta, si possono utilizzare tre chip differenti, Ion 314, 316 e 318. La sola differenza tra essi e’ data dal numero di pozzetti presenti sulla superficie del chip: cio’ permette di sequenziare da poche centinaia di migliaia di reads ad un massimo di 6-8M di reads a corsa. Applicazioni che richiedono, quindi, un numero limitato di reads a campione, come il sequenziamento mirato di DNA, l’analisi di genomi di piccole dimensioni (virus, batteri), l’analisi dell’espressione genica di pochi trascritti, puo’ essere fatta con qualsiasi dei chips sopra descritti. Pannelli Ion AmpliSeqTM TM La metodica che caratterizza i pannelli a DNA e/o RNA si basa sulla tecnologia Ion AmpliSeq che, utilizzando in multiplex diverse centinaia di coppie di primers, permette di selezionare, amplificandoli contemporaneamente, i diversi geni di interesse. I prodotti di amplificazione così ottenuti sono successivamente sequenziati su piattaforma Ion Torrent, PGM. Rispetto ai metodi di sequenziamento mirato attualmente disponibili commercialmente, il sistema Ion TM AmpliSeq richiede quantitativi di DNA o RNA piuttosto bassi (approssimativamente da 10 a 40 ng), permettendo quindi anche il sequenziamento di campioni di quantità esigua (vd. biopsie). Data la ridotta lunghezza degli ampliconi, il sistema ben si adatta anche all’amplificazione di campioni di DNA o RNA parzialmente degradato, come quello proveniente da materiale biologico conservato in paraffina (FFPE). TM Il sistema Ion AmpliSeq è ad oggi la migliore risposta ad analisi che richiedono un’elevata scalabilità del numero di campioni e/o geni, velocità e riproducibilità dell’informazione ottenuta. Esistono due tipologie di pannelli, predisegnati (ready to use) da Life Technologies o custom. Per la costruzione di pannelli personalizzati (custom) si utilizza il software Ion AmpliSeq™ Designer. Di seguito una descrizione generale dei pannelli per DNA: • Ion AmpliSeq™ DNA panels (uomo): I pannelli attualmente in commercio sono specifici per: l’analisi mirata di oncogeni e sopressori tumorali di diversi tumori; per lo studio di malattie ereditarie a carattere mendeliano; per altre malattie di rilevanza clinica come ad esempio la fibrosi cistica e la demenza precoce. I geni compresi nei diversi pannelli sono stati estrapolati considerando come database di riferimento COSMIC (Catalogue of Somatic Mutations in Cancer) per i geni legati al cancro, e NCBI ClinVar database per le malattie ereditarie. • Ion AmpliSeq™ DNA Custom Panels (varie specie): i pannelli personalizzati a DNA permettono il sequenziamento mirato di regioni genomiche di interesse di diversi genomi quali uomo, topo, maiale, pecora, mucca, pollo, mais e altri ancora. Nel caso in cui il genoma di riferimento non sia caricato nel software, puo’ essere importato manualmente. I primers vengono forniti in uno o più pool contenenti ciascuno dai 12 ai 6144 coppie di primers. Il numero dei pool varia a seconda della dimensione della regione genomica da analizzare. Di seguito una descrizione generale dei pannelli per RNA: • Ion AmpliSeq™ RNA panels (uomo): al momento esistono in commercio pannelli relativi a geni apoptotici, coinvolti nel cancro e nel tumore al polmone. Vengono valutati i livelli di espressione di mRNA come di RNA non codificanti ed in particolare, nell’ultimo pannello citato, si pone attenzione all’identificazione di trascritti di fusione dovuti a riarrangiamenti cromosomici. • Ion AmpliSeq™ RNA Custom Panels (uomo): i pannelli personalizzati permettono di scegliere al massimo 300 geni tra più di 20.000 geni da analizzare in contemporanea in un’unica reazione di amplificazione. Il numero di coppie di primer, forniti in un singolo pool, varia da un minimo di 12 ad un massimo di 300, a seconda del disegno richiesto. Creare questi pannelli e’ molto semplice, basta selezionare on line i propri targets di interesse, o la regione genomica di riferimento, e il software Ion AmpliSeq™ Designer crea il pannello piu’ adatto. Dove possibile, nei pannelli ad RNA, l’amplicone disegnato copre la giunzione esone-esone per minimizzare l’amplificazione di eventuale DNA genomico presente nel campione. Inoltre, la referenza utilizzata dal software per la sintesi degli ampliconi, contiene la sequenza del trascritto identificato come quella a piu’ alto coverage per ogni singolo gene in RefSeq. E’ possibile consultare una lista completa ed aggiornata dei pannelli a DNA e a RNA attualmente disponibili in commercio registrandosi al sito www.ampliseq.com Procedura di costruzione librerie Il procedimento per la costruzione di librerie AmpliSeq è comune sia per campioni a DNA che a RNA. Come mostrato in figura, se il materiale di partenza è costituito da RNA è previsto un passaggio iniziale di retrotrascrizione a cDNA. Le regioni bersaglio del DNA genomico o del cDNA sono amplificate in multiplex utilizzando pools di coppie di primers specifici. Gli ampliconi ottenuti sono quindi trattati enzimaticamente in modo da digerire parzialmente i primers di amplificazione e fosforilare gli ampliconi stessi. Dopo questo passaggio, alle due estremità di ciascun amplicone sono ligati covalentemente gli adattatori specifici (A/P1) richiesti per il sequenziamento con piattaforma Ion Torrent. In questa fase è possibile sostituire l’adattatore A con specifici adattatori dotati di codici a barre differenti marcando i diversi campioni. I prodotti della ligazione sono purificati tramite biglie magnetiche Agentcourt AMPure XP (SPRI technology) e sottoposti ad amplificazione tramite PCR che selezionerà solo le molecole dotate di entrambe le coppie di adattatori. La qualità e quantità delle librerie così ottenute è valutata mediante fluorimetria (Qubit) o microelettroforesi capillare (Agilent Bioanalyzer). Le librerie infine sono sequenziate, isolatamente o in multiplex. Per la costruzione di librerie non AmpliSeq, sono previsti due tipologie di librerie, a frammenti o mate-paired. La procedura alla base della costruzione delle librerie a frammenti è molto simile a quanto descritto per le librerie AmpliSeq. In generale, il DNA genomico e’ frammentato fino ad ottenere la grandezza desiderata e ligato agli adattatori specifici Ion. La libreria così ottenuta e’ selezionata per dimensione e amplificata per PCR per ottenere la quantita’ di DNA necessaria a procedere con la preparazione del templato sulle particelle Ion Sphere e il successivo sequenziamento. In questa categoria di librerie ricade anche quella utilizzata negli studi di metagenomica. In particolare, il DNA genomico prima di essere utilizzato per costruire la libreria, viene amplificato con primer specifici per le regioni ipervariabili del 16S. I prodotti di PCR cosi’ ottenuti sono uniti insieme in un unico pool e processati, come descritto sopra saltando la fase di frammentazione del campione. Le librerie mate-paired sono principalmente utilizzate per i sequenziamenti de novo in aggiunta alle librerie di frammenti. Ciò permette di riempire i buchi tra contigui rendendo più fattibile l’assemblaggio delle sequenze. Il DNA genomico, privo di contaminanti di RNA, viene inizialmente frammentato ad una grandezza media piu’ grande di quella dell’inserto desiderato. Le sue estremità sono riparate prima dell’aggiunta della coda A-tail e degli adattatori come in una libreria di frammenti. Viene quindi fatta una size-selection sul frammento per renderlo della dimensione desiderata e viene ligato ad una sorta di gancio utilizzato per identificare correttamente i frammenti. Questo inserto viene circolarizzato e trattato con diversi enzimi, inizialmente per rimuovere i frammenti lineari di DNA, e successivamente per tagliarlo nella lunghezza corretta facendo uso di un mix di enzimi specifici per ogni genoma. Viene ligato un altro adattatore, che riconosce correttamente le giunzioni del frammento, e la libreria cosi’ ottenuta e’ nuovamente circolarizzata ed amplificata per PCR, con un numero di cicli adeguato a ridurre una potenziale overamplificazione del frammento. La libreria purificata e’ adesso pronta per la preparazione del templato e il successivo sequenziamento con il sistema Ion PGM. Tipo e quantità di campione necessario La quantità e il tipo di campioni variano a seconda dell’applicazione di interesse e in funzione della richiesta di esecuzione del controllo di qualita’ iniziale sui campioni. Mediamente per i pannelli AmpliSeq, per DNA sono necessari dai 10 ai 40ng, mentre per l’ RNA si utilizzano dai 10 ai 20ng. Per tutte gli altri tipi di applicazione, si va dai 20ng ad 1ug di DNA a campione. Per maggiori dettagli si prega di consultare le schede progetto specifiche. Analisi Bioinformatica Ad ogni applicazione DNA o RNA e’ associata una procedura analitica specifica. Il punto di partenza e’ sempre il controllo di qualita’ ed il trimming delle read di sequenza, seguito dal mappaggio sul genoma di riferimento e dalla generazione dei files in formato binario .bam, contenenti le read allineate e quelle non allineate. In questa fase vengono anche generate tabelle e grafici riassuntivi. Nelle applicazioni di tipo ‘diagnostico’ (pannelli a DNA) viene generata una tabella riassuntiva estesa contenente i risultati dell’analisi di identificazione di SNV ed Indel identificati a seguito del mappaggio, corredati da informazioni come la posizione della variante, gli alleli di riferimento e variante, le call di ploidia, la frequenza dell’allele variante, il tipo di variante, il coverage e la qualita’ di sequenza in corrispondenza della variante. Queste informazioni di carattere fisico vengono complementate da annotazioni delle varianti ricavata dal confronto con database pubblici come dbSNP, COSMIC, OMIM e dalla predizione dell’effetto funzionale delle varianti non contenute in dbSNP. Nelle applicazioni di misura dell’espressione genica (pannelli a RNA) alla fase iniziale di mappaggio segue la quantificazione dell’espressione assoluta dei trascritti identificati e, ove richiesto dal progetto, l’espressione differenziale. Nelle applicazioni di sequenziamento DNA metagenomico (16S rRNA) alla fase di controllo di qualità e mappaggio sulla referenza 16S seguono i passaggi di una procedura messa a punto in Genomnia: l’analisi statistica della rappresentazione differenziale dei genomi (individui) distinti attribuibili a specie assegnate a generi o famiglie; l’analisi statistica della rappresentazione differenziale delle specie assegnate ad un genere; l’analisi di richness. Nelle applicazioni di sequenziamento di genomi batterici ‘de novo’, infine, alla fase iniziale di mappaggio segue l’assemblaggio delle sequenze in contigui genomici e la generazione di metriche come il numero di contigui ed il valore N50. Informazioni per gli ordini Richiedere ad [email protected] la scheda progetto specifica per l’applicazione di interesse. Trattamenti per DNA e RNA Prodotto N. Catalogo QC: controllo di qualità di preparazioni di RNA totale RNA03 QC: controllo di qualità di DNA DNA06 Preparazioni di librerie Prodotto N. Catalogo Preparazione di libreria AmpliSeq con codice a barre ASb Preparazione di libreria RNA AmpliSeq con codice a barre ASRb Preparazione di libreria DNA con codice a barre LDb Arricchimento della regione ipervaribile con il kit Ion 16S metagenomics 16S Preparazione librerie custom arricchite con codice a barre, fino a 10Mb ENRb Preparazione librerie da ampliconi di PCR con codice a barre, fino a 8kb AMPb Preparazione librerie mate-paired DNA LD_Mp Amplificazione di target specifici mediante pannelli AmpliSeq Pannello N. Catalogo Amplificazione dei target mediante sistema Ion AmpliSeq Cancer Hotspot Panel v2 ASD_Hp Amplificazione dei target mediante sistema Ion AmpliSeq Comprehensive Cancer Panel ASD_Cp Amplificazione dei target mediante sistema Ion AmpliSeq Inherited Disease Panel ASD_IDp Amplificazione dei target mediante sistema Ion AmpliSeq BRCA1 and BRCA2 Panel ASD_BRCAp Amplificazione dei target mediante sistema Ion AmpliSeq Colon and Lung Research Panel v2 ASD_CLp Amplificazione dei target mediante sistema Ion AmpliSeq Hearing Loss Research Panel v1 ASD_HLp Amplificazione dei target mediante sistema Ion AmpliSeq CFTR Panel ASD_CFTRp Amplificazione dei target mediante sistema Ion AmpliSeq TP53 Panel ASD_TP53p Amplificazione dei target mediante sistema Ion AmpliSeq Dementia Research Gene Panel ASD_Dp Amplificazione dei target mediante sistema Ion AmpliSeq AML Research Panel ASD_AMLp Amplificazione dei target mediante sistema Ion AmpliSeq RNA Cancer Panel ASR_Cp Amplificazione dei target mediante sistema Ion AmpliSeq RNA Apoptosis Panel ASR_Ap Amplificazione dei target mediante sistema Ion AmpliSeq RNA Fusion Lung Cancer Research Panel ASR_FLCp Amplificazione dei target mediante sistema Ion AmpliSeq RNA Custom Panels ASR_CUp Sequenziamento Prodotto N. Catalogo Sequenziamento forward 200 bp tags con codice a barre SEQI200B Sequenziamento forward 400 bp tags con codice a barre SEQI400B Sequenziamento mate-paired a 400 bp tags SEQI400MP Analisi Bioinformatica per ION Personal Genome Machine (PGM) Prodotto N. Catalogo Dati di sequenza, senza analisi bioinformatica SEQ-BF01 Trascrittoma Intero: analisi bioinformatica livello I WTA-BF01 Trascrittoma Intero: analisi bioinformatica livello II WTA-BF02 Piccoli RNA: analisi bioinformatica livello I MIR-BF01 Piccoli RNA: analisi bioinformatica livello II MIR-BF02 ChIP-seq: analisi bioinformatica livello I CHIP-BF01 ChIP-seq: analisi bioinformatica livello II CHIP-BF02 Risequenziamento dell’intero esoma: identificazione, classificazione ed annotazione delle varianti. FEX-BF01 Risequenziamento mirato: identificazione, classificazione ed annotazione delle varianti. TGT-BF01 Pannelli DNA Malattie Ereditarie: analisi bioinformatica livello I PANEL-BF01 Pannelli DNA cancro hotspot v.2: analisi bioinformatica livello I HOTSPOTBF01 Pannelli DNA cancro completi: analisi bioinformatica livello I COMPLETEBF01 Pannelli DNA BRCA1 & BRCA2: analisi bioinformatica livello I BRCA-BF01 Pannelli DNA custom: analisi bioinformatica livello I CUSTOMBF01 ION Torrent, PGM Rev. 1 – 02/2016