PLoS ONE: Amplicon sekvensointi peräsuolen syövän: Variant Calling Frozen ja Formaliinifiksoidusta Näytteet
tiivistelmä
Uuden sukupolven sekvensointi (NGS) on uusi tekniikka tulossa merkityksellisiä genotyypin kliinisistä näytteistä. Täällä me arvioida vakautta amplikonin sekvensointia peräisin formaliinilla kiinnitetyt, parafiiniin upotetut (FFPE) ja pariksi jäädytetty näytteitä kolorektaalisyövän etäpesäkkeitä eri analyysi putkistoja. 212 amplikonin alueet 48 syöpään liittyvät geenit sekvensoitiin Illumina MiSeq käyttämällä DNA eristettiin resektio näytteitä 17 potilailla, joilla peräsuolen syöpä maksassa etäpesäkkeitä. Kymmenestä näistä potilaista, pariksi tuore ja rutiininomaisesti käsitelty FFPE kudosta oli käytettävissä vertailevaa tutkimusta. Näyte laatu FFPE kudosten määritettiin määrä monistettavan DNA: sta käyttäen qPCR, sekvensointi kirjastot arvioitiin käyttäen Bioanalyzer. Kolme bioinformatiikan putkistojen verrattiin analysointiin amplikonin sekvensointia tietoja. Valitut hot spot mutaatioita tarkistettiin käyttäen Sangerin sekvensointia. Vuonna sekvensoitu näytteitä 16 potilaista, 29 ei-synonyymi koodaavat mutaatioita tunnistettiin yksitoista geenejä. Yleisimpiä olivat mutaatioita TP53 (10), APC (7), PIK3CA (3) ja KRAS (2). Suuri yksimielisiksi FFPE ja pariksi jäädytetyn kudosnäytteiden havaittiin kymmenen Hyväksytty näytteissä, paljastaen 21 identtinen mutaatio puhelut ja vain kaksi mutaatiota erilaiset. Vertailu näistä tuloksista kahden muun yleisesti käytettyjen variantti kutsuvan työkaluja, kuitenkin osoitti korkea poikkeamia. Siten amplikonin sekvensointia voidaan mahdollisesti käyttää tunnistamaan hot spot mutaatioita peräsuolen syövän etäpesäkkeitä jäädytetty ja FFPE kudosta. Kuitenkin merkittäviä eroja keskuudessa tuloksia eri varianttia kutsuvan työkaluja, jotka eivät liity ainoastaan DNA-näytteen laatu. Tutkimuksemme korostaa tarvetta standardointi ja esikuva variantin kutsuvan putkistojen, jota varten tarvitaan translaation ja kliinisissä sovelluksissa.
Citation: Betge J, Kerr G, Miersch T, Leible S, Erdmann G, Galata CL, et ai. (2015) Amplicon sekvensointi peräsuolen syövän: Variant Calling Frozen ja Formaliinifiksoidusta Näytteet. PLoS ONE 10 (5): e0127146. doi: 10,1371 /journal.pone.0127146
Academic Editor: Jeong-su Seo, Seoul National University College of Medicine, Korean tasavalta
vastaanotettu: 10 tammikuu 2015; Hyväksytty: 13 huhtikuu 2015; Julkaistu: toukokuu 26, 2015
Copyright: © 2015 Betge et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään
Data Saatavuus: kaikki asiaankuuluvat tiedot ovat saatavilla Euroopan Nucleotide Archive (ENA) hakunumerolla PRJEB8754.
Rahoitus: JB on tukenut apurahan päässä Hartmut-Hoffmann-Berling International Graduate School (HBIGS).
kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Koska viimeaikainen edistys syvässä sekvensointiteknologioihin, merkillistä oivalluksia on saatu sen muutoksista hankkimien peräsuolen syöpä (CRC) genomien aikana karsinogeeninen prosessi, pitkälti laajentamassa näkymä CRC genomista etenemiseen [1-3]. Lupauksen, että sen jälkeen kun rakenteellinen luonnehdinta syövän genomien, kliininen päätöksenteko ohjaavat yksittäiset genomista kasvain profiilit kuitenkin edelleen täyttyvän. Kuitenkin kehittää uusia kohdennettuja terapeuttisten korostetaan luotettavia ja kustannustehokkaita menetelmiä molekulaarinen syövän genomien tunnistaa potilaat, jotka lopulta reagoi hoitoon perusteella druggable mutaatioita, ennakoivaa muutoksia tai hankittu resistenssimerkkigeenejä.
Kohdennetut sekvensointi perustuu PCR amplikonit edustaa toteuttamiskelpoinen lähestymistapa arvioinnissa käytännöllisiä mutaatioiden, mutaatiostatuksesta kriisipesäkkeisiin tai ennakoivaa muutoksia syövän genomien kliinisissä tutkimuksissa. Verrattuna genominlaajuisten tai exome laajuinen sekvensointi, korkea syvyys sekvensointi ( 1000 lukee) sillä genomin loci kohteisiin pääsee, mikä helpottaa havaitsemista matalataajuista variantit heterogeenisissä Tuumorinäytteissä sekoittaa stroomasoluissa [4 , 5]. Lisäksi johtuen verrattain vähän emäsparien Sekvensoitavat potilasta kohden, useita näytteitä, myös pitkittäisanalyysin, voidaan analysoida rinnakkain penkki-top koneet kuten Illumina MiSeq, alentaa kustannuksia ja mahdollisesti mahdollistaa rutiinia kliinistä soveltamista lähitulevaisuudessa.
kuitenkin, kliiniseen soveltamiseen ja translaation tutkimuksia arkistoituja kliinistä näytettä, monet ongelmat ovat edelleen ratkaisematta. Laajimmin käytettävissä yksilöitä kliiniseen diagnostiikkaan ja biomarkkereiden tutkimukset ovat formaliinilla kiinnitetyt, parafiiniin upotetut (FFPE) kudoksia patologian arkistoista, koska niiden pitkäaikainen varastointi on suhteellisen yksinkertainen ja kustannustehokas verrattuna jäädytetty materiaalia. Kuitenkin on tunnettua, että formaliinilla kiinnitys johtaa kytkeminen kovalenttisesti DNA: ta, RNA: n ja proteiinin metyleeni siltoja, deaminaatio ja hapetusreaktioita, muodostuminen syklisen emäksen johdannaisten ja myös DNA: n fragmentoituminen [6]. Nämä DNA-muutokset vaikeuttavat sekvensointiteknologioihin johtaa vähemmän luotettavia tuloksia ja tulkintavaikeuksia tietojen sekvensointi kokeilut. Lisäksi kultakantaan analysoitaessa seuraavan sukupolven sekvensointi (NGS) dataa puuttuu ja laadunvarmistuksen ohjelmia ei käynnistetään vielä. Erilaiset bioinformatiikan analyysi, ja putkistot on kehitetty NGS tietoja. Vaikuttaa kuitenkin siltä, että toistettavuus niiden välillä on parannettava [7]. Lisäksi tilastollisia malleja variantin löytämisen ja variantti arviointi, suunniteltu koko-exome tai koko genomin tieto, joka koostuu monista näytteistä alhainen kattavuus, ehkä ole paras pienten amplikonin aineistoja muutamalla kohdennettua alueille. Näin ollen ei ole yleisesti hyväksyttyä standardia kuinka toimit variantti puhelut amplikonin sekvensointia tietoihin. Nämä ongelmat korostavat tarvetta näytteen valmistus ja data-analyysi putkistojen optimoitu amplikonin sekvensointia kliinisissä näytteissä.
Tässä tutkimuksessa kuvaamme kokeellisen ja bioinformatiikan putkilinjan amplikonin sekvensointia kliinisen tuore ja FFPE näytteitä CRC. Erityistä huomiota on piirretty valmistelusta sekvensointi kirjastojen huonolaatuisia FFPE näytteitä. Bioinformatiikan putki, käyttämällä mukautettu Genome Analysis Toolkit (GATK) Unified GENOTYPER, selitetään yksityiskohtaisesti ja verrataan muiden yleisesti käytettyjen variantti kutsuvan menetelmiä suhteessa niiden soveltuvuutta amplikonin sekvensointia käyttäen FFPE materiaalia.
Materiaalit ja menetelmät
potilaat
Kolmekymmentä kolme näytettä 17 potilasta joille tehtiin resektio maksan etäpesäke CRC Department of Surgery, yliopistollisen sairaalan Mannheim, helmi 2012 helmikuu 2013 olivat mukana tässä tutkimuksessa. Kaikki nämä potilaat, joko tuore tai formaliinilla kiinnitetyt, parafiiniin upotettuja (FFPE) kudosta käytettiin DNA: n eristämiseen. 10 potilaalla, pariksi jäädytetty ja FFPE kudosta oli käytettävissä tutkimus ja 5 potilasta, Hyväksytty primaarikasvainten voitaisiin saada arkistoon Institute of Pathology, University Hospital Mannheim. Lisäksi yksi täsmäsi ala-etäpesäke parin päässä neuroendocrine karsinooma ohutsuolen (Pat05), primäärisestä viljelmästä materiaalia yhdestä potilaasta (Pat16), materiaalia eturauhassyövän potilaan ja solulinjoissa DLD-1, HCT116, HT55, Huh7, HEK293T , HS68 ja SW480 sisältyivät sekvensointi kulkee ja analyysi muiden hankkeiden tai kontrolleina. Näytteet analysoitiin kaksi sekvensointi suoritetaan, yksi potilas (Pat13) analysoitiin sekä toimii kontrollina. Kaikki solulinjat saatiin ATCC: ltä. Tietoa potilaista löytyy S1 taulukossa.
eettisen hyväksynnän
Ethics hallituksen hyväksyntä on saatu Medical Ethics komissio II lääketieteellisen tiedekunnan Mannheimin, Heidelbergin yliopisto, Mannheim, Saksa (No. 2012-293N-MA, 2013-841R-MA, 2014-551N-MA). Kirjallinen suostumus luovuttajien kudosnäytteitä saatiin käyttöön tutkimuksessa.
Näytteen valmistus
Pakastetut näytteet ja solulinjoissa.
näytteet maksametastaaseja CRC: tä potilasta kuljetettiin RPMI soluviljelyalustassa ja jäädytettiin nopeasti kuivajäässä ja sen jälkeen säilytettiin -80 ° C: ssa. DNA eristys tehtiin Qiagen DNeasy Veren Tissue Kit (Qiagen, Hilden, Saksa) mukaan valmistajan suositusten mukaan lukien RNaasi ruoansulatus (kuvio 1A). Solulinjoja pelletoitiin ja DNA eristettiin samaa protokollaa. Uutettu DNA laimennettiin ja sitä käytettiin valmistuksessa sekvensointi kirjastot.
(A) Näytteen valmistus työnkulun. DNA eristettiin tuore tai FFPE CRC maksan etäpesäke resektio yksilöt Qiagen Blood and Tissue tai FFPE kit, tässä järjestyksessä. Jäädytetyt näytteet sitten suoraan koki sekvensointi kirjasto valmisteluun, yhdistämällä kirjastojen, laadunvalvonnan ja sekvensointi. FFPE näytteet lisäksi testattiin DNA laatua qPCR. Kirjasto laatu testattiin Bioanalyzer. Näytteissä on pieniä määriä oikein mitoitettu DNA amplikoneihin (fragmentteja at 310bp), uusia kirjastoja valmistettiin suuremmilla lähtö- DNA pitoisuudet ja uudelleen analysoitiin Bioanalyzer. Näytteet, joissa vielä pieniä määriä DNA oikean kokoisia ja erittäin hajanainen DNA jätettiin pois. (B) ΔCq-arvot laadunvalvonta PCR osoittaa huonoa näytteen laatu. DNA pitoisuus sirpaletta 250bp ja 450 bp jälkeen kirjasto valmistetta laskettiin Agilent Bioanalyzer ja pidon ΔCq arvojen FFPE laadunvalvonta PCR. (C) korkeampi ΔCq-arvot korreloivat pienempi keskisyvyys sekvensointi. (D) kattavuus jakelu amplikonien kaikista pariksi FFPE ja pakastetut näytteet, normalisoitu kokonaisotoksesta kattavuus. Jäädytetyt näytteet oli keskisyvyys 4622, FFPE näytteitä 1852.
FFPE näytteitä.
Kudos maksametastaaseja oli vahvistettu formaliiniin und upotettiin parafiiniin aikana rutiini patologinen jatkokäsittelyä . Sopivia lohkot valittiin viisi 10pm siivut käytettiin DNA: n eristämisessä ilman mikrodissektion. Dia värjätään hematoksyliinillä ja eosiinilla (H 150bp). Vertailla määriä DNA: n halutun kokoinen alue, DNA: n pitoisuus amplikonien välillä 250-450bp laskettiin. DNA-pitoisuuden, joiden koko on välillä 250bp ja 450 bp vaihteli suuresti 51,7 ja 93831,9 pg /ul (keskiarvo 5675,1 pg /ul, mediaani 672,2 pg /ul) puitteissa kirjastot eri näytteiden ja korreloi käänteisesti ΔCq arvojen (Spearmanin kerroin: -0,805 kuvio 1B, S2 taulukko). Näytteitä alhainen DNA pitoisuudet klo 310bp amplikonin, kirjasto valmistelu toistettiin käyttäen korkein mahdollinen DNA määriä (S1 kuvio, S2 taulukko). Bioanalyzer paljasti suurempia pitoisuuksia DNA noin 250-450bp (365,3 pg /ul-5669,8 pg /ul, tarkoittaa 6190,9 pg /ul; mediaani 1996,3 pg /ul), mutta joilla on merkittäviä tausta lyhyitä DNA-fragmentteja. Sen jälkeen kun PCR puhdistamiseen kirjastojen, lyhyitä DNA-fragmentit vähenivät, mutta kolme näytettä osoitti vähentynyt määriä 310bp amplikonin, ja näin ollen jätetty sekvensointi.
Tietojenkäsittely
bioinformatiikka- analyysi putki on kuviossa 2A. Lukee rinnastettiin vastaan hg19 viite genomi käyttämällä BWA algoritmia toteuttanut MiSeq ohjelmisto (MiSeq Reporter v2.2.29). BAM tiedostot laatu vertaamalla niitä FASTQC (v.0.9.5; https://www.bioinformatics.babraham.ac.uk/projects/fastqc/). Indeleitä sekvenssirinnastuksessa tiedostot vasemmalle tasattu ja paikallisten Uudelleensuuntauksen noin indeleitä tehtiin kanssa RealignerTargetCreator ja IndelRealigner työkalut Genome Analysis Toolkit (GATK, versio 2,4-9) [8]. Base laatupisteet uudelleenkalibrointi suoritettiin. Monista kartoitus ja merkintää ei katsottu sovellu amplikonin sekvensointia ja siten jätetty pois.
(A) Sekvensointianalyyysi työnkulun. Sekvenssirinnastus tiedostoja tehtiin paikallista-uudelleensuuntausta noin indeleitä, tasaus vasemmalle ja pohja laatupisteet uudelleenkalibroinnilla. Sen jälkeen kun muunnos soittamalla GATK Unified GENOTYPER, huomautusta ja vaikutus ennustaminen havaittujen varianttien tehtiin käyttäen SnpEff. Raaka variantteja kaikki näytteet suodatetaan mukautettuja parametreja SnpSift. Vaihtoehdot sisältyvät 1000 Genomes Projektitiedot jätettiin vain saada somaattisten mutaatioiden syöpä. (B) Korkean taajuuden TP53 ja APC mutaatioista somaattiset mutaatiot tunnistettiin CRC maksametastaaseihin (jäädytetty ja FFPE kudosta). Värilliset kentät ovat läsnä nonsynonymous koodittavan SNP-kohdan (sininen), mutaatio johtaa stop-kodoni (harmaa) tai lukukehyksen (oranssi). Bars Yhteenvetona mutaatiot läsnä kunkin potilaan (pystypalkit) tai kukin mutatoitunut geeni (vaakaviivaa). Huomattavaa on, että jotkut geenit sisältävät enemmän kuin yksi mutaatio.
Unified GENOTYPER putki
Variant calling.
Unified GENOTYPER päässä GATK (versio 2,4-9) oli käytettävä variantti calling. Kaikki näytteet käsitellä rinnakkain ja jakaa eri varianttia tiedostot jokaiselle näytteen variantti calling. Suurin kattavuus per lokuksen nostettiin oletuksena 250 9000000 ottaa huomioon korkea syvyys amplikonin sekvensointia. (Interpolaatio alaspäin alentaa syvyys tapahtuu kokonaan-exome tutkimukset nopeuden lisäämiseksi tallentamalla muistiin). Pienin luottamuskynnys kutsumiseen asetettiin 10 pienin luottamus kynnystä lähettävä 30. SNP ja indeleitä arvioitiin samanaikaisesti. Alueella luettelo kaikista amplikonien käytettiin määrittämään alueita varten yhden nukleotidin polymorfismin (SNP) ja Indel kutsuvan lisäämiseksi analyysin nopeutta. Vaihtoehtoisesti Unified GENOTYPER putki käytti prosessoimalla kukin näyte erikseen, muuten samoja parametreja käytettiin.
Variant huomautusta ja vaikutus ennustaminen.
SnpEff (versio 2.0.5, http: //snpeff.sourceforge.net/) [9] käytettiin varianttia huomautusta ja vaikutus ennustaminen ja GATK VariantAnnotator työkalu ajettiin kanssa-A SnpEff vaihtoehto lisätä SnpEff merkinnät korkein biologista merkitystä kunkin variantin muunnoksen kutsuvan formaatti (VCF) tiedostoja. Myöhemmin vcf tiedosto tietoja kaikista sekvensoitiin näytteet jaettiin yksittäisen näytteen muunnos Tiedostojen GATK SelectVariants ohjelmaa. Variantteja selityksin kanssa muunnos taajuudet 1000 genomien projektin avulla SnpSift (https://snpeff.sourceforge.net/SnpSift.html) merkintöjä ominaisuus [9].
Variant suodatus.
SnpSift päässä SnpEff paketti käytettiin suodatusta raaka variantteja. Seuraavat laadulliset suodatusehtoja sovellettiin: laadun syvyys on yli 0,8 (QD 0,8), kokonaissyvyys kutsumiseen varianttien tietyssä lokuksessa on suurempi kuin 200 (DP 200), Fisher säikeen (Phred mitoitetaan p-arvo Fisherin testi havaita lohkon bias) pienempi kuin 70 (FS 70), vähintään variantti luottamus on suurempi kuin 1500 (QUAL 1500), kartoitus laatu yli 40 (MQ 40) ja kartoitus laatu rank sum test korkeampi kuin -15 (! olemassa MQRankSum