PLoS ONE: Seuraavan sukupolven Sequence Analysis of Cancer ksenograftimalleissa

tiivistelmä

Seuraavan sukupolven sekvensointi (NGS) tutkimukset syövän rajoittavat määrä, laatu ja puhtaus kudosnäytteitä. Tässä tilanteessa, ensisijainen ksenografteissa ovat osoittautuneet käyttökelpoisiksi kokeellisissa malleissa. Kuitenkin läsnäolo hiiren johdettujen stromasoluja merkitsee teknisen haasteen niiden käyttöä NGS tutkimuksissa. Tutkimme tämän ongelman vakiintunut ensisijainen ksenograftimallia pienisoluisen keuhkosyövän (SCLC), maligniteetti diagnosoidaan usein pienistä biopsia tai neula aspirate näytteitä. Käyttämällä

in silico

strategian, joka antaa lukee mukaan lajin-of-alkuperää, me verrattu prospektiivisesti NGS tietoihin ensisijainen ksenograftimalleja Hyväksytty solulinjojen ja julkaistuja aineistoja. Osoitamme tässä, että matala-kattavuus koko genomin analyysi osoitti huomattavaa vastaavuutta välillä julkaistut genomitiedon ja sisäistä valvontaa, läsnäolosta huolimatta hiiren genomista DNA: ta. Exome kaapata sekvensointi paljasti, että tämä rikastustoimenpiteen oli erittäin lajispesifisiä, on alle 4%: lukee yhdenmukaistaa hiiren genomiin. Ihmisen ilmentymistä profilointi RNA-Seq monistaa array-pohjainen geeniekspression kokeissa, kun taas hiiren erityisiä transkriptio profiilien korreloi julkaistu aineistoja ihmisen syövän strooman. Olemme päätellä, että ensisijainen ksenografteissa ovat hyödyllinen foorumi monimutkaisten NGS analyysiä syöpätutkimuksessa kasvaimia rajalliset näytteen resurssit, tai joilla on näkyvä stroomasolulinja populaatiot.

Citation: Rossello FJ, Tothill RW, Britt K, Marini KD , Falzon J, Thomas DM, et ai. (2013) seuraavan sukupolven Sequence Analysis of Cancer ksenograftimalleissa. PLoS ONE 8 (9): e74432. doi: 10,1371 /journal.pone.0074432

Editor: William B. Coleman, University of North Carolina School of Medicine, Yhdysvallat

vastaanotettu: 29 huhtikuu 2013; Hyväksytty: 01 elokuu 2013; Julkaistu: 26 syyskuu 2013

Copyright: © 2013 Rossello et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Rahoitusta tämä työ tarjosi National Health ja Medical Research Council of Australia (Project Grant 546204), Victorian osavaltion Operational Infrastructure Support Program, ja Victorian Cancer Agency. Rahoitus avoin lataus: Victorian Cancer Agency. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Mr Erwin Tantoso työskentelee Partek SG Pte. Ltd Tämä ei muuta tekijöiden noudattaminen kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja. Toinen Kirjoittajat paljastaneet mitään mahdollisista eturistiriidoista.

Johdanto

Vaikka soveltaminen NGS teknologian syöpätutkimukseen on johtanut dramaattiseen edistysaskeleita ymmärrystä genomisen Näiden sairauksien, syvyys ja monimutkaisuus sekvensointi data korreloi negatiivisesti määrän ja laadun tuumorinäytesylinterin käytetään analysointiin [1]. Lisäksi, monia yhteisiä kasvaimet, kuten haimasyövän, on ominaista laaja tunkeutumisen peruskudoselementeistä, mikä vähentää havaitsemiskynnys harvinaisia, syövän erityisiä variantteja [2]. Tämän seurauksena yleisimmistä syövistä diagnosoidaan pienet koepaloja ovat huomattavasti aliedustettuina NGS tutkimuksissa, jotka perustuvat pääasiassa kirurgisesti-resekoituun kudosnäytteistä.

Yksi lähestymistapa tämän ongelman poistamiseksi on käyttää ensisijaisen ksenograftimalleja, jossa pienet kudosnäytteitä voidaan suoraan Siirto tehty, laajennettu ja kuljetettiin immuunivajaissa hiirillä ilman altistumista tavanomaisen kudosviljelyolosuhteissa [3]. Vaikka kasvainsoluja ylläpidetään immuunivajaissa hiirillä, me [4], ja toiset [5] – [7], ovat osoittaneet, että ne säilyttävät tärkeitä ominaisuuksia primaarikasvaimen että oleellisinta, menetetään peruuttamattomasti soluviljelmissä [2], [ ,,,0],4]. Lisäksi, huolimatta siitä, että strooman komponentti on hiiri-johdettu, ensisijainen ksenograftimalleissa on onnistuneesti käytetty prekliinisen tutkimuksen erilaisten solun autonomisten ja strooman johdettu merkinantojärjestelmää terapeuttista merkitystä syövän [7].

näiden tietojen perusteella, ensisijainen ksenografteissa voisi edustaa hyvät puitteet NGS analyysiä, kun syöpä kudos on rajoittava. Ding

et al.

[8], tutkimuksessa, jonka tarkoituksena oli tunnistaa somaattisten mutaatioiden ja rakenteellisia muunnelmia pohjapinta-kuin rintasyöpä, arvioima patologia tekniikoilla kasvain koostumuksen sitten laskea ja säätää kasvain luettu numero. Perustuen patologia arvioiden kirjoittajat käyttävät deterministinen korjaus saastumisen kasvaimen normaalin lukea laskee, mikä vaikuttaa mutantti alleeli taajuus, ja sovelsi sitä primaarikasvaimen ja etäpesäkkeiden näytteitä vain. Oletettiin, että vähäisen kartoitus määrä Isäntäspesifinen lukee siirteen genomiin, ei luku- syvyys korjausta vaadittiin Ksenograftikudoksista näyte.

Katsomme, läsnäolo kontaminoivien hiiren DNA: n ja RNA vaikuttaa herkkyys ja spesifisyys NGS analyysin näissä kasvainmuodoista joita ei perustua cellularity arvioihin, mutta pitäisi olla tarkasti ja järjestelmällisesti käsitelty. Lisäksi, koska useimmat nykyiset NGS tekniikkaa käyttävät haulikko-sekvensointi menetelmiä, resoluutio mahdollisten artefakti voitaisiin suorittaa

post-hoc

aikana bioinformatiikan analyysejä, joka yksiselitteisesti tunnistaa laji-of-alkuperää lukee. Tämä ongelma on aiemmin keskusteltu ultra high-throughput cDNA sekvensoinnin (RNA-Seq) Conway

et al.

[9] ja Raskatov

et al.

[10], joka löysi muuttuja määriä isännästä peräisin sekvensointi lukee. Täällä takautuvasti analysoineet lisäämisessä sekä

in silico

työnkulun suunniteltu lopullisesti määrittää laji-of-alkuperää NGS lukee useilla aiemmin ominaista ensisijainen ja solulinjaa johdettu ksenograftimalleja SCLC, ja verrataan näitä tuloksia julkaistu aineistoja.

Materiaalit ja menetelmät

Ethics lausunto

Kaikki kokeet, joissa eläimet ennalta hyväksynyt Animal eettinen komitea on Monash University ja tehtiin mukaisesti ” Australian käytännesäännöt Care ja eläinten käyttö tieteellisiin tarkoituksiin. ”

Solut

SCLC ensisijainen ksenografti linjat LX22, LX33 ja LX36 siirrostettiin kuten aikaisemmin on kuvattu [4]. Lyhyesti, resektoitiin kudoksia kemiallis-naiivit SCLC potilasta käytetään tuottamaan ensisijaisesti ksenograftit näytteitä. Kasvaimen näytteet hienonnettuna steriilillä partakoneen teriä, hierrettiin 1 x PBS, suodatetaan 60 pm verkkosuodatin, sentrifugoitiin ja uudelleensuspendoitiin 500 ui matrigeelin (BD Biosciences) 4 ° C: ssa. Käsitellyt solut injisoidaan ihonalaisesti kyljissä ei-lihavien diabeettisten /severe combined immuunivajaisiin hiirillä. Kun P0 kasvaimet saavuttivat halkaisija 1 cm, hiiri lopetettiin ja resektoitua kasvain oli jaettu jaksoihin snap jäädyttämistä tai serial passage. Ksenograftikasvaimissa valmisteltiin peräkkäistä kertaa

in vivo

edellä kuvatulla tavalla ja solut ruiskutetaan kylkiin Kateenkorvattomien nude-hiirten in Matrigel. Kuljetettiin ja pikajäädytettii kasvaimia näytteet rutiininomaisesti ominaista histopatologista ja immunohistokemiallista ominaisuudet vanhemman kasvain [4].

Vahvistetut NCI-H209 solulinja hankittiin ATCC uudelleen peräisin yhdestä solusta klooni käyttäen single solukloonausta sarjalaimentamalla (Corning, Tewksbury, MA, USA) ja sitten kasvatettiin

in vitro

ja in vivo kuvatulla Watkins

et al.

[11]. DNA näytteistä uutettiin käyttämällä DNAeasy Tissue and Blood Kit (Qiagen, Santa Clara, CA, USA) valmistajan ohjeiden mukaisesti. RNA puhdistettiin käyttämällä miRNeasy Mini Kit käyttäen QIAzol (Qiagen, Santa Clara, CA, USA) valmistajan ohjeiden mukaisesti.

valmistaminen Sequencing Libraries

Exome ja matalan kattavuus koko genomin DNA uudelleen sekvensointi: Target DNA (3ug) oli ensiksi leikattiin käyttäen polttoväli akustinen laite (Covaris, Woburn, MA, USA). DNA-fragmentti, kirjastot exome uudelleen sekvensoinnilla ja low-kattavuutta koko genomin sekvensoinnin konstruoitiin leikatulla DNA peräkkäiset vaiheet end-korjaus, A-pyrstön ja ligaatiolla indeksoitu lllumina yhteensopivan sovittimen sekvenssit (TruSeq DNA, Illumina, San Diego, CA , USA). Sillä exome uudelleen sekvensointi, PCR-monistettu fragmentti kirjastot rikastettiin eksoni-DNA: n pitkän oligonukleotidin hybridisaatiolla talteenotto mukaan valmistajan protokollan (SeqCap EZ Exome Library v3.0, Roche Nimblegen, Madison, WI, USA). Alhaisen kattavuus koko genomin, PCR-monistettiin kirjastot olivat koko on valittu kuvaamaan DNA 500-700nt pituuden, käyttämällä automatisoitua elektroforeesia alustan (Pippen Prep, Sage Science Inc., Beverly, MA, USA). Kaikki sekvensointi kirjastot kvantitoitiin käyttäen reaaliaikaista PCR vastaan ​​kirjaston tunnetun pitoisuuden ja sitten käsitellään klusterien sukupolven ja sekvensoinnin standardimenetelmien mukaisesti (HiSeq 2000 Illumina, San Diego, CA, USA).

RNA- seq.

kokonais-RNA laatu tarkastetaan ja sato automatisoitu mikrofluidinen elektroforeesilla (Bioanalyzer 2100, Agilent Technologies, Santa Clara, CA, USA) ja spektrofotometriä (NanoDrop, Thermo Scientific, Wilmington, DE, USA). Suuntaamaton RNA-Seq kirjastoja luotiin mukaan valmistajan protokollan (Truseq RNA-Seq Library Prep Kit v2, Illumina, San Diego, CA, USA). Lyhyesti tämä menetelmä mukaan peräkkäiset vaiheet mRNA rikastamiseen peräisin 3ug kokonais-RNA: n, RNA pirstoutuminen kuumentamalla kahdenarvoisten kationien läsnäolosta, satunnaisesti esikäsitelty käänteistranskriptio ja toisen juosteen cDNA-synteesi jälkeen valmistetaan DNA-fragmentti, kirjastoja käyttäen Illumina yhteensopivia sovittimia ja PCR-monistus kuten aiemmin on kuvattu DNA-kirjastoja.

Kaikki näytteet arvioitiin erikseen yleinen lukea laatu käyttämällä FASTQC (https://www.bioinformatics.bbsrc.ac.uk/projects/fastqc) ja heikkolaatuisia lukee suodatettiin ja oli kova lohkottu käyttäen Trimmomatic (keskimääräinen minimiaika Phred pisteet, 6 peräkkäistä emästä, 20 ja vähintään lukemaan pituus 50nt, taulukko S1) [12].

Raaka syvä sekvensointi aineistot ovat julkisesti saatavilla National Center of Biotechnology Information Short Read Archive (Liittymisnumero SRA082685).

strategia eristämään ja tunnistamaan lajeja alkuperämaan NGS lukee

ehdotettu strategia muistuttaa kuvata Conway

et al.

[9], mutta eroaa useassa tärkeitä näkökohtia. Ensinnäkin, ensisijainen kohdistus siirteen genomiin, tässä tapauksessa ihmisen genomissa, suoritetaan, jossa lukee jaetaan siirre-kartoitettu ja siirre-unmapped lukee; Toinen, sekä siirteen kartoitettu ja siirre-unmapped read-sarjat ryhmitetään isännän genomiin, tässä tapauksessa hiiren genomin, edelleen tunnistaa yhteisiä siirre-isäntä ja isäntä-erityisiä lukee vastaavasti; Lopuksi, yhteinen siirre-isäntä lukee suodatetaan luetusta asetettu saatu ensisijainen kohdistus saamiseksi siirre-erityisiä lukee. Tässä tutkimuksessa tunnistaminen ja luokittelu prosessit suoritettiin

kautta

keräys- ja vertaamalla luetun tunnukset vastaanottavan /siirrännäisen linjauksia, tuottavat lukee FASTQ muodossa. Tämän seurauksena tunnistettu siirteen erityinen lukee otettiin uudelleen linjattu siirteen genomiin.

Seuraavat rinnastuksia tuotti kolme erillistä linjassa aineistoja,

i. e.

, lukee joka voisi yhdistää vain ihmisen genomia lukee jotka yksinomaan kartoitettu hiiren genomiin ja lukee että kartoitettu molemmat genomit. Analyysin lisäksi RNA-Seq lukea sarjaa, me edelleen tarkistaa tämän strategian matala-kattavuus koko-genomin ja exome kaapata sekvensointi kokeilut. Kokonaiskuva kuvataan kaikki vaiheet sisältyvät ehdotetun strategian esitetään kuvassa 1. Jokaisen linjaus, kartoitetaan ja unmapped lukee sisältyvät SAM /BAM muotoisia tiedostoja [13] suodatettiin perustuvat niiden peiton lippu tila käyttämällä Samtools [13], räätälöidyn Perl-skripti, joka kerätään ainutlaatuinen lukea identiteetit päässä linjassa /unaligned SAM muotoisia tiedostoja ja suodatetaan ne raaka fastq tiedostoja, [Simon Andrews, 2010, Seqanswers.com [14]. Saatavilla: https://seqanswers.com/forums/showpost.php?p=25302 postcount=3] ja cmpfastq_pe ohjelmisto, joka verrattuna raaka pari-end fastq tiedostoja ja raportoitu yhteisten ja ainutlaatuisia lukee (http: //compbio .brc.iop.kcl.ac.uk /ohjelmisto /cmpfastq_pe.php).

ohjelmistokomponentteja hyödynnetty jokaisessa vaiheessa on myös määritelty. Kiinteät viivat edustavat tärkeimmät analyyttiset tiehen ja katkoviivat edustavat ylimääräisiä vaiheita.

Mapping tulokset arviointiin käytettiin kartoituksen laatua käsitellyistä näytteistä ja edelleen hävitä useita osuma lukee. Pääsääntöisesti, oletettiin, että korkeampi kartoitus laatu merkitsee enemmän ”ainutlaatuinen” linjassa luku- ja useimpien näytteiden, suuri osa luku-pareja oli kartoitus laatu yli 20 (taulukko S2).

transcriptome analyysi

Koko transcriptome analyysi kolmesta SCLC ensisijaista -ksenografteissa suoritettiin läpi RNA-Seq käyttäen GAIIX ja HiSeq 2000 sekvensointi alustoilla (Illumina, San Diego, CA, USA). Koe pariksi-end kanssa 100NT luku- pituus (300nt keskimääräinen insertin koko). Tavoiteltu vähimmäismäärä lukee näytettä kohti oli 40 miljoonaa lukee (taulukko S1).

Jotta voitaisiin tunnistaa ja yksiselitteisesti erillinen siirteen (ihmisen) ja isännän (hiiri) lukee, käsitelty näyte lukee peräkkäisessä järjestyksessä tasataan molemmat siirteen [täydellinen hg19 ihmisen genomin (UCSC versio, helmikuu 2009)] ja isäntä [täydellinen mm9 hiiren genomin (UCSC versio, heinäkuu 2007)] genomit käyttäen Bowtie-tophat [versio 2.0.4, segmentin pituus 29nt, 1 epäsuhta segmentissä on sallittua, maksimi herkkyys, kattavuus haku suoritetaan [15], [16]. Ei de päällekkäisyyden suoritettiin jälkeiseen kokoonpanoon RNA-sekvenssi analyysi.

mRNA määrällisesti kaikkien selityksin geenit ihmisen perimän suoritettiin käyttäen Partek® ohjelmistoa (Partek Inc. (1993) Partek® Genomics Suite ™) . Lukee normalisoitiin käyttämällä lukee kohden kiloemästä eksonin mallin miljoonassa kartoitettu lukee menetelmä [17].

Ihmisen-erityinen ensisijainen vierassiirrettä microarray ilmaisun data-sarja (GSE15240) [4] noudetaan National Center for Biotechnology Information (NCBI) Gene Expression Omnibus (GEO) arkiston [18].

Jos haluat vertailla hiirispesifisiä lukee aiemmin julkaistu syöpää strooman geeni allekirjoitukset, rintasyöpä liittyy fibroblastien aineisto [19] oli noudettu GEO arkistoon (GSE10797). [18]

kaikille mikrosiruanalyysi, geenikoettimia normalisoitiin käyttämällä quantile normalisointi (log pohja 2 ja mediaani kiillottaa probeset muutosta ja yhteenvetoa vastaavasti) ja taustan korjaus suoritettiin käyttäen vankka multi -array keskimääräinen menetelmä (RMA) [20].

vertailu microarray ja RNA-Seq geeniekspression tuloksia suoritettiin käyttäen lineaarista korrelaatiota (Spearmanin r) tukin pohjan 2 määrällisten geenin mielivaltainen intensiteetti yksiköiden ja log pohja 2 RPKM kuvatulla Mortazavi

et al

[17].

Exome resequencing analyysi

Koko-exome näytteiden analysointi saatu ääreisverenkierron, NCI-H209 cell rivi ja sen johdannainen ksenografti tehtiin läpi koko exome ultra-high throughput sekvenssi käyttämällä HiSeq 2000 sekvensointialustamme (llumina, San Diego, CA, USA). Koe pariksi-end kanssa 101nt luku- pituus (200 emäsparin insertin koko). Keskimääräinen kohdennettu kattavuutta asetettiin 50x (katso taulukko S1 kokonaismäärästä lukee sekvensoitiin).

Käsitelty näyte lukee lisättiin peräkkäin kohdistettu sekä siirteen [täydellinen hg19 ihmisen genomin (UCSC versio, helmikuu 2009)] ja isäntä [täydellinen mm9 hiiren genomin (UCSC versio, heinäkuu 2007)] genomit käyttäen Burrows-Wheeler Kohdistustyökalu [(BWA), BWA aln käytetty algoritmi, siemen pituus 22nt; maksimi muokkaa etäisyys siemen 0 [21].

Yhden nukleotidin variantteja (SNVs) löytö tehtiin käyttämällä työkaluja sisällytetään Picard (https://picard.sourceforge.net) ja GATK [22 ], [23]. Ensinnäkin kahtena lukee poistettiin uudelleenlinjattu BAM Tiedostojen MarkDuplicates käsky Picard (https://picard.sourceforge.net). Arvioidut päällekkäisyyksiä tasot on kuvattu taulukossa S3. Myöhemmin de-monistaa BAM tiedostot paikallisesti uudelleenlinjattu ympärille uusia ja tunnettuja indeleitä käyttäen RealignerTargetCreator ja IndelRealigner kävelijöiden välillä GATK [23]. Lopuksi pohja laatu pistemäärät kalibroitava käyttämällä CountCovariates ja TableRecalibration kävelijöiden välillä GATK [23]. Tämä menettely suoritettiin kullekin kolme näytettä analysoidaan.

Raaka SNP puhelut suoritettiin käyttäen UnifiedGenotyper kävelijä alkaen GATK [23], jossa on vähintään pohja laatu Phred pisteet 20, puhelun luottamusta kynnys 50 (Phred -scaled) ja emmition luottamusta kynnys 10 (Phred mitoitetaan). Raaka kutsutaan SNP suodatettiin käyttäen VariantFiltration kävelijä kanssa seuraavat parametrit: SNP klusterin size = 10; Kattavuus: ≥ 5; Qual: ≥ 50; Strand bias: Fisherin testiä, ≥ 60. Näyte-erityisiä uusia SNP,

i. e.

, ne eivät läsnä Tietokanta yhden emäksen monimuotoisuus (dbSNP) (Bethesda (MD): National Center for Biotechnology Information, National Library of Medicine. (dbSNP 137: 137; http: //www.ncbi. nlm.nih.gov/SNP/), olivat selityksin ja sen vaikutus ennustaa käyttämällä SnpEff [24] ja variantAnnotator kävelijä alkaen GATK [23].

Genome visualisointi suoritettiin käyttäen integroiva Genome Browser (IGV) [ ,,,0],25], [26]. monilajikalastusta paikallinen linjaus kappaleita haettiin IGV tiedot palvelimelta.

Whole-genomianalyysi

matalan kattavuus koko-Genomikartoituksen näytteiden saatujen ääreisverenkierrossa, H209 solulinjaa ja sen johdetun ensisijaisen ksenografti suoritettiin läpi haulikko koko genomin ultra-high throughput sekvenssi käyttämällä HiSeq 2000 sekvensointialustamme (llumina, San Diego, CA, USA). koe pariksi-end kanssa 101nt luku- pituus (200 emäsparin insertin koko) . keskimääräinen kohdennettu kattavuutta asetettiin 4x (katso taulukko S1 kokonaismäärästä lukee sekvensoitiin).

Käsitelty näyte lukee lisättiin peräkkäin kohdistettu sekä siirteen [täydellinen hg19 ihmisen genomin (UCSC versio, helmikuu 2009) ] ja isäntä [täydellinen mm9 hiiren genomin (UCSC versio, heinäkuu 2007)] genomit käyttäen Burrows-Wheeler Kohdistustyökalu [(BWA), BWA aln käytetty algoritmi, siemen pituus 22nt; maksimi muokkaa etäisyys siemen 0 [21]. Arvioitu päällekkäisyyden määrän todettiin olevan marginaalinen ja on kuvattu taulukossa S3.

sisäisestä ja välisestä kromosomi uudelleenjärjestelyjä löytö tunnistettu ihmisen erityinen lukee suoritettiin käyttäen FusionMap [span ja split lukea jonolukemakynnyksen 3 ja split vähintään ankkuri 4 lukee [27]. Havaitut fuusiot piirrettiin pyöreä edustus ihmisen genomin (Circos tontti) käyttäen Circos [28].

Kopioi numero variaatioita (CNV) ja alleeliset sisällön genomialuetta todettiin käyttäen Ohjaus-Freec [29]. Perifeerisen veren näytettä käytettiin perustason kontrolli. Circos käyrät havaitun CNV on rakennettu käyttäen Circos [28].

Tulokset

Kuten on esitetty kuviossa 2, arvioidaan NGS strategioita paljasti eri suhteissa isäntä-erityisiä lukee. Exome talteenotto ja RNA-Seq tuotettu alhaisin osuus hiiren erityisiä lukee vaihdellen 4% ja 7%. Sen sijaan, haulikko koko genomin sekvensointi tuotti suurimman määrän todetaan, että yksilöllisesti kohdistettu hiiren genomin, joka vastasi 20% kokonaismäärästä lukee (kuvio 2). Homologinen määrä lukee,

eli

, ne lukee että tasataan sekä ihmisen ja hiiren perimän, todettiin olevan samanlainen kaikilla menetelmillä, jotka vaihtelevat 4% (RNA-Seq) 1,5% (Exome -kaapata). Täydellinen yhteenveto rinnastukset suoritetaan esitetään taulukossa S2.

Kunkin lukea luokan, osuus (%) kaikista lukumäärän lukee on määritelty.

Koko genomin analyysi

Kuten odotettua, sekvenssi kattavuutta näytteiden altistetaan matalan kattavuus koko genomin sekvensointi oli yli 3 kertaa kaikkien analysoiduista näytteistä (taulukko S3 A). Kuitenkin syvyys kattavuutta ksenograftissa näyte vakava hiiri saastuminen ja tuottanut alin arvo 3 näytettä sekä keskisyvyys kattavuuden (3,3 kertaa) ja prosenttiosuus lukee kattaa vähintään 3 kertaa (taulukko S3 A).

Kopioi numero vaihtelu analyysi sekä solulinjan ja ksenografti valmistetut näytteet hyvin samanlaisia ​​tuloksia, kun perifeerisen veren näytettä käytettiin kontrollina (kuvio 3 A). Kaikkiaan 578 ja 470 somaattisesti hankittu kopioluvun muutoksia havaittiin solulinjasta ja ksenografti- näytteitä vastaavasti. Nämä erot johtuivat pääasiassa hienoisia eroja kattavuutta perimän alueita arvioidaan ja useimmat niistä vastaavat polttoväli kopioluvun tai -tappiot keskellä diploidi alueiden (kuva 3 B). Kuten havaitaan kuviosta S1, sekä solulinja (kuvio S1 A) ja -ksenografti (kuva S1 B) näytteet tuotetaan hyvin samankaltaisia ​​CNV profiileja kaikki analysoidut kromosomeja. Yksityiskohtainen CNV profiili molemmista näytteistä löytyy Aineistot S1 ja S2. Samanlainen malli havaittiin

beta

alleelin frekvenssi profiileja molemmille näytteille (kuva 3 C).

(A) Circos juoni edustavat kopioluvun vaihtelut, sisäisiä ja kromosomin järjestelyillä NCI -H209 solulinja ja ksenograftin kasvaimen johdettu siitä. Kopioi numero muunnelmia (punainen, voitto, vihreä, tappio) laskettiin perustuen kattavuus käyttäen kirjeenvaihtaja ääreisverenkierron kontrollina. Inter ja sisäisen kromosomi uudelleenjärjestelyt ovat edustettuina blue (inter-kromosomi) ja tummansininen (intra-kromosomi). (B, C) Yksityiskohtainen profiilia kopioluvun vaihtelut ja B-alleeli taajuuksilla kromosomin 1 analysoidun solulinjasta ja ksenograftin. Kuten edellä on kuvattu, on kyseistä perifeerisen veren käytettiin kontrollina sekä tyypin analyysin. Kopioi numero profiilit näkyvät punaisella (voitto), vihreä (tappio) ja harmaa (ei muutosta). LOH näkyvät vaaleansininen.

Vastaavia tuloksia voitiin havaita sisäiseen ja väliseen kromosomi uudelleenjärjestelyt (kuva 3 A), jossa yli 70 uudelleenjärjestelyjä sekä näytteitä havaittiin. Eräs esimerkki muun kromosomin uudelleenjärjestelyjä välillä havaittiin

BAGE4

, ehdokas koodaavan geenin kasvainantigeenejä, ja

MLL3

, jäsen myelooisen /imukudoksen tai seka-linjan leukemia (MLL) perhe . Täydellinen luettelo intra- ja inter-kromosomaalisia uudelleenjärjestelyjä yhteinen sekä solulinjaan ja ksenograftissa näytteet löytyvät Tietoaineistot S3.

Edellä esitetyt tiedot tukevat hypoteesia, että perusteellinen CNV ja rakenteellinen muunnos analyysi voi suoritetaan kun sekä solulinja ja ksenografti näytteitä käytettiin. Huomasimme, että oikein osuus hiirispesifisiä saastuminen, käyttäen saadut tulokset saastumattomalle solulinjoja voidaan tarkasti käyttäen ksenografti näytteitä, joissa lisäedut käyttö sellaisen

in vivo

mallissa.

Exome Sekvensointianalyysin

tarkoittaa sekvenssi syvyys kattavuus kohdennettujen kaapattu alueilla kaikissa näytteissä yli 100 kertaa saavutettiin, yli 80% kätkeä vähintään 30 kertaa (taulukko S3 B) . Solulinjassa ja ksenograftissa näytteet, 68,5 ja 74,7 prosenttia kohdennettujen exome alueet kuuluivat vähintään 50 kertaa, ja keskiarvo sekvenssi kattavuutta 109 ja 136 kertaisia. Sekvenssianalyysissa kaikkien kolmen näytteen (

i. E.

, Ääreisverenkierron, solulinja ja ksenografti) havaittiin yhteensä 53186 (52429 tunnetaan ja 757 novel) SNP: itä. Ne variantit, jotka löytyivät ääreisveren katsottiin ituradan alkuperää, ja niitä enää käsitellä kolmannen asteen analyysiä.

yhteensä 946 somaattisen variantteja, 351 näistä uusia, olivat yhteisiä sekä solulinja ja -ksenografti näytteet (kuvio 4 A). Näistä 886 oli yhden emäksen substituutioiden, 28 oli lisäyksiä ja 32 olivat poistot (kuva 4 B). Täydellinen luettelo somaattisista mutaatioista havaittu kuvataan Datasets S4. Mutaatio luokan analyysi osoitti G A /C T siirtymät olivat yleisimpiä (33%) ja sen jälkeen A G /T C siirtymät (23%) ja G T /C transversioita (20%) (kuvio 4 C). Kaiken kaikkiaan tämä malli oli samanlainen kuin raportoitu Pleasance

et ai

[30] kantavassa aiemmin on kuvattu TP53 akseptorisilmukointikohtien häiritä ja RB1 C706F pistemutaatio, ominaisuus SCLC, [30], havaittiin sekä solu line ja ksenografti- näytteitä.

useita tunnettuja ja uusia variantteja (A) ja variantti tyypit (B) havaittiin olevan yhteisiä sekä solulinjan ja ksenografti ja ne havaittiin vain solulinjassa ja ksenograftin. (C) kvantifiointi kuusi mahdollista mutaatiota luokkaa.

946 variantit yhteisiä sekä solulinjaan ja ksenografti The SnpEff vaikutus ennustaja raportoitiin yhteensä 1806 (kuvio 5 A B). Jotta Tässä analyysissä, raportoimme vaikutus kaikkiin mahdollisiin geenitranskriptien, joten kokonaismäärä raportoitu variantteja poikkeaa kokonaismäärästä havaittuja vaikutuksia. Eniten edusti vaikutuksia luokkia, kun luokiteltu tyypin, olivat ne, jotka vastaavat intronia (721), ei-synonyymi koodausta (305) ja synonyymi koodaus (170) (kuvio 5 A). Kun muunnos vaikutuksia luokiteltiin alueittain, introni ja eksonin alueilla, odotetusti, olivat merkitsevästi edusti (kuva 5 B). Kuvaus kohtalainen ja suuri vaikutus SNP ennustetut vaikutukset ensimmäistä vaikutti transkriptio kuvataan Tietoaineistot S5.

kuusikymmentäneljä somaattisia variantteja ainutlaatuinen ksenografti havaittiin (kuva 4 B). Näistä vain 15 oli ei-synonyymejä koodausta variantteja. Kaikissa tapauksissa, variantit olivat heterotsygoottinen, ja SnpEff ennustettu kohtalainen vaikutus proteiinin toimintaan (taulukko S4 A). Nämä variantit vaikuttavat geenitranskriptien seuraavista geeneistä:

ESPN, KAZN, APEH, MUC20, MUC17, AQP7, ZNF808

ja

LUZP4

. Jotta voitaisiin tunnistaa syy näiden eroja varianttien havaitut solulinjassa ja ksenograftissa näytteiden genomialuetta ympäröivä variantit havaitut tutkittiin. Jotta voidaan sulkea pois sitä mahdollisuutta, että nämä variantit ovat syntyneet saastuttamaan hiiren sekvenssi, suoritimme seuraava analyysi. Ensin eristettiin sekvensointi lukee vieressä kohdealueen säteellä 1,000bp (kuva S2 yksityiskohtaisia ​​esimerkkejä). Pairwise paikallinen rinnastuksia näiden alueiden välillä ihmisen ja hiiren genomeja osoitti, että maailmanlaajuinen yhdenmukaistaminen ei ollut mahdollista välillä analysoitiin sekvensointi lukee ja hiiren genomin (kuva S2). Seuraavaksi yritimme mukauttamispyrkimyksissä lukee hiiren genomiin. Ei rinnastuksia tuotettiin. Nämä tiedot osoittavat, että koodaus-alue variantit ainutlaatuinen ksenograftissa olivat ihmisperäisiä.

Koska geneettinen heterogeenisyys pidetään nykyään kardinaali piirre monissa syöpätyyppien [31] – [33], me kysytään, onko kyse ksenografti erityinen variantteja voitiin havaita alkuperäisessä solulinjassa aineisto. Yksityiskohtainen tarkastus sekvensointi lukee ja sekvenssi syvyys-of-kattavuus asiaankuuluvien alueiden paljasti, että suurin osa (9 out of 15) Näiden varianttien olivat havaittavissa, mutta jäivät alle alleelin frekvenssi kynnysarvoa 0,2 (kuva S3 Taulukko S4 ). Variantteja ei ole havaittu solulinjassa, joko sekvenssin kattavuutta oli alle 10 kertaa tai vaihtoehtoisen alleelin nukleotidisekvenssin ei havaittu (taulukko S4 A). Nämä tulokset tukevat sitä päätelmää, että variantit ainutlaatuisia ksenograftissa syntyi seurauksena kloonilaajenemisen heterogeenisen solulinjasta väestöstä, tai uusia variantteja, jotka johtuvat spontaani tausta mutaatioista.

Lisäksi 74 variantteja tunnistettiin solussa linja, mutta ei-ksenograftissa näytteessä (kuvio 4 B). Näistä 9 (

RhoA, MUC17, TRIM22, UNC93B1, MAML2, HF1A, FAM18B2 ja GPR64

) johti kuin synonyymi koodaava alue muuttuu, jonka ennustettu kohtalainen vaikutus proteiinin toimintaan (taulukko S4 B). Kaikki nämä poikkeavia variantteja havaittiin olevan heterotsygoottinen (taulukko S4 B). Vertailu sekvensointi lukee ja sekvenssi kattavuutta näiden alueiden paljastui samanlainen kattavuus sekä solulinjassa ja ksenograftin näyte (taulukko S4 B kuva S4). Käyttäen samanlaista lähestymistapaa, että otetaan varten ksenograftissa-erityinen variantteja, olemme päättäneet, että kaikissa paitsi yhdessä tapauksessa, solulinja erityisiä variantti voitiin helposti havaita ksenograftissa, mutta jälleen alitti samalla alleelin taajuus kynnys. Koska nämä lukee tunnistettiin puhdas ihmisen solulinjassa väestöstä, voimme päätellä, että solut sisältävät näitä poikkeavia muunnoksia ovat edustettuina alemmilla taajuus ksenograftissa sijaan seurauksena hiiren saastumisen tai vaihtelua sekvensointi perusteellisesti.

määrä ristiriitainen variantteja havaittu kunkin näytteen – 64 ksenografti erityinen

versus

74 solulinja erityinen variantteja – ehkä puolueellinen tunnettujen-to-romaanin suhde havaittiin ksenograftissa (kuva 4 B). Tämä näyte suhde on lähellä 01:01, korkeampi kuin havaittu solulinjan erityiset ja yhteiset solulinja – ksenografti vaihtoehdot, on alle 1 (kuva 4 B).

Tiedot asettaa Ksenograftikudoksista näytteestä tuotti korkein keskimääräinen sekvenssi kattavuutta ja 75% sekvensoidun emästä kuuluivat vähintään 50 kertaa. Valtaosa somaattisten varianttien havaittiin sekä solulinjassa ja ksenografti, kun taas variantit, jotka ainutlaatuisesti havaittu joko solulinjassa tai ksenografti edusti vähäistä suhteessa ole merkittävää vaikutusta käännös mRNA. Yhdessä nämä tiedot osoittavat, että exome-capture sekvensointi ksenograftimalleissa tuottaa erittäin tarkkoja ja toistettavia havaitseminen merkittäviä koodaavan-alue variantteja.

transcriptome analyysi

Ihmisen erityinen transcriptome analyysi kolmesta SCLC ensisijainen ksenograftimalleja (LX22, LX33 ja LX36) olivat vahvasti (Spearman korrelaatio = 0,75, P 0,001), jossa on aiemmin julkaistu geeni-ilmentymisen array data asetetaan samalla kasvainmuodoista käyttäen ihmisen cDNA-probesets [4] (Kuva 6 A), mikä itsenäisesti validointi meidän lajikohtaisia ​​strategiaa.

(A) vertailu geenien ilmentyminen havaita RNA-Seq ja Affymetrix ilmaisun array alustoja identtiset SCLC näytteitä (keskiarvo, n = 3, P 0,01) . (B) Vertailu geenin ilmentymisen välillä SCLC primaaristen kasvainten [34] (Y-akselin keskiarvo, n = 15) ja ensisijaisen ksenograftit (X-akseli, tarkoittaa, n = 3) (P 0,01). (C) Vertailu geeniekspression havaita Affymetrix joukko mikro-leikellään ihmisen syövän strooman [19] (Y-akseli, keskiarvo, n = 28) ja hiiren RNA-Seq ilmentymisen tiedot SCLC ksenograftimalleissa (X-akseli, tarkoittaa , n = 3) (P 0,01).

geenien ilmentymisen korrelaatio analyysi välillä äskettäin julkaistun SCLC primaarikasvainten RNA-Seq kokeilu [34] ja ihmisen-RNA-Seq lukee SCLC ensisijainen ksenograftimalleja, osoitti positiivista korrelaatiota molempien tietokokonaisuuksien (Spearman korrelaatio = 0,68, P 0,001) (kuvio 6 B).

Vastaa