PLoS ONE: Kohdennettu uudelleenjärjestely-Tunnistetut rs3106189 klo 5’UTR TAPBP ja rs1052918 3’UTR TCF3 liittyvän kanssa eloonjäämisaste peräsuolen syövän Potilaat

tiivistelmä

Viimeaikaiset tutkimukset ovat osoittaneet voiman syvä uudelleenjärjestely-koko genomin tai exome ymmärtää syövän genomeja. Kuitenkin kohdennettua kaapata valitun genomista koko geenin kehon alueilla, eikä koko exome, on useita etuja: 1) geenit voidaan valita perustuen biologian tai hypoteesi; 2) mutaatiot promoottori ja introni alueilla, joilla on merkittäviä sääntelyyn tehtäviä, voidaan tutkia; ja 3) halvempaa kuin koko genomin tai kokonaan exome sekvensoinnilla. Siksi suunnittelimme custom high-density oligonukleotidigeenisirumenetelmää (NimbleGen Inc.) kaapata noin 1,7 Mb kohdealueita käsittää genomialuetta 28. liittyvistä geeneistä peräsuolen syöpä mukaan lukien geenit, jotka kuuluvat WNT signalointireitin, sekä tärkeitä transkriptiotekijöitä tai paksusuolen erityisiä geenejä, jotka ovat yli ilmaistut peräsuolen syöpä (CRC). 1,7 Mb kohdealueilla sekvensoitiin kattavuus vaihteli 32 × 45 × varten 28 geenit. Me tunnistaa yhteensä 2342 sekvenssin vaihtelut CRC ja vastaavien viereisten normaaleissa kudoksissa. Niistä 738 oli uusi sekvenssi muunnelmia perustuu vertailuja SNP tietokanta (dbSNP135). Me validoitu 56 66 SNP erillisessä kohortin 30 CRC kudosten käyttäen Sequenom MassARRAY iPLEX Platform, mikä viittaa validointi, joka on vähintään 85% (56/66). Löysimme 15 missensemutaatioita joukossa eksoni vaihtelut, 21 synonyymi SNP jotka ennustettiin muuttaa eksoni silmukoinnin motiivit, 31 UTR SNP jotka ennustettiin esiintyvän transkriptiotekijän sitoutumiskohdat, 20 introni SNP lähellä silmukointipaikoista, 43 SNP konservoitunutta transkriptiotekijän sitoutumiskohtia ja 32 CpG- saarilla. Lopuksi määritetään, että rs3106189, lokalisoitu 5’UTR antigeeniä esittelevien tapasin sitovan proteiinin (TAPBP), ja rs1052918, lokalisoitu 3 ’UTR transkriptiotekijän 3 (TCF3), liittyivät eloonjäämisaste CRC potilailla.

Citation: Shao J, Lou X, Wang J, Zhang J, Chen C, Hua D, et al. (2013) Kohdennettu uudelleenjärjestely-Tunnistetut rs3106189 klo 5’UTR TAPBP ja rs1052918 3’UTR TCF3 liittyvän kanssa eloonjäämisaste peräsuolen syövän Potilaat. PLoS ONE 8 (8): e70307. doi: 10,1371 /journal.pone.0070307

Editor: Hiromu Suzuki, Sapporo Medical University, Japani

vastaanotettu: 14 maaliskuu 2013; Hyväksytty: 19 Kesäkuu 2013; Julkaistu: 05 elokuu 2013

Copyright: © 2013 Shao et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus tukivat avustuksia tiede ja teknologia, Kiina (2006DFA32950, ​​2006AA02A303, 2012AA02A204,2011ZX09307-001-05) ja avustusta National Science Foundation, Kiina (81072060 /H1618). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

639000 kuolemantapausta vuodessa maailmanlaajuisesti, peräsuolen syöpä on kolmanneksi yleisin syöpä ja toiseksi yleisin syy syöpään liittyvien kuolemien länsimaissa (WHO, helmikuussa 2009 http: //www.who .int /mediacentre /tiedotteista /fs297 /fi /) ja Kiinassa [1], [2]. Tähän mennessä paksunsuolen syöpään altistava on ollut ominaista tunnistamiseksi harvinainen perinnöllinen mutaatioiden pieni joukko vakiintuneita geenien kuten mutaatiot

APC

geeni, geeni tunnistettiin ensin familiaalinen adenomatoottisen polypoosin (FAP) lokuksen geenin [3], joka edistää peräsuolen kasvaimien syntyyn [1], [4]. SNP (yhden emäksen monimuotoisuus) ovat yleisin tyyppi vaihtelua ihmisen perimän, esiintyy kerran useita satoja emäsparia läpi genomin [5].

Viimeaikaiset tutkimukset ovat osoittaneet potentiaalista valtaa syvä uudelleenjärjestely- kandidaattigeenien ihmisväestöissä havaita harvinaisia ​​variantteja ja auttavat ymmärtämään monimutkaisten ihmisen piirteet [6]. Perinteisesti, syövän genomin uudelleen sekvensointi on suoritettu käyttäen eksonin vahvistusta ja tavanomaisen Sangerin sekvensoinnilla [7] – [9]. Viime aikoina koko genomin tai kokonaan exome (by exome syömällä) on käytetty vuoksi tekninen kehitys ja alentuneet kustannukset seuraavan sukupolven sekvensointi [10] – [12]. Esimerkiksi Basso

et al.

Soveltaa koko Genomikartoituksen sekvensoida kasvaimia 9 CRC potilaiden ja tunnistettu 11-frame-geenin fuusio tapahtumia, kuten fuusio VTI1A ja TCF7L2, joka löydettiin 3 97 peräsuolen syövät [13]. Cancer Genome Atlas Network äskettäin suoritettu exome kaapata DNA-sekvensointi kolorektaalisyövissä ja tunnistetaan usein mutatoituja geenejä, mukaan lukien APC, TP53, KRAS, PIK3CA, FBXW7, Smad4, TCF7L2, sääntelyviranomaisten, ARID1A, SOX9 ja FAM123B (WTX) geenit [14].

Lisäksi sijaan syömällä koko exome, kohdennettua kaapata valitun halutun geenin vähentää kustannuksia ja mahdollisesti siirtää NGS kliiniseen käytäntöön. Esimerkiksi Pritchard

et al.

Kehitetty Coloseq, jossa valituilla alueilla 1,1 Mb DNA lukien 209 kb

MLH1

,

MSH2

,

MSH6

,

PMS2

,

EPCAM

,

APC

, ja

MUTYH

oli suunnattu, kiinni ja alistettiin NGS [15]. Kirjoittajat tunnistivat 28/28 (100%) tautia aiheuttavia mutaatioita MLH1, MSH2, MSH6, PMS2, EPCAM, APC, ja MUTYH [15].

Olimme kiinnostuneita kohdennettua pyydystäminen genomialueiden mukaan lukien promoottorit, ja introni-alueiden liittyvien geenien väylän tai verkon geenejä, joilla on tiettyjä ominaisuuksia ymmärtää syövän biologian. On olemassa useita etuja tämän lähestymistavan: 1) geenit voidaan valita perustuen biologian tai hypoteesi; 2) mutaatiot promoottori ja introni alueita, joita on viime aikoina ehdotettu olevan tärkeä sääntelyn rooleja, voidaan tutkia; ja 3) tekniikka on halvempaa kuin koko genomin tai koko exome sekvensoinnilla. Siksi suunnittelimme custom high-density oligonukleotidigeenisirumenetelmää (NimbleGen Inc.) kaapata yhteensä noin 1,7 Mb kohdealueita käsittää genomialuetta 28. liittyvistä geeneistä peräsuolen syövän lukien eksoni, introni, 10 kb ylävirtaan ja 5 kb alavirran sekvenssit seuraa analyysi käyttämällä Illumina Genome Analyzer. Valitun geenejä ovat ne, jotka kuuluvat WNT signalointireitin, sekä tärkeitä transkriptiotekijöiden tai paksusuolen-geenit, jotka ovat yli ilmaistuna CRC.

Tulokset

Kohdennettu Re-sekvensointi Genomisen alueiden Mukaan lukien promoottorit Key WNT Pathway ja muut CRC liittyviä Genes

Koska WNT signalointireitin on kriittinen polku sekaantunut CRC [16], valitsimme kaksi WNT reitin geenien (http: //www.genome. jp /Kegg /polku /HSA /hsa04310.html) aloittaa meidän tutkinnan. Lisäksi valitsimme 22 tärkeitä transkriptiotekijöitä (transkriptio säädin aktiivisuus GO: 0030528) ja neljä paksusuolen omat tai rikastettu geenejä [17], jotka ovat yli ilmaistu syöpään tietojen perusteella syntyy laboratoriossa sekä tietoja julkisia (esim GSE8671, GSE15960, GSE24551, GSE41258 päässä GEO tietokannasta). Lopullinen luettelo valituista 28 geenit on esitetty taulukossa 1 lappuja.

vähentää kuluja, ensin sekvensoitiin poolin 30 CRC kudosten (CRC-allas) ja altaan 30 vieressä normaali kudokset (CRN pool) ja sitten vahvisti SNP tunnistettu käyttämällä PCR tai Sequenom teknologioita. Olemme luoneet mukautetun oligo matriisi NimbleGen tekniikkaa kaapata kohdesekvenssien. Kokonaispituus kohde genomialueiden suunniteltu oli 1,7 Mbp. Kaapattu DNA: t sekvensoitiin käyttäen Illumina Genome Analyzer. Poistamisen jälkeen PCR päällekkäisiä raaka sekvenssit, keskimääräinen kattavuus vaihteli 32x ja 45x, ja kattavuutta sekvenssin pituus kohdealueilla kunkin geenin vaihteli 83,5-100%. Kattavuus eri alueilla kohdegeenien erosivat, mikä saattaa johtua omaisuutta NimbleGen järjestyksessä talteenottoteknologiaa, sekvenssikompleksisuus tai muita tuntemattomia tekijöitä. Raaka sekvensointi Aineisto talletetaan NCBI järjestyksessä lukea arkisto (SRA) hakunumerolla SRX277359.

taulukkomuodossa coverages kaikkien 28 geenien vertaamalla -alueille suunniteltu koettimia tai koko kohdealueilla lukien promoottorit ja 3′-distaalinen alueita (taulukko 1) voidaan laskea talteenottotehokkuutta NimbleGen lähestymistapaa. Mitataan kohdealueilla, mediaani coverages oli 98,1 ja 99,5% CRC ja CRN kudosten vastaavasti, ja jotka vaihtelevat 83,5-100% (taulukko 1). Vuonna NinbleGen koettimet, koettimet ole suunniteltu päällekkäiset oligot kattamaan koko alueen, vaan koettimia, jotka välimatkan joukossa kohdealueet, joilla on erityisiä ominaisuuksia optimoitu DNA talteenotto. Kattavuus laskema -alueille suunnitellut koettimet kaikki yli 100% (taulukko 1), mikä viittaa siihen, että sieppauskoettimien jää viereiset sekvenssit lisäksi niiden komplementaariset sekvenssit, mikä johti että sekvensoitiin alueet todella ulottaa ne alueet, jotka kuuluivat koettimia.

GC-pitoisuus laskettiin kunkin paikan viitesekvenssien keskitettynä käytettäessä 81-emäsparin ikkuna selvittääkseen, onko coverages vaikutti GC-pitoisuus kaapattu alueilla. Kattavuus on jokaisen aseman laskettiin jälkeen poistamalla päällekkäisiä sekvenssejä. Riittävä kattavuus 40X saavutettiin alueilla, joiden GC-pitoisuus välillä noin 15-75% (kuvio 1A, 1 B). Me seuraavaksi tutkittiin, onko ero kattavuus vaikuttaa havaitseminen taajuus sekvenssin muunnelmia. Me lasketaan Spearman korrelaatio SNP laskea ja vastaava kattavuus käyttäen R (www.r-project.org). Tässä kattavuutta laskettiin poistamisen jälkeen järjestyksessä kaksoiskappaleet. Korrelaatiokertoimet olivat -0,51 ja -0,38 CRC ja CRN näytteet, vastaavasti, mikä viittaa hieman korrelaatio SNP havaitsemisen ja lukea kattavuus. Olemme edelleen laskettuun onko SNP prosentuaalinen osuus kokonaismäärästä SNP eri peittojen (kuvio 1 C). Huomasimme, että ilmaisutaajuudelle pysyi kun sekvenssi kattavuus nousi 40X ja 60X CRC kudoksia. Kuitenkin olemme huomanneet, että havaitseminen taajuus normaalia kudosta altaat lisääntyi, kun sekvenssi kattavuus oli noin 55X ja 65X (kuvio 1C). Nämä erot saattavat ehdottaa suurempaa heterogeenisuus normaalia kudosta altaan kuin CRC kudos allas, joka voidaan selittää vastaavalla tuumoribiologiassa tai mutaatio profiilien joukossa CRC kudoksiin. Ilmaisulaitteen taajuus putosi kun sekvenssi kattavuus oli yli 65X, mikä johtuu todennäköisesti vääriä suuri kattavuus syntyy toistuvan sekvenssit näille alueille.

(A) GC-pitoisuus ja kattavuus CRC (peräsuolen syöpä) kudosta. (B) GC-pitoisuus ja kattavuus CRN (peräsuolen normaali kudos) kudosta. (C) välinen suhde sekvenssi kattavuus ja SNP havaitsemiseen. Punainen viiva osoittaa sekvenssin kattavuutta ja prosenttiosuus SNP havaittu, että kattavuus CRC-allas, ja vihreä viiva CRN allas (D) Venn kaavio SNP CRC ja CRN näytteitä. (E) yleiskatsaus SNP tunnistettu syöpää ja viereiseen normaaliin kudokseen.

Kun data-analyysi, tunnistimme yhteensä 2342 sekvenssin vaihtelut CRC ja vastaavien viereisten normaaleissa kudoksissa. Niistä 738 oli uusi sekvenssi muunnelmia perustuu vertailua nykyisen SNP tietokanta (dbSNP135; taulukko S1). 1226 vaihtelut olivat yhteisiä CRC ja normaalin paksusuolen kudoksiin, kun taas 374 ja 742 vaihtelut olivat ainutlaatuisia kullekin kudostyypin (kuvio 1 D).

Kahden yhdistettyä näytettä, mutaatioita vaihteli välillä 0,354 ja 4.942 per kilo- eri geenejä. Useimmat vaihtelut tapahtui introni alueilla, joissa vain 5% vaihtelut esiintyvät eksoni alueilla.

satunnaisesti valittu kahdeksan SNP validoitavaksi kattaa vaihtelut löytyy introni ja eksoni alueilla. Validointi, käytimme alleelispesifinen PCR (AS-PCR) ja genotyypin yhden nukleotidin polymorfismien [18], [19]. Kukin SNP analysoitiin yksitellen geenin tietyn alukeparia erillisessä kohortin 22 CRC näytteiden ja 24 CRC viereisten normaaleissa kudoksissa vastaavista potilaista ja neljää terveen luovuttajan (taulukko S5). Huomasimme, että tiedot neljän SNP vastasivat välillä sekvenointitulosten ja PCR validointi. Esimerkiksi SNP: varten MSX2 ja KAT5 havaittiin 100%: iin sekvensointi lähestymistapaa ja PCR validointi. Sillä rs80186078 että TFDP1 geeni, me vain havaitut SNP CRC kudoksissa sekvensoimalla ja validointi sitä sekä CRC ja CRN kudoksissa, mutta ei terveillä luovuttajien AS-PCR validointi. Olemme kuitenkin myös havaittu epäjohdonmukaisuuden sekvensointi yhdistettyä näytettä ja PCR validointi yksittäisten näytteiden. Esimerkiksi rs11186694 ja rs17107140 havaittiin sekä CRC ja CRN näytteet sekvensoimalla mutta sitä ei voitu havaita AS-PCR yksittäisissä näytteissä. Tämä tulos viittaa siihen, väärä positiivinen tunnistus SNP: iden tai epäonnistuminen AS-PCR. Emme yrittäneet suunnitella ylimääräisiä PCR alukkeiden AS-PCR, kuten olemme todenneet, että AS-PCR oli hankalaa ja puuttui herkkyys [20]. Lisäksi jotkut SNP (esim chr11:65481267_TG) havaittiin yhdessä yhdistetyssä näytteessä, mutta havaittiin sekä CRC ja normaaleissa kudoksissa, kun analysoitiin PCR: llä validointi yksittäisten näytteiden. Tämä tulos viittaa väärän negatiivisen tunnistaminen SNP yhden yhdistettyä näytettä. Kuitenkin, se ei ehkä ole yllättävää, koska jos alleelin taajuus SNP on alhainen yksi yhdistettyä näytettä, se voi jäädä huomaamatta sekvensoinnilla yhdistetyistä näytteistä.

Koska alhainen tehokkuus ja herkkyys SNP validointi PCR, päätimme käyttää Sequenom MassARRAY iPLEX Platform validointitutkimusten. Valitsimme 66 SNP validoitavaksi erillisessä kohortin 30 CRC kudosten koska DNA käyttää sekvensointi tyhjentynyt. Lopulta pystyimme vahvistaa olemassa 56 SNP 30 CRC kudoksissa (taulukko S6), mikä viittaa validointi, joka on vähintään 85% (56/66), kun otetaan huomioon, että jotkin havaitsemiseen vikoja saattaa johtua erot otosryhmästä.

toiminnallinen Seuraus Tunnistetut Sequence Variations

Huomasimme 15 SNP, joka muuttaisi proteiinisekvenssien joukossa eksoni vaihtelut CRC ja normaalin paksusuolen kudoksiin, mukaan lukien 14 missensemutaatioita ja 1 nonsense-mutaatio (kuvio 1 E ja taulukko 2). Nämä missensemutaatioita voivat vaikuttaa toiminto mutatoidun proteiinin tuotteita. Romaani SNP chr13:114288328_CT tunnistettu vain CRC kudoksissa johtaisi lopetuskodonin, mikä aiheuttaisi lopettamisperusteet kääntämiseen TFDP1 (NP_009042, Q200 *) ja menetys Transc_factor_DP_C verkkotunnus katkaistun TFDP1 proteiinia. Tämän seurauksena katkaistun TFDP1 CRC syövän synnyn vielä tutkittava.

neljä mutaatioista ei validoitava Sequenom n MassARRAY iPLEX (taulukko S6), ja sen vuoksi jätetty tarkempaa analyysiä. Neljä jäljellä 11 missense sekvenssivariaatioita tunnistettu CRC ja normaalin paksusuolen kudokset olivat uusia mutaatioita. Online työkalut PolyPhen, SIFT ja PROVEAN käytettiin ennustamaan toiminnalliset seuraukset (taulukko 2). Kaikki kolme ohjelmaa ennusti, että uusia mutaatioita MSX2 (A197T) vaikuttavat toiminnalliset domeenit proteiinin ja voi olla toiminnallisia vaikutuksia. NEXN (G245R) vaihtelu ennustettiin olevan toiminnallisia seurauksia, joita SEULOA ja PolyPhen ohjelmat (taulukko 2). PolyPhen ennustettu toinen mutaatio NR3C1 geeni todennäköisesti vahingoittavat (taulukko 2). Olemme myös arvioi nämä 11 mutaatioita on aiemmin raportoitu CRC. Kymmenen heistä ei ole aiemmin raportoitu liittyvän CRC ja siksi tunnistettiin ensimmäisen kerran (taulukko 2). Yksi niistä, rs459552 APC-geeni on raportoitu antavan suojaava vaikutus CRC kertoimet suhde 0,76 (CI = ,60-+0,97) keskuudessa CRC potilaista [21].

oli 29 synonyymejä SNP havaittu koodaavan alueen CRC ja CRN näytteitä ja 73 SNP: 5 ’tai 3’ UTR alueilla. FastSNP käytettiin ennustamaan sääntelyn rooleja näiden SNP lukien eksoni liitos tehostajana (ESE), eksoni silmukoinnin äänenvaimennin (ESS), aihe muutokset synonyymi SNP (taulukko 3), ja tf sitoutumiskohdat muutoksia UTR SNP (taulukko 4). ESE löytäjä voidaan tunnistaa paikkansapitävyys tunnista yksittäisiä SR proteiineja, jotka ovat erittäin konservoituneita liitos tekijät, ja RESCUE-ESE voi hakea sekvenssit ESE aktiivisuutta. Sen sijaan, FAS-ESS voi tunnistaa ESS. Ennustaminen tulokset kolmesta laskennallisia työkaluja yhdistettiin vahvistaa, onko yhden nukleotidin muutos muuttaisi liittämiseen motiivi. Transkriptiotekijän sitoutumiskohtia, jotka liittyvät kohde-SNP: tä tunnistettiin TFSEARCH käyttämällä FastSNP. Yhteensä 21 synonyymi SNP: ennustettiin muuttaa eksoni silmukoinnin motiiveja, ja 31 UTR SNP: tä ennustetaan esiintyä transkriptiotekijän sitoutumiskohdat, ja näin ollen voi vaikuttaa geenin transkriptiota. Romaani SNP chr2:219524460_CA (5’UTR BCSIL) löydettiin myös konservoituneet transkription sitoutumiskohtiin (taulukko S2).

Ymmärtääksemme toiminnalliset seuraukset introni SNP, online työkalu SNPnexus käytettiin käsinkirjoittaa SNP. Etäisyydet silmukointipaikoista laskettaisiin SNPnexus. Oli 20 introni SNP lähellä silmukointipaikoista jossa etäisyys alle 30 bp, ja vain yksi oli uusi. Mutaatiot näillä alueilla voivat vaikuttaa liittämiseen ja transkriptio. C6orf1, ETV4, KAT5 ja VAV1 kukin oli kaksi muunnelmia lähellä silmukointipaikoista ja TNKS2 oli 3 variaatioita lähellä silmukointipaikoista (taulukko 5). SNP rs2271959 (chr17:41622740_GT, ETV4) oli 5 emäsparin päässä liitos päällä ja havaittiin vain CRN kudoksiin suuri luottamus. Oli 43 introni, ylävirtaan tai geenien välinen SNP konservoitunutta transkriptiotekijän sitoutumiskohtia (taulukko S2) ja 32-CpG-saarekkeiden (taulukko S3).

Julkisen chip seuraavissa aineistoja, varsinkin ENCODE projekti, tarjota laaja TF sitovia tai DNAase yliherkkyys sivustoja erilaisissa solulinjoissa. Täällä, käytimme RegulomeDB käsinkirjoittaa SNP sääntelyn alueilla. Kukin SNP sai pisteet, joka edustaa eri sääntely- alueiden RegulomeDB (taulukko S1, taulukko 6). Edellä mainitut, todennäköisesti vahingollista, missense SNP rs1166698 (NEXN, vahvista Sequenom) sai pisteet 1 b, joka oli korkein tässä tutkimuksessa, mikä osoittaa, että SNP oli mukana monissa tärkeissä säätelyalueita. Toinen 1b SNP oli rs1860661, joka sijaitsee intronin TCF3 eikä testannut Sequenom. Niistä 2342 SNP, 1062 sijaitsivat TF sitova määriteltyjen alueiden Chip-seuraavissa tekniikkaa.

Analyysi yhdistysten välillä SNP ja Kokonaiselossaoloaika Time

Valitsimme yhdeksän SNP (taulukko 7 ), jotka ovat vahvistaneet sen Sequenom MassARRAY iPLEX teknologia ja alleeli heterozygosities yli 0,4 analysoitavaksi yhdistyksen välillä SNP ja CRC potilaan selviytymistä. Keräsimme näytteitä joukko 117 potilasta yksityiskohtaiset kliiniset tiedot tästä analyysiä käyttäen Sequenom MassARRAY iPLEX tekniikkaa. Jakauma 117 potilaiden demografiset ja ennusteeseen viittaavia ominaisuuksia on koottu taulukkoon 8, ja genotyyppi tiedot on koottu taulukkoon S7.

ensimmäinen analysoitu Hardy-Weinberg tasapaino kunkin SNP ja todettiin, että vain SNP rs1053023 poikkesi Hardy-Weinberg tasapaino (taulukko 9, p 0,05); P arvoja muille SNP vaihtelivat 0,3265 1. Vaikutus yhdeksästä SNP eloonjäämiseen aika arvioitiin 117 CRC käyttävän potilaan Kaplan-Meier menetelmä ja piirrettynä käyttäen Stata 12 (www.stata.com) tilastollinen analyysi ohjelma . Olemme havainneet, että kaksi SNP (rs3106189 ja rs1052918) liittyi eloonjäämisaste CRC potilaiden (kuva 2) käyttäen hallitseva malli riskisuhteita 0,25 (P = 0,009) ja 0,28 (P = 0,024), tässä järjestyksessä. SNP rs3106189 myös merkitsevästi yhteydessä CRC elossaololuku kanssa lisäaineen mallin (riskisuhde = 0,33, P = 0,021; taulukko 7). SNP rs3106189 lokalisoitu 5’UTR TAPBP, ja SNP rs1052918 lokalisoitu 3 ’UTR TCF3. SNP rs3106189, potilaiden määrä heterotsygoottista ja homotsygoottisia variantteja olivat 42 ja 7 vastaavasti. SNP rs1052918, potilaiden määrä heterotsygoottista ja homotsygoottisia variantteja olivat 47 ja 22 vastaavasti. Potilaat, joilla on jokin kahden vaihtoehdon näyttävät suuremmat todennäköisyydet hengissä pidempään.

(A) Kaplan-Meier kuvaaja rs3106189 lokalisoitu 5’UTR TAPBP. (B) Kaplan-Meier-kuvaaja rs1052918 lokalisoitu 3 ’UTR TCF3. Y-akseli, CRC eloonjäämistä; X-akseli, kuukautta leikkauksesta. Siniset viivat ovat homotsygoottisia villityyppisen (villi), vihreät ovat homotsygoottisia variantti (var), punainen Heterotsygoottisesti variantti (het).

Keskustelu

Tässä käsikirjoitus, kuvaamme analyysimme putki, joka koostuu (1) aluksi sekvensoidaan yhdistettyä DNA-näytteet seurasi validointi ja edelleen analyysi suuremmissa kohortteja näytteiden kustannusten vähentäminen (2) hypoteesin perustuva kohdennettu syömällä ja analysointi SNP ja niiden yhteenliittymien kanssa syöpä fenotyypit. Kokoamalla genomiset DNA sekvensointiin etuna on vähentää näytteen valmistusta ja sekvensoinnin kustannuksia. Esimerkiksi syömällä 30 yksittäiset näytteet edellyttäisi käyttäen 30 capture paneelit suorittaa hybridisaatio ja näytteen saannot, jotka ovat ikävä ja saattavat käyttöön näytteen ja näytteen vaihteluiden aikana näytteen valmisteluvaiheessa. Sekvensoinnin 30 yksittäiset näytteet olisivat myös huomattavasti kalliimpaa kuin sekvensoimalla yksi allas. Vaikka on mahdollista käyttää viivakoodi ja multiplexing reaktioita ja sekvensointi saavuttaa samankaltainen sekvenssin kattavuus vastaavilla kuluilla kokoamalla näytteitä, näytteen valmistus monimutkaisuus olisi huomattavasti suurempi. Hiljattain GWAS analyysi tyypin 1 diabetes (T1D) julkaistu Science, Nejentsev

et al.

Uudelleen sekvensoitiin eksonit ja silmukointikohdissa 10 ehdokkaan geenien DNA-altaat 480 potilasta ja 480 valvontaa tunnistaa aiheuttava tyyppi 1 diabetes (T1D) variantit ja sitten testataan heidän sairautensa yhdistys yli 30.000 osallistujaa [22]. Kirjoittajat tunnistivat neljä harvinaisia ​​muunnoksia, jotka itsenäisesti alensi T1D riski [kertoimet suhdeluvut, 0,51-0,74; P = 1,3 x 10 (-3) ja 2,1 x 10 (-16)] in interferoni indusoitiin helikaasin C domain 1 (IFIH1) [22].

Toinen selvä piirre analyysimme putki on, että sekvensoimme genomisen alueet, jotka sisältyvät eksoni ja introni-alueilla, eli 10-kb promoottorin ja 5 kb alavirtaan genomialuetta valitun geenejä. Tämä menetelmä oli toisin useimmissa tutkimuksissa, että vain analysoinut eksonisekvenssit (exome capture) [23], [24]. On tärkeää sisällyttää promoottorialueiden analyysissä, kuten SNP promoottorialueissa on liittynyt kasvaimien syntyyn. Esimerkiksi, Bond

et al.

Osoitti, että yhden nukleotidin polymorfismin MDM2-promoottori voitaisiin lieventää p53-tuumorisuppressorin reitin ja nopeuttaa kasvainten muodostumista ihmisissä [25]. Passarelli

et al.

Osoitti, että SNP estrogeenireseptori beeta promoottori liittyy selviytymisen postmenopausaalisille naisille CRC [26]. Polymorfismien UTR-alueiden geenien on myös havaittu liittyvän syöpään. Esimerkiksi Zhang

et al.

Havaittu, että polymorfismi 3’UTR alueella insuliinin kaltaisen kasvutekijän I (IGF1) geenin ennustaa selviytymisen ei-pienisoluinen keuhkosyöpä kiinalaisessa väestöstä [27] . Hao

et al.

Havaittu, että SNP (rs3213245, -77T C) XRCC1 geenin 5 ’UTR myötävaikuttaa vähentynyt promoottorin aktiivisuus ja lisääntynyt riski ei-pienisoluinen keuhkosyöpä [28]. Olemme tunnistaneet ja validoitu käyttämällä Sequenom alustan useita SNP: että paikallistettu 5 ’tai 3’ UTR geenien (taulukko S6). Esimerkiksi, rs3106189 on TAPBP ja rs8041394 on GTF2A2 lokalisoitu 5 ’UTR: t, ja rs1051425 sekä ETS2 ja rs1052918 on TCF3 lokalisoitu 3’UTRs (taulukko S6). Toiminnallinen merkitys näissä SNP on vielä määrittämättä.

Olemme päättäneet geenit liittyvät WNT polku, kuten Cancer Genome Atlas Network löytyy mutaatiot 16 eri geenien WNT reittejä kuten APC, CTNNB1, FAM123B ja TCF7L2 [14]. Laajensimme analyysi WNT reitin geenit alueille pidemmälle exome analysoi Cancer Genome Atlas Network, ja meidän lähestymistapamme on mahdollista tunnistaa ne mutaatiot, jotka moduloivat geenin ilmentymistä tai silmukoinnin lisäksi määritettäessä niitä rakenteellisesti vahingollisia mutaatioita eksonit .

havaintojen mukaan yhteensä 2342 sekvenssin vaihtelut CRC ja vastaavien viereisten normaaleissa kudoksissa. Niistä 738 oli uusi sekvenssi muunnelmia perustuu vertailuun nykyisen SNP-tietokanta (dbSNP135; taulukko S1). Valitsimme 66 SNP validoitavaksi erillisessä kohortin 30 CRC kudoksiin. Pystyimme vahvistaa olemassa 56 SNP 30 CRC kudoksissa (taulukko S6), mikä viittaa validointi, joka on vähintään 85% (56/66), kun otetaan huomioon, että jotkin havaitsemisen epäonnistumisia saattaa johtua eroista otosryhmästä . Tämä validointi korko on sopusoinnussa julkaistujen validointi osuus 85,4% NGS käyttäen Illumina platform [29]. Lisäksi on raportoitu, että useat validointi alustoilla kuten Sangerin sekvensoinnin, pyrosekvensointi, Sequenom MassArray tai tilannekuvan SNP Detection puuttuu herkkyys vahvistaa sekvenssivariantteja tunnistaa syvät sekvensoinnilla kasvaimissa, jotka voivat olla saastuneita DNA: iden normaaleista kudoksista tai jotka voivat sisältää useita klooneja [30].

tunnistettu 14 missense eksoni mutaatiot CRC ja normaalin paksusuolen kudokset (taulukko 2). SNP (G245R) klo NEXN geeni (Nexilin, F aktiini sitova proteiini) ennustettiin olevan toiminnallisia seurauksia. Roolit NEXN geenin syöpä ei ole vielä tutkittu. Kaksi romaani SNP ytimen reseptorin alaperheen 3, C-ryhmän jäsen 1 (NR3C1) ja lysiiniä liasetyylitransferaasi 5 (KAT5) geenien havaittiin vain CRC kudoksissa, mutta ei normaalissa paksusuolen kudoksiin. KAT5 (myös nimeltään TIP60 tai HIV-1-Tat-interaktiivinen proteiini) on histoni asetyyli transferaasi (HAT), ja sillä on tärkeä rooli säätelyssä chromatin remodeling ja DNA: n korjaukseen ja apoptoosin [31]. Vuonna peräsuolen syöpiä, KAT5 alas sääntely liittyy edenneessä vaiheessa paksusuolisyövän [32]. NR3C1 (alias, glukokortikoidireseptorin) havaittiin epigeneettiseltä vapautettiin peräsuolen kasvainten synnyssä [33]. Lisäksi hypermetyloitunut NR3C1 on CRC geenin mikrosatelliittien epävakaus [34]. Nämä uudet SNP KAT5 ja NR3C1 geenit takaa vahvistus, ja muita toiminnallisia tutkimuksia tarvitaan arvioimaan toiminnallisia seurauksia mutaatioiden ja niiden suhdetta syöpää, kuten onko SNP matkisi epigeneettisenä määräyksiä näiden geenien.

Meillä on myös tunnistettu SNP, joka saattaa vaikuttaa eksonin silmukoinnin koska ne paikallistaa sen ESE (eksoni liitos tehostajana) ja ESS (eksoni liitos äänenvaimennin), jotka ovat kriittisiä eksonissa liittämiseen. Esimerkiksi tunnistimme SNP kaukana ylävirtaan elementti (sulake) sitova proteiini 1 (FUBP1), peroksisomiproliferaattoreilla aktivoituvan reseptorin alfa (PPARa) ja transkriptiotekijä Dp-1 (TFDP1), jotka saattavat vaikuttaa eksoni liitos näiden geenien, ja nämä SNP: t havaittiin vain CRC kudoksissa (taulukko 3). Zhang

et al.

Osoitti, että SNP (-195 C T; dbSNP ID: rs1056932), joka muuttaa mahdollinen sitoutumiskohta eksoni liittämiseen edistäjä voisi vaikuttaa riski non-Hodgkin-lymfooman [35]. Toiminnalliset seuraukset SNP, joka lokalisoituvat ESE tai ES sekvenssien FUBP1, PPARa ja TFDP1 geenien takaa lisätutkimuksia.

todenneet, että rs3106189, paikallistaa 5 ’UTR: TAP sitovan proteiinin (tapasin; TAPBP ), ja rs1052918, paikallistaa 3 ’UTR TCF3, liittyi eloonjäämisaste CRC potilaista (taulukko 7 ja kuvio 2), jossa riskisuhteita saavuttaa 0,28 (P = 0,024) ja 0,33 (P = 0,021), vastaavasti. Nämä tiedot viittaavat siihen, että nämä kaksi vaihtoehtoa antavat suojaavia vaikutuksia CRC potilaille. Mielenkiintoista, toinen muunnos, joka me tunnistettu, rs459552 APC-geeni, oli aiemmin raportoitu antaa suojaava vaikutus CRC kertoimet suhde 0,76 (CI = +0,60-,97) keskuudessa CRC potilaista [21]. Emme kuitenkaan ole analysoida SNP jonka Sequenom tekniikkaa eikä siksi voi arvioida, onko toteamus pätee myös meidän keräämiseen.

TAPBP koodaa läpäisevä glykoproteiini, joka välittää vuorovaikutusta vasta kootut (major histocompatibility complex MHC) luokan I molekyylien ja kuljetusliikkeen liittyvät antigeenin prosessointia (TAP) [36]. Downregulation TAPBP ilmentymisen on havaittu useita syöpiä, mukaan lukien CRC, kuten im- paeta mekanismi ihmisen kasvaimissa [37]. Menetys TAPBP ilmentyminen on havaittu 80% korkealaatuisesta intraepiteliaalinen neoplasia (HIN) verrattuna autologiseen peräsuolen limakalvon, 63% ensisijaisen adenokarsinooman vaiheessa III ja 79% sovitetun imusolmukemetastaaseja [38]. Ex vivo käyttöön TAPBP ilmentymistä hiiren keuhkosyöpä malli suuremman pinta-MHC-luokan I ja palauttaa kasvainsolujen herkkyyttä antigeeni-spesifisten sytotoksisten T-lymfosyyttien (CTL) tappaa [39]. SNP rs3106189 sijaitsee sisällä H3K27Ac Histonimerkki, joka on usein lähellä aktiivisia säätelyelementtejä, ja sisällä H3K9Ac ja H3K4me3 markkaa (UCSC genomin selain; Kuva S1). Lisäksi rs3106189 on lokalisoitu joukossa sitoutumiskohtia useille transkriptiotekijöitä kuten interferoni sääntely transkriptiotekijä 1 (IRF-1), IRF-2 ja IRF-7. Tarkka toiminnallinen seurauksena variantti on rs3106189 lokuksessa vaatii lisätutkimuksia.

Transkriptiotekijän 3 (TCF3; E2A immunoglobuliini tehostajana sitova tekijät E12 /E47) on jäsenenä TCF /LEF transkriptiotekijä perhe, joka on keskeinen säätelyssä orvaskeden ja alkion kantasolujen identiteettiin ja on mukana WNT signalointireitillä [40]. Rintasyövässä TCF3 on mukana säätelyssä rintasyövän solujen erilaistumisen valtion ja tuumorigeenisyystesti [40]. Lisäksi yliekspressio TCF3 on osittain vastuussa butyraatti-resistentti fenotyyppi CRC koska TCF3 estää hyper-induktion Wnt-aktiivisuuden butyraatti [41].

Vastaa