PLoS ONE: transcriptome Wide analyysi UTR Non-pienisoluinen keuhkosyöpä paljastaa syöpään liittyvien geenien kanssa SNV aiheuttamiin muutoksiin RNA Sekundäärirakenteen ja miRNA Kohdesivustot
tiivistelmä
Perinteiset mutaatio arviointimenetelmiä keskitytään yleensä ennustamaan häiritsevä muutoksia proteiinia koodaavat alueet sijaan ei-koodaavat säätelyalueita kuten transloimattomia alueita (UTR) mRNA. UTR, kuitenkin tiedetään olevan monia järjestyksessä ja rakenteellisia motiiveja, jotka voivat säädellä translaation ja transkription tehokkuuden ja vakauden mRNA vuorovaikutuksessa RNA-sitovien proteiinien ja muiden ei-koodaavat RNA: t, kuten MikroRNA (miRNA). Tuoreessa tutkimuksessa, transcriptomes kasvainsolujen kätkeminen mutantti ja villityypin
KRAS
(V-Ki-ras2 Kirsten rat sarkooma viruksen onkogeenin homologi) geenien potilailla, joilla on ei-pienisoluinen keuhkosyöpä (NSCLC) ovat olleet sekvensoitiin tunnistamaan yhden nukleotidin vaihtelut (SNVs). Noin 40% koko SNVs (73717) tunnistettujen oli kartoitettu UTR, mutta jätetty pois edellisessä analyysissä. Vastatakseen tähän selkeää kysyntää analyysi UTR, suunnittelimme kattavan putken ennustaa, SNVs kahteen tärkeään säätelyelementtejä, sekundaarinen rakenne ja miRNA kohdesivustot. Out of 29290 SNVs vuonna 6462 geenejä, me ennustaa 472 SNVs (408 geenejä), jotka vaikuttavat paikallisiin RNA sekundaarirakenteissa, 490 SNVs (in 447 geenejä), jotka vaikuttavat miRNA kohdesivustot ja 48, jotka tekevät molempia. Yhdessä nämä häiritsevä SNVs oli läsnä 803 eri geeniä, joista 188 (23,4%) oli aiemmin tiedetään olevan syöpään liittyvän. Erityisesti tämä suhde on huomattavasti suurempi (yksipuolinen Fisherin testiä p-arvo = 0,032) kuin suhde (20,8%) tunnettujen syöpään liittyvien geenien (n = 1347) meidän alkudatajoukkoon (n = 6462). Verkko-analyysi osoittaa, että geenit kätkeminen häiritsevä SNVs olivat mukana molekyylitason mekanismeja syövän, ja signalointireittien LPS-stimuloidun MAPK, IL-6, iNOS, EIF2 ja mTOR. Lopuksi olemme löytäneet satoja SNVs jotka ovat erittäin häiritsevä suhteen muutoksiin sekundaarirakenne ja miRNA kohde sivustojen UTR. Näihin muutoksiin mahdollisesti muuttuu ilmentymistä tunnettujen syöpää tai geenejä, jotka liittyvät syöpään liittyvän reittejä.
Citation: Sabarinathan R, Wenzel A, Novotny P, Tang X, Kalari KR, Gorodkin J (2014) transcriptome Wide analyysi UTR Non-pienisoluinen keuhkosyöpä paljastaa syöpään liittyvien geenien kanssa SNV aiheuttamiin muutoksiin RNA Sekundäärirakenteen ja miRNA Kohdesivustot. PLoS ONE 9 (1): e82699. doi: 10,1371 /journal.pone.0082699
Editor: Akio Kanai, Keio University, Japani
vastaanotettu: 02 elokuu 2013; Hyväksytty: 26 lokakuu 2013; Julkaistu: 8. tammikuuta 2014
Copyright: © 2014 Sabarinathan et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoittajat: tanskalainen keskus for Scientific Computing (DCSC, DeiC); Tanskan neuvoston strategisen tutkimuksen (Programme komission strateginen kasvu Technologies); Tanskan neuvoston riippumattomia Research (teknologia ja tuotanto Sciences). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Seuraavan sukupolven Genomikartoituksen käytetään nyt laajalti tunnistamiseksi geneettisen vaihtelun syövän genomien [1], [2]. Ei-pienisoluinen keuhkosyöpä (NSCLC) on yleisin keuhkosyövän, ja se on usein on aktivoivia mutaatioita
KRAS
onkogeeni, joka aiheuttaa tuumorisolujen olla aggressiivinen ja resistenttejä kemoterapialle [3] – [5]. Tuoreessa tutkimuksessa, Kalari et al. [6] suoritetaan transcriptome laajuinen sekvensointi NSCLC ja tunnistettu ilmentyvät eri geenien, vaihtoehtoinen silmukointi-isoformit ja yhden nukleotidin variantit (SNV) kasvaimia ja ilman
KRAS
mutaatioita. Verkostoanalyysi suoritettiin geenien osoittavat ero lauseke (374 geenit), vaihtoehtoisen silmukoinnin (259 geenit) ja SNV-liittyviä muutoksia (65 geenejä), jotka ovat eri tavoin läsnä keuhkojen kasvain ryhmissä ja ilman
KRAS
mutaatioita . Integroitu polku analyysi tunnistettu NFKB, ERK1 /2 ja AKT polkuja merkittävimpänä reittejä eri tavoin vapautettiin
KRAS
villityypin verrattuna
KRAS
mutatoitunut näytteitä.
yhden nukleotidin muunnos (SNV) on nukleotidimuutos yhden emäksen asema, joka esiintyy alhaisella taajuudella (viitataan myös harvinainen variantti). SNVs havaittu tuumorisoluissa ovat enimmäkseen somaattiset variantteja ja hyvin harvat ovat ituradan variantteja. Genome-laajuinen yhdistys tutkimukset (GWAS) raportoivat, että SNVs useimmiten esiintyvät ei-koodaavat alueet verrattuna koodaus (eksoni) alueet RNA: iden [7]. Aiemmin on kuitenkin, useimmat tutkimukset ovat keskittyneet vaikutus SNVs koodausalueilla (tunnetaan cSNVs tai nsSNVs) [8], sen sijaan, että vaikutus SNVs sääntely- ei-koodaava DNA: ta tai ei-koodaava RNA (rSNV) . Siinä tapauksessa, NSCLC, Kalari et ai. [6] havaintojen mukaan yhteensä 73717 ainutlaatuinen SNVs läsnä ja ympärillä (+/- 5 kb) RefSeq geenejä. Näistä 23987 olivat cSNVs ja niiden vaikutukset koodaavat alueet on aiemmin ennustettu (ks [6] lisätietoja). Vaikutukset rSNVs jotka sijaitsevat transloimattomat alueet (UTR) proteiini-koodaus geenit kuitenkin on tutkittava.
On hyvin tunnettua, että UTR keskeisessä asemassa ovat transkription jälkeisen sääntelyn lukien mRNA vakautta [ ,,,0],9], liikenteen [10], lokalisointi [11], [12], translationaalinen aktivointi [13] ja sorron [14], [15]. Nämä toiminnalliset määräykset suorittaa
cis
sääntelyvälineitä alkuaineet 5 ’ja 3’ UTR. Erityisesti, jotkut
cis
sääntelyvälineitä elementit rakentuvat esim rauta-reagoivan elementin (IRE), sisäisen ribosomin sisääntulokohdan (IRES) ja selenokysteiini insertiosekvenssi (SECIS). Ensisijainen rakenne
cis
sääntelyvälineitä elementtejä on myös tärkeää, että sitoutumisen
trans
LINJASÄÄTÖVENTTIILIT RNA-sitovia proteiineja tai muita ei-koodaavat RNA: t. Esimerkiksi MikroRNA (miRNA) ovat pienet ei-koodaavat RNA: t (noin 22 nt), jotka sitoutuvat tavoitekohdissa enimmäkseen läsnä 3 ’UTR. Tämä vuorovaikutus johtaa joko pilkkomista kohde- mRNA: iden tai tukahduttamisen niiden käännös. Useissa tutkimuksissa on raportoitu, että miRNA-välitteinen geenisäätelyn on merkittävä rooli syöpäsoluissa ja tällainen sääntely on pidetty mahdollisena huumeiden kohde (katso katsaus [16]). Kaikki tämä näyttö tukee sekä sekvenssin ja rakenteellisia motiiveja UTR on tärkeää hallita geenien ilmentymisen.
esiintyminen geneettinen vaihtelu (t) UTR voi mahdollisesti vaikuttaa niiden järjestys ja /tai rakenteellisia motiiveja ja johtaa siten muutokset posttranskriptionaalisen asetuksen [17] – [20]. Esimerkiksi SNP on päästää 7 miRNA kohdepaikkaan (miRTS) 3 ’UTR:
KRAS
on todettu vaikuttavan sitoutumiseen anna-7 miRNA. Tämä johtaa yli-ilmentyminen
KRAS
, mikä suurentunut NSCLC [21]. Lisäksi viimeaikaiset tutkimukset raportoivat, että geneettinen vaihtelu voi mahdollisesti luoda, muuttaa tai tuhota miRNA tavoitteita sivustoja, mikä johtaa häiriöstä kohde-mRNA [22], [23]. Erityisesti tämä on tunnistettu kasvainsoluissa sekä [24]. Lisäksi syövän perustuva mutaatio läsnä IRES ihmisen
p53
mRNA muuttaa rakennetta IRES-elementin, joka inhiboi transaktivoivia tekijä olennaista käännös [25]. Viimeaikaiset useita web-palvelimia ja tietokantoja kehitetty käsittelemään variantit vaikuttavat miRTSs osoittaa myös kasvavaa merkitystä kohdesivustoa varianttien [22], [26] – [28].
Tässä tutkimuksessa olemme ennustaa mahdolliset vaikutukset 29290 SNVs liittyvät NSCLC jotka sijaitsevat UTR alueilla mRNA. Paikallinen vaikutus SNVs on toissijainen rakenne UTR ennustetaan käyttämällä RNAsnp [29] ja vaikutus SNVs on miRTSs että UTR ennustetaan käyttämällä TargetScan [30] ja Miranda [31], joiden osoitettiin olevan yksi luotettavampia miRNA tavoite ennustus menetelmiä [32]. Kokeellisesti tunnistettu miRNA-mRNA karttoja käyttäen Argonaute (Ago) ristisilloitukseen immunosaostus yhdessä korkean suoritustehon sekvensointi (CLIP-Seq), ovat edelleen käytetään vähentämään vääriä positiivisia ennusteita miRTSs [33].
materiaalit ja menetelmät
Tietolähteet
SNVs tunnistettu RNA-sekvensointi 15 ensisijaisen keuhkoadenokarsinooma kasvaimet (8
KRAS
mutaatio ja 7 ilman
KRAS
mutaatio) uutettiin Kalari et al. [6]. On huomattava, että edellisessä tutkimuksessa [6] ei ollut RNA-sekvensointi tietoja normaaleissa soluissa, joten se ei ollut mahdollista erottaa SNVs peräisin ituradan tai somaattiset mutaatio. Siten datajoukon saatu, 29290 UTR SNVs vuonna 6462 koodaus geenit, jotka ovat peräisin sekä ituradan ja somaattisia variantit, jotka ilmaistiin keuhkoadenokarsinooma kasvaimia. Perustuen päällekkäisyys näiden SNVs kanssa dbSNP (135 build), voisimme arvioivat, että 40%: n 29290 SNVs ovat ituradan variantteja. Niille SNVs kanssa päällekkäiset dbSNP merkinnät, myös purkanut SNP kytkennällisessä DIS-tasapaino käyttäen SNAP-palvelimen [34] (versio 2.2; oletusparametreillä: r
2≥0.8, etäisyys raja 500 kb, SNP data asettaa 1000 Genomes pilotti 1, ja väestö paneeli CEU).
RefSeq mRNA-sekvenssit, jotka vastaavat 6462 geenejä (hg19 Build) on ladattavissa UCSC genomista selaimen (https://genome.ucsc.edu) [35 ]. Geenejä, joissa on useita selostukset, kaikki isoformit pidettiin. Mukaan kartoitus 29290 SNVs näiden RefSeq mRNA-sekvenssien, saimme 3646 5 ’UTR: t, 25627 3’ UTR: t ja 17 sekä 5 ’ja 3’ UTR: n päällekkäisten selostukset. Nämä SNVs oli alistetaan edelleen kattavan putkilinjan (kuvio 1) ennustaa niiden vaikutusta RNA sekundaarisen rakenteen ja miRNA kohdekohtia, joka on kuvattu seuraavissa kappaleissa.
luettelo syöpään liittyvien geenien saatiin COSMIC [36] ja Qiagen /SABioSciences [37]. Tämä lista sisältää 1347 ja 6462 geenien katsotaan tässä analyysissä. Jotta voitaisiin löytää rikastumista geenien kuljettavat häiritsevä SNVs, joilla on vaikutusta sekundaarirakenteissa ja /tai miRTSs, syövän, suoritimme yksipuolinen Fisherin testiä. Tämä on laskettu 2 x 2 kontingenssitaulukkomenetelmillä (n = 6462), jonka määrä geenejä kuljettavien /joissa ei ole häiritsevä SNVs toisella puolella ja useita syöpään liittyvän /muita geenejä toisella puolella. Samoin rikastamalla häiritsevä SNVs in syöpään liittyvien geenien laskettiin luokittelemalla kokonaismäärä SNVs (n = 29290) osaksi häiritsevää /ei-häiritsevä SNVs toisaalta, ja ne ovat sekä ei esiinny syöpään liittyvien geenien toisaalta.
joukko kokeellisesti todistettu esimerkkejä SNP kanssa vaikutuksia miRNA kohdesivustot on purettu kirjallisuudesta (katso taulukko S1). Nämä 19 SNP (vaikuttava 25 miRNA-mRNA vuorovaikutus) on testata suodatuksen käytettyjen kriteerien miRNA osa putkilinjasta.
ennustaminen SNVs ”vaikutus RNA sekundaarirakenteissa
vaikutus SNVs RNA sekundaarirakenteissa ennustettiin käyttämällä RNAsnp (versio 1.1) [29]. Villityypin mRNA-sekvenssit ja SNVs annettiin syötteenä yhdessä oletusparametrejä RNAsnp. Kunkin SNV, RNAsnp pidetään ikkuna +/- 200 mukset ympäri SNV kanta tuottaa villityypin (WT) ja mutantti (MT) alisekvenssejä ja lasketaan niiden emäsparin todennäköisyys matriisit ja. Sitten erotus emäsparin todennäköisyys villityypin ja mutantti-rakenne mitattiin käyttäen Euklidinen etäisyys (d) ja Pearsonin korrelaatiokerroin (r) kaikkien paikallisten alueiden alasekvenssi. Täydellisyyden, me lyhyt yhteenveto näitä kahta toimenpidettä seuraavasti. Ensimmäinen laskee ero kahden matriisin suoraan (1) missä on todennäköisyys emäkset
i
ja
j
on pariksi. Toinen toimenpide käyttää kanta-viisasta pari todennäköisyydet. Paikallisen alueen, vektori sisältää elementtejä. Sitten ero kahden vektorien ja mitataan (2) B
Lopuksi paikallinen alue ennustaa suurin Euklidinen etäisyys (d
max) tai vähintään Pearsonin korrelaatiokerrointa (r
min) ja vastaava p-arvo raportoidaan sitten. Palveluksessamme molemmat toimenpiteet itsenäisesti molemmat toimenpiteet pitävät niiden vahvuudet ja heikkoudet (katso [29] lisätietoja). Meillä syntyy kaksi luetteloa (jokaisessa on p 0,1) ehdokkaita, d
max ja r
min, ja jokainen niistä tehdään usean testaus korjauksen käyttäen Benjamini-Hochberg menettely [38], mikä rajoittaa väärä löytö korko on enintään valittu kynnysarvo (tyypillisesti 10%).
sen analysoimiseksi, onko RNAsnp ennustettu paikallinen alue on rakenteellisesti säilyneitä, käytimme merkinnät konservoituneiden RNA sekundaarirakenteen ennustuksia meidän in- house putki [39], joka käyttää erilaisia työkaluja, kuten CMfinder [40] ja RNAz [41] ohjelmia.
ennustaminen on SNVs ”vaikutus microRNA kohdesivustot
kunkin SNV datan asetettu, alasekvenssi 30 mukset kummallakin puolella SNV aseman noudettiin. Edelleen, kaikki 2042 ihmisen kypsän miRNA sekvenssit miRBase (v19) [42] käytettiin etsimään mahdollisia kohdesivustot villityypin ja mutantti (jossa SNV) subsequences. Ensimmäisessä vaiheessa, TargetScan (versio 6.0) [30] käytettiin tunnistamaan paria SNVs ja miRNA joille tyypin siementen ottelu eroaa villityypin ja mutantti tai on läsnä vain jompikumpi niistä. Eri siementen tyyppejä, joita TargetScan ovat 7mer-1a, 7mer-m8 ja 8mer-1a (kasvava vahvuus), jossa ”1 a” viittaa adenosiini on miRTS 3 ’siementen ottelua (eli vastapäätä ensimmäisen nukleotidin n miRNA) ja ”-m8” viittaa Watson-Crick-Hyväksytty nukleotidikohtaan 8. Tämän jälkeen vuorovaikutus energia näiden parien laskettiin käyttäen Miranda (versio 3.3a) [31]. Siemenenä ottelu muutos on jo edellytetään TargetScan Suodatuksen parametrit Miranda asetettiin ei punnita siemen alueen liian korkea ( ’mittakaavaisia 2’ sijasta default 4) ja rento cutoffs (pisteet 45, energia -5 kcal /mol), jotta kaapata tapauksia, joissa huono siemen ottelu voidaan kompensoida. Luokitella vuorovaikutus niiden toimivan me myöhemmin hakea varovaisempaa energiaa kynnyksellä -11 kcal /mol perustuvat edellisessä tutkimuksessa [43]. Kunkin parin miRNA ja 61mer, vain vahvimmat sitoutumiskohta (alin), joka eroaa WT ja SNV-sekvenssi säilyy. Otaksuttu vuorovaikutukset luokitellaan
luotu
,
tuhoutunut
tai
muuttaa
mutatoitumisen perustuu Miranda ennusteita.
luoda
joukko sisältää kohde sivustoja, jotka indusoi SNV, eli on vuorovaikutus energia -11 kcal /mol tai pienempi SNV variantti, kun ei ole vuorovaikutusta ennustetaan villityypin (joko johtuvat pisteet tai energian kynnys). Samoin menetys kohdepaikan olisi merkitään
tuhota
asettaa, jos vuorovaikutus ennustetaan villin tyypin mutta ei SNV. Lopuksi
muuttaa
joukko sisältää otaksuttu yhteisvaikutuksista, ennustetaan sitovan energian korkeintaan -11 kcal /mol ainakin yhden vaihtoehdon. Näiden energia ero havaittiin sitoutumisen miRNA ennen ja jälkeen SNV käyttöönoton mitattiin niiden log-suhde
lr
= ld (/), 0.
LR
on 0, jos ei ole muuttunut energia; negatiivinen, jos villityypin on voimakkaampi vuorovaikutus (alempi energia), positiivinen toisin. Koska koko datajoukon, keskitymme (ylhäällä) ehdokasta, jonka absoluuttinen
lr
arvo on yli keskimääräisen (μ) absoluuttisen
LR
arvot kaikki parit luokiteltu alter. Tehokkuus tämän kynnyksen selvästi vaihtelee data, mutta se tulee aina säilyttää alkuun ehdokkaat suhteellisesti eniten energiaa ero. Vaikka sitä ei voida pitää kiinteän cut-off, haimme sen meidän joukko tunnettuja esimerkkejä, joissa 14 ulos 23 vuorovaikutusten ylittää arvoa sovelsimme here (katso taulukko S1). Kynnysarvot perustuvat jakeluun MFE muutoksia on käytetty samalla tavalla ennen [24].
Jotta voitaisiin vähentää vääriä positiivisia ennusteita, Mirna kohdesivustot ennustettu villikannan (
tuhota
tai
muuttaa
) on ristiintarkastettu kokeellisesti tunnistettu microRNA-kohde vuorovaikutuskarttojen. Nämä tiedot, johdettu Ago CLIP-Seq, ladattiin STARBASE [44]. Vain SNVs, jotka sijaitsevat sisällä tiukat Ago CLIP-Seq piikin klustereiden biologisen monimutkaisuus (BC), joka on vähintään kaksi oli säilytetty. Tämä suodatin ei voida käyttää vuorovaikutuksia
luoda
asettaa, koska CLIP-Seq data on saatavilla villityypin vain.
Lopuksi joukko miRNA suodatettiin niille ilmaisseet hengityselimiä (keuhko- ja henkitorvi) mukaan miRNA kehon kartan [45]. Katsaus Mirna analyysi kuvataan kuviossa 2.
vuokaavio esittää eri vaiheet ennustaminen ja suodatuksen kanssa useita yksittäisiä SNVs, miRNA, ja paria näistä kussakin vaiheessa.
Valitse PhenomiR [46] tietokantaan, me haetaan tietoa miRNA, joiden on havaittu olevan ylös- tai alaspäin säännelty keuhkosyöpä. Tämä sarja koostuu 264 yksittäisiä miRNA kantasilmukan liittymiset, joista 3 on ”kuollut merkinnät”. Loput 261 varsi-silmukkaa aiheuta 430 kypsä miRNA tuotteita, jota me kutsumme nimellä
keuhkosyöpään liittyvien miRNA
. Tässä tietokokonaisuus, 27 miRNA ovat ominaisia NSCLC [47] tyyppi mukaan miRNA kehon kartta [45]. Myöhemmin datasarja on tarkoitettu niin
NSCLC liittyviä miRNA
.
Ingenuity Pathways Analysis
Interactome verkostojen kandidaattigeenejä rakennettiin käyttäen Ingenuity Pathway Analysis (IPA) ohjelmisto (Ingenuity ® Systems, www.ingenuity.com, rakentaa versio: 220217; sisällön versio: 16542223). Verkko sukupolvi perustuu Global Molecular Network ”IPA, joka koostuu laajasta, manuaalisesti kuratoinut joukko geenin-geenin suhteet perustuvat havaintoihin tieteellisestä kirjallisuudesta. Kiinnostavat geenit (ehdokasta laittaa pois meidän putkiston ja tarkoitus syöttää IPA), jotka ovat myös läsnä tässä globaalissa verkossa ovat ns keskittyä geenejä. Korkeasti toisiinsa painopiste geenit ovat lähtökohtia verkko sukupolvi. Muita ei-keskittyä geenejä Global Molecular Network voitaisiin käyttää linkkeri geenien pienten verkkojen. Verkkoja jatketaan kooltaan noin 35 geenien, joka on optimaalinen visualisointi ja tulkinta (lisätietoja [48]). P-arvo lasketaan kullekin verkon edustaa todennäköisyys löytää samat (tai enemmän) määrä keskittyä geenien satunnaisesti valittu joukko geenejä maailmanlaajuisen verkon. Se lasketaan oikean pyrstö Fisherin Exact Test kanssa (ei-) keskitytään molekyylejä toisella puolella ja molekyylit (ei) verkossa toisella puolella 2 x 2 kontingenssitaulukkomenetelmillä. Tämä muuttuu pisteet, joka on negatiivinen logaritmi p-arvo. Lisäksi IPA käytettiin tunnistamaan alkuun sairauksien ja häiriöiden, molekyyli- ja solutason toimintoihin, ja kanoninen reitit liittyvät geenit meidän ehdokas sarjaa (ns focus geenejä ”). P-arvo tietyn (sairaus, toiminto tai reitti) merkintä kuvaa todennäköisyyttä, että yhdistyksen välillä tulon geeniperimä ja merkintä johtuu sattumasta. Tämä perustuu myös oikea-pyrstö Fisherin testiä edellä esitetyllä tavalla.
Tulokset
vaikutus SNVs RNA sekundaarirakenteissa
rakenteelliset vaikutukset 29290 UTR SNVs olivat ennustaa käyttämällä RNAsnp (v1.1). Sekä Euklidinen etäisyys (d
max) ja Pearson Korrelaatiokerroin (r
min) toimenpiteet RNAsnp (tila 1) on itsenäisesti käytettiin ennustaa, SNVs paikallisiin RNA sekundaarinen rakenne. Jakelu p-arvot lasketaan 29290 UTR SNVs on esitetty kuviossa S1A. Merkittävyystasolla 0,1 (valitaan aiempien tutkimuksen [29]), 3237 ja 3062 SNVs ennustettiin vastaavasti, jonka d
max ja r
min toimenpiteitä. Lisäksi säätö monimuuttujille (käyttäen Benjamini-Hochberg menettely [38]) edellyttäen 3204 ja 1813 SNVs kunkin d
max ja r
min toimenpiteitä. Sulatuksen jälkeen nämä kaksi listaa, saimme 3561 ainutlaatuinen SNVs vuonna 2411 geenejä.
Lisäksi laskimme välisen etäisyyden sijainti näiden 3561 SNVs ja ennustetun paikallinen alue, jossa suurin rakenteellinen muutos havaittiin (kuvio S1B) . Se osoittaa, että suurin osa SNVs aiheuttavat rakennemuutos ja ympärillä SNV asentoon. Lisäksi, pituuden jakautuminen ennustetun paikallisen alueen osoittaa, että suurin osa SNVs on vaikutusta paikallisen alueen, jonka koko on 50-100 mukset kuitenkin tiettyjä SNVs (n = 47) vaikutus maailmanlaajuisesti rakenne, jossa koko ennustetun paikallisen alueen yli 300 döt (kuvio S1C). Lisäksi pyysimme ovatko nämä häiritsevä SNVs rikastuvat GC tai AU rikkaita alueita, kuten sekvenssit niin puolueellinen nukleotidin sisältö on osoitettu herkempi rakennemuutoksia aiheuttamia mutaatioita [49]. Jokaista SNV me laskenut GC-pitoisuus sen viereisten alueiden (kuten aiemmin käyttäen 200 mukset ylä- ja ketjun loppupään), katso materiaalit ja menetelmät. Tämä osoitti, että sekä datajoukon SNVs ja häiritsevä SNVs ovat korkeasti rikastettua alueilla GC sisällön vaihtelee 40-60 prosenttiin (katso kuva S2), joka olisi sen vuoksi tehdä niistä vähemmän herkkiä muutoksille. Lisäksi olemme havainneet, että ei ollut merkittäviä eroja GC sisällön jakaumat häiritsevä SNVs ja datajoukon SNVs (katso kuva S2 Kolmogorov-Smirnov).
Tiedetään, että UTR mRNA Harbor evolutiivisesti konservoituneita säätelyelementtejä ([50] – [52], katso myös arviot [53], [54]). Niinpä ristiintarkistetaan päällekkäisyydet jäävät häiriintyy paikallisen alueen ennusti RNAsnp ja säilytetyn RNA sekundäärirakenteiden ennustaa käyttämällä meidän talon valmisteilla [39] (ks Materiaali ja menetelmät osioista). Mielenkiintoista, paikallisen alueen ennustetaan 472 SNVs (p-arvo 0,1) päällekkäisiä ennustetun säilytetty RNA toissijaisia rakenteita. Nämä 472 SNVs vastaavat 408 geenejä; joista 111 SNVs vastaavat 98 geenejä, jotka osallistuvat syöpään liittyvä reittiä (katso File S1.xlsx).
perusteella p-arvo, edellä 111 SNVs oli edelleen luokitella kahteen ryhmään: 28 korkean luottamusta, joka täyttää molemmat d
max ja r
min p-arvo 0,05 (taulukko 1), ja toinen 83 keskipitkän luottamus (joko d
max tai r
min p -arvon 0,1) (ks File S2.xlsx). Ennakoimme SNV aiheuttama rakennemuutoksia UTR alueilla saattaisi vaikuttaa vakautta mRNA tai häiritä toimintaa säätelyelementtejä läsnä UTR. Esimerkiksi SNV A2304C (taulukko 1) läsnä 3 ’UTR:
MAPK14
mRNA näyttää merkittävä rakennemuutos (p-arvo: 0,0076) paikallisessa RNA sekundaarirakenteissa on rakenteellisesti konservoituneet mukaan molemmat CMfinder ja RNAz ennusteita meidän talon valmisteilla [39]. Tämä rakenteellinen suojelu osoittaa, että alue on alle kehittyvä paine säilyttää rakenteen, joka on todennäköisesti joitakin toiminnallisia merkitys. Koodaama proteiini
MAPK14
geeni kuuluu MAP kinaasiperheen, jonka tiedetään liittyvän moniin polkuja liittyvät solunjakautumisen kypsymisen ja erilaistumisen (tarkistetaan [55]). Lisäksi se on ennustettu olevan yksi keskeisistä toimijoista keuhkosyövän interactome [6]. Siten muutos geenin ilmentyminen
MAPK14
klo transkription jälkeisellä tasolla johtuen SNV aiheuttama rakennemuutos saattaa vaikuttaa MAKP14 liittyviä signalointireitteihin.
Toisena esimerkiksi geeni,
GPX3
vastaa koodauksen plasman glutationiperoksidaasi, antioksidantti, entsyymi, joka sisältää selenokysteiini sen aktiivisessa ja katalysoi vähentäminen vetyperoksidia. Aminohappo selenokysteiini koodaa UGA kodoni, joka normaalisti toimii lopetuskodonin.
GPX3
mRNA, vaihtoehtoisen tunnustamista UGA kodonin kuin selenokysteiini kodonin välittyy
cis
LINJASÄÄTÖVENTTIILIT säätelyelementtiin selenokysteiini insertiosekvenssi (SECIS), läsnä 3 ’ UTR ja muut
trans
LINJASÄÄTÖVENTTIILIT keratekijöitä [56]. SNV U1552G (taulukko 1), joka sijaitsee 3 ’UTR:
GPX3
mRNA oli ennustettu aiheuttavan merkittävää rakenteellista vaikutusta (p-arvo: 0,0474) paikallisessa alueella, joka sisältää SECIS säätelyelementti. Kuvio 3 esittää emäsparin todennäköisyydet vastaa paikallisen alueen (NM_002084: 1544-1692) villityypin ja mutantti-mRNA: ta. Voidaan nähdä, että villityypin on suurempi emäsparin todennäköisyydet muodostavat stabiilin varsi-silmukka-rakenne SECIS (korostettu ympyrä kuvassa 3), kun taas mutantti muodossa se on häiriintynyt, koska SNV, joka sijaitsee ulkopuolella SECIS alueella. Aiempi tutkimus on osoittanut, että ominaisuus varsi-silmukka rakenne SECIS on välttämätöntä tehokkuuden UGA koodaamalla
in vivo
ja
in vitro
[56]. Tämän perusteella voimme spekuloida, että SNV U1552G aiheuttama rakennemuutos SECIS elementti voi vaikuttaa tehokkuuteen UGA recoding.
pistekuvaajan alkaen RNAsnp web-palvelimen [67] osoittaa emäsparin todennäköisyydet vastaa paikallista alue ennustaa merkittävää eroa (
d
max
p-arvo: 0,0474) välillä villin tyypin ja mutantti. Ylempi kolmio edustaa emäsparin todennäköisyydet villityypin (vihreä) ja alempi kolmio mutantti (punainen). Sivuilla, pienin vapaa energia (MFE) rakenne villityypin ja mutanttien näkyvät Planar graafinen esitys. SECIS alue on korostettu sinisellä ympyrän ja SNV asento on merkitty nuolimerkki.
Lisäksi, kun otetaan huomioon sekä joukko korkean luottamuksen ja keskisuurten luottamus SNVs, huomasimme, että geenit (n = 15) on lueteltu taulukossa 2 satamassa enemmän kuin yksi häiritsevä SNV ennustetussa konservoitunut rakenteellinen alue mRNA. Esimerkiksi geeni,
ID2
koodaa DNA-sitovan proteiinin estäjä ID-2, joka on kriittinen tekijä solujen lisääntymistä ja erilaistumista normaalissa selkärankaisten kehityksessä. Yliekspressio ID-2-proteiini havaitaan usein erilaisissa ihmisen kasvaimissa, mukaan lukien NSCLC [57]. MRNA-sekvenssi
ID2
geeni, kaksi SNVs sijaitsevat 5 ’UTR alue oli ennustivat aiheuttaa merkittävää paikallista rakennemuutos säilyneen alueen. Aiemmat tutkimukset ovat osoittaneet, että SNP tai mutaatio indusoi rakenteellisia muutoksia 5 ’UTR voi johtaa hallitsemattomaan käännöksen tai yliekspressio vastaavat proteiinit [58], [59]. Ennakoimme kaksi SNVs jotka aiheuttavat merkittävän muutoksen rakenteellisesti konservoitunut alue voi vaikuttaa käännöksen tehokkuuteen
ID2
mRNA.
Out of 472 häiritsevä SNVs saatu sekundaarirakenteen analyysi (ennen kanssa risteävän syöpään liittyvien geenien), 199 päällekkäisyyttä SNP alkaen dbSNP (rakentaa 135). Näistä 199 SNVs, 17 ovat sidos DIS-tasapaino (LD) muihin SNP, jotka sijaitsevat proksimaalisesti (+/- 200 mukset) muuttamisesta SNV asentoon. Nämä 17 paria testattiin RNAsnp tarkistaa, onko SNP LD kanssa (häiritsevä) SNV on rakenne vakauttavan haplotyyppi [60]. Näistä 17 paria, viisi ennustettiin ei ole merkittäviä rakenteellisia muutoksia, mikä voisi olla mahdollista rakennetta stabiloiva haplotypes; kun taas muut 12 paria ovat osoittaneet merkittäviä rakenteellisia muutoksia (katso File S3.xls).
vaikutus SNVs on mikroRNA kohdesivustot
Seulonta kaikki ihmisen kypsän miRNA vastaan kaikki tunnistetut SNVs kanssa reunustavan sekvenssin saannot 2 x 59810180 mahdollisia yhdistelmiä. Alkuperäinen TargetScan vaihe on konservatiivinen suodatin ja vähentää joukko SNV-miRNA paria 0,2% tästä. Me sitten soveltaa Miranda toisena kohteena ennusteen menetelmällä, jota seuraa joukko suodattimia. Jakauma
LR
arvot
muuttaa
asetettu näkyy kuvassa S3, ainoastaan tapauksissa suhteelliset muutokset suurempi kuin kuvattu katkaista pidetään (katso materiaalit ja menetelmät). Kuvio 2 esittää eri vaiheet, yksittäisten laskee oletetun vuorovaikutuskohdat kussakin vaiheessa. Tämä antaa meille 490 SNVs vuonna 447 geeneistä ennustetaan vaikuttavan 707 yhteisvaikutuksia 344 miRNA (katso File S4.xlsx). Sen jälkeen leikkaa tunnettujen syöpään liittyvien geenien (viimeinen vaihe valmisteilla, kuva 1), löydämme 124 SNVs ja 148 miRNA olla mukana 186 vuorovaikutukset eroavat mutaatio. Nämä SNVs jotka indusoivat oletetun miRTS muutoksia voidaan edelleen luokitella niihin, vuorovaikutus- mutantti (80) tai villityypin (52) variantti.
Taulukossa 3 luetellaan kaikki geenit, jotka sisältävät useamman kuin yhden miRTS ennustetaan olevan muuttaa välillä villityypin ja SNV. Tämä sisältää esimerkkejä, joissa samat SNV muuttuu kohdesivustoon eri kypsä miRNA samasta perheestä, mutta myös esimerkkejä, joissa eri SNVs geenissä aiheuttaa voitto tai tappio on miRTS. Samoin kaikki miRNA on enemmän kuin kaksi muuttunutta kohdekohtaan on esitetty taulukossa 4. luetellaan jäsenet miR-29 perhe, joka on aiemmin raportoitu toimimaan tuumorisuppressoreilla sekä onkogeenien (katso [61] tarkistamista).
Niistä 148 miRNA (vastaa 186 otaksuttu vuorovaikutusten) meidän lopullinen ehdokasjoukon, 89 ovat
keuhkosyöpä liittyvä miRNA
(117 vuorovaikutukset) (ilmoitettu File S4.xlsx). Taulukossa 5 luetellaan kaikkien 14 otaksuttu tavoite sivustojen lopullisessa ehdokasjoukon jotka sisältävät
NSCLC liittyviä miRNA
. On huomattava, että luettelo sisältää neljä miRNA, joissa on enemmän kuin yksi ennustettu kohde muuttunut. Mir-184 yksi kohdepaikan on luotu, kun toinen on heikentynyt, kun mutaation. Lisäksi miR-30a, d, ja e ennustetaan kohdistaa 3 ’UTR:
SUZ12
geenin. Kuitenkin ennustettu vuorovaikutus ovat todennäköisesti toiminnallinen villikannan ja hävisi mutantti johtuen SNV aiheuttama muutoksia siemenen alueelle. SUZ12 on aiemmin osoitettu olevan suoraan kohteena miR-200b ja estävät tämän miRNA lisää muodostumista syövän kantasoluja (CSCS) [62], jotka edistävät kasvaimen aggressiivisuus. Menetys miR-30 asetuksessa (yksi) kolmesta vierekkäisen SNVs siemenessä kohdepaikan voisi olla vastaava vaikutus NSCLC.
Lisäksi 48 SNVs ennustettujen miRTSs löytyivät on sisäpuolella paikallisen alueen, jossa merkittävä toissijainen rakennemuutos ennustettiin RNAsnp. Näistä 15 SNVs sijaitsi syöpään liittyvien geenien (katso taulukko 6). Perustuen aiemmissa tutkimuksissa [63], [64], me spekuloida, että SNV aiheuttama miRTS muuttaa yhdessä toisen rakenteellisia muutoksia ja ympärillä miRTS saattavat vaikuttaa sitoutumiseen ennustetun miRNA.