PLoS ONE: ennustaminen Mahdolliset Cancer-Risk alueiden Perustuu transcriptome Data: Kohti kattava yleiskatsaus

tiivistelmä

A novel integroiva putki esitetään löytämisen mahdollisten syöpää-alttius alueet (PCSRs) laskemalla määrä muuttaa geenejä kussakin geenivirhe, käyttäen ilmaisua mikrosiru aineistoja ihmisen erilaisten syöpien (HC) . Meidän uusi lähestymistapa käsittää ensisijaisesti ennustavat PCSRs seurasi tunnistaminen keskeisten geenien näillä alueilla saada potentiaalisia alueita kätkeminen uusi syöpään liittyvien variantteja. Sen lisäksi löytää uusia syövän syy variantteja, toinen etu ennustaminen tällaisen riskin alueiden samanaikainen tutkimus erityyppisten genomista variantteja mukaisesti keskittymällä erityisiin kromosomialueita. Käyttämällä tätä putki poimimamme numerot alueiden erittäin muuttunut ekspressiotasot syövän kunnossa. Säätelyverkkojen myös rakennettu eri syöpien jälkeen tunnistamista muuttaa mRNA ja MikroRNA. Mielenkiintoista, tulokset osoittivat, että GAPDH, LIFR, ZEB2, mir-21, mir-30a, mir-141 ja mir-200c, kaikki sijaitsevat PCSRs, ovat yleisiä muuttunut tekijöitä rakennettu verkoissa. Löysimme useita klustereita muuttuneen mRNA: iden ja miRNA ennakoitavissa PCSRs (

esim

.12p13.31) ja niiden yhteinen sääntelyviranomaisten lukien Klf4 ja SOX10. Laajamittaiset ennustaminen riskin alueiden perustuu transcriptome tietoihin voi avata ikkunan kattavan tutkimuksen syövän riskitekijöiden ja muiden ihmisen sairauksien.

Citation: Alisoltani A, Fallahi H, Ebrahimin M, Ebrahimin M, Ebrahimie E ( 2014) ennustaminen Mahdolliset Cancer-Risk alueiden Perustuu transcriptome Data: Kohti kattava yleiskatsaus. PLoS ONE 9 (5): e96320. doi: 10,1371 /journal.pone.0096320

Editor: William B. Coleman, University of North Carolina School of Medicine, Yhdysvallat

vastaanotettu: 23 tammikuu 2014; Hyväksytty 7 huhtikuuta 2014; Julkaistu: 05 toukokuu 2014

Copyright: © 2014 Alisoltani et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Kirjoittajat ei ole tukea tai rahoitusta raportoida.

kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

muuttaminen mRNA ja miRNA ilmaisun ja tärkeä rooli suuri määrä näistä molekyyleistä on tutkittu aloittamisen, etenemisen ja etäpesäkkeiden monien syöpien [1], [2], [3] _ENREF_1. Muutokset DNA: n metylaatio ja transkriptiotekijä (TF) asetus, genomista kopioluvun vaihtelu (CNV) [4], yhden nukleotidin polymorfismi (SNP) [5] ja mikrosatelliittimerkkien vuorottelu [6] sekä muut kromosomimuutokset luonnehditaan päämekanismia ilmaisun vuorottelu erilaisissa ihmisen syövissä (HC).

erilaisia ​​menetelmiä, kuten genomin laajuinen yhdistys tutkimukset (GWAS) ovat tunnistaneet useita liittyy variantteja eri syöpiä [7], [8], [9]. Esimerkiksi yhteinen muunnoksia alue 19p13 havaittiin olevan yhteydessä munasarjasyöpään [10], CNVs klo 6q13 ja viisi riski loci at 21q21.3, 5p13.1, 21q22.3, 22q13.32 ja 10q26.11 liittyivät suoraan haimasyövän [4], [11]. Lisäksi uusi riski loci at 10q25.2, 6q22.2 ja 6p21.32 liittyi keuhkosyövän [12], ja useat riski loci at 9q31.2, 19q13.4 ja 8q24 osoitettiin liittyvän eturauhassyöpään [ ,,,0],13], [14], [15].

kuitenkin haasteet GWAS ovat löytää syy variantteja ja toiminnallisia vaikutuksia sekä keskinäiset näiden varianttien syövässä. Vaikka edellinen geneettiset tutkimukset syövän ovat ennustaneet useita syöpään liittyvien variantteja [8], [9], [10], [15], [16], tunnistaa syy-variantteja on suuri este, koska tunnetut syy perimä ovat useimmiten sijaitsee ei-koodaavilla alueilla tai sijaitsevat eri fyysisiä etäisyyksillä geenistä ne vaikuttavat [17]. Lisäksi palveluksessa lineaarinen mallintaminen puitteet GWAS usein pitää vain yhden SNP kerrallaan ja jättää huomiotta vaikutukset muiden genotyyppi SNP [5]. Siksi eteneminen voi olla työläs tilastollisista yhdistys saatu GWAS on johdettua syy ja toiminnallisia seurauksia syöpään. Toinen haaste suurten genomiikan tutkimukset on, että jotkut näistä variantteja kuten mikrosatelliitteihin on vähemmän tutkittu verrattuna muun tyyppisiin (SNP ja CNV). Lisäksi monet näistä tutkimuksista on keskittynyt yhdenlaisia ​​genomisen vaihtelut syöpä; Näin ollen, vaikutukset muiden mukana olevien tekijöiden laiminlyödään.

Yhtenäinen menettely käytetty aiemmissa tutkimuksissa on havaitseminen syy variantteja ja etsimällä funktionaalisia vaikutuksia Näiden varianttien kuten yhdistys varianttien kanssa ilme polygeeninen ominaisuus (eQTLs) [17]. On kuitenkin olemassa myös käänteinen strategia koostuu ennustamisessa mahdollisia syövän riskin alueilla jaettu eri syöpien perustuu transcriptome ekspressiotietojen ja sitten etsivät syy variantteja. Tunnistaminen näiden alueiden auttaa löytämään uusia variantteja sekä samanaikainen tutkimus eri tekijöistä, jotka vaikuttavat geenien ilmentyminen rajoittamalla arviointien tiettyihin kromosomialueen. Täällä kehitimme putki, joka koostui PCSRs ennustuksen käyttämällä laskennassa transkriptio-ilmentyminen muuttuu alla syöpä kullekin kromosomialueen. Olemme myös uuttaa yhteisiä muuttunut mRNA: iden ja MikroRNA käyttää mikrosirujen ja ilmenevän geenin osiksi (EST) data seuraavat verkon analyysin saavuttaa enemmän oivalluksia ennustetusta PCSRs. Käyttämällä tätä putki, me ennustaa riski alueiden vuorovaikutuksessa klusterin tavoitteiden (mRNA miRNA ja /tai TF: t) purkautumisen mahdollisia-ehdokkaita edelleen genomin yhdistys tutkimukset.

Tulokset

Geenien ilmentyminen tiedot useita erilaisia ​​syöpiä analysoitiin uudelleen, ja tulokset yhdistettiin ennustaa yleisin syöpä riski alueilla. Toinen Tutkimuksen tavoitteena oli saada käsityksen välisestä suhteesta PCSRs ja muuttaa mRNA miRNA ja niiden yhteisen sääntelyviranomaisten. Yleiskatsaus työnkulku on esitetty kuviossa 1.

Se käsittää ilmentymisen analysointi ihmisen erilaisten syöpien, mukaan lukien rinta-, kolorektaalinen, kohdun limakalvon, mahan, maksan, keuhkon, munasarjojen, haiman, eturauhasen, kivesten, virtsarakon, suoli neuroendocrine, kohdunkaulan ja munuaisten syövät sekä glioblastooma. Tämä ensisijainen analyysi seurasi uutto muuntuneen geenien, laskea kromosomin alueita muuttunut geenien ja ennustaminen riskin alueiden perustuvan alueen taajuudella.

tulokset transkriptioekspressiokuvio analysoi jokaisen syövän aineisto mukaan lukien rinta-, peräsuolen, kohdun limakalvon, mahan, maksan, keuhkon, munasarjojen, haiman, eturauhasen, kivesten, virtsarakon, suoli neuroendocrine, kohdunkaulan ja munuaisten syövät sekä glioblastooma on esitetty taulukossa S1. Nämä uutetaan geenit ja miRNA käytettiin sitten lisäanalyysiä kuten alla.

ennustaminen Mahdolliset Cancer-herkkyys alueiden käyttäminen Microarray Aineistot on syöpätyypin

prosenttiosuus alueen osallistumisen laskettiin kullekin kromosomi (chr) peräisin microarray data (2-kertainen muutokset kynnyksen) 11 HC. Tiedot menettely on kuvattu materiaalit ja menetelmät. Kunkin kromosomin viisi alueet kattavat korkein taajuus muuttaa geenien kirjattiin mahdollisina PCSRs (taulukko 1). Tulokset osoittivat, että näihin PCSRs kaksi alueet sisältävät eniten yli-ilmentyvien geenien; chr1p31.2 (27,27%) ja chr13q13.2 (20,45%) (taulukko 1, sarakkeet 3-7). Kun taas jos alas-ilmentyvien geenien, suurin osuus on tallennettu alueilla sijaitsevat chr13q13 (15,53%) ja 4q34.2 (15,15%).

testaamiseksi luotettavuuden ennustetun PCSRs prosenttiosuus alueen osallistuminen syövän laskettiin eri kynnyksen, missä taajuuksien ensimmäinen 200 probesets korkeimmalla kertaiseksi muutoksia havaittiin kullakin alueella (taulukko S2). Vaikka suuri osa näistä alueista, kuten 1q31.3, 2p25.2,3q25.2, 12p13.31 ja 22q12.1 yhteinen sekä kynnysarvot (taulukko 1 ja taulukko S2), jotkin alueet olivat kirjataan PCSR vain yhdelle näiden kynnysarvojen. Esimerkiksi 1p32.2 ja 2q22.3 tiedetä olevan 2-kertaiseksi muutoksia kynnys, kun taas 1p22.3 ja 2p12 kirjattiin korkeimmalla kertaiseksi muutokset (taulukko 1 ja taulukko S2).

Prosenttiosuus kromosomi osallistuminen laskettiin myös 11 HC, mitkä kromosomin (t) on enemmän mukana transkriptio ilmentyminen muuttuu (taulukko S3). Tulokset osoittivat, että CHR4 on kätkeminen eniten geenien muuttunut syöpä (lukuun ottamatta eturauhas- ja mahasyöpä) (taulukko S3). Sen sijaan, chrY on pienin määrä geenejä ilmaistuna syöpä. Yhteenveto kromosomi osallistumisen 11 HC osoittaa huomattavia eroja kuten General Chi-neliö testi. Neljä top kromosomit kätkeminen kaikkein alas-ilmaistuna geenejä Merkkien 4, 5, 13 ja X, kun taas kun on kyse yli-ilmaisivat geenien eniten muutos- kirjattiin Merkkien 1, 7, 8 ja 12 (kuvio S1).

Altered mRNA: t Jaettu eri syöpien

Differentially ilmaisi mRNA: t, joilla on korkein kertaiseksi muutoksia vähintään 6 HC valittiin yhteisen muuttunut mRNA: t (taulukko 2 ja taulukko 3). Nämä yhteiset muuttunut mRNA: t luokiteltiin kolmeen eri ilmaisua ryhmää. Luokka I osoitti yli-ilmentyminen useimmissa syöpätyyppien kuten tubuliinin alfa 1b (TUBA1B) ja glyseraldehydi-3-fosfaattidehydrogenaasi (GAPDH) (taulukko 2), luokan II edusti alas-ilmentyminen useimmissa HC kuten aspartoacylase (ASPA) ja kemokiini (CXC-motiivin) ligandin 12 (CXCL12) (taulukko 2), kun taas lepää (luokka III) oli sekoitettu ekspressiokuvioita eri syöpien, kuten proteiinikinaasi (cAMP-riippuvainen, katalyyttinen) estäjä beta (PKIB) ( taulukko 3).

Mielenkiintoista, useita yhteisiä muuttaa mRNA: iden sijaitsevat ennustetut PCSRs (sarake 3 taulukot 2 ja 3). Esimerkiksi, GAPDH on 12p13.31 (kuten ennustettu PCSR) osoitti yli-ilmentyminen kaikissa HC (Ptaulukko 2). CKS2 (chr9q22.2), CEP55 (chr10q23.33), UHRF1 (chr19p13.3), RRM2 (chr2p25.1), AURKA (chr20q13.2), FLJ39632 (chr14q11.2), FAM83D (chr20q11.23), NEK2 (chr1q32.3) ja MAD2L (chr4q27) olivat kaikki sijaitsevat PCSRs ja osoitti yli-ilmentymisen 9, 8, 10, 9, 8, 9, 9, 8 ja 9 syöpiin, vastaavasti (taulukko 2 ja taulukko 3 ). Sen sijaan, DCN (chr12q21.33), LIFR (chr5p13.1), ABCA8 (chr17q24.2), C7 (chr5p13.1) ja ZEB2 (chr2q22.3) on ennustettu PCSRs olivat alas-ilmaistuna 9, 7, 8 , 8 ja 8 syöpiä, vastaavasti (taulukko 2 ja taulukko 3). Loput muuttuneen geenien PCSRs näytteillä sekä alas ja yli-ilmentyminen malleja (taulukko 3).

Altered miRNA Jaettu eri Syövät

Useita miRNA (kuten miR-93, mir -182, mir-196b ja mir-1274b) osoitti yli-ilmentyminen useimmissa syövissä (taulukko 3). Useita miRNA (kuten miR-30a ja mir-30c-2) on alaspäin-ilmaistaan ​​eri HC, kun taas monet muut miRNA näytteillä sekoitettu ekspressiomalli (taulukko 4).

kromosomaalisen sijainnit määritettiin yhteisiä muuttunut miRNA. Mielenkiintoista on, miRNA joka sijaitsee samalla alueella osoittivat, co-ilmentymistä joidenkin syöpien, kuten klusterin 19q13.41 (mukaan lukien mir-99b ja -125a). Tämä klusteri (19q13.41) oli alas ilmaistu kohdunkaulan, eturauhas- ja munuaisten syövät. Sen sijaan samassa ryppäässä on yli-ilmaistu virtsarakon syöpä. Toinen koekspressoi klusterin havaittiin 12p13.31 (mir-141and mir-200C), joka osoitti yli-ilmentymisen munasarja-, eturauhas- ja virtsarakon syövät, ja päinvastoin, se oli alas-ilmaistaan ​​munuaisten syöpä (taulukko 4). Loput koekspressoi klustereita listattiin alueille klo 6q13 (mukaan lukien mir-30a ja mir-30c-2), Xp11.23 (mukaan lukien mir-362, mir-500, mir-501, mir-502 ja mir-532 ), 14q32.2 (mukaan lukien mir-134, mir-379 ja mir-382), 14q32.31 (mukaan lukien mir-127, mir-432 ja mir-770), 9q22.32 (mukaan lukien let-7d, mir-23b ja mir-27b) ja 7q22.1 (mukaan lukien mir-93 ja mir-106b) (taulukko 3). Viisi yhdeksästä miRNA koekspressoi klusterit edellä luetellut sijaitsevat ennustetaan PCSRs lukien 6q13, 12p13.31, 14q32.2, 19q13.41 ja Xq26.2 (taulukko 4).

Vuorovaikutus sisällä ja välillä yhteisen Altered mRNA: t ja miRNA paljasti Network Analysis

neljä erillistä verkkoa rakennettiin myös verkoston yhteisen muuttunut mRNA: t (409 yhteisöt ja 1288 suhteet) (kuva S2), verkosto yhteinen muuttaa mRNA: t sijaitsevat eri ennustetun PCSRs (383 yhteisöt ja 1121 suhteet) (kuva S3), verkko yhteinen muuttunut miRNA (322 yhteisöt ja 1041 suhteet) (kuva S4) ja verkoston yhteisen muuttunut miRNA sijaitsevat eri PCSRs (with123 yhteisöt ja 409 suhteet ) (Kuva S5). Lisäksi, yhdistetty verkkoon rakennettiin integroimalla muuttaa mRNA: iden ja miRNA data, joka on 667 yhteisöistä ja 2482 välillä (kuvio S6). Eri tyyppisiä transkriptiotekijöiden, proteiinikinaaseiksi, pieniä molekyylejä, mRNA: t ja miRNA toimivat joko hyväksynyt tai otaksuttu sääntelyviranomaisten näissä verkoissa. Muita yksityiskohtia kunkin verkon lukien useita tuotujen geenien ja biologisia prosesseja esitetty taulukossa S4.

tunnistetaan verkostojen samanlaisia ​​biologisia prosesseja, kuten soluprosessiin, biologinen asetus, aineenvaihduntaa, monisoluisten eliöiden prosessi, kehitysprosessia ja vastauksena ärsyke (taulukko S4 sarake 5). Nämä yhteiset prosessit merkitsevät olemassaolo yhteisten geenien ja miRNA eri rakennettu verkostoja taulukossa S5. Esimerkiksi sinkki sormi E-box sitova homeobox 2 (ZEB2), DEAD (Asp-Glu-Ala-Asp) box helikaasin 5 (DDX5) ja leukemiaa estävä tekijä reseptori alfa (LIFR) on jaettu molempien rakennettu verkkojen yhteistä muuttunut mRNA: iden ja miRNA (taulukko S5). Tavallisiin muuttunut miRNA, mir-21, mir-30a, mir-141 ja mir-200C jaettiin kaikissa neljässä rakennettu verkot (taulukko S5).

Yleisimmät aliverkossa havaittu näissä verkoissa oli keskitetty on DDX5 (kuvio 2). Tämä Aliverkko käsittää 5 yhteisöjä kuten DDX5, mir-20b, mir-21, mir-141 ja mir-182. DDX5 säätelee negatiivisesti mir-20b ja mir-141, kun taas DDX5 itse säätelee mir-21 ja mir-182. Down-ilmentyminen DDX5 havaittiin 7 eri HC, kun taas, mir-20b, mir-21, mir-141 ja mir-182 yli-ilmentynyt 3, 5, 3 ja 4 HC, vastaavasti (taulukko 3 ja taulukko 4 ). Siinä ehdotetaan, että negatiivinen keskinäisiä yhteyksiä DDX5 ja näiden neljän miRNA.

Verkko on myös mir-21, mir-182, -mir20b ja mir-141. Verkko rakennettiin käyttäen koulutusjakson studio 9 -ohjelmiston. Verkko koottiin perustuu bioinformatiikan ja kirjallisuuden yhdistettynä biologinen tulkinta microarray tietojen ja rikastettu Gene ontologia funktionaalisia ryhmiä. Punainen: yli-säänneltyjen useimmat syöpiä. Sininen: down-säänneltyjen useimmat syöpiä. edustaa negatiivinen säädelty.

Toinen aliverkko rakennettiin perustuu mir-141, mir-200c, ja GAPDH, jossa kaikki sijaitsevat ennustettu PCSRs klo 12p13.31 (kuva 3). Tämä verkosto koostuu 17 yksiköitä ja 29 suhteet (kuva 3). Kolmetoista loppupään tavoitteet havaittiin mir-141, mir-200c, ja GAPDH. Esimerkiksi mir-141 ja, mir-200C, joka oli yli-ilmentynyt 3 HC (esitetty violetti kuvassa 3), on miRNA vaikutuksia ZEB2 (down-ilmaisua 7 HC). Mielenkiintoista, nämä muuttuneet RNA: t mukaan lukien mir-141, mir-200c ja GAPDH (at 12p13.31) ja myös ZEB2 (at 2q22.3) ovat kaikki sijaitsevat ennusti PCSRs. Kun kyseessä on ylävirran solmujen, TP53 ja MYC havaittiin kuten ylävirtaan säätelijöinä mir-200c ja GAPDH (kuva 3). TP53 on yleinen positiivinen säädin sekä mir-200c ja GAPDH, mutta MYC vasta säännellä GPADH (kuva 3).

Verkko rakennettiin käyttäen koulutusjakson studio 9 -ohjelmiston. Lyhimmän polun algoritmia sovellettiin rakentaa verkkoon. Verkko koottiin perustuu bioinformatiikan ja kirjallisuuden yhdistettynä biologinen tulkinta microarray tietojen ja rikastettu Gene ontologia funktionaalisia ryhmiä. Purple: over-säänneltyjen useimmissa syövät Blue: down-säänneltyjen useimmat syöpiä. O-Vertex edustavat TF: iä, edustaa positiivisesti säädellä, ja se edustaa negatiivinen säädelty.

promoottorianalyysi Muutettujen mRNA: iden ja miRNA eri Syövät

Promoottorit yli-ilmentynyt ja alaspäin ilmaisi mRNA: ita ja miRNA yksilöllisesti analysoitiin eri syöpiä. Lista yleisistä transkriptiotekijöiden kunkin lajin alas-ilmaistaan ​​ja yliekspressoitujen mRNA: t annetaan taulukoissa S6 ja S7, vastaavasti. Niistä 18 yhteinen ennustettu TF yli-ilmentynyt mRNA: ita, Kruppel-Like Factor 4 (Klf4), joka sijaitsee PCSRs todettiin alas ilmaistaan ​​7 syöpien (taulukko S6). Vaikka total 13 yhteisistä sääntelyviranomaisten ennustetaan alas-ilmaistuna mRNA: t, 6 sääntelyviranomaiset sijaitsevat PCSRs. Näistä 6 sääntelyviranomaisten RAR liittyviä orporeseptoria A (RORA) laski-ilmaistuna 8 syöpien (Paitsi että Glioblastoma yli-ilmentyminen ja mitään merkittävää eturauhasessa ja syöpien) (taulukko S7).

Yhteiset sääntelyviranomaiset myös ennustettu klusterin muuttuneen miRNA samalla alueella (taulukko S8). Esimerkiksi GATA2, GATA3, ETS1, MZF1_1-4, SOX10, YY1, ZNF354C ja SPI1- oli ennustettu miRNA sijaitsevat klusterin Xp11.23 (taulukko S8). Kaikkiaan, 22 yhteinen säätävät ennustettiin eri klustereiden miRNA joista kahdeksan niistä sijaitsevat PCSRs lukien YY1, SPIB, SOX10, NFIC, NR4A2, FOXD1, NFATC2 ja HOXA5 (taulukko S9). Mielenkiintoista, GATA2 ennustettiin sekä down-ilmaisseet mRNA: ita ja muuttunut miRNA.

Keskustelu

Tehokas putki kehitettiin ennustamaan PCSRs käyttäen microarray aineistoja eri syövän tutkimuksiin. Kaksi eri kynnysarvoja sovellettiin ennustaa PCSRs lukien probsets ainakin 2-kertainen muutokset ja ensimmäinen 200 probsets korkein kertaiseksi muutoksia. Suurin osa ennustetun PCSRs kummallakin kromosomissa olivat samanlaiset sekä sovellettu kynnysarvoja, jotka vahvistavat luotettavuutta näiden PCSRs.

Tämän lisäksi vahvistusta, perustuu kirjallisuuskatsaukseen löysimme että siinä on useita tärkeitä syöpään liittyvien variantteja meidän ennustaa PCSRs. Nämä vaihtoehdot on raportoitu aiemmin haiman [4], [11] (6q13, 21q21.3, 5p13.1, 21q22.3 ja 22q13.32), keuhkosyöpä [12] (6p21.32), eturauhasen [13], [14], [15] (9q31.2, 19q13.4, 8q24 ja 17q21-q22), munasarjasyöpä [10] (19p13), rintojen [18] (8q24, 12p13 ja 20q13) ja peräsuolen syöpä [19] (11q23 , 8q24 ja 18q21). Meidän havainnot kanssa näissä tutkimuksissa todettu alueella 8q24 riskinä alueen eri HC [8], [14], [19], [20], [21], mikä osoittaa osallistuminen joidenkin riskin alueilla useita erilaisia syöpiä eikä tiettyä syöpä. Lisäksi jotkut ennustettu PCSRs Tässä tutkimuksessa raportoitiin muun tyyppisiä ihmisen sairauksien, mukaan lukien herpes simplex -virus tyyppi 1 [22] (21 q), munasarjojen monirakkulatauti [23] (9q33.3), tyypin 1 diabetes ja nivelreuma [ ,,,0],24] (molemmat sijaitsevat 18p11). Tämä samankaltaisuus saattaa osoittaa tehokkuuden meidän lähestymistavan ennustus riskin alueet liittyvät eri ihmisten sairauksia lisäksi syövän.

Olemme myös havainneet, että kahdeksan kromosomit satama eniten muuttunut geenit eri syöpätyyppien kuten kromosomien 1, 4, 5, 7, 8, 12, 13 ja X. Mielenkiintoista kromosomeja 1, 4 ja 13 kirjataan myös kromosomien kanssa prosentuaalisesti eniten ennustettu PCSRs, mikä viittaa tärkeä rooli näiden kromosomien syövän biologian. Näiden tulosten perusteella ja aiemmin raportoitu kromosomeissa poikkeavuus [7], [25], [26], [27], voidaan päätellä, että putki pystyy ennustamaan riskin alueilla sekä riski kromosomien erilaisissa sairauksissa kuten syövän. Tämä putki voidaan myös soveltaa nopeasti kasvava (mutta silti rajoitettu määrä) RNA-seq aineistot tulevissa tutkimuksissa.

Verkko-analyysi osoittaa, että DDX5, LIFR, ZEB2, mir-21, mir-27b, mir -30a, mir-141, mir-182 ja mir-200C jaettiin eri rakennetaan verkkoja, indicting niiden keskeinen rooli syövän biologian ja etenemisen, joka on raportoitu aikaisemmin [28], [29], [30]. Esimerkiksi mahdollinen kliininen hyöty DDX5 ja siihen liittyvät miRNA (mir-21 ja mir-182) on ehdotettu terapeuttinen tavoite rintasyövän [29], [31]. Lisäksi kliininen soveltaminen eri miRNA syövän kuten let-7, mir-21 ja mir-122 käsitellään tuoreessa tutkimuksessa Nana-Sinkam ja Croce [28].

Koska miRNA eivät toimi eristyksissä [28], olemme analysoineet klusterin miRNA samassa alueita ymmärtää suhteellinen osuus useiden miRNA eikä yksittäisiä miRNA. Co-ilmentyminen eri miRNA merkitsee esiintyvien tavallisesta transkriptio sääntelyviranomaisten ja /tai yhteisiä syy variantteja näille alueille. Ennestään on myös raportoitu, että yhteinen moduuleja promoottorit voivat aiheuttaa co-geenien ilmentymistä [32].

Huomasimme, että eri yhteinen säätimet muuttuneita mRNA: iden ja miRNA lukien, Klf4 (at 9q31.2) ja RORA (15q22.2) olivat ennustetun PCSRs. Nämä kaksi TF: t välittävät joukko solusyklin geenien ja näyttelyitä sekä onkogeeninen ja kasvaimen tukahduttava toiminnot [33], [34]. Mielenkiintoista, alas-ilmentyminen mir-30c-2 (at 6q13) sekä yli-ilmentyminen GATA3 havaittiin eri tyyppisiä HC tässä tutkimuksessa, joka vahvistaa sääntely mir-30c-2 kautta GATA3. Bockhorn ja collogues äskettäin osoittaneet, että mir-30c on kopiointia ajatellen säädellään GATA3 [35].

Läsnäolo toiselle tasolle keskinäistä suhdetta syövän riskin alueilla Ehdotettiin, jossa mRNA: t ja niiden yhteisen sääntelyviranomaiset eri PCSRs vuorovaikutuksessa keskenään muut sekä niiden tavoitteita. Aliverkko keskittyi DDX5 kokonaan 5 solmua ja 4 suhteista (kuva 2) ja aliverkon GAPDH, miR-141 ja mir-200C confirm tällaista vuorovaikutusta (kuva 3). Näissä aliverkoiksi eri RNA: t sijaitsevat PCSRs kuten GAPDH, ZEB2, mir-20b, mir-21, mir-141 ja mir-200C tukee merkittäviä vaikutuksia näiden RNA: iden ja niiden alueiden syövässä.

Aliverkon keskitetty DDX5 jaetaan eri verkkojen rakennettu muuttuneita mRNA: iden ja miRNA eri syöpiä. RNA-helikaasia DDX5 (tunnetaan myös nimellä p68) osallistuu RNA aineenvaihduntaa ja toimii transkription co-säädin ja on raportoitu säätelijänä mir-182 rintasyövässä [29]. Merkittävää yhdistys on myös raportoitu välillä DDX5 rs1991401 (OP = 7.90 × 10-5) ja pahanlaatuinen ääreishermoston tuppi kasvain [36]. Tuloksemme osoittivat, että jopa sääntely mir-20b ja mir-141 alas säätelee DDX5.

Toinen aliverkkoon (kuva 3) sisälsi GAPDH, mir-141 ja mir-200c, jotka sijaitsevat 12p13.31 ennakoidusti PCSRs . Monistus 12p13 alueen havaittiin rintasyövässä [37], T-solu-lymfoomat ja lymfaattinen leukemia [38], [39], mikä aiheuttaa yli-ilmentyminen GAPDH, mir-141 ja -200c. Upstream sääntelyviranomaiset voivat osalliseksi ylössäätöä näiden RNA: iden ja positiivinen vaikutus on raportoitu TP53 sijaitsee ylävirtaan GAPDH [40]. Lisäksi Yoshihara ym [41] raportoitu joitakin satunnaisia ​​munasarjasyöpä-ainutlaatuinen CNVs klo 12p13.31. Yleensä nämä raportit yhdessä meidän

in silico

havainnot osoittavat keskeistä roolia 12p13.31 vuonna HC.

Mielenkiintoista, joitakin muita yhteisiä RNA: iden välillä syöpiä tässä raportissa, havaitaan aikaisempien tutkimusten kasvaimia ja muita sairauksia [16], [42]. Esimerkiksi läsnäolo synonyymi SNP (rs12948217) vaikuttavat eksoni silmukoinnin parantajia site lähistöllä ASPA on raportoitu hermostoa rappeuttavien sairauksien [43]. Menetys alueet mukaan lukien 14q32.2 (sijainti mir-127, mir-432 ja mir-770) ja 14q32.31 (mir-134, mir-379, ja mir-382) on raportoitu aikaisemmissa tutkimuksissa munuaissyövän ja osteosarkooma [16], [44]. Tutkimuksessamme mirRNAs sijaitsee 14q32.2 ja 14q32.31 osoitti alas-ilmentymistä useissa syövissä, mikä alas-ilmentymisen miRNA seuraavista kromosomin menetyksen näillä alueilla.

Lopuksi, ennusti PCSRs nykyisen tutkimuksen avautuu uusi väylä jatko genomin yhdistys tutkimukset löytää eri syöpätyyppien-syy variantteja. Koska useita muunnelmia kertynyt geenin tai klusterin geenit voivat kaikki osaltaan fenotyyppiin, tutkimalla erilaisia ​​muunnelmia tai sääntelymekanismeja yli geenin klusterin geenien tai tietyllä alueella saattaisi olla hyödyllinen keino parantaa yhdistyksen havaitsemiseen. Tunnistetut yhteinen muuttaa RNA: t at PCSRs meidän rakennettu verkoissa on loistavat mahdollisuudet käyttää löytää niihin liittyvien SNP, CNVs ja /tai puolijohdereleiden lähellä nämä geenit. Lisäksi nämä tulokset viittaavat siihen, mahdollisten uusien säätimen-pohjainen (mieluummin kuin geenin-pohjainen) syövän hoito palauttamiseksi häiritsi klusterin mRNA: iden ja /tai miRNA. Yleensä meidän putki voidaan tehokkaasti käyttää ennustamaan syövän riskin alueilla ja syövän riskin kromosomit.

Methods

Expression Data Analysis

Raaka CEL ekspressiotietojen eri HC saatiin Gene Expression Omnibus (GEO) tietokannassa (taulukko S10). RMA (Robust Multichip keskiarvo) algoritmia sovellettiin ensimmäisenä microarray raakadataa saamiseksi normalisoitu dataa Expression Console ohjelmistoa (Affymetrix, CA, USA). Tiedot analysoitiin käyttämällä FlexArray ohjelmistoa (https://genomequebec.mcgill.ca/FlexArray/). Differential geeniekspressiomalli kullekin kokeelle (syöpä vs. normaali) arvioitiin käyttämällä empiiristä Bayes testiä (moderoitu t-testi) (p 0,05). Geenit, joilla on vähintään 2-kertainen muutoksia geenien ilmentymisessä ja 1,5-kertainen muutokset miRNA ilmentymisen valittiin lisäanalyysiä varten. Myös 1,2-kertainen muutos katsottiin jäljittää yhteistä muuttunut mRNA: iden ja miRNA eri syöpiä.

Digitaalinen ero näyttö (DDD) työkalun (https://www.ncbi.nlm.nih.gov/UniGene/ddd.cgi) käytettiin seulomaan syöpään liittyvien geenien eri HC. EST kirjastot valittu DDD vertailuja eri kudoksissa (syöpä vs. normaali) on lueteltu taulukossa S11. Altaat A ja B määrättiin normaalin ja syöpä- kirjastot kunkin syöpä, vastaavasti. Tuotos edellyttäen lukuarvo kussakin altaan ilmaiseva osa sekvenssien poolin sisällä että kuvata UniGene klusterin. Tilastollisesti merkitsevä osumia (Fisherin tarkka testi) osoittaa 10-kertainen eroja koottiin, ja alustava tietokanta luotiin. Kertainen erot laskettiin käyttäen suhdetta pool B /allas A mukaan aiemmin kuvattu menetelmä [45].

Niistä probsets kanssa korkeimmalla kertaiseksi muutoksia, yhteinen muuttunut mRNA: t ja miRNA (ainakin 6 ulos 11 HC) uutettiin käyttäen DDD työkaluja yhdessä mikrosirun aineistoja. Nämä yhteiset muuttunut RNA: t jälkeenpäin käyttää verkon rakenteita.

havaitseminen Jaetun-Cancer Alttius alueiden

numerot ilmentyvät eri geenien laskettiin kullekin alueelle (kuten taajuus alue) käyttämällä in -House kehitetty python script (python käsikirjoitus on saatavana script S1). Taajuus alueen mukana ilmentyminen laskettiin probsets ainakin 2-symmetrinen kertainen muutokset (taulukko S12) ja 200 ensimmäisen probsets korkeimman kertaiseksi muutokset (taulukko S13). Seuraavaksi kutakin aluetta, prosenttiosuus alueen osallistumisesta ilmennetty eri probsets kaikilla 11 tyyppistä HC laskettiin käyttäen seuraavia yhtälöitä: Missä FOR on taajuus alueella yli-ilmentynyt probsets (summattu 11 HC), n on määrä syöpien (tässä 11) ja FTP on taajuus alueen koko probsets (taulukko S14 ja S15) .Where FDR on taajuus alueen alas-ilmaistaan ​​probsets (summattu 11 HC), n on määrä syöpiä (tässä 11 ) ja FTP on taajuus alueen koko probsets (taulukko S14 ja S15). Lopuksi, viisi alueilla korkein suhde valittiin mahdollisina syövän riskin alueista jokaista kromosomi.

Lisäksi prosenttiosuus kromosomi osallistumisesta ilmennetty eri probsets yhteensä 11 HC laskettiin käyttäen seuraavia yhtälöitä: Missä FOC on taajuus kromosomin yli-ilmentynyt probsets (summattu 11 HC), n on määrä syöpiä (tässä 11) ja FCTP on taajuus kromosomin kokonaismäärän probsets (taulukko S16) .Where FDC on taajuus kromosomia down-ilmaistuna (summattu 11 HC), n on määrä syöpiä (tässä 11) ja FCTP on taajuus kromosomi täydellistä probsets (taulukko S16). Lisäksi prosenttiosuudet kromosomin osalta kutakin syöpä (taulukko S17) laskettiin osa kromosomi taajuus muuttunut probsets kromosomiin taajuus yhteensä probsets (taulukko S17). Erot kromosomien tutkittiin perustuvat yleisiin chi neliön testi.

Rakentaminen Networks yhteisestä Altered mRNA: iden ja miRNA

Pathway Studio 9 -ohjelmiston (Ariadne Genomics, Rockville, MD) käytettiin määritettäessä eri verkoissa. Pathway Studio käyttää RESNET Mammal tietokanta, joka on kattava polku ja molekyylien vuorovaikutus tietokantaan [46]. Tämä tietokanta sisältää uusia aliaksia ihmisen geenien, miRNA ja merkinnät muut nisäkkäät. Lyhimmän polun algoritmia käytettiin rakentamaan neljä eri verkkojen perustuu muuttaa mRNA: iden ja miRNA [47]. Viisi verkot rakennettiin perustuu yhteisiin muuttunut RNA: t, mukaan lukien verkon yleisesti muuttunut mRNA verkosto yhteisesti muuttaa mRNA: iden päälle PCSRs, verkon yleisesti muuttunut miRNA, verkko yhteisesti muuttunut miRNA päälle PCSRs ja integroiva verkon yhteisten muuttunut mRNA: iden ja miRNA. Biologisen prosessin kunkin verkon tunnistettiin käyttäen DAVID (https://david.abcc.ncifcrf.gov/tools.jsp) sarja bioinformatiikan työkaluja. DAVID bioinformatics resurssit koostuu integroidun biologisen tietämyskannat ja analyysityökaluja, joilla pyritään systemaattisesti talteen biologisen merkityksen suurista geenistä /proteiini luettelot [48].

promoottorianalyysi Muutettujen RNA: iden

Promoottori analyysi suoritettiin koekspressoi mRNA: iden eri syöpiä käyttäen pscan [49]. Transkriptiotekijät (TF: t) on ennustettu promoottorialueissa (-1 kb 0) mRNA käyttäen Jaspar tietokantaa (TF: t, joissa P-arvo 0,1 valittiin). Kun kyseessä on miRNA, yhteisten sääntelyviranomaisten ennustivat muuttuneita miRNA samaan alueeseen avulla Jaspar sivuston (https://jaspar.genereg.net/). TF: iä ennustettiin vuonna oletetun promoottori alueille (-3 kb +1 kb) ja MikroRNA ainakin 99%: n suhteellinen profiilin pisteet kynnys. Expression of ennustetun TF: istä määritettiin käyttäen transkriptio-microarray ekspressiotietojen 11 eri syöpiä, kuten rinta-, paksusuolen ja peräsuolen, kohdun limakalvon, mahan, maksan, keuhkojen, munasarjojen, haiman, eturauhasen, kivesten, virtsarakon, suoli neuroendokrii-, kohdunkaulan ja munuaisten syövät sekä glioblastooma .

tukeminen Information

Kuva S1.

Prosenttiosuus kromosomin osallistuminen geeniekspression.

doi: 10,1371 /journal.pone.0096320.s001

(PDF) B Kuva S2.

Vastaa