PLoS ONE: jälleenrakennus ja analyysi Transcription Factor-miRNA Co-Regulatory Feed-Forward Loops ihmisen syövissä käyttäminen Suodatin-kääre Feature Selection

tiivistelmä

Background

Kuten yksi yleisimpiä yhteistyön sääntelyyn motiiveja, rehu-eteenpäin silmukoita (FFLs) ohjata monia solujen toimintoja ja tärkeä rooli ihmisen syövissä. Siksi on tärkeää rekonstruoida ja analysoida syöpään liittyvien FFLs joita ohjataan transkriptiotekijä (TF) ja microRNA (miRNA) samanaikaisesti, jotta selvittää, miten miRNA ja TF: t yhteistyössä keskenään syöpäsoluissa ja miten ne edistävät syövän synty. Nykyinen FFL tutkimukset luottaa ennusti sääntelyä tietoa ja siksi kärsivät väärän positiivisen ongelman tulosennusteita. Kriittisemmin, FFLs tuottama Nykyiset lähestymistavat eivät voi edustaa dynaamista ja ehdollinen sääntelyn suhteen erilaisissa koeolosuhteissa.

Menetelmät /Principal Havainnot

Tässä tutkimuksessa ehdotimme uusi suodatin-kääre ominaisuuksien hallintaan menetelmä täsmällisesti yhteistyössä sääntelymekanismiin sisällyttämällä etukäteistietoja ennustettu sääntelyn yhteisvaikutukset rinnakkain miRNA /mRNA ilmaisun aineistoja. Soveltamalla tätä menetelmää, me rekonstruoitu 208 ja 110 TF-miRNA yhteissääntelymekanismien FFLs ihmisen yleiseurooppalainen syövän ja eturauhasen aineistoja, vastaavasti. Niiden tarkempi analyysi syöpään liittyvien FFLs osoittivat, että huippu-TF STAT3 ja miRNA HSA-let-7e ovat keskeisiä sääntelijöiden osallisena ihmisen syövissä, jotka ovat säänneltyjä tavoitteita merkittävästi rikastettu soluprosessi asetusten ja signalointi polkuja, jotka ovat mukana syövän synnyn.

Johtopäätökset /merkitys

tässä tutkimuksessa toimme tehokas laskennallinen lähestymistapa rekonstruoida yhteissääntelyjärjestelmien FFLs by tunnistaa tarkasti geeni yhteissääntelymekanismien vuorovaikutusta. Vahvuus Ehdotetun ominaisuuden valintatapa piilee siinä, se voi tarkasti suodattaa vääriä positiivisia ennusti sääntelyn vuorovaikutusta kvantitatiivisesti mallintamalla monimutkainen myötäsääntelyä kohdegeenien välittämän TF: ien ja miRNA samanaikaisesti. Lisäksi ehdotettu ominaisuus valintatapa voidaan yleisesti soveltaa muihin geenisäätelyn tutkimukset harmaan ekspressiotietojen suhteen erilaiset biologiset yhteyksissä.

Citation: Peng C, Wang M, Shen Y, Feng H, Li A ( 2013) jälleenrakennus ja analyysi Transcription Factor-miRNA Co-Regulatory Feed-Forward Loops ihmisen syövissä käyttäminen Suodatin-kääre Feature Selection. PLoS ONE 8 (10): e78197. doi: 10,1371 /journal.pone.0078197

Editor: Raya Khanin, Memorial Sloan Kettering Cancer Center, Yhdysvallat

vastaanotettu: 11 kesäkuu 2013; Hyväksytty: 09 syyskuu 2013; Julkaistu: 29 lokakuu 2013

Copyright: © 2013 Peng et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat avustuksia National Natural Science Foundation of China (61101061 MW, 31100955 AL). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Keski kaikkiin biologisiin organismien salakoodinavaus monimutkaisten geenin asetusten välillä sääntelyviranomaisten ryhmän ja kohdegeenien on tärkeää oppia solunsisäinen fysiologisia toimintoja ja toimintojen molekyylitasolla. Se auttaa myös ymmärtämään sisäisiä mekanismeja monimutkaisten sairauksien

in vivo

. Sääntelyviranomaisten geenien säädöksiä ovat transkriptiotekijöitä (TF: t), jotka ovat proteiineja sitoutumalla tiettyihin sivustoja promoottorialueissa kohdegeenien Tämä aktivoi tai estämällä ilmaus niistä. Muita sääntelyviranomaiset sisältävät endogeenisia pieni (19-24 nukleotidia) ei-koodaavat RNA: t (miRNA), joissa sääntelyn geenin ilmentymisen transkription jälkeisellä tasolla [1] estämällä käännös menettelyn tai alentavasti kohde mRNA: iden. On havaittu, että sekä TF: ien ja miRNA tärkeä rooli ihmisen syövissä [1] – [5] ohjaamalla monia biologisia prosesseja syövän kehittymistä ja etenemistä.

Useat tutkimukset ovat osoittaneet, että TF: ien ja miRNA ovat päägeenis- sääntelyviranomaisten eläimillä ja toimivat samalla sääntelyn logiikka [6]. Siten TF: t ja miRNA voi säädellä saman kohdegeenin yhteistoiminnallisesti on transkription ja posttranskriptionaalisella tason vastaavasti. Toisaalta, miRNA säädellään TF: ien aikana transkriptiota genomista tumassa ja ilmaisu ien voidaan myös moduloida miRNA. Siksi geeni asetuksilla TF: t ja miRNA usein tiukasti kytketty, hahmottamalla tietyn ”Feed-forward silmukoita” (FFLs) [7] rakenne ummessa sääntelyn piirejä. FFLs ovat osoittautuneet yhdeksi ofthe yleisimpiä co-transkription kuviot [8] ja se on raportoitu, että satoja miRNA-ohjattu FFLs ovat saatavilla genomin tasolla [9], [10]. Muodostamalla toiminnalliset moduulit geeni säätelyverkkoja (GRNs), FFLs ohjata monia solun toimintoja ja myös tärkeä rooli ihmisen syövissä, esimerkkejä, tukemalla onkogeeninen ominaisuudet onkogeenien [11] ja myötävaikuttamassa runsaasti kohdegeenien kasvainsoluissa erilaisten biologisten reittien [12]. Siten se on ratkaisevan rekonstruoida ja analysoida TF-miRNA yhteissääntelyjärjestelmien FFLs ihmisen syövissä, jotta selvittää, miten miRNA ja TF: t yhteistyössä keskenään syöpäsoluissa ja miten ne edistävät syövän syntymistä.

One haasteista tutkittaessa FFLs on puutteellisia tietoja sääntelyn tavoitteita. Koska on olemassa vain pieni määrä kokeellisesti todistettu tavoitteita, useimmat FFL tutkimukset hyväksyä sääntelyn tietoja laskennallinen ennustaminen. Esimerkiksi jotta löydettäisiin syöpään liittyvien miRNA ja TF: iä, Yan

et al

. uutetaan ja sijoittui FFLs päässä ennusti TF ja miRNA tavoitteet käyttäen Transfac ja TargetScan [13]. Ye

et al

. käytetään myös FFLs saada muista ennustus resursseja rakentaa ja analysoida miRNA ja TF yhteissääntelymekanismien verkon T-solujen akuutti lymfaattinen leukemia [14]. Nämä ennusti tulokset sisältävät suuren osuuden vääriä positiivisia, ja enemmän kriittisesti FFLs tuottamat edellä lähestymistavat ovat staattisia ja ei voi edustaa dynaamista ja ehdollinen sääntelyn suhteita erilaisissa koeolosuhteissa.

Tällä hetkellä rinnakkainen microarray kokeilut ovat olleet suorituksen tutkimiseksi geeni ja miRNA ilmentymisen syövissä samanaikaisesti [15], [16], joka tarjoaa erinomaisen mahdollisuuden käsitellä edellä mainittuja asioita käyttämällä ilmaisua tietoja jälleenrakentamiseen TF-miRNA yhteissääntelymekanismien FFLs. Äskettäin Lu

et al

. ehdotti Lasso regressiomallin joka hyödyntää laskennallisesti ennustettu sääntelyn vuorovaikutusta ja syövän rinnan ekspressiotietojen päätellä miRNA-tavoite säätelyverkkojen [17], Yu

et al

. käytetyt vaiheittainen lineaariregressiomallin (STEP), joka integroituu myös ennustettu asetusten kanssa ilme datan saamiseksi kombinatorinen verkosto TF ja miRNA syövässä [18]. Nämä kaksi asiakirjaa valottavat menetelmiä rakentamiseen miRNA-mukana GRNs ja mullistanut ymmärrystä vaikutuksia ien ja miRNA ihmisen syövissä. Kuitenkin tutkimus FFLs edellyttää tarkkaa yhteissääntelymekanismien tietoja, kuten FFLs edustaa itseään hienovarainen eräänlainen yhteissääntelymekanismien motiivi. Siksi kehittyneempiä laskennallisia menetelmiä parempana tarkasti rekonstruoida FFLs mistä ekspressiotietojen tuella ennustetun sääntelyn vuorovaikutusta.

Tässä tutkimuksessa ehdotimme uutta laskentamenetelmä perustuu ominaisuuksien hallintaan rekonstruoida TF-miRNA yhteissääntelymekanismien FFLs ihmisen syövissä. Koska voimakas -koneoppimisteknologia, ominaisuus valinta on laajalti käytetty monilla bioinformatiikan, kuten geeni valinta microarray data [19], päättely geenin verkkojen [20], sisällön ja signaalianalyysi sekvenssi [21] ja massaspektrit analyysi [21]. Meillä työskentelee kaksi suosittua ominaisuuksien hallintaan strategioita: suodatin ja kääre, tehokkaasti löytää co-asetusten ien ja miRNA rinnakkaisviljelmistä microarray data ihmisen syövissä. Tuloksemme osoittivat, että ehdotettu menetelmä vähensi väärien löytö korko on päätelty sääntelyyn suhteita, mikä johtaa tarkempaan FFL jälleenrakentamiseen. Edelleen analyysi FFLs tunnistaa ehdotettu menetelmä osoitti, että ne sisältyvät monet tunnetut syöpään liittyvien geenien ja miRNA, mikä osoittaa niiden toiminnallinen merkitys ihmisen syövissä.

Materiaalit ja menetelmät

Ennustettu sääntelyn vuorovaikutusta

kolmenlaista sääntelyä yhteisvaikutuksia ei tutkittu tässä tutkimuksessa: TF miRNA (TF-miRNA), TF geeni (TF-geeni), ja miRNA että geeni (miRNA-geeni). Me kopioidut ennusti TF-miRNA vuorovaikutuksia cGRNB verkkosivuilla [18] kanssa 11599 sääntelyn paria. Jos haluat hakea ehdokas TF-geenin vuorovaikutusta, TF sitoutumiskohtia ensin poimittu TFbsConsSites tiedosto UCSC [22] noudattamalla kuvattua [18] ja sitten käytetään skannaamaan 1 kb ylävirtaan 0,5 ke alavirtaan transkription aloituspaikkoja kaikkien viite geenien UCSC. Tulokset edelleen yhdistettiin 7059 TF-geenin vuorovaikutuksia TRED tietokannasta [23], mikä johtaa täysin 130338 TF-geenin vuorovaikutusta, mukaan lukien 16534 kohdegeenien ja 214 ihmisen TF: iä. Sillä miRNA-geenin vuorovaikutusta, tulokset kolmesta laajalti käytetty miRNA tavoite ennustelaitteet: PicTar [24], TargetScan [25] ja Miranda [26] saatiin miRGen tietokannasta [27], jotka sisältävät 75968, 75613 ja 41804 ennustettu miRNA- geenin vuorovaikutusta vastaavasti. Liitto ennustuksen tulosten, mukaan lukien 118408 miRNA-geenin vuorovaikutusta 276 ihmisen miRNA ja 10255 kohdegeenien, käytettiin jatkotutkimuksiin.

Parallel mRNA ja miRNA ilmaisun aineistot

Käytimme kaksi rinnakkaista mRNA ja miRNA ilmaisun aineistot ihmisen syöpien, jotka edustavat miRNA ja mRNA: n ilmentymisen saadut tiedot samat näytteet ja samoissa koe-olosuhteissa. Ensimmäinen aineisto sisältää NCI-60 mRNA ilmaisu tiedot perustuvat Affymetrix HG-U133 siruja [16] ja rinnakkaisen miRNA ekspressiotietojen [15] päässä CellMiner verkkosivuilla. Tämä yleiseurooppalainen syövän aineisto sisältää kaikkiaan 60 erilaista ihmisen syövän solulinjat, jotka ovat peräisin melanoomat, leukemia ja muut kiinteät tuumorit, kuten rinta-, paksusuoli-, munasarja-, keuhko- ja eturauhassyöpää. Tämä rinnakkainen ilmaus aineisto koostuu kokonaan 8388 geenien ja 195 miRNA [18]. Toinen rinnakkainen mRNA ja miRNA ilmaisun aineisto hyväksytään tässä tutkimuksessa koostuu 111 eturauhassyövän ja 28 terveessä eturauhasessa, mukaan lukien 373 miRNA ja 19253-mRNA: t [28]. Tämä aineisto on saatavilla GEO tietokannan hakunumero: GSE21032.

Ominaisuus valinta tunnistamiseen sääntelyn vuorovaikutusten

Kunkin kohde (mRNA tai miRNA), joukko alkuperäisen ominaisuuksia (eli kaikki ennustettu TF: t tai miRNA jotka säätelevät tämän tavoitteen) sisältää tavallisesti useamman kuin yhden elementin takia suuri määrä vääriä positiivisia ennustettu tuloksia. Sitten piirre matriisi on

n

rivit ja

m

sarakkeet

n

sääntelyviranomaisten ja niiden ilmaisun arvot

m

näytteitä. Koska ensimmäinen vaihe, me suodatetaan ominaisuus joukko kohde käytettävä tehokkaita mRMR menetelmää (minimaalinen ylimäärätarkastus maksimaalinen-merkityksellinen) [19], joka perustuu keskinäiseen tieto, joka on laajalti käytetty toimenpide määritellä riippuvuus muuttujia. Erityisesti anna

p

(

x

) ja

p

(

y

) on marginaalinen todennäköisyysjakauman toiminnot kaksi muuttujaa

x

ja

y

ja

p

(

x, y

) olla yhteinen todennäköisyysjakauman funktio, keskinäinen tieto määritellään seuraavasti: (1) Oletetaan, että kohde

x

ilme arvo

E

x

on kaksi sääntelyviranomaisten

y

i

ja

y

j

ilme arvot

E

yi

ja

E

yj

. Jos esimerkiksi

y

i

ja

y

j

edustavat miRNA ja TF sitten

E

yi

ja

E

yj

saadaan rinnakkaisesta miRNA ja mRNA: n ilmentymisen datan, vastaavasti. Lopullinen ominaisuudet

S

suodattimen jälkeen vaiheen tyydyttää kaksi kriteeriä käytetyn mRMR menetelmässä, eli suurin merkitys tavoitteen kanssa ja minimaalinen välinen redundanssi sääntelyviranomaisten (eli valita säätimiä, jotka eivät ole vain vähäisiä redundanssia keskinäisen tiedot olemassa olevaan sääntelyviranomaisten, mutta myös maksimaalinen keskinäinen tietoa kohteen kanssa), siinä muodossa kuin yhtälön (2) ja (3). Tässä

I

edustaa toisiltaan tietoa kaksi muuttujaa. Vuodesta sijoitusta tulokset mRMR, valitsimme jopa 20 ehdokas säätimiä, jotka ovat todennäköisimmin vuorovaikutusta tavoite lisätutkimuksia, johon olisi sisällytettävä kaikki mahdolliset sääntelyviranomaisten. (2) (3) Seuraavaksi on kunkin kohde oli edelleen optimoida kääre ominaisuus valintatapa, ja tässä vaiheessa käytimme rekursiivinen taaksepäin elimistöstä poistaminen. Me mallinnettu ilmaus arvoja tavoite

i

(

E

xi

) ja sen

p

sääntelyviranomaisten (

E

yi1

, …

E

Yip

) kanssa lineaarinen regressio (yhtälö 4), jossa

β

i

on regressio kerroin ja

ε

i

edustaa virhetermi tai melua syntyy regressio prosessi. Sillä joka kerta Poistimme säädin pienin regressiokerroin päässä featureset ja toistuvat edellä kuvatut jäljellä sääntelyviranomaisten kunnes ominaisuusvalikoima tuli tyhjäksi. Optimaalinen ominaisuudet määritettiin pienin

p

-arvo (alle 0,01) on lineaarista regressiomallia käyttäen F-testiä. (4) B

Jälleenrakennus ja validointi TF-miRNA yhteissääntelymekanismien FFLs

yhteissääntelymekanismien vuorovaikutukset tunnistaa suodatin-kääre ominaisuus valintatapa on kolme erilaista sääntelyn suhteet: TF-geeni miRNA-geeni ja TF-miRNA. Rekonstruoida yhteissääntelymekanismien FFLs teimme tyhjentävä haku tukikohtaan syvyyshaku menetelmää kaikkiin kohdegeenien tuloksissa. TF-FFLs, ensimmäinen lista mahdollisista kohdegeenien, joita ohjataan ainakin yhdellä TF ja miRNA syntyi. Mirna säätävät kunkin kohdegeenin tutkittiin sitten yksi kerrallaan ja TF-FFL syntyi, kun kohdegeeni ja sen miRNA säädin molemmat ohjataan TF. Sillä miRNA-FFLs, saman kohdegeenin lista on käytetty ja miRNA säätelevä sekä kohdegeenin luettelosta ja sen TF valittiin rakentaa miRNA-FFL. Lopuksi tunnistaa komposiitti-FFLs rekonstruoitu miRNA-FFLs tutkittiin edelleen toistuvasti, onko TF: iä näissä FFLs säätelevät myös vastaavan miRNA.

validoimiseksi FFLs rekonstruoitu rinnakkain ilmaisun aineisto ja etukäteistietoja ennusti sääntelyn vuorovaikutusta, me satunnaisesti valittu saman määrän vuorovaikutuksia ennustetun sääntelyn paria, joista olemme rekonstruoitu FFLs käyttäen yllä lähestymistapaa. Tämä menettely toistettiin 1000 kertaa tuottaa empiiriset jakaumat alle hypoteesia, että FFLs rekonstruoimasta lähestymistapamme todellakin syntyä sattumalta. Suoritimme sitten yhden otoksen t-testi perustuu lukumäärän TF-FFLs miRNA-FFLs ja komposiitti-FFLs rekonstruoida yleiseurooppalainen syövän aineisto ja lasketaan

p

-arvo, onko tämä nollahypoteesi voidaan hylättävä merkitsevyystasolla 0,01.

lisäksi, edelleen vahvistaa, kuinka tärkeää on FFLs syövän, arvioimme suorituskyky tunnistetaan FFLs luokittelussa eturauhassyövän normaali näytteitä rinnakkain geenien ilmentyminen tietoja. LIBSVM [29], joka on julkinen SVM kirjasto, valittiin luokitusta. Jätä-one-out cross validointi (LOOCV), joka on objektiivisin ja tiukka tapa arvioida luokittelija, annettiin arvioida luokituksen suorituskykyä FFLs. Vertailun, me myös käyttää perustason menetelmä, jossa etiketit syövän ja normaalin ilmaisun aineisto oli vuorotella 100 kertaa. Sillä joka kerta, SVM luokittelijoiden samoilla FFLs muodostettiin permutoitu ekspressiotietojen ja sitten testattava samoilla arviointimenettelyä. Luokittelu saadut tulokset kaikista permutaatio testit keskiarvo saada perussuorituskykyä.

kolme luokitusta mittausten suorittaminen Tässä tutkimuksessa käytetyt, tarkkuus (

Acc

), herkkyys (

Sn

) ja spesifisyys (

Sp

) määritellään ajalle seuraavasti: (5) (6) (7) Tässä

TP

,

TN

,

FP

ja

FN

edustavat oikeita positiivisia, tosi negatiivinen, vääriä positiivisia ja vääriä negatiivisia, vastaavasti. Samaan aikaan, koska koot syövän ja normaali näytteet ovat hyvin erilaisia, Matthews korrelaatiokerroin (

Mcc

) käytettiin, joka on tasapainoinen mittauksen laadun luokituksia [30]: (8) Lisäksi, myös piirretty vastaanottimen operaattori (ROC) käyrät suorituskyvyn vertailu, jossa x-akseli kuvaa 1-

Sp

ja y-akseli

Sn

.

tulokset

Filter-kääre ominaisuuksien hallintaan

esimerkki suodattimen kääre toiminto valintamenettelyä käyttäen yleiseurooppalaista syöpä aineisto on esitetty kuviossa 1. suodattimen ominaisuuksien hallintaan, kärkikastiin sääntelyviranomaisten valittu by mRMR osoittaa suuri keskinäinen tiedotus, joka osoittaa korkea merkityksellinen kanssa kohdegeenin (kuvio 1A). Kuvio 1B esittää alussa, on täysin 20 ehdokkaan ominaisuudet mahdollisia vääriä positiivisia ja

p

-arvoon liittyvä lineaarinen regressiomalli on 0,27. Kun kääre ominaisuus valinta on suoritettu, vastaava

p

-arvo laskee dramaattisesti, mikä viittaa parempaan malli, joka on lähellä todellista geenisäätelyn mekanismi. Lopullinen malli koostuu kolmesta sääntelyviranomaisten optimaalisella

p

-arvo on 3,9 x 10

-4. Lisäksi boxplot on

p

-arvot kaikille tavoite tässä tutkimuksessa (kuvio 2A) näyttää ominaisuuksien hallintaan yleensä tekee tarkemman regressiomalleja. Olemme myös arvioineet ehdotettu menetelmä laskemalla Pearsonin korrelaatiokerroin (PCC), laajalti käytetty mittaus tunnistaa sääntelyn suhteet [31], välillä ehdokas sääntelyviranomaisten ja kohde. Tämän seurauksena merkittävästi korkeampi PCC: llä (U-testi

p

-arvo: 4,4 × 10

-167) havaittiin sääntelyn vuorovaikutusta jälkeen ominaisuuksien hallintaan (kuvio 2B). Yhdessä suodattimen kääre ominaisuuksien hallintaan menetelmä parantaa huomattavasti luotettavuutta lainsäädäntöhankkei viestinvälityksen tarkasti mallintamalla rinnakkain ilmaisun tiedot ja tehokkaasti poistamalla väärin ennustettu vuorovaikutus.

(A) Esimerkki osoittaa toisiltaan tietoa kaikista sääntelyviranomaisten suodatin ominaisuus valintaprosessi. Valitsimme kärkikastiin sääntelyviranomaisten valitsemien mRMR, jotka osoittavat suuremmat keskinäinen tietojen arvoja, jotka osoittavat suuri merkitys kanssa kohdegeenin. (B) Esimerkki havainnollistaa

p

-arvo muutoksen lineaarista regressiomallia kääreen ominaisuus valintaprosessia. Kun 17 ominaisuudet poistetaan, optimaalinen

p

-arvo (merkitty punaisella ’*’) saapuvat kääre ominaisuus valinta on 3,9 x 10

-4.

( A)

P

-arvot regressioanalyysin mallien kaikille kohdegeenien ennen ja jälkeen ominaisuus valinta.

P

-arvot laskenut huomattavasti ominaisuuksien hallintaan suoritettiin. (B) Pearsonin korrelaatiokertoimet (PCC) kaikkien kohde- geenejä ja niiden venttiilit ennen ja jälkeen ominaisuus valinta. Korkeampi PCC: llä (U-testi

p

-arvo: 4,4 × 10

-167) havaittiin lopullisessa lainsäädäntöhankkei vuorovaikutusta.

lisäarvioimiseksi suorituskykyä ehdotettu menetelmä, me permutoidaan ilmaus arvoja ekspressiotietojen satunnaisesti 100 kertaa ja lasketaan väärien discoveryrate (FDR) mukaan yhteisvaikutuksista syntyvät satunnaistettiin aineistot kuin vääriä positiivisia. Vertailun vuoksi arvioitiin myös suorituskykyä kaksi muita menetelmiä: Lasso [17] ja STEP [18]. Testaus toistettiin 3 kertaa, ja tulokset on esitetty taulukossa 1. verrattavissa varianssi, keskiarvon FDR suodattimen ominaisuuden valinta on 0,11, joka on merkittävästi pienempi kuin Lasso ja STEP. Lisäksi käyttämällä suodatinta ja kääre ominaisuuksien hallintaan yhdessä, havaitsimme dramaattisesti väheneminen FDR varianssi 1,24-0,38, mikä osoittaa parempaa yhdenmukaisuutta ja kestävyyttä verrattuna muihin lähestymistapoihin. Lisäksi tämä menetelmä tuotti keskimääräinen FDR 0,06, mikä on 5% parempi kuin suodattimen menetelmää. Yhdessä nämä tulokset osoittavat parempi suorituskyky suodatin-kääreen ominaisuus valintatapa.

Lopuksi tutkimme miRNA sääntelyn vuorovaikutusta ennen ja jälkeen ominaisuus valinta. Kuten taulukosta 2, oli täysin 190976 ennusti miRNA-kohde vuorovaikutukset ja useimmat niistä poistettiin kun ominaisuuksien hallintaan haettiin, mikä osoittaa nämä ennustettu sääntely vuorovaikutukset olivat joko vääriä positiivisia tai liity ihmisen syövissä. Lisäksi turvautumalla miRTarBase [32], joka sisältää kokeellisesti validoitu miRNA tavoitteet, löysimme osa tunnetuista sääntelyn vuorovaikutusten lisääntyi merkitsevästi tuloksiin (taulukko 2, Hypergeometrisen-testi,

p

-arvo: 2,4 × 10

-3 suodattimen ominaisuuksien hallintaan, 4,0 x 10

-4 suodatinkankaiden-kääre ominaisuus valinta), joka myös tukee hyödyllisyyttä ominaisuuksien hallintaan löytämässä sääntelyn vuorovaikutusta.

TF ja miRNA yhteissääntelymekanismien FFLs ihmisen syövissä

Vuodesta 24033 sääntelyn vuorovaikutusta tunnistettiin ominaisuuksien hallintaan tunnistimme kolmenlaisia ​​FFLs ihmisen syövissä (kuvio 3A): TF-FFL miRNA-FFL ja komposiitti- FFL. TF-FFL, TF on tärkein säädin suoraan säätelee miRNA ja kohdegeenin kun miRNA säätelee myös kohdegeenin. Mirna-FFL on sama rakenne, jossa TF-FFL mutta tärkein säädin on sen sijaan miRNA. Komposiitti-FFL on yhdistelmä TF-FFL ja miRNA-FFL, jossa TF ja miRNA säädellä toisiaan, kun ne säätelevät myös saman kohdegeenin. Huomaa nämä FFLs on raportoitu myös muissa tutkimuksissa syövän [7], [13], [14], [33], [34], mikä viittaa esiintyvyys FFLs geenisäätelyn ja mekanismi syövän. Vuoasta syövän aineisto, olemme menestyksekkäästi rekonstruoitu 98 TF-FFLs, 106 miRNA-FFLs ja 4 komposiitti FFLs päässä lainsäädäntöhankkei viestinvälityksen ominaisuuksien hallintaan. Edelleen vahvistaa nämä syöpään liittyvien FFLs, suoritimme yhden otoksen t-testiä vertaamalla rekonstruoitu FFLs niille syntyy satunnaisesti valitun vuorovaikutuksia ennusti sääntelyn paria (katso menetelmä), ja keskimääräinen lukumäärä TF-FFLs miRNA-FFLs ja komposiitti FFLs satunnaistetuissa vuorovaikutusta oli 56, 26 ja 0,2, jotka olivat kaikki merkittävästi pienempi (

p

-arvo: 1,2 x 10

-8 varten TF-FFL, 2,0 x 10

-43 varten miRNA-FFL, 9,9 x 10

-11 komposiitti-FFL) kuin määrä FFLs tunnistettu ihmisen syövissä.

(A) kolmenlaista 3-vertex FFLs löydetty ihmisen syövissä. Mukaan suhde miRNA ja TF, sekoitettu FFLs löydetty ihmisen syövissä luonnehdittaisiin TF-FFL (TF suoraan säätelee miRNA ja kohdegeenin kun miRNA säätelee myös kohdegeenin) miRNA-FFL (Mirna suoraan säätelee TF ja kohdegeenin kun TF säätelee myös kohdegeenin) tai komposiitti-FFL (TF ja miRNA säädellä toisiaan samalla kun ne myös säätelevät samat kohdegeenin). (B) Yhteinen TF-FFLs löytyy sekä pan-ja eturauhassyövän aineistoja. Punaiset ympyrät osoittavat kohdegeenien; sinisiä kolmioita ja oranssi neliöt osoittavat TF: ien ja miRNA.

Samalla olemme rekonstruoitu TF-miRNA yhteissääntelyjärjestelmien FFLs käyttäen eturauhassyöpää aineisto ja verrattiin niitä niihin syntyy normaalin eturauhasen ekspressiotietojen. Määrä yhteistyön sääntelyä FFLs eturauhassyövässä oli 110, ja paljon muuta FFLs (425 kpl) havaittiin normaalissa eturauhasessa soluissa. Lisäksi löysimme koostumus FFLs oli merkittävästi erilainen (chi-neliö testi,

p

-arvo: 1,7 × 10

-2), esimerkiksi prosenttiosuus miRNA-FFLs oli 79% eturauhasen syöpä, kun tämä määrä nousi 89% normaalissa eturauhasessa kudoksessa. Tämä ilmiö merkitsee paljon normaalia yhteissääntelymekanismien FFLs dramaattisesti tukahdutetaan tai muutettu eturauhassyövässä. Lopuksi vertasimme FFLs rekonstruoitu yleiseurooppalainen ja eturauhassyövän aineistot ja tunnistettu 2 TF-FFLs (kuvio 3B), joka ilmestyi molemmissa aineistoja. Mielenkiintoista on, että miRNA näiden kahden FFLs, HSA-let-7a ja HSA-anna-7e, kuuluvat HSA-let-7 perhe, joka liittyy eturauhasen [35], rintojen [36], keuhkosyöpä [37] syöpiä.

lisäksi teimme luokittelu analyysi eturauhassyövän ja normaali näytteet käyttämällä ilmaisua tiedot miRNA ja geenien edellämainitussa yhteissääntelymekanismien FFLs. Suorituskykyä normaalin ja syövän FFLs arvioitiin käyttämällä LOOCV ja esitetään taulukossa 3. Sekä normaalin ja syövän FFLs saatiin erittäin hyviä luokittelun tuloksia

Acc

on 95,0% ja 95,7%, repectively. Myös

Sn

,

Sp

ja

Mcc

mittaukset osoittavat classfication tulokset Molempien FFLs ovat hyvin tasapainossa. Lisäksi käyttämällä kaikkia näitä FFLs luokitusta suorituskyky on edelleen parantunut

Acc

,

Sn

ja

Mcc

nostamisesta 97,1%, 99,1% ja 0,909, tässä järjestyksessä, jotka ovat signficantly paremmat kuin perustason menetelmällä. Nämä tulokset ovat myös vahvistaneet ROC käyrät edellä lähestymistapojen (kuvio 4), mikä viittaa siihen, tehokkuus näiden FFLs luokittelussa eturauhassyövän ja normaali näytteet ja niiden merkitys syövän.

harmaa, sininen, vihreä ja punainen käyrät ovat ROC käyrät lähtötilanteen (yhden yhdistelmän), syöpä FFLs, normaali FFLs ja kaikki FFLs, vastaavasti. Suurin AUC osoittaa parasta esityksiä luokitus.

keskeisiä toimijoita syöpään liittyvien FFLs

Laskimme esiintyminen TF: ien ja miRNA in yleiseurooppalaisia ja eturauhassyövän FFLs. Kuten taulukosta 4, korkeimmilla sijoilla TF ja miRNA ovat STAT3 ja HSA-let-7e, vastaavasti. Mielenkiintoista, löysimme STST3 ilmestyi 18 FFLs eturauhassyövän (taulukko 5), joka oli merkittävästi rikastettu verrattuna normaalissa eturauhasessa kudoksessa (chi-neliö testi,

p

-arvo = 2,6 × 10

-12) ja yleiseurooppalaisen syövän (chi-neliö testi,

p

-arvo = 3,8 × 10

-3). Tämä ilmiö merkitsee STST3 on sekaantunut eturauhassyöpää. On raportoitu, että STAT3 konstitutiivisesti aktivoitu eturauhassyöpäkudoksen [38] ja induktio STAT3 ilmentyminen voidaan indusoida pahanlaatuinen muutos normaalin eturauhasen epiteelisolujen [39]. Lisäksi STAT3 on esitetty lupaava terapeuttinen kohde eturauhassyövässä [40]. Kaikki nämä havainnot osoittavat, että STST3 on tärkeä syöpään liittyvien TF ja sillä on merkittävä vaikutus ilmenemisestä ja kehittymisestä eturauhassyöpää. Lisäksi olemme havainneet, yli 24%: n tavoite STAT3 löytyy yleiseurooppalaiseen syöpää esiintyi myös eturauhassyöpää. Tarkempi analyysi toiminnallisten rikastumista STST3 tavoitteet eturauhassyövän osoitti näissä kohde oli tärkeä rooli erilaisissa soluprosessin asetuksia osallisena syövän synnyn, esimerkiksi solun pinnan sitoutumisen ja aktiivisuuden säätely erilaisia ​​proteinaasien (taulukko 6). Tulokset koulutusjakson osoitti myös nämä tavoite esiintyi runsaasti Fruktoosi ja mannoosi aineenvaihduntaa ja Notch signalointireitin.

TF-miRNA co-säätelyverkkojen ihmisen syövissä

Perustuu FFLs rekonstruoitu kahdessa aineistoja, me edelleen rakennettu yleiseurooppalaisten ja eturauhassyövän erityinen TF-miRNA co-säätelyverkkojen, ja visualisoida niitä käyttämällä Cytoscape ohjelmistojen [41]. Kuten kuvassa 5, yleiseurooppalainen syöpä yhteissääntelymekanismien verkko sisältää kokonaismäärän 213 solmuja, kuten 37 TF: iä, 17 miRNA ja 159 muita geenejä. Eturauhassyövän erityinen verkko koostuu 118 solmut 27 TF: iä, 8 miRNA ja 83 muiden geenien (kuvio 6). Laskimme aste (connectivity) kunkin solmun ja totesi, että napa on suurin määrin molemmissa verkoissa oli sama miRNA HSA-let-7e. Tämä tulos yhtyi FFLs analyysin edellä, mikä osoittaa, että HSA-let-7e voi olla ratkaiseva erilaisissa ihmisen syövissä. Lisäksi kirjallisuuden tutkimus osoittaa, että HSA-let-7e on jäsenenä let-7 perheen tullut tuumorisuppressoriproteiinia [36] ja on raportoitu tärkeä rooli säätelyssä onkogeenien multipletumors [42], [43].

Red ympyrät osoittavat kohdegeenien; sinisiä kolmioita ja oranssi neliöt osoittavat TF: ien ja miRNA. Punainen T muoto reuna: miRNA sääntely; sininen nuoli muoto reuna: TF sääntelyä.

Red ympyrät osoittavat kohdegeenien; sinisiä kolmioita ja oranssi neliöt osoittavat TF: ien ja miRNA. Punainen T muoto reuna: miRNA sääntely; sininen nuoli muoto reuna: TF sääntelyä.

Aliverkko HSA-let-7e noudetaan yleiseurooppalainen syövän FFLs (kuvio 7) sisältää 57 kohdegeenien ja 12-TF: myös monia syöpään liittyvien geenien kuten MYB, E2F2 ja HAND1. MYB on esikasvaintekijän joka on tunnistettu aiheuttavan erilaisia ​​leukemia [44]. E2F2 on solusyklin säädin, jonka ilmentyminen nousee eturauhasen syöpä kudoksen [45]. HAND1 on myös raportoitu olevan keskeinen rooli syövän synnyn prosessissa [46]. Olemme myös suoritettu toiminnallinen rikastamiseen analyysi HSA-let-7e tavoitteiden pan-syövän ja tulokset taulukossa 7 osoittavat, että ne ovat huomattavasti rikastunut viisi väyliä (hsa05200: Pathways in cancer; hsa05220: Krooninen myelooinen leukemia, hsa00270: kysteiini ja metioniini aineenvaihduntaa; hsa05222: pienisoluinen keuhkosyöpä, hsa05219: Virtsarakon syöpä), joista neljä reitit liittyvät ihmisen syövissä. Kaikkiaan nämä tulokset osoittavat, että HSA-let-7e voi estää prosessi kasvaimen esiintyminen ja kehityksen eri kasvaimissa säätelemällä eri onkogeenien.

Aliverkko piirrettiin kaikki suorat liittyvät solmut HSA-let-7e , joka on osoitettu olevan napa yhteistyössä sääntelyverkon.

keskustelu

Human syöpiä yleensä ominaista lisääntyminen monipuolisia geenien eri kehitysvaiheissa kanssa monimutkainen sääntelymekanismina, siksi jälleenrakentamiseen geenisäätelystä ihmisen syövissä, erityisesti suhteessa sen monimutkainen, dynaaminen ja ehdollinen ominaisuus, voi suuresti parantaa tietämystä alkuperästä syöpä ja sen pahanlaatuinen käyttäytymistä. Tässä tutkimuksessa käytimme suodattimen kääre ominaisuuksien hallintaan menetelmää tunnistaa sääntelyn välistä vuorovaikutusta kohdegeenien ja sääntelyviranomaiset, josta olemme edelleen rekonstruoitu TF-miRNA yhteissääntelyjärjestelmien FFLs ihmisen syövissä. Ehdotettu menetelmä hyödyntää täysin rinnakkaisia ​​ilmaisun aineistojen ja etukäteistietoja ennustettu sääntelyn vuorovaikutusta mallintaa ja luonnehtia monimutkainen yhteissääntelyn mekanismi ihmisen syövissä.

Vastaa