PLoS ONE: Integrative tunnistaminen vapautettiin miRNA /TF-välitteisen Gene Regulatory lenkit ja Networks Eturauhassyöpä

tiivistelmä

MikroRNA (miRNA) ovat herättäneet runsaasti huomiota biologian ja lääketieteen. On oletettu, että miRNA vuorovaikutuksessa transkriptiotekijöiden (TF: t) in koordinoidusti avainasemassa säätelyssä signalointi ja transkription reittejä ja saavuttamaan vankan geenisäätelyn. Tässä ehdotamme uutta integroiva laskennallisen menetelmän päätellä tietyntyyppisten vapautettu miRNA-välitteinen sääntelyä piirien klo transkription, transkription jälkeisen ja signalointi tasolla. Luotettavasti ennustaa miRNA-kohde vuorovaikutuksia mRNA /miRNA ekspressiotietojen, menetelmämme kollektiivisesti käytetään sekvenssi-pohjainen miRNA-kohde ennustukset saatu useista algoritmeja, tunnettu tietoa mRNA ja miRNA tavoitteet ien saatavilla olemassa oleviin tietokantoihin, tietyt molekyylirakenteet tunnistettiin tilastollisesti yliedustettuja geeniregulatiivista verkostot, molekyyli- alatyypitys tietoa, ja state-of-the-art tilastollisia menetelmiä tarkoituksenmukaisesti rajoittaa taustalla analyysiin. Tällä tavalla menetelmä hyödyntää lähes kaikilla osa uuttuvan tietojen ilmaisua tietoja. Käytämme menettelyn mRNA /miRNA ilmentymisen tietoja eturauhasen kasvain ja normaali näytteitä ja havaita lukuisia tunnettuja ja uusia miRNA-välitteinen vapautuneilla silmukoita ja verkostoja eturauhassyövässä. Osoitamme myös esiintymiä johtaa useita eri biologisia asetuksia, joiden tiedetään keskeisessä asemassa ovat eturauhas- ja muiden syöpien. Havaintomme osoittavat, että ehdotettu laskentamenetelmä voidaan tehokkaasti saavuttaa merkittäviä oivalluksia huonosti molekyylimekanismeihin miRNA-välitteisen vuorovaikutukset ja leikellä niiden toiminnallisten roolien syövän pyrkimyksenä tasoittaa tietä miRNA terapeuttisten kliinisissä puitteissa.

Citation: Afshar AS, Xu J, Goutsias J (2014) Integrative tunnistaminen vapautettiin miRNA /TF-välitteisen Gene Regulatory lenkit ja verkostot Eturauhassyöpä. PLoS ONE 9 (6): e100806. doi: 10,1371 /journal.pone.0100806

Editor: Sebastien Pfeffer, Ranskan National Center for Scientific Research – Institut de biologie Moleculaire et Cellulaire, Ranska

vastaanotettu: 20 tammikuu 2014; Hyväksytty: 28 toukokuu 2014; Julkaistu: 26 kesäkuu 2014

Copyright: © 2014 Afshar et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ rahoittivat National Science Foundation (NSF) myöntää CCF-0849907 ja CCF-1217213. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

MikroRNA (miRNA) ovat pieniä ei-koodaava ribonukleiinihapoista (RNA: t) että laajalti säätelevät geeniekspression metazoan eläinten, kasvien ja alkueläimet. Noin 22 nukleotidin pituisia, miRNA yleensä tukahduttavat geenin ilmentymisen sitoutumalla sekvenssit osittaisella täydentävät tavoite lähetti-RNA (mRNA) selostukset. Nisäkkäillä, miRNA arvellaan määräämään toiminnasta yli 60% kaikista proteiineja koodaavat geenit ja laajasti osallistua säätelyssä monissa solun toimintoja [1], [2].

Harvoja poikkeuksia lukuun ottamatta, metazoan miRNA emäsparin kanssa tavoitteensa epätäydellisesti jälkeen joukko sääntöjä, jotka on muotoiltu käyttämällä kokeellisia ja bioinformatiikan perustuvien analyysien [3]. Tämä rajoitettu täydentävät tekee tehtävän laskennallisesti tunnistaa miRNA tavoitteita erittäin haastava ja johtaa yleensä suuria määriä, enimmäkseen vääriä, potentiaalisia kohteita.

Aiemmin laskennallisia työkaluja ovat lähinnä dissecting yksittäisten miRNA-tavoite vuorovaikutukset luottamalla sekvenssi -pohjainen tunnistaminen miRNA-kohde sitoutumiskohtia tai mRNA /miRNA ilmentymisen analysointi [4] – [6]. Vaihtoehtoiset menetelmät käyttävät miRNA isäntägeenejä likiarvoina mittaamiseksi ilmentymistä sulautettujen miRNA [7] tai palkata tieto-theoretic lähestymistapa tunnistaa ehdokas mRNA: iden moduloivien miRNA toimintaa vaikuttamalla suhdetta miRNA ja sen kohde (s) [8]. Toisaalta, viime työtä pitää koekspressoimalla analyysi, olettaen että tavoitteet tietyn miRNA ovat koekspressoi-, ainakin tiettyihin kudoksiin tai olosuhteissa [9].

Perinteisesti monet laskennallisia menetelmiä kehitetään miRNA-tavoite ennustus perustuvat oletukseen, että on olemassa käänteinen korrelaatio ilmentymisen taso miRNA ja että sen tavoite [10]. Kuitenkin on äskettäin osoitettu, että sekä positiiviset että negatiiviset transkription myötäsääntelyn on miRNA ja sen tavoitteet ovat yleisiä ihmisen ja hiiren genomeja [11], [12]. Erityisesti kaksi sääntelyn piirejä (että keskustelemme lähiaikoina) on ehdotettu miRNA-välitteinen vuorovaikutus, joilla katsotaan modu ja /tai vahvistaminen rooleja miRNA verkoissaan perustuu motiivien, kuten rehun eteenpäin silmukoita (FFLs ) [13]. Tämän seurauksena miRNA-kohde ennusteita pelkästään luottaen käänteinen korrelaatio oletuksen odotetaan rajoittuvan jos ennustus menetelmä ei tarkoituksenmukaisesti sisällyttää taustalla FFL verkon rakenne.

Edellisen perusteella paradigma, useat tutkijat ovat tutkineet tilastollisen yliedustus verkon rakenteita, joihin liittyy miRNA ja TF myötäsääntelyn mRNA: iden tunnistamiseksi rikastetun verkkoon motiiveja ja /tai arvioida niiden esiintyvyyttä eri biologisten yhteyksissä [14] – [21]. Pohjimmiltaan nämä menetelmät laskea toimenpiteiden koordinoidun geenin yhdessä sääntelyn miRNA ja TF sääntelyviranomaisten. Muut tutkijat ovat pitäneet regressiomenetelmiä tai bayesiläistä määrittää tilastollisia yhdistysten määrittämällä muutokset ilmentymistaso tietyn mRNA selittää ekspressiotasot TF: ien ja miRNA ennustettu kohdistaa mRNA perustuvat sekvenssi-informaatioon [22] – [25]. Myöhemmin he käyttävät päätelty suhteita hahmotella merkittäviä verkon rakenteita ja motiiveja muoti samanlainen kuin käytettiin edellä mainitut menetelmät. On kuitenkin tärkeää huomata, että kollektiivinen havainnot tuottaman kaikki nämä lähestymistavat tukevat edelleen tärkeyttä miRNA /TF välittämää FFLs kuin vallitsevat verkko motiiveja eri biologisten yhteyksissä, vahvistaen olettamukset perin ehdotti [11], [12] .

lisäksi edellä, häiriöistä geenisäätelyssä (esimerkiksi geneettinen ja epigeneettiset muutokset) uskotaan aiheuttavan muutoksia normaaliin solujen toimintaa, jotka johtavat etenemistä patologisten tilojen, kuten syövän, levitetään kautta geenisäätelyprote- verkoissa. Tämän vuoksi tehokas hoito moniin ihmisen sairauksiin voi vaatia perusteellista ja järjestelmätason käsitys genomista sääntelyviranomaisten, kuten miRNA ja TF: ien ja niiden verkostojen vuorovaikutusta. Kuitenkin systemaattisesti inferring molekyylivuorovaikutusten kokeellisin menetelmin on sekä vaikeaa ja kallista. Siksi on erittäin toivottavaa kehittää ”luotettava” tietotekniikassa kykenee tunnistamaan tällaisia ​​verkkoja. Verkon ennusteita voidaan myöhemmin käyttää asiantuntija biologi muotoilla uusia hypoteeseja ja tehokkaasti jatkaa niiden kokeellisen tutkimuksen ja validointi.

Viime aikoina useita uusia menetelmiä on tunnistamiseen esitetyn koordinoituja miRNA /TF vuorovaikutusta [26], [ ,,,0],27]. Kuitenkin, ja tietyn motiivi rakenne (esim FFL), nämä menetelmät yrittää ennustaa taustalla vuorovaikutukset (kolme reunat FFL) hyödyntämällä rajoitettu biologiset tiedot ja kapea joukko laskennallisia työkaluja. Tämän seurauksena, vaikka menetelmät ovat tehokkaita tarjoamaan oivalluksia esiintyvyys eri motiivin tapauksia geeniregulatiivista verkoissa, ne eivät voi tuottaa luotettavia ennusteita kokeellisesta näkökulmasta.

suorituskykyä joidenkin edellisten menetelmien on hiljattain testattu [27]. Havaittiin, että vaikka joitakin menetelmiä kykenivät saavuttamaan kohtuullisen onnistumisprosentti ennustaa tapauksissa yhdenlaista vuorovaikutus, he olivat vähemmän tehokkaita ennustaa tapauksissa kahden muun tyyppisiä, useita algoritmeja, joiden onnistumisprosentti lähellä tai vähemmän kuin 1% ennustettaessa TF-mRNA ja TF-miRNA vuorovaikutusta. Tämä korostaa kriittistä, että ennustavat pareittain molekyylivuorovaikutusten ja rakentamalla korkeamman asteen tapauksia motiivien käyttäen ennustettua reunat voivat kääntää korkeampiin yleistä vääriä positiivisia hinnat. Koska on runsaasti tietoa siitä, miten TF sitoo sen tavoitteita ja niiden sääntelyyn tehtäviä, päätimme harkita vain

kokeellisesti

validoitu TF-mRNA ja TF-miRNA vuorovaikutukset alle FFL puitteiden ja siirtää keskittyä luotettavasti ennustamaan huonosti miRNA-kohde vuorovaikutus reuna. Uskomme, asianmukaisesti rajoittaa taustalla tilastollisen analyysin ongelma, voisimme mahdollisesti lisätä luotettavuutta miRNA /TF välittämä geeniregulatiivista silmukka ennusteita.

edelleen rajoittaa miRNA-kohde vuorovaikutus ennustus ongelma, me keskitytään tämä paperi eräistä kolmen solmun sääntelyyn motiiveja. Ensimmäiset motiiveja, että menetelmä pitää kolme solmun FFLs jotka ovat viime aikoina saanut paljon huomiota kesken järjestelmien ja kokeellista biologeja. Nämä aiheet ovat erinomaisia ​​malleja koordinoituja miRNA-välitteinen ja transkription säätelyyn, joka on oletettu olevan yleisempiä ihmisen ja hiiren genomeja [12].

Katsomme kaksi tyypin I ffl motiiveja, jossa miRNA ja TF ovat tuotantoketjun sääntelyviranomaisten vastaavasti sekä neljä tyypin II FFL motiiveja, jossa TF on nyt alkupään säädin, kun taas miRNA on alavirran säädin – katso kuva 1. mekanistinen näkökulmasta nämä kuusi FFLs ovat luokiteltu

johdonmukaista

tai

epäjohdonmukainen

. Kun johdonmukainen tapauksessa miRNA ja TF sääntelyviranomaiset toimivat koordinoidusti vahvistaa asetuksen logiikka kahdella myötäkytketty polkuja. Tyypin I ja tyypin II-B yhtenäinen FFLs, nämä polut samanaikaisesti tukahduttavat ilmentymisen kohteena mRNA. Tuloksena mekanismia käytetään esimerkiksi hillitsemään vuotava geenin transkription varmistamalla, että sen ilmentyminen pysyy merkityksettömänä tasolla. Toisaalta, on tyypin II-Yhtenäinen FFL, TF vahvistaa transkriptio kohdennettujen mRNA suoraan aktivoimalla sitä sekä estämällä sen tukahduttamistoimet kohdentamalla miRNA säädin.

Tyyppi I FFL koostuu kolmoset (miRNA, TF, mRNA) siten, että miRNA samanaikaisesti on kohdistettu mRNA ja sen TF mRNA. Tyypin II FFL koostuu kolmoset (miRNA, TF, mRNA) siten, että TF samanaikaisesti säätelee miRNA ja sen kohde-mRNA. Lopuksi, tyypin III silmukka koostuu tripletti (miRNA, G-1, G-2) siten, että miRNA samanaikaisesti kohdistuu kaksi transkriptien tietyllä Kegg polku, yksi kustakin geenistä G-1 ja G-2, joiden vastaavat proteiinit voisivat mahdollisesti vuorovaikutuksessa toistensa kanssa, joka perustuu reitin kartalla annetaan Kegg tietokantaan.

epäyhtenäisiä FFLs, mirna ja TF sääntelyviranomaiset toimivat koordinoidusti hienosäätää ilmentymistä kohdennetun mRNA . Tarkemmin, mahdolliset poikkeamat vakaan tilan pitoisuus alkupään säädin (eli miRNA tyypin I ja TF tyypin II-A ja tyypin II-B FFLs) ajaisi kohdennetun mRNA sekä loppupään säädin , pois niiden vakaan tason samaan suuntaan. Tällä tavoin alavirran säädin voi tasapainottaa ilmentymistä kohteena mRNA kompensoi vaihtelut ilmentymistason ylävirtaan tekijä.

Tietyt soluprosesseja saattavat olla erittäin herkkiä aktiivisuuden tietyn transkriptin on spesifisiä biologisia yhteydessä. Näissä tilanteissa ”kohina puskuroida” mekanismi, jonka epäjohdonmukainen FFLs auttaa ylläpitämään kohdeproteiinin homeostaasin ja varmistaa, että koordinoimaton drift päässä vakaan tilan taso ylävirran säädin ei saa johtaa ei-toivottuun vaihteluun kohdeproteiinin tasolla, joka voi johtaa patologisia tuloksia. MiRNA ovat erityisen tehokkaita tässä ympäristössä, koska niiden nopea vaikutusmekanismia at transkription jälkeisellä tasolla, toisin kuin transkriptiorepresso- kiihdyttää siten melu puskuriksi [12].

Lisäksi moduloivia ja /tai vahvistavat geeniregulatiivista roolit että miRNA tiedetään pelata yhteistuumin TF: iä, ne on oletettu avainasemassa säätelyssä signalointireittejä samoin. Tässä suhteessa vaikka miRNA tiedetään olevan vähäisempiä vaikutuksia proteiineihin tasolla yksittäisten tavoitteiden asettaminen niiden kumulatiivinen vaikutus voi merkittävästi vaikuttaa tuloksiin ohjataan signalointireittien, koska moninaisuus tavoitteensa ja samanaikainen downregulation useiden näiden tavoitteiden. Ottaa tämä tärkeä näkökohta huomioon, menetelmämme katsoo myös perus tyypin III silmukka motiivi kuviossa 1, jossa miRNA kohdistuu kaksi geenitranskriptien, G-1 ja G-2, jonka proteiinit saattavat olla vuorovaikutuksessa toistensa kanssa mukaan polku kartan järjestetty Kegg tietokannassa (https://www.kegg.jp). Olemassaolo tyypin III silmukan motiiveja tukee kaksi keskeistä hypoteesia: (i) miRNA pelata merkittävä rooli säätelyssä signaalinvälitysreittien johtuen niiden terävien annoksesta arkaluonteisia [28] – [32], ja (ii) tavoitteet yhden miRNA ovat enemmän yhteydessä (eli vuorovaikutuksessa) proteiinitasolla odotettua sattumalta [28], [33] – [35].

vertailun ehdotetun menetelmän [26] mielestä vain tyypin II FFLs ja tekee saa syrjiä johdonmukaista ja epäjohdonmukaista FFLs, jota tarvitaan järjestelmätason käsitys transcriptome muutosten tauti. Lisäksi standardin tilastolliset testit käyttää tunnistamaan ilmentyvät eri geenien välillä kaksi ehtoa tyypillisessä geeniekspressioprofilointi tutkimus hyväksymä edellinen menetelmillä [26], [27], tulevat perustavanlaatuisia puutteita läsnäollessa kateissa lähteitä vaihtelua (johtuen biologiset ja kokeellinen tekijät mm) [36] – [38]. Molecular alatyypitys tieto on kriittinen esimerkki tällaisesta lähteitä vaihtelua.

Vastatakseen edellisen asioita, kehitämme tässä asiakirjassa IntegraMiR, uusi integroiva analyysi, jota voidaan käyttää päätellä tietyntyyppisten sääntelyä silmukoita vapautettu miRNA /TF vuorovaikutukset näkyvät transkription, transkription jälkeisen ja signaloinnin tasojen tilastollisesti yliedustettuna tavalla. Ehdotettu menetelmä määrittää biologinen roolit miRNA integroimalla viiden suuren tietolähteiden kanssa state-of-the-art tilastollisia menetelmiä luotettavasti päätellä tietyntyyppisiin miRNA-kohde vuorovaikutusten yhteydessä sääntelyn silmukoita. Erityisesti IntegraMiR hyödyntää:

mRNA ja miRNA ekspressiotietojen.

Sequence-pohjainen miRNA-kohde saatuja tietoja eri algoritmeja.

Tunnetut tietoa mRNA ja miRNA tavoitteet TF: ien saatavilla olemassa oleviin tietokantoihin.

Tietyt kolmen solmun motiiveja geeniregulatiivista verkoissa.

Tunnetut molekyylitason alatyypitys tietojen kanssa geenien ilmentyminen tietoja.

Toimi , IntegraMiR tunnistaa vapautetuilla miRNA, TF: t ja mRNA: t suorittamalla tilastollinen analyysi sisällä rajoittaa kehys, joka käyttää ”ennen” tieto käsittää äskettäin löydetty motiiveja, saatavilla oleva tieto miRNA /mRNA transkription säätelyyn, ja tunnetun proteiinin tason vuorovaikutusta signalointireittejä. Havainnollistaa tehokkuutta ja mahdollisuuksia tämän menetelmän, me soveltaa sitä mRNA /miRNA ilmentyminen tietoja kasvain ja normaali näytteet ja tunnistetaan useita tunnettuja ja uusia vapautettiin silmukoita eturauhassyöpä (PCA). Näin voimme osoittaa esiintymät tulokset ja havainnot useita eri biologisia asetuksia, joiden tiedetään keskeisessä asemassa ovat PCa ja muiden syöpien.

Haluamme korostaa tässä vaiheessa, että IntegraMiR on skaalautuva , siinä mielessä, että tiedon olemassa oleviin tai äskettäin kehitetty /päivitetty tietokantoja voidaan syöttää tuottavat halutut /laajennettu tuloksia. Lisäksi kaikki miRNA /mRNA ekspressiotietojen näytteitä saatu biologista yhteydessä kahden olosuhteet voidaan hyödyntää päätellä vastaavan vapautuneilla silmukoita kulloistenkin yhteydessä käsillä. Lopuksi kiinnostunut lukija voi vapaasti ladata R täytäntöönpanon IntegraMiR peräisin www.cis.jhu.edu/~goutsias/CSS%20lab/software.html.

Tulokset

Integrated miRNA /TF -välitteisen Regulatory Loop Prediction

kulkukaavio kuviossa 2 on yleinen kuvaus eri vaiheiden palveluksessa IntegraMiR. Viittaamme lukijan ”Materiaalit ja menetelmät” -osassa on lisätietoja kunkin vaiheen. Menettely käyttää mRNA ja miRNA ilmaisun saadut eturauhasessa kahdella eri biologiset olosuhteet (normaali vs. syöpä). Lisäksi se työllistää saatujen tulosten sekvenssi-pohjainen miRNA tavoite Ennustusalgoritmien ja sisältää purettuja tietoja neljästä tietokannoista saatavilla verkossa, nimittäin:

menetelmä määrittää biologinen roolit miRNA integroimalla viiden suuren tietolähteiden kanssa state-of the-art tilastollisia menetelmiä luotettavasti päätellä tietyntyyppisiin miRNA-kohde vuorovaikutusten yhteydessä sääntelyn silmukoita mRNA ja miRNA ekspressiotietojen.

-mSigDB (www.broadinstitute.org/gsea/msigdb ).

-miRTarBase (https://mirtarbase.mbc.nctu.edu.tw).

-TRANSFAC (www.gene-regulation.com/pub/databases.html).

-TransmiR (https://202.38.126.151/hmdd/mirna/tf).

Huomaa, että ENCODE julkaisi tiedot äskettäin TF sitoutumiskohtia perustuu chip seq kokeita 161 TF: iä 91 solulinjoissa (https://genome.ucsc.edu/ENCODE). Valitettavasti tämä tietokanta ei tarjoa säätötyyppiä (aktivointi tai tukahduttaminen) tietyn TF-kohde vuorovaikutus, tietoja, jotka on kriittinen lähestymistapamme. Tästä syystä, IntegraMiR käyttää Transfac. Kuitenkin, kun tieto on saatavilla kautta ENCODE tai muita TF-kohdetietokannassa, se voidaan helposti hyödyntää IntegraMiR.

Ensimmäinen askel IntegraMiR koskee standardin esikäsittely tekniikoita raaka ekspressiotietojen (kuten taustakorjauksen , normalisointi, ja data heterogeenisuus korjaus) tietojen laadun parantamiseksi, jonka jälkeen useat hypoteesin testaus (MHT) ja korvike muuttujan analyysin (SVA) tunnistaa mRNA: iden ja miRNA jotka ilmentyvät eri kahden biologisissa olosuhteissa, kun taas korjaamalla biologisen vaihtelevuuden takia molekyyli alatyypitys moninkertainen testaaminen ja erä vaikutuksia.

toinen vaihe toteutetaan ylimääräisiä tilastollisen analyysin avulla geeniperimä rikastus analyysi (GSEA) arvioitava edelleen biologista merkitystä tiettyjen mRNA: iden ja miRNA joita ei pidetä differentiaalisesti ilmaistaan MHT. Käyttämällä molekyylitasolla allekirjoitukset tietokantaan mSigDB selityksin varustetun geenin sarjaa käytettäväksi GSEA ja

kokeellisesti

todennettujen miRNA kohdetietokannassa miRTarBase, IntegraMiR rakentaa kolme erillistä ryhmää geenin sarjaa ja arvioi tilastollista merkitystä kunkin geeniperimä rikastettu vapauttamista käytettävissä olevien mRNA ekspressiotietojen. Ensimmäinen ryhmä koostuu geenin sarjaa mRNA data indeksoitu TF mRNA jota ei pidetä differentiaalisesti ilmaistaan ​​MHT ja määräytyy mSigDB suoraan säädellä kullekin geeniä asetettu. Toisen ryhmän muodostavat geenien setit mRNA data indeksoidaan miRNA joka ei katsotaan differentiaalisesti ilmaistaan ​​MHT ja määräytyy miRTarBase kohdistaa kullekin geeniä asetettu. Kolmas ryhmä koostuu geenin sarjaa mRNA data indeksoitu tietyllä Kegg signalointireitin [39], [40] sisältyvät mSigDB. Lopuksi, TF: t liittyi tilastollisesti merkitsevä rikastettua geenin sarjaa muutetaan luetteloa niistä mRNA: iden katsotaan differentiaalisesti ilmaistaan ​​MHT tuottamaan yhdistetty luettelo ilmentyvät eri mRNA: iden, ja sama on tehty miRNA. Meidän tulisi huomata tässä, että mSigDB käytetään laajasti saamiseksi geenin sarjat GSEA analyysiä. Toisaalta, käytämme MiRTarBase koska tämä tietokanta on kertynyt suhteellisen paljon kokeellisesti validoitu miRNA-kohde vuorovaikutuksia.

Lyhyesti, GSEA määrittää, onko tietty joukko geenejä osoittaa tilastollisesti merkitseviä yhtäpitävät erot kahden biologisen valtiot [41]. Tärkein syy IntegraMiR koskee GSEA jälkeen ensimmäisen hypoteesin testauksen vaihe on parantaa havaitseminen differentiaalisesti ilmaisi TF: ien ja miRNA, jotka voidaan jättää väliin, kun yksi ekspressiotasot näyttää vain kohtuullisia muutoksia näiden kahden välillä biologisissa olosuhteissa. Koska itse asiassa, jos useat selostukset tiedetään osallistua yhteiseen biologiseen mekanismi, sitten jopa kohtalainen muutoksia ekspressiotasot näiden transkriptien voi olla tilastollisesti merkitsevä johtuu siitä, että tunnetut biologiset väliset suhteet selostukset saattaa johtaa korkeampiin tilastotehoa havaitessaan pienet vaihtelut niiden ekspressiotasot verrattuna tapauksessa yhden selostukset. Lisäksi tiettyjen TF: ille, TF mRNA ilmaisu ei välttämättä voida käyttää apuna sen aktiivisuutta proteiini tasolle johtuen transkription jälkeisiin ja translaation jälkeiset modifikaatiot ien [42], [43]. Näiden ongelmien ratkaisemiseksi, IntegraMiR katsoo myös kollektiivinen ero geenien ilmentymistä, toisin kuin useat menettelyjä seuraa muuta siihen liittyvää toimintaa keskusteltu aiemmin, että pääasiassa rakentamaan analyysejä saatujen tilastojen yhden selostukset.

kolmas vaihe IntegraMiR käyttää saadut tulokset MHT ja GSEA sekä saatavilla biologista tietämystä ja sekvenssi-pohjainen miRNA tavoite ennusteet, tunnistaa tunnettuja

suoraan

säänneltyä tavoitteet differentiaalisesti ilmaisi TF: ien ja miRNA ja ennustetut tavoitteet miRNA. Käyttämällä eukaryoottien TF tietokantaan Transfac ja TF /miRNA sääntelyn tietokanta TransmiR, IntegraMiR tuottaa listan differentiaalisesti ilmaisi TF: istä ja niiden geenikohteet ja säätötyyppiä (aktivointi tai sortotoimien) kunkin kohdegeenin. Se tuottaa myös listan differentiaalisesti ilmaisi TF: istä ja niiden ilmentyvät eri miRNA tavoitteet ja säätötyyppiä kohde miRNA. Huomaa, että meidän valinta käyttämällä Transfac ja TransmiR perustuu siihen, että Transfac luotettavasti antaa tärkeää tietoa asetuksen tyyppi (aktivointi /tukahduttaminen) transkriptiotekijän ja sen kohdegeenin (t), kun taas TransmiR antaa ratkaisevaa tietoa microRNA (t) on säännelty sitä. Toisaalta, tunnistaa mRNA: n tavoitteiden ilmentyvät eri miRNA, IntegraMiR käytetään miRecords (https://mirecords.umn.edu/miRecords), integroitu sekvenssi-pohjainen miRNA tavoite ennustaminen työkalu, sekä miRTarBase, tietokanta kokeellisesti validoitu miRNA tavoitteita. Tässä vaiheessa IntegraMiR tuottaa listan differentiaalisesti ilmaisi miRNA vastaavaan sekvenssiin perustuva tavoite ennusteita, muutettu kokeellisesti validoitu mRNA tauluja miRTarBase auttaa tunnistamaan oikeiden positiivisten ja väärien negatiivisten ennusteita käyttämällä saatavilla biologista tietoa. Tässä suhteessa IntegraMiR sisältää

ennustava

moduuli (hyödyntäminen miRecords) ja

ei-ennustava moduuli

(miRTarBase) tämän tehtävän.

Neljäs vaihe IntegraMiR toteuttaa tekniikka, kuvattu ”Materiaalit ja menetelmät” -osiossa, rakentaa vapautetuilla silmukoita tyypeistä kuviossa 1 käyttäen saatuja tuloksia edelliset vaiheet. IntegraMiR rakentaa seuraavat kolme tyyppiä sääntelyn silmukoita:

(i) FFL käsittää miRNA joka samanaikaisesti on kohdistettu TF ja mRNA, joka on suoraan säätelee TF.

(ii) Lentotoiminnan FFL käsittää TF joka suoraan säätelee miRNA ja mRNA, joka on kohdistettu suoraan mukaan miRNA.

(iii) sääntelyn silmukka käsittää miRNA joka samanaikaisesti kohdistuu kaksi eri geeniä tietyllä Kegg polku, jonka proteiinit voisi potentiaalisesti vuorovaikutuksessa toistensa kanssa, joka perustuu reitin kartalla annetaan Kegg tietokantaan.

listalla rakennettu sääntely silmukat mitattuna niiden ”merkitystä” IntegraMiR soveltaa hypoteesin testaus menettely käyttämällä Fisherin menetelmällä [44] . Menettely työllistää Fisherin yhteenveto Testimuuttuja, antama Eq. (2) ”Materiaalit ja menetelmät” -osiossa, yhdistää MHT-lasketun

P

arvot kullekin solmulle silmukan yhdeksi

P

arvoa käytetään ranking sijoituksen koko silmukan. Tämä ei koske tyyppi III silmukoita, koska nämä silmukat sisältävät geenejä eikä erityisiä mRNA dokumenttinsa. Koska toiminnalliset roolit sääntelyn silmukat ovat erilaiset, IntegraMiR ryhmät näitä silmukoita viiteen eri luokkaan: Tyyppi I johdonmukaista, FFL, tyyppi I sekava FFL, tyypin II johdonmukainen FFL, tyypin II epäjohdonmukainen FFL, ja tyypin III silmukoita – katso kuvat 1 2. antaa lisää joustavuutta tulosten tulkintaan, IntegraMiR lajittelee tyypin II FFLs kahteen eri alaryhmään, tyypin II-A ja tyypin II-B, vaikka tämä ylimääräinen lajittelua ei ehkä ole tarpeen. Kussakin ryhmässä ja alaryhmä, IntegraMiR riveissä vapautuneilla silmukat lisäämällä tulokset, joissa pienempi tulokset vastaavat korkeampia ”merkitystä”, ja siinä keskitytään niihin silmukat löydetty voidaan vapautettu tavalla

yhdenmukainen

alla olevan reunan rakenne ja ekspressiotietojen, kuten sääntöjen määrittämään kuviossa 3 (katso myös ”Materiaalit ja menetelmät” -osassa). Lisäksi se merkitsee miRNA tavoitteita sen mukaan, onko nämä tavoitteet ennustaa menettelyä tai ovat kokeellisesti validoitu mukaan miRTarBase, tai molempia. Huomaa, että ”yhdenmukaisuus” viittaa siihen, että ilmaus kuviot solmut vapautetuilla silmukan ovat yhtä mieltä sen sääntely reunan rakenne. Esimerkiksi tyypin I johdonmukaista, FFL sanotaan johdonmukaisesti vapautettu, jos se käsittää voimistunut miRNA ja vaimentua TF ja mRNA, tai vaimentua miRNA ja voimistunut TF ja mRNA; katso kuva 3.

vapautettu silmukka katsotaan

johdonmukainen

jos ekspressiokuviota sen solmut ovat yhtä mieltä sen sääntely reunan rakenne. Jokainen vapautettu silmukka, joka ei täytä tätä ominaisuutta sanotaan olevan

epäjohdonmukainen

.

IntegraMiR Tunnistaa Laaja transkription, transkription jälkeistä ja signalointi vapauttaminen PCA

tutkia tehokkuutta IntegraMiR on rajattu miRNA-välitteinen sääntelyyn silmukoita, käytämme mRNA microarray ilmaisua saatuja tietoja 48 normaalin ja 47 eturauhassyövän kudosnäytteistä (NCBI GEO-tietokannan hakunumero GSE29079), sekä miRNA microarray ilmaisun saadut täsmäsi normaali ja syöpä- kudosnäytteitä, uutetaan 20 henkilöä (NCBI GEO-tietokannan hakunumero GSE23022). Lisätietoja tästä tieto, viittaamme lukijan ”Materiaalit ja menetelmät” -osassa. Kun tietoja esikäsittely, IntegraMiR sisältää Surrogate Variable Analysis (SVA) [36], sekä MHT, tunnistaa ilmentyvät eri geenien välillä kaksi ehtoa. On osoitettu, että SVA pidentää biologisen tarkkuutta ja toistettavuutta analyysien genominlaajuisten ilme tutkimuksissa [36], [37]. IntegraMiR työllistää SVA ottamaan huomioon biologiset variabilities johtuen molekyylien alatyyppeihin luokiteltuna tilan TMPRSS2-ERG-geenin fuusio, joka on tunnistettu noin puolet kaikista PCa tapauksissa ja on kriittinen varhainen tapahtuma kehittymistä ja etenemistä tämän taudin [ ,,,0],45] – [47].

IntegraMiR suorittaa ensin MHT käyttäen moderoitu t-tilaston [48], erikseen tunnistaa mRNA: iden ja miRNA jotka ilmentyvät eri välillä kasvain ja normaali näytteitä. Raportissa esitellään laaja transkription sääntelyn purkamista kasvain kudosnäytteistä: 7934 geenejä (out of 17324) todetaan ekspressoitua eri perustuu niiden tilastollisen merkittävyyden, 164 näistä geeneistä on yli-ilmentää kertamuutos tai tukahdutettu kertamuutos – katso taulukot S1 S2. Geeni lista tarjoamme taulukossa S2 sisältää tärkeitä geenejä, kuten Pressu, MYC, SNAI2 (SLUG), WIF1 ja ERG mm, mikä on aiemmin tunnettu PCa.

analyysi vastaavan miRNA ekspressiotietojen by MHT tulokset 18 (out of 847) ilmentyvät eri ihmisen miRNA, jota me luettelo taulukossa 1 (ensimmäinen 18 miRNA) – katso myös taulukko S3. Äskettäin syvä sekvensointi analyysi miRNA ekspressioprofiileja tunnistettu 33 miRNA olevan ilmennetty eri PCA, jossa miR-375, miR-200c, miR-143 ja miR-145 näytteille selvin purkamista [49]. Vertasimme IntegraMiR tuloksia ne saadaan syvä sekvensoinnilla. 18 miRNA tunnistaa IntegraMiR, 7 miRNA (miR-200c, miR-20a, miR-375, miR-106a, let-7a, miR-21, ja miR-106b) on vahvistettu voimistuvan syvä Sekvensointianalyysin , kun taas 2 miRNA (miR-221 ja miR-145) on vahvistettu vaimentua. Loput 9 miRNA tunnistetaan MHT ei havaittu syvä sekvensoinnilla.

aikana toisen vaiheen IntegraMiR soveltaminen GSEA geenien sarjaa TF tavoitteet saadaan mSigDB havaitsee 37 merkittävästi vapautettu TF: iä, jotka ovat ei havaitse alkuperäisen MHT vaihe perustuu yhden geenin analyysiin. Me luettelo näistä TF: iä taulukossa S4. Mielenkiintoista on, että useita näistä TF: ien (esim NKX3-1, SMAD1 /3, SRF, ETV4 ja ELK1) tiedetään tärkeitä rooleja PCa, samoin kuin muiden syöpien.

Samoin sovellus of GSEA geenien sarjaa kokeellisesti vahvistanut (syvä Sekvensointianalyysin) miRNA tavoitteet saatu miRTarBase tunnistaa 5 merkittävästi vaimentua miRNA, joita ei havaita MHT. Me luettelo näistä miRNA taulukossa 1 (viimeinen 5 miRNA). Molemmissa tapauksissa, ja jokaisen TF tai miRNA, GSEA suoritetaan perustuu saatavuuteen geenin setit tietoja.

Lopuksi soveltaminen GSEA yksilöidään 30 merkittävästi vapautettiin signalointireittien, joukossa 186 Kegg signalointipolkujen käytettävissä in mSigDB. Me luettelo tulokset taulukossa 2. Muiden väyliä, luettelo sisältää TGF ja Wnt signalointireittejä, jotka ovat sekaantuneet PCa aloittamista ja etenemistä. Luonnollisesti tulokset kuuluvat myös Eturauhassyöpä ja vyöliitos polkuja. Viimeinen polku säätelee solujen välistä adheesiota, jolla on tärkeä rooli epiteelin-to-mesenkymaalitransitioon (EMT), pidetään tärkeänä askeleena kasvainprogression [50], [51].

Vastaa