PLoS ONE: järjestelmällinen tunnistaminen Core -transkriptiotekijät välittävä säädeltyyn Linkit Bridging tulehduksellisten suolistosairauksien ja peräsuolen syövän
tiivistelmä
Kertyvät näyttöä tiukka yhteys tulehduksen ja syövän. Kuitenkin kattava tunnistaminen keskeinen transkriptiotekijöiden (eli ydin TF: t) välittämisessä säädeltyyn linkit edelleen haastava, lähinnä puute näytteitä, jotka voidaan tehokkaasti heijastaa yhteyksiä tulehduksen ja kasvaimen kehittymisen. Täällä rakensimme sarjan TF välittämän säätelyverkkojen suuresta kokoelman ilmentymisen profilointi normaalien paksusuolen kudoksiin, tulehduksellinen suolistosairaus (IBDs) ja peräsuolen syöpä (CRC), joka sisältää 1201 näytteitä yhteensä, ja sitten ehdotti verkko- lähestymistapa luonnehtia mahdollisia yhteyksiä kuroa tulehdus ja syöpään. Tätä tarkoitusta varten olemme lasketaan huomattavasti säädeltyyn suhteita tulehdusta ja niiden liittyvät syövän verkkoja, ja sitten 24 ydin-TF: iä ja niiden väärin säädellystä geenit tunnistettiin. Yhdessä lähestymistapamme tarjoaa meille varsin tärkeä käsityksen tulehdukseen liittyvä tuumorigeneesiä kolorektaalisyövässä, jota voitaisiin soveltaa myös tunnistaa toiminnallisesti säädeltyyn suhteiden välittäjänä yhteyksiä muihin eri sairauksien fenotyyppejä.
Citation: Xiao Y, Fan H, Zhang Y, Xing W, Ping Y, Zhao H, et al. (2013) järjestelmällinen tunnistaminen Core -transkriptiotekijät välittävä säädeltyyn Linkit Bridging tulehduksellisten suolistosairauksien ja peräsuolen syövän. PLoS ONE 8 (12): e83495. doi: 10,1371 /journal.pone.0083495
Editor: Paolo Provero, University of Torino, Italia
vastaanotettu: 09 heinäkuu 2013; Hyväksytty 4 marraskuuta 2013 Julkaistu: 26 joulukuu 2013
Copyright: © 2013 Xiao et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä työ tuettiin osittain Creative Research ryhmät National Natural Science Foundation of China (lupanumeroita 81121003, 91129710, 91029717, 91229112 ja 31200997), Specialized Research Fund tohtorikoulutuskeskukseen of Higher Education of China (lupanumeroon 20102307110022), Science Foundation of Heilongjiangin maakunnassa (lupanumeroita D200834 ja C201207) ja tiedesäätiö Heilongjiangin maakunnassa opetusviraston (lupanumeroon YJSCX2012-230HLJ). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
välinen tiivis yhteys tulehduksen ja syövän suolistossa on arvostettu vuosisatojen perustuttava kliinisiin havaintoihin [1], [2]. Tulehdukselliset suolistosairaudet (IBDs), joka sisältää haavaisen koliitin (UC) ja Crohnin tauti (CD), altistaa potilaat kehittämiseen peräsuolen syöpä (CRC) [3], joka on yksi yleisimmistä ja kuolemaan johtavia syöpiä maailmanlaajuisesti. Vaikka The ’adenooma-karsinooma ”sekvenssi on ollut pitkään keskeinen merkitys tutkimuksia CRC, muutos painopistettä sekvenssin” tulehduksen-dysplasia-syöpä ”on havaittu [4]. Yksi mahdollinen selitys [5], [6] Voi olla, että tulehdus, joka nopeuttaa hankinta syövän tunnusmerkkejä taustalla loukkaantunut paksusuolen kudoksiin, voisi edistää kasvaimia synnyttäviä etenemistä. Kuitenkin tulkinta on tiivis yhteys sillan tulehdusta ja syöpä suolistossa on edelleen haastava.
Suurikapasiteettinen teknologiat ovat suuresti edistänyt tuotannon valtavia määriä monikerroksisia biologisia tietoja, esimerkiksi geenien ilmentymisen mikrosirujen [7] [8]; nämä tiedot ovat käytetään laajasti luonnehtia molekyylien väliset erot normaaleissa ja pahanlaatuisten solujen [9], [10], tai molekyylitason assosiaatioita erillisten sairauksien fenotyypit [11], esimerkiksi tulehdus ja syöpään. Nämä ilmaisu perustuvat tutkimukset onnistuneesti tunnistettu yksittäisten geenien fenotyyppisen luonnehdinta, kun se on vielä vaikea päätellä mitään yksityiskohtia suhteita näiden molekyylien taustalla oncogenesis. Siksi on järkevää tunnistaa suhteita muuttaa tai väärin säädellystä klo kautta tai verkon tasolla.
Suuri osa solun vastaus sisäisiä tai ulkoisia ärsykkeitä säännellään maailmanlaajuisen sääntelyn verkosto enimmäkseen transkription tasolla [12] . Yhtenä tärkeimmistä sääntelyviranomaisten nisäkkään solu yhteydessä, transkriptiotekijät (TF: t) edistää merkittävästi useiden patologisten prosessien. Greten et ai. [13] osoitti, että määritetty komponentti transkriptiotekijän
NF-KB
liittyy tulehdusta ja tuumorigeneesiä UC liittyvien CRC käyttäen hiirimallissa, jossa hiirillä. Äskettäinen työ [14] sekaantunut transkriptiotekijä
STST3
solujen eloonjäämisen ja solusyklin etenemisen koliitin liittyvien kasvaimien syntyyn. Kuitenkaan mitään systemaattisia tutkimuksia ien mukana linkin suolistossa on raportoitu. Kääntäminen genominlaajuisten ilmaisun tiedot verkkoon tieto on välttämätöntä edelleen laajamittaista analyysiä, joka vaatii laskennallisia työkaluja, kuten -parin tai tieto-theoretic liittyvien lähestymistapoja [15]. Viimeksi geeni verkot tyypillisesti rakennettu geenien ilmentyminen dataa laskennallisen analyysin. Ensimmäinen laajamittainen analyysi microarray -parin tavoitteena oli lisätä päättely vakautta geenin toimintojen [16]. Sen jälkeen, Choi et ai. [17] verrattuna kasvaimen ja normaali -parin verkko rakennetaan 13 erillistä syöpään fenotyyppejä, ja sitten tunnistaa ero -parin suhteita toiminnallisia muutoksia. Lisäksi tutkimuksia näistä muuttunut suhteita, liittyy polkuja tai aliverkot tunnistetaan myös kautta integroidun verkon lähestymistapoja. Siinä tapauksessa, glioblastooma (GBM), Cerami et ai. [18] vahvistettiin, että toiminnallinen GBM muutokset tehdään usein sisällä erityisiä moduuleja, ja siksi he yrittivät tunnistaa GBM liittyviä keskeisiä reittejä automatisoidulla verkostoanalyysiä. Samanaikaisesti toiminnallinen aliverkot kolorektaalisyövässä tunnustettiin Nibbe et al. [19] käyttäen random walk algoritmi. Epäilemättä nämä menetelmät ovat käyttökelpoisia tunnistamisessa liittyvien molekyylitason mekanismit yksittäisten sairaus. Kuitenkin tutkimukset sairausfenotyyppi vastauksena molekyylien häiriöiden [20] tai molekyylien assosiaatioita erillisten sairauksien fenotyypit ovat vielä alkuvaiheessa. Abdollahi et ai. [21] osoitti, että siirtyminen angiogeenisten tasapaino on angiogeneesiä fenotyyppi säätelee maailmanlaajuinen transkription circuitries haimasyövän vastauksena keskeisten endogeenisten proteiinien, joka perustuu sääntelyn verkossa. Toinen tutkimus erillisiä vaiheita maksasyöpä päätökseen He et al. [22] havainnut mahdollisia molekyyliprosessien soveltamalla verkon lähestymistapa yhdistettynä transkription säätelyyn.
Tässä työssä me omaksua yhtenäinen laskennallinen lähestymistapa (kuva 1, katso myös kuva S1 vuokaavio laskennallisen vaiheiden ) rekonstruoimaan säätelyverkkoja normaalia, IBDs ja CRC suuresta kooste geeniekspressioprofilointi erottuva ilme malleja tulehduksen ja syövän geenien (kutsutaan IC-erityisverkkojen), käyttäen aukikoodauksen algoritmia. Verkko-pohjainen klusterointi levitetään sitten luonnehtimaan mahdollisen vihjeen yhdistää IBDs ja liittyvän CRC verkostoja, joka auttaa meitä erottaa tulehduksellinen verkkojen tuumorigeenisiä potentiaaleja. Verkon vertailu analyysi, säädeltyyn suhteet lasketaan merkittäviä voitto tai tappio välistä tietojenvaihtoa tulehdus ja syöpään verkko, ja sitten säädeltyyn verkkoa rakennetaan. Perustuen säädeltyyn kuvio analyysi, lopulta tunnistaa 24 kääntyvä TF: iä (ts ydin TF: t), yhdessä niiden väärin säädellystä geenien kiinnostaviin ehdokkaita biologien; tämä varmasti laajentaa ja täydentää nykyistä tietämystä tulehdukseen liittyvien kasvainten synnyssä kolorektaalisyövässä.
Menettely on pääosin jaettu neljään vaiheeseen: 1) jälleenrakentaminen IC sääntelyyn verkkojen suuri kooste microarray data; 2) klusterointi IC sääntelyyn käyttävien verkkojen verkko TOM, jonka jälkeen verkko häiriöiden; 3) rakentaminen säädeltyyn verkon reunat väärin säädellystä välillä tulehdusta ja niiden yhdistetty syöpään verkko perustuu verkon vertailuja; 4) tunnistaminen ydin TF: ien kautta säädeltyyn kuvio analyysi. TF, transkriptiotekijä; Ig, tulehdus geeni; Cg, peräsuolen syövän geeni; MI, keskinäinen tietoa.
Materiaalit ja menetelmät
Data Sources
keräsimme 13 IBDs ja CRC liittyvien geenien ilmentyminen tietojen keräämisessä Gene Expression Omnibus (GEO) (taulukko S1). Niiden vastaavat käsitellyt sarja matriisi tiedostoja käytettiin syötetyn datan uudelleen rakentamiseksi geenin vuorovaikutusta verkoissa. Taustakorjaus ja tietojen normalisointi kunkin ilmaisun datasarjan jo suoritettu, erikseen. Koetinsarjojen kartoitettu vailla tai useampia ihmisen Gene tunnuksia poistettiin. Expression arvot log2 muuttunut. Kunkin datajoukko, poimimamme näytteitä olosuhteissa UC, CD, CRC, ja normaali, mikä johti 22 ilme tietokokonaisuuksien.
Saimme 231 tulehdukseen liittyviä geenejä päässä Gene ontologia luokat ”tulehdusreaktio” (GO: 0006954) ja ”sääntely tulehdusvasteen” (GO: 0050727), jotka sitten kutsutaan tulehdus geeniperimä. Kolorektaalisyöpä geeniperimä (syöpä geeniperimä), joka sisälsi 196 geenit, manuaalisesti syntyvät Mendelian Inheritance in Man tietokantaan (OMIM) etsimällä eri avainsanoilla ( ”peräsuolen syöpä” TAI ”kolorektaalisyöpää” TAI ”peräsuolen kasvain” ). Nämä kaksi geeniä sarjaa sitten tarkoitettu niin IC-geenin sarjaa. Sitä paitsi, TF asettaa viitataan 344 ainutlaatuista TF: ille on ladattu TRANSFAC® Professional 11.4.
Reconstructing IC-spesifinen Regulatory Networks
Ensimmäinen, K: n keskiarvon klusterointialgoritmi [23] sovellettiin IBD ja CRC liittyvät ilme tietojoukkoja ilmentymiskuviot geenien sekä tulehduksen ja syövän geeni sarjaa, tunnistaa ilmaisu-homogeeninen näyte ryhmiä, jotka sitten kutsutaan IC-spesifinen aineistoja. Kunkin UC, CD, ja CRC liittyvistä tiedoista yli 100 näytettä, me ryhmitelty näytteet neljään klustereita käyttäen K-means klusterointi. Ne, joilla on vähemmän kuin 100 näytettä jaettiin kahteen klustereita. Osa-jakautunut ilmentymisen profilointi tai IC-erityinen ilmaisu aineistoja, sisältää normaalit tietomäärien altistaa clustering hoitoon, syntyi. Sitten, joilla on alle 20 näytettä jätettiin pois lisätutkimusta, ottaen huomioon tarkkuuden lähestymistavan rakentamiseen säätelyverkkoja [24]. Tietojoukot ole poissuljettu käytettiin jälleenrakentamiseen IC sääntelyyn verkoissa.
ARACNe (algoritmi jälleenrakennuksen Tarkka Cellular Networks) [25], joka perustuu tiedon teoreettista lähestymistapaa ja tietojenkäsittely eriarvoisuus (DPI) kontrolli, tarjoaa tavan päätellä säätelyverkkojen suoraan geenien ilmentyminen tietoja. Vuorovaikutukset TF: t ja geenit tunnistettiin laskemalla keskinäinen tiedotus (MI) arvioi Gaussin ydin menetelmää, jossa on määritetty
p
arvo raja, jotka sitten karsineet mukaan DPI analyysi perustuu toleranssi parametri. Perustuen TF asettaa johdettu Transfac, käytimme ARACNe ohjelmaa rekonstruoida yksi sääntelyverkon välillä TF: ien ja kaikkien geenien havaitsemat mikrosirulla seulonta kustakin IC-ekspressiota tietokokonaisuus itsenäisesti, jossa on
p
arvo sulku 0,001 ja tiukan sulku on DPI toleranssilla 0%. Sitten uutettu IC ja TF geenit rakennettiin sääntelyverkon, joita kutsutaan kuten IC-sääntelyyn verkkoon.
Klusterointi IC-erityisiä Regulatory Networks
muokattu versio topologinen päällekkäisyys toimenpiteen ( TOM) [26], [27] nimeltään verkko TOM ehdotettiin laskea samankaltaisuutta sääntelyn kiinteistöjen kaikille yhteistä TF: ille kunkin kahden säätelyverkkojen, suoritettaessa klusterointi IC-erityisverkostojen. Koska kaksi säätelyverkkojen, anna ja on määrä naapureiden yleinen ja vastaavasti. Useita yhteisiä naapurit edusti, ja niin voisimme määritellä mitään yhteistä alla:
Lopuksi oli summataan verkkoon verkkojen välillä ja sitten jaettuna suurimman verkon TOM kaikkia mahdollisia pareittain verkot, jota sitten käytettiin tiettyä samankaltaisuutta kahden verkon välillä.
Seuraavaksi verkko permutaatioiden sovellettiin niitä IC-erityisverkostojen ja sitten uusia klusterointi tulokset saatiin aikaan kautta toistuvasti poistamalla yksi verkko pois koko käytetyt verkot verkon klusterointia ja sitten kaksi verkkoa ulos, käyttäen samaa samankaltaisuus toimenpide.
Computing säädeltyyn Ihmissuhteet
Määrittelemme sääntely- suhdetta ja on väärin säädellystä välillä tulehdusta ja syövän verkon, jos ja vain, jos MI ero suhdetta IBD ja CRC-verkoissa on tilastollisesti merkitsevä verrattuna satunnainen jakauma.
Koska parin IBD ja CRC-verkot, yhdistimme nämä vierekkäisten naapuriensa kunkin yhteisen yksittäisten verkkoon ja sitten lasketaan MI erotuksen kunkin suhde kaikkien yhteisten TF: istä. MI ero ja laskettiin kuten alla: missä ja edustaa MI välillä sekä CRC ja IBD verkkoja, tässä järjestyksessä. Kaikki MI arvot laskettiin pois ARACNe ohjelmasta. Lopuksi syntyy kaikki MI erot kaikki suhteet kaikkien yhteisten TF: istä kahden verkon välillä. Tunnistaa säädeltyyn suhteita, permutaatio testejä tehtiin 100 kertaa sekä IBD ja CRC-ilmaisun aineistoja, mikä johtaa 100 paria satunnainen verkkojen laskettu vastaavasta pari satunnaisten aineistoja. Olemme toistuvasti laskenut MI erotuksen kunkin suhde kunkin parin avulla satunnainen IBD ja CRC verkkojen edellä saadut ja sitten yhdisti kaikki MI erot osaksi satunnaista jakautumista. Väärä löytö määrä (FDR)
p
arvo 0,05 käytettiin merkitys sulku. Ne säädeltyyn suhteita visualisoitiin käyttäen Cytoscape ohjelmistojen [28]. Suurin kytketty komponentti uutettiin lisäanalyysiä.
tunnistaminen Core -transkriptiotekijät
TF määritellään olevan keskeinen säädin on säädeltyyn verkoston rakennettu ulos säädeltyyn suhteita IBD ja CRC verkkoja, asteen perusteella jakelu TF ja koostumus suhteet sen suoraan kytketty tulehdus ja syöpään geenejä. Kuten koostumuksen suhde kunkin TF, me laskettu suhde määrää viereisiä tulehduksen geenien sen verran, ja suhde määrää viereisiä syövän geenien sen asteen.
Tulokset
jälleenrakennus IC-erityisiä Normal, IBD, ja CRC Regulatory Networks
Keräsimme kaksitoista geenien ilmentyminen tietojen keräämisessä GEO tietokannasta (taulukko S1). Näistä tietojen poimimamme 22 erilaista normaalia, UC, CD, ja CRC ilme tiedot (normaali: 7; UC: 6; CD: 3, CRC: 6) viitaten 1201 näytteitä yhteensä. Ensinnäkin, tuottaa suhteellisen homogeenisia näytteitä, olemme soveltaneet K-means klusterointi algoritmia 22 lauseke aineistoja perustuu erilaisia ekspressiomalleja 196 syövän ja 231 tulehdus geenejä. Tämä johti 14 UC, 6 CD, ja 16 CRC osajoukkoja, joita kutsutaan IC-erityinen. Muut 7 normaali datan joukkoja, joita ei alistettiin K-means klusterointi analyysi, uskotaan homogeeninen ja myös tarkempaa analysointia varten. Lopuksi kaksikymmentäyksi IC-ekspressiota aineistoja jäivät, kuten 5 UC, 2 CD, 11 CRC, ja 3 normaali, jossa on vähintään 20 näytettä kutakin.
Sitten me rekonstruoitu 21 IC-specific säätelyverkkojen vastaavasta IC-ekspressiota aineistoja käyttäen ARACNe ohjelma, jossa P-arvon ja DPI toleranssi kuvatulla Materiaalit ja menetelmät. ARACNe, kuten aukikoodauksen algoritmi, on laajalti käytetty rekonstruoimaan geenin vuorovaikutusta verkkojen nisäkkäiden solujen yhteydessä. Kuten verrataan muiden algoritmien samassa perheessä, ARACNe algoritmi katsotaan hyvä suorituskyky käsiteltäessä vakaan tilan data (ei aika-sarja) ja on edelleen maksamatta, kun muutamat kokeet ovat saatavilla, verrattuna määrä geenejä [29] , [30], [31]. Päätellä verkot sisälsi TF: ien ja kaikki niiden mahdollisesti kytketty geenejä. Tutkia tarkemmin niille taustalla keskeinen tekijät välittyvät säädeltyyn yhteyksiä, TF: t ja niiden suoraan kytketty IC geenit poimittiin, ja sitten maksimaalinen yhdistetty komponentti kullekin IC-erityinen verkosto käytettiin seuraava analyysi (kuva S2).
Kuva 2 luetellaan verkon topologinen parametrit 21 IC-erityisiä muun muassa verkoston halkaisija, verkon tiheyden, merkitse solmu läheisyys, merkitse solmu lyhin polkuja, betweenness, ja aste. Verkko perustuslait, eli määrä TF, tulehdus geenit ja syövän geenit, jotka vastaavat kutakin verkon ovat myös saatavilla. Huomaamme, että solmut koostuvat vastaavasti keskuudessa verkoissa. Ien lukumäärä, tulehduksen tai syövän geenien kukin verkko osoittaa pieniä muutoksia, jotka vaihtelevat 288-339, 212-225, ja 170-174, vastaavasti. Lisäksi, vastaavat numerot solmun perustuslakien yhteisiä TF: ille, tulehdusta tai syöpää geenien kunkin kahden IC-spesifinen verkot ovat myös yhdensuuntaisia toistensa kanssa (yksityiskohtia kuviossa S3). Tietyt topologinen parametrit osoittavat selvää diskordansseja keskuudessa normaali, tulehdus tai syöpä säätelyverkkojen. Esimerkiksi tarkoita solmu (vain TF: t) ja reuna (kaikki reunat) betweenness osoittavat suuria eroja keskenään jopa kesken syöpää verkon itse. Vaikka keskimääräinen solmun (vain TF: t) läheisyyttä ja lyhimmän polun maltillista erot, kun tulehdus ja syöpään verkkoja verrataan.
vastaavat luvut ien, tulehduksen ja syövän geenit luetellaan kolme ensimmäistä saraketta. Verkko halkaisija, verkon tiheyden, merkitse solmu läheisyys (vain TF: t), keskimääräinen solmun lyhimmän polun (vain TF: t), ja keskimääräinen betweenness solmuja (vain TF: t) ja reunojen (kaikki reunat) sisältyvät myös seuraavat kuusi saraketta. Ensimmäisen yhdeksän saraketta, kussakin on mukana histogrammin ulkopuolella ensimmäinen rivi, jossa korkeus kunkin palkki, joka osoittaa määrä jokaisessa solussa vastaavan sarakkeen. Aste jakelu vain TF: iä kussakin verkossa palvelee histogrammit viimeisessä sarakkeessa. Kolme mustaa alas-nuolet kussakin histogrammin luokiteltava kaikki tangot neljään ryhmään, jotka edustavat syöpä, CD, normaali, ja UC verkkoja, tässä järjestyksessä. InGene, tulehdus geeni; CaGene, syöpä-geeni; #, Määrä, NodeCn, solmu läheisyyttä; NodeSp, solmu lyhimmän polun; NodeBt, solmu betweenness; EdgeBt, reuna betweenness.
Mahdolliset Clue linkittäminen IBDs ja Associated CRC
Verkko TOM käytetään arvioimaan sääntelyn samankaltaisuus yhteisen TF: ien kunkin kahden eri verkoissa. Sitten käytetään verkon samankaltaisuus toimenpide klusterin 21 IC-sääntelyyn verkoissa. Kuten ryhmittämisen tulos, normaali, tulehdus tai syöpä verkoissa yleensä suurin samankaltaisuus omilla luokkiin, kuten haara kahdeksan tiukasti ryhmittyneet syöpä verkkojen kuvassa 3 (vasen punainen katkoviiva). Täsmälleen, läheisen haara viisi tulehdusta (kuten CD ja UC), ja kaksi normaalia verkot ovat myös tiiviisti ryhmitelty vastaavasti. Nämä verkostot odotetaan tuottavan eniten tiiviisti sääntelyn kuvioita ien muodostavat kolme suurta edustaja oksat normaalia, tulehdus, ja syöpä (oikealta vasemmalle, merkitty vastaava väri varjo kuvassa 3). Jokainen haara tarkoittaa, että nämä verkot ovat paljon rinnakkaisia toisiinsa sääntelymekanismeja (tai sääntelyyn kuvioita) kuin tarkoin muista oksat. Intuitionistically, kaksi normaalia verkot ovat ryhmittyneet sisällä haara tulehdus verkkoja, jota kutsutaan normaalia haara; niiden huomattavasti pienempi etäisyys on todella hyvä edustus korkean suorituskyvyn meidän ehdotetun verkoston TOM. Ei ole yllättävää, ne tiukasti ryhmitelty tulehdus tai syöpä verkkoja syntyy suhteellisen suurempi etäisyys johtuvat pääasiassa sairauden heterogeenisuus [32].
Verkko TOM käytettiin samankaltaisuutta mittana hierarkkinen klusterointi. Kolme edustavaa oksat on merkitty eri väriä varjo. Ca, syöpä verkko; UC ja CD, tulehdus verkot; Normaali, normaali verkko; Ca.GSE25070_24.network, syöpä verkko päätellä GSE25070 data asetettu 24 näytettä jälkeen alistamalla K-means klusterointialgoritmi.
Mielenkiintoista, kaksi UC verkot eli UC.GSE3629_22.network ja UC.GSE3629_31.network, ovat ryhmittyneet tiukasti yhdessä yhden CRC verkkoon, eli Ca.GSE13294_42.network, oikeanpuoleisessa haaran (kuvio 3, oikealla punainen katkoviiva). Mikäli järjestelmällistä melu, yritimme arvioida toistumisen tarkka haaran satunnaisesti poistamalla yksi verkko ulos ja suorita sitten ryhmittely jäljellä verkoissa. Vaikka häiriöt verkkojen käytettävien klusterointi voi aiheuttaa muutoksia lopullisiin tuloksiin, on rohkaisevaa nähdä, että kaksi UC verkot ovat aina ryhmittyneet samalla CRC verkkoon (kuva 4). Johdonmukaisesti, tulokset satunnaisesti poistamiseksi kaksi verkkoa ulos osoittavat myös, että tarkka haara toistuu eniten taajuus. Lisäksi, kuten tukemana kirjallisuudesta, potilailla, joilla on UC ovat alttiimpia koliitti liittyviä syöpiä (CAC), kuten CRC [33], ja CRC on merkittävä uhka pitkäaikainen UC potilaista [34], mikä osaltaan tukee mahdolliset yhteydet epäsuorasti sivuliikkeen. Meillä on siis selvää, että on olemassa joitakin samankaltaisia sääntelymekanismeja välinen tulehdus ja syöpään sääntelyverkon, joka myös ehdottaa mahdollisia toiminnallisen yhteyden UC ja CRC. Samaan aikaan, yksi normaali verkko (Normal.GSE8671_32.network) näytti myös yllättäen ryhmittyneet saman haaran vieressä syövän verkkoon. Yksi mahdollinen selitys voisi olla, että normaali verkko johdettu histologiseen normaalista paksusuolen kudoksiin on jo toteutettu kehittynyt molekyyliprosessien tulehduksen ja /tai syövän alle normaalin esitys (kuva S4).
Poistimme yhden verkon ulos ja sitten tuotettu uusia klusterointi, toistuvasti, tutkia nämä pankit luotu käyttämällä kaikkia verkkoja uusiutunut tai ei. (Nimet poistettiin verkkojen on lueteltu ensimmäisessä sarakkeessa. Numero 1 kuhunkin soluun sarakkeesta viisikymmentäkahdeksan yli viisi välineet toistuvia, kun taas numero 0 tarkoittaa ei.). Oksat luokitellaan CaBranch1, CaBranch2, InBranch, NorBranch, ICBranch ja NewBranch manuaalisesti uutetaan hierarkkinen klusterointi käyttäen kaikissa verkoissa. CaBranch1, sisältää täsmälleen kaksi verkostoja Ca.GSE25070_24.network ja Ca.GSE3629_67.network. CaBranch2, sisältää syöpää verkot ryhmittyneet läheisesti toisiinsa. InBranch sisältää tulehdusta verkoissa. NorBranch, on täsmälleen kaksi normaalia verkostoja Normal.GSE11223_63.network ja Normal.GSE20881_67.network. ICBranch, sisältää täsmälleen neljä verkostojen UC.GSE3629_22.network, UC.GSE3629_31.network, Ca.GSE13294_42.network ja Normal.GSE8671_32.network. NewBranch esitettiin oikealla puolella, vain ja ainoastaan, jos ICBranch puuttui. UC verkot ICBranch on alleviivattu punaisella viivalla NewBranch.
säädeltyyn väliset suhteet UC ja niiden Linked CRC
Klusterointi IC sääntelyyn verkot perustuvat verkon TOM auttaa meitä hahmotella mahdollisen vihjeen yhdistää UC ja liittyy CRC, jossa haaran (kuvio 3, oikealla punainen katkoviiva) tarjoaa meille varsin lupaavia ehdokkaita. Tulkita väärin säädeltyyn yhteyksiä, suhteita merkittävä voitto tai tappio MI välillä UC ja CRC verkostoja tunnistettiin. Yhdistelmälle UC.GSE3629_22.network ja Ca.GSE13294_42.network, me ensin yhdistetty suoraan naapureiden yhteisen TF: ien ja sitten lasketaan MI ero kunkin suhdetta. Toiseksi, 100 random IC-ekspressiota aineistoja kummankin ilmentymisen aineistoja, joita käytettiin rekonstruoimiseksi vastaavat säätelyverkkojen, luotiin. Jokaisesta 100 parin satunnainen ilmaisun aineistoja, me toistuvasti lasketaan MI eroja näiden suhteiden lasketaan yllä jälkeen palautuksessa vastaava satunnainen säätelyverkkojen käyttäen ARACNe ohjelman oletusparametrit, ja sitten muodostaa satunnaista jakautumista MI eroja. Verrattuna satunnaista jakautumista, voisimme määritellä merkitystä kunkin suhdetta jota FDR p-arvo 0,05. Ne suhteet merkittävä voitto tai tappio MI pidettiin väärin säädellystä. Sitten muodostimme 3394 säädeltyyn suhteita yhdistelmästä, kun taas 2898 muodostettiin toinen yhdistelmästä UC.GSE3629_31.network ja Ca.GSE13294_42.network. Lopuksi uutettu 1052 suhteita, jotka määriteltiin väärin säädellystä samanaikaisesti sekä yhdistelmä, rakentaa säädeltyyn verkkoon.
Verkko, joka sisältää 625 solmut 285 TF: ien ja 200 tulehdus ja 162 syöpä geenit, on tavoitteena esitys 1052 säädeltyyn suhteita TF: ien ja IC geenejä. Avain verkon topologinen parametrit (kuva S5) osoittaa, että se on mittakaavasta ja pienen maailman biologinen verkkoon.
Core transkriptiotekijät välittävät säädeltyyn Linkit
Transkriptiotekijän välittämää säätelyverkkojen toimia päätöksentekojärjestelmä järjestelmän sisällä nisäkkään soluissa [35]. Siksi perustuu säädeltyyn verkon rakennettu, voisimme tunnistaa ydin-TF: toimivaa kautta säädellään viereisen väärin säädellystä geenien kuroa UC ja liittyvän CRC. Tutkittuaan aste jakautuminen kaikkien TF: iä verkossa, me kynnys TF verran peräti 8 olla topologisesti tärkeitä. Ja sitten, pyysimme koostumus suhde vierekkäisten tulehduksen ja syövän geenien kaikki TF: istä. Kuten, TF: t voidaan luokitella kolmeen ryhmään: syöpää TF: iä enimmäkseen viereisten syöpä geenit; tulehduksellinen TF: t enimmäkseen viereisten tulehdus geenejä; IC-erityisiä TF: t sekä viereisen tulehdusta ja syöpä geenit. Jotta voidaan tunnistaa näiden mahdollisesti mukana ydin-TF: iä säätelemällä ei vain tulehdukseen geenejä, mutta myös syövän geenit, koostumuksen suhde (mukaan lukien sekä lukumäärän suhde vierekkäisten tulehdusta, ja suhde määrää viereisiä syöpägeenejä) on asetettu kello vähintään 0,1. Hyväksi sääntöjemme, 24 ydin TF: t ovat sen perusteella, näitä rajoituksia, kun otetaan huomioon sekä asteen rajoitteen ja osatekijän suhde niiden viereisten tulehduksen ja syövän geenien. Uhkaamilla säännellään vain tulehduksen tai syövän geenien ja alhaisempi; suhteellinen vähäinen vaikutus koko verkon rakennetta ei ollut mukana. Säädeltyyn sub-verkon (runkoverkon) rakennetaan sitten pois 24 ytimen TF: ien kanssa suorassa yhteydessä geeneistä (kuvio 5). Ydin TF luettelo sisältää
STAT3
,
GFI1
,
NFATC1
,
TCF7L2
,
ETS1
,
CEBPG
,
XBP1
,
RUNX3
,
Smad7
,
Smad2
,
POU2F2
,
FOXC1
TCF4
,
PBX1
,
HOXA4
,
SOX10
,
SREBF1
,
NFYB
,
FOXO1
,
PRDM1
,
ZNF589
,
BACH2
,
POU5F1B
, ja
TFF3
. Jotkut ydin TF: t eli
TCF7L2
ja
FOXO1
ovat tärkeitä, jotka ovat myös suunnattu varten geneettisiä mutaatioita [36] (kuva 5).
alaverkkoa valmistettu 24 core TF: t ja niiden väärin säädellystä IC geenejä. Useita yhteisvaikutuksia on vahvistettu muiden tutkimusten perusteella. Esimerkiksi vuorovaikutukset NFATC1 ja IL6 sekä STAT3 ja AKT1, jotka on vahvistettu biologisia kokeita, havainnollistetaan kahden asetettu romuttuneet suorakulmion ja tarjotaan yksityiskohtaisia tietoja siitä, miten se toimii. Core TF: iä on korostettu punaisella isompia. Geenit, joilla on geneettisiä variaatioita tarjoamiin March et al. on merkitty pieni viisisakarainen tähti.
Tietyt ydin TF: iä yhdessä niiden säädeltyyn suhteet ovat yleisesti tunnettuja, jossa korostetaan sääntelyn ydin TF: iä kaventavat tulehdusta ja syöpä suolistossa. Esimerkkinä on
NFATC1
yhdessä sen säädeltyyn geenin
IL6
[37]. Varhainen aktivointi
IL6
on tarpeen pahanlaatuisiin normaalien solujen hiiren solulinjassa malli [38]. Useimmat tutkimukset T-soluissa, osoittaa, että vapautuminen IL6 riippuu aktivoinnista
NFATC1
[39], joka on myös liitetty immuunivasteen useita erilaisia soluja, jotka vastaavat suolen vahinkoa. Toinen hyvin raportoitu tekijä
STST3
[40] aktivoidaan kautta fosforylaation tavalla, joka IL6 sitoutuu sen reseptoriin. IL6 saattavat antaa transkriptio
STAT3
, ja sitten suorittaa sen antiapoptooppinen ja pro-tuumorigeeniset vaikutuksia kautta
STST3
ja sen loppupään tavoitteet kuten
AKT1
[41].
AKT1
[42], [43] on välttämätön säätelyssä nisäkkäiden solujen lisääntymisen ja eloonjäämisen. Lisäksi sääntely niiden välinen suhde on jo vahvistettu Iliopoulos et al. [44]; tämä suhde välittyy miR-21 ja sen kohdegeenin
PTEN
.
STAT3
voi aiheuttaa tuumorigeenisyyden transformoitujen solujen ja myöhemmin aktivoitumisen
NF-KB: n
[45], joka on toinen tapa aktivoida
IL6
[46].
keskustelu
Syöpätutkimus [47], [48] on luotu käsitteellinen kehys, joka on hyödyllistä ymmärtää monimutkaisia ja dynaamisia muutoksia syövän biologian. Suurin luettelo syövän fenotyyppien ja genotyyppien on täynnä ilmentymä kuusi yleisiä tunnusmerkkejä (tai piirteistä) luetella Hanahan et al., Yhdessä tulehdus, joka on äskettäin tunnetaan nimellä ”seitsemäs” [49]. Vaikka vuoden kliinisten ja epidemiologisten tutkimusten ovat tarjonneet kertynyt todisteita sen vahvan yhteyden tulehdus ja erilaisten syöpä fenotyyppejä, harvat tutkimukset ovat arvioitua ydin transkriptiotekijät välittämisessä säädeltyyn yhteyksiä IBDs ja liittyvän CRC.
roolit tulehdus karsinogeneesis- ovat varsin monimutkaisia ja tunnetaan huonosti, vaikka jätämme suuntaan syy välillä tulehduksen ja syövän. Näin ollen perusteella rajoitettu määrä syövän ja tulehduksen näytteitä, se on erittäin vaikeaa rajata salaperäinen ja monimutkaisia yhteyksiä tulehdus ja syöpään. Täällä, me integroitu suuri kooste microarray ekspressioprofiileja tasolla verkon, ja erikseen uutetaan tulehdus ja syöpään näytteitä vastaavia transkription taso tulehdus ja syöpään liittyvät geenit.