PLoS ONE: Äänestäminen-Based Cancer Module Identification Yhdistämällä Topological ja Data-Driven Properties

tiivistelmä

Äskettäin tietotekniikassa integroimalla kopioluvun poikkeamia (CNAs) ja geenien ilmentyminen (GE) on tutkittu laajasti tunnistaa syöpään liittyvien geenien ja polkuja. Tässä työssä me yhdistää nämä kaksi tiedostoa, joissa proteiini-proteiini-vuorovaikutuksen (PPI) tietoa löytää syöpään liittyvien toiminnallisia moduuleja. Integroida CNA ja GE tiedot, ensin rakennettu geeni-geeni suhde verkon joukko siementen geenien luettelemalla kaikenlaisia ​​pairwise korrelaatioita, esim. GE-GE, CNA-GE, ja CNA-CNA, usean potilasta. Seuraavaksi ehdotamme äänestyksen perustuva syövän moduuli identifiointialgoritmi yhdistämällä topologinen ja data-driven ominaisuudet (VToD algoritmi) käyttämällä geeniä-geenin suhteen verkon lähteenä data-driven tietoa, ja PPI datan topologinen informaatio. Olemme soveltaneet VToD algoritmi 266 glioblastoma multiforme (GBM) ja 96 munasarjakarsinooman (OVC) näytteet, joilla on sekä ilmaisun ja kopioluvun mittauksia, ja tunnistettiin 22 GBM moduulit ja 23 OVC moduulit. Niistä 22 GBM moduulit, 15, 12, ja 20 moduulien merkittävästi rikastettu syöpään liittyvien Kegg, BioCarta polkuja, ja GO termejä, tässä järjestyksessä. Niistä 23 OVC moduulit, 19, 18, ja 23 moduulien merkittävästi rikastettu syöpään liittyvien Kegg, BioCarta polkuja, ja GO termejä, tässä järjestyksessä. Samoin myös havaittu, että 9 ja 2 GBM moduulit ja 15 ja 18 OVC moduulit rikastettiin syövän geeni laskennan (CGC) ja erityinen syöpään kuljettaja geenejä, tässä järjestyksessä. Meidän ehdotettu moduuli-havainnointialgoritmin merkittävästi päihitti muiden menetelmien suhteen sekä toiminnallisia ja syöpää geeniperimä rikastusta. Useimmat syöpään liittyvien reittien sekä syöpään aineistoja löytyy meidän algoritmi sisälsi yli kaksi geeniä geenin suhteita, osoittaa vahva positiivinen korrelaatioita määrän erilaisia ​​suhteita ja CGC rikastus-arvot (0,64 varten GBM ja 0,49 ulkopuolelta ladattavien). Tämä tutkimus viittaa siihen, että tunnistetut moduulit, jotka sisältävät sekä ilmaisun muutoksia ja CNAs voi selittää syöpään liittyvien toimintojen enemmän oivalluksia.

Citation: Azad AKM, Lee H (2013) Äänestys-Based Cancer Module Identification Yhdistämällä Topological ja Data- Driven ominaisuudet. PLoS ONE 8 (8): e70498. doi: 10,1371 /journal.pone.0070498

Editor: Dongxiao Zhu, Wayne State University, Yhdysvallat

vastaanotettu: Marraskuu 9, 2012 Hyväksytty: 19 Kesäkuu 2013; Julkaistu: 05 elokuu 2013

Copyright: © 2013 Azad, Lee. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ (nro 2011-0029447) tukivat Mid-ura tutkija Program kautta National Research Foundation se rahoitettiin opetus-, tiede- ja teknologia. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Syöpä on yleinen geneettinen sairaus, ja maailmanlaajuisesti johtava kuolinsyy. Syöpä genomiikka tunnistaa muutoksia geenien tärkeä rooli syövän taudin alkamisen ja etenemisen. Vuosikymmenten tutkimukset ovat paljastaneet, että syöpä liittyy läheisesti epänormaali muutoksia sääntely- ja signalointireitteihin kasvunsa aikana ja malignance [1], [2]; tällaiset säätelyhäiriöiden keskeisillä väyliä johtua yhdistelmiä geneettisiä muutoksia ja ilmentyminen muuttuu onkogeenien tai tuumorisuppressorigeeneille [3] – [5]. Siksi monet algoritmeja on kehitetty tunnistamaan väyliä liittyvät syöpään [6] – [9] käyttämällä DNA CNAs, GE muutoksia, protonipumpun estäjiä, ja niin edelleen.

Laaja käytöt GE tutkimiseen molekyylitason reittejä ovat auttaneet luokittelua syöpä alatyyppejä ennustaminen ennuste, ja kehittää lääkkeitä syövän. Kuitenkin käyttää vain GE tietojen tunnistamisesta syöpään liittyvien geenien ei riitä, koska joitakin tärkeitä geenien syöpään liittyvien reittien ei ehkä ilmentyvät eri ja jotkut ilmentyvät eri geenit saattavat olla merkitystä syövän. CNAs ovat rakenteellisia muunnelmia DNA-sekvenssejä, jotka edustavat epänormaalit kopioita DNA-segmenttien muodossa deleetio tai vahvistus solussa [10]. CNAs tiedetään olevan tuntomerkki syövän, ja menetelmiä, mukaan lukien synergisillä [11], RAE [12], ja WIFA [13], on käytetty syövän toteamiseksi-ohjaimen geenien poikkeavaan genomialuetta. Tuoreessa laajamittainen analyysi GBM näytteitä Cancer Genome Atlas (TCGA) [8] osoitti geneettiset muutokset mukaan lukien mutaatiot, deleetiot, ja monistuksia DNA 78%, 87%, ja 88% 206 GBM näytteiden ydinelementtien RB, TP53, ja RTK /PI3K polkuja, vastaavasti.

Useat tutkimukset ovat viime aikoina raportoineet tärkeää integroida CNAs ja GE aineistoja tunnistamiseen syöpään liittyvien reittejä. TCGA tutkimus munasarjasyövän osoitti, että geneettiset muutokset ja geenien ilmentymisen muutoksia samanaikaisesti esiintyvät retinoblastooma signalointireitillä [14]. Jörnsten

et al.

[15] kehitetty malli, joka selittää vaikutukset CNAs GE suuressa mittakaavassa verkkoon. Perustuu malliin, ennustetekijöiden tulokset laskettiin ja syöpään liittyvien geenien tunnistettiin. Akavia

et al.

[16] palveluksessa integroiva Bayesian lähestymistapa tunnistaa biologisesti ja terapeuttisesti tärkeitä kuljettajan geenejä geneettisesti muutettu alueilla liittämällä Hakijan geenit ilmentyvät differentiaalisesti geenejä. Ne levitetään ehdotettu menetelmä on melanooma datasarja ja tunnistaa tiedossa kuljettajan geenejä melanooman yhdessä uusia syöpää kuljettajan geenejä TBC1D16 ja RAB27A. Tärkeä edistystä yhdistämällä CNAs ja GE tutkii geenejä moduulina pikemminkin kuin yksittäisiä geenejä. Witten

et al.

[17] sovellettu kanoninen korrelaatio analyysi integroida CNAs ja GE. Tämä menetelmä yhdistää CNA moduulien GE moduulien ja optimoi CNA-GE vuorovaikutuksia.

rakentamisessa moduulit tai aliverkkoihin, PPI-lääkkeitä on käytetty ennakkotietoja sisällyttää yhteyksien keskuudessa geenejä. Cerami

et al.

[9] ehdotettu menetelmää rakentaa aliverkot, joka sisältää merkittävän määrän mutatoituja geenejä käyttäen ihmisen PPI-lääkkeiden ja tunnistaa polut, jotka liittyvät GBM. Chuang

et al.

[6] Ehdotettu lähestymistapa on integroida PPI-lääkkeiden ja GE tietomäärien tunnistaa aliverkon merkkiaineiden luokitella metastaattinen ja ei-etäpesäkkeitä.

Ehdotamme laskennallinen järjestelmään sisällytetään CNA -CNA, CNA-GE, ja GE-GE suhteet proteiini vuorovaikutusverkosto tunnistaa syöpään liittyvien moduulien joka geneettisiä muutoksia geenien selitetään näitä suhteita. Vaikka GE-GE suhdetta on tutkittu vuosikymmenien ajan [18] – [20], CNA-CNA [21] – [23] ja CNA-GE [7], [24] – [27] suhteet ovat vasta hiljattain tutkittu . On havaittu, että monistukset ja deleetioita DNA-segmentit voivat vaikuttaa ekspressiotasot geenien samassa paikassa, sekä kaukaista sijaitsevat geenit [25]. Tämä trans-sijaitsee yhdistyksen välillä CNA ja GE voi olla yksi niistä mekanismeista, selittää monimutkaisia ​​suhteita geenien signalointi ja säätelyreittejä. Sisällyttää nämä monimutkaisia ​​suhteita, luomme geeni-geeni suhde verkkoon ilmentyvät eri ja merkittävästi kopioluvun muuttunut geenejä pariksi tietokokonaisuuksien sisältää sekä DNA- ja RNA tietoja samoja potilaita. Sitten me myös sisällyttää PPI tietoa hyödyntää ennen toiminnallisten riippuvuuksien geenien välillä. Käytimme äänestyksen lähestymistapa löytää edustaja geenejä, jotka liittyvät tiiviisti muiden geenien yhdistysten keskuudessa CNAs, GE, ja PPI-lääkkeitä. Nämä edustaja geenejä käytetään rakentamaan valmiiksi moduulien sisällyttämällä liittyy vahvasti geenejä. Sitten, pre-moduulit yhdistetään muihin valmiiksi moduulit, jotka ovat tilastollisesti merkitseviä kautta CNAs, GE, ja PPI suhteita, ja lopullinen moduulit tuotetaan.

Ehdotettu lähestymistapa sovellettiin GE ja CNAs tiedot GBM ja OVC näytteitä TCGA tunnistaa syöpään liittyvien moduulien. Tunnistetut moduulit arvioitiin kahdessa suhteessa: toiminnallista yhtenäisyyttä ja merkitystä syövän. Voit testata, että moduulit koostuvat toiminnallisesti yhtenäisen geenien, haimme toiminnalliset rikastukseen testeissä käytetään Kegg [28], BioCarta reittejä [29], ja GO biologinen prosessi [30]. Voit testata, että syntyvän moduulit liittyvät syöpään, ensin valittu syöpään liittyvien tapoja valmistaa näitä kolmea polkuja. Koska ei vielä ole yksimielisyyttä siitä, mikä polkuja tai toiminnallisesti liittyvät syöpään, katsomme, että väylän liittyy syöpään, jos se on merkittävästi rikastettu syöpään liittyvien geenien syöpää geenistä laskennan (CGC) [31]. Sitten me soveltaa rikastamiseen testeissä käytetään näitä syöpään liittyvien reittejä. Tuloksemme osoittivat, että syöpään liittyvien reittien rikastettiin kanssa tunnistettu moduulit sekä GBM ja OVC aineistoja, ja että merkittävä määrä geenejä moduuleissa liittyi muiden kautta CNA-CNA, CNA-GE, ja GE-GE suhteita .

tulokset

Kehys yhdistäminen Topological ja tietoihin perustuva Properties

Kehitimme VToD lähestymistapa rakentaa moduulit, jotka koostuvat toiminnallisesti yhtenäisen ja syöpää liittyviä geenejä. VToD kehitettiin perustuu neljään ideoita; (I) geenit, joilla on samankaltaisia ​​geeniekspressioprofiilit ja kopioluvun muutokset ovat todennäköisesti olla samassa moduulissa, (ii) geenit voidaan liittää useisiin moduuleihin heijastaa biologista tietoa, että jotkut geenit osallistuvat useiden reittien kautta, (iii) geenejä lyhyen matkan PPI verkossa todennäköisemmin kuuluvat samaan moduuliin, ja (iv) napa geenien PPI verkossa todennäköisemmin sisällytetään moduulien koska monet napa geenejä, joilla on suuri määrä vuorovaikutuksessa kumppanit voivat edistää syövän kehitystä. Entinen kaksi ajatusta harkita data-driven ominaisuuksia ja kaksi jälkimmäistä heijastavat topologinen ominaisuuksia geenien sisällä PPI-verkkoon.

kaaviokuva meidän ehdotettu VToD menetelmä on esitetty kuviossa 1. VToD rakentaa geeni-geenin suhteen verkko, integroimalla GE ja CNA aineistoja, joissa on joukko siementen geenejä ja on joukko geenin-geenin suhteita. Seed geenit valitaan yhdistämällä eri tavoin ilmaistuna (DE) geenejä ja CNA geenit, jossa CNA geenit saadaan TCGA [8], [14] ja taulukossa S1. Sillä GBM, 4821 siemenet geenit valittiin yhdistämällä 2976 DE geenejä ja 2073 CNA geenejä. Ulkopuolelta ladattavien, 6649 siemenet geenit rakennettiin 710 DE geenejä ja 6510 CNA geenejä. Huomaa, että jotkut siemenet geenit ovat molemmat ilmentyvät differentiaalisesti ja kopion numero muuttunut. Geeni-geeni suhteita rakennettiin, jossa kaksi geeniä on vahva korrelaatio vähintään yhden kolmenlaisia ​​suhteita: GE-GE, CNA-GE, ja CNA-CNA. Sitten VToD integroi PPI data asetettu geeni-geeni suhde verkon

GGR

noudattamalla neljä päävaihetta.

(A) Gene ilmaisuja ja niiden pariksi CNA tietoja kerätään. (B) Geeni-geenin suhteen verkko,

GGR

, rakennetaan käyttäen suorat ja epäsuorat yhteydet GE-GE, CNA-GE, ja CNA-CNA. (C) A novel algoritmi, VToD, löydöt päällekkäisiä moduulien yhdistämällä

GGR

verkko ja PPI tiedot. (D) Toiminnallinen ja syövän geeniperimä rikastusta testataan tunnistetaan moduuleja.

Laske yhdistyksen välillä geenien:

Jokaista kaksi geeniä, ja yhdistyksen arvo geenistä toiseen on lasketaan yhdistämällä geeni-geeni suhteita ja PPI keräämiseen. Yhdistyksen arvo kutsutaan – tässä tutkimuksessa, koska oletamme, että geeni ääniä geeni edustaa vahvuus yhdistyksen kahden geenejä.

Valitse edustaja geenejä kustakin geenistä:

For geeni, ääni-arvot kaikista muista geeneistä lajitellaan laskevaan järjestykseen, ja geenit sijaitsevat yläosassa% äänistä-arvot valitaan edustajana geenit geenin.

Form pre-moduulit

Jos geeni on valittu edustajaksi geenin useita geenejä, muita geenejä valitsemalla geenin edustajana geeni yhdessä itse geenin muodostavat pre-moduuli.

Yhdistä pre-moduulit :

kaksi pre-moduulit yhdistetään jos pareittain jäsenet valmiiksi kaksi moduulia ovat erittäin liittyvät geenissä-geenin suhteen verkko ja ovat tiiviisti kytketty PPI verkossa.

VToD algoritmi taustalla on dynaaminen signaali transduktiojärjestelmää (STM) algoritmi [32], joissa kunkin geenin, useimmat liittyvät geenit valitaan muodostamaan ennalta moduulit perustuvat PPI topologia vain. Kuitenkin selvä välissä STM ja VToD prosessissa (i) laskemalla yhdistyksen välillä kaksi geeniä ja (ii) sulautuvat pre-moduulit, koska lähestymistapamme integroi GE, CNAs, ja PPI aineistoja.

rakennettu moduulit arvioitiin kahdessa näkökohdat (I) mittasimme toiminnallista merkitystä tunnistetun moduulien testaamalla onko geenien moduuli rikastettiin Kegg, BioCarta polkuja, ja biologisia prosesseja GO suhteen (kutsutaan toiminnallinen rikastamiseen testi), ja (ii) arvioimme merkitystä moduulit syövän soveltamalla rikastamiseen testiä syöpään liittyvien reittien tai syöpään liittyvien biologisten toimintojen jotka ovat osajoukkoja edellä kolmeen luokkaan polkuja /GO termejä rikastettu syöpään liittyvien geenien CGC [31] (kutsutaan syöpää liittyvä polku rikastamiseen testi). Lisäksi testasimme ovatko geenit tunnistettu moduulien rikastettua syövän geenien CGC, GBM kuljettajan geenejä [33], ja OVC liittyviä geenejä [34]. Näissä arvioinneissa hypergeometrisen tilastoja käytettiin rikastamiseen testissä.

moduulit päässä VToD Algoritmi

jakaumat kaikki luetellut pairwise geeni-geeni suhteista (GE-GE, CNA-GE, ja CNA-CNA) keskuudessa siemenet geenit on esitetty kuvassa S1, ja jakaumat kaikki äänestää-arvot GBM ja OVC aineistoja on esitetty kuvassa S2. Koska tiettyjen ennalta moduuleja riippuu% arvoista vaiheessa 2 VToD algoritmin, yritimme kolme arvoa tutkimaan, miten arvot vaikuttavat laskennalliseen pre-moduulit. Äänestys-arvot top 1%, 0,25% ja 0,1% lopulta saatiin 100, 68, ja 43 pre-moduulit GBM, ja 138, 53, ja 34 pre-moduulit OVC. Sitten käytimme toiminnallinen rikastamiseen kokeiden ja syöpään liittyvien reitin rikastamiseen kokeiden ennalta moduulien luotu käyttäen kolmea kynnysarvoja edellä. Kuvio 2 esittää osa rikastettu pre-moduulia; vaikka monet pre-moduulit ovat merkittäviä päällekkäisyyksiä, joiden tiedetään polkuja kaikilla kolmella kynnysarvot, pre-moduulit = 0,25% ja 0,1% enemmän päällekkäisyyden polkuja verrattuna = 1%, mikä osoittaa, että korkeampi ääni-arvot tuovat osa toiminnallisesti asiaankuuluvat ja syöpään liittyvien moduulien.

(A) on GBM ja (B) on ulkopuolelta ladattavien. Pylväät edustavat jakeet moduulien rikastettu Kegg, BioCarta, GO biologinen prosessi, syöpään liittyvien Kegg, syöpään liittyvien BioCarta, syöpään liittyvän GO biologisen prosessin, ja syövän geeni laskennan (CGC) kolmelle eri ääni kynnysarvoja. Lisäksi kussakin tapauksessa, ääni-arvot laskettiin käyttäen vain topologinen ominaisuuksia, käytetään vain data-driven ominaisuuksia, ja yhdistämällä ne voivat vertailla yksittäisiä vaikutuksia suorituskykyyn. Numerot geenien (NGS) kussakin ennalta moduuli set esitetään vastaavasti.

Testasimme myös, että olisi harkittava sekä topologinen ja data-driven ominaisuuksia pairwise ääni laskentaan. Meillä syntyy ennalta moduulit käyttämällä vain topologinen ja ainoastaan ​​data-driven ominaisuuksia. Kun yksittäinen kiinteistö käytettiin sama määrä geenin parien valinnassa on noudatettu, että geenien parien valittujen yhdistämällä molemmat ominaisuudet kunkin arvon. Kaikkien kolmen arvot kynnyksen, osa toiminnallisesti rikastettua moduulien oli suurempi, kun topologinen ja data-driven ominaisuudet yhdistettiin kuin silloin, kun vain yksi ominaisuus käytettiin sekä GBM ja OVC, kuten on esitetty kuviossa 2.

Valitsimme = 0,1% kynnykseksi tarkempaa analysointia. Käyttämällä tätä kynnystä, sillä GBM, 43 pre-moduulit saatiin. Yhdistämällä nämä pre-moduulit, 22 moduulit ovat saaneet aikaan ja keskimäärin geenien moduulien oli 24. OVC, käyttäen samaa kynnystä, 34 pre-moduulit ovat saaneet aikaan ja 23 moduulit saatiin yhdistämisen jälkeen pre-moduulit, jossa keskimääräinen määrä geenejä on 57. Kaikki geenit moduuleissa on lueteltu taulukossa S2 ja Taulukko S3. Tilastollinen merkitys tunnistettu moduulit esitetään kuviossa S3.

Koska VToD algoritmi mahdollistaa usean esiintymiset geenien useita moduuleja, laskimme keskimääräinen suhde yhteisten geenien moduulien välillä. Varten GBM suhde yhteisen geenin oli 16,07%, mikä oli samanlainen kuin on Kegg ja BioCarta polkuja. Myös jakelu suhde yhteisten geenien laskettiin. Noin puolet moduulien oli 10% yhteisiä geenejä, mikä osoittaa, että lopullinen moduulit rikastettu erillisiä toiminnallisia polkuja tai ehdot (kuviot S4A ja S4b). Tutkimme myös kolme erilaista suoria suhteita (GE-GE, CNA-GE, ja CNA-CNA) väliin geeni parien kussakin näistä 22 GBM moduulit (kuvio S5a). Noin 64%: n moduulien sisälsi ainakin kahta suhteita, mikä osoittaa, että (i) geenit, joilla on samankaltaisia ​​geenin ilmentymisen ja DNA: n kopioiden määrän muutokset ovat todennäköisesti olla samassa moduulissa, ja (ii), että aktiivisuus geenien näiden tunnistettujen moduulit voidaan selittää eri molekyylitason mekanismeja (taulukko S4).

23 OVC moduulit, keskimääräinen suhde yhteisten geenien oli 11,68%, mikä oli myös pienempiä kuin Kegg ja BioCarta, ja yli puolet 23 OVC moduulit oli 10% yhteisten geenien (kuviot S4C ja S4d). Noin 83% kaikista 23 OVC moduulit (kuvio S5B) sisälsi ainakin kahdenlaisia ​​suoria suhteita.

Cancer liittyvät moduulit tunnistetaan VToD algoritmi GBM.

sovelletaan toiminnallisia ja syöpä geeni asetettu rikastamiseen testit 22 GBM moduuleja. Huomasimme, että 19 (86,36%), 14 (63,63%), ja 20 (90,9%) moduulien merkittävästi rikastettu (FDR -arvo 0,05), jossa on ainakin yksi Kegg, BioCarta tai GO termejä, tässä järjestyksessä, joka osoittaa, että tunnistetut moduulit ovat toiminnallisesti yhtenäinen. Myös 15 (68,18%), 12 (54,55%), ja 20 (90,9%) GBM moduulit merkittävästi rikastettu syöpään liittyvien Kegg, BioCarta polkuja, ja GO termejä, tässä järjestyksessä. Kun kyseessä on syöpä geeniperimä rikastamiseen testi, 9 ja 2 GBM moduulia oli merkittävää päällekkäisyyttä (FDR -arvo 0,05) kanssa CGC [31] ja GBM liittyviä geenejä [33], tässä järjestyksessä. Nämä tulokset osoittavat, että moduulit liittyvät syövän kehittymisen. Taulukossa 1 esitetään yhteenveto viisi valittujen moduulien tilaaman GBM liittyvä geeni rikastamiseen-arvot; nämä moduulit sisältävät monia GBM liittyviä geenejä. Kaikki rikastamiseen tulokset GBM datasarjan on esitetty taulukoissa S4, S5, S6, ja S7.

Valitsimme GBM Moduuli 2 selittää yksityiskohtaisesti, miten geenit ovat vuorovaikutuksessa muiden geenien ja osallistuvat biologisia reittejä moduuleina. Valitsimme tämä moduuli antaa lisätietoja, koska sillä on alhainen rikastus -arvo syöpä geenin sarjaa, ja sisältää geenin paria vahvojen korrelaatiot kolmenlaisia ​​suoria suhteita. Tämä moduuli sisältää 1,080 geenin paria 48 geeneistä, ja niiden joukossa oli 300 GE-GE, 9 CNA-GE, ja 8 CNA-CNA suoria suhteita. Kuvio 3A esittää verkon näkymä GBM Moduuli 2 suoralla suhteita vain. Oli kolmenlaisia ​​reunojen tähän verkostoon: i) punainen reunat CNA-CNA, ii) sininen reunat CNA-GE, ja iii) vihreä reunat GE-GE suhteet kahden geenin. Kuuluvien geenien merkittävästi rikastettu polkuja /ehdot ryhmiteltiin. Tietoa DNA CNAs ja /tai ilmentymisen muutoksia geenien leimattiin myös niitä kussakin ryhmässä. Taajuudet kopioluvun muutoksia esitettiin prosentteina 206 GBM näytteistä joko polttoväli vahvistus tai homotsygoottinen deleetio [8]. Laskemaan osa kasvain näytteiden geenien ilmentyminen muutoksia, me katsotaan, että kasvain näyte on ali- tai ilmoitetaan, jos arvo yhtälössä (1) kuuluu top 10% arvoista kaikista kasvain näytteissä, joissa on ilmaus arvo kasvain näytteen ja on keskiarvo ilmaus kaikkien kontrollinäytteistä varten. Perustuen jakaumia varten GBM ja OVC aineistoja, 0,4 valittiin GBM ja 0,365 ulkopuolelta ladattavien. (1) B

(A) verkko otetaan GBM Moduuli 2 käytetään vain suoria suhteita, piirtämä Cytoscape [ ,,,0],70]. Geenit koottiin perustuu päällekkäisiä BioCarta polkuja, ja prosenttiosuudet näytteiden CNAs ja GE muutokset näkyvät. CGC geenit ovat värillisiä oliivi ja GBM geenit ovat violetti. Cytoband ja Amp /Del (tai muuttaminen-Expression Changes) tietoa CNA-CNA (tai CNA-GE) parit on esitetty upotettavat taulukossa. (B) Pathway rikastamiseen testejä Kegg ja BioCarta väyliä Tämän moduulin on esitetty. Siniset palkit osoittavat rikastamiseen-arvot polkuja ja punaiset pylväät osoittavat päällekkäisyys-arvot välillä polku ja GBM kuljettajan geenejä. Musta pystypalkit osoittavat -arvon kynnys, 0,05 ja leveys vaakapalkeilla riippuu (-arvo). (C) Punainen palkit osoittavat päällekkäisten -arvo kanssa CGC ja GBM kuljettajan geenejä.

manuaalinen kirjallisuuskatsauksesta säädetty tukevaa näyttöä suoria suhteita GBM Moduuli 2. Geenit MAPK1-MAPK3, MAPK3- MAPK9, ja MAPK1-MAPK9 parit vaikuttavat eri syöpää ja GBM liittyviä reittejä, kuten MAPK signalointi, erbB signalointi, fokaalisen adheesion, ja Toll-kaltainen reseptori signalointi. In BRCA2-ING1, molemmat geenit kriittisiä rooleja solusyklin kontrolli [35], [36]; ING1 on tuumorisuppressorigeenin ja vuorovaikutuksessa TP53, ja sen ali-ilmentyminen, ja geneettisen uudelleenjärjestymisen on havaittu useissa syövissä, mukaan lukien GBM [37]; ja BRCA2, kasvainsuppressorigeenin, on äskettäin kohdistettu herkistävä gliooma solujen tappaminen syöpälääkkeiden [38]. In BTBD2-TEP1, TEP1 on tunnettu GBM estävä geeni, ja poisto /mutaatio tämän geenin on havaittu monissa syövissä, mukaan lukien GBM [39]; polymorfismi BTBD2 on mukana kaksinkertaisen lohkon murtuma korjaus polku, joka voi olla hyötyä GBM selviytymisen [40]. In ING1-HMGB1, molemmat geenit sijaitsevat kromosomissa 13q, jossa kopioluvun menetys on raportoitu [41] – [43], mikä viittaa siihen, yhdessä esiintyvät poistetaan näiden kahden geenin. In APEX1-HF1A ja HF1A-TEP1 joilla CNA-CNA suhde, APEX1 ja HF1A suoraan vuorovaikutuksessa toistensa kanssa

in vitro

[44]; ja, GBM, kopioiden määrä tappio 14q11.1-q13.1, 14q23.2-q23.3, ja 14q32.33, missä nämä geenit sijaitsevat, on raportoitu Donovan

et al.

[45]. Suhde 14q11.1-11.2 ja 14q23.1-31.3 esitetään myös meidän havainnot CNA-GE suhteista (APEX1-BRCA1, BRCA1-HF1A, ja BRCA1-TEP1) tässä moduulissa. In BTBD2-BARD1, BARD1 ehdotettiin välittäjänä apoptoosin, koska sen yli-ilmentyminen indusoi solukuolemaa [46]; ja korkea LOH on havaittu ihmisen karsinooman metastaasit aivoihin kromosomissa 19p13.3 varten BTBD2 [47].

Kuvio 3B esittää rikastukseen testeissä käytetään Kegg ja BioCarta väyliä GBM moduulin 2. Löytää GBM- siihen liittyviä reittejä, myös laskenut-arvot varten rikastamista GBM liittyvien geenien näistä reiteistä, vastaavasti. Kuviossa 3B, top 15 37 rikastettua Kegg ja top 15 49 rikastettua BioCarta reittejä on esitetty GBM Moduuli 2, sekä niiden vastaavat päällekkäisiä -arvoja, lajiteltu ne -arvot. GBM Moduuli 2 sisältää monia aikaisemmin tunnettuja GBM liittyviä Kegg sellaisia ​​keinoja kuten Gliooma, P53 signalointi, MAPK signalointi, erbB signalointi, mTOR signalointi, ja VEGF signalointi, ja GBM liittyviä BioCarta reittejä, kuten ATM, G2, G1, RB, P53, PTEN , ja MET reitit [48]. GBM Moduuli 2 on myös rikastettu syöpään liittyvien 40 Kegg, 48 BioCarta polkuja, ja 92 GO termejä.

Testasimme myös merkitystä GBM Moduuli 2 syöpään käyttäen CGC ja GBM liittyviä geenejä, kuten on esitetty Kuva 3C. GBM Moduuli 2 sisälsi 10 CGC geenejä TP53, BRCA1, BRCA2, Daxx, DDX5, MDM2, MDM4, NPM1, TEP1, ja WRN, jolloin-arvo on 1,0510, ja 2 GBM liittyvien geenien TP53 ja TEP1, jolloin -arvo on 1,0210.

syöpä käsittelevistä moduuleista tunnistetaan VToD algoritmi munasarjasyöpä.

Niistä 23 OVC moduulit, 22 (95,65%), 18 (78,26%), 23 ( 100%), 15 (65,22%), ja 18 (78.26%) moduulien merkittävästi rikastettu (FDR -arvo 0,05), jossa on ainakin yksi Kegg, BioCarta polkuja, GO termejä, CGC [31], tai OVC liittyvän geenin sarjaa [ ,,,0],34], tässä järjestyksessä. Myös 19 (82,61%), 18 (78,26%), ja 23 (100%) ulkopuolelta ladattavien moduulien merkittävästi rikastettu syöpään liittyvien Kegg, BioCarta, ja GO termejä, tässä järjestyksessä. Taulukossa 2 esitetään yhteenveto viiden valittujen moduulien tilaaman OVC liittyvä geeni asetettu rikastamiseen-arvot. Kaikki rikastamiseen tulokset OVC datasarjan on esitetty taulukoissa S8, S9, S10, ja S11.

Tutkimme OVC Moduuli 8 yksityiskohtaisesti, kuten kuvassa 4; se sisältää 629 geeniä paria 37 geenien, ja niiden joukossa oli 2 GE-GE, 28 CNA-GE, ja 49 CNA-CNA suoria suhteita. OVC Moduuli 8, STAT5B-STAT3 geenipari aktivoidaan munasarjasyöpä [49], vuorovaikutuksessa toistensa kanssa [50], ja on mukana monissa polkuja kuten Jak-STAT signalointi, RAS signalointi, Kemokiini signalointi, EGF, IL10, PDGF ja TPO polkuja. In STAT5B-PRLR, molemmat geenit ovat mukana Jak-STAT signalointi, signaalinvälitysreitin keskeisten valvoa lisääntymistä, erilaistumista, ja selviytymistä maitorauhasen soluja [51]. Viime aikoina on osoitettu, että PRLR ja sen loppupään STAT5B on asetyloitu CREB: tä sitova proteiini (CBP) [52]. In EGF-STAT1 ja EGF-STAT3, molemmat geeni parit ovat mukana haimasyövän, EGF koulutusjakson, ja duktioreaktiotiessä; sekä STAT1 ja STAT3 aktivoituvat Jak kinaasin vastauksena EGF [53] – [55], jossa JAK2 /STAT3-signalointia tarvitaan EGF-driven munasarjasyöpä [55]. In PIK3R1-IGF1 R, nämä geenit ovat vuorovaikutuksessa toistensa kanssa [56] ja ovat mukana monia toiminnallisia polkuja, mukaan lukien IGF1-, IGF1 R, HDAC, BAD, IGF1MTOR, ja fokaalisen adheesion polkuja. In ErbB2-STAT, nämä geenit ovat mukana haimasyövän ja singaalin; korrelaatio aktivointi ErbB2 ja STAT3 on havaittu monissa ihmisen kasvaimissa [57], [58]. In ErbB2-STAT5B, molemmat geenit ovat vuorovaikutuksessa JAK2 [59], [60] ja ovat mukana erbB signalointi ja signaalintransduktioreitteihin. EGF-ErbB2-, nämä geenit suoraan vuorovaikutuksessa toistensa kanssa [61] ja ne ovat mukana monissa syövissä, mukaan lukien haiman, kohdun limakalvon, eturauhasen, virtsarakon ja munasarjojen syöpien. Ne ovat myös mukana erbB signalointi ja polttovälin tarttuvuus polkuja. In HRAS-FYN, nämä geenit ovat vuorovaikutuksessa toistensa kanssa

in vitro

[62] ja ovat mukana monissa polkuja, kuten polttoväli pito, aksoniohjauksen, T-solureseptorin signalointi, ja FC epsilon RI signalointi, ECM , TCR, ja integriini polkuja.

(A) verkko otetaan OVC Moduuli 8 käytetään vain suoria suhteita. CGC geenit ovat värillisiä oliivin ja OVC liittyvät geenit ovat violetti. (B) Pathway rikastamiseen kokeiden testit olivat samanlaisia ​​kuin kuviossa 3 (B), mutta tässä, punainen palkit osoittavat päällekkäisten-arvot välillä polku ja OVC liittyviä geenejä. (C) Punainen palkit osoittavat-arvot, jotka ovat päällekkäisiä, jotka on otettu CGC- ja OVC liittyviä geenejä.

15 parasta 37 rikastetun Kegg ja top 15 59 rikastettua BioCarta reitit esitetään myös ulkopuolelta ladattavien Moduuli 8 kuvassa 4B. Se sisältää tunnettua OVC liittyviä Kegg reittejä, kuten polttoväli tarttuvuus, JAK-STAT signalointi, erbB signalointi, sytokiini-sytokiinireseptorin vuorovaikutus, kemokiinin signalointi ja VEGF signalointi, ja OVC liittyviä BioCarta reittejä, kuten AKT signalointi, IL6, RAS, EGF, IGF1-, PDGF, VEGF, CXCR4, ja HER2 reitit [34]. Testasimme myös merkityksellisyys OVC moduulin 8 syöpään. OVC Moduuli 8 rikastettiin 39 Kegg, 58 BioCarta polkuja, ja 49 GO termejä, jotka olivat syöpään liittyvien subsets alkuperäisen polkuja /ehdoin. Lisäksi, kuten on esitetty kuviossa 4C, OVC Module 8 sisälsivät 7 CGC geenejä (PTPN11, AKT1, erbB2: n, FOXO1, HRAS, LIFR, ja PIK3R1) ja -arvo on 2,0810 ja 6 OVC liittyvien geenien (EGF, EPHA2, erbB2: , PIK3R1, STAT3 ja VEGFA) ja -arvo on 5,2310. Nämä tulokset viittaavat siihen, että meidän tunnistettu moduuleja OVC tietokokonaisuus edustavat syöpään liittyvien reittejä.

Verrattaessa VToD muiden Methods

Taulukossa 3 esitetään suorituskyvyn vertailuja meidän ehdotettujen VToD algoritmin ja muiden klustereiden menetelmiä käyttäen GBM ja OVC käyttökelpoisuus; verrattuna nämä algoritmit, osuus on suurempi VToD moduuleja toiminnallisesti rikastettu kuin moduuleita muita algoritmeja. Vaikka toiminnalliset rikastuminen DFM-CIN moduulit on verrattavissa VToD, VToD tunnistaa suurempi osa moduuleista encriched syöpään liittyviä reittejä kuin DFM-CIN. Huomaa, että koska algoritmit suunniteltiin erilaiset tiedot, he verrattiin käyttämällä datatyyppejä alkuperäisessä paperi. Jotta hierarkkinen klusterointi menetelmä, GE, CNAs, ja PPI aineistoja yhdistettiin.

Hierarkkinen klusterointi: Löytää moduuleja hierarkkista klusterointialgoritmi, muunsimme geeni-geeni suhde verkon osaksi matkan matriisiin käyttäen topologinen päällekkäisyys metrinen [63], että WCGNA työkalun R laskennallinen suite. Tämä etäisyys matriisi käytettiin sitten hierarkkinen klusterointi keskiarvoon sidoksen. Dendrogrammi Klusterin leikattiin dynaamisella puu leikattu [64] algoritmi, lopulta tuottaa 216 moduulien kun GBM tietojoukko käytettiin. Käytimme toimiva ja syöpää geeniperimä rikastamiseen testit näillä 216 moduuleja. Löysimme 14, 0, ja 13 moduulit, joilla on merkittäviä päällekkäisyyksiä Kegg, BioCarta polkuja, ja GO termejä, vastaavasti, ja 4, 0, ja 4 rikastettu moduulien syöpään liittyvien subsets Kegg, BioCarta, ja GO termejä, tässä järjestyksessä. Myös 5 ja 1 moduuleja rikastettu CGC- ja GBM liittyviä geenejä (taulukko S12). Taulukossa 3 esitetään vertaileva suorituskyvyn välillä hierarkkinen klusterointi ja VToD algoritmeja, jotka osoittavat, että VToD tunnistettu enemmän reittiin rikastettu moduulit kuin hierarkkinen klusterointialgoritmi (taulukko S13). Lisäksi kuvio S6A esitetty laatikko juoni CGC ja GBM kuljettajan geeni rikastamiseen -arvoja, mikä osoittaa korkeampi syövän geeni rikastusta sisään VToD verrattuna hierarkkinen klusterointi. Myös piirakkakuvioita kuvassa S6b esittävät erilaisia ​​yhdistelmiä kolmenlaisia ​​suoria suhteita (CNA-CNA, GE-CNA, GE-GE). Tässä VToD tuotti suuremman osan näistä moduuleista, jotka sisältävät useamman kuin yhden tyyppistä suoria suhteita verrattuna hierarkkinen klusterointi.

Cerami et. al .: Cerami

et al.

[9] kehitetty algoritmi integroida DNA-kopion numeroita, somaattinen mutaatio, ja PPI aineistoja, ja soveltaa sitä 84 TCGA GBM data [8].

Vastaa