PLoS ONE: ICAN: yhdennetty Co-muuttaminen Verkon tunnistaa munasarjasyöpä-Related Genes

tiivistelmä

Background

Viime vuosikymmenen aikana, yhä useammat integroiva tutkimuksia syöpään liittyvä geenejä on julkaistu. Integroiva analyysit pyrittävä ratkaisemaan rajoittamisesta yhden datatyypin, ja tarjoavat kattavan kuvan syövän synnyn. Valtaosa näistä tutkimuksista käytettiin näyte-sovitetun datan geeniekspression ja kopioluvun tutkimaan vaikutuksia kopioluvun muutos geenien ilmentymisen, sekä ennakoida ja priorisoida ehdokas oncogenes ja tuumorisuppressorigeeneille. Kuitenkin korrelaatiot geenejä huomiotta näissä tutkimuksissa. Työmme tavoitteena oli arvioida yhteistyössä muuttamista kopioluvun, metylaatio ja ilme, jotta voimme tunnistaa syöpään liittyvien geenien ja olennaiset toiminnalliset moduulit syöpään.

Tulokset

Rakensimme Integrated Co -alteration verkko (ICAN), joka perustuu usean omiikka datan ja analysoi verkon paljastaa syöpään liittyvien geenien. Sen jälkeen kun vertailu satunnainen verkkojen tunnistimme 155 munasarjasyöpä liittyviä geenejä, myös tunnettujen (

TP53

,

BRCA1

,

RB1 ​​

ja

PTEN

) ja myös uusia syöpään liittyvien geenien, kuten

PDPN

ja

EphA2

. Vertasimme tuloksia tavanomaisella menetelmällä: CNAmet, ja saatu merkittävästi parempi AUC-arvo (ICAN: 0,8179, CNAmet: 0,5183).

Johtopäätös

Tässä artikkelissa kuvaamme puitteet löytää syöpään liittyvien geenien perustuu Integrated Co-muutos verkkoon. Tuloksemme osoittivat, että ICAN voisivat tarkasti tunnistaa ehdokas syövän geenien ja lisäävät mekanistisen ymmärryksen syövän. Tämä työ ehdotti uuden tutkimuksen suuntaan biologisen verkon analyyseistä, jotka on multi-omiikka data.

Citation: Zhou Y, Liu Y, Li K, Zhang R, Qiu F, Zhao N, et al. (2015) ICAN: yhdennetty Co-muuttaminen Verkon tunnistaa munasarjasyöpä liittyviä geenejä. PLoS ONE 10 (3): e0116095. doi: 10,1371 /journal.pone.0116095

Academic Editor: Lars Kaderali, Technische Universität Dresden, lääketieteellisen tiedekunnan SAKSA

vastaanotettu: 14 heinäkuu 2014; Hyväksytty: 04 joulukuu 2014; Julkaistu: 24 maaliskuu 2015

Copyright: © 2015 Zhou et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään

Data Saatavuus: Kaikki munasarjasyöpä aineistot saatiin Cancer Genome Access, ja ovat julkisesti saatavissa TCGA verkkosivuilla (https://tcga-data.nci.nih.gov/tcga/).

Rahoitus: Tätä työtä tukee osittain National Natural Science Foundation of China (Grant nro 81372492), ja osittain Scientific Research Fund Heilongjiangin maakunnan opetusviraston (No.12541278) ja Natural Science Foundation of Heilongjiangin maakunnassa (Grant nro D201116). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

nopean kehityksen suurikapasiteettisia tekniikoita, tietokannat kuten The Cancer Genome Atlas hanke (TCGA) [1] ja Cancer Cell Line Encyclopedia (CCLE) [2] ovat tarjonneet monia korkean resoluution molekyyli profiilit sama syöpä näytteet, joissa geenin ilmentyminen, kopioiden määrä, metylaatio ja miRNA ekspressiotietojen. Nämä aineistot käytössä integroiva analyysit keskittyvät tunnistamiseen syöpään liittyvien geenien. Ihmisen kasvaimen kehittymisen ja etenemisen ohjaavat poikkeavaan toimintaa sääteleviä geenejä näkökohtia solujen lisääntymistä, apoptoosin, genomin vakautta, angiogeneesi, invaasio ja etäpesäkkeiden [3]. Suurena haasteena on tunnistaa syöpään liittyvien geenien, erityisesti ne, jotka on tärkeä rooli aloittamisesta ja syövän kehittymisen. Tunnistaminen tällaiset geenit edistävät edelleen kehittämiseen henkilökohtaisen lääketieteen [4].

Viime vuosikymmenellä useita menetelmiä on ehdotettu integrointi geenien ilmentymisen ja kopioluvun tiedot. Nämä menetelmät voidaan jakaa karkeasti kahteen ryhmään: vaiheittaisen integraatio ja yhteiset menetelmät [3]. Esimerkiksi, Akavia et al. [5] kehittivät ”genomisen jalanjälki” teoria, jossa ne uutettiin kuljettajan geenejä menetelmällä, joka perustuu Bayes-verkko; kuitenkin ne huomiotta korrelaatio geenejä, jotka samanaikaisesti muutetaan eri tasoilla. Bicciato ym. [6] kehitti vaiheittaista menetelmää, jota kutsutaan Merkittävä limittäisyys ilmentyvät eri ja Genomic Epätasainen alueiden (SODEGIR) tunnistaa diskreetti genomialuetta koordinoituun kopioluvun muutoksia ja muutoksia transkription tasolla. Salari ym. [7] kehitti R paketti nimeltään DRI tunnistaa mRNA: iden kanssa yhtäpitävät kopioluvun ilmaisun suhteen. Lisäksi on integroiva perustuvia lähestymistapoja kanoninen korrelaatio analyysi että tavoitteena oli määrittää yhdistyksen välillä kopiomäärä ja ilmaisun [8, 9]. Kokonaisuutena tällaisia ​​menetelmiä edustaa bioinformatiikan menettelystä integroiva, geeni-asema perustuva analyysi CN ja GE tietoja, joiden avulla tunnistaa erillisten kromosomialueiden tai geenejä koordinoituja kopioluvun muutoksia ja muutoksia transkription tasoa. Lisäksi nämä menetelmät, Louhimo et ai. [10] suoritetaan integroiva analyysi kopioluvun, DNA: n metylaation ja geenin ilmentymistä tietoja käyttämällä CNAmet, niiden geenien tunnistamiseksi, jotka ovat koordinoidusti monistetaan, hypometyloidut ja voimistunut tai yhteistoiminnallisesti poistettu, hypermetyloitunut ja vaimentua . Vaikka heidän työnsä integroitu useita datatyyppejä, huomasimme, että ne olivat vain keskittyneet alueille tai geenien samanaikaisesta CN /GE muutos. ja eivät tutki suoraa tai epäsuoraa suhde muuttunut geenejä.

Kuitenkin solutoiminnoille harvoin määrittää yhden geenin, vaan monet geenit yhdistetään muodossa verkkojen tai klusterien. Enemmän kuin yksi geeni on muuttunut etenemistä syövän, seurasivat erillisiä malleja häiriöitä, ja yhteistyössä edistää kasvaimen fenotyypin [11]. Esimerkiksi tuore tutkimus osoitti, että RSF1 säätelee geenien kiertämiseen apoptoosin (

CFLAR

,

XIAP

,

BCL2

ja

BCL2L1

) ja säätelee tulehduksellinen geeni (

PTGS2

) [12]. Lisäksi tutkimukset ovat havainneet, että muutokset syövän tehdään usein läheisesti liittyviä moduuleja ja yhteisöt [13]. Siksi -korrelaatiot useita tasoja olisi otettava huomioon vakavasti. Yllämainitut tutkimukset eivät kiinnitä huomiota geeni-geeni korrelaatioita. Eräät muut tutkimukset ovat pohtineet näitä korrelaatioita eri tasoilla; kuitenkin, kasvain aktivointi /tukahduttaminen mekanismeista he paljastivat rajoittuivat yhdellä tasolla. He eivät pitäneet kattavasti vaikutukset syövän kehitystä genomista ja epigenomic ominaisuuksia. Ne vain tutki voima geenin yhdellä tasolla syövän etenemisen. Esimerkiksi samanaikaisen ilmentymisen on yleisin korrelaatio. Vuonna 2005 Sean ym. [14] löydetty suhde korkea -parin

JAG1

ja

Notch1

ja huonon ennusteen rintasyöpään. Lisäksi vaikutus yhteistyössä mutaatioita geenien välillä tutkittiin myös suhteessa tautiin. Vuonna 2010 Yunyan ym. [15] tutki toiminnallista yhdistyksen välillä yhteistyön mutatoituja geenejä; niiden tuottamien tulosten uusia oivalluksia monimutkainen koordinointimekanismeissa molekyyli prosesseja. Äskettäin lisätä tarkkuutta ehdokas geenin seulonta, jotkut tutkijat myös tiedot mRNA ilmaisun ja proteiinin vuorovaikutusta. Bashashati et ai. [16] on kehittänyt DriverNet algoritmi, joka perustuu geenin vuorovaikutusta, ja harvinaiset Hakijan mutaatioita, joita voi häiritä transkription verkoissa. Näistä toimista huolimatta on vielä parantamisen varaa. Integrointi multi-omiikka tiedot auttavat meitä kehittämään in silico malleja, jotka ovat lähempänä todellisuutta, parantaa tarkkuutta syöpään liittyvien geenin tunnistaminen, ja tarjota entistä kattavampi käsitys molekyyli patologian syövän.

Tässä tutkimuksen ehdotimme puitteet rakentamiseen Integrated Co-muutos verkko (ICAN). Me integroitu proteiini-proteiini-vuorovaikutuksen tieto ja tulospareille kopioluvun DNA metylaatio ja geenien ilmentymiseen 574 munasarjanäytteiden. Kanoninen korrelaatio analyysi (CCA) käytettiin analysoimaan -korrelaatiot genomista, transcriptomic ja epigeneettiset tasolla, joka on perusta meidän verkkoon. Erityisesti meidän lähestymistapa voi paitsi tunnistaa geeni pareja, jotka ovat yhteistyössä muuttunut yhdellä tasolla, mutta myös geeni paria monitasoisen co-muutos. Huomasimme, että

CHEK1

,

IGF1 R

,

ISG15

,

MSH3

ja

PODXL

olivat yhteistyössä muutettiin vuoden kopioluku , ilmaisun ja metylaatiotasoilla samanaikaisesti. Aktiivisesti muutos verkosto geenejä voidaan tehokkaasti arvioida vahvuutta yhdistyksen välillä geenien eri tasoilla. Keskittimessä geenit tässä verkossa ehdottaa solunsisäisen vuorovaikutusta ja monimutkaisia ​​tehtäviä. Suoritimme sitten toiminnallinen analyysi ja eloonjääminen analyysi vahvistaa ehdokas syöpään liittyvien geenien tunnistaa satunnainen kävelyä. Toistuvassa testaus korrelaatioita vihdoin saatu 17 geenin muutoksia kanssa ennusteen arvioinnissa.

kanoninen korrelaatio analyysi menetelmää käytetään yleensä analysoida korrelaatio kahden ryhmän välillä muuttujia. Toisin kuin Pearsonin korrelaatiokerroin, CCA voidaan tehokkaasti paljastaa lineaarinen riippuvuus kahden ryhmän muuttujien jotta voisimme mitata geenien korrelaation käyttämällä useita ominaisuuksia. Vertasimme yhteistyössä muutos verkon kanssa yhden tekijän korrelaatio verkko (koekspressoimalla verkko, co-CNA verkko, co-metylaatio verkko) näkökulmasta moduulit, ja löysi moduulit integroiva menetelmällä olivat kompaktimpi ja merkittävämpää (p-arvo = 2.2e-16). Toiminnalliset rikastaminen analyysi geenien moduulien osoitti, että ne olivat rikastettu tiettyjen toimintojen, kuten solujen apoptoosin, solusyklin ja syövän polkuja.

Tutkimalla syöpään liittyvien geenien ja niiden keskinäisiä suhteita, työmme on kuitenkin arvokas järjestelmätason teoreettisen pohjan diagnoosin, hoidon ja lääkekehityksessä alalla bioinformatiikan. Työmme korostaa integroitava, ja antaa klinikan tutkijoille uutta tietoa molekyylimekanismeihin tumorigeneesin ja etenemiseen.

Materiaalit ja menetelmät

Data

Level 3 aineisto geeniekspression, kopioluku ja DNA: n metylaatio varten samat munasarjasyöpä näytteet (taulukko 1) saatiin julkisesti saatavilla TCGA verkkosivuilla (https://tcga-data.nci.nih.gov/tcga/). Gistic2.0 käytettiin analysoimaan kopioluvun aineisto (Level 3) tunnistamista varten toistuvien alueiden kopioluvun muutos ja kopioluvun geenien. Beta arvot DNA: n metylaatio ovat jatkuvia, jotka vaihtelevat 0 (metyloitumaton) 1 (täysin metyloitu). Koetin tunnukset kartoitettiin Gene symbolien kanssa merkintä taulukon Illumina Human-Methylation27 alustan, joka havaitaan metylaatio taso 27578 CpG loci sijaitsevat läheisimmän promoottorialueet transkription aloituspaikat 14495 geenejä. Jos oli useita koettimia, jotka vastaavat samaa geeniä, otimme keskimäärin intensiteetti Mittapäiden kuin beeta-arvo geenin ja poistetaan koettimet ilman arvoa tai vastaavaa geeniä. Valitsimme K-lähimmän naapurin perustuvaa menetelmää, joka moititaan puuttuvat arvot geeniekspressioprofiilien, joka pantiin täytäntöön R paketti (imputoidaan). Lisäksi olemme lisänneet luettelo näytteet oheismateriaali (katso S1 taulukko).

integroida HPRD [17], Reactome [18], MSKCC Cancer Cell kartta, ja NCI /Nature Pathway Interaction Database [19], Pathway -yhteisvaikutustutkimukset ja proteiini-proteiini-vuorovaikutuksen tuloksia käytettiin luomaan alkuperäisen verkkoon. Pathway aineistoja Reactome, NCI /Nature Pathway Vuorovaikutus tietokanta, ja MSKCC Cancer Cell Map ladattu Simple Interaction Format (SIF) muodossa Pathway Commons, proteiini-proteiini vuorovaikutus data on ladattu HPRD. Human Tausta Network (HBN) oli yhtenäiset neljän aineisto. Samanaikaisesti tarpeeton reunat ja itsensä yhdistetty reuna poistettiin (taulukko 2).

HBN rakensimme koostuu geenien ja vuorovaikutukset muodot solmujen ja reunat. Vuorovaikutus heijastavat toiminnallinen yhdistysten välillä kaksi geeniä, kuten fyysinen vuorovaikutus tai epäsuoran vuorovaikutuksen kautta yhteisen reitin.

Olemme saaneet 973 siemenen geenejä (S2 taulukko) neljästä vakiintunut syöpää ja tauteja liittyvä geeni tietokannat: Cosmic [20], GAD [21], OMIM [22] ja phenopedia [23]. Munasarjasyöpä siementen geenit määriteltiin tunnettuja onkogeenejä tai tuumorisuppressorigeeneille liittyy syövän tunnettu tietokantoja. Työnkulun lähestymistapamme on esitetty kuvassa. 1 ja lisätietoja annetaan seuraavassa osassa.

Difference analyysi geenien yhdellä tasolla

Gistic2.0 [24] käytettiin analysoimaan kopioluvun aineisto tunnistaa toistuvat alueet kopioluvun muutos ja kopioluvun geenien. Olemme tunnistaneet useita toistuvia polttoväli somaattisten kopioluvun muutos (SCNA) tapahtumat, mukaan lukien 55 merkittävää monistukset ja 48 poisto huiput. SAM [25] algoritmia sovellettiin kaksi munasarjanäytteiden (kasvain /normaali) tunnistamiseksi differentiaalisesti ilmentyvien geenien: tunnistimme 549 erittäin ilmentyvien geenien ja 805 matalan ilmaisi geenejä, jotka ilmentyvät differentiaalisesti syöpä (fold muutos = 2 ja väärien löytö määrä (FDR) 0,05). DNA metylaatio data tunnistimme erittäin merkitsevä (FDR 0,005) erilaisesti metyloituja geenien Tuumorinäytteissä verrattuna normaaliin näytteitä käyttäen Mann-Whitneyn-Wilcoxonin testi, mukaan lukien 1445 hypermetyloitunut geenejä ja 1219 hypometyloidut geenejä.

Rakentaminen integroidun yhteistyön muutos verkon ja suorituskyvyn vertailu

samanaikaisesti käyttää useita ominaisuuksia geenien ja luoda korrelaatio geenien genomin, epigenome ja transcriptome tasolla, suunnittelimme kehyksen, joka perustuu CCA, tilastollinen menetelmä analysoida korrelaatio toisistaan ​​kaksi satunnaismuuttujien. CCA voi kääntää tavallisen korrelaatio kahden muuttujien kanoninen korrelaatio kaksi muuttujaa. Tarkoituksena CCA on etsiä maksimointi korrelaatio kaksi lineaarista yhdistelmää muuttujista [26, 27].

Tässä työssä ominaisuuksia geenien nähtiin satunnaismuuttujien; mahdollisuus kahden geenin ollessa yhteistyössä muuttuneet kaikilla tasoilla mitattiin sitten seuraavalla menetelmällä.

määritelty kaksi geeniä: g

1, g

2. Oletetaan, että

G

1 = [g

1

(1), g

1

(2) …, g

1

(p)]

T

,

g

2 = [g

2

(1), g

2

(2) …, g

2

(p)]

T

, ja molemmat vektorit koostuvat

p

mukaisia ​​tietoja g

1 ja g

2. Tässä tutkimuksessa asetimme

p = 3

.Take

G

1

esimerkiksi:

g

(1) B merkitään ilmaus arvoja g1 näytteissä,

g

1

(2) B merkitään kopiomäärän arvoja g1 näytteissä, ja

g

1

(3) B merkitään metylointi arvot g1 näytteissä. Samoin voimme määritellä

G

2

.

Anna,

Sitten kovarianssimatriisin määritellään :, jossa kukin osa lasketaan kaavalla (1).

(1)

Käytämme korrelaatio lineaarisen yhdistelmän vektoreiden (eli

TG

1, b

TG

2) mittaamiseen lineaarinen suhde G

1 ja G

2.

rakentaminen ICAN toteutettiin etsimällä suurin korrelaatiokerroin

U = a

T

G

1

ja

V = b

T

G

2

(2)

Ratkaisuja optimoinnin ongelma (2) täyttivät:

Var (a

TG

1) = 1, Var (b

TG

2) = 1

.

tarkoituksena oli saada sopivin

ja

b

siten, että

corr

(U, V), oli suurin. Ensimmäinen pari lineaariyhdistelmiä kutsuttiin ensimmäinen pari kanoninen muuttujien; niiden suurin korrelaatio

ρ

(U

1, V

1) kutsuttiin ensimmäinen kanoninen korrelaatio. Seuraavaksi, jos on olemassa

k

ja

b

k

sellainen, että seuraavat ehdot täyttyvät:

oli korreloi aluksi K-1 pari kanoninen muuttujien

korrelaatiokerroin ja se on suurin.

kutsuttiin ensimmäinen K parin kanoninen muuttujien ja

ρ (U

k, V

k) B kutsuttiin ensimmäiseen K kanoninen korrelaatio. Tässä tutkimuksessa asetimme K = 3. Rayleigh osamäärä matriisi :.

Ensimmäinen korrelaatiokerroin on yhtä kuin neliöjuuri suurimman ominaisarvon

λ

1

matriisin R. Vastaavasti, ensimmäinen K korrelaatiokerroin on yhtä kuin neliöjuuri suurimman ominaisarvon

λ

k

matriisin

R

. Tämän jälkeen lineaarinen korrelaatiokerroin (

ρ

1,

ρ

2,

ρ

3) laskettiin välillä jokainen geenipari datasarjassa.

Canonical korrelaatio on jatkoa tavallisten korrelaatio; se voi mitata korrelaatio kahden muuttujaa [28]. Verrattuna yhdellä tietotyyppi, se osoitti enemmän tarkkuutta kvantifiointia lineaarisen suhteita geenien käyttävät eri ominaisuuksia [29]. Seuraavaksi edellisiin teoksiin [29], käytimme chi-neliön mittaamiseksi onko kanonisen korrelaatiokerroin (

ρ

1,

ρ

2

ρ

3) [30] oli merkittävä.

nollahypoteesi on H

0:

λ

k

= … =

λ

p

= 0

Anna P

k on

p

-arvon K: nnen testimuuttuja

T

k

, jossa :, ja

T

k

~ [29], jossa

n

on näytteiden lukumäärä. Lopuksi, käytimme yhdistelmä painot (3) määrittää painon reunoihin yhdistää kaksi geeniä, (3) Jos

Lopullinen paino

ω

, edustaa korrelaatio geenien lisää tarkasti.

ω

toimenpiteiden mahdollisuutta kahden geenin ollessa yhteistyössä muuttaa tasosta kopioluvun DNA metylaatio ja geenien ilmentymisen. Sitten liitetään painoa HBN ja rakennettu integroidun yhteistyön muutos verkon kutsutaan ICAN. Menetelmä voi mitata vahvuutta yhdistyksen välillä geenien monilla tasoilla. Tässä työssä olemme toteuttaneet CCA menetelmää ja chi-neliö-pohjainen tilastollisen merkittävyyden testi kirjaston ”CCA” ja ”Chi-square test” R tilasto-ohjelmalla.

Samalla olemme laskettu Pearsonin korrelaatiokerroin ilmaisun profiilien (kopiomäärä profiilit ja metylaation profiilit) välillä jokainen pari geenien ja perusti koekspressoimalla verkko (GCE), co-kopiomäärä verkko (GCC) ja co-metylaatio verkko (GCM). Tämä prosessi toteutettiin myös R tilasto-ohjelmalla. Vastaamaan paremmin suorituskyky meidän verkkoon, vertasimme ICAN ja CNAmet, ja välillä kolme yhden tietoverkkojen.

tunnistaminen ehdokas munasarjasyöpä liittyvien geenien

satunnaiskulku kanssa käynnistyy uudestaan ​​[31] on lajittelualgoritmi. Se simuloi prosessin kävely askel askeleelta siemenestä solmut suoraan naapurin solmuja; Verkon solmut paremmuusjärjestykseen todennäköisyydet saavuttaa solmun. Olettaen

W

on vierusmatriisi on ICAN ja

P

t on vektori, jonka i: ​​nnen elementin pitää todennäköisyys saapuu solmussa

i

at vaihe

t

, random walk laskettiin mukaan

(4)

jakauma arvot siementen solmujen alkuperäisen todennäköisyys vektori

P

0 asetettiin yhtenäinen, jossa summa todennäköisyydet yhtä suuri kuin 1;

r

edustaa todennäköisyys uudelleen siemen- solmuja, joka oli asetettu 0,7. Sen jälkeen N vaiheita, tämä todennäköisyys saavuttaa vakaan tilan, joka määritettiin eroa

P

t ja

P

t + 1. Suoritimme iterointi kunnes L1 normi niiden välillä alittanut 1E-10. Random Walk kanssa käynnistyy uudestaan ​​todennäköisyys kaikkien geenien verkon laskettiin. Sitten analysoimme ero muuttaminen top 20% geenit eri tasoilla.

Kaplan-Meier selviytymisen analyysi ehdokkaan syöpään liittyvien geenien

epäparametrinen Kaplan-Meier estimaattori sovellettiin arvioida vaikutusta eri tekijöiden elinaika. Tässä työssä, tutkimaan mahdollisia ennusteen arvioinnissa Tunnistettujen kandidaattigeenejä, käytimme ”survival” paketin

R

tilastojen ohjelmisto.

p

-arvo 0,05 ja FDR 0,25 käytettiin cutoffs tilastollisen merkitsevyyden jonka log-rank-testi.

Tutkimme muuttaminen kunkin geenin näytteissä, ja diskretoidaan kolme aineistoja mukaan ominaisuuksien onkogeenien ja tuumorisuppressorigeeneille eli , vahvistus, yliekspressio, hypometylaatio; ja käänteinen: poisto, alhainen ilmaisun ja hypermetylaation, vastaavasti. Kopio numero data otimme tulokset GISTIC2.0 erillisten kopioluvun puhelut. Näytteet luokiteltiin geenin homotsygoottinen deleetio (-2) tai vahvistus (1/2). Sillä geenien ilmentyminen tietojen laskimme keskiarvo ja keskihajonta (SD) kunkin geenin: arvot, jotka olivat suurempia kuin keskiarvo + SD pidettiin yli-ilmentymisen. Sitä vastoin niitä arvoja, jotka olivat pienempiä kuin keskimääräinen-SD pidettiin heikkoa ilmentymistä. Sillä DNA: n metylaatio data, asetamme kynnys perustuu empiirinen analyysi beeta-arvon jakaumat: beeta-arvo on alle 0,2 katsottiin hypometylaatio; arvo on yli 0,8 pidettiin hypermetylaation.

tunnistaminen toiminnalliset moduulit ICAN

toiminnallisia moduulit ICAN ja rakennettu kolme yhden verkot käyttävät Mcode [32]. Käyttö MCode on edullinen helpottaa vertailua ICAN ja kolme yhden tekijä verkoissa, koska sama moduulit tunnistettiin painottamaton verkkoon. Reuna-painotus menettely suoritettiin erikseen kullekin verkkoon, ja M tulokset kunkin moduulin laskettiin scoring kaavaa (ks Additional tiedosto S4 taulukko lisätietoja). Toimiva rikastamiseen analyysi suoritettiin ehdokas syöpään liittyvien geeniperimä ja geenit moduulin sisäpuolella käyttäen DAVID työkalulla [33] (https://david.abcc.ncifcrf.gov/).

Tulokset

ICAN on ominaisuuksia monimutkaisten verkkojen

integroitu yhteistyössä muutos verkko on edustettuna suuntaamaton painotettu kuvaaja, jossa solmut edustavat geenejä ja reunat yhdistävät solmut edustavat korrelaatiot yhteistyön muutos geenien välillä . Ensinnäkin hyödyntäen ihmisten välistä vuorovaikutusta tietojen ja reitin tuntemus, perustimme HBN joka käsitti 9195 solmut ja 65720 reunat.

574 munasarjasyöpä kasvain näytteet, on olemassa 11384 geenejä, jotka ovat läsnä kaikissa kolmessa profiilit kopio numero, promoottori metylaatio ja geenien ilmentymisen. Mukaan CCA, me sitten lasketaan painon jokaisen kahden geenien mittaamaan niiden lineaarinen korrelaatio kolmen ominaisuuksia. Seuraavaksi reunat verkossa oli määrätty painot ja geenit eivät sisälly molekyyliprofiilien poistettiin. Lopulta, rakensimme ICAN, joka koostui 6345 solmut ja 40125 reunat. Mitä lähempänä

ω

on 1, sitä suurempi on korrelaatio näiden kahden geenin välissä. Lisäksi käytimme Pearsonin korrelaatiokerroin geeni-ilmentymisen, kopioluvun ja DNA: n metylaatio rakentaa kolme saman kokoinen verkoissa.

Verkon topologia on tärkeä rooli biologisten toimintojen ja toimitettuun tietoon verkkoon. Tutkittuaan ominaisuuksia topologiaa huomasimme, että ICAN osoitti mittakaavasta rakenne, joiden teho-laki jakelu solmun astetta. Tämä tarkoittaa sitä, että ICAN sisältää vain pieni määrä solmuja, joiden aste on korkea, mikä viittaa siihen, että on tärkeää, että navan solmuja. Sitten levitetään painotetun satunnainen kävely menetelmää tunnistaa napa solmuja. Tämä menetelmä voidaan tehokkaasti optimoida ehdokas tautigeenejä ja tarkasti ennustaa ehdokas avain geenejä syövän.

ICAN parantaa tarkkuutta priorisoida ehdokas syöpään liittyvien geenien

ICAN sisältää 604 tunnetaan munasarjasyöpä liittyviä geenejä, joita käytettiin kultakannasta juoni vastaanottimeen operaattori ominaiskäyrät, ja laskea käyrän alapuolisen alueen (AUC). Perustuen viisinkertaisen cross validointi, valitsimme 80% geeneistä siemeninä geenejä; loput 20% oli varattu lopullinen validointi. Todistaakseen tarkkuutta menetelmämme, käyttäen samoja tietokokonaisuus, me soveltanut CNAmet menetelmä ennustaa onkogeenien ja kasvainten synnyssä, ja vertasivat tuloksia kanssa ICAN lopputulokseen. Tämän seurauksena, AUC-arvo on CNAmet oli huomattavasti pienempi kuin AUC-arvo ICAN (ICAN: Max AUC = 0,8179; CNAmet: AUC = 0,5183, p-arvo = 3.158e-14, kaksi ensimmäistä arkkia S5 taulukko) (Fig. 2). Merkitys ero AUC kaksi ROC käyrät määritettiin DeLong n testin ”proc paketti” [34].

musta viiva ICAN, punainen katkoviiva CNAmet. Vaaka-akseli on vääriä positiivisia, pystysuora akseli on tosi positiivinen korko.

tarkemmin ennustaa syöpään liittyvien geenien munasarjasyöpä, käytimme painotettu satunnainen kävely laskentatapana läheisyys välillä muut solmut ja siemenet geenit määrittää korrelaatioita onkogeenien. Tätä menetelmää kutsutaan usein nimellä ”syyllisyyden-by-suora-yhdistys” periaate, jolla geenejä, jotka liittyvät tautiin geenit ovat yleensä samankaltaisia ​​toimintoja. Me satunnaisesti Valitsimme geenien ICAN siemeninä geenejä, ja niitä verrattiin alkuperäiseen tuloksia. Tämä prosessi toistettiin 1000 kertaa; mukautettua

p

-arvo alle 0,05 katsottiin merkitseväksi syöpään liittyvien geenien. Toisaalta, vertasimme ero asteen [35] ja geenin pituus kandidaattigeenien ja muita geenejä. Viimeaikainen tutkimus on osoittanut, että suurempi geeni pituus aiheuttaa usein enemmän verkkotunnuksia käännetyssä proteiineja, mikä johtaa suurempaan interaktiivisuutta, mikä tarkoittaa suurempaa mahdollisuutta geenin ollessa syövän geeni [36]. Tulokset osoittivat, että ei vain olivat siellä merkittäviä eroja geenin pituuden ehdokas syöpään liittyvien geenien verrattuna muiden geenien (

p

-arvo = 2.64E-02, Fig. 3, S6 taulukko), mutta lisäksi tulokset olivat samanlaiset kannalta geenin asteen (

p

-arvo = 6.176E-07).

Fig. 3 (a), vaaleanvihreä edustaa kandidaattigeenit, harmaa edustaa muita geenejä ICAN, ja pystyakseli edustaa astetta geenejä. Kun Fig. 3 (b), vaaleanvihreä edustaa kandidaattigeenit, harmaa edustaa muita geenejä ICAN, ja pystyakseli edustaa pituutta geenejä.

Lopuksi tunnistettiin 155 ehdokas syöpään liittyvien geenien (S7 taulukko), ja analysoitiin yhteistyössä muutos tapahtumien näistä geeneistä yksityiskohtaisesti. CHEK1, IGF1 R ja MSH3 annettiin samanaikaisesti muuteta yhteiseen kaikilla kolmella tasolla; CHEK1, IGF1 R, MSH3 ja FANCA annettiin samanaikaisesti muutettiin vuoden kopioluku ja ekspressiotasot; ja CHEK1, FGF18, IGF1 R, IGFBP1, IGFBP2, MSH3, Plau, RAD51 ja EIF2AK2 olivat yhteistyössä muutettiin tasolla DNA: n metylaation ja ilme.

CHEK1, FANCA ja RAD51 osallistuvat tarkastukseen keskeytyskohtia solusyklin asetuksen ja korjaus prosessi, ja tärkeitä rooleja joko p53 signalointireitin tai MAPK signalointireitille. MAPK signalointireitin on tärkeä syövän koulutusjakson aktivaatio tämän reitin voi edistää endoteelisolujen proliferaatiota ja angiogeneesiä. Juuri muodostettujen verisuonten voitaisiin tarjota enemmän ravintoaineita kasvainsoluja, kiihdyttää tuumorin kasvua ja edistää syöpäsolujen lisääntymistä [37]. MSH3 ja IGF1 R on tärkeitä rooleja DNA kahdentuminen, rekombinaatio, ja korjaus. Puute yhteensopimattomuuden korjauksen, erityisesti menetyksen ilmaisun seitsemästä tärkeimmät geenit (MSH2, MSH3, MSH6, MLH1, MLH3, PMS1 ja PMS2), voi lisätä riskiä munasarjasyöpä [38].

Lisäksi analysoimme ero osuus top 20% geenejä ICAN satunnaisesti kävelyä. Kuva. 4 osoittaa, että osuus ero metylaatio oli korkein kunkin pylvään parhaan joukkoon 100; kuitenkin vain kaksi geeniä ovat samanaikaisia ​​ero muutoksia kaikilla kolmella tasolla. Numerot geenien vain yhden tyyppisen muutoksen (CNA, ero metylointi tai erilainen ekspressio) olivat 13, 19 ja 18, vastaavasti. Huomasimme, että määrä geenejä, jotka eri tavoin muuttuneet monilla tasoilla taipumus vakauttaa jälkeen top 600, joka osoitti, että todennäköisyys näiden geenien on paljon suurempi, mikä viittaa siihen, läheisempi suhde tunnettuihin siemeniä geenejä.

valittu TOP 20% geenin ICAN Random Walk, jokainen pylväs edustaa lukumäärää ero muutos geenien. GE edustaa geenejä, jotka olivat olleet vain ilmennetty eri Tuumorinäytteissä vastaavasti CN edustaa muuttaminen geenikopiomäärä; DM edustaa DNA: n metylaatio; GD edustaa geenien ilmentyminen ja DNA: n metylaatio; GC edustaa geenien ilmentyminen ja kopioluku; CD edustaa kopiomäärä ja DNA: n metylaatio; GCD edustaa geenien muuttunut kolmessa ominaisuuksia.

Muutos geenin yhdellä tasolla edustivat kopiomäärä poikkeavuus, differentiaalikaavojen tai ero metylaatio, vastaavasti (S3 taulukko, levyt 1-3).

Novel syöpään liittyvien geenien munasarjasyövän voivat vaikuttaa säilymiseen

vaikutusten arvioimiseksi kandidaattigeeneihin potilaan selviytymistä, ja etsiä genomista ja epigeneettiset genomista liittyviä ominaisuuksia potilaiden ennusteeseen, haimme selviytyminen analyysi arvioida osuus 6 ominaisuuksia kullekin 155 geenien (930 yhteensä ominaisuuksia) on elinaika. Havaitsimme kuusi merkittävää kasvaimia synnyttävän riskitekijöitä ja 11 merkittäviä tuumorisuppressorigeeni tekijät (S8 taulukko).

Mielenkiintoista, vaikutukset homotsygoottisia deleetioita kandidaattigeenien eloonjäämiseen ei ollut merkittävä. Me arveltu, että se voisi johtua heterogeenisuus kasvain näytteitä. Vaikka korkea ilmentyminen PDPN ei ollut erityisen merkittävä vaikutus huonoon ennusteeseen (

p

-arvo = 7.80E-04, FDR = 0,12, Fig. 5). Syöpäsolut korkea PDPN ilme on korkeampi pahanlaatuinen potentiaalia takia tehostetun verihiutaleiden aggregaatiota, joka edistää muuttaminen solun liikkuvuus, etäpesäke ja epiteelin-mesenkymaalitransitioon [39]. Aiemmat tutkimukset ovat osoittaneet, että yli-ilmentyminen PDPN fibroblasteissa merkittävästi korreloi huonon ennusteen munasarjasyöpäpotilailla [40].

vasemmanpuoleisessa paneelissa, punainen viiva edustaa näytteiden PDPN korkea-ilmaisun ja vihreän linjan

Vastaa