PLoS ONE: Integrative Network Biology: Graph prototypointi Co-Expression Cancer Networks
tiivistelmä
Verkko-analyysi on osoittautunut hyödylliseksi biologisesti suuntautuneita alueita, esimerkiksi tutkia dynamiikkaa ja monimutkaisuus biologisten verkkojen. Tutkiminen joukko verkkojen avulla johtuvien yleistä tietoa taustalla topologinen ja toiminnallisia ominaisuuksia. Integroiva analyysi verkkojen tyypillisesti yhdistää verkot eri tutkimuksista joka tutkii samoja tai samankaltaisia tutkimuksen kysymyksiä. Jotta suorittaa integroiva analyysi on usein tarpeen vertailla ominaisuuksia vastaavia reunojen poikki keräämiseen. Tämä tunnistaminen yhteisten reunojen on usein hankala ja laskennallisen intensiivinen. Tässä esitämme lähestymistapa on erilainen kuin päätellä uudesta perustuva verkko yhteisiä piirteitä. Sen sijaan valita yhden verkon kuvaaja prototyyppi, joka sitten edustaa joukko vertailukelpoisten verkon objekteja, koska se on vähiten keskimääräinen etäisyys kaikkiin muihin verkkoihin samat. Me käyttökelpoisuuden osoittamiseksi kuvaajan prototyyppien lähestymistapa joukko eturauhassyövän verkkojen ja joukon vastaavan hyvänlaatuinen verkoissa. Olemme lisäksi osoittavat, että etäisyydet syöpä ryhmän ja hyvänlaatuiset ryhmä ovat tilastollisesti erilaisia riippuen käytetystä etäisyyden toimenpide.
Citation: Kugler KG, Mueller LAJ, Graber A Dehmer M (2011) Integrative Network Biology: Kaavio prototypointi Co-Expression Cancer Networks. PLoS ONE 6 (7): e22843. doi: 10,1371 /journal.pone.0022843
Editor: Dongxiao Zhu, University of New Orleans, Yhdysvallat
vastaanotettu: 22 maaliskuu 2011; Hyväksytty: 30 Kesäkuu 2011; Julkaistu: 29 heinäkuu 2011
Copyright: © 2011 Kugler et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Hanke tukivat Tiroler Zukunftsstiftung ja Tiroler Wissenschaftsfonds. Tämä työ oli myös rahoittivat COMET Centerin ONCOTYROL ja rahoittaa liittovaltion liikenne- Innovation and Technology (BMVIT) ja liittovaltion talous- ja työ- /liittovaltion talous-, perhe- ja nuoriso (BmwA /BMWFJ), Tiroler Zukunftsstiftung (TZS) ja valtion Steiermarkin edustaa Styrian Business Promotion Agency (SFG). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
monien sairauksien enää yksittäisten geenien toimivat merkki, mutta joukko vuorovaikutuksessa geenien voidaan luonnehtia tai diagnosoida patologinen prosessi [1]. Driven by että rationaalinen joukon uusia data-analyysimenetelmiä noussut viime vuosina, koska tarve menetelmille, jotka pystyvät kaapata liittyvän monimutkaisuutta syntyi. Yksinkertainen esimerkki on etsiä kohteita, jotka ovat erittäin liitetty muita esineitä ja ne voivat siksi olla keskeinen rooli säätelytoimia. Verkko-analyysi [2] biologista tietoa on yksi liittyvä kenttä systeemibiologiaa [3]. Kun taas klassinen tietojen analysointi verrattuna johtui reductionistic näkökulmasta Nykyaikainen verkko biologian pyrkii hahmottamaan data kokonaisvaltaisesti [3]. Käyttämällä verkkojen avulla jättäen staattinen etsintä yksi piirre kerrallaan ja mahdollistaa tutkimus on realistisempi dynaaminen luonne biologisten ja lääketieteellisten tietojen. Dynamiikka hajallaan useita ulottuvuuksia, kuten järjestelmät muuttuvat ajan mittaan [4], reagoida häiriöihin [5] tai yksinkertaisesti koostuvaa biologisiin toimintoihin, jotka ovat toisiinsa sidoksissa monimutkaisissa laskeutuu [6]. Samalla yhdistetään eri tietolähteiden on tullut tavanomainen käytäntö modernin laskennallisen biologian. Olipa avulla tiedon integroinnin tai klassista meta-analyysissä, että paljon työtä on vielä pantu standardoimalla lähestymistapoja, jotka mahdollistavat integroiva analyysi [7]. Integratiiviset lähestymistapoja lisäämään tietopohjaa uudet havainnot yhdistämällä tietoja eri lähteistä. Klassisessa mielestä tiedon integroinnin viittaa integroinnin tietoja luonteeltaan erilaisia (esim. Geenien ilmentyminen ja proteomiikka). Tässä Tässä asiakirjassa, meidän viittaavat myös integraation samantyyppisiä tietoja kuin tietojen integroinnin.
Tutkimus yhdistämiseksi verkkoon biologian ja integroiva tietojen analysointi on kukoistanut viime vuosina [8] – [10]. Tämä mahdollistaa johtuvat yleistyksiä joukko erilaisia verkkoja, jotka tutkia samoja tai samankaltaisia tutkimuksen kysymyksiä. Tällaiset yleiset havainnot voidaan käyttää vastattaessa biologisia kysymyksiä tai luoda uusia hypoteesi taustalla prosesseja. Mittaaminen samankaltaisuuden verkkojen on osoittautunut hyödylliseksi arvioitaessa systemaattista vaikutusten ajankulku metabolisia verkkoja [8], vastaa sääntelyn vuorovaikutusta [9] tai tunnistamiseksi vastaavien subgraphs pareittain verkkojen [10]. Toinen sovellus vertailevan verkko analyysi on systemaattinen vertailu kahden yhdistyksen verkot, jotka karsittiin osittaista korrelaatiota [11]. Silti, havaitsemiseen ja inferring tietoa yhteisistä ominaisuuksien joukko verkkoja on haastava tehtävä, koska vertaamalla verkkojen määritelmästä riippuu taustalla samankaltaisuus toimenpide. Kuitenkin samankaltaisuus esineitä ei ole yksikäsitteisesti määritelty, koska monipuolinen näkökohtia, kuten rakenne, toiminta ja semantiikka ovat mukana [12]. Siksi on tarpeen löytää vastaavia ominaisuuksia biologisissa verkoissa. Usein tämä tapahtuu havaitsemalla yhteinen reunoja tai kärkipisteet, ja verrataan niitä tai niiden jakaumat [13], [14]. Voit käsitellä mielekkäästi vertailla biologisten verkkojen monta tapaa on kehitetty. Voimme tässä vain esittää pieni valikoima eri lähestymistapoja ja niiden sovelluksia. Piruzian et ai. itsenäisiin topologinen informaatio integroida transcriptomic ja proteomiikka datan listalla perustuva lähestymistapa [15]. Yleistynyt muoto asteen jakelun, nk graphlet aste jakelu, voidaan soveltaa määritettäessä verkon samanlaisuuden [16]. Graphlets käytettiin myös yhdenmukaistaa PPI verkkoihin ihmisen ja hiivan [17]. Tilastollinen vertailemiseksi suuri taudin verkkoja päätellä kohdunkaulan syövän käyttäen puun hajoaminen ja linjaus tekniikka oli ehdotettu myös [18]. Tässä keskitymme soveltamisesta vertaamalla verkkoja, jotka ovat peräisin samantyyppisiä tietoja ja käytetään esityksiä varten luokan yksilö. Siksi analysoimme joukko yhdistyksen verkkojen johdettu eturauhassyöpään geenien ilmentyminen tietoja. Hyödyntämällä tätä yhdistelmää on mahdollista johtaa yleistä tietoa verkko-pohjainen liittyvät havainnot tiettyjen sairauksien tai kehitykseen valtioissa. Yhteinen lähestymistapa ongelmaan analysoida verkon ominaisuuksien avulla meta-analyysi on vertailla päällekkäisyys reunojen eri verkoissa. Me osoittanut hyödyllisyytensä verkkoon integrointihankkeet aiemmassa tutkimuksessa [19]. Samanlaista lähestymistapaa yhteiskäytössä reunojen antoivat Cootes et al. [10]. Vaihtoehtoinen menetelmä esitti Wang et al., Joka hyödyntää tietoa vaikutus koon yhdistämään tietoa joukko verkon [20]. Tämä lähestymistapa edellyttää tietoa siitä, millaisia vaikutuksia koon olevan saatavilla. Havaitsemaan yhteiset reunat verkossa on haastava tehtävä, jos mitään kunnon kartoitus kärki tarrojen on käytettävissä. Harkittaessa ilmentäminen rinnakkain verkot, kärki tarrat viittaavat geenin nimiä. Jotta tuottaa yleisnimi tilan poikki eri verkoissa, se on siis hyödyllistä kartoittaa tutkimuksittain, alustasta riippuvainen geenin tunnisteet muiden tunnisteiden esim Entrez geenin tunnisteet.
Tässä artikkelissa osoittaa vaihtoehtoisen lähestymistavan johtopäätöstä yhteisiä topologinen ominaisuuksia joukon verkkoja. Täällä kuvaaja prototyyppien voidaan ymmärtää menetelmää, joka valitsee olemassa olevan verkon joukko verkkojen edustajana varten täydellinen, suhteessa taustalla kuvaajan etäisyys toimenpide [21]. Tämä tarkoittaa sitä, että rakenteellinen kaavio prototyyppi edustaa topologinen ominaisuuksia täydellinen verkkojen tehdyn valinnan kriteeri, joka on määritelty kaavion etäisyyttä toimenpiteitä. Kaavamainen esimerkki valitsemiseksi kuvaajan prototyyppi on esitetty kuvassa. 1. Huomaa, että muut määritelmät kuvaajan prototyyppien kuten ns konsensus puu [22] on myös tutkittu. Mutta ne ei käsitellä tässä asiakirjassa. Siten tämä prototyyppi verkko voidaan sitten käyttää suorittamaan topologinen analyysi ja päätellyt uutta tietoa, koska se edustaa ominaisuuksia kaikkien muiden verkkojen samat. Yksi vahva pisteen tämä menetelmä on, että havaitaan yhteinen reunat tai solmut voivat tulla tarpeeton, riippuen palveluksessa kuvaajan etäisyys toimenpiteitä. Sitten, on tärkeää käyttää kuvaajan etäisyys toimenpide, jonka laskennallinen monimutkaisuus on polynomi. Toteuttaa kuvaajan prototyyppien, valitsemme oikea kuvaaja etäisyyden toimenpiteet, jotka pystyvät on mielekkäästi määrällisesti etäisyys kahden verkoissa. Osana panos kuvaamme neljä etäisyyttä toimenpiteitä, jotka perustuvat todennäköisyysjakaumiin verkon ominaisuuksia. Tämä on toinen vahva pisteen tätä menetelmää, koska se voidaan modifioida käyttää muita, räätälöityjä kuvaajan etäisyys toimenpiteitä. Osoittaakseen valinta kuvaajan prototyypin [21], [23] käytämme eturauhassyövän geeniekspressiotutkimuksissa. 25% vasta diagnosoitu mies syövistä Yhdysvalloissa ovat eturauhasen syöpiä [24], mikä tekee siitä houkuttelevan kohteen jatkuvaa biolääketieteellisen tutkimuksen. Laaja valikoima tutkimuksia on tehty viime vuosina, ja suuri osa vastaavat tiedot on käytettävissä yleisillä tietovarastojen [25] – [27]. Käytämme menetelmää asettaa seitsemän eturauhassyövän tutkimuksissa [28-24], jotka koostuvat syöpänäytteissä ja näytteitä hyvän- tai tervettä kudosta. Odotamme kaksinkertainen tulos: Ensin odotamme tärkeitä rakenteellisia eroja hyvänlaatuinen ja syöpä tutkimukset hyödyntämällä topologinen toimenpiteitä. Toiseksi, odotamme merkittäviä eroja etäisyydet syöpä tietoverkkojen ja etäisyydet hyvänlaatuinen tietoverkot. Tämä voisi osoittaa, että ei ainoastaan verkkojen itse vaihtelevat, mutta että myös samankaltaisuuksia näiden kahden ryhmän välillä on eroja. Jos näin on, patogeeninen prosesseja, jotka johtuvat syöpä ovat todennäköisimmin vastuussa selittää näitä havaintoja. Perustuen aiempaan työhön [19] odotamme tarkkailla korkeampi yhtäläisyyksiä sisällä syöpä ryhmässä. Tarkemmin sanottuna odotamme etäisyyksillä tietokokonaisuuksista syövästä ryhmä olla pienemmät kuin hyvälaatuisesta set.
Tämä kuvio kuvaa kaavamaisesti johtamista kuvaajan prototyyppi.
paperi on järjestetty seuraavasti: kun ”data ja menetelmät -osiossa esittelemme hyödynnetään aineistoja ja päättelyn prosessi verkkojen. Sitten kuvaamme kuvaaja prototyyppien lähestymistapa ja palveluksessa kuvaaja etäisyyden toimenpiteitä yksityiskohtaisesti. Osiossa ”tulokset” on yhteenveto ja kuvataan saatuja tuloksia. Osiossa ”Keskustelu ja Outlook” päättyy paperi keskustella tuloksemme ja seuraa joidenkin loppuhuomautuksia.
Materiaalit ja menetelmät
Eturauhassyöpä Data
osoittaa kaavion prototyyppien lähestymistapa käyttäen joukko eturauhassyövän tutkimuksia. Koska tämä syöpä on perusteellisesti tutkittu viime vuosina yhä useammat geenien ilmentyminen tietoja käden julkisessa arkistot. Sillä esitteli tutkimuksen kartoituksen tallennusjärjestelmään NCBI GEO [25], EBI Arrayexpress [26] ja Oncomine [27] toteutettiin. Sisällytettäväksi analyysimme tutkimukset on raportoitava geeniekspressiotasot eturauhassyöpää ja hyvänlaatuisia näytteen avulla mikrosiruja. Hyvänlaatuiset näyte ovat joko näytteitä normaalista kudoksesta vieressä kasvaimia tai terveille miehille. Me siivota metastaattinen lomakkeet syöpänäytteissä tälle tutkimukselle vähentääkseen heterogeenisuus verkoissa. Solulinja ekspressiotietojen myös ulkopuolelle. Vähentää tietojen valmistelu ja kartoitus työtä me vain kuuluu Affymetrix microarray alustoille tässä tutkimuksessa.
käydä tätä analyysiä valitsemme seitsemää tietomääriä [28] – [34] tiedoista altaan luetellaan taulukossa 1. vaikutuksen tutkimiseksi otoskoko sisällä tutkimuksia tuloksemme laaja otoskoot (pienistä tutkimuksista suuremmat) on sallittu. Valinnan jälkeen tutkimukset voidaan sisällyttää, me uudelleen suorittaa microarray esikäsittelyä. Annetut otoskoot taulukossa 1 viittaavat jälkeinen laadunvalvonta tilassa. Jotta välinen tutkimus vertailun geenien, alkuperäisen tunnisteet kartoitetaan Entrez geeni tunnisteiden avulla biomaRt paketti [35] varten Bioconductor [36]. Aina kun useita probesets kartta yhteen Entrez geeni tunniste, säilytämme mittaus korkein varianssi. Tämän jälkeen kartoitus 8906 geenien yhteinen kaikissa seitsemässä tutkimuksessa jätetään tarkempaa analysointia varten. Johtamiseksi sopiva verkko esitys tietojen luomista yhdistyksen verkostojen valittiin. Kuitenkin menetelmät esitetty alla ovat sovellettavissa moniin muihin verkon tyyppiä myös, jos hyväksytään oikein.
Verkko päättely
päätellä oikea verkko esitys pohjatiedot on merkittävä haaste verkkoon perustuva tutkimus [37] – [39]. Laaja valikoima verkko esityksiä biologisten tietojen olemassa [39] – [41], ja kuvaaja prototyyppien esitetyn menetelmän jäljempänä voidaan soveltaa useimpiin niistä. Täällä käytämme tietoa yhdistyksen kahden geenejä. Tuloksena verkot kutsutaan tästä syystä yhdistys verkoissa. Johtopäätöstä ja analysoimalla geenin ilmentyminen tietoja yhdistyksen verkot, koekspressoimalla suhteet ovat usein hyödynnetty [42]. Huomaa, että yhdistys ei välttämättä tarkoita syy-yhteyttä. Yksi tapa ratkaista tämä ongelma on soveltaa tarkoitetun syy jäsenyyksiä [43], jossa geenit on toiminnallisesti luokiteltu.
Täällä käytämme keskinäistä tietojen mittana yhdistyksen, kuten on kuvattu [39 ]. Päättelemiseksi verkkojen geenistä ekspressiotietojen, me hyödyntää MRNETB algoritmin [38]. Perustamaan aineistoja valitsemiseksi kuvaajan prototyyppi, päättelemme kaksi verkkoa kustakin tutkimus. Yksi verkko, joka perustuu tietojen hyvänlaatuinen näytteiden tutkimuksessa, ja yksi verkko syöpä näytteistä samassa tutkimuksessa. Tämä johtaa 6 hyvänlaatuinen verkkoihin, ja 7 syöpä verkkoja poistamme hyvänlaatuinen verkko Wang tiedot. Tämä tehdään johtuen pienestä näytteen koosta (), koska pidämme johdettua verkon olevan juurikaan luotettavuutta. Yleensä päätellä verkon jokaiselle potilasryhmässä erikseen mahdollistaa suorittaa topologinen vertailuja ja siten aiheutuvien uusia oivalluksia taustalla toiminnallisia eroja.
Valinta Graph Prototype
yleistää kuvaajan samankaltaisuus ongelma [ ,,,0],21], se on osoittanut Dehmer et al. että yksi kuvaaja voidaan käyttää edustamaan joukko muita vastaavia kaavioita [21]. Tehtäväksi päättää tämän ns kuvaaja prototyyppi voidaan ratkaista soveltamalla etäisyyden tai samankaltaisia toimenpiteitä [21], [44]. Antaa on verkko, ja olla kuvaaja etäisyyden toimenpide. Ottaa joukko verkoissa kuvaaja prototyyppi voidaan ilmaista [21], [23], [45] 🙁 1) Näemme, että yhtälössä. 1 antaa keskimääräinen etäisyys verkon kaikkiin muihin verkkoihin. Merkitään tätä. Tavoitteemme Tässä asiakirjassa on soveltaa valikoima kuvaaja etäisyyden toimenpiteiden valintaa kuvaajan prototyyppejä sarjasta eturauhassyövän verkkojen ja joukon vastaavan hyvänlaatuinen verkoissa. Soveltamalla eri kuvaaja etäisyyden toimenpiteitä tarkoittaa, että voimme kattaa erilaisia näkökohtia rakenteellisen samankaltaisuuden. Yleensä se on vielä ratkaisemattoman mitä osa rakenteellisen samankaltaisuuden taustalla toimenpide kaappaa [44]. Jos eri kuvaajan etäisyys toimenpiteitä valita samassa verkossa kuin kuvaaja prototyyppi joukon verkkoja, tämä lisää pätevyyttä valinnan. Suhteessa työllisten etäisyyden toimenpide kuvaaja prototyyppi edustaa topologinen ominaisuuksia muihin verkkoihin mistä samat. Näin ollen voidaan käyttää suorittamaan topologinen ja toiminnallinen analyysi.
Kaavio Etäisyys Toimenpiteet
Jotta suorittamiseksi kuvaaja prototyyppien on tarpeen mielekkäästi mitata etäisyys kahden verkoissa. Tässä momentissa esittelemme kaksi lähestymistapaa toteutuksessa tähän tehtävään. Ensimmäinen lähestymistapa perustuu käyttäen epätarkkoja kuvaajan matching. Erityisesti valitsemme ns kuvaaja muokata matkan (
GED
) [46]. Toinen lähestymistapa perustuu vertaamalla kahta erillistä jakaumat [47], jotka on päätellyt johtamalla rakenteellisia ominaisuuksia verkkojen.
GED
on pienin kustannukset sekvenssin transformoidaan kaavio toiseen kaavion avulla muokkaustoimintojen (poistamalla ja lisäämällä reunat tai poistamalla, lisäämällä ja korvaamalla kärjet) [46]. Perusongelmana (vertailla kahden kuvaajan rakenteellisesti) voidaan nähdä yleistys Levenshtein menetelmällä [48] vertailla jousille. Yleensä laskettaessa
GED
varten (merkitsemätön) kuvaajat on laskennallisesti vaativa, koska se on NP täydellinen [49]. Meidän tarkoitus monimutkaisuutta voidaan vähentää johtuen kolme seikkaa [50]: i) Kaikki verkot on sama määrä (kytkemättä) kärkipisteet, ii) kaikki kärkipisteet on merkitty yksilöllisesti, ja iii) valitsemalla ainoastaan geenit esiintyy kaikissa tutkimuksissa, kaikki verkot on sama joukko solmuja, mikä vapauttaa meidät poistamisen, lisäämällä tai korvaamalla mitään kärjet. Siten laskennallisen monimutkaisuuden vähentämiseksi on [49]. Mittaamiseksi etäisyydet kahden verkon, käytämme normalisoitu muoto, joka saadaan prosenttiosuus
GED
(
pGED
) [51] 🙁 2) missä on määrä mahdollisimman reunat on, ja tekijä viittaa ei-suunnattu luonne reunat. Me paino kaikki jäljellä muokkaa muunnokset (lisätä, poistaa) yhtä nimeämällä painosta.
Tietopohjainen theoretic lähestymistapa kvantifioivien välimatkat kuvaajia voidaan määritellä perustuen Kullback-Leibler eroavuus (
KLD
) [47]. Määrittelemme kaksi erillistä todennäköisyysjakauman ja siten, että
KLD
annetaan [47] 🙁 3)
KLD
määritellään aina positiivisesti välinen etäisyys ja. Ota huomioon, että . Koska
KLD
on epäsymmetrinen ja ei täytä kolmioepäyhtälö, se ei ole metrinen [52]. Me sitten laskea kaavion prototyypin asettamalla sen
KLD
yhtälössä. 1. Numerolla stabiliteetti on taattu asettamalla todennäköisyydet nollasta.
yleensä jakelua, joka on usein käytetty Systems Biology on aste jakelu. Vuonna Suuntaamattoman verkoissa aste on se määrä naapureita varten kärki. Jos määrittelemme olevan pisteiden lukumäärä naapureiden, voimme saada todennäköisyysjakauman siten, että: (4) missä on maksimimäärä naapurimaiden pisteiden. Kuva. 2 näkyy, missä määrin jakaumat hyvänlaatuinen ja syöpä verkoissa. voidaan käyttää kuvaamaan verkkoon [9], [42], [53] – [55], ja sen on osoitettu olevan mittakaavasta ja seurata teho-laki jakelu eritasoisten biologisten verkkojen [42], [ ,,,0],53] – [55]. Virta-laki jakaumat astetta voidaan nähdä kuvassa. 2. Täällä käytämme laskea
KLD
, jota siis kuvaamaan niin.
Aste jakaumat hyvänlaatuinen data (ylhäällä) ja syöpään liittyvät tiedot (alhaalla). Näyttämällä syistä leikattu määrä laskee 300.
Etäisyydet hetkellä toinen näkyvä verkon muuttumaton. Jotta kärki etäisyyttä kaikkiin muihin kärkipisteet annetaan (5) missä on lyhin tie välillä kärkipisteet ja. Jos me anna on kardinaliteettia kaikkien etäisyydet pituuden kanssa, sitten mukaan matkan ajossa annetaan (6) missä on polkujen lukumäärä. Näemme, että. Huomaa, että on halkaisija, joka on enintään lyhin välisten polkujen kaikki parit solmujen. Etäisyyden jakaumat verkoille on esitetty kuvassa. 3. Palveluksessamme etäisyyden jakaumia mukana verkostoja, jotta määrällisesti etäisyys kahden verkon, jota merkitään.
etäisyyden jakaumat hyvänlaatuinen data (ylhäällä) ja syöpään liittyvät tiedot (alhaalla).
Vaikka kolmen etäisyyden toimenpiteitä, esitimme yläpuolella täydellinen, vailla verkko analysoitiin, nyt esillä kaksi etäisyyttä toimenpiteitä, jotka työskentelevät kytketty vain kaaviot. Tämä tarkoittaa, että meidän täytyy päätellä suurin liitetyn aligraafi jokaisen verkon ja soveltaa kahden etäisyyden toimenpiteitä. Kolmas jakelu että me sisällyttää meidän
KLD
-pohjainen etäisyyksien perustuu Vertex todennäköisyyksien [56]. Kärkipiste todennäköisyys pitää todennäköisenä arvon kärkipiste hyödyntämällä ns Vertex toiminnallinen [56] 🙁 7) Näemme, että. Tässä tutkimuksessa käyttää seuraavia kärki toiminnalliset [56] 🙁 8) pisteiden lukumäärä on nnen alalla annetaan joka kärkeen niin [56]. Näemme, että perustuu metrinen ominaisuuksiin kuvaajat [57]. Tässä annamme painotuskertoimet pienenee eksponentiaalisesti. Tämä antaa meille mahdollisuuden korostaa kärkipisteet melko lähellä, koska ne ovat todennäköisesti vahvempia aikaan tietoa, joka leviää ulos [56].
Lopuksi käytämme jakelu joka voidaan laskea käyttäen topologinen tietosisältöön perustuvat vertex kiertoradat [58], [59]. Radalle sisältää topologisesti vastaava kärkipisteet [58], ja antaa tietoa pisteiden lukumäärä kuuluvien nnen kärki kiertoradan [58]. Me täällä määrittää todennäköisyysjakauman summaamalla määrä kiertoradat jakavat saman pisteiden lukumäärä verkon sisällä. Antaa on määrä kiertoradat sisältävien kärjet. Jos on huippupiste kiertoradat sitten saamme kiertoradalla jakelu (9) Huomaa, että jos on summa lukumäärän kiertoradat sisältävät saman solmujen lukumäärä. Tieto jakautumisesta topologinen vastaavien pisteiden jokaisen meidän verkot voidaan sitten käyttää yhdistämään tietoa joukko verkkojen perustaminen. Kutsumme tätä niin.
Jokaisella näistä neljästä esitetään jakaumat voimme kattaa erilaisia näkökohtia topologinen ominaisuuksia meidän verkoissa. Todennäköisyys jakelu perustuu tietoa siitä, miten kytketty geenit kussakin verkot ovat. Tietoa viestintä etäisyydet geenien heijastuu jakauma, jota käytetään. perustuu todennäköisyysjakauma, joka kuvaa tiedon jakaminen verkossa, kun taas todennäköisyys jakautuminen heijastaa topologinen vastaavuus solmujen. Taulukossa 2 on yhteenveto työllisten etäisyys toimenpiteitä. Otettuaan käyttöön meidän muodollinen laite, laskemme etäisyydet ja kuvaaja prototyyppi kahden näytteen ryhmää (hyvänlaatuinen ja syöpä). Laskelmien ja tilastollinen analyysi voimme hyödyntää tilastollista ohjelmointikieli R (https://www.r-project.org). Todennäköisyys jakaumat laskea ja lasketaan käyttämällä QuACN paketti [60].
Tulokset
Taulukossa 3 on yhteenveto keskiarvon etäisyydet viisi etäisyyden toimenpiteet sekä kaksi ryhmää . Laskettaessa näemme, että keskimääräinen etäisyys kuuden verkkojen vaihtelee olevassa hyvänlaatuinen ryhmässä, ja sen seitsemän verkkojen syöpä ryhmässä. Keskimääräiset arvot ovat (hyvänlaatuinen) ja (syöpä). Kuva. 4 esitetään kuvaus kaikista yksittäisen etäisyydet yhdestä verkon kaikille muille samassa ryhmässä. Eroa jakelun välillä syöpä ja hyvänlaatuinen näyte voidaan nähdä. Sillä hyvänlaatuinen ryhmä, verkko, joka perustuu tietoihin Yu on valittu kuvaajan prototyyppi, kun taas syöpä ryhmä verkon muodostavat Wang data on valittu. Keskimääräinen etäisyys Yu tiedot sekä Wang datan. Verkko-erityinen keskimääräinen etäisyys vaihtelee ja että verkkojen hyvänlaatuinen data, vastaavasti eturauhasen syöpään liittyvät tiedot. Keskimääräiset arvot ovat (hyvänlaatuinen) ja (syöpä). Kuva. 5 visualisoi tuloksia. Valitut kuvaaja prototyypit ovat Yu (hyvänlaatuinen), jonka keskimääräinen etäisyys ja Wang (syöpä), jonka keskimääräinen etäisyys. , Joka perustuu matkan ajossa verkon sisällä, valitsee verkkojen Singh data (hyvänlaatuinen) ja Wang tiedot (syöpä) kuin kuvaajan prototyyppejä. Käyrä prototyypit on keskimääräinen etäisyys (hyvänlaatuinen) ja (syöpä). Keskimääräinen etäisyydet yhdestä verkon kaikille muille samoissa ryhmissä kullekin joukolle ovat (hyvänlaatuinen) ja (syöpä). Yksityiskohtaiset tulokset on esitetty kuvassa. 6. verkkoja Yu (hyvänlaatuinen) ja Wang (syöpä) ovat jälleen valittu kuvaajan prototyyppejä käytettäessä. Pienin on hyvänlaatuinen kuvaajan prototyyppi, vastaavasti syövän kuvaajan prototyyppi. Keskimääräiset arvot ovat (hyvänlaatuinen) ja (syöpä). Etäisyydet yhdestä verkosta kaikkiin muihin verkkoihin samassa ryhmässä ollessa esitetty boxplots kuvassa. 7. Yhdessä tämä merkitsee kahdessa tapauksessa, joissa matkan sisällä syöpä data on suurempi silloin sisällä hyvänlaatuinen tiedot. Jotta toimenpide perustuu kiertoradat etäisyyksien Kaavion prototyypit ovat hyvänlaatuinen Yu verkkoon ja syöpä verkko, joka perustuu Wang tietoihin. Keskimääräinen etäisyydet ovat (hyvänlaatuinen) ja (syöpä), kuten on esitetty kuviossa. 8.
Tämä kuvio havainnollistaa etäisyydet yhdestä verkosta kaikkiin muihin verkkoihin, jotka perustuvat normalisoitu Graph Edit Etäisyys
pGED
. Vasemmalla puolella se kuvaa etäisyyksiä yksi hyvänlaatuinen verkko ja kaikki muut hyvänlaatuinen verkoissa, kun taas oikealla puolella se luettelee etäisyydet yhden syövän verkon kaikkiin muihin syövän verkoissa. Verkot, jotka valitaan kaavion prototyypit korostetaan eri väreillä (hyvänlaatuinen = sininen, cancer = ruskea).
Tässä osoitamme etäisyydet yhden verkon ja kaikkien muiden verkostojen boxplots mitattuna Kullback-Leibler eroavuus, joka perustui asteen jakeluun. Vasemmassa osassa osoitamme hyvänlaatuinen tiedot ja oikea osa etäisyydet syöpätietojen. Käyrä prototyypit korostetaan.
Tämä luku näyttää etäisyydet verkkojen boxplots. Etäisyydet perustuvat jakautumisesta etäisyydet kärkipisteet ja Kullback-Leibler eroavaisuuksia. Vasemmassa osassa ovat etäisyydet hyvänlaatuinen verkkojen ja oikeassa osassa etäisyyksien syövän verkoissa.
Täällä näyttää etäisyydet perustuvat Kullback-Leibler eroavuus, joka perustuu pallo kärki funktionaalien. Vasemmassa osassa osoitamme hyvänlaatuinen näytteistä ja oikea osa etäisyydet syöpä näytteitä. Valitut kuvaaja prototyyppejä korostetaan.
Tämä kuvio havainnollistaa Kullback-Leibler erot varten kiertoradalla jakaumat. Vasemmalla puolella se luetellaan hyvänlaatuinen näytteet, ja oikeassa osassa syöpä näytteitä tutkimuksista.
Tärkein hypoteesi on, että on olemassa merkittävä ero etäisyyksien ryhmässä syövän näytteitä ja etäisyydet ryhmässä hyvänlaatuinen näytteitä. Sillä tämän hypoteesin testauksessa käytämme Wilcoxonin testi (katso taulukko 4) kullekin viidestä etäisyyden toimenpiteitä joukko etäisyyksillä syöpänäytteissä ja hyvänlaatuinen näytteitä. Me korjata useita testausta Bonferronin menetelmällä. ,, Esiintyy merkittävä ero (), kuten voidaan nähdä taulukossa 4. havaitut tulokset tukevat hypoteesia, katso boxplots vuonna siihen liittyvät kuvat.
havaitsemiseksi kuvioita sisällä joukko etäisyyksien käytämme klusterointi. Siksi me normalisoida tuloksena jokainen etäisyys toimenpiteen ilman ryhmän tiedot. Tämä tehdään jokaiselle etäisyys toimenpiteen erikseen niin, että vähintään kunkin etäisyyden toimenpiteen on asetettu ja maksimista. Sitten sovelletaan hierarkkinen klusterointi. Kunkin verkon olemme piirrevektorin, joka koostuu keskimääräinen etäisyys kaikkiin muihin verkkoihin kustakin viidestä käyttää etäisyyden toimenpiteitä. Joten, yleisestä klusterointi meillä on matriisi, jossa 5 riviä ja 13 saraketta. Vastaava heatmap käyttäen euklidista etäisyyttä ja täydellinen sidos, on esitetty kuviossa. 9. Olemme myös soveltaa keskimäärin nostolaitteen kuten klusterointi toiminto, joka johtaa samaan tulokseen. Siksi pitävät havaittu tulos vakaiksi osalta näiden kahden sidoksen toimintoja. Tulokset osoittavat, että kolme syövän verkkojen (Tsavachidou, Wallace, Singh, Liu) muodostavat erillisen ryhmän, kun taas kaikki muut verkot ovat ryhmittyneet yhteen. Toisessa klusterissa vietämme että kolme syövän verkkojen (Chandran, Wang, ja Yu) klusterin tiiviisti kolmeen hyvänlaatuinen verkkoihin (Yu, Singh, Tsavachidou).
täällä näyttää keskimääräinen etäisyys yhdestä verkosta muut verkot samassa ryhmässä (hyvänlaatuinen tai syöpä). Sillä klustereiden me sitten pois ryhmän tiedot. Me itsenäisesti lisätä ryhmän tiedot ruskeana baaria (syöpä) ja siniset palkit (hyvänlaatuinen).
tulosten perusteella kuvaajasta prototyyppien valitsemme verkko Yu tietojen kuvaaja prototyyppinä hyvänlaatuinen asettaa, ja verkko Wang tietojen kuvaaja prototyyppi syövän asetettu. Analysoimiseksi topologinen ominaisuuksia verkkojen tutkimme navan geenejä. Jakauma 15 enimmäkseen liitetty napa astetta on esitetty taulukossa 5. Huomaamme, että tärkein napa geenien syövän verkossa ovat huomattavasti pienempiä kuin hyvänlaatuinen verkossa. Tämä on tunnettujen tulosten josta meillä sovellettu reuna ääntenlaskenta varten integroiva verkon analyysin [19]. Tässä tutkimuksessa olemme myös havaittu melko pieni astetta yleisin syöpä verkkoon. Häiriöstä navan geenejä, jotka liittyvät solu- syklin, voi olla merkittävä rooli kehityksessä aggressiivisen muodon eturauhassyöpä [61]. Vastaavia muita mittakaavasta verkkojen [62], [63], biologiset verkot voivat olla alttiina hyökkäyksille vastaan harvoista keskeinen napa geenejä. Kuitenkin on äskettäin osoitettu, että napa geenit eivät välttämättä katsota olevan hauras, ja että muita toimenpiteitä tämä ominaisuus saattaa olla sopivampi [64]. Analysoidaan etäisyydet kärkipisteet sallii luonteenomaiset viestinnän prosessit biologisessa verkossa. Siksi tutkimme väliset etäisyydet pisteiden kahden kuvaajan prototyyppejä. Määritelmän, epäkeskisyys kärkipiste on enintään lyhin polut kaikkiin muihin kärkipisteet. Sillä hyvänlaatuinen kuvaaja prototyyppi enemmistön vertices on on, kun taas syöpä kuvaajan prototyyppi enemmistön vertices on 1. Vertaamme epäkeskisyys jakaumia kahden verkon kanssa Kolmogorov-Smirnov testi, mikä johtaa erittäin merkittävä ero (). Toinen mielenkiintoinen verkon ominaisuus on verkon halkaisija, joka on suurin kaikista. Kahden kuvaajan prototyypit halkaisijat ovat 17 (hyvänlaatuinen) ja 12 (syöpä).