PLoS ONE: päättelemällä Temporal Order of Cancer geenimutaatioita Individual Kasvain Näytteet

tiivistelmä

ajallinen järjestys syövän geenimutaatioita kasvaimissa on olennaista ymmärtämiseksi ja hoitamiseksi sairauden. Olemassa olevat menetelmät eivät pysty päättelemään, jotta mutaatioiden, jotka tunnistetaan samanaikaisesti yksittäisten tuumorinäytteissä, jolloin heterogeenisyys järjestyksessä tuntematon. Tässä osoitamme, että läpi monimutkaisen verkoston lähestymistapaa, joka perustuu äskettäin määritelty tilastollinen –

Karsinogeneesi tiedot johtavuus

(CIC), ajallinen järjestys yksittäiset näytteet voidaan tehokkaasti päätellä. Tulokset viittaavat siihen, että kasvaimeen synnyssä ehkä useammin aloittaa järjestyksen mutaatioiden kuin onkogeenien, ja jokainen syöpätyyppi voi olla oma ainutlaatuinen järjestyksessä mutaatioita. Alkuperäinen mutaatiot näyttävät omistettu hankkia toiminto kiertää apoptoosin, ja jotkut järjestys rajoitukset saattavat heijastaa mahdollisia säännönmukaisuuksia. Lähestymistapamme on täysin tietoperusteisissa ilman parametriasetukset ja voidaan odottaa tehokkaammin kuin enemmän tietoja tulee saataville.

Citation: Guo J, Guo H, Wang Z (2014) päättelemällä Temporal järjestys Cancer Gene Mutaatiot Yksittäiset Kasvain Näytteet. PLoS ONE 9 (2): e89244. doi: 10,1371 /journal.pone.0089244

Editor: Raya Khanin, Memorial Sloan Kettering Cancer Center, Yhdysvallat

vastaanotettu 22 lokakuuta, 2013 Hyväksytty: 20 tammikuu 2014; Julkaistu: 27 helmikuu 2014

Copyright: © 2014 Guo et ai. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Natural Science Foundation of China alle apurahan no. 61273217; Kiinan 111 ohjelma ”Advanced Intelligence ja Network Service” alla avustusta ei. B08004. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Zhanyi Wang on China Mobilen tutkimuslaitos, mutta tämä ei muuta kirjoittajien noudattaminen kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja.

Johdanto

syöpä on geneettinen sairaus aiheuttama mutaatio syövän geenien koostuu onkogeenien ja kasvaimen synnyssä. Useimmissa syöpätapausta, useita mutaatioita esiintyy menettely tunnetaan kasvaimen eteneminen [1], [2]. Ymmärtämään syövän etenemiseen, tutkimuksia ei ole tehty malli yleisiä säännönmukaisuuksia ajallista järjestystä mutaatioiden tietyn syöpätyypin käyttäen sekä kokeellisia ja laskennallisia lähestymistapoja [3] – [7]. Koska kanoninen malli, järjestys mutaatioiden ja peräsuolen syöpä on rekonstruoitu läpi kasvaimen koon ja luokka [8]. Uusin laskennallisten mallien päätellä tyypillinen ajallinen järjestys rajoituksia tietyntyyppisen syöpien simuloimalla syövän etenemistä kuin stokastinen prosessi [9] – [11]. Tästä edistyksestä huolimatta vieläkään ei ole hyvin määritelty menetelmä päätellä järjestyksessä mutaatioiden tunnistettu samalla yksittäisten näytteiden vaikka tämä päätelmä on tarpeen paljastaa heterogeenisuus järjestyksessä mutaatioiden syövän. Viime aikoina uuden sukupolven sekvensointi tulee laajasti sovellettu, mutaatio maisemat eri syöpien paljastetaan yksi kerrallaan. Tulokset ovat osoittaneet, että mutaatiot syövän usein osoittamaan tilastollisia korrelaatioita keskenään tai jopa aiheuttaa-seuraus sidoksia induktion välillä sekä näiden [12] – [18]. Nämä korrelaatiot /yhteyksiä ei ole täysin hyödynnetty päätellessään ajallisen järjestyksen mutaatioiden.

From tietotekniikkaan näkökulmasta tämä tutkimus määrittelee tilastollinen mittaus määrittää arvon korrelaatiot tai sidoksia edellä mainitut ja mallintaa mutaatiot monimutkaisessa verkossa, jonka kautta ajallista järjestystä mutaatioiden yksittäiset näytteet voidaan päätellä. Me kutsumme mittaus

Karsinogeneesi tiedot johtavuus

(CIC), joka mittaa tavoitettavuutta siirtämään tietoa syövän geeniin mutaatio transkriptioprosessin tietyn YK-mutatoitunut syövän geeni aiheuttaa sen mutaatio. Tilastollisesti tavoitettavuutta voidaan arvioida yksittäisen tapahtuman taajuudet ja juokseva co-esiintymistiheys kahden geenin mutaatioiden syöpänäytteissä. Lisäksi kilpailu lähettämät tiedot useista muuntunut geeneistä annettuun YK-mutatoitunut geeni olisi myös pidettävä tahansa onnistunut lähettäminen aiheuttaa kohdegeenin muuntua, mikä päätti mutaatio prosessi. Tässä tutkimuksessa, jota kutsumme tahansa kaksi mutaatiota selville samassa syövän näytteestä yhteistyössä ilmeneviä mutaatioita. Vaikka useimmat genomista tutkimukset antavat tästä määrästä epäsuorasti, täällä pyrimme disentangling sekvenssin esiintymisen kaksi mutaatiotapahtumaa yksinkertaisesta co-esiintymiseen. Näiden sekvenssit mutaation esiintyminen, peräkkäinen co-esiintymistiheys voidaan laskea (materiaalit ja menetelmät). Perustuu ajatukseen, olemme määritelleet CIC syöpään geenistä

i

syöpään geeni

j

kuten: (1) jossa () on esiintyminen taajuus mutaatio geenin

i

(

j

) syövissä, on peräkkäinen yhteistyössä esiintyminen taajuus mutaatio geenin

i

seuraa mutaatio geenin

j

, ja on prioriteetti geenin

i

verrattuna muihin mutantti geenejä lähettää tiedot geeni

j

. Olemme todenneet, että. Tässä yhtälössä on joukko syövän näytteiden mutantti geenejä

i

ja

j

, on näytteiden lukumäärä sarjassa, ja on indikaattori funktio, joka on 1 jos mutantti geenejä

j

ja

i

näytteessä. Muuten se on yhtä kuin 0. Vastaavasti korkein prioriteetti yksi osoitetaan jos on suurempi kuin jokaisessa näytteessä asetettu, ja useamman kerran, että mitä suurempi arvon. Pidämme kaava (1) mittana syövän tietojen johtavuus koska suhde on arvio suurimmasta mahdollista, että geeni

i

lähettää syövän synnyn tiedot geeni

j

ja aiheuttaa sen mutaation suhde on arvio suurimmasta mahdollisuus, että mutaatio geenin

j

aiheuttavat syövän synnyn saatujen tietojen geenistä

i

, ja on prioriteetti tietoliikenneyhteys verrattuna muihin linkkejä geeniä

j

. Arvo välillä 0 1. Kuten määritelmää

aktivointivoimaa

, mittaus me aikaisemmin ehdotettu painottamalla linkkejä monimutkaisten verkkojen [19] määritelmä CIC noudattaa kaavaa painovoiman jos kuvittelemme suhteet ja koska massoja ja prioriteettia etäisyyttä. Tilastot määritelty tällä tavoin todennäköisesti jakaa niiden arvojen voima laki, joka on kätevä analysoida monimutkaisia ​​verkostoja monimutkaisia ​​suhteita mukaan lukien biology [20] – [24].

Yksi haaste laskettaessa CIC on puute syövän näytteitä, joita voidaan käyttää lähteenä peräkkäisiä co-esiintyminen taajuudet syövän geenimutaatioita, koska mutaatiot eri geenien syövän näytteessä tunnistetaan yleensä samaan aikaan sekvensoimalla. Tähän haasteeseen, esittelemme iterointimenettelyllä että parit CIC laskenta ja päättely todennäköisyys jokainen mahdollinen järjestyksen syövän geenimutaatio. Soveltamalla tätä menettelyä katalogi somaattisista mutaatioista in Cancer (COSMIC) tietokanta [25], [26] paljasti, että iterointi saavutettu lähentymistä vähemmän kuin 10 silmukoita, ja yhtenevät tulokset viittaavat merkityksellisiä tuloksia.

materiaalit ja menetelmät

iteratiivinen päättely järjestelmän

Voit suorittaa iteratiivinen päättely menettely, suuri joukko syöpänäytteissä syöpään geenimutaatioita tunnistetaan genominlaajuisten sekvensointi on tarpeen. Kun aineisto, me määrittää perustilastoihin esiintymisen ja ei-peräkkäisiä yhteistyössä esiintyminen taajuudet syövän geenimutaatioita. Näistä perustilastot, iteratiivisen päättely varten näytteiden lukumäärä kyseessä alkaa ja CIC tuloksia ja todennäköinen tilaukset syövän geenimutaation kunkin näytteen osalta määritellään kun iteraation saavuttaa lähentymistä. Kuva. Kuvio 1 esittää yleiskuvan menettelyä.

(a) esiintyminen ja co-esiintyminen taajuudet syövän geenimutaatioita ja määritetään saatavilla olevat näytteet, joissa, ja se on määrä syövän geenien suunnattu tutkimuksessa . Esiintymisen geenin lasketaan, jos se on mutatoitunut yksi näytteistä, ja co-esiintyminen pari geenien lasketaan, jos molemmat ovat mutatoituja yksi näytteistä; Siksi, ja. (B) Perustuu periaatteeseen suurimman entropian, alkuarvot peräkkäisiä yhteistyössä esiintyminen taajuudet asetetaan. (C) karsinogeneesin tiedot johtavuus,, lasketaan vektorin ja matriisin. On huomattava, että ei ehkä ole yhtä suuri, mikä merkitsee, että matriisi edustaa suunnatun verkon. (D) Kunkin näytteen kyseessä todennäköisyydet jokainen mahdollinen järjestyksen mutantti geenien näytteessä lasketaan mukaan CIC kunkin järjestyksessä (menetelmät). (E) matriisi määritetään uudelleen, että matriisin ja suhde todennäköisyydellä painotettua numero tilausten osoitti, että

i

tapahtuu ennen

j

lukumäärään co-esiintymisen taajuuden , on tärkeää huomata, että ei ole sama kuin yleensä. Jos matriisi ei ole saavuttanut peruste lähentymisen johdettua tilaukset ei pidetä vakaana ja uusi lenkki laskemisen ja tehdään. Muutoin (f), tilaukset todennäköisyydellä yli sattuman ja vastaavat todennäköisyydet ja pidetään viitatun tuloksia. Esimerkiksi kaikista 6 mahdollisia tilaukset näytteen kolme mutantti syövän geenien

,

b

ja

c

, tilaukset ja tunnistetaan todennäköinen niistä johtuvat todennäköisyydet 0,7 ja 0,2 (suurempi kuin satunnainen mahdollisuus 1/6).

Iteratiivinen menettely CIC laskenta ja päättely mutaation järjestyksessä

määritelmän peräkkäinen co-esiintyminen taajuudet on tarpeen arvioida CIC-arvo. Tämä vaatimus ei voi olla tyytyväinen nykyinen tietokantoja, kuten COSMIC. Tämän vaikeuden voittamiseksi, hyväksymme iterointimenettelyllä kytkemään päättely esiintyvän mutaation tilaukset ja laskentaa CIC. Ensin tasaisesti jakaa ei-peräkkäinen co-esiintymisen taajuuden kohdalla kaksi mahdollista peräkkäisen yhteistyössä esiintyminen taajuuksia laskea alkuperäisen CIC. Sitten päätellä mutaation tilaukset alkuperäiseen CIC on repredict peräkkäisen yhteistyössä esiintyminen taajuuksia, toista CIC laskenta ja päättely mutaation tilauksia ennen suppenevan tulos on saatu.

Perustuen periaatteeseen suurimman entropian, me ensimmäinen käyttää yhtenäistä ennen jakautumisen esiintymisen tilauksia, mikä tarkoittaa, että ei-peräkkäisiä co-esiintymistiheys mutaation kahden geenien

i

ja

j

, kaksi mutaatiota tilaukset

i

j

ja

j

i

esiintyy samalla todennäköisyydellä. Sen vuoksi on tarpeen peräkkäinen co-esiintymistiheys on asetettu puolet vastaavan ei-peräkkäisiä taajuus. Tällä asetuksella, laskemme alkuperäisen CIC välillä jokainen pari syövän geenien.

sitten laskea CIC että tilauksen yli kaksi mutantti geenejä hallussaan. Tässä laskenta, on otettava huomioon, että jokainen edellisen geenit voivat lähettää karsinogeneesin tiedot rinnakkain kohdegeenin sisällä järjestyksessä. Siksi me lainata periaatetta Computing resistenssin piiri, joka on rinnakkainen-by-sarja menettely; me summa kaikki rinnakkaiset CIC edellisestä geenien kohdegeenin sisällä, jotta voidaan määrittää

vaihe CIC

tilauksen ja sitten muotoilla

järjestyksessä CIC

CSS kaikki

vaiheen CIC

s. Mieti järjestystä

APC → ATM → KRAS

esimerkkinä; tässä järjestyksessä sisältää kaksi vaihetta tietojen lähettämiseen,

→ ATM

ja

→ KRAS

. Ensimmäisen vaiheen aikana, tiedot voidaan lähettää vain yksi lähde,

APC

. Siksi ,, CIC alkaen

APC

osoitteeseen

ATM

, yksinkertaisesti tulee CIC ensimmäisen vaiheen. Toisessa vaiheessa, kuitenkin sekä

APC

ja

ATM

voi tulla tietolähteen, joka edellyttää summattu kaksi rinnakkaista CIC kuin CIC toisen vaiheen. Kun rinnakkain vaiheen kunkin vaiheen, reciprocals

vaihe CIC

s, pitää vastuksia, jotka sarjatuotantona summata käänteisluku

järjestyksessä CIC

. Vaiheet voidaan tiivistää seuraavasti:

Parallel vaihe

:

Sarja vaihe

:.

k

th geenin järjestyksessä on tiedon saaminen geenin

(k-1) B: nnen vaiheen ja on

k-1

lähettäjät rinnakkaisia ​​tietoja. Tilaus koostuu

n

geenejä on

n-1

vaiheita syövän tietojen johtuminen. Yleensä meillä on yhtälö, jossa on CIC vaiheen

k

, on CIC geenistä toiseen, ja on indeksi geenin asemassa järjestyksessä.

Based määritelmästä CIC, suurempi CIC arvo mahdollisesta tilaukseen liittyy helpompi syövän synnyn tiedot johtuminen sisällä järjestyksessä. Kaikista kilpailevat tilauksista, sitä suurempi CIC tilauksen arvo, sitä suurempi todennäköisyys esiintyminen tilauksen. Siksi oletamme, että CIC tilauksen on positiivisesti verrannollinen todennäköisyys järjestyksessä esiintyvän. Arvioitaessa todennäköisyys jokainen mahdollinen järjestys lineaarikuvaus päässä CIC kaikki mahdolliset tilaukset annetulle mutantti geenejä, yhteensä todennäköisyyksien kaikkia mahdollisia tilauksia on yhtä kuin yksi. Muodollisesti varten näytteen

n

mutantti syövän geenien määrä mahdollisia tilauksia on

n

!; kartoitamme CIC järjestyksessä

m

(

m

= 1, 2, …,

n

!) osaksi todennäköisyys kaavalla

jälkeen määrittää todennäköisyydet kaikkia mahdollisia järjestyksessä mutaatioista, me määrittää uudelleen ennustettu peräkkäinen yhteistyössä esiintyminen taajuudet seuraavasti: missä on todennäköisyys tilauksen

m

näytteen

l

, ja

L

on näytteiden määrä kyseessä. on indikaattori funktio, joka on 1, kun geeni

i

tapahtuu ennen geenin

j

jotta

m

näytteen

l

ja yhtä kuin 0 kaikissa muissa tapauksissa ja on ei-peräkkäinen co-esiintyminen taajuus välillä geeni

i

ja geeni

j

. Jos määritetään uudelleen arvot ovat lähes identtisiä vanhoja tai tulla yhtenevät, lasketut CIC ja näin johdettua järjestys todennäköisyydet voidaan pitää luotettavina tuloksia. Muuten CIC ja tilauksen todennäköisyydet on määritettävä uudelleen uudessa silmukka. Iteratiivinen menettely jatkuu tällä tavalla, kunnes lähentyminen on saavutettu. Käytännössä kriteeriä lähentymistä voidaan katsoa täyttyneen, kun absoluuttinen ero uuden ja vanhan arvot monotonisesti pienenee riittävän pieni arvo.

Koska aloitamme toistuvaa joiden alkuperäinen ennustaminen peräkkäinen co-esiintyminen taajuuksia kuin juokseva esiintyvyys perustuu suurimman entropian periaate, jonka mukaan suurin muutos potentiaali peräkkäisiä yhteistyössä esiintyminen taajuuksien ensimmäistä iterointia, muutos vähenee asteittain ja lopulta tulla merkityksetön. Tämä lähtökohta varmistettiin tutkimuksessa; tyydyttävä lähentyminen saavutettiin alle 10 silmukoita päättely menettelyn avulla joukko näytteitä COSMIC tietokannasta.

Iterointi perustuu COSMIC tietoihin saavuttaa lähentymistä 10 silmukoita. Täällä käytämme laskenta CIC alkaen

KRAS

osoitteeseen

APC

käyttöön menettely yksityiskohtaisesti. Aluksi laskemme esiintyminen taajuudet = 125 ja = 209 ja ei-peräkkäinen yhteistyöstä esiintyminen taajuus = 79 alkaen COSMIC tietokannasta. Määrittelemällä puolet ei-peräkkäinen co-esiintymisen taajuuden (79) kuin juokseva taajuus, toteamme = 39,5. Verrattaessa peräkkäinen yhteistyössä esiintyminen taajuuksia muitakin geenejä

KRAS

geeniin

APC

kussakin 79 näytteen, on todettu olevan keskimäärin luokkaa 1,47. Siksi prioriteetti = 1,47, ja alkuarvo = (39,5 /125) * (39,5 /209) /1.47

2 = 0,028.

käyttäminen alkuperäisen CIC kaikkien syövän geeni paria, arvioimme todennäköisyys jokainen mahdollinen mutaation esiintyminen, jotta määritetään kustakin näytteestä edellä kuvatulla tavalla. Mukaan todennäköisyydet, ei-peräkkäisiä co-esiintyminen taajuuksia voidaan epätasaisesti jaettu juokseva taajuuksilla. Sillä 79 näytteet tässä esimerkissä suhde

KRAS

APC

vs.

APC

KRAS

perustuvat vastaaviin kokonais- todennäköisyys jokainen järjestys on 0,28: 0,72. Siksi päivitämme arvo = 79 * 0,28 = 22,1 ja ensisijaiset Sitten määritetään uudella. Näiden uusien arvojen, me määrittää uudelleen.

lähentyminen ja sen vastine aikana toistojen on esitetty kuvassa. 2. Tämä esimerkki osoittaa, että arvot päässyt tyydyttävään lähentymisen jälkeen vain 6 toistojen. Tämä esimerkki edustaa myös yleinen tilanne, näin me päättyi laskenta CIC jälkeen 10 toistojen tässä tutkimuksessa.

CIC (a) ja sen vastine (b) saavuttaa nopeasti suppenevan kuin toistojen laskenta suoritetaan . Kun 6 toistojen, tyydyttävä lähentyminen on saavutettu.

monimutkaisuus päättelyn menettelyn

CIC laskenta on monimutkaisuus

O

(

n

2) jos määrä syövän geenien tutkimuksessa on

n

, ja päättely todennäköisyyksien kaikki mahdolliset tilaukset näytteessä

m

mutantti syöpä geenit on monimutkaisuutta

O

(

m! m

2). Tutkimuksessamme

n

on yhtä suuri kuin 397 ja

m

vaihtelee välillä 2 8. Siten monimutkaisuus

O

(

m! M

2) voi vaihdella suuresti eri näytteitä. Todellisuudessa aikana päättely, että 1118 näytettä raportoitu tutkimuksessa suurimman osan aikaa oli kulunut muutama näytteiden maksimimäärä mutantti syöpägeenit. On syytä huomata, että menettelyn aikana, meillä on vain laskea CIC kerran kunkin silmukan päätellä tilauksen todennäköisyydet kaikille näytteille. Päätelmä käsittävä 10 toistojen varten 1118 näytteitä saatiin päätökseen 10 minuutin sisällä lavalle koostuu PC (4 * 2,66 GHz Quad CPU) ja Matlab.

Study tiedot

Tulokset ilmoitetaan tässä tutkimuksessa saatiin hiljattain COSMIC tietokanta (myönnetty 12. syyskuuta

th, 2012) koodausta pistemutaatioita. Se on taulukko tiedosto, joka sisältää nimet mutatoidun syövän geenien jokaisessa syövän otokseen. Mutant geenit samassa syöpä on sama kasvain ID (

ID_tumour

), ja aloilla

genominlaajuisten näytön

ja

ensiöpuolella

toimittaa tarvittavat tiedot käytetty tässä tutkimuksessa.

Steps määrittämiseksi esiintymistä ja yhteistyössä esiintyminen taajuudet syövän geenimutaatioita näytteissä

esiintyminen ja yhteistyö esiintyminen taajuudet syövän geenien syövän näytteitä käytettiin arvioida CIC tutkimuksessa, ja perustilastot määritettiin käyttäen seuraavia vaiheita:

Lataa

lähde

tiedosto

CosmicMutantExport_v61_120912.tsv

kautta ftp: //ftp. sanger.ac.uk/pub/CGP/cosmic/data_export/;

Tee

väliaikainen

tiedosto hankkimalla tietueiden arvoa ”

y

” in ”

genominlaajuisten näytön

”kentän

lähde

tiedosto;

Tee

ensisijainen

tiedosto hankkimalla kirjaa syövän geenien määrittelemän tiedoston

Table_1_full_2012-03-15.xls

Cosmic

web-sivuston

väliaikainen

tiedosto, ja parantavien tietueet sekvenssit

Gene_name

ja

ID_Sample

;

Tee

mutation_sequence

tiedostona, jossa kukin tietue on luettelo mutatoidun geenien samasta näytteestä, joka perustuu

ensisijainen

file ja hävitä levy, joka sisältää vain yhden geenin nimi

mutation_sequence

tiedosto;

Count esiintymistä ja yhteistyössä esiintyminen taajuudet syövän geenien perusteella

mutation_sequence

tiedosto.

tulokset

Ominaisuudet arvioidusta CIC

Suoritimme päättelyn syöpään geenimutaatio tietoja genominlaajuisten skannataan kerätyistä näytteistä uudempi versio COSMIC tietokantaan. Kaikkiaan 1212 näytettä kätkeminen 6281 mutaatioita 397 syövän geenien ollut käytettävissä määrittämiseksi perus- esiintymistä ja yhteistyössä esiintyminen taajuuksia. Näistä 1118 näytettä, kukin kätkeminen enintään 8 mutantti syöpä geenit, käytettiin toistuvaa CIC laskennan ja järjestys päättely. Taulukko S1 luettelee 1118 näytettä. Tulokset havaittiin lähentyä 10 toistojen. Sen jälkeen lähentyminen, CIC joiden arvo on yli 1.0e-6 esitteli teho laki kaltainen jakautuminen suuruudet, niin että ylivoimainen enemmistö on suuruusluokkaa vähemmän kuin keskimäärin 4.0E-4 ja hyvin pieni osa on suurempi kuin keskimääräinen suuruus (Fig. 3, taulukko S2). Tämä ominaisuus koskee myös jakeluun suuruuksia CIC välillä (tai) tietyn geenin useimmissa tapauksissa, mikä tarkoittaa, että vain pieni määrä kumppaneita ovat merkittäviä syövän tietojen johtuminen mihinkään tiettyyn geenin. Toisin sanoen, CIC tunnistaa lähimmän kumppanit karsinogeneesissä tiedot johtuminen. Lisäksi suunnattu verkkojen syövän geenien linkittämä CIC olivat epäsymmetrinen ja pieni maailma kaltainen. CIC geenien

i

geenin

j

oli yleensä epätasainen kuin geenien

j

geenin

i

; verkko on useita navan geenien paljon enemmän yhteyksiä kuin normaalisti. Tämä ominaisuus on yhdenmukainen sen havainnon kanssa, että signalointi verkko syövän on analoginen Internet, joka rakentaa pienen maailman napa solmuja [27] – [29]. Kuva. 4 havainnollistaa CIC liittyy kattava 44 syöpä geenit, mukaan lukien napa geenit

APC

,

TP53

ja

MLL3

, ja linkit vahvempi kuin 1.0e-2 osoittaa epäsymmetria . Epäsymmetrisyys CIC merkitsee olemassaolon parempana tietyn mutaation tilauksia. Lisäksi, kolme napa geenit ovat kaikki kasvaimen synnyssä, ja vahvin suunnattu linkki, jonka arvo on 0,136, on peräisin

APC

on

KRAS

, yksi useimmin mutatoitunut onkogeenien , mikä viittaa ylivoimainen tietoa kanavan mutaation

APC

mutaatioon

KRAS

.

CIC yli 1.0e-6 ovat läsnä teho lain kaltainen jakelu; Erityisesti logaritmi on CIC logaritmin funktiona niiden suuruusluokkaa saadaan paloittain lineaarinen suhde. Perustuen kysymykseen, onko teho laki jakelu on tarkoituksenmukaista analysoida monimutkaisten verkkojen ja huoli epäluotettavuudesta aliarvostettu CIC jotka saattavat johtua vara tiedot ainoastaan ​​CIC yli 1.0e-6 oli välittömästi käyttää päättelyn tässä tutkimuksessa . CIC päätellä vähemmän kuin 1.0e-6 korvattiin kynnystä tasoittaa.

Neljäkymmentäneljä usein mutatoitunut syövän geenien (yli 20 genominlaajuisten skannattu näytteiden COSMIC tietokanta) on havainnollistettu kanssa CIC niiden välillä suurempi kuin 1.0e-2. Paksuus linkki on verrannollinen vahvuus vastaavan CIC. Kun pari geenejä on kaksisuuntainen linkit, tiivis yhteys on piirretty suora viiva ja heikomman piirretään kaareva viiva (ks tapauksessa

APC

← →

TP53

) . Epäsymmetria voidaan havaita se, että ei kaksisuuntainen yhteyksiä samanlaisten vahvuuksien välillä geeniä paria, ja

APC

,

TP53

, ja

MLL3

kukin olla napa rooli verkossa.

päättely todennäköinen tilausten

päätellä mutaatio tilaukset todennäköisyydellä yli Sattumiin, kutsutaan jäljempänä

todennäköistä tilaukset

, edellyttäen konkreettisempi oivalluksia syövän etenemiseen. Analysoimme todennäköinen tilaukset päätellä, että 1118 syöpänäytteissä kyseessä tutkia enintään 8 mutaation askeleen päässä aloittamisesta. Ensisijainen sivustot Näytteiden sijaitsevat pääasiassa

munasarjojen

(256),

large_intestine

(

LI

, 180),

haematopoietic_and_lymphoid_tissue

(

HLT

, 148),

eturauhasen

(100),

rintojen

(97),

central_nervous_system

(

CNS

, 86) ja

upper_aerodigestive_tract

(

UAT

, 72).

Taulukko S3 luetellaan kaikki todennäköinen tilaukset ja niiden todennäköisyyksiä tutkituissa näytteissä, ja taulukko 1 esittää osan niistä . Perustuen todennäköiseen tilauksista solmimme että annetussa näytteessä vain pieni osa kaikista mahdollisista tilauksista on todennäköisyys suurempi kuin Sattumiin, ja summa todennäköisyyksien näiden tilausten on lähellä näytteiden määrä suhteella on 1034,4 /1118. Tämä osoittaa, että päättely tunnistettu pieni osa kaikista mahdollisista tilaukset permutoiduista että määrätylle mutantti syövän geenien todennäköinen tilauksia. Näytteen kätkeminen kaksi mutantti syöpägeenit, päättelyn aina viittaa vahvasti siihen, yksi kahdesta mahdollisesta tilauksia. Kuitenkin näytteiden yli kaksi mutantti syöpä geenit, joitakin tilauksia voi olla vertailukelpoinen korkea todennäköisyydet. Vaikka emme voi tuomita yksittäisiä plausibilities on päätelty todennäköinen tilausten puutteen takia maa totuuden tilaukset useimmissa tapauksissa niiden merkitys voitaisiin viittasivat vahvasti siihen arvioimalla päättely näytteitä tietyn syöpätyypin jotka ovat hyvin tutkittu kannalta järjestyksen. Esimerkiksi

APC, KRAS ja TP53

ovat kolme useimmin mutatoitunut geenien paksusuolen syövät, ja niiden mutaatio tilauksia on hyvin mallinnettu [30], [31]. Meidän tulokset, näyte mutantti syövän geenien

APC

ja

KRAS

, tuottivat päätelty todennäköisyys 0,95 tilaukselle

APC

KRAS

, mikä oli yhdenmukainen aiempien tutkimusten. Jotta näyte mutantti

APC, KRAS ja TP53

syöpä geenit, kolme todennäköinen tilaukset

APC → KRAS → TP53

(0,33),

APC → TP53 → KRAS

( 0,32)

ja TP53 → APC → KRAS

(0,19) on päätellä 6 potentiaali niitä, ja tämä tulos oli myös yhdenmukainen aiempien tutkimusten.

BRCA1

ituradan mutaatioita koituu suuri riski rinta- ja munasarjasyövän, mutta somaattisten menetys villityypin

BRCA1

alleeli on osoitettu esiintyy yleensä

jälkeen

mutaatiosta

TP53

[32]. Suostumuksella Tämän havainnon, me päätellä somaattinen mutaatio järjestys

TP53 → BRCA1

todennäköisyydellä yli 0,99. Nämä esimerkit antavat todisteita päättelyn pätevyyttä.

Iniators todennäköisestä mutaation tilausten

tunnistaminen alullepanijoista mutaatio tilauksia on pidetty yhtenä suurimmista haasteista tutkimuksessa kasvaimen eteneminen [1]. Meidän päätellä todennäköinen tilaukset mutaation tarjotaan informatiivinen vihjeitä ratkaisemaan tämän haasteen. Tutkimalla geenit, jotka käynnistävät todennäköinen tilauksia, olemme huomanneet, että initiaattorit hallitsi kasvaimen synnyssä. Selvä enemmistö (yli 77,5%) ja todennäköisyydellä painotettua numero todennäköisen tilausten oli päätellä alkavan kasvain-vaimennin geeni sijaan onkogeeni. Oli 368 syöpä geenit testissä syöpään näytteitä, niiden joukossa vain 92 oli tuumorisuppressoreilla. Tarkemmin sanottuna, oli 1858 mutaatiot tuumorisuppressoreilla keskuudessa täysin 3823 mutaatiot kaikkien syöpägeenit. Siksi keskimääräinen mahdollisuus tuumorisuppressoreilla aloittaa mutaatio tilaukset oli 48,6% (1858/3823). Tämä osoittaa, että ylivoima tuumorisuppressoreilla aloittaessaan mutaatio tilauksia ei voida katsoa johtuvan mahdollisuus. Lisäksi suhteet monta kertaa geeni initiaattori sen mutaation taajuus oli yleensä eri, mikä tarkoittaa, että se ei ole varmaa, että usein mutatoitu geenit muuttua alussa (taulukko 2). Merkittävää on, että todennäköisyydellä painotetun lukumäärän todennäköinen tilausten aloitti kaksi parasta kasvaimeen vaimennin geeni initiaattorit

TP53

ja

APC

, koostuivat prosenttiosuudet yhtä suuri kuin 46,9% ja 11,4%, tässä järjestyksessä . Sen sijaan kaksi ylintä onkogeeni initiaattoreita,

PIK3CA

ja

KRAS

, havaittiin prosenttiosuudet niin pieni kuin 3,1% ja 1,3%, vastaavasti. Top alullepanijoista mutaation kulloisellakin ensisijainen syöpä sivustoja ehdotti lisätietoja (taulukko 3). Yleensä kaikki syövät suurimmilla ensisijainen sivustoja näytteistä paljastui kasvain-vaimennin geeni niiden top initiaattorina. Erityisesti

TP53

oli yhteinen alkuun aloitteentekijä neljässä aikaisemmin luetelluista syöpätyyppejä,

munasarja

,

UAT

,

rinta

ja

eturauhasen

, jossa prosenttiosuudet 91,5%, 73,4%, 57,6% ja 30,4%, tässä järjestyksessä. Vuonna

LI

syöpiä, alkuun alullepanija oli

APC

(57,5%), jonka jälkeen

TP53

(29,7%). Molemmat

CNS

ja

HLT

syöpiä ei ollut ilmeisesti ylivoimainen initiaattorit, jossa

CIC

(13,6%),

PIK3CA

(10,1%) ja

TP53

(10,0%) kuin kolmen parhaan initiaattorit entisen, ja

TP53

(14,9%),

NPM1

(10,4%) ja

MLL2

(9,9%) kuin kolmen parhaan initiaattorit jälkimmäisen. Näkökulmasta initiaattorin jakelun,

munasarja

,

LI

,

UAT

ja

rintasyövän

syöpiä päätellä hallitsevat pieni määrä kasvain -suppressor geenit, kun taas

HLT

,

CNS

ja

eturauhasen

syöpiä päätellä olevan monipuolisempia merkittäviä initiaattorit.

Aiemmat tutkimukset ovat osoittaneet useita tunnusmerkki toimintoja, jotka on hankittu syövän tuottaa, auttaa tutkijoita ymmärtämään monimutkaisuutta syövän etenemisen tapa looginen, tieteellisellä tavalla [33], [34]. Meidän pääteltyihin tulokset viittaavat ehdotus, joka menee askeleen pidemmälle. Useimmissa syövät, aikaisintaan hankittujen tunnusmerkki toiminto saattaa olla

kiertämästä apoptoosin

koska suurin osa ensimmäisen mutatoitujen geenien jokaisessa syöpätyypin taulukossa 3 (

TP53, APC, KRAS, PIK3CA, NPM1

ja

CIC

) on havaittu koodaavan apoptoosia sääteleviä proteiineja, ja mutaatio kaikkien näiden geenien on osoitettu johtavan puutteellinen apoptoosin toimintoja. Tarkemmin sanoen mutaatio

TP53

voi johtaa poistamiseen keskeinen osa DNA-vaurio anturi, joka toimii apoptoosin [33], [34], mutanttimuotoihin APC proteiini voi vaimentaa vastauksia apoptoottinen ärsykkeille [35], [36], mutaatiot

KRAS

ja

PIK3CA

voi aktivoida reittejä, jotka lähettävät anti-apoptoottiset eloonjääntisignaaleja [33], ja koodaamien proteiinien

NPM1

ja

CIC

on osoitettu toimivan apoptoosin [37], [38].

informatiivinen siirtymien todennäköinen tilausten

siirtymiä todennäköinen tilauksia tarjotaan lisätietoja syövän etenemiseen.

Vastaa