PLoS ONE: päättelemällä Temporal Order of Cancer geenimutaatioita Individual Kasvain Näytteet
tiivistelmä
ajallinen järjestys syövän geenimutaatioita kasvaimissa on olennaista ymmärtämiseksi ja hoitamiseksi sairauden. Olemassa olevat menetelmät eivät pysty päättelemään, jotta mutaatioiden, jotka tunnistetaan samanaikaisesti yksittäisten tuumorinäytteissä, jolloin heterogeenisyys järjestyksessä tuntematon. Tässä osoitamme, että läpi monimutkaisen verkoston lähestymistapaa, joka perustuu äskettäin määritelty tilastollinen –
Karsinogeneesi tiedot johtavuus
(CIC), ajallinen järjestys yksittäiset näytteet voidaan tehokkaasti päätellä. Tulokset viittaavat siihen, että kasvaimeen synnyssä ehkä useammin aloittaa järjestyksen mutaatioiden kuin onkogeenien, ja jokainen syöpätyyppi voi olla oma ainutlaatuinen järjestyksessä mutaatioita. Alkuperäinen mutaatiot näyttävät omistettu hankkia toiminto kiertää apoptoosin, ja jotkut järjestys rajoitukset saattavat heijastaa mahdollisia säännönmukaisuuksia. Lähestymistapamme on täysin tietoperusteisissa ilman parametriasetukset ja voidaan odottaa tehokkaammin kuin enemmän tietoja tulee saataville.
Citation: Guo J, Guo H, Wang Z (2014) päättelemällä Temporal järjestys Cancer Gene Mutaatiot Yksittäiset Kasvain Näytteet. PLoS ONE 9 (2): e89244. doi: 10,1371 /journal.pone.0089244
Editor: Raya Khanin, Memorial Sloan Kettering Cancer Center, Yhdysvallat
vastaanotettu 22 lokakuuta, 2013 Hyväksytty: 20 tammikuu 2014; Julkaistu: 27 helmikuu 2014
Copyright: © 2014 Guo et ai. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Natural Science Foundation of China alle apurahan no. 61273217; Kiinan 111 ohjelma ”Advanced Intelligence ja Network Service” alla avustusta ei. B08004. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Zhanyi Wang on China Mobilen tutkimuslaitos, mutta tämä ei muuta kirjoittajien noudattaminen kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja.
Johdanto
syöpä on geneettinen sairaus aiheuttama mutaatio syövän geenien koostuu onkogeenien ja kasvaimen synnyssä. Useimmissa syöpätapausta, useita mutaatioita esiintyy menettely tunnetaan kasvaimen eteneminen [1], [2]. Ymmärtämään syövän etenemiseen, tutkimuksia ei ole tehty malli yleisiä säännönmukaisuuksia ajallista järjestystä mutaatioiden tietyn syöpätyypin käyttäen sekä kokeellisia ja laskennallisia lähestymistapoja [3] – [7]. Koska kanoninen malli, järjestys mutaatioiden ja peräsuolen syöpä on rekonstruoitu läpi kasvaimen koon ja luokka [8]. Uusin laskennallisten mallien päätellä tyypillinen ajallinen järjestys rajoituksia tietyntyyppisen syöpien simuloimalla syövän etenemistä kuin stokastinen prosessi [9] – [11]. Tästä edistyksestä huolimatta vieläkään ei ole hyvin määritelty menetelmä päätellä järjestyksessä mutaatioiden tunnistettu samalla yksittäisten näytteiden vaikka tämä päätelmä on tarpeen paljastaa heterogeenisuus järjestyksessä mutaatioiden syövän. Viime aikoina uuden sukupolven sekvensointi tulee laajasti sovellettu, mutaatio maisemat eri syöpien paljastetaan yksi kerrallaan. Tulokset ovat osoittaneet, että mutaatiot syövän usein osoittamaan tilastollisia korrelaatioita keskenään tai jopa aiheuttaa-seuraus sidoksia induktion välillä sekä näiden [12] – [18]. Nämä korrelaatiot /yhteyksiä ei ole täysin hyödynnetty päätellessään ajallisen järjestyksen mutaatioiden.
From tietotekniikkaan näkökulmasta tämä tutkimus määrittelee tilastollinen mittaus määrittää arvon korrelaatiot tai sidoksia edellä mainitut ja mallintaa mutaatiot monimutkaisessa verkossa, jonka kautta ajallista järjestystä mutaatioiden yksittäiset näytteet voidaan päätellä. Me kutsumme mittaus
Karsinogeneesi tiedot johtavuus
(CIC), joka mittaa tavoitettavuutta siirtämään tietoa syövän geeniin mutaatio transkriptioprosessin tietyn YK-mutatoitunut syövän geeni aiheuttaa sen mutaatio. Tilastollisesti tavoitettavuutta voidaan arvioida yksittäisen tapahtuman taajuudet ja juokseva co-esiintymistiheys kahden geenin mutaatioiden syöpänäytteissä. Lisäksi kilpailu lähettämät tiedot useista muuntunut geeneistä annettuun YK-mutatoitunut geeni olisi myös pidettävä tahansa onnistunut lähettäminen aiheuttaa kohdegeenin muuntua, mikä päätti mutaatio prosessi. Tässä tutkimuksessa, jota kutsumme tahansa kaksi mutaatiota selville samassa syövän näytteestä yhteistyössä ilmeneviä mutaatioita. Vaikka useimmat genomista tutkimukset antavat tästä määrästä epäsuorasti, täällä pyrimme disentangling sekvenssin esiintymisen kaksi mutaatiotapahtumaa yksinkertaisesta co-esiintymiseen. Näiden sekvenssit mutaation esiintyminen, peräkkäinen co-esiintymistiheys voidaan laskea (materiaalit ja menetelmät). Perustuu ajatukseen, olemme määritelleet CIC syöpään geenistä
i
syöpään geeni
j
kuten: (1) jossa () on esiintyminen taajuus mutaatio geenin
i
(
j
) syövissä, on peräkkäinen yhteistyössä esiintyminen taajuus mutaatio geenin
i
seuraa mutaatio geenin
j
, ja on prioriteetti geenin
i
verrattuna muihin mutantti geenejä lähettää tiedot geeni
j
. Olemme todenneet, että. Tässä yhtälössä on joukko syövän näytteiden mutantti geenejä
i
ja
j
, on näytteiden lukumäärä sarjassa, ja on indikaattori funktio, joka on 1 jos mutantti geenejä
j
ja
i
näytteessä. Muuten se on yhtä kuin 0. Vastaavasti korkein prioriteetti yksi osoitetaan jos on suurempi kuin jokaisessa näytteessä asetettu, ja useamman kerran, että mitä suurempi arvon. Pidämme kaava (1) mittana syövän tietojen johtavuus koska suhde on arvio suurimmasta mahdollista, että geeni
i
lähettää syövän synnyn tiedot geeni
j
ja aiheuttaa sen mutaation suhde on arvio suurimmasta mahdollisuus, että mutaatio geenin
j
aiheuttavat syövän synnyn saatujen tietojen geenistä
i
, ja on prioriteetti tietoliikenneyhteys verrattuna muihin linkkejä geeniä
j
. Arvo välillä 0 1. Kuten määritelmää
aktivointivoimaa
, mittaus me aikaisemmin ehdotettu painottamalla linkkejä monimutkaisten verkkojen [19] määritelmä CIC noudattaa kaavaa painovoiman jos kuvittelemme suhteet ja koska massoja ja prioriteettia etäisyyttä. Tilastot määritelty tällä tavoin todennäköisesti jakaa niiden arvojen voima laki, joka on kätevä analysoida monimutkaisia verkostoja monimutkaisia suhteita mukaan lukien biology [20] – [24].
Yksi haaste laskettaessa CIC on puute syövän näytteitä, joita voidaan käyttää lähteenä peräkkäisiä co-esiintyminen taajuudet syövän geenimutaatioita, koska mutaatiot eri geenien syövän näytteessä tunnistetaan yleensä samaan aikaan sekvensoimalla. Tähän haasteeseen, esittelemme iterointimenettelyllä että parit CIC laskenta ja päättely todennäköisyys jokainen mahdollinen järjestyksen syövän geenimutaatio. Soveltamalla tätä menettelyä katalogi somaattisista mutaatioista in Cancer (COSMIC) tietokanta [25], [26] paljasti, että iterointi saavutettu lähentymistä vähemmän kuin 10 silmukoita, ja yhtenevät tulokset viittaavat merkityksellisiä tuloksia.
materiaalit ja menetelmät
iteratiivinen päättely järjestelmän
Voit suorittaa iteratiivinen päättely menettely, suuri joukko syöpänäytteissä syöpään geenimutaatioita tunnistetaan genominlaajuisten sekvensointi on tarpeen. Kun aineisto, me määrittää perustilastoihin esiintymisen ja ei-peräkkäisiä yhteistyössä esiintyminen taajuudet syövän geenimutaatioita. Näistä perustilastot, iteratiivisen päättely varten näytteiden lukumäärä kyseessä alkaa ja CIC tuloksia ja todennäköinen tilaukset syövän geenimutaation kunkin näytteen osalta määritellään kun iteraation saavuttaa lähentymistä. Kuva. Kuvio 1 esittää yleiskuvan menettelyä.
(a) esiintyminen ja co-esiintyminen taajuudet syövän geenimutaatioita ja määritetään saatavilla olevat näytteet, joissa, ja se on määrä syövän geenien suunnattu tutkimuksessa . Esiintymisen geenin lasketaan, jos se on mutatoitunut yksi näytteistä, ja co-esiintyminen pari geenien lasketaan, jos molemmat ovat mutatoituja yksi näytteistä; Siksi, ja. (B) Perustuu periaatteeseen suurimman entropian, alkuarvot peräkkäisiä yhteistyössä esiintyminen taajuudet asetetaan. (C) karsinogeneesin tiedot johtavuus,, lasketaan vektorin ja matriisin. On huomattava, että ei ehkä ole yhtä suuri, mikä merkitsee, että matriisi edustaa suunnatun verkon. (D) Kunkin näytteen kyseessä todennäköisyydet jokainen mahdollinen järjestyksen mutantti geenien näytteessä lasketaan mukaan CIC kunkin järjestyksessä (menetelmät). (E) matriisi määritetään uudelleen, että matriisin ja suhde todennäköisyydellä painotettua numero tilausten osoitti, että
i
tapahtuu ennen
j
lukumäärään co-esiintymisen taajuuden , on tärkeää huomata, että ei ole sama kuin yleensä. Jos matriisi ei ole saavuttanut peruste lähentymisen johdettua tilaukset ei pidetä vakaana ja uusi lenkki laskemisen ja tehdään. Muutoin (f), tilaukset todennäköisyydellä yli sattuman ja vastaavat todennäköisyydet ja pidetään viitatun tuloksia. Esimerkiksi kaikista 6 mahdollisia tilaukset näytteen kolme mutantti syövän geenien
,
b
ja
c
, tilaukset ja tunnistetaan todennäköinen niistä johtuvat todennäköisyydet 0,7 ja 0,2 (suurempi kuin satunnainen mahdollisuus 1/6).
Iteratiivinen menettely CIC laskenta ja päättely mutaation järjestyksessä
määritelmän peräkkäinen co-esiintyminen taajuudet on tarpeen arvioida CIC-arvo. Tämä vaatimus ei voi olla tyytyväinen nykyinen tietokantoja, kuten COSMIC. Tämän vaikeuden voittamiseksi, hyväksymme iterointimenettelyllä kytkemään päättely esiintyvän mutaation tilaukset ja laskentaa CIC. Ensin tasaisesti jakaa ei-peräkkäinen co-esiintymisen taajuuden kohdalla kaksi mahdollista peräkkäisen yhteistyössä esiintyminen taajuuksia laskea alkuperäisen CIC. Sitten päätellä mutaation tilaukset alkuperäiseen CIC on repredict peräkkäisen yhteistyössä esiintyminen taajuuksia, toista CIC laskenta ja päättely mutaation tilauksia ennen suppenevan tulos on saatu.
Perustuen periaatteeseen suurimman entropian, me ensimmäinen käyttää yhtenäistä ennen jakautumisen esiintymisen tilauksia, mikä tarkoittaa, että ei-peräkkäisiä co-esiintymistiheys mutaation kahden geenien
i
ja
j
, kaksi mutaatiota tilaukset
i
→
j
ja
j
→
i
esiintyy samalla todennäköisyydellä. Sen vuoksi on tarpeen peräkkäinen co-esiintymistiheys on asetettu puolet vastaavan ei-peräkkäisiä taajuus. Tällä asetuksella, laskemme alkuperäisen CIC välillä jokainen pari syövän geenien.
sitten laskea CIC että tilauksen yli kaksi mutantti geenejä hallussaan. Tässä laskenta, on otettava huomioon, että jokainen edellisen geenit voivat lähettää karsinogeneesin tiedot rinnakkain kohdegeenin sisällä järjestyksessä. Siksi me lainata periaatetta Computing resistenssin piiri, joka on rinnakkainen-by-sarja menettely; me summa kaikki rinnakkaiset CIC edellisestä geenien kohdegeenin sisällä, jotta voidaan määrittää
vaihe CIC
tilauksen ja sitten muotoilla
järjestyksessä CIC
CSS kaikki
vaiheen CIC
s. Mieti järjestystä
APC → ATM → KRAS
esimerkkinä; tässä järjestyksessä sisältää kaksi vaihetta tietojen lähettämiseen,
→ ATM
ja
→ KRAS
. Ensimmäisen vaiheen aikana, tiedot voidaan lähettää vain yksi lähde,
APC
. Siksi ,, CIC alkaen
APC
osoitteeseen
ATM
, yksinkertaisesti tulee CIC ensimmäisen vaiheen. Toisessa vaiheessa, kuitenkin sekä
APC
ja
ATM
voi tulla tietolähteen, joka edellyttää summattu kaksi rinnakkaista CIC kuin CIC toisen vaiheen. Kun rinnakkain vaiheen kunkin vaiheen, reciprocals
vaihe CIC
s, pitää vastuksia, jotka sarjatuotantona summata käänteisluku
järjestyksessä CIC
. Vaiheet voidaan tiivistää seuraavasti:
Parallel vaihe
:
Sarja vaihe
:.
k
th geenin järjestyksessä on tiedon saaminen geenin
(k-1) B: nnen vaiheen ja on
k-1
lähettäjät rinnakkaisia tietoja. Tilaus koostuu
n
geenejä on
n-1
vaiheita syövän tietojen johtuminen. Yleensä meillä on yhtälö, jossa on CIC vaiheen
k
, on CIC geenistä toiseen, ja on indeksi geenin asemassa järjestyksessä.
Based määritelmästä CIC, suurempi CIC arvo mahdollisesta tilaukseen liittyy helpompi syövän synnyn tiedot johtuminen sisällä järjestyksessä. Kaikista kilpailevat tilauksista, sitä suurempi CIC tilauksen arvo, sitä suurempi todennäköisyys esiintyminen tilauksen. Siksi oletamme, että CIC tilauksen on positiivisesti verrannollinen todennäköisyys järjestyksessä esiintyvän. Arvioitaessa todennäköisyys jokainen mahdollinen järjestys lineaarikuvaus päässä CIC kaikki mahdolliset tilaukset annetulle mutantti geenejä, yhteensä todennäköisyyksien kaikkia mahdollisia tilauksia on yhtä kuin yksi. Muodollisesti varten näytteen
n
mutantti syövän geenien määrä mahdollisia tilauksia on
n
!; kartoitamme CIC järjestyksessä
m
(
m
= 1, 2, …,
n
!) osaksi todennäköisyys kaavalla
jälkeen määrittää todennäköisyydet kaikkia mahdollisia järjestyksessä mutaatioista, me määrittää uudelleen ennustettu peräkkäinen yhteistyössä esiintyminen taajuudet seuraavasti: missä on todennäköisyys tilauksen
m
näytteen
l
, ja
L
on näytteiden määrä kyseessä. on indikaattori funktio, joka on 1, kun geeni
i
tapahtuu ennen geenin
j
jotta
m
näytteen
l
ja yhtä kuin 0 kaikissa muissa tapauksissa ja on ei-peräkkäinen co-esiintyminen taajuus välillä geeni
i
ja geeni
j
. Jos määritetään uudelleen arvot ovat lähes identtisiä vanhoja tai tulla yhtenevät, lasketut CIC ja näin johdettua järjestys todennäköisyydet voidaan pitää luotettavina tuloksia. Muuten CIC ja tilauksen todennäköisyydet on määritettävä uudelleen uudessa silmukka. Iteratiivinen menettely jatkuu tällä tavalla, kunnes lähentyminen on saavutettu. Käytännössä kriteeriä lähentymistä voidaan katsoa täyttyneen, kun absoluuttinen ero uuden ja vanhan arvot monotonisesti pienenee riittävän pieni arvo.
Koska aloitamme toistuvaa joiden alkuperäinen ennustaminen peräkkäinen co-esiintyminen taajuuksia kuin juokseva esiintyvyys perustuu suurimman entropian periaate, jonka mukaan suurin muutos potentiaali peräkkäisiä yhteistyössä esiintyminen taajuuksien ensimmäistä iterointia, muutos vähenee asteittain ja lopulta tulla merkityksetön. Tämä lähtökohta varmistettiin tutkimuksessa; tyydyttävä lähentyminen saavutettiin alle 10 silmukoita päättely menettelyn avulla joukko näytteitä COSMIC tietokannasta.
Iterointi perustuu COSMIC tietoihin saavuttaa lähentymistä 10 silmukoita. Täällä käytämme laskenta CIC alkaen
KRAS
osoitteeseen
APC
käyttöön menettely yksityiskohtaisesti. Aluksi laskemme esiintyminen taajuudet = 125 ja = 209 ja ei-peräkkäinen yhteistyöstä esiintyminen taajuus = 79 alkaen COSMIC tietokannasta. Määrittelemällä puolet ei-peräkkäinen co-esiintymisen taajuuden (79) kuin juokseva taajuus, toteamme = 39,5. Verrattaessa peräkkäinen yhteistyössä esiintyminen taajuuksia muitakin geenejä
KRAS
geeniin
APC
kussakin 79 näytteen, on todettu olevan keskimäärin luokkaa 1,47. Siksi prioriteetti = 1,47, ja alkuarvo = (39,5 /125) * (39,5 /209) /1.47
2 = 0,028.
käyttäminen alkuperäisen CIC kaikkien syövän geeni paria, arvioimme todennäköisyys jokainen mahdollinen mutaation esiintyminen, jotta määritetään kustakin näytteestä edellä kuvatulla tavalla. Mukaan todennäköisyydet, ei-peräkkäisiä co-esiintyminen taajuuksia voidaan epätasaisesti jaettu juokseva taajuuksilla. Sillä 79 näytteet tässä esimerkissä suhde
KRAS
→
APC
vs.
APC
→
KRAS
perustuvat vastaaviin kokonais- todennäköisyys jokainen järjestys on 0,28: 0,72. Siksi päivitämme arvo = 79 * 0,28 = 22,1 ja ensisijaiset Sitten määritetään uudella. Näiden uusien arvojen, me määrittää uudelleen.
lähentyminen ja sen vastine aikana toistojen on esitetty kuvassa. 2. Tämä esimerkki osoittaa, että arvot päässyt tyydyttävään lähentymisen jälkeen vain 6 toistojen. Tämä esimerkki edustaa myös yleinen tilanne, näin me päättyi laskenta CIC jälkeen 10 toistojen tässä tutkimuksessa.
CIC (a) ja sen vastine (b) saavuttaa nopeasti suppenevan kuin toistojen laskenta suoritetaan . Kun 6 toistojen, tyydyttävä lähentyminen on saavutettu.
monimutkaisuus päättelyn menettelyn
CIC laskenta on monimutkaisuus
O
(
n
2) jos määrä syövän geenien tutkimuksessa on
n
, ja päättely todennäköisyyksien kaikki mahdolliset tilaukset näytteessä
m
mutantti syöpä geenit on monimutkaisuutta
O
(
m! m
2). Tutkimuksessamme
n
on yhtä suuri kuin 397 ja
m
vaihtelee välillä 2 8. Siten monimutkaisuus
O
(
m! M
2) voi vaihdella suuresti eri näytteitä. Todellisuudessa aikana päättely, että 1118 näytettä raportoitu tutkimuksessa suurimman osan aikaa oli kulunut muutama näytteiden maksimimäärä mutantti syöpägeenit. On syytä huomata, että menettelyn aikana, meillä on vain laskea CIC kerran kunkin silmukan päätellä tilauksen todennäköisyydet kaikille näytteille. Päätelmä käsittävä 10 toistojen varten 1118 näytteitä saatiin päätökseen 10 minuutin sisällä lavalle koostuu PC (4 * 2,66 GHz Quad CPU) ja Matlab.
Study tiedot
Tulokset ilmoitetaan tässä tutkimuksessa saatiin hiljattain COSMIC tietokanta (myönnetty 12. syyskuuta
th, 2012) koodausta pistemutaatioita. Se on taulukko tiedosto, joka sisältää nimet mutatoidun syövän geenien jokaisessa syövän otokseen. Mutant geenit samassa syöpä on sama kasvain ID (
ID_tumour
), ja aloilla
genominlaajuisten näytön
ja
ensiöpuolella
toimittaa tarvittavat tiedot käytetty tässä tutkimuksessa.
Steps määrittämiseksi esiintymistä ja yhteistyössä esiintyminen taajuudet syövän geenimutaatioita näytteissä
esiintyminen ja yhteistyö esiintyminen taajuudet syövän geenien syövän näytteitä käytettiin arvioida CIC tutkimuksessa, ja perustilastot määritettiin käyttäen seuraavia vaiheita:
Lataa
lähde
tiedosto
CosmicMutantExport_v61_120912.tsv
kautta ftp: //ftp. sanger.ac.uk/pub/CGP/cosmic/data_export/;
Tee
väliaikainen
tiedosto hankkimalla tietueiden arvoa ”
y
” in ”
genominlaajuisten näytön
”kentän
lähde
tiedosto;
Tee
ensisijainen
tiedosto hankkimalla kirjaa syövän geenien määrittelemän tiedoston
Table_1_full_2012-03-15.xls
Cosmic
web-sivuston
väliaikainen
tiedosto, ja parantavien tietueet sekvenssit
Gene_name
ja
ID_Sample
;
Tee
mutation_sequence
tiedostona, jossa kukin tietue on luettelo mutatoidun geenien samasta näytteestä, joka perustuu
ensisijainen
file ja hävitä levy, joka sisältää vain yhden geenin nimi
mutation_sequence
tiedosto;
Count esiintymistä ja yhteistyössä esiintyminen taajuudet syövän geenien perusteella
mutation_sequence
tiedosto.
tulokset
Ominaisuudet arvioidusta CIC
Suoritimme päättelyn syöpään geenimutaatio tietoja genominlaajuisten skannataan kerätyistä näytteistä uudempi versio COSMIC tietokantaan. Kaikkiaan 1212 näytettä kätkeminen 6281 mutaatioita 397 syövän geenien ollut käytettävissä määrittämiseksi perus- esiintymistä ja yhteistyössä esiintyminen taajuuksia. Näistä 1118 näytettä, kukin kätkeminen enintään 8 mutantti syöpä geenit, käytettiin toistuvaa CIC laskennan ja järjestys päättely. Taulukko S1 luettelee 1118 näytettä. Tulokset havaittiin lähentyä 10 toistojen. Sen jälkeen lähentyminen, CIC joiden arvo on yli 1.0e-6 esitteli teho laki kaltainen jakautuminen suuruudet, niin että ylivoimainen enemmistö on suuruusluokkaa vähemmän kuin keskimäärin 4.0E-4 ja hyvin pieni osa on suurempi kuin keskimääräinen suuruus (Fig. 3, taulukko S2). Tämä ominaisuus koskee myös jakeluun suuruuksia CIC välillä (tai) tietyn geenin useimmissa tapauksissa, mikä tarkoittaa, että vain pieni määrä kumppaneita ovat merkittäviä syövän tietojen johtuminen mihinkään tiettyyn geenin. Toisin sanoen, CIC tunnistaa lähimmän kumppanit karsinogeneesissä tiedot johtuminen. Lisäksi suunnattu verkkojen syövän geenien linkittämä CIC olivat epäsymmetrinen ja pieni maailma kaltainen. CIC geenien
i
geenin
j
oli yleensä epätasainen kuin geenien
j
geenin
i
; verkko on useita navan geenien paljon enemmän yhteyksiä kuin normaalisti. Tämä ominaisuus on yhdenmukainen sen havainnon kanssa, että signalointi verkko syövän on analoginen Internet, joka rakentaa pienen maailman napa solmuja [27] – [29]. Kuva. 4 havainnollistaa CIC liittyy kattava 44 syöpä geenit, mukaan lukien napa geenit
APC
,
TP53
ja
MLL3
, ja linkit vahvempi kuin 1.0e-2 osoittaa epäsymmetria . Epäsymmetrisyys CIC merkitsee olemassaolon parempana tietyn mutaation tilauksia. Lisäksi, kolme napa geenit ovat kaikki kasvaimen synnyssä, ja vahvin suunnattu linkki, jonka arvo on 0,136, on peräisin
APC
on
KRAS
, yksi useimmin mutatoitunut onkogeenien , mikä viittaa ylivoimainen tietoa kanavan mutaation
APC
mutaatioon
KRAS
.
CIC yli 1.0e-6 ovat läsnä teho lain kaltainen jakelu; Erityisesti logaritmi on CIC logaritmin funktiona niiden suuruusluokkaa saadaan paloittain lineaarinen suhde. Perustuen kysymykseen, onko teho laki jakelu on tarkoituksenmukaista analysoida monimutkaisten verkkojen ja huoli epäluotettavuudesta aliarvostettu CIC jotka saattavat johtua vara tiedot ainoastaan CIC yli 1.0e-6 oli välittömästi käyttää päättelyn tässä tutkimuksessa . CIC päätellä vähemmän kuin 1.0e-6 korvattiin kynnystä tasoittaa.
Neljäkymmentäneljä usein mutatoitunut syövän geenien (yli 20 genominlaajuisten skannattu näytteiden COSMIC tietokanta) on havainnollistettu kanssa CIC niiden välillä suurempi kuin 1.0e-2. Paksuus linkki on verrannollinen vahvuus vastaavan CIC. Kun pari geenejä on kaksisuuntainen linkit, tiivis yhteys on piirretty suora viiva ja heikomman piirretään kaareva viiva (ks tapauksessa
APC
← →
TP53
) . Epäsymmetria voidaan havaita se, että ei kaksisuuntainen yhteyksiä samanlaisten vahvuuksien välillä geeniä paria, ja
APC
,
TP53
, ja
MLL3
kukin olla napa rooli verkossa.
päättely todennäköinen tilausten
päätellä mutaatio tilaukset todennäköisyydellä yli Sattumiin, kutsutaan jäljempänä
todennäköistä tilaukset
, edellyttäen konkreettisempi oivalluksia syövän etenemiseen. Analysoimme todennäköinen tilaukset päätellä, että 1118 syöpänäytteissä kyseessä tutkia enintään 8 mutaation askeleen päässä aloittamisesta. Ensisijainen sivustot Näytteiden sijaitsevat pääasiassa
munasarjojen
(256),
large_intestine
(
LI
, 180),
haematopoietic_and_lymphoid_tissue
(
HLT
, 148),
eturauhasen
(100),
rintojen
(97),
central_nervous_system
(
CNS
, 86) ja
upper_aerodigestive_tract
(
UAT
, 72).
Taulukko S3 luetellaan kaikki todennäköinen tilaukset ja niiden todennäköisyyksiä tutkituissa näytteissä, ja taulukko 1 esittää osan niistä . Perustuen todennäköiseen tilauksista solmimme että annetussa näytteessä vain pieni osa kaikista mahdollisista tilauksista on todennäköisyys suurempi kuin Sattumiin, ja summa todennäköisyyksien näiden tilausten on lähellä näytteiden määrä suhteella on 1034,4 /1118. Tämä osoittaa, että päättely tunnistettu pieni osa kaikista mahdollisista tilaukset permutoiduista että määrätylle mutantti syövän geenien todennäköinen tilauksia. Näytteen kätkeminen kaksi mutantti syöpägeenit, päättelyn aina viittaa vahvasti siihen, yksi kahdesta mahdollisesta tilauksia. Kuitenkin näytteiden yli kaksi mutantti syöpä geenit, joitakin tilauksia voi olla vertailukelpoinen korkea todennäköisyydet. Vaikka emme voi tuomita yksittäisiä plausibilities on päätelty todennäköinen tilausten puutteen takia maa totuuden tilaukset useimmissa tapauksissa niiden merkitys voitaisiin viittasivat vahvasti siihen arvioimalla päättely näytteitä tietyn syöpätyypin jotka ovat hyvin tutkittu kannalta järjestyksen. Esimerkiksi
APC, KRAS ja TP53
ovat kolme useimmin mutatoitunut geenien paksusuolen syövät, ja niiden mutaatio tilauksia on hyvin mallinnettu [30], [31]. Meidän tulokset, näyte mutantti syövän geenien
APC
ja
KRAS
, tuottivat päätelty todennäköisyys 0,95 tilaukselle
APC
→
KRAS
, mikä oli yhdenmukainen aiempien tutkimusten. Jotta näyte mutantti
APC, KRAS ja TP53
syöpä geenit, kolme todennäköinen tilaukset
APC → KRAS → TP53
(0,33),
APC → TP53 → KRAS
( 0,32)
ja TP53 → APC → KRAS
(0,19) on päätellä 6 potentiaali niitä, ja tämä tulos oli myös yhdenmukainen aiempien tutkimusten.
BRCA1
ituradan mutaatioita koituu suuri riski rinta- ja munasarjasyövän, mutta somaattisten menetys villityypin
BRCA1
alleeli on osoitettu esiintyy yleensä
jälkeen
mutaatiosta
TP53
[32]. Suostumuksella Tämän havainnon, me päätellä somaattinen mutaatio järjestys
TP53 → BRCA1
todennäköisyydellä yli 0,99. Nämä esimerkit antavat todisteita päättelyn pätevyyttä.
Iniators todennäköisestä mutaation tilausten
tunnistaminen alullepanijoista mutaatio tilauksia on pidetty yhtenä suurimmista haasteista tutkimuksessa kasvaimen eteneminen [1]. Meidän päätellä todennäköinen tilaukset mutaation tarjotaan informatiivinen vihjeitä ratkaisemaan tämän haasteen. Tutkimalla geenit, jotka käynnistävät todennäköinen tilauksia, olemme huomanneet, että initiaattorit hallitsi kasvaimen synnyssä. Selvä enemmistö (yli 77,5%) ja todennäköisyydellä painotettua numero todennäköisen tilausten oli päätellä alkavan kasvain-vaimennin geeni sijaan onkogeeni. Oli 368 syöpä geenit testissä syöpään näytteitä, niiden joukossa vain 92 oli tuumorisuppressoreilla. Tarkemmin sanottuna, oli 1858 mutaatiot tuumorisuppressoreilla keskuudessa täysin 3823 mutaatiot kaikkien syöpägeenit. Siksi keskimääräinen mahdollisuus tuumorisuppressoreilla aloittaa mutaatio tilaukset oli 48,6% (1858/3823). Tämä osoittaa, että ylivoima tuumorisuppressoreilla aloittaessaan mutaatio tilauksia ei voida katsoa johtuvan mahdollisuus. Lisäksi suhteet monta kertaa geeni initiaattori sen mutaation taajuus oli yleensä eri, mikä tarkoittaa, että se ei ole varmaa, että usein mutatoitu geenit muuttua alussa (taulukko 2). Merkittävää on, että todennäköisyydellä painotetun lukumäärän todennäköinen tilausten aloitti kaksi parasta kasvaimeen vaimennin geeni initiaattorit
TP53
ja
APC
, koostuivat prosenttiosuudet yhtä suuri kuin 46,9% ja 11,4%, tässä järjestyksessä . Sen sijaan kaksi ylintä onkogeeni initiaattoreita,
PIK3CA
ja
KRAS
, havaittiin prosenttiosuudet niin pieni kuin 3,1% ja 1,3%, vastaavasti. Top alullepanijoista mutaation kulloisellakin ensisijainen syöpä sivustoja ehdotti lisätietoja (taulukko 3). Yleensä kaikki syövät suurimmilla ensisijainen sivustoja näytteistä paljastui kasvain-vaimennin geeni niiden top initiaattorina. Erityisesti
TP53
oli yhteinen alkuun aloitteentekijä neljässä aikaisemmin luetelluista syöpätyyppejä,
munasarja
,
UAT
,
rinta
ja
eturauhasen
, jossa prosenttiosuudet 91,5%, 73,4%, 57,6% ja 30,4%, tässä järjestyksessä. Vuonna
LI
syöpiä, alkuun alullepanija oli
APC
(57,5%), jonka jälkeen
TP53
(29,7%). Molemmat
CNS
ja
HLT
syöpiä ei ollut ilmeisesti ylivoimainen initiaattorit, jossa
CIC
(13,6%),
PIK3CA
(10,1%) ja
TP53
(10,0%) kuin kolmen parhaan initiaattorit entisen, ja
TP53
(14,9%),
NPM1
(10,4%) ja
MLL2
(9,9%) kuin kolmen parhaan initiaattorit jälkimmäisen. Näkökulmasta initiaattorin jakelun,
munasarja
,
LI
,
UAT
ja
rintasyövän
syöpiä päätellä hallitsevat pieni määrä kasvain -suppressor geenit, kun taas
HLT
,
CNS
ja
eturauhasen
syöpiä päätellä olevan monipuolisempia merkittäviä initiaattorit.
Aiemmat tutkimukset ovat osoittaneet useita tunnusmerkki toimintoja, jotka on hankittu syövän tuottaa, auttaa tutkijoita ymmärtämään monimutkaisuutta syövän etenemisen tapa looginen, tieteellisellä tavalla [33], [34]. Meidän pääteltyihin tulokset viittaavat ehdotus, joka menee askeleen pidemmälle. Useimmissa syövät, aikaisintaan hankittujen tunnusmerkki toiminto saattaa olla
kiertämästä apoptoosin
koska suurin osa ensimmäisen mutatoitujen geenien jokaisessa syöpätyypin taulukossa 3 (
TP53, APC, KRAS, PIK3CA, NPM1
ja
CIC
) on havaittu koodaavan apoptoosia sääteleviä proteiineja, ja mutaatio kaikkien näiden geenien on osoitettu johtavan puutteellinen apoptoosin toimintoja. Tarkemmin sanoen mutaatio
TP53
voi johtaa poistamiseen keskeinen osa DNA-vaurio anturi, joka toimii apoptoosin [33], [34], mutanttimuotoihin APC proteiini voi vaimentaa vastauksia apoptoottinen ärsykkeille [35], [36], mutaatiot
KRAS
ja
PIK3CA
voi aktivoida reittejä, jotka lähettävät anti-apoptoottiset eloonjääntisignaaleja [33], ja koodaamien proteiinien
NPM1
ja
CIC
on osoitettu toimivan apoptoosin [37], [38].
informatiivinen siirtymien todennäköinen tilausten
siirtymiä todennäköinen tilauksia tarjotaan lisätietoja syövän etenemiseen.