PLoS ONE: ennustaminen ja testaus Biological Networks Taustalla Suoliston Cancer
tiivistelmä
peräsuolen syöpä etenee kertyminen somaattisista mutaatioista, joista osa asuu ns ”driver” geenejä, jotka tarjoavat kasvu etu kasvain. Tunnistaa leikkauspisteitä kuljettajan geeni polkuja, toteutimme verkostoanalyysi puitteet käyttäen proteiini vuorovaikutusten ennakoimiseen yhteydet – sekä ennennäkemätön ja uusi – välillä avaintekijä geenien syöpää. Käytimme puitteissa löytää merkittäviä yhteyksiä kaksi geeniä,
APC
ja
Cdkn1a
(
p21
), tiedetään olevan synergistisiä kasvainten synnyssä hiirimalleissa. Sitten arvioitiin toiminnallinen yhtenäisyys tuloksena
APC-Cdkn1a
verkon suunnittelu
in vivo
yhden solmun häiriöitä verkon: hiirimalleihin mutatoitunut yksitellen
Apc
(
APC
1638N +/-
) tai
Cdkn1a
(
Cdkn1a
– /-
), minkä jälkeen mittaukset proteiinin ja geenin ilmentymisen muutoksia suolen epiteelikudokseen . Oletimme, että jos ennustettu verkko on biologisesti yhtenäinen (toiminnallinen), niin ennustettu solmut pitäisi liittää erityisesti väärin säädeltyyn geenien ja proteiinien kuin stokastisesti valittu geenien ja proteiinien. Ennustettu
APC-Cdkn1a
verkon merkittävästi häiritsi mRNA-tason sekä yhden geenin aihiot, ja ennusteet olivat myös vahvasti tuettu perustuu fyysiseen läheisyyteen ja mRNA -parin proteomic tavoitteita. Nämä tulokset tukevat toiminnallista yhtenäisyyttä ehdotetun
APC-Cdkn1a
verkkoon ja myös osoittamaan, miten verkko-ennusteita voidaan tilastollisesti testata käyttämällä suuren läpimenon biologista tietoa.
Citation: Patel VN, Bebek G, Mariadason JM, Wang D, Augenlicht LH, Chance MR (2010) ennustaminen ja testaus Biological Networks taustalla Suoliston syöpä. PLoS ONE 5 (9): e12497. doi: 10,1371 /journal.pone.0012497
Editor: Tšad Creighton, Baylor College of Medicine, Yhdysvallat
vastaanotettu: toukokuu 16, 2010; Hyväksytty: 26 heinäkuu 2010; Julkaistu: 1. syyskuuta 2010
Copyright: © 2010 Patel et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä työ on tukenut National Institutes of Health Avustukset UL1-RR024989 National Center for Research Resources (Clinical and Translational Science palkinnot) ja P30-CA043703 päässä Case Western Reserve University Kattava Cancer Center. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
suurin osa periytyvä Kolorektaalituumorien syntyy kautta juokseva mutaatioiden keskeinen tekijä geenejä, joissa on mutaatio tuumorisuppressori (esim
APC
) tai onkogeenin (esim
Kras
) aloittaa prosessin, ja kaskadi somaattisten mutaatioiden ensues [1]. Vaikka nämä mutaatiot klassisesti ajatellaan koostuvan muutamia geenejä (esimerkiksi
APC
,
Kras
,
Trp53
), laaja-alaisten sekvensointi ponnisteluja paljasti, että mikä tahansa kasvain sisältää (keskimäärin) 80 mutaatioita, peräti 15 makaa usein muuntunut ”driver” geenit [2]. Tukeakseen hypoteesia, että nämä keskeiset geenit toimivat yhteistoiminnassa ajo kasvainten synnyssä, hiiri malleja mutatoitunut kahden kuljettajan geenejä samanaikaisesti ovat osoittaneet synergististä kasvaimen taakkaa, mukaan lukien:
PTEN-Apc
[3],
Kras-TGFb
[4], ja
APC-Trp53
[5]. Todisteet synergististä eli summautumattomat, nousu kasvaintaakkaa viittaavat siihen, että signalointi polkuja kaksi mutatoitujen geenien voi leikata loppupäässä, ja siten ennustamaan ja kuulusteltavaksi nämä kohdat leikkauspisteessä –
biologisena verkko
– on merkittävää etua. Jäljittää yhteydet geenien erilaisia suurikapasiteettisten aineistot – esim. proteiini-proteiini vuorovaikutusten (PPI), geeni -parin, ja transkriptiotekijä suhteet – on käytetty päätellä toiminnallisia yhteenliittymiä, jotka soveltuvat analyysin verkostoja, joissa kukin geeni tai proteiini on edustettuna solmu ja vuorovaikutuksen reunasta. Lisäksi verkko-pohjainen analyyseja voidaan käyttää tunnistamaan biomarkkereita [6], ennustaa taudin etenemiseen [7], tai paljastaa molekyylitason muutoksia taustalla sairaus [8].
Kuitenkin nykyinen tietämys biologisista verkkojen on kaukana täydellisestä. Kattavuus nykyisen interactome tietokantojen arvioidaan olevan alle 10% kokonaismäärästä vuorovaikutusten [9]. Niinpä, kun interpoloimalla yhteyksiä kuljettajan geenejä, verkko-pohjainen analyysit, jotka luottavat pelkästään vahvistanut yhteisvaikutuksia voi puuttua olennaisia yhteyksiä. Yhtenä päämääränä tutkimus on ennustaa ja analysoida toiminnallisia polkuja ajajalle geenien, kriittinen vaihe oli kehittää ennustavan puitteet päätellä ja arvioida uusia yhteyksiä geenien. Ehdotetun kehyksen here (mallina Pathfinder [10]) päättelee puuttuu reunat käyttäen ennustuksia proteiini perhesuhteista ja suodattaa näitä polkuja huomioon tunnetut yhdistyksen säännöissä. Toisaalta, koska syövän geeni osallistuu useita signalointireiteissä, saattaa olla useita kymmeniä – jos näin ei ole, satoja – polkuja, jotka kaksi proteiinia toiminnallisesti vuorovaikutuksessa. Siten laskennallinen lähestymistapa on tarpeen rajoittaa verkon tilaa tyypillistä biologista yhteydessä kiinnostusta. Voit purkaa toiminnallisesti asiaankuuluvat aliverkkoihin, puitteet tunnistaa erittäin todennäköinen signalointireitteihin perustuvat geeni-geeni mRNA -parin ja Gene ontologia [11] assosiaatiosäännöt louhitaan julkaistu reittejä.
Käytimme laskennallisen menetelmän valaista yhteyksiä välillä tunnettu kuljettaja geenin suoliston syöpä,
Apc
(
adenomatoottisen polypoosin coli
), toiseen geeni mukana myös syövän,
Cdkn1a
(aiemmin tunnettu nimellä
p21
). Vaikka
Cdkn1a
ei todettu olevan mutatoitunut populaatioissa ihmisen paksusuolen ja peräsuolen syöpiä tutkittu tähän mennessä [2], sen ekspressiotaso korreloi neoplastisten etenemisen ja on ennusteen arvioinnissa suurempi kuin
Trp53
[12]. Lisätukielimet sen merkitys neoplasia, kaksinkertainen mutantti hiiren,
APC
1638N +/- Cdkn1a
– /-
, osoittaa synergististä kasvua sen kasvaintaakkaa [13]. Sen jälkeen ennustaminen yhdistävän verkon
APC
ja
Cdkn1a
, arvioimme merkitystä nämä ennustukset manipuloimalla taustalla järjestelmä: tuottavan
in vivo
verkon häiriöt kahdella hiiren mallia, seurasi järjestelmätason ”omic mittaukset ohutsuolen epiteelin. The ’omic mittaukset – sekä proteomic ja genomista – häirityn järjestelmää käytettiin tilastolliseen testaukseen ennustetun verkon, mikä otetaan käyttöön käsite arvioitaessa
in silico
ennusteet vastaan asiayhteyskohtaisia biologista tietoa.
Materiaalit ja menetelmät
Network Analysis Framework
verkon analysointi kehys (kuvassa 1, ja selitetään menetelmiä S1) työllistää PathFinder arkkitehtuuri hahmoteltu aiemmin [10]. Raaka verkosto julkisesti saatavilla fyysistä vuorovaikutusta ensin karsitaan vääriä positiivisia käyttäen logistista regressiomallia, joka sisältää (i) kuinka monta kertaa PPI havaitaan, (ii) Pearsonin korrelaatiota ilmentymisen mittausten vastaavien geenien, (iii) proteiinien ”pieni maailma klustereiden kerroin, ja (iv) proteiini solunosasijaintia tiedot vuorovaikutuksessa kumppaneita. Positiivinen (1000 PPI-lääkkeet päässä MIPS [14] tietokanta vuorovaikutus) ja negatiivinen koulutus tietomääriä (1000 satunnaisesti valittua protonipumpun estäjien, jotka eivät ole MIPS) käytetään 1000 rajat validointikokeita hankkia parametrit maksimoida todennäköisyys, todellinen vuorovaikutus .
prosessi alkaa kaksivaiheinen suodatus prosessi tilille vääriä positiivisia ja vääriä negatiivisia vuorovaikutuksessa tietokantoihin. Kun olet valinnut kuljettaja kiinnostavat geenit, polkuja ennustetaan ja sitten karsitaan molemmilla GO aikavälin yhdistyksen säännöt ja geeni-geeni -parin arvoja. Lopuksi merkittäviä reitin segmentit yhdistetään päästä verkkoon yhdistää kaksi kuljettajaa geenejä. Puitteet sisältää kudosspesifisiä mRNA -parin kahdella tasolla: vuonna pairwise suodatus vääriä positiivisia; ja suodatuksen polkuja keskimäärin -parin. Logistinen regressiomalli on koulutettu kulta-standardin interactome tietokantoja (katso Menetelmät S1 lisätietoja).
Väärät negatiiviset vuorovaikutukset päätellä käyttäen sekvenssihomologia suhteita. Havaittiin, että proteiinit, joilla on samanlaiset sekvenssit jakavat samanlaiset vuorovaikutus kumppaneita samalla organismi [15], ja siten proteiinit samasta perheestä ovat myös todennäköisesti samanlainen vuorovaikutuksen tavoista. Pfam tietokanta, hyödyntämällä usean sekvenssin rinnastukset ja HMM (HMM), käyttää sekvenssin samankaltaisuus muotoilla proteiiniperheelle Luokitusten [16] ja toimii hyödyllinen väline hyödyntämällä näitä suhteita. Näin ollen meidän päätellä vuorovaikutusta reuna, jos (i) kaksi proteiinia eivät ole vuorovaikutuksessa toistensa kanssa, että PPI-verkkoon, ja (ii) on olemassa ainakin yksi vuorovaikutus perheiden näiden kahden proteiinin.
tunnistamiseksi poluille merkitystä mallimme järjestelmän kohteisiin, -parin tiedot perustuvat microarray kokeiluja
APC
Min /+
hiiri ohutsuolen epiteelin saatiin Gene Expression Omnibus (sarja GSE422 [17]); Tässä tutkimuksessa käytetty laser-capture mikrodissektion näyte crypts adenoomien, karsinoomien ja normaali epiteelin. Meidän toteutuksessa käytimme Pfam julkaisu 23.0 [16] ja Gene ontologia julkaistaan elokuussa 2008 [11]. Hakualgoritmi laajennettiin löytää väyliä jopa 6 solmua pituisia, ja kynnys keskimääräisen -parin väyliä oli.
Hiiri suoliepiteeliin Isolation
Kaikki eläimet käsiteltiin tiukasti mukaisesti eläinten hyvä käytäntö määrittelemät asianomaisten kansallisten ja /tai paikallisten eläinten hyvinvoinnin elimet, ja kaikki eläinten työ hyväksyi Institutional animal Care ja Käytä komitea (IACUC) Albert Einstein College of Medicine (luvan numero 20070805).
APC
1638N +/-
ja
Cdkn1a
– /-
C57BL6 /J-hiiret synnytettiin kuten on aiemmin kuvattu [13], ja kudosnäytteet otettiin talteen käyttäen menetelmää, jonka Weiser et al., jolloin krypta ja villus populaatioiden solujen ohutsuolen
APC
1638N +/-
,
Cdkn1a
– /-
, ja villityypin hiirien [18].
2D-ero geelielektroforeesi
2D-ero geelielektroforeesi (2D-DIGE) suoritettiin, kuten aiemmin on kuvattu [19]. Ilmentyvät eri proteiineja krypta ja villus fraktiot tunnistettiin mutantti hiirissä (
APC
1638N +/-
ja
Cdkn1a
– /-
) suhteessa vastaavaan jakeet villin tyyppinen hiiret (4 jäljittelee kukin). Univariate t-testit (epätasainen varianssien ja yhtäläiset otoskokoja) ja monimuuttuja lineaarinen regressio (koodattu R pakkauksessa Limma [20]) suoritettiin. Geeli kohdetta valittiin LC-MS /MS-tunnistaminen perustuu näiden kahden t-tilastoja tasolla 0,05 merkitys.
geeli täplät leikattiin irti, trypsiini pilkottu, ja peptidit analysoitiin sen jälkeen tandem LC-MS /MS on LC Packings /Dionex Ultimate 3000 HPLC-Orbitrap XL (Finnigan, San Jose, CA) järjestelmä [19]. Sillä tulkinta MS /MS-spektri, MASCOT ohjelmistopaketti käytettiin etsimään SwissProt tietokannasta; null tietokanta päinvastaiseksi peptidisekvenssejä haettiin samanaikaisesti huomioon vääriä positiivisia. Tunnistetut proteiinit luetellaan taulukossa S1. Mascot DAT tiedostot on julkisesti saatavilla kautta proteomiikka tunnistukset Database [21], hakunumerolla 10638.
geeniekspressioprofilointi
Microarray tutkimuksia krypta ja villus populaatioita
APC
1638N + /
-,
Cdkn1a
– /-
, ja villityypin hiiret (4 jäljittelee kukin) suoritettiin Affymetrix hiiri genomista 2,0 pelimerkkejä julkaistujen menetelmien mukaisesti [22] . Kaikki tiedot on MIAME yhteensopiva ja raakadataa on tehty julkisesti saataville MIAME yhteensopiva tietokanta, Gene Expression Omnibus [23], hakunumero GSE19338.
Verkko mRNA Analysis
Raw .CEL tiedostoja käsiteltiin MATLAB käyttäen Robust Multiarray keskiarvonmääritysmenetelmä [24]. Käsittelemään useita koettimia syömällä eri näkökohtia geenituotteen käyttäytymistä, käytimme kaikki antureista edustamaan geeniin. Niinpä seuraava analyysi, jokainen
APC-Cdkn1a
verkkosolmun,
i
, edusti
k
i
koettimista array, jolloin matriisin koko
q
×
n
, missä ja. Sen määrittämiseksi, oliko
APC-Cdkn1a
verkon solmut kollektiivisesti differentiaalisesti ilmaistut kudoslokeron (crypts tai Villi), laajensimme Hotellingin
t
2
tilastollinen – klassinen lähestymistapa hyödyllinen testaus geenin ryhmät [25] – sisällyttää useita kokeita, seuraavasti: missä on vektori keskimääräinen mRNA intensiteetin kaikille
q
koettimina geneettinen tausta,
G
, jossa (
APC
osoittaa
APC
1638N +/-
;
Cdkn1a
osoittaa
Cdkn1a
– /-
, ja
WT
ilmaisee villin tyypin C57BL6 /J).
S
on itseisarvo puolueeton yhdistetty näyte kovarianssimatriisi kullekin mutantti: jossa
Mutant
voi viitata joko
APC
1638N +/-
tai
Cdkn1a
– /-
, ja absoluuttinen arvo
S
käytetään estämään imaginaarikomponenttien otettaessa käänteistä juureen
S
vuonna. On huomattava, että antureista vastaa
APC
ja
Cdkn1a
itse suljettiin, koska sen odotetaan olevan erittäin matalan intensiteetin arvot (vastaavassa mutantit), jotka voisivat vääristää koettu yhteenlaskettu verkkoon vaikutus. Vuonna ero keinoja, jokaisen mutantti voi olla positiivinen tai negatiivinen koetin
i
, niin, toisin kuin
t
2
,
V
2
voi olla joko positiivinen tai negatiivinen.
Koska, näytekovarianssi arviot eivät ole positiividefiniitti, ja siten, käänteinen on yksikössä. Voit kiertää tämän ongelman, asetimme kaikki kovarianssien nollaan laskemiseksi ensimmäistä
V
2
ja sitten laskea merkitystä
V
2
käyttämällä permutaatio testi (ts stokastisesti synnyttää uusia ”
mutantti
” ja ”
villityypin
” fenotyyppi etiketit), näin huolehtia taustalla kovarianssi rakenne null jakeluun. Asettaminen off-diagonaalialkiot
S
nollaan yksinkertaistaa
V
2
on: Siten
V
2
on yksinkertaisesti summa tuotteen skaalattuna t-tilastot lasketaan kunkin koettimen, kussakin kaksi kokeellista häiriöiden. Koska näytteiden määrä oli pieni (mutantin ja villityypin, kukin), kohinaa lisättiin kuhunkin permutoidun matriisin saamiseksi interpoloitu ja tasoitetaan empiirinen null jakelu; keskihajonta,, melu kunkin koetin,
q
, että geneettinen tausta,
G
, arvioitiin näytteen keskihajonta kunkin koetin. 10000 tällaiset permutaatiot laskettiin saada null jakaumia, joka -kuten odotettavissa – muistuttavat F-jakaumien (katso kuva S1). Koska
APC
ja
Cdkn1a
ovat tuumorisuppressoreilla ja arveltu vaikuttavan verkostomme kiinnostusta samalla tavalla, odotamme t-tilastot vaihtelevat samaan suuntaan jos hypoteesi ( mitään yhteistä vaikutus) on hylättävä. Näin ollen meidän laskea
p
-arvoon
V
2
kuin määrä nolla havaintojen suurempi kuin meidän havaittu arvo
V
2
. Laskeminen
p
-arvon kielteisistä hännän jakauman olisi hyödyllistä, jos häiriöt odotettiin olevan päinvastainen molekyyli vaikutuksia (esim
APC
+/-
pariksi
Stat3
+/-
hypomorph).
Vaikka esitämme analyysin varten 2-solmu häiriön verkkoon, tämä analyysi on laajennettavissa
k
kokeellinen häiriöiden laskemalla pareittain
V
2
tilastoja, jolloin matriisissa: Missä edustaa tilaston välillä häiriöiden
j
ja
k
; kuten on esitetty, lävistäjä vähenee skaalattu versio Hotellingin
t
2
tilastotieto kullekin kokeelle. Koska tilastot ovat kukin eri mittakaavassa, niitä ei voida verrata suoraan, ja siten merkitys matriisin kunkin alkion tulee laskea (kuten yllä) kautta permutaatio testi. Sitten, että matriisi
p
-arvot, diagonaalialkiot antaa tietoa merkityksestä erillisiä kokeita, kun taas off-lävistäjä arvot antavat tietoa pairwise kokeellinen merkitys. Yhteenlaskettu kokeellinen tuki verkon häiriöt voidaan laskea yhdistämällä off-diagonaalinen
p
-arvot, esim. Fisherin menetelmällä [26]. Suosittelemme tätä lähestymistapaa käsitellä häiriöiden; for häiriöiden, kuten meidän tapauksessamme,
p
-arvoja voidaan tulkita suoraan.
Analyysi proteomiikan Tavoitteiden
merkityksen arvioimiseksi fyysistä läheisyyttä, topologinen etäisyys välillä
Apc
–
Cdkn1a
verkon solmut ja vastaavat proteomic tavoitteet laskettiin. Fyysinen PPI verkostoja koottu BioGRID [27], ihmisen proteiini viitetietokantaan (HPRD) [28], ja ehjä [29]. Kukin verkkosolmu testattiin itsenäisesti määrän 2-hop polut kytkemällä se joukko
n
kokeellisesti mitattu proteiineja, ilmaistaan seuraavasti: Missä on merkintä rivillä
i
ja sarake
j
vuonna vierusmatriisi,
, PPI-verkon;
i
on proteiini
APC-Cdkn1a
verkkoon;
j
on välituote proteiini; ja
k
on kokeellisesti mitattuja proteiinia. Tällöin kokeellinen proteiinit olivat proteomic tavoitteet joko
APC
1638N +/-
tai
Cdkn1a
– /-
hiirillä. Jos on olemassa ainakin yksi väli-proteiinia,
j
, jonka kahden hypyn polku on olemassa solmujen välillä
i
ja
k
, sitten 2-hop päässä, , on 1; koko yhteydet,, proteiinia
i
joukkoon 2D-DIGE tavoitteet on yksinkertaisesti summa. Merkittävyys laskettiin vapaaksi empiirinen null muotoiltu 10000 satunnaisesti sarjaa proteiineja myös koko
n
.
arvioimiseksi malleja yhteissääntely, mRNA -parin arvot (Spearmanin korrelaatiokerrointa) laskettiin vastaava normalisoitujen microarray kokeiluja, ulottuen villityypin,
APC
1638N +/-
, ja
Cdkn1a
– /-
kryptat ja nukka; koetin maksimi-intensiteetillä käytettiin edustaja geenin. Testaamiseksi merkitys mRNA-tason korrelaatioita, modifioitu Kuiper n Testimuuttuja,
K
, laskettiin välinen ryhmä korrelaatiot (eli kaikki koettimista array) ja näyte korrelaatiot (eli joukon 2D-DIGE tavoitteet) kunkin verkon solmuun itsenäisesti; se lasketaan summana maksimaalisen ja minimaalinen poikkeamat näytteen, ja ohjaus (eli koko ryhmän),
F
, kertymäfunktioita [30]: Kuten kohti ehdotuksia Subramanian et al. [31], Kuiperin n tilaston,
K
, muutettiin parantaa sen kyky havaita bimodaalisen muutoksia sijainti näytteenjakelujärjestelmästä (Kuten odottaa ekspressoidaan ryhmiä proteiinien näyttää sekä positiivisia että negatiivisia korrelaatioita): jossa
S
on joukko proteiineja testataan (joko
APC
1638N +/-
tai
Cdkn1a
– /-
2D-DIGE tavoitteet) ;
r
on tilannut vektori väliset korrelaatiokertoimet vastaavien 2D-DIGE tavoitteet ja yhden verkkosolmun; ja normalisoi saada summa 1. merkitys testaus suoritettiin käyttäen normaaliapproksimaatiota Empiirisen null: empiirinen null koottiin modifioitu
K
laskettu 500 satunnaisesti valittua proteiinia sarjaa, kukin kooltaan, ja suurimman todennäköisyyden arviointiin käytettiin sopimaan normaalijakaumaa. Tutustumiseen ja havainnollistaa yhteyksiä merkittävä (
α
= 0,05) verkon solmut, tarkastellaan osajoukko korrelaatioita,
r
y
, jos se ja; ja osajoukko korrelaatioita,
r
p
, jos sellainen, että ja (analoginen ”etureunan” alaryhmä GSEA [31]). Tunnistaa ilmentyvät eri solmuja, valitsimme ne solmut, jossa t-tilaston (varianssi on erisuuruinen) enimmäisvoimakkuudesta koetin oli sellainen, että joko krypta tai nukka osastoon, jossa on normaali käänteinen kertymäfunktio.
testaus jokainen solmu
APC-Cdkn1a
verkko itsenäisesti johti
p
-arvo kullekin nollahypoteesi, missä, ja kukin hypoteesi,, oletetaan, ettei suhdetta ( fyysisesti perustuva tai -parin-pohjainen) välillä
APC-Cdkn1a
verkkosolmun,
i
, ja 2D-DIGE tavoitteita. Testaa ryhmä nollahypoteesin jotka kaikki ovat yhtä aikaa totta,
p
-arvot olivat yhdistetä tilastotieto,
τ
, ehdotti Fisher; merkittävyys arvioitiin vasten jakaumaa 2
n
vapausasteita [26] (ks myös Methods S1). Mutatoidut solmu (
APC
in
APC
1638N +/-
tai
Cdkn1a
in
Cdkn1a
– /-
) jätettiin vastaavista analyyseistä, koska niiden äärimmäisen ekspressiokuvioiden vinouttaa ryhmä kerrallaan tuloksia.
tulokset
Kuljettaja Gene Network Ennusteet
kaksoismutantti
APC
1638N +/- Cdkn1a
– /-
hiiri oli aiemmin osoitettu olevan synergistinen kasvua sen kasvaimen rasitukselta verrattuna yksittäiset mutantit [13]. Tunnistamaan mahdollisia yhteyksiä
APC
ja
Cdkn1a
rakensimme ennakoivaa puitteet, jotka yhtäältä oppii merkinnästä kuviot ominaisuus tunnettujen signalointireittien (esimerkiksi ne löytyy Kegg [32] ja muut), ja sitten parit näitä kuvioita kudosspesifisiä -parin tiedot purkaa todennäköisesti ketjujen vuorovaikutuksessa osallistuvien proteiinien
APC-Cdkn1a
signalointi (esitetty kuviossa 1). Tunnistamaan pelkästään korkean luottamuksen polkuja, kaksivaiheinen suodatus prosessi käytettiin ensimmäisen maailmanlaajuisen PPI verkkoon. Ensimmäisessä vaiheessa, reunat – koottu nisäkkäiden vuorovaikutukset BioGRID [27] ja HPRD [28] – karsittiin verkosta, jos ne eivät muistuta todennäköisesti vuorovaikutuksia (kuten määritelty logistiikkaregressiomallin), jonka tavoitteena on vähentää vääriä positiivisia joukossa raportoitu yhteisvaikutuksia. Tilille vääriä negatiivisia (Phase 2), vuorovaikutukset lisättiin verkkoon päättelemällä suhteita, jotka ovat ennakkotapauksia malliorganismien perustuen proteiiniin perhesuhteita. Sen jälkeen näiden toimenpiteiden soveltamisessa tuottaa synteettinen verkko, etsittiin todennäköisesti yhteyksiä
APC
ja
Cdkn1a
käyttäen sekä geenin ilmentymiseen yhdessä datan ja Gene ontologia yhdistyksen säännöissä.
Korostetaan solmukohdat ja reunat liittyvät biologiset järjestelmä, esittelimme kudosspesifisiä puolueellisuudesta etsiessämme
Apc
–
Cdkn1a
yhteyksiä käyttäen geenien ilmentyminen tietoja suoliepiteeliin on
APC
Min /+
hiirillä. Näistä tuloksista laskimme mRNA-tason -parin arvo yksittäisten reunojen kautta geeni-geeni Pearsonin korrelaatiokerrointa. Seuraavaksi kaikki polut synteettinen yhdistävän verkon geenituotteet
APC
ja
Cdkn1a
tiedusteltiin, ja ennustettu polut suodatettu (i) tuki yhdistyksen sääntöjen GO merkinnät ja (ii) keskimääräinen koekspressointi polkua pitkin; tulos (at merkittävyystasolla
α
= 0,01) on esitetty kuviossa 2.
Apc
–
Cdkn1a
verkko sisältää useita aiemmin tunnettuja yhteisvaikutuksia (kiinteä riviä) sekä ennustettu vuorovaikutus (katkoviivat), joka perustuu: (i) proteiini perhesuhteet, (ii) vahvuus GO yhdistyksen sääntöjä, ja (iii) mikrosirun samanaikaisen ilmentymisen pitkin tiettyä polkua liittämällä
APC
kohteeseen
Cdkn1a
. Koska geneettinen yhteisvaikutuksia sisällytetty alkuperäiseen vuorovaikutuksessa tietokantoja, ennustettu verkko sisältää sekä fyysiset ja toiminnalliset suhteet.
Kiinteä reunat ovat aikaisemmin tunnettuja yhteisvaikutuksia; murskautuvat reunat ovat ennustettu vuorovaikutus; ja reunat merkitty ”v” edustavat ennustettu vuorovaikutus, jotka on validoitu äskettäin julkaistusta kirjallisuudesta.
Tällä järjestelmätason ehdotettu
APC-Cdkn1a
verkko kantaa tilastollisesti epätodennäköistä ominaisuus on kyllästetty onkogeenien: 8 20 proteiineja, on merkitty onkogeenien OMIM (
p
-arvo alle 5 x 10
-10 Fisherin tarkkaa testiä, katso Methods S1), ja monet muut geenit on kokeellisesti osoitettu toimivan onkogeenien (esim
ErbB3
[33], [34],
Shc1
[35],
Map2k1
[36 ]). Vaikka
Apc
–
Cdkn1a
verkko sisältää useita hyvin tutkittu proteiineja, solmun aste (ts vuorovaikutusten määrä) sisällä aliverkko ei ole täysin korreloi solmun tutkinto suodattamaton vuorovaikutuksessa tietokannan (Pearsonin korrelaatio = 0,51). Esimerkiksi vaikka AKT1 on monia tunnettuja yhteisvaikutuksia, sen yleisesti tutkittu biologisen kumppanit – nimittäin GSK3b ja PTEN (jotka molemmat liittyvät
APC
[3] ja
Cdkn1a
[37] signalointi ) – eivät näy verkossa. Muita tunnettuja vuorovaikutuksia, kuten välillä SHC1 ja SRC [38], ovat myös poissa verkosta. Koska meidän algoritmi ennustaa yhteyksiä vääristyneinä biologiaa järjestelmän tutkittavana (käyttämällä geenien ilmentyminen tietojen
APC
Min /+
hiiri suolen kudosta), tiettyyn proteiiniin tai reuna ehkä näy verkon jos reitin (eli ketju proteiinien), johon se sijaitsee ei täytä geeniä samanaikaista ilmentymistä ja /tai GO assosiaatiosääntöjen kynnysarvot.
Käänteisesti
Apc
–
Cdkn1a
verkko sisällään uusia yhteenliittymiä: ne eivät sisällä lähde tietokantoja (katkoviiva reunat kuvassa 2). Useat näistä yhteisvaikutuksista on viime aikoina validoitu keskittynyt tutkimuksissa (katso taulukko 1), voidaan luottaa, että kehys on hyödyllinen. Lisäksi
Apc
–
Cdkn1a
verkko ehdottaa myös, että tietyt vuorovaikutus on aikaisemmin yhdistetty muiden syövän malleja – kuten SRC-CCND1 toiminnallinen yhdistys löytyy eturauhassyövän [39], tai fosforylaatiota CDK4 jonka SRC solulinjassa [40] – ovat merkityksellisiä tässä mallissa paksusuolen syöpä.
Yhden Solmut häiriöt: mRNA Profilointi
Apc- Cdkn1a
verkko edustaa risteyksessä signalointipolkujen peräisin
APC
ja
Cdkn1a
, odotamme tarkkailla toiminnallisia muutoksia verkkoon liittyvien proteiinien vastauksena häiriöitä joko
APC
tai
Cdkn1a
. Yhden solmun häiriöiden kehitettiin hiiri malleja, joissa mutaatiot joko
Apc
(eli
APC
1638N +/-
) tai
Cdkn1a
(
Cdkn1a
– /-
). Vaikka
Apc
–
Cdkn1a
verkko muodostettiin käyttäen kasvainspesifisiä
APC
Min /+
data – malli kätkeminen useita tausta geneettisten vaurioiden [41 ] – suoliston kudos saadaan
APC
1638N +/-
ja
Cdkn1a
– /-
hiirillä 3 kuukauden iässä on suhteellisen polyyppi vapaa, mikä antaa meille mahdollisuuden arvioida vaikutus yksittäisen geneettisen häiriön pre-neoplastisia epiteelin. Vaikka tämä poistaa mahdollinen harha, joka on otettu käyttöön myöhemmin mutaatioiden kasvainkudoksessa, tämä lähestymistapa voi myös heikentää tiedonkulkua näiden kahden geenin välissä.
Koska käytämme kahta häiriöt selvittää, miten hyvin
APC-Cdkn1a
verkko voi kaapata biologisten ilmiöiden, otimme käyttöön monimuuttujatestausta tilastotieto,
V
2
testata, jos eroja keskimääräisissä mRNA runsaasti olemassa yhteisesti
APC
1638N + /-
ja
Cdkn1a
– /-
malleja. Käyttämällä
V
2
, kuten kuviossa 3, geenit lievää differentiaalikaavojen kahden yksittäisen mutantit voivat edistää yleistä tukea verkon, kuten
V
2
palkitsee ne geenit, joissa kussakin kaksi riippumatonta t-tilastot ovat molemmat suurempia kuin 1. Tilastollisesti merkittävä
V
2
testattiin permutaatio null, ja kuten häiriöt mukana kaksi tuumorisuppressoreilla odotetaan olevan molekyyli vaikutuksia samaan suuntaan, käytimme positiivinen hännän jakelun. Tietäen, että monet molekyylit ”kytkin” lauseke (eli suurimmasta pienimpään, tai päinvastoin) siirryttäessä crypts ja Villi [19], mikrosirulla aineistot näiden kahden biologisen osastoa testattiin erikseen. Huomasimme, että
APC-Cdkn1a
verkon tuki voimakkaasti (
p
-arvo = 0,002) yhteisessä mRNA ero ilmentymisen kahdessa mutanttien krypta. Verkon yhtenäisyyden oli heikompi (
p
-arvo = 0,060) kun villus osastoon, ja verkko kokonaisuutena ei differentiaalisesti ilmaistu Villi joko mutantin, totesi kahdessa
V
2
matriisit ”
p
-arvot: kun, kuten mainittiin, diagonaalialkiot osoittavat merkitys ero ilmaisun
sisällä
mutantti (per Hotellingin
t
2
), ja off-diagonaalialkiot osoittavat merkitys yhteisten differentiaalikaavojen
poikki
mutantteja (kuten per
V
2
). Vuonna kryptissa, verkosto oli differentiaalisesti ilmaistu
Cdkn1a
– /-
(
p
-arvo = 0,009), mutta ei
APC
1638N +/-
(
p
-arvo = 0,871), ja kuitenkin oli yhdessä tukevat differentiaalikaavojen kaikkialle sekä hiiren malleissa (
p
-arvo = 0,002). Tämä osoittaa, että pieni mRNA-tason muutoksia, jotka ovat yhteisiä useiden häiriöiden – on geeni-by-geenin perusteella – antaa yhteinen tuki verkkoja hypoteesin, kun taas yksittäiset häiriön voi epäonnistua osoittaa vaatimuksen.
Jokaisessa verkko geeni edustaa kaksi päällekkäistä kuplia värillinen mukaan t-tilastojen (varianssi on erisuuruinen) kahden mutantteja: vasemmalla alhaalla kupla geenin vastaa t-tilastotieto
APC
1638N +/-
, ja vasemmassa yläkulmassa kupla t-tilastotieto
Cdkn1a
– /-
. Risteyksessä kaksi kuplaa vastaa summa t-tilastot, joka kuvaa, miten merkitys pieniä vaikutuksia voidaan tehostaa, kun sitä tarkastellaan yhdessä. Solmut vaimentua in mutantti ovat värillisiä vaaleanpunainen, ne voimistussäädellään mutantti ovat keltaisia, ja neutraali t-tilastot ovat harmaita.