PLoS ONE: ennustaminen ja testaus Biological Networks Taustalla Suoliston Cancer

tiivistelmä

peräsuolen syöpä etenee kertyminen somaattisista mutaatioista, joista osa asuu ns ”driver” geenejä, jotka tarjoavat kasvu etu kasvain. Tunnistaa leikkauspisteitä kuljettajan geeni polkuja, toteutimme verkostoanalyysi puitteet käyttäen proteiini vuorovaikutusten ennakoimiseen yhteydet – sekä ennennäkemätön ja uusi – välillä avaintekijä geenien syöpää. Käytimme puitteissa löytää merkittäviä yhteyksiä kaksi geeniä,

APC

ja

Cdkn1a

(

p21

), tiedetään olevan synergistisiä kasvainten synnyssä hiirimalleissa. Sitten arvioitiin toiminnallinen yhtenäisyys tuloksena

APC-Cdkn1a

verkon suunnittelu

in vivo

yhden solmun häiriöitä verkon: hiirimalleihin mutatoitunut yksitellen

Apc

(

APC

1638N +/-

) tai

Cdkn1a

(

Cdkn1a

– /-

), minkä jälkeen mittaukset proteiinin ja geenin ilmentymisen muutoksia suolen epiteelikudokseen . Oletimme, että jos ennustettu verkko on biologisesti yhtenäinen (toiminnallinen), niin ennustettu solmut pitäisi liittää erityisesti väärin säädeltyyn geenien ja proteiinien kuin stokastisesti valittu geenien ja proteiinien. Ennustettu

APC-Cdkn1a

verkon merkittävästi häiritsi mRNA-tason sekä yhden geenin aihiot, ja ennusteet olivat myös vahvasti tuettu perustuu fyysiseen läheisyyteen ja mRNA -parin proteomic tavoitteita. Nämä tulokset tukevat toiminnallista yhtenäisyyttä ehdotetun

APC-Cdkn1a

verkkoon ja myös osoittamaan, miten verkko-ennusteita voidaan tilastollisesti testata käyttämällä suuren läpimenon biologista tietoa.

Citation: Patel VN, Bebek G, Mariadason JM, Wang D, Augenlicht LH, Chance MR (2010) ennustaminen ja testaus Biological Networks taustalla Suoliston syöpä. PLoS ONE 5 (9): e12497. doi: 10,1371 /journal.pone.0012497

Editor: Tšad Creighton, Baylor College of Medicine, Yhdysvallat

vastaanotettu: toukokuu 16, 2010; Hyväksytty: 26 heinäkuu 2010; Julkaistu: 1. syyskuuta 2010

Copyright: © 2010 Patel et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ on tukenut National Institutes of Health Avustukset UL1-RR024989 National Center for Research Resources (Clinical and Translational Science palkinnot) ja P30-CA043703 päässä Case Western Reserve University Kattava Cancer Center. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

suurin osa periytyvä Kolorektaalituumorien syntyy kautta juokseva mutaatioiden keskeinen tekijä geenejä, joissa on mutaatio tuumorisuppressori (esim

APC

) tai onkogeenin (esim

Kras

) aloittaa prosessin, ja kaskadi somaattisten mutaatioiden ensues [1]. Vaikka nämä mutaatiot klassisesti ajatellaan koostuvan muutamia geenejä (esimerkiksi

APC

,

Kras

,

Trp53

), laaja-alaisten sekvensointi ponnisteluja paljasti, että mikä tahansa kasvain sisältää (keskimäärin) 80 mutaatioita, peräti 15 makaa usein muuntunut ”driver” geenit [2]. Tukeakseen hypoteesia, että nämä keskeiset geenit toimivat yhteistoiminnassa ajo kasvainten synnyssä, hiiri malleja mutatoitunut kahden kuljettajan geenejä samanaikaisesti ovat osoittaneet synergististä kasvaimen taakkaa, mukaan lukien:

PTEN-Apc

[3],

Kras-TGFb

[4], ja

APC-Trp53

[5]. Todisteet synergististä eli summautumattomat, nousu kasvaintaakkaa viittaavat siihen, että signalointi polkuja kaksi mutatoitujen geenien voi leikata loppupäässä, ja siten ennustamaan ja kuulusteltavaksi nämä kohdat leikkauspisteessä –

biologisena verkko

– on merkittävää etua. Jäljittää yhteydet geenien erilaisia ​​suurikapasiteettisten aineistot – esim. proteiini-proteiini vuorovaikutusten (PPI), geeni -parin, ja transkriptiotekijä suhteet – on käytetty päätellä toiminnallisia yhteenliittymiä, jotka soveltuvat analyysin verkostoja, joissa kukin geeni tai proteiini on edustettuna solmu ja vuorovaikutuksen reunasta. Lisäksi verkko-pohjainen analyyseja voidaan käyttää tunnistamaan biomarkkereita [6], ennustaa taudin etenemiseen [7], tai paljastaa molekyylitason muutoksia taustalla sairaus [8].

Kuitenkin nykyinen tietämys biologisista verkkojen on kaukana täydellisestä. Kattavuus nykyisen interactome tietokantojen arvioidaan olevan alle 10% kokonaismäärästä vuorovaikutusten [9]. Niinpä, kun interpoloimalla yhteyksiä kuljettajan geenejä, verkko-pohjainen analyysit, jotka luottavat pelkästään vahvistanut yhteisvaikutuksia voi puuttua olennaisia ​​yhteyksiä. Yhtenä päämääränä tutkimus on ennustaa ja analysoida toiminnallisia polkuja ajajalle geenien, kriittinen vaihe oli kehittää ennustavan puitteet päätellä ja arvioida uusia yhteyksiä geenien. Ehdotetun kehyksen here (mallina Pathfinder [10]) päättelee puuttuu reunat käyttäen ennustuksia proteiini perhesuhteista ja suodattaa näitä polkuja huomioon tunnetut yhdistyksen säännöissä. Toisaalta, koska syövän geeni osallistuu useita signalointireiteissä, saattaa olla useita kymmeniä – jos näin ei ole, satoja – polkuja, jotka kaksi proteiinia toiminnallisesti vuorovaikutuksessa. Siten laskennallinen lähestymistapa on tarpeen rajoittaa verkon tilaa tyypillistä biologista yhteydessä kiinnostusta. Voit purkaa toiminnallisesti asiaankuuluvat aliverkkoihin, puitteet tunnistaa erittäin todennäköinen signalointireitteihin perustuvat geeni-geeni mRNA -parin ja Gene ontologia [11] assosiaatiosäännöt louhitaan julkaistu reittejä.

Käytimme laskennallisen menetelmän valaista yhteyksiä välillä tunnettu kuljettaja geenin suoliston syöpä,

Apc

(

adenomatoottisen polypoosin coli

), toiseen geeni mukana myös syövän,

Cdkn1a

(aiemmin tunnettu nimellä

p21

). Vaikka

Cdkn1a

ei todettu olevan mutatoitunut populaatioissa ihmisen paksusuolen ja peräsuolen syöpiä tutkittu tähän mennessä [2], sen ekspressiotaso korreloi neoplastisten etenemisen ja on ennusteen arvioinnissa suurempi kuin

Trp53

[12]. Lisätukielimet sen merkitys neoplasia, kaksinkertainen mutantti hiiren,

APC

1638N +/- Cdkn1a

– /-

, osoittaa synergististä kasvua sen kasvaintaakkaa [13]. Sen jälkeen ennustaminen yhdistävän verkon

APC

ja

Cdkn1a

, arvioimme merkitystä nämä ennustukset manipuloimalla taustalla järjestelmä: tuottavan

in vivo

verkon häiriöt kahdella hiiren mallia, seurasi järjestelmätason ”omic mittaukset ohutsuolen epiteelin. The ’omic mittaukset – sekä proteomic ja genomista – häirityn järjestelmää käytettiin tilastolliseen testaukseen ennustetun verkon, mikä otetaan käyttöön käsite arvioitaessa

in silico

ennusteet vastaan ​​asiayhteyskohtaisia ​​biologista tietoa.

Materiaalit ja menetelmät

Network Analysis Framework

verkon analysointi kehys (kuvassa 1, ja selitetään menetelmiä S1) työllistää PathFinder arkkitehtuuri hahmoteltu aiemmin [10]. Raaka verkosto julkisesti saatavilla fyysistä vuorovaikutusta ensin karsitaan vääriä positiivisia käyttäen logistista regressiomallia, joka sisältää (i) kuinka monta kertaa PPI havaitaan, (ii) Pearsonin korrelaatiota ilmentymisen mittausten vastaavien geenien, (iii) proteiinien ”pieni maailma klustereiden kerroin, ja (iv) proteiini solunosasijaintia tiedot vuorovaikutuksessa kumppaneita. Positiivinen (1000 PPI-lääkkeet päässä MIPS [14] tietokanta vuorovaikutus) ja negatiivinen koulutus tietomääriä (1000 satunnaisesti valittua protonipumpun estäjien, jotka eivät ole MIPS) käytetään 1000 rajat validointikokeita hankkia parametrit maksimoida todennäköisyys, todellinen vuorovaikutus .

prosessi alkaa kaksivaiheinen suodatus prosessi tilille vääriä positiivisia ja vääriä negatiivisia vuorovaikutuksessa tietokantoihin. Kun olet valinnut kuljettaja kiinnostavat geenit, polkuja ennustetaan ja sitten karsitaan molemmilla GO aikavälin yhdistyksen säännöt ja geeni-geeni -parin arvoja. Lopuksi merkittäviä reitin segmentit yhdistetään päästä verkkoon yhdistää kaksi kuljettajaa geenejä. Puitteet sisältää kudosspesifisiä mRNA -parin kahdella tasolla: vuonna pairwise suodatus vääriä positiivisia; ja suodatuksen polkuja keskimäärin -parin. Logistinen regressiomalli on koulutettu kulta-standardin interactome tietokantoja (katso Menetelmät S1 lisätietoja).

Väärät negatiiviset vuorovaikutukset päätellä käyttäen sekvenssihomologia suhteita. Havaittiin, että proteiinit, joilla on samanlaiset sekvenssit jakavat samanlaiset vuorovaikutus kumppaneita samalla organismi [15], ja siten proteiinit samasta perheestä ovat myös todennäköisesti samanlainen vuorovaikutuksen tavoista. Pfam tietokanta, hyödyntämällä usean sekvenssin rinnastukset ja HMM (HMM), käyttää sekvenssin samankaltaisuus muotoilla proteiiniperheelle Luokitusten [16] ja toimii hyödyllinen väline hyödyntämällä näitä suhteita. Näin ollen meidän päätellä vuorovaikutusta reuna, jos (i) kaksi proteiinia eivät ole vuorovaikutuksessa toistensa kanssa, että PPI-verkkoon, ja (ii) on olemassa ainakin yksi vuorovaikutus perheiden näiden kahden proteiinin.

tunnistamiseksi poluille merkitystä mallimme järjestelmän kohteisiin, -parin tiedot perustuvat microarray kokeiluja

APC

Min /+

hiiri ohutsuolen epiteelin saatiin Gene Expression Omnibus (sarja GSE422 [17]); Tässä tutkimuksessa käytetty laser-capture mikrodissektion näyte crypts adenoomien, karsinoomien ja normaali epiteelin. Meidän toteutuksessa käytimme Pfam julkaisu 23.0 [16] ja Gene ontologia julkaistaan ​​elokuussa 2008 [11]. Hakualgoritmi laajennettiin löytää väyliä jopa 6 solmua pituisia, ja kynnys keskimääräisen -parin väyliä oli.

Hiiri suoliepiteeliin Isolation

Kaikki eläimet käsiteltiin tiukasti mukaisesti eläinten hyvä käytäntö määrittelemät asianomaisten kansallisten ja /tai paikallisten eläinten hyvinvoinnin elimet, ja kaikki eläinten työ hyväksyi Institutional animal Care ja Käytä komitea (IACUC) Albert Einstein College of Medicine (luvan numero 20070805).

APC

1638N +/-

ja

Cdkn1a

– /-

C57BL6 /J-hiiret synnytettiin kuten on aiemmin kuvattu [13], ja kudosnäytteet otettiin talteen käyttäen menetelmää, jonka Weiser et al., jolloin krypta ja villus populaatioiden solujen ohutsuolen

APC

1638N +/-

,

Cdkn1a

– /-

, ja villityypin hiirien [18].

2D-ero geelielektroforeesi

2D-ero geelielektroforeesi (2D-DIGE) suoritettiin, kuten aiemmin on kuvattu [19]. Ilmentyvät eri proteiineja krypta ja villus fraktiot tunnistettiin mutantti hiirissä (

APC

1638N +/-

ja

Cdkn1a

– /-

) suhteessa vastaavaan jakeet villin tyyppinen hiiret (4 jäljittelee kukin). Univariate t-testit (epätasainen varianssien ja yhtäläiset otoskokoja) ja monimuuttuja lineaarinen regressio (koodattu R pakkauksessa Limma [20]) suoritettiin. Geeli kohdetta valittiin LC-MS /MS-tunnistaminen perustuu näiden kahden t-tilastoja tasolla 0,05 merkitys.

geeli täplät leikattiin irti, trypsiini pilkottu, ja peptidit analysoitiin sen jälkeen tandem LC-MS /MS on LC Packings /Dionex Ultimate 3000 HPLC-Orbitrap XL (Finnigan, San Jose, CA) järjestelmä [19]. Sillä tulkinta MS /MS-spektri, MASCOT ohjelmistopaketti käytettiin etsimään SwissProt tietokannasta; null tietokanta päinvastaiseksi peptidisekvenssejä haettiin samanaikaisesti huomioon vääriä positiivisia. Tunnistetut proteiinit luetellaan taulukossa S1. Mascot DAT tiedostot on julkisesti saatavilla kautta proteomiikka tunnistukset Database [21], hakunumerolla 10638.

geeniekspressioprofilointi

Microarray tutkimuksia krypta ja villus populaatioita

APC

1638N + /

-,

Cdkn1a

– /-

, ja villityypin hiiret (4 jäljittelee kukin) suoritettiin Affymetrix hiiri genomista 2,0 pelimerkkejä julkaistujen menetelmien mukaisesti [22] . Kaikki tiedot on MIAME yhteensopiva ja raakadataa on tehty julkisesti saataville MIAME yhteensopiva tietokanta, Gene Expression Omnibus [23], hakunumero GSE19338.

Verkko mRNA Analysis

Raw .CEL tiedostoja käsiteltiin MATLAB käyttäen Robust Multiarray keskiarvonmääritysmenetelmä [24]. Käsittelemään useita koettimia syömällä eri näkökohtia geenituotteen käyttäytymistä, käytimme kaikki antureista edustamaan geeniin. Niinpä seuraava analyysi, jokainen

APC-Cdkn1a

verkkosolmun,

i

, edusti

k

i

koettimista array, jolloin matriisin koko

q

×

n

, missä ja. Sen määrittämiseksi, oliko

APC-Cdkn1a

verkon solmut kollektiivisesti differentiaalisesti ilmaistut kudoslokeron (crypts tai Villi), laajensimme Hotellingin

t

2

tilastollinen – klassinen lähestymistapa hyödyllinen testaus geenin ryhmät [25] – sisällyttää useita kokeita, seuraavasti: missä on vektori keskimääräinen mRNA intensiteetin kaikille

q

koettimina geneettinen tausta,

G

, jossa (

APC

osoittaa

APC

1638N +/-

;

Cdkn1a

osoittaa

Cdkn1a

– /-

, ja

WT

ilmaisee villin tyypin C57BL6 /J).

S

on itseisarvo puolueeton yhdistetty näyte kovarianssimatriisi kullekin mutantti: jossa

Mutant

voi viitata joko

APC

1638N +/-

tai

Cdkn1a

– /-

, ja absoluuttinen arvo

S

käytetään estämään imaginaarikomponenttien otettaessa käänteistä juureen

S

vuonna. On huomattava, että antureista vastaa

APC

ja

Cdkn1a

itse suljettiin, koska sen odotetaan olevan erittäin matalan intensiteetin arvot (vastaavassa mutantit), jotka voisivat vääristää koettu yhteenlaskettu verkkoon vaikutus. Vuonna ero keinoja, jokaisen mutantti voi olla positiivinen tai negatiivinen koetin

i

, niin, toisin kuin

t

2

,

V

2

voi olla joko positiivinen tai negatiivinen.

Koska, näytekovarianssi arviot eivät ole positiividefiniitti, ja siten, käänteinen on yksikössä. Voit kiertää tämän ongelman, asetimme kaikki kovarianssien nollaan laskemiseksi ensimmäistä

V

2

ja sitten laskea merkitystä

V

2

käyttämällä permutaatio testi (ts stokastisesti synnyttää uusia ”

mutantti

” ja ”

villityypin

” fenotyyppi etiketit), näin huolehtia taustalla kovarianssi rakenne null jakeluun. Asettaminen off-diagonaalialkiot

S

nollaan yksinkertaistaa

V

2

on: Siten

V

2

on yksinkertaisesti summa tuotteen skaalattuna t-tilastot lasketaan kunkin koettimen, kussakin kaksi kokeellista häiriöiden. Koska näytteiden määrä oli pieni (mutantin ja villityypin, kukin), kohinaa lisättiin kuhunkin permutoidun matriisin saamiseksi interpoloitu ja tasoitetaan empiirinen null jakelu; keskihajonta,, melu kunkin koetin,

q

, että geneettinen tausta,

G

, arvioitiin näytteen keskihajonta kunkin koetin. 10000 tällaiset permutaatiot laskettiin saada null jakaumia, joka -kuten odotettavissa – muistuttavat F-jakaumien (katso kuva S1). Koska

APC

ja

Cdkn1a

ovat tuumorisuppressoreilla ja arveltu vaikuttavan verkostomme kiinnostusta samalla tavalla, odotamme t-tilastot vaihtelevat samaan suuntaan jos hypoteesi ( mitään yhteistä vaikutus) on hylättävä. Näin ollen meidän laskea

p

-arvoon

V

2

kuin määrä nolla havaintojen suurempi kuin meidän havaittu arvo

V

2

. Laskeminen

p

-arvon kielteisistä hännän jakauman olisi hyödyllistä, jos häiriöt odotettiin olevan päinvastainen molekyyli vaikutuksia (esim

APC

+/-

pariksi

Stat3

+/-

hypomorph).

Vaikka esitämme analyysin varten 2-solmu häiriön verkkoon, tämä analyysi on laajennettavissa

k

kokeellinen häiriöiden laskemalla pareittain

V

2

tilastoja, jolloin matriisissa: Missä edustaa tilaston välillä häiriöiden

j

ja

k

; kuten on esitetty, lävistäjä vähenee skaalattu versio Hotellingin

t

2

tilastotieto kullekin kokeelle. Koska tilastot ovat kukin eri mittakaavassa, niitä ei voida verrata suoraan, ja siten merkitys matriisin kunkin alkion tulee laskea (kuten yllä) kautta permutaatio testi. Sitten, että matriisi

p

-arvot, diagonaalialkiot antaa tietoa merkityksestä erillisiä kokeita, kun taas off-lävistäjä arvot antavat tietoa pairwise kokeellinen merkitys. Yhteenlaskettu kokeellinen tuki verkon häiriöt voidaan laskea yhdistämällä off-diagonaalinen

p

-arvot, esim. Fisherin menetelmällä [26]. Suosittelemme tätä lähestymistapaa käsitellä häiriöiden; for häiriöiden, kuten meidän tapauksessamme,

p

-arvoja voidaan tulkita suoraan.

Analyysi proteomiikan Tavoitteiden

merkityksen arvioimiseksi fyysistä läheisyyttä, topologinen etäisyys välillä

Apc

Cdkn1a

verkon solmut ja vastaavat proteomic tavoitteet laskettiin. Fyysinen PPI verkostoja koottu BioGRID [27], ihmisen proteiini viitetietokantaan (HPRD) [28], ja ehjä [29]. Kukin verkkosolmu testattiin itsenäisesti määrän 2-hop polut kytkemällä se joukko

n

kokeellisesti mitattu proteiineja, ilmaistaan ​​seuraavasti: Missä on merkintä rivillä

i

ja sarake

j

vuonna vierusmatriisi,

, PPI-verkon;

i

on proteiini

APC-Cdkn1a

verkkoon;

j

on välituote proteiini; ja

k

on kokeellisesti mitattuja proteiinia. Tällöin kokeellinen proteiinit olivat proteomic tavoitteet joko

APC

1638N +/-

tai

Cdkn1a

– /-

hiirillä. Jos on olemassa ainakin yksi väli-proteiinia,

j

, jonka kahden hypyn polku on olemassa solmujen välillä

i

ja

k

, sitten 2-hop päässä, , on 1; koko yhteydet,, proteiinia

i

joukkoon 2D-DIGE tavoitteet on yksinkertaisesti summa. Merkittävyys laskettiin vapaaksi empiirinen null muotoiltu 10000 satunnaisesti sarjaa proteiineja myös koko

n

.

arvioimiseksi malleja yhteissääntely, mRNA -parin arvot (Spearmanin korrelaatiokerrointa) laskettiin vastaava normalisoitujen microarray kokeiluja, ulottuen villityypin,

APC

1638N +/-

, ja

Cdkn1a

– /-

kryptat ja nukka; koetin maksimi-intensiteetillä käytettiin edustaja geenin. Testaamiseksi merkitys mRNA-tason korrelaatioita, modifioitu Kuiper n Testimuuttuja,

K

, laskettiin välinen ryhmä korrelaatiot (eli kaikki koettimista array) ja näyte korrelaatiot (eli joukon 2D-DIGE tavoitteet) kunkin verkon solmuun itsenäisesti; se lasketaan summana maksimaalisen ja minimaalinen poikkeamat näytteen, ja ohjaus (eli koko ryhmän),

F

, kertymäfunktioita [30]: Kuten kohti ehdotuksia Subramanian et al. [31], Kuiperin n tilaston,

K

, muutettiin parantaa sen kyky havaita bimodaalisen muutoksia sijainti näytteenjakelujärjestelmästä (Kuten odottaa ekspressoidaan ryhmiä proteiinien näyttää sekä positiivisia että negatiivisia korrelaatioita): jossa

S

on joukko proteiineja testataan (joko

APC

1638N +/-

tai

Cdkn1a

– /-

2D-DIGE tavoitteet) ;

r

on tilannut vektori väliset korrelaatiokertoimet vastaavien 2D-DIGE tavoitteet ja yhden verkkosolmun; ja normalisoi saada summa 1. merkitys testaus suoritettiin käyttäen normaaliapproksimaatiota Empiirisen null: empiirinen null koottiin modifioitu

K

laskettu 500 satunnaisesti valittua proteiinia sarjaa, kukin kooltaan, ja suurimman todennäköisyyden arviointiin käytettiin sopimaan normaalijakaumaa. Tutustumiseen ja havainnollistaa yhteyksiä merkittävä (

α

= 0,05) verkon solmut, tarkastellaan osajoukko korrelaatioita,

r

y

, jos se ja; ja osajoukko korrelaatioita,

r

p

, jos sellainen, että ja (analoginen ”etureunan” alaryhmä GSEA [31]). Tunnistaa ilmentyvät eri solmuja, valitsimme ne solmut, jossa t-tilaston (varianssi on erisuuruinen) enimmäisvoimakkuudesta koetin oli sellainen, että joko krypta tai nukka osastoon, jossa on normaali käänteinen kertymäfunktio.

testaus jokainen solmu

APC-Cdkn1a

verkko itsenäisesti johti

p

-arvo kullekin nollahypoteesi, missä, ja kukin hypoteesi,, oletetaan, ettei suhdetta ( fyysisesti perustuva tai -parin-pohjainen) välillä

APC-Cdkn1a

verkkosolmun,

i

, ja 2D-DIGE tavoitteita. Testaa ryhmä nollahypoteesin jotka kaikki ovat yhtä aikaa totta,

p

-arvot olivat yhdistetä tilastotieto,

τ

, ehdotti Fisher; merkittävyys arvioitiin vasten jakaumaa 2

n

vapausasteita [26] (ks myös Methods S1). Mutatoidut solmu (

APC

in

APC

1638N +/-

tai

Cdkn1a

in

Cdkn1a

– /-

) jätettiin vastaavista analyyseistä, koska niiden äärimmäisen ekspressiokuvioiden vinouttaa ryhmä kerrallaan tuloksia.

tulokset

Kuljettaja Gene Network Ennusteet

kaksoismutantti

APC

1638N +/- Cdkn1a

– /-

hiiri oli aiemmin osoitettu olevan synergistinen kasvua sen kasvaimen rasitukselta verrattuna yksittäiset mutantit [13]. Tunnistamaan mahdollisia yhteyksiä

APC

ja

Cdkn1a

rakensimme ennakoivaa puitteet, jotka yhtäältä oppii merkinnästä kuviot ominaisuus tunnettujen signalointireittien (esimerkiksi ne löytyy Kegg [32] ja muut), ja sitten parit näitä kuvioita kudosspesifisiä -parin tiedot purkaa todennäköisesti ketjujen vuorovaikutuksessa osallistuvien proteiinien

APC-Cdkn1a

signalointi (esitetty kuviossa 1). Tunnistamaan pelkästään korkean luottamuksen polkuja, kaksivaiheinen suodatus prosessi käytettiin ensimmäisen maailmanlaajuisen PPI verkkoon. Ensimmäisessä vaiheessa, reunat – koottu nisäkkäiden vuorovaikutukset BioGRID [27] ja HPRD [28] – karsittiin verkosta, jos ne eivät muistuta todennäköisesti vuorovaikutuksia (kuten määritelty logistiikkaregressiomallin), jonka tavoitteena on vähentää vääriä positiivisia joukossa raportoitu yhteisvaikutuksia. Tilille vääriä negatiivisia (Phase 2), vuorovaikutukset lisättiin verkkoon päättelemällä suhteita, jotka ovat ennakkotapauksia malliorganismien perustuen proteiiniin perhesuhteita. Sen jälkeen näiden toimenpiteiden soveltamisessa tuottaa synteettinen verkko, etsittiin todennäköisesti yhteyksiä

APC

ja

Cdkn1a

käyttäen sekä geenin ilmentymiseen yhdessä datan ja Gene ontologia yhdistyksen säännöissä.

Korostetaan solmukohdat ja reunat liittyvät biologiset järjestelmä, esittelimme kudosspesifisiä puolueellisuudesta etsiessämme

Apc

Cdkn1a

yhteyksiä käyttäen geenien ilmentyminen tietoja suoliepiteeliin on

APC

Min /+

hiirillä. Näistä tuloksista laskimme mRNA-tason -parin arvo yksittäisten reunojen kautta geeni-geeni Pearsonin korrelaatiokerrointa. Seuraavaksi kaikki polut synteettinen yhdistävän verkon geenituotteet

APC

ja

Cdkn1a

tiedusteltiin, ja ennustettu polut suodatettu (i) tuki yhdistyksen sääntöjen GO merkinnät ja (ii) keskimääräinen koekspressointi polkua pitkin; tulos (at merkittävyystasolla

α

= 0,01) on esitetty kuviossa 2.

Apc

Cdkn1a

verkko sisältää useita aiemmin tunnettuja yhteisvaikutuksia (kiinteä riviä) sekä ennustettu vuorovaikutus (katkoviivat), joka perustuu: (i) proteiini perhesuhteet, (ii) vahvuus GO yhdistyksen sääntöjä, ja (iii) mikrosirun samanaikaisen ilmentymisen pitkin tiettyä polkua liittämällä

APC

kohteeseen

Cdkn1a

. Koska geneettinen yhteisvaikutuksia sisällytetty alkuperäiseen vuorovaikutuksessa tietokantoja, ennustettu verkko sisältää sekä fyysiset ja toiminnalliset suhteet.

Kiinteä reunat ovat aikaisemmin tunnettuja yhteisvaikutuksia; murskautuvat reunat ovat ennustettu vuorovaikutus; ja reunat merkitty ”v” edustavat ennustettu vuorovaikutus, jotka on validoitu äskettäin julkaistusta kirjallisuudesta.

Tällä järjestelmätason ehdotettu

APC-Cdkn1a

verkko kantaa tilastollisesti epätodennäköistä ominaisuus on kyllästetty onkogeenien: 8 20 proteiineja, on merkitty onkogeenien OMIM (

p

-arvo alle 5 x 10

-10 Fisherin tarkkaa testiä, katso Methods S1), ja monet muut geenit on kokeellisesti osoitettu toimivan onkogeenien (esim

ErbB3

[33], [34],

Shc1

[35],

Map2k1

[36 ]). Vaikka

Apc

Cdkn1a

verkko sisältää useita hyvin tutkittu proteiineja, solmun aste (ts vuorovaikutusten määrä) sisällä aliverkko ei ole täysin korreloi solmun tutkinto suodattamaton vuorovaikutuksessa tietokannan (Pearsonin korrelaatio = 0,51). Esimerkiksi vaikka AKT1 on monia tunnettuja yhteisvaikutuksia, sen yleisesti tutkittu biologisen kumppanit – nimittäin GSK3b ja PTEN (jotka molemmat liittyvät

APC

[3] ja

Cdkn1a

[37] signalointi ) – eivät näy verkossa. Muita tunnettuja vuorovaikutuksia, kuten välillä SHC1 ja SRC [38], ovat myös poissa verkosta. Koska meidän algoritmi ennustaa yhteyksiä vääristyneinä biologiaa järjestelmän tutkittavana (käyttämällä geenien ilmentyminen tietojen

APC

Min /+

hiiri suolen kudosta), tiettyyn proteiiniin tai reuna ehkä näy verkon jos reitin (eli ketju proteiinien), johon se sijaitsee ei täytä geeniä samanaikaista ilmentymistä ja /tai GO assosiaatiosääntöjen kynnysarvot.

Käänteisesti

Apc

Cdkn1a

verkko sisällään uusia yhteenliittymiä: ne eivät sisällä lähde tietokantoja (katkoviiva reunat kuvassa 2). Useat näistä yhteisvaikutuksista on viime aikoina validoitu keskittynyt tutkimuksissa (katso taulukko 1), voidaan luottaa, että kehys on hyödyllinen. Lisäksi

Apc

Cdkn1a

verkko ehdottaa myös, että tietyt vuorovaikutus on aikaisemmin yhdistetty muiden syövän malleja – kuten SRC-CCND1 toiminnallinen yhdistys löytyy eturauhassyövän [39], tai fosforylaatiota CDK4 jonka SRC solulinjassa [40] – ovat merkityksellisiä tässä mallissa paksusuolen syöpä.

Yhden Solmut häiriöt: mRNA Profilointi

Apc- Cdkn1a

verkko edustaa risteyksessä signalointipolkujen peräisin

APC

ja

Cdkn1a

, odotamme tarkkailla toiminnallisia muutoksia verkkoon liittyvien proteiinien vastauksena häiriöitä joko

APC

tai

Cdkn1a

. Yhden solmun häiriöiden kehitettiin hiiri malleja, joissa mutaatiot joko

Apc

(eli

APC

1638N +/-

) tai

Cdkn1a

(

Cdkn1a

– /-

). Vaikka

Apc

Cdkn1a

verkko muodostettiin käyttäen kasvainspesifisiä

APC

Min /+

data – malli kätkeminen useita tausta geneettisten vaurioiden [41 ] – suoliston kudos saadaan

APC

1638N +/-

ja

Cdkn1a

– /-

hiirillä 3 kuukauden iässä on suhteellisen polyyppi vapaa, mikä antaa meille mahdollisuuden arvioida vaikutus yksittäisen geneettisen häiriön pre-neoplastisia epiteelin. Vaikka tämä poistaa mahdollinen harha, joka on otettu käyttöön myöhemmin mutaatioiden kasvainkudoksessa, tämä lähestymistapa voi myös heikentää tiedonkulkua näiden kahden geenin välissä.

Koska käytämme kahta häiriöt selvittää, miten hyvin

APC-Cdkn1a

verkko voi kaapata biologisten ilmiöiden, otimme käyttöön monimuuttujatestausta tilastotieto,

V

2

testata, jos eroja keskimääräisissä mRNA runsaasti olemassa yhteisesti

APC

1638N + /-

ja

Cdkn1a

– /-

malleja. Käyttämällä

V

2

, kuten kuviossa 3, geenit lievää differentiaalikaavojen kahden yksittäisen mutantit voivat edistää yleistä tukea verkon, kuten

V

2

palkitsee ne geenit, joissa kussakin kaksi riippumatonta t-tilastot ovat molemmat suurempia kuin 1. Tilastollisesti merkittävä

V

2

testattiin permutaatio null, ja kuten häiriöt mukana kaksi tuumorisuppressoreilla odotetaan olevan molekyyli vaikutuksia samaan suuntaan, käytimme positiivinen hännän jakelun. Tietäen, että monet molekyylit ”kytkin” lauseke (eli suurimmasta pienimpään, tai päinvastoin) siirryttäessä crypts ja Villi [19], mikrosirulla aineistot näiden kahden biologisen osastoa testattiin erikseen. Huomasimme, että

APC-Cdkn1a

verkon tuki voimakkaasti (

p

-arvo = 0,002) yhteisessä mRNA ero ilmentymisen kahdessa mutanttien krypta. Verkon yhtenäisyyden oli heikompi (

p

-arvo = 0,060) kun villus osastoon, ja verkko kokonaisuutena ei differentiaalisesti ilmaistu Villi joko mutantin, totesi kahdessa

V

2

matriisit ”

p

-arvot: kun, kuten mainittiin, diagonaalialkiot osoittavat merkitys ero ilmaisun

sisällä

mutantti (per Hotellingin

t

2

), ja off-diagonaalialkiot osoittavat merkitys yhteisten differentiaalikaavojen

poikki

mutantteja (kuten per

V

2

). Vuonna kryptissa, verkosto oli differentiaalisesti ilmaistu

Cdkn1a

– /-

(

p

-arvo = 0,009), mutta ei

APC

1638N +/-

(

p

-arvo = 0,871), ja kuitenkin oli yhdessä tukevat differentiaalikaavojen kaikkialle sekä hiiren malleissa (

p

-arvo = 0,002). Tämä osoittaa, että pieni mRNA-tason muutoksia, jotka ovat yhteisiä useiden häiriöiden – on geeni-by-geenin perusteella – antaa yhteinen tuki verkkoja hypoteesin, kun taas yksittäiset häiriön voi epäonnistua osoittaa vaatimuksen.

Jokaisessa verkko geeni edustaa kaksi päällekkäistä kuplia värillinen mukaan t-tilastojen (varianssi on erisuuruinen) kahden mutantteja: vasemmalla alhaalla kupla geenin vastaa t-tilastotieto

APC

1638N +/-

, ja vasemmassa yläkulmassa kupla t-tilastotieto

Cdkn1a

– /-

. Risteyksessä kaksi kuplaa vastaa summa t-tilastot, joka kuvaa, miten merkitys pieniä vaikutuksia voidaan tehostaa, kun sitä tarkastellaan yhdessä. Solmut vaimentua in mutantti ovat värillisiä vaaleanpunainen, ne voimistussäädellään mutantti ovat keltaisia, ja neutraali t-tilastot ovat harmaita.

Vastaa