PLoS ONE: tunnistaminen peräsuolen syövän Related Geenit kanssa mRMR ja Lyhyin polku Protein-proteiini vuorovaikutus Network
tiivistelmä
Yksi tärkeimmistä ja haastavia ongelmia biolääketieteen ja genomiikan on miten tunnistaa taudin geenit. Tässä tutkimuksessa kehitimme laskennallisen menetelmän tunnistaa peräsuolen syöpään liittyvien geenien perustuu (i) geeniekspressioprofiilien, ja (ii) lyhimmän polun analyysin funktionaalisen proteiinin yhdistyksen verkoissa. Entinen on käytetty valitsemaan differentiaalisesti ilmentyvien geenien taudista geenit melko pitkään, kun taas jälkimmäinen on käytetty laajasti tutkia mekanismi sairauksia. Nykyisten proteiini-proteiini vuorovaikutukseen tietojen STRING (Hae Työkalu nouto Vuorovaikutus Genes), painotettu toiminnallista proteiini yhdistys verkosto rakennettiin. Avulla mRMR (Maximum osuma Minimi Redundancy) lähestymistapa, kuusi geeniä tunnistettiin, jotka voivat erottaa Kolorektaalituumorien ja normaalin viereisen paksusuolen kudokset niiden geeniekspressioprofiilien. Samalla mukaan lyhimmän polun lähestymistavan, me edelleen havaittu ylimääräinen 35 geenejä, joista joitakin on raportoitu olevan merkitystä peräsuolen syövän ja jotkut ovat hyvin todennäköisesti merkitystä sille. Mielenkiintoista on, että geeneistä tunnistettiin sekä geeniekspressioprofiilien ja funktionaalista proteiinia yhdistyksen verkko on enemmän syöpägeenit kuin geenit tunnistettiin geeniekspressioprofiilien yksin. Sitä paitsi, nämä geenit oli myös suurempi toiminnallinen samankaltaisuus kanssa raportoitiin kolorektaalisyöpä geenejä kuin geenit tunnistettiin geeniekspressioprofiilien yksin. Kaikki nämä osoittavat, että menetelmä on esitetty tässä paperissa on varsin lupaava. Menetelmä voi tulla hyödyllinen väline, tai ainakin sillä on täydentävä rooli nykyiseen menetelmään, tunnistamiseksi peräsuolen syöpä geenejä. Se ei ole jäänyt meidän ilmoitusta siitä, että menetelmää voidaan soveltaa tunnistaa geenien muiden tautien kuin hyvin.
Citation: Li BQ, Huang T, Liu L, Cai YD, Chou KC (2012) tunnistaminen paksusuoli- syöpään liittyvät geenit kanssa mRMR ja Lyhyin polku proteiini-proteiini vuorovaikutus Network. PLoS ONE 7 (4): e33393. doi: 10,1371 /journal.pone.0033393
Editor: Paulo Lee Ho, Instituto Butantan, Brasilia
vastaanotettu 13 syyskuuta 2011; Hyväksytty: 13 helmikuu 2012; Julkaistu: 04 huhtikuu 2012
Copyright: © 2012 Li et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä työ tukivat avustusta National Basic Research Program of China (2011CB510102, 2011CB510101, 2011CB910200 ja 2010CB912702), Natural Science Foundation of China (90913009), Kiinan Academy of Sciences (KSCX2-EW-R-04), joka on National High Tech Program Grant 2012AA022802 ja Innovation Program Shanghai Municipal Education komissio (12ZZ087). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
peräsuolen syöpä (CRC) on yksi yleisimmistä pahanlaatuisten länsimaissa ja merkittävä syy syöpään liittyvät kuolemat. Varhainen havaitseminen CRC voisivat vähentää sairastuvuutta ja parantaa ennustetta. Siksi on erittäin tärkeää tunnistaa syöpään liittyvien geenien, joita voidaan käyttää biomarkkerina varhaisen diagnoosin.
Viime aikoina on kehitys korkean suoritustehon bioteknologian, suuri määrä biologista tietoa on luotu, kuten hiivan kahden hybridin järjestelmiä, proteiinin monimutkainen ja geeni-ilmentymisen profiilit, jne. Nämä tiedot ovat hyödyllisiä resursseja liittäessään ja ymmärtää geenin toimintojen [1], [2], [3], [4], [5], [6 ], [7], [8]. Toistaiseksi proteiini-proteiini-vuorovaikutuksen (PPI) data on laajalti käytetty geenien toiminnan ennustaminen olettaen, että vuorovaikutuksessa proteiinit ovat samat tai ovat samanlaisia toimintoja ja siten voi olla osallisena samaa reittiä. Tämä ”syyllisiksi yhdistys” sääntö ehdotti ensimmäisenä Nabieva et al. [9] ja sitä voidaan myös käyttää tunnistamaan syöpään liittyvät geenit.
STRING on online-tietokanta resurssi, joka on lyhenne sanoista Search Tool haettaessa Vuorovaikutus Genes [10]. Se tarjoaa sekä kokeellista sekä ennustettu vuorovaikutus tiedot luotettavuustasolla pisteet. Algoritmit perustuvat PPI viittaavat siihen, että proteiinit lyhyet etäisyydet toisiinsa verkon todennäköisemmin jakaa yhteiseen biologisten toimintojen [11], [12], [13], [14], ja että vuorovaikutteinen naapurit ovat todennäköisemmin sama biologinen funktio kuin ei-interaktiivinen niitä [15], [16]. Tämä johtuu siitä, että kysely proteiinin ja sen interaktiivinen proteiinit voivat muodostaa proteiinikompleksi suorittamaan tietyn toiminnon tai mukana samaa reittiä.
Vaikka onnistunut soveltaminen suurikapasiteettisten tiedot geenin toiminta kadotuksesta ja tunnistaminen Uusien geenien liittyvät syöpiin, virheet suurikapasiteettisten tiedot eivät ole hyvin ratkaistu vielä. Tässä artikkelissa, ehdotimme uutta tapa tunnistaa CRC liittyvien geenien integroimalla geeniekspressioprofiili ja painotettu toiminnallista proteiini yhdistys rakennetusta verkostosta PPI tietoja STRING. Tämä menetelmä voi muodostavat vika vain käyttää suuren suoritustehon data. Samaan aikaan mRMR (maksimi merkityksellinen minimi irtisanominen) algoritmi [17] hyödynnettiin määriteltiin kuusi lupaava ehdokas geenejä erottaa kasvain ja normaali peräsuolen näytteitä. Dijkstra algoritmilla [18] käytettiin rakentaa lyhimmän polun kunkin parin väliin kuuden geenejä. Lisäksi ylimääräinen 35 geenit seuraavilla lyhimmän polun tunnistettiin myös ja analysoidaan. Tällaisen geenin siten tunnistettu, havaittiin, että ne sisälsivät enemmän syöpägeenit kuin geenit tunnistettiin geeniekspressioprofiilien yksin. Lisäksi 41 geenit oli myös suurempi toiminnallinen samankaltaisuus kanssa raportoitu CRC geenit kuin geenit tunnistettiin geeniekspressioprofiilien yksin. On odotettavissa, että jotkin 41 geenien näin todetun saattaa kuulua uusia CRC liittyviä geenejä.
Materiaalit ja menetelmät
Dataset
käyttää geeniekspression tietoja peräsuolen syöpä tutkimus Hinoue et al. [19]. Geeniekspressiota profilointi 26 Kolorektaalituumorien ja Hyväksytty histologisesti normaaliin viereiseen paksusuolen kudosnäytteitä haettiin NCBI Gene Expression Omnibus (GEO) kanssa liittymisen määrä GSE25070. Geeni-ilmentymisen profiili saatiin käyttäen Illumina Ref-8 koko genomin ilmentymisen BeadChip kanssa 24526-koettimien vastaa 18491-geenit. Signaalin voimakkuus oli log2 muunnetaan ja sitten normalisoidaan RSN (Robust urainen normalisointi) menetelmällä.
Tissue näyte edustus
Edellä esitetyn perusteella, edustus kudosnäyte voidaan formuloida 24526- D (ulotteinen vektori), kuten on annettu (1) jossa edustaa kudosnäyte, sen arvoa n koetin, ja transpoosi matriisi (vrt Eq.6 of [20]).
Syöpä liittyvä geeni lista ja kaksi peräsuolen syöpään liittyvät geeni listoja
koottu kolme geeniä luettelot julkisista tietokannoista ja julkaisut verrata 41 kandidaattigeeneihin tunnistimme. Nämä kolme geeniä luettelot kuului yksi syöpään liittyvien geeni lista ja kaksi peräsuolen syöpään liittyvät geenin luetteloita.
742 syöpään liittyvien geenien olivat peräisin kolmesta lähteestä. Ensin saimme 457 syöpään liittyvien geenien Cancer Gene Census of Sanger Centre. Toiseksi haetaan syöpään liittyvien geenien Atlas of Genetics ja Sytogeneettiset onkologian [21]. Kolmas osa kerättiin Ihmisen proteiini viitetietokantaan [22]. Katso olevat tiedot S1.
Ensimmäinen peräsuolen syöpään liittyvä geeni luettelo on noudetaan tutkimuksen Sabates-Bellver ja työtoverit [23]. He vertasivat transcriptomes 32 adenoomia normaali limakalvo samalta yksilöitä ja tunnistettu 438 geenien merkittävästi muuttunut ilme peräsuolen adenoomia verrattuna normaaliin limakalvon Affymetrix U133 Plus 2.0 array. Katso olevat tiedot S1.
Toinen peräsuolen syöpään liittyvä geeni lista noudettiin muoto äskettäin työn Nagaraj et al. [24]. He ehdottivat Boolen perustuva Systeemibiologian syyllisyyden-by-yhdistys algoritmi tunnistaa uusia syöpään liittyvien geenien. Me koottu kaikki 134 romaani CRC liittyviä geenejä tunnistettu tässä tutkimuksessa. Katso olevat tiedot S1.
PPI tietoja STRING
Ensimmäinen painotettu PPI verkosto noudetaan STRING (versio 9.0) [10] (https://string.embl.de/), joka on suuri tietokanta tunnettujen ja ennustettujen proteiinien vuorovaikutus. Proteiinit vuorovaikutusverkosto olivat edustettuina kanssa solmuja, kun taas vuorovaikutusta kahden proteiinien siinä edusti reunan kanssa. Nämä vuorovaikutukset sisältävät suoria (fyysinen) ja epäsuorat (toiminnallinen) vuorovaikutuksia, jotka ovat peräisin lukuisista lähteistä, kuten kokeellinen varastoja, laskennallinen ennuste menetelmiä. Verkossa jokainen reuna on merkitty pisteet määrällisesti vuorovaikutusta luottamus, eli todennäköisyys, että vuorovaikutus voi tapahtua.
Euroopan mRMR (suurin merkitys pienin irtisanominen) menetelmä
Saat geenit, jotka voidaan erottaa peräsuolen kasvaimet ja viereisistä normaaleista kudoksista, käytimme mRMR menetelmää, joka on alun perin kehitetty Peng et ai. [17] analysointiin microarray data. MRMR menetelmä voisi sijoittua geenit mukaan niiden merkitys luokan näytteiden osalta ja samalla myös voitaisiin toteuttaa redundanssin geenien huomioon. Ne geenit, joilla on paras kompromissi suurimman merkitystä näytteen luokan ja pienin irtisanomisia, katsottiin ”hyvä” biomarkkereita.
Sekä merkitystä ja redundanssi kvantitoitiin seuraavat keskinäisen tiedot ( MI) 🙁 2) missä ja ovat vektoreita, on niiden yhteinen todennäköisyyksiin tiheys, ja ja ovat marginaalinen todennäköisyyksiin tiheydet.
määrällisesti sekä merkitystä ja irtisanomisia, meidän määritellä koko geeniperimä, koska jo valitun geenin sisältävän sarjan geenejä ja koska to-be-valitun geenin sisältävän sarjan geenejä. Merkityksellisyys välinen geenin ja kohde voidaan laskea: (3) välinen redundanssi geenin ja kaikki geenit voidaan laskea: (4) Saadakseen geenin suurimmalla merkitystä ja pienin irtisanomisia , olkaamme yhdistää yhtälön 3 ja Eq.4, kuten voidaan muotoilla seuraavasti: (5) koska geeni asetettu geenien mRMR operaation geenin arviointia jatketaan kierrosta. Kun nämä arviointien mRMR menetelmä tuottaa geeni asetetaan muotoillut (6) jos indeksi ilmaisee, mikä ympäri geeni on valittu. Mitä pienempi indeksi on, sitä aiemmin geeni tyytyväinen Eq.5 ja paremmin geeni on.
Prediction moottori
Tässä tutkimuksessa naapuriin Algoritmi (NNA) [25], [26], joka on laajalti käytetty bioinformatiikan ja laskennallisen biologian [3], [27], [28], [29], [30], [31], [32], [33], [34], annettiin ennustaa luokan paksusuolen kudosnäytteistä. ”Läheisyys” laskettiin seuraavan yhtälön (7) missä ja ovat kahden vektorin edustavat kahta kudosnäytteitä, on niiden pistetulo, ja ovat niiden moduluses. Mitä pienempi, sitä enemmän samanlaisia kaksi näytettä [35]. Saat intuitiivinen esimerkki miten NNA toimii, katso kuvio 5 on [20].
Suorituskyky validointi
Seuraavat kolme ristivalidointi menetelmiä käytetään usein tilastoissa validoida tilastollinen ennuste menetelmä : itsenäinen aineisto testi, subsampling testi, ja jackknife testi [36]. Kuitenkin joukossa kolme validointi menetelmissä jackknife testi on vähiten mielivaltainen johtuu seuraavista seikoista. (I) riippumattoman aineisto testi, vaikka kaikki näytteet testata ennustaja ulkopuolella koulutusta aineisto käytetty kouluttaa ennusteen moottoria siten jättää ”muisti” vaikutus tai bias, tapa miten valita riippumattoman näytteiden testata ennustaja voisi olla melko mielivaltainen, ellei useita itsenäisiä näytteitä on riittävän suuri. Tällainen mielivaltaa saattaa johtaa täysin päinvastaisiin tuloksiin. Esimerkiksi voidaan päätellä, että ennustaja tuotti varmemmin kuin muut ennustaja tietyn riippumattoman testauksen aineisto saattaa tulla vastapäätä testattaessa toinen riippumaton testaus aineisto [36]. (Ii) alinäytteenotto betoni, menettelyä käytetään yleensä kirjallisuudessa on 5-kertainen, 7-kertainen tai 10-kertainen rajat validointi. Ongelmana tässä sellainen subsampling testi on, että useita mahdollisia valintoja jakamalla vertailukohtana aineisto on erittäin suuri jopa hyvin yksinkertainen ja pieni aineisto, kuten selvitetty [37] ja osoituksena Eqs.28-30 in [20] . Näin ollen mitään todellisia subsampling rajat validointitestejä, vain hyvin pieni murto-osa mahdolliset valinnat otetaan huomioon. Koska eri valintoja aina johtaa erilaisiin tuloksiin edes saman benchmark aineisto ja sama ennustaja, alinäytteenotto testiä ei voi välttää mielivaltaisuutta myöskään. Testausmenetelmiä pysty antamaan ainutlaatuinen lopputulosta ei voida pitää hyvänä. (Iii) Kun jackknife testiä kaikki näytteet vertailuarvo aineisto tullaan erikseen mainita yksi kerrallaan ja testattu Prediktorin kouluttama jäljellä näytteitä. Prosessin aikana ylitaittumisen, sekä koulutus aineisto ja testaus aineisto ovat todella avoin, ja jokainen näyte on puolestaan siirtynyt näiden kahden välillä. Jackknife testi voi sulkea pois ”muisti” vaikutus. Myös mielivaltaisuus yllä kuvattu ongelma riippumattoman aineisto testi ja subsampling testi voidaan välttää, koska lopputulos saatu jackknife testi on aina uniikki tietylle benchmark aineisto. Näin ollen jackknife testi on laajasti ja käytetään yhä enemmän tarkastaa laadun eri ennustavia (katso esim [30], [31], [32], [38], [39], [40], [41] [42], [43], [44], [45], [46]). Niinpä tässä tutkimuksessa jackknife testiä käytettiin myös tutkimaan laadun nykyisen ennusteen menetelmällä.
ennustetarkkuus muotoili (8), jossa TP edustaa oikeita positiivisia; TN, todellinen negatiivinen; FP, väärien positiivisten; ja FN, väärät negatiiviset.
Inkrementaalinen ominaisuuksien hallintaan (IFS) B
Perustuu paremmuusjärjestykseen geenejä niiden tärkeyden mukaan, kun mRMR arvioinnin, käytimme Inkrementaalinen Feature Selection (IFS) (ks, esim [1], [47]), joka määrittelee optimaalisen määrän geenejä biomarkkereina. Aikana IFS menettelyssä, geenien sijoittui geeniperimä lisätään yksitellen korkeammista alentaa listalla. Uusi geeni sarja koostuu kun yksi geeni lisätään. Niinpä geeni sarjaa koostuisi kun annetaan sijoittui geenejä. Geeni sarja on (9) Kunkin N-geenin sarjaa, joka on NNA ennustaja rakennettiin ja tutkittiin käyttäen jackknife testiä benchmark aineisto. Tekemällä niin me saaneet IFS pöytä yksi sarake indeksi
i
ja toinen sarake ennustamiseen tarkkuutta. Siten pystyimme saamaan optimaalisen geeniperimä (), jolla ennustaja tuottaa parhaan ennusteen tarkkuutta.
Kaavio lähestymistapa ja lyhimmän polun jäljittäminen
Kaaviot ovat hyödyllinen keino tutkimiseen monimutkaisten biologisten järjestelmät, koska ne voivat tarjota intuitiivisia oivalluksia ja kokonaisrakenne omaisuutta, kuten on osoitettu useita tutkimuksia joukon tärkeitä biologisia aiheista (katso esim [48], [49], [50], [51], [52], [53], [54], [55], [56], [57], [58]). Tässä tutkimuksessa, ensin rakennettu kuvaaja G (V, E), jossa PPI tietojen STRING. Kaavion, reuna on osoitettu kunkin parin geenejä, jos ne olivat vuorovaikutuksessa keskenään. Paino reuna E verkon G oli peräisin luottamus pisteet yhtälön, jossa on paino verkon G, kun on luottamus pisteet kahden proteiinien osalta. Siten saamme funktionaalista proteiinia yhdistys verkon reuna painon. Dijkstra algoritmilla [18] on käytetty löytää lyhin polku kustakin kuudesta geenistä kaikille muille viisi geeniä kaaviossa. Sitten keräsimme kaikki geenit nykyiset lyhin polkuja ja asettaa nämä geenit mukaan niiden betweenness.
Kegg rikastamiseen analyysi
toiminnallinen käsinkirjoitustyökalun of DAVID [59] käytettiin Kegg reitin rikastamiseen analyysi. Rikastamista p-arvo korjattiin ohjata perhe laajuinen vääriä löytö korko tietyin nopeudesta (eli ≤0.05) Benjamin useita testaus korjausmenetelmällä [60]. Kaikki geenien BeadChip valittiin tausta aikana rikastamiseen analyysin.
Tulokset
mRMR tuloksia
Ilmaisu profiili oli haettu GEO kanssa liittymisen määrä GSE25070, joka sisälsi 52 näytteitä ja 24526 antureista ja muutettiin CSV tiedosto 52 riviä ja 24.526 sarakkeet panos mRMR. Jokainen koetin edusti ominaisuus ja 26 kasvaimen näytteet kuuluivat luokkaan 1, kun taas paired26 pariksi normaali näytteet kuului luokkaan 2. Kun käynnissä mRMR ohjelmisto, saimme kaksi pöytää (ks tukeminen Information S2), joista yksi oli nimeltään MaxRel pöytä, joka sijoittui anturit mukaan niiden merkitys luokan näytteitä, ja toinen nimeltään mRMR piirre taulukossa luetellut, koettimet suurimmalla merkitystä ja pienin irtisanomisia luokkaan näytteistä.
Kuusi kandidaattigeenit tunnistaa NNA ja IFS
perusteella lähtöjen mRMR, rakensimme 1000 ominaisuus osajoukot mukaan Eq.9. Kuten on kuvattu Materiaalit ja menetelmät jaksossa, testasimme ennustajan kanssa yksi piirre, kaksi ominaisuutta, kolme ominaisuuksia, jne., Ja IFS tulos löytyy tukeminen Information S3. Kuviossa. 1 on IFS käyrä piirretään perustuu tietoihin tukeminen Information S3. Vuonna IFS käyrä, X-akseli on määrä koettimia käytetään luokituksen, ja Y-akselilla on ennuste tarkkuudet lähimmän naapurin algoritmi arvioi jackknife testi. Suurin tarkkuus oli 1, kun 6 ominaisuuksia sisältyi. Optimaalinen koetinsarjaa mukana 6 antureista vastaa 6 eri geeniä, jotka olivat GUCA2B, PI16, CDH3, SPIB, BEST2, ja HMGCLL1 (taulukko 1).
IFS käyrä, X-akseli on, että määrä koettimia käytetään luokituksen, ja Y-akselilla ennustamiseksi tarkkuudet lähimmän naapurin algoritmi (NNA) arvioi jackknife (Jätä-One-Out) rajat validointitestiä. Huippu tarkkuus oli 1 kuudella koettimilla. Top 6 koettimina mRMR koetin lista muodostetaan optimaaliset erotteleva koetinsarjaa.
Lyhin polkuja geenien
Samalla rakensimme suuntaamaton verkko kanssa PPI tietojen STRING . Sitten keräsimme kaksi geeniä kuudesta identifioitujen geenien kanssa mRMR edellä kuvattua menetelmää, ja selvisi lyhin polku näiden kahden geenin kanssa dijkstran algoritmi. Saimme yhteensä 15 lyhimmän polkuja alhaisin kustannuksin (tukeminen Information S4). Kuviossa. 2 ovat 15 lyhimmän polun välillä kuuden kandidaattigeeneihin, jossa vuorovaikutus luottamusta leimattiin reunalla kutakin vuorovaikutusta geenin paria. Oli yhteensä 35 geenien lyhimmän polun ja me sijoittui nämä geenit niiden betweenness (taulukko 2). Näistä 35 geenit, AR on suurin betweenness 7, mikä tarkoittaa, että on olemassa 7 lyhimmän polun läpi tätä geeniä. Siten AR voi olla tärkeä rooli, joka yhdistää kuusi kandidaattigeeneihin ja siten saattaa liittyä CRC. Tällainen päätelmä on johdonmukainen sen kanssa, että AR-proteiinin havaittiin normaaleissa peräsuolen limakalvolla sekä useimmissa CRC [61], [62], mikä tarkoittaa, että AR-reseptori on vastuussa mitogeenisten vaikutuksia hormoni lähempiä käsitellään myöhemmin.
15 lyhimpiä polkuja välillä kuusi kandidaattigeeneihin tunnistettiin Dijkstran algoritmin perusteella PPI tietojen STRING. Keltainen roundrect edustaa kuusi parasta kandidaattigeeneihin tunnistetaan mRMR menetelmällä. Punainen pyöreä edustaa 35 geenit nykyisten alueella lyhin polkuja. Numerot reunat ovat reuna painot määrällisesti vuorovaikutusta luottamusta. Mitä pienempi numero on, sitä voimakkaampi vuorovaikutus kahden solmun välillä on. Katso teksti osastossa ”Graph lähestymistavan ja lyhimmän polun jäljittäminen” varten kvantitatiivinen suhde reunan paino luottamusta pisteet kahden proteiinien osalta.
Voit testata, onko meidän 35 lyhin polku geenit olivat solmukohdat taustalla verkossa tai ei, me juoksi permutaatio laskea esiintyminen aikaa meidän 35 lyhimmän polun geenien lyhin polut välillä 6 satunnaisesti valitun geenin kun ne on suurempi betweenness kuin tutkimuksessamme. Me toisti tämän prosessin 5000 kertaa, ja p-arvo laskettiin osuuden esiintymisen aikaan 35 geenien 5000 permutaatio. Katso lisätietoja, katso taulukko 2. Oli 10 lyhin tie geenit, joiden p-arvot eivät olleet merkittäviä. TP53 oli tähti molekyyli mukana lukuisissa biologisissa prosesseissa ja lähes liittyy kaikenlaisia syövistä [63]. Näin ollen, se ei ole mitään yllättävää, että TP53 esiintyi monta kertaa välisen lyhimmän polun 6 sattumanvaraisesti geenien. Sillä EP300, on raportoitu, että tämä geeni voi acetylate TP53 ja liittyy paljon kasvaimia [64]. CTNNB1 ja GSK3b kuuluvat Wnt-signalointireitin aktivaatio, joiden tehtävä on caners on hyvin dokumentoitu [65]. Jäljellä merkityksetön 6 geenejä, niiden betweennesses tutkimuksessamme olivat kaikki yhdessä (taulukko 2), ja siten näiden esiintymismäärät näiden geenien satunnaisessa lyhimpiä polkuja on altis olla suurempi kuin yksi. Useimmat näistä merkityksettömiä 6 lyhin tie geenien myöhästy Taulukossa 2 mukaan niiden betweennesses, mikä viittaa siihen, että ne eivät ehkä ole tärkeä. Näiden lisäksi 10 geenejä, loput 25 lyhin tie geenit tutkimuksessamme todettiin olevan merkittäviä.
MaxRel taulukko geeni Kegg rikastamiseen
Käyttämällä toiminnallinen käsinkirjoitustyökalun Daavidin Kegg polku rikastamiseen analyysi suoritettiin vastaavien geenien 1000 koettimien lueteltu MaxRel. Rikastamista Tulokset osoittivat, että nämä geenit olivat merkittävästi rikastettu energia-aineenvaihdunnan reittejä pitkin, mukaan lukien rasvahappojen aineenvaihdunta, Pentoosi ja glukuronaatti interkonversiot sekä tärkkelystä ja sakkaroosia aineenvaihduntaa (taulukko 3). Nämä tulokset viittaavat siihen, aineenvaihduntaa ravinteiden voi olla kriittinen rooli kasvainten synnyssä CRC.
Kuusi kandidaattigeenit ja lyhimmän polun geenit Kegg rikastamiseen
Kegg polku rikastamiseen analyysi suoritettiin myös on 41 geenejä, mukaan lukien kuusi parasta geenien mRMR luetteloon ja 35 geenien lyhin polut näiden kuuden geenien toiminnallisten käsinkirjoitustyökalun of DAVID. Rikastamista Tällä tavalla saatu tulos osoitti, että nämä geenit olivat merkittävästi rikastettu kanoninen syöpään liittyvät reitit, kuten eturauhassyövän, polkuja syövän, Wnt-signalointireitin aktivaatio, solusyklin, peräsuolen syövän, kilpirauhasen syövän, ja niin edelleen. On valaisevaa huomata, että näihin reittejä, jotkut ovat osoittautuneet merkitystä peräsuolen syöpä mukaan lukien Wnt-signalointireitin, solusykliä, peräsuolen syövän ja insuliinin signalointireitin (taulukko 4).
Päällekkäisyys kanssa syöpään liittyvä geeni lista ja kaksi CRC liittyvää geeniä luettelot
koottu 742 syöpään liittyvien geenien seuraavista kolmesta eri lähteestä: Cancer Gene Census päässä Sanger Centre, Atlas of Genetics ja Sytogeneettiset onkologian [21], ja ihmisen proteiini viitetietokantaan [22]. Havaittiin, että 8 ulos 41 geenien tunnistaa meistä oli osoittautunut syöpään liittyvien geenien. Lisäksi todettiin, että Fisherin testiä että nämä 41 geeniä merkittävästi liittyvät syöpään (p-arvo = 0,0001908). Katso olevat tiedot S5.
Lisäksi keräsimme 438 geeniä, jotka olivat eri tavalla ilmaistuna välillä peräsuolen adenoomien ja normaali limakalvo aikaisemmista tutkimuksessa [23]. Mielenkiintoista, edellä mainittu 41 kandidaattigeeneihin tunnistaa meidät oli päällekkäisyyttä 4 geenien kanssa 438 geenejä, ja päällekkäisyys oli varsin merkittävä (p-arvo = 0,01057, Fisherin tarkka testi). Katso olevat tiedot S5.
Äskettäin Boolen perustuva Systeemibiologian käytettiin tunnistamaan 134 uusia CRC liittyviä geenejä [24], joista kolme tunnistettiin meitä tässä tutkimuksessa ja päällekkäisyys oli merkitsevä (p arvo = 0.002017, Fisherin tarkka testi). Katso olevat tiedot S5.
Keskustelu
Kegg rikastamista MaxRel geenien
vastaavien geenien 1000 koettimet luetellut MaxRel taulukossa merkittävästi rikastettu energia-aineenvaihdunnan reittejä, mukaan lukien rasvahappojen aineenvaihdunta, Pentoosi ja glukuronaatti interkonversiot sekä tärkkelystä ja sakkaroosia aineenvaihduntaa. On osoitettu, että ruokavalio on tärkeä vaikutus CRC kehittämiseen. Meidän havainto on täysin johdonmukaista sen kanssa, että geneettisten polymorfismien vaikuttavat aineenvaihduntaan ravinteiden tärkeä rooli etiologiassa CRC ja peräsuolen adenomatoottisten polyypit [62].
Useita riviä todisteita ovat osoittaneet vaikutuksia tai osallistumista rasva etiologiassa CRC [66]. Ratkaiseva merkitys rasvahappojen lukuisissa biologisissa prosesseissa viittaa siihen, että muutos rasvahappojen metabolizing geenejä edistää paksusuolen syövän synnyn [67]. On osoitettu, että tärkkelys ja sakkaroosi aineenvaihduntaa ja Pentoosi ja glucuronateinterconversions läheisesti liittyvät syövät. Christensen et ai. [68] osoitti, että tärkkelys ja sakkaroosi aineenvaihduntaa ja Pentoosi ja glucuronateinterconversions polku oli hypometyloidut vuonna isositraattidehydrogenaasin mutantti kasvaimia. Lisäksi nämä kaksi metaboliset reitit todettiin merkittävästi liittyy riski estrogeenireseptori-negatiivinen rintasyöpä [69].
Viime CRC tautikohtaisia transcriptome tutkimus osoitti, että tärkkelyksen ja sakkaroosin aineenvaihduntaa oli ja 7 yhteisen reitin merkittävä säädellään eri tavalla käyttäen kahta erilaista mikrosirujen alustoilla kuten Affymetrix HGU133 Plus2.0 array ja CRC tautikohtaisia array. Sitä paitsi, rasvahappoaineenvaihdunta tunnistettiin merkittävästi differentiaalisesti säännellyn reitin käyttäen peräsuolen tautikohtaisten array [70].
Kuusi kandidaattigeenit tunnistaa mRMR, NNA ja IFS
Tässä tutkimuksessa olemme tunnistaneet seuraavat kuusi geeniä: GUCA2B, PI16, CDH3, SPIB, BEST2, ja HMGCLL1. Alla olkaamme lyhyesti keskustella suhteita peräsuolen syöpä.
GUCA2B (uroguanyliini) on sisäsyntyinen aktivaattori guanylaattisyklaasivä- 2C-reseptorin havaittiin säädeltiin 8-kertaiseksi adenooma, ja sen ilmentymistä havaitaan veren ja virtsan [71] .Siksi GUCA2B voitaisiin pitää ei-invasiivisia biomarkkeri varhaiseen toteamiseen CRC. Lisäksi radio-leimattu uroguanyliini analogeja on käytetty havaitsemiseen CRC in vivo [72].
PI16 (peptidaasia inhibiittori 16) on havaittu kiveksissä, eturauhasessa, ohutsuolessa, paksusuolessa, ja munasarja kanssa immunohistokemiallinen analyysit [73]. Lasku PI16 pitoisuudet löydettiin eturauhassyöpää [73] ja mahasyövän [74]. Tuloksemme osoittivat myös, että ilmaus PI16 peräsuolen adenokarsinooma oli merkittävää väheni verrattuna viereisen ei-kasvain peräsuolen kudokseen, mikä oli yhdenmukainen tulos tutkimuksen eturauhassyövän ja mahasyövässä. Koska PI16 ei ole hyvin ominaista ja toistaiseksi ei ole raportti lainkaan noin PI16 kolorektaalisyövässä etiologiassa, tuloksemme hiljaista että PI16 voi tulla lupaava biomarkkereiden paksusuolisyövän varhaiseen diagnosointiin.
CDH3 on klassinen kadheriinin, The demetylaation joka usein havaitaan pitkälle CRC joka liittyi yli-ilmentyminen CDH3 [75]. Sitä paitsi CRC, CDH3 myös yli-ilmentyy useimmissa haimasyövän ja mahasyövän, mutta ei niiden noncancerous vastineet tai normaaleissa kudoksissa. Näin CDH3 pidettiin uutena kasvaimeen liittyvän antigeenin käyttökelpoinen immunoterapiassa ja varhainen diagnoosi ja mahalaukun syövän CRC [76].
SPIB on transkriptiotekijä, E-kaksikymmentäkuusi (ETS) perheeseen, joka tiedetään toimivan positiivisia tai negatiivisia säätelijöitä geenin ilmentymisen. SPIB on adenooma-spesifisten sääteli geenin ja sen ilmentyminen tehtiin silmiinpistävä pieneneminen CRC kudoksissa viittaa siihen, että SPIB voivat toimia mahdollisina markkereita CRC invasiivisuus ja etäpesäkkeiden [77].
BEST2 (tunnetaan myös nimellä VMD2L1) koodaa proteiinia bestrophin perheen. Sekä RT-PCR-analyysit ja X-gal värjäys paljasti kudoksen vapaan BEST2 ja VMD2L2 ilmentyy runsaana paksusuolessa [78], [79]. Se on ollut osoittaa, että BEST2 välittää bikarbonaatti kuljetusten Pikarisolujen hiiren paksusuolen [80]. Straub et ai. [81] tunnistettiin BEST2 yhdeksi metylaation merkkiaineita varhaista havaitsemista ja ennusteen CRC. Siksi BEST2 odotettiin tulla terapian kohde CRC demetylaation agentti.
HMGCLL1 on näyttää liittyvän erilaisiin syöpiin, kuten haiman syöpiä [82], glioblastooma [83], rinta- ja paksusuolen ja peräsuolen syövät [84]. HMGCLL1 on yksi geeneistä, jotka sisältävät somaattisia mutaatioita haimasyövän [82]. Vaikka mutaatio HMGCLL1 on raportoitu olevan mukana näiden syöpien, erityiset mekanismeista jäävät selvittämättä.
Lyhyin reitti geenien
Olemme täysin tunnistettu 35 lyhimmän polkuja geenejä. Kuten näemme taulukosta 2, jotkut lyhimmän reitin geeneistä kuten TP53, EP300, CTNNB1 ja GSK3b eivät olleet merkittäviä CRC johtuen niiden universaalisuus lukuisissa syövissä. Nämä geenit on hyvin dokumentoitu olevan merkitystä CRC, ja myös niiden rooli CRC on ollut hyvin tunnettu [85]. Sitä paitsi nämä geenit, useimmat muut lyhin geenien lueteltu taulukossa 2 olivat hyvin spesifisiä CRC (p-arvo 0,05). Alla olkaamme keskittyä geenien kanssa suuri betweenness arvot ja keskustella suhteesta näiden geenien CRC.
AR (androgeenireseptorin) on ligandista riippuva transkriptiotekijä, joka osallistuu valvontaan solu lisääntymistä ja erilaistumista [86]. Useat tutkimukset ovat antaneet tukevia todisteita sen osallistumisesta sukupuolen steroidihormonien (estrogeenit ja androgeenien) etiologiassa ja etenemistä CRC [87]. AR-proteiinin on osoitettu olevan ilmentyy normaaleissa ja peräsuolen limakalvon, ja useimmissa peräsuolen syövän [61], [62], joka tukee, että CRC ilmentävät AR-reseptoria voi vastata mitogeenisten vaikutusten hormoni. Lisäksi somaattisten vähennyksiä androgeenireseptorin CAG toista esiintyy usein, läpi reitin eroaa mikrosatelliittien epävakautta ja varhaisen aikana paksusuolen syövän synnyn. Näennäinen kasvu solujen valikointi kätkeminen lyhentää AR alleelien viittaa siihen, että androgeenien edistää paksusuolen syövän syntymistä Vielä tuntemattomalla tavalla [61].
TBP (TATA-sitova proteiini) on keskeinen eukaryoottinen transkriptiotekijän käyttävät kaikkia kolmea solun RNA polymeraasit.