PLoS ONE: minimaalinen Yhdistetty verkosto transkriptiotekijöiden säätelemä Ihmisen kasvaimet ja sen soveltaminen Quest for Universal Cancer Biomarkers
tiivistelmä
universal syöpä biomarkkereiden ehdokas diagnoosi on tarkoitus erottaa, laajoissa rajoissa kasvaimia, terveiden ja sairaiden potilaiden. Äskettäin julkaistut tutkimukset ovat tutkineet universaali hyödyllisyydestä joidenkin biomarkkereita ihmisen kasvaimissa. Tässä tutkimuksessa esittelemme integroiva lähestymistapa etsimään mahdollisia yleisin syöpä biomarkkereita. Käyttämällä TFactS web-työkalu, jossa on luettelo kokeellisesti vahvistettu geenin määräyksiä, voisimme ennustaa transkriptiotekijöitä (TF: t) säännellään 305 eri ihmisen syövän solulinjoissa kattaa suuren paneelin kasvaintyypeille. Havaitsimme myös kromosomialueita, joilla on huomattavia kopioluvun vaihtelu (CNV) näissä solulinjoissa. Puitteissa TFactS luettelo, 88 TF: t, joiden asemasta selittyvät niiden geeniekspressioiden ja CNVs tunnistettiin. Heidän minimaalinen verkkoyhteyden (MCN) proteiini-proteiini vuorovaikutusten muodostaa merkittävän moduulin sisällä ihmisen kuraattorina TF proteomiin. Toiminnallinen analyysi proteiinien mukana tässä MCN paljasti rikastus syövän väyliä sekä tulehdusta. Kymmenen keskeisin proteiineja MCN ovat TF: ille, jotka trans-säätelevät 157 tunnettuja geenejä koodaava erittyvän ja transmembraaniproteiineja. Yleisesti saatavilla oleviin kokoelmiin geenien ilmentyminen tietoja 8525 potilaan kudoksista, 86 geenejä säädellään eri tavalla syövän verrattuna tulehdussairaudet ja valvontaa. Vuodesta TCGA syövän geenien ilmentyminen aineistoja, 50 geenit liittyivät merkittävästi potilaan selviytymistä vähintään yhdessä kasvaimen tyyppi. Väkevöiminen analyysi osoittaa, että nämä geenit mekaanisesti vuorovaikutuksessa yleisin syöpä reittejä. Näistä syöpä biomarkkereiden ehdokkaita, TFRC, MET ja VEGFA yleisesti monistetaan geenien kasvaimia ja niiden koodatut proteiinit värjättiin positiivinen yli 80% pahanlaatuisten kasvainten julkisista tietokannoista. Ne liittyvät angiogeneesiin ja hypoksia, jotka ovat yleisiä syöpään. Ne voisi kiinnostaa lisätutkimuksia syövän diagnostiikkaan strategioissa.
Citation: Essaghir A, Demoulin J-B (2012) minimaalisen Yhdistetty verkosto transkriptiotekijöiden säätelemä Ihmisen kasvaimet ja sen soveltaminen Quest for Universal Cancer Biomarkers. PLoS ONE 7 (6): e39666. doi: 10,1371 /journal.pone.0039666
Editor: Paolo Provero, University of Torino, Italia
vastaanotettu: 06 helmikuu 2012; Hyväksytty: 25 toukokuu 2012; Julkaistu: 25 kesäkuu 2012
Copyright: © 2012 Essaghir, Demoulin. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä työ rahoittivat FSR Fellowship Leuvenin yliopistossa. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Syöpä on monitekijäinen sairaus. Monet syöpätyyppeihin ja vaiheet on erotettu. Tämä monimutkaisuus tekee pyrkimys ”universaali syöpä biomarkkerit” haastava tehtävä. Kuitenkin monet tutkimukset erikseen eri syöpätyyppejä ovat raportoineet yhteisiä geenejä mahdollisten biomarkkereiden arvoa hoitoa tai diagnoosia [1].
perusteella kirjallisuuden Tarkastellaan tai käyttämällä korkea-tekniikoiden avulla jotkut kirjoittajat tunnistaa mahdollisia biomarkkereita yhteisiä useille syöpien ja yrittivät kehittää strategioita tunnistaa ne potilaasta Biofluids joko suoraan tai välillisesti. Näistä markkereita, telomeraasi on raportoitu olevan erittäin ilmaistaan kasvainten [2]. Alusta, kaapata verenkierrossa syöpäsolujen potilaan verestä ja mitata niiden telomeraasiaktiivisuuteen on ehdotettu syövän diagnostinen työkalu [3]. Lisäksi solun ulkoisten cAMP-riippuvaisen proteiinikinaasi A (EY-PKA) on raportoitu olevan hyvä merkki useita syöpiä [4]. Auto-vasta-aineita EY-PKA mitattiin ELISA: lla potilaista seerumeista on todettu olevan erittäin spesifinen syöpää [5]. Follikkelia stimuloiva hormoni (FSH) reseptorin myös raportoitu olevan selektiivisesti ilmaistaan eri kasvainten [6]. Samat havainnot koskevat myös sytokromi P450 (CYP1B1) [7]. Epigeneettiset muutokset, lisäksi voi olla diagnostista merkitystä syövän. Itse asiassa, jotkut kirjoittajat ovat viitanneet syöpää spesifisiä DNA-metylaation markkerina pahanlaatuisten sairauksien [8]. Ne voidaan havaita solu-free kiertävä DNA veressä [9]. Auto-vasta-aineita leukosyyttiantigeenin F (HLA-F) havaittiin myös potilailla, joilla oli eri syöpätyyppejä verrattuna terveisiin yksilöihin [10].
Syöpä biomarkkereiden kandidaattigeenit voitiin tunnistaa kirjallisuudesta. Luottamus painot voidaan liittää kuhunkin geeniä käyttämällä lainaus taajuus [11]. Vaikka aluksi käytetään luetella markkereita kunkin syöpätyypin, nämä painotetut luettelot voi auttaa valita yhteiset biomarkkereita syövässä. Kuitenkin kehittyneempi strategioita on käytetty tunnistamaan yleisin syöpä biomarkkereita, mukaan lukien geenien ilmentyminen meta-analyysi eri kasvaintyypeille [12], [13]. Ne voivat liittyä toiminta ja polku merkintä rikastamiseen suodattimia valita yhteinen biomarkkerit [14].
Tässä tutkimuksessa olemme laatineet integroiva strategiaa etsiä hyödyllisiä biomarkkerit yhteisiä syöpätyyppejä. Meidän työhypoteesina perustuu oletukseen, että lähes kaikki häiriöt, jotka johtavat pahanlaatuisen muutosta normaalien solujen, vaikka monimutkainen ja monipuolinen, on yhteisiä yhteistyöhön reittejä [15]. Yleensä nämä reitit voi loppua aktivoimalla ja /tai tukahduttaa joitakin sarjaa geenejä. Nämä geenit ovat tavoitteita transkriptiotekijöiden (TF: t). Jotkut näistä TF: istä ovat toisteellisesti moduloidaan eri solun muuttamassa tapahtumat [16] – [22]. Niitä voidaan pitää yhteyksiä tai cross-talk solmut syövän johtava reittejä [23] – [27]. Näin ollen pitäisi olla joukko minimaalinen liitettyjen TF: iä yleisesti levoton tuumoreissa kuin niillä moduloitu reittejä [28]. Tämä joukko TF: ien voitaisiin pitää pullonkaulana syövän polkuja. Jos yhteinen syöpä biomarkkereita on olemassa, ne ovat todennäköisesti yksi tavoitteista näiden yleisesti säänneltyjen TF: t [29]. Tässä tutkimuksessa olemme käytti TFactS, työkalu, joka äskettäin kehitetty ennustamaan TF säännöksi suurikapasiteettisten geeniekspressiota data [30].
Tulokset
tunnistaminen ien säätelemä Cancer Cell Lines
Geenien ilmentyminen ja SNP oli saatavilla 305 solulinjoja, josta tuloksia analysoitiin edelleen. Nämä solulinjat edustavat laajaa paneelia syöpätyyppien kattaa 28 eri histologisia sivustoja.
Oletimme, että tärkeitä TF: t olisivat ne, joiden geenien ilmentymistä ja CNV voisi selittää heidän asemasta [31], [32]. Ne voitaisiin tunnistaa käyttämällä regressiomallia kuvassa 1. Laske kaikki tarvittavat parametrit tässä mallissa, tunnistimme geenejä säädellään eri tavalla kussakin solulinjassa verrattuna altaan kaikkien muiden solulinjojen. Mediaani määrä geenien solulinjaa kohden on 218 (min: 15 ja max: 721), kumulatiivisesti mukana 4686 ainutlaatuinen tunnettujen koodaus geenit. Sitten kukin solulinja-geenistä lista toimitettiin TFactS ja verrataan luettelo kokeellisesti validoitu TF kohdegeenien käyttämällä Fisherin testiä [30]. Olemme osoittaneet, että tämä työkalu tehokkaasti ennustaa TF sääntely säännelty geenistä luetteloista [33], [34]. Toisaalta, SNP data normalisoitiin segmenttikaariset sitten toimitetaan synergisillä algoritmi tunnistaa kromosomialueita merkittävästi muuttaa kaikissa näissä solulinjoissa [35]. Kuvassa S1 osoittaa, että merkittävä monistukset ja poistot levitettiin koko genomin. Rajoitettu analyysi TF-koodaavat geenit paljasti, että 2113 on 2335 geenien tiedetään koodaavan ”DNA: ta sitovaa” proteiinit (GO termi) oli niiden lokusten merkittävästi muuttunut, ainakin yhdessä solulinjassa. Valitseminen transkriptiotekijöiden merkitystä syövän tiukempia tavalla yhdistimme analyysin ilmaisun, aktiivisuus ja CNV (kuva 1).
Katso teksti yksityiskohtia. Reg: sääntely; Exp: ilmaus; CNV: kopiomäärä vaihtelu; MCN: minimaalinen kytketty verkkoon; PPI: proteiini-proteiini vuorovaikutusten; TF: Transkriptiotekijän.
Kunkin TF, korrelaatio profiileja muiden TF: ien laskettiin perustuen: asetuksen (päätellä TFactS analyysi), geenien ilmentyminen ja genomista muutokset (CNV), tässä järjestyksessä. Malli Kuvassa 1 käyttää näitä korrelaatio tulokset löytää merkittäviä TF: ille, joille geeniekspression liittyvät CNV selittäisi vastaavaa johdettua sääntelyä. 88 TF: t tunnistettiin (p-arvot = 0,05, taulukko S1). Tukeminen tuloksemme, CNV vaikuttaa joitakin näistä TF: iä syövässä on jo raportoitu, mukaan lukien: TP53, BRCA1, RUNX1 ja MYC [36].
Minimal Connected verkoston transkriptiotekijöiden säätelemä Cancer Cell Lines
Käytimme Snow web väline määriteltäessä minimaalinen verkkoyhteyden (MCN) proteiini-proteiini vuorovaikutusten, joihin 88 TF: t liittyvät syöpään meidän alustavan analyysin. Snow ennusti tämä MCN laskemalla lyhin polut yhdistävät tulo proteiinit joko suoraan tai yhden siedetty väli proteiinia, joka perustuu sisäänrakennettu tietokanta ihmisen proteiini-proteiini vuorovaikutusten [37], [38]. Rajoittaminen meidän Snow perustuva analyysi ihmisen proteiini interactome ainakin kahden koetulokset vuorovaikutuksen, olemme tunnistaneet aliverkko yhdistää 70 ulos 88 TF: istä joko suoraan tai yhden väli. On huomionarvoista, että suurin osa TF: iä tunnistettu ensimmäisessä vaiheessa voitaisiin liittää tähän single proteiini-proteiini-vuorovaikutuksen aliverkossa. Kahdeksantoista TF: t menetit meidän rajoituksia analyysissä tai niiden puuttuminen Snow-selityksin interactome. Snow käyttää Kolmogorov-Smirnov testi arvioida merkitystä tunnistettujen aliverkon vertaamalla sen betweenness, yhteydet ja klustereiden kerroin jakaumat niille syntyy 1000 satunnaisesti verkkojen kanssa sama määrä proteiineja. Meidän tunnistettu aliverkon ollut merkittäviä p-arvot kaikkien näiden arvioidaan parametrit (betweenness: 2.06E-37, liitännät: 1.68E-47, klusterointi kerroin .: 4.07E-43). Tämä aliverkko sisälsi kaksi erillistä liitettyjen komponenttien. Ensimmäinen sisälsi lähes kaikki vuorovaikutukset merkittävä aliverkon ja pidettiin syövän solulinja, joka liittyy TF: iä MCN myöhempää analyysiä varten (kuvio 2). Toinen liitetty komponentti, jossa on vain kaksi vuorovaikutuksia yhdistää kolme proteiineja heitettiin pois.
Snow verkkotyökalu tunnistettu merkittävä ihmisen kuratoitu proteiini-proteiini vuorovaikutukseen aliverkko, johon 70 ulos 88 TF: iä Vastaavuussuhteessa säännelty syöpäsolulinjoissa. Ensimmäinen on kytketty komponentti, kuten on esitetty tässä pidetään minimaalinen verkkoyhteyden (MCN), joka yhdistää nämä TF: iä. Kukin solmu edustaa proteiinia. Reunat ovat proteiini-proteiini vuorovaikutusten validoitu vähintään kaksi kokeellista todisteita. Solmut varjostetut violetti edustavat kymmenen keskeisin TF: iä in MCN. Node-ranking perustui betweenness keskeisyyden tulokset.
Sitten kysytään vääriä positiivisia päässä TFactS, synergisillä ja differentiaalikaavojen analysoi voisi vaikuttaa MCN tunnistamista. Hallita näitä vaikutuksia, suoritimme negatiivinen kontrolli, jossa kartoitettiin 100 eri satunnainen luetteloista 88 TF: ien päässä TFactS luettelo. Jokainen lista toimitettiin Snow tuottaa MCN käyttäen samoja parametrejä kuin yllä. Vertaamalla jakauma betweenness pisteiden kaikista satunnainen MCN on perustettu MCN meidän malli, löysimme merkittävä ero (p-arvo ~0.01; KS testi). Yhdessä tulokset edellä sisäänrakennetusta verrattuna 1,000 satunnainen verkkojen suoritetaan Snow, tämä ehdotti, että tunnistettu MCN on merkittävä moduuli liittyy TF: iä yleisesti säännelty syöpäsolulinjoissa.
Tämä MCN voitaisiin pitää sääntelykomiteana ”pyöreän noin” enemmistön säänneltyjen reittejä syöpäsolulinjoissa. Itse asiassa, kuten kuviossa 3, monia MCN proteiinit ovat osallisena monissa syöpätyypeissä ja syövän signalointireittejä. Kuitenkin MCN proteiinit ovat myös merkittävästi mukana immuunivasteen reittejä. Tämä voi olla voimakas osallistuminen joidenkin MCN TF: iä, kuten NFKB sekä syövän ja tulehduksen [16].
Kaikki proteiinit (solmut) in MCN toimitettiin DAVID web työkalu Kegg reitin rikastamiseen analyysi. Merkittävät reitit esitetään luokittain mukaan -log10 (p-arvo) ja prosenttiosuus leikkauspiste toimitettu lista ja kysellä merkintöjä.
kohdegeenien MCN Keski -transkriptiotekijät
transkriptiotekijöitä minimaalinen verkkoyhteyden edellä mainitut vaikutukset edustavat todennäköisesti tärkein sääntelyyn efektorit yleisesti häiritsi vuonna analysoitiin syöpäsolun linjat. Olemme keskittyneet keskeisin TF: iä tässä verkossa. Keskeisyys solmut tietyssä verkossa voitiin arvioida käyttämällä monia parametreja. Niistä betweenness tulokset taajuuden, jolla tietty solmu on lyhyin polut yhdistää muihin kahden solmun. Se uskotaan olevan hyvä arvio keskeisyyden [39]. By kärkikastiin 236 MCN solmut mukaan niiden betweenness tulokset tunnistimme 59 keskeinen proteiineja, joilla tulokset keskiarvon yläpuolella. Nämä keskeinen proteiinit osoittavat samaa toiminnallista rikastamiseen kuin koko MCN.
mielivaltaisesti valittu top 10 keskeinen MCN solmuja. Heidän koodaavan geenin, nimet ovat: TP53, ESR1, CREBBP, MYC, AR, BRCA1, RELA, RARA, EP300 ja NFKB2. Nämä kymmenen TF: t keskittyvät 41% koko betweenness kumulatiivinen tulokset 236 MCN solmut. Niitä voidaan pitää solmukohdat tai kerääjien näiden verkon vuorovaikutusta. Tämä on sopusoinnussa ”mittakaava vapaa” malli, joka ehdotettiin määrätä TF proteiini-proteiini vuorovaikutusten, jossa napojen ympärille rakennettiin TF: iä, jotka liittyvät syöpäsairauksia [40]. Olemme väitti, että yleisin syöpä biomarkkereita todennäköisesti joukossa tavoitteet Näiden keskeisin TF: iä. 874 ainutlaatuinen kohdegeenien näistä kymmenestä TF: iä raportoidaan TFactS luetteloon. Rikastuminen analyysi näistä geeneistä, käyttäen ”geneettinen yhdistys db sairaus” in DAVID verkkotyökalu, paljasti yliedustettuina suuren paneelin syövän tyyppejä sekä ontologioiden liittyvät immuunivasteet ja tulehdussairauksiin (File S1).
syöpä-erityiset geenit kohderyhmä MCN Keski -transkriptiotekijät
rikastus analyysi suoritettiin MCN proteiineja sekä tavoitteet Keski TF: ien osoitti yhdistyksen välillä syöpä ja tulehdus. Tämä yhdistys on hyvin dokumentoitu kirjallisuudessa [41]. Cancer-spesifinen biomarkkerit täytyy ekspressoitua eri syöpäpotilailla verrattuna terveisiin yksilöihin, ja potilailla, joilla on tulehdussairauksia, [42]. Lisäksi yleinen syövän biomarkkereiden tulisi olla syöpää erityinen laajasti paneelin kasvaintyypeissä. Koska meidän korko on tunnistaa ”helposti” syöpä biomarkkereita, pyrimme rajoittamaan tarkempaa analysointia vain koodaavat geenit erittyvää ja transmembraaniproteiineja. SP-PIR merkintä avainsanoja tietokanta, jota käytettiin DAVID työkalu, sisältää 1689 ja 642 geenit selityksin kuin joka eritti ja transmembraaniproteiineja, vastaavasti. Vuonna 874 kohdegeenien kymmenen keskeisin TF: iä MCN, löydettiin 57 geeniä, jotka koodaavat eritettyjä proteiineja (p-arvo: 1.1E-6) ja 110 koodaavan transmembraaniproteiineja (p-arvo: 4.3E-5). Tämä on ainutlaatuinen joukko 157 geenejä. Täten yksilöidään TF: t MCN ja keskittymällä kohdegeenien kymmenen eniten Keski-TF: pystyimme etusijalle lyhyen luettelon saatavilla proteiinien analysoitavaa potilasnäytteistä erilainen ekspressio (kuvio 1).
edelleen suodatetaan tämän geenin listaa käyttämällä saatavilla potilastiedot. Me tehdään geenin ilmentymisen analyysi koottuna microarray suuria tietomääriä joukko 8525 eri kudoksissa syöpäpotilaille tai tulehduksen ja terveiden yksilöiden (kuva 4, File S2). Vuodesta priorisoitu 157 geenit, voisimme laatia luettelo 86 syöpäspesifisessä transkriptien (kuva 4). Niistä 3 geenit hyväksytty FDA syövän diagnosointiin, mukaan lukien: EGFR, KLK3 (PSA) ja AFP diagnosointiin paksusuolen, eturauhasen ja kiveksissä syöpiä, vastaavasti [43]. Lisäksi HLA-F tässä luettelossa on jo raportoitu havaittavissa seerumissa eri syöpäpotilaiden käyttämällä epäsuoria ELISA [10].
Microarray geenien ilmentyminen tietojen edustaa 8525 potilasta näytteet ladataan GEO. A- 78%: lla potilaista oli eri syöpätyyppejä; 14% ovat terveen yksilön ja otettiin näytteet eri kudoksista; 8%: lla potilaista oli tulehdus /sepsis ja tutkittiin kokoverestä ja muissa kudoksissa. B- ero ilmaus MCN kymmenen Keski-TF: kohdegeenin lista koodaavan erittyvää ja transmembraaniproteiineja analysoitiin. Näistä geenit, kuten on esitetty Venn-kaavio, 140 koetinsarjojen (86 ainutlaatuinen geenit) havaittiin olevan syöpää erityinen. GI: Ruoansulatuskanavan.
Mahdolliset biomarkkerit Common in Cancer
Tehostaakseen todennäköisyyttä löytää mahdollisia yhteisiä biomarkkereiden joukossa syöpää erityinen geeni (Kuva 5), me suodatettu nämä geenit perustuu niiden huomattava vaikutus potilaiden eloonjäämisen tahansa syövän tyypit TCGA tietokannasta. Käytettävissä olevat geenien ilmentyminen tietojen keräämisessä TCGA, joka kattaa yhdeksän syöpätyyppejä, ladattiin ja analysoitiin erikseen geeni-selviytymisen -alueella. Kullekin geenille, potilaat jaettiin kolmeen ryhmään (kolmannekseen) mukaisesti ilmentymisen tasoja tutkittiin geenin. Potilasryhmiä matala-, keski- ja korkea ilmaisun saatiin sitten. Hyödyntämällä käytettävissä elossaololuku tiedot: seurannan kesto ja kuoleman tila, me asennettu Kaplan-Meier -käyrät näihin ryhmiin. Geenit ennustavat elossaololuku merkitsevästi (log-rank p-arvo = 0,05), ainakin yhdessä syöpätyypin, on esitetty taulukossa S2. Tuotteet Näiden 50 geenien välittävät monia vuorovaikutteisia polkuja syövän, kuten kuvassa S2 (Kegg koulutusjakson rikastamiseen, p-arvo ~4.29E-4).
Syöpä-erityinen geenin ilmentymisen merkitystä ja taita muutos. Merkitsevyys osoituksena B-H p-arvon korjaus, ja kaikki on esitetty geenit ovat B-H p-arvo = 0,05. Bar-tonttien esittävät -log10 (korjaamaton p-arvo). Kolmiot esittävät kirjautunut kertainen muutos vastaavan geenin syöpä verrattuna terveisiin ja tulehduksen potilasfenotyyppeihin. FDA: n hyväksymä syöpä biomarkkereita on merkitty (*).
Kunkin geenin taulukossa S2, lisäsimme seuraavat voimavarat: (i) CNV merkittävästi vaikuttamatta vastaavasti geenilokusten Kaikkien syöpätyyppien analysoituna että Tumorscape tietokantaan [44]; (Ii) prosenttiosuus immunohistokemiallinen (IHC) positiivista värjäytymistä syövän detektoituina ProteinAtlas tietokantaan [45]. Me katsoi, että geenit positiivinen kaikilla kriteereillä taulukossa S2 ovat todennäköisemmin yleisin syöpä biomarkkereiden ehdokkaita. TFRC, VEGFA ja MET ovat parhaita mahdollisia ehdokkaita. Nämä geenit ovat erikseen liittynyt monia syöpätyyppejä kirjallisuudessa (taulukko S3).
Keskustelu
Syöpä tyyppejä on seulottu erikseen biomarkkereiden tunnistamiseen. Nykyään on syntymässä pyrkimys hakea yleistä syöpään markkereita. Hiljattain käytettävissä suurikapasiteettisten tietoja syöpäpotilaasta yksilöt tekevät tästä tehtävästä edullisemmaksi yhteydessä integroiva analyysi. Tämä tutkimus tehtiin sisällä tällaista kehystä.
Syöpä on monivaiheinen sairaus, jossa normaalit solut vähitellen muunnetaan pahanlaatuinen niistä. Tähän prosessiin kuuluu transkriptiotekijä (TF) asetus varmistaa transkription tarvittavien geenien [46]. Oletimme, että TF: iä säännelty syöpä olisi niiden aktiivisuus johtuu niiden koodaavan geenin ilmentymisen taso ja genomin muutoksia. Oletimme, että syöpään liittyvä TF: t voivat olla vuorovaikutuksessa toisiinsa modulaarisesti, niin että syövän herätteitä päätyvät vääristäviä tehtävä tämän moduulin. Biomarkkerit yhteisiä monille syöpätyyppejä voisi olla näiden joukossa TF kohdegeenien. Sitten seurasi työnkulun kuviossa 1 kohdentaa tärkeitä geenejä yleisesti säännelty syöpä, jotka koodaavat helposti proteiineja. Oletimme, että keskittyminen TF: istä ohjaa meitä löytämään arvokkain osa syövän tietoa, jota voitaisiin mitata geeniekspressiota [47]. Lisäämällä CNV data suodattaa tärkeitä TF: ille vahvistaa tätä lähestymistapaa. Katsovat, analysoidaan kaikki geenien ja merkittävästi muuttunut kromosomialueita ilman kontekstualisoinnin kannalta sääntelyviranomaisten (TF: t) laimentaa yleisin syöpä biomarkkereiden joukossa monia vääriä positiivisia tuloksia.
Ensimmäinen askel pyrkiessämme yhteiseen syöpä biomarkkereita yritimme tunnistaa minimaalinen verkkoyhteyden mukana TF: ien, jonka toiminta on säänneltyä kasvaimia. Me integroitu genomiikka ja transkriptomiikan dataa paneelista syöpäsolulinjojen yhdessä päätelty TF sääntely geenin ilmentymistä käyttämällä TFactS, joka on osoitettu aiemmin pystyä päättelemään tarkasti TF sääntelyä tai toiminnan tila luettelosta ilmaistaan geenien [30] . Käyttö solulinjojen tässä vaiheessa on perusteltua saatavuus sekä genomista ja ilme datan. Lisäksi rakennuksen merkityksellistä MCN vaatii dataa homogeenisia soluja, mikä ei ole useimmille primaarisen syövän hoidossa näytteitä, jossa genominen muutokset ja geenin ilmentymisen eroavat syöpäsoluja ja stroomasolujen, ja jopa eri syöpäsolun klooneja. Havaitsimme 88 TF: iä, jotka voivat olla tärkein sääntelyviranomaisten syöpäsolulinjoissa. Tämä vaihe on kuitenkin rajoitettu TF: iä edustaa TFactS, vaikka ne näytteen eniten tutkittu TF: iä kirjallisuudessa. Tämä vaihe voidaan myös lievittää ottaen huomioon muut genomista muutoksia, kuten mutaatioita. Kuitenkin koko genomin muuttaminen tietoja ei vielä ollut käytettävissä kaikissa tutkituissa solulinjoissa.
proteiini-proteiini vuorovaikutuksen analyysi, MCN yhdistää suurin osa 88 TF: ien on tunnistettu päässä kuratoi ihmisen proteomiin verkkoon. MCN sisältää sekä TF: iä ja muita proteiineja. Väkevöiminen analyysi paljasti, että tämä MCN kokoaa suuren tunnetut reitit ajo useita syöpätyyppejä. Silmiinpistävän, immuunivaste reittejä myös rikastuneet MCN, joka tunnistaa perustuen solulinjassa tietojen heittäen tahansa kasvain mikro-ympäristön vaikutus näihin tuloksiin. Tämä viittaa siihen, kaksi roolia tässä moduulissa on kytketty TF: iä sekä syövän ja tulehduksen. Tulokset meidän negatiivinen kontrolli menettely ehdotti, että syöpään liittyvän MCN muodostaa merkittävän moduuli. Tämä moduuli keskeisin TF: t ovat alttiita toimimaan tärkein ”kerääjät” marginaalinen häiriöiden.
Toisessa vaiheessa, me mielivaltaisesti rajoitettu analyysimme kohdistaa geenejä kymmenen keskeisin MCN TF: iä. Enrichment analyysi näistä geeneistä paljasti syövän yhteydessä väyliä yliedustus, odotetusti. Koska meidän tarkoitus oli tunnistaa geenejä, jotka voitaisiin helposti tutkittiin potilailla me suodatetaan tämän geenin luettelon 157 koodaavat geenit erittyvää ja transmembraaniproteiineja. Vertaamalla niiden ilmaisun paneeli 8525 potilasta, tunnistimme joukko 86 syöpää geenit ilmentyvät differentiaalisesti syövän ja normaalissa ja tulehdusta fenotyyppejä. Ne sisältävät kolme kuudesta proteiinien hyväksynyt FDA erityisissä syövän diagnoosi: PSA /KLK3, EGFR ja AFP. Expression näiden kolmen geenit voivat tarkastaa muissa syöpätyyppeihin. PSA, eturauhasen spesifisen antigeenin, esimerkiksi, vaikka käytetään laajalti eturauhassyövän diagnoosia, se on myös raportoitu munuaisessa, mahassa ja rintasyöpiä [48] – [50]. Nämä tulokset antavat sisäinen validointi menetelmämme.
pyrki edelleen rajoittamaan analyysiä ottamalla huomioon mahdollinen ennusteen arvioinnissa ainakin yhdessä syöpätyypin. Tämä suoritettiin liittämällä geeniekspressiota potilaan eloonjäämisen TCGA aineistoja. 50 geenien merkittävästi ennustettu selviytymistä vähintään yhdessä syöpätyypin. Kukin näistä geeneistä voitaisiin tutkia erikseen vastaavalla syövän tyyppi ennustetta. Nämä geenit ovat merkittävästi mukana ja toisiinsa monissa syövän väyliä (kuva S2). Kuitenkin, immunomodulatorinen sytokiinien ja kemokiinien myös rikastuneet tämän geenin lista, joka voisi viitata siihen, että jotkut näistä geeneistä ei voi täysin erottaa syöpäpotilaiden kuin tulehdussairauksiin.
tunnistettiin kolme mahdollista biomarkkerit yhteisiä syöpään, eli TFRC, VEGFA ja MET osoituksena: (i) geeni yli-ilmentyminen syövän verrattuna normaaliin ja tulehdus; (Ii) geenin ilmentyminen merkitsevästi liittyy potilaan eloonjäämisen vähintään kaksi syöpätyyppien; (Iii) vastaava CNV fokaalisesti merkittävästi laajemmat kasvaimissa; (Iv) proteiinien värjäämiseksi positiivinen yli 80% syövistä. VEGFA edistää angiogeneesiä. Sen diagnostinen potentiaalia tutkittiin erikseen monissa syövän tyypit (taulukko S3). MET, on tunnettu kasvaimia synnyttävän tyrosiinikinaasin reseptoria hepatosyyttikasvutekijän. Se on myös liitetty moniin syöpätyyppeihin (taulukko S3). Lisäksi on raportoitu markkerina syövän kantasoluja: eturauhasen, pään ja kaulan alueen, maksan, aivojen ja keuhkojen syövät [51] – [56]. VEGFA ja MET synergiaa angiogeneesiin voidaan suunnattu tehokkaampaa kasvaimia torjuvaa hoitoa [57]. TFRC, transferriini-reseptori, tiedetään ilmentyvän monissa kasvaintyypeissä (taulukko S3). Expression of VEGFA ja TFRC yleisesti säätelee HIF ja MYC, jotka edistävät angiogeneesiä ja leviäminen, vastaavasti [58] – [60]. Yhteys näiden kahden TF: ien kautta niiden kohdegeenien tiedetään antavan metabolisen etu kasvaimia hypoksiaolosuhteissa, joka on yleinen sairaus, pahanlaatuisten sairauksien [61], [62].
Yhteenvetona strategiamme tunnistettu verkosto ien, jotka säätelevät 50 potentiaali yleisin syöpä biomarkkereita. Tällä hetkellä saatavissa tietoja TCGA, Tumorscape ja ProteinAtlas tietokantoja osoitti VEGFA, TFRC ja MET-geenien mahdollisiksi. Kirjallisuus tieto liittyy näiden geenien vahvistavat lähestymistapamme. Yhdessä kaikki nämä havainnot voisi luulla tutkimiseksi edelleen hyödyllisyyttä VEGFA, MET ja TFRC yhteisiksi syöpä biomarkkereita. Tämä voitaisiin suorittaa suoraan havaitsemista aivovaurion tai tarkistamalla läsnäolo suuntautuneiden autovasta-aineiden mahdollisilta syöpää proteiineja potilaan seerumissa, lähestymistapaa, joka on saanut paljon kiinnostusta syöpädiagnoosin kentän [4], [63].
Materiaalit ja menetelmät
Microarray Analysis
tiedot 950 mikrosiruja suorittaa GlaxoSmithKline laboratorioissa (GSK) eri syövän solulinjat ladattu arrayExpress (E-MTAB-37) . RMA normalisoinnin menetelmää sovellettiin käyttämällä XPS paketin R /Bioconductor [64]. Geenien ilmentyminen kullakin solulinjasta tehtiin kaksoiskappaleet tai kolmen rinnakkaisen. Kolmogorov-Smirnov testi suoritettiin valitsemaan geenit ilmentyvät differentiaalisesti kussakin solulinjassa muihin verrattuna. Bonferroni korjaus kynnys levitettiin p-arvot. Geenit, joilla e-arvo = 10 katsottiin merkittävästi ilmentyvät eri vastaavalla solulinjassa.
transkriptiotekijä asetus Analysis
Jokainen geeni lista säädellään kussakin solulinjassa toimitettiin TFactS ennustaa säännellään TF: ille [30]. TFactS allekirjoittaa vähemmän luettelo (versio 2) sisältää 6823 määräykset yhdistää 345 ainutlaatuista TF: t niiden 2,650 ainutlaatuinen geenikohteet. Kunkin luettelo säännellyn geenien TFactS ennustaa TF: ille, joiden tavoitteet rikastettu toimittaneet luettelot käyttämällä Fisherin testiä. Tässä tutkimuksessa suurempi sign-vähemmän luettelo sijasta käytettiin rajatulle sign-herkkä. TFactS toteutettiin käyttäen BatchTFactS oletusparametreja (www.tfacts.org). TF: t, joilla on positiivinen sähköinen arvo pisteet (-log10 (e-arvo)) katsottiin merkittäviksi. TF: t, jotka eivät olleet merkittäviä kaikissa solulinjoissa hylättiin ennen mallin sovitus.
Perimän Kopioi numero vaihtelu Analysis
genomiikka tiedot Edellä solulinjoja julkaistiin myös GSK. SNP taulukot aineistoja saatavilla arrayExpress ladattu (E-MTAB-38). Ne analysoitiin aromia Affymetrix paketin R /Bioconductor [65]. Lyhyesti käytimme kvantiili normalisoinnin seuraa CrmA- yhteenvetoa ja korjattuna siru ja PCR-fragmentti pituus vaikutuksia [66]. Sitten GLAD algoritmia sovellettiin raaka kopiomääriin segmentointia [67]. Segmentoitu Sitten aineisto toimitettiin synergisillä algoritmi löytää merkittävästi muuttunut alueilla kaikissa kromosomeissa paitsi X ja Y. oletus q-arvon kynnys 0,25 käytettiin valita merkittäviä alueita [35]. Ennen CNV-pohjainen korrelaatiomatriisin computing ja mallin sovitus, CNV arvot kullekin geenin merkittävästi muuttunut kromosomialueita normalisoitiin seuraavasti: (i) kullekin synergisillä-raportoitu merkittäviä alueita, päätimme mediaani merkitsevä CNV huippuja; (Ii) kunkin geenin merkittävällä geenivirhe on annettu arvo tämän mediaani. Arvot CNV oli log2-suhde kuin ulostulevien synergisillä. Sijainti kromosomissa geenien saatiin käyttämällä Ensembl geenejä 64 tietokanta ihmisen ”GRCH37.p5” julkaisu Biomart verkkotyökalu [68].
tunnistetiedot Minimal Connected TF säätelemä Cancer Cell Lines
jotta voitaisiin tunnistaa joukko korreloi TF: ille, jotka ovat yleisesti säännellään syövän, me pidetään 305 solulinjoja, joita varten sekä ilmaisun ja SNP tiedot olivat saatavilla. Kullakin TF on kolme mittausta kussakin solulinjassa: TF asetus tulokset arvioitiin TFactS (-log10 (e-arvo)), TF koodaava geeni ilmaisuja (maasta mikrosiruja) ja TF-lokus kopioluvun vaihtelut (mistä mediaani normalisoitu synergisillä analyysi). Kolme matriisit, jossa TF: t riveihin ja solulinjoja sarakkeisiin, voitaisiin rakentaa näistä tiedot: TF asetus matriisi, TF-koodaavan geenin ilmentymisen matriisi ja TF-lokuksen CNV matriisi. Jokaisessa näistä matriiseista, voimme laskea korrelaatiot kunkin TF muiden TF: ien avulla Pearsonin korrelaatiokerroin. Näitä korrelaatioita voitaisiin edustettuina TF-TF korrelaation profiileja. Sitten asennetaan seuraavat malli jokaiselle TF:
R = β
0+ β
1 * E + β
2 * C
, Missä:
(R ) TF-TF korrelaation profiilin perustuu TFactS tulokset, vain TF: iä merkittävästi säännelty ainakin yhdessä solulinjaa; (E) TF-TF korrelaation profiilin perustuu geenien ilmentyminen; (C) TF-TF korrelaation profiilin merkittävistä määritellyt alueet synergisillä algoritmilla, nämä korrelaatiot laskettiin käyttäen loci kopioluvun vaihtelu mediaani-normalisoidut arvot.
Jokainen TF, joilla on huomattavia
β
1
(p-arvo = 0,05) ja
β
2
(p-arvo = 0,05) katsottiin Vastaavuussuhteessa säännelty syöpä.