PLoS ONE: meta-analyysi Gene Expression allekirjoitukset määritteleminen epiteelikasvaimet on mesenkymaalitransitioon aikana syövän etenemisessä

tiivistelmä

epiteelin ja mesenkymaalitransitioon (EMT) on ratkaiseva tapahtuma aikana syövän etenemisen ja levittämiseen. EMT on muuntaminen karsinooma solujen epiteelin on mesenkymaaliset fenotyypin, joka on yhteydessä korkeammalla soluliikkuvuus sekä tehostettua chemoresistance ja syöpä stemness. Erityisesti EMT on tunnustetaan yhä varhainen tapahtuma etäpesäkkeiden. Lukuisat geeniekspressiotutkimuksissa (GES) on tehty saada transcriptome allekirjoituksia ja markkerigeenejä ymmärtää sääntelyn mekanismeista EMT. Silti ei meta-analyysi huomioon lukuisia GES EMT on suoritettu kattavasti muotoilee ydin geenit tässä prosessissa. Kirjoittajat raportoivat meta-analyysi 18 itsenäistä ja julkaissut GES EMT jossa keskityttiin eri solutyyppejä ja hoitomuotoja. Laskennallinen analyysi paljasti klusterointi GES mukaan hoitomuoto sijasta solutyypin. GES EMT: aiheuttamaa kautta transformoiva kasvutekijä-β ja tuumorinekroositekijä-α hoito tuotti tasaisesti määritelty klustereita taas GES malleja vaihtoehtoisia EMT induktio ryhmittyneet monimutkaisempi tavalla. Lisäksi tunnistimme ne ylä- ja vaimentua geenejä, jotka jakavat lukuisia GES. Tämä ydin geeni luettelo sisältää tunnettuja EMT merkkiaineita sekä uusia geenejä toistaiseksi ole kuvattu tässä prosessissa. Lisäksi useat geenit EMT-core geeni lista korreloi merkitsevästi heikentynyt patologinen täydellinen hoitovaste syöpäpotilaista. Kaiken kaikkiaan tämä meta-analyysi antaa kattavan selvityksen käytettävissä EMT ilmaisun allekirjoituksia ja näyttää olennainen oivalluksia mekanismeja, jotka säätelevät syöpä etenemistä.

Citation: Gröger CJ, Grubingerin M, Waldhör T, Vierlinger K, Mikulits W (2012) meta-analyysi Gene Expression allekirjoitukset määritteleminen epiteelikasvaimet on mesenkymaalitransitioon aikana syövän etenemisessä. PLoS ONE 7 (12): e51136. doi: 10,1371 /journal.pone.0051136

Leikkaus: Olivier de Wever, Gentin yliopisto, Belgia

vastaanotettu: 28 kesäkuu 2012; Hyväksytty: 29 lokakuu 2012; Julkaistu: 10 joulukuu 2012

Copyright: © 2012 Gröger et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Euroopan unionin FP7 Health Research, projektin numero TERVEYS-F4-2008-202047. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

epiteelin ja mesenkymaalitransitioon (EMT) on alun perin kuvattu olennaisena prosessi metazoan alkionkehityksen [1]. Viime vuosikymmenen aikana, EMT on toteutunut kriittiseksi tapahtuma kohdunkaulan etenemistä kuin epiteelikasvainsolut hankkia mesenkymaaliset fenotyypin jonka avulla ne voivat irrota primaarikasvaimen ja hyökätä paikalliseen kudokseen [2]. Yleensä polarisoitunut epiteelisolujen järjestää solu-solu risteyksissä ja solu-ankkurointi kompleksit muodostavat apikaalisella ja basolateraalisessa pintoja. Sen sijaan, mesenkymaaliset solut muodostavat epäsäännöllisen muotoisia rakenteita ei ole tiukka tarttumia naapurisolujen ja vähentää solujen kontakti substraattiin. Mesenkyymisolujen on pitkänomainen muoto verrattuna epiteelin ja näyttää etu-taka-polaarisuus, joka mahdollistaa tehostetun maahanmuuton alentunut pito voimia. Vaikka epiteelisolujen hyökätä kollektiivisesti klustereissa, mesenkymaaliset solut osoittavat yksittäisen solun liikettä, jonka avulla ne voivat levittää joukkopostin soluista [3]. Lisäksi osittainen EMT näytetään eri E-kadheriinin ilmentymisen on havaittu, että voi vielä johtaa kollektiiviseen soluinvaasiota [4].

EMT on luokiteltu kolmeen alatyyppiin [5]. Type 1 EMT vaaditaan alkionkehityksen tarjota gastrulaation ja muodostumista hermostopienasoluille että erilaistua eri solutyyppeihin ilman systeemistä leviämistä. Tyypin 2 EMT osallistuu kudosten uudistumista ja fibroosia eri elinten, kuten munuaisten, maksan, keuhkojen ja suoliston johtaa kertymistä sidekudosta. Tyyppi 3 EMT kumppaniaan voitto on maligniteetti syöpä soluja. Neoplastisten epiteelisolujen saada läpikäymään EMT usein lokalisoitu leviämisrintamassa primaarikasvaimen ja aloittaa kaskadi kasvainsolun levitystä paikallisten soluinvaasiota jota seuraa tuloa verisuonistoon. Erityisesti EMT edustaa ohimenevä ja palautuva prosessi, joka voi johtaa mesenkymaalisten epiteeli- siirtyminen (MET) kun metastaattinen kolonisaation [5],. Sykliä EMT ja MET oletetaan olevan mukana etäpesäkkeiden muodostumisen distaalisessa sivustoja [3]. Silti molekyylitason perustan muutosten epiteelin plastisuus EMT ja MET on vielä avoin kysymys, ja sen rooli syöpäpotilailla on Kiistanalaista. Molekyylejä ja induktorien tyypin 3 EMT anna vastus syöpäsolujen apoptoosin ja onkogeenin aiheuttama vanhenemista sekä chemoresistance [6]. Viimeaikaiset havainnot osoittavat, että EMT tarjoaa mesenkyymisolujen kantasolujen ominaisuuksia, joiden avulla karsinoomasoluja tuottaa etäpesäkkeiden keskiasteen sivustoja [3]. Nämä syövän kantasoluja, joita kutsutaan myös syövän aloittamista solujen osuus fenotyyppiset ja toiminnallisia ominaisuuksia muuttavia alkion solujen näyttämällä mesenkymaaliset fenotyyppi [6].

profilointi on transcriptome käyttäen mikrosiruja on käytetty laajasti valaista ilmentymiskuviot aikana EMT eri olosuhteissa, jotka osoittivat uusien biomarkkereiden ja molekyylitason mekanismit yksittäisistä tutkimuksista. Meta-analyysi yleensä esitellään yhdistelmä useita tutkimuksia eri otoksista ja kudosten tai vertailua omien tietojen julkaistujen tietojen kanssa [7], [8]. Viimeaikainen edistyminen perustamisen geenien ilmentymisen aineistoja mahdollistaa tunnistaa uusia merkkiaineita ja asianmukaiset menetelmät, joita aliarvioitu yhtenä tutkimuksissa, mutta syntyi meta-analyysi. Tähän mennessä, lukuisia geeniekspressiotutkimuksissa (GES), joka kattaa laajan valikoiman solutyyppejä meneillään EMT yhdessä erilaisten liikennemuotojen induktio ovat käytettävissä. Silti tietojemme mukaan mitään meta-analyysi on näitä EMT tutkimuksia on tehty toistaiseksi.

Muutokset biologisessa järjestelmässä edellyttävät yhteistä muutos geenien ilmentymisen sarjaa. Bioinformatiikan rikastamiseen analyysityökalut tutkia geenien ilmentyminen sarjaa tällaisia ​​muutoksia. Nämä työkalut tutkia yliedustus geenin sarjaa verrattuna koko genomin, kartta tulo luettelo geenien biologisen luokkia online-tietokannat ja tilastollisesti arvioida yliedustus geenien kunkin biologisen luokan tai merkintä, kuten Kioto Encyclopedia of Genes and Genomes (Kegg ) väyliä ja geeni ontologian (GO) ehdot [9]. Useampien yhden rikastamiseen työkaluja saman tulon luettelosta ja tarkastelemalla vain johdonmukaisesti rikastetun luokat on raportoitu olevan erittäin lupaava strategia [10], [11].

keräsimme tietoja 18 julkaistut ja riippumaton GES EMT: ja uutetaan geeni luettelot merkittävästi ylä- ja vaimentua geenit klusterianalyysillä. Tämä lähestymistapa paljasti geeniryppäät mukaan hoitomuotoja sijasta solutyypin. Olemme myöhemmin uutetaan EMT-core lista, joka koostuu 130 geenien kanssa virallista geenin symboleja ja nimien tutkittiin edelleen rikastamalla analyysi useita yhdellä rikastamiseen työkaluja. Erityisesti valittu geenit EMT-core lista korreloi merkitsevästi heikentynyt patologinen täydellinen hoitovaste (PCR) syöpäpotilaista. Tämä analyysi ehdottaa, että EMT-core geeni lista on merkitystä tunnustamisesta molekyylitason mekanismeja EMT. Lisäksi klusterin analyysi osoittaa uusia oivalluksia suhteet EMT prosessien eri solutyyppejä ja induktio tilat.

Tulokset

Tiedonkeruu geeniekspression tutkimuksista (GES) B

arvioimiseksi yhtäläisyyksiä julkaistu GES ja määritellä keskeiset geenin luettelo ihmisen EMT, analysoimme 18 itsenäistä GES EMT. Nämä 18 itsenäistä ja julkaissut GES koostui 24 aineistot yhteensä (taulukko 1). Useat kirjoittajat raportoitu EMT kinetiikka eri solutyyppejä tai annoksesta riippuvia vaikutuksia EMT induktorien sisällä yhden tutkimuksia. Kuitenkin ainoastaan ​​tiettyihin tarkastuskohdalla Voimakkaimmin vaikutusta tai EMT fenotyypin, kuten raportoitu tekijät, on valittu. Takahashi

et al.

Julkaisi kaksi liittyvien GES, joista yksi koostui kahdesta aineistoja, jolloin kolme aineistoja yhden riippumattoman tutkimuksen [12]. Taube

et al.

Raportoitu 5 aineistot julkaistaan ​​kuluessa GES samanlaisia ​​ekspressiokuvioiden ja erimuotoista EMT induktion [13]. Käsitellyt tiedot (normalisoitu ja yleensä logarithmized data) on ladattavissa Geenien ilmentyminen Omnibus (GEO) ja ArrayExpress (AE) tietokannat ja selityksin kanssa Bioconductor ja NetAffx. Lukuisat GES, saatavana GEO ja AE, jätettiin pois, koska ne eivät joko ole käsitelty tietoja tai ei sisältänyt rinnakkaisnäyte- tai ei ole julkaistu. Koska eri microarray muodoissa sekä erilaiset normalisoinnin ja suodatus menetelmiin kirjallisuudessa, käytimme jalostettuja sijaan raakadatana säilyttämiseksi laatukriteerit kirjoittajien aikana datan esikäsittely. Kaksisuuntainen Opiskelijan

t

-testi käytettiin laskea p-arvot. Merkittävästi ylä- ja vaimentua geenit valittiin vastaamaan kertainen muutos on suurempi kuin 2 tai pienempi kuin 0,5 ja p-arvo on alle 0,05.

GES klusterianalyysillä

syntyy matriisi sisältävä geeni symbolit poikki analysoitu GES (n = 14113), jotka ovat yksilöllisesti raportoitu. Merkittävästi ylä- ja vaimentua geenit kustakin GES siirrettiin matriisiin niiden tyypin asetuksen. Voimistunut geenit leimattiin 1, vaimentua geenejä -1 eikä differentiaalisesti geenien 0 (taulukko S1). Tämä data jakelu koostui 88,22% ei differentiaalisesti geenien ja 11.78% ylä- tai vaimentua geenejä ja on merkittävästi erilainen binomijakau- näiden parametrien (p 0,0001). Sen määrittämiseksi sulku lukumäärälle GES jakaa tietyn geenin käytetään klusterianalyysilla, binomijakauman toiminto, jonka R sekä alustavien hierarkkinen klusterointi tulokset kunkin raja vaihtoehdon analysoitiin (tuloksia ei ole esitetty). Tästä päätimme tutkia klusterointi geenien jaetaan vähintään 10 aineistot (n = 365; p 0,0001; kuvio 1). Lisäksi tämä analyysi osoitti, klustereita GES mukaan tilaan EMT ärsyke pikemminkin kuin solu- tyypin (kuvio 2A). On kiinnostavaa, että tiukempia klusterointi geenien jaettu ainakin 14 analysoitiin GES aineistot aikaan samanlaiset klustereita, huolimatta siitä, että tämä luettelo on vain 41-geenien (kuvio 2B ja kuvio S1).

Genes jaettu kello vähintään 10 ulos 24 aineistoja käytettiin Manhattan hierarkkinen klusterointi. Säätötyyppiä tietyllä tutkimus tehtiin näkyväksi kautta lämpökartta. Sarakkeet: geenit jaetaan vähintään 10 aineistot (n = 365); rivit: analysoitu GES (24 aineistot yhteensä); vihreä: vaimentua geenit; punainen: voimistunut geenit; musta: geenit ole säännelty. GSE: Geenien ilmentyminen laadut (GEO) sarja kirjaa; E.TABM: ArrayExpress (AE) sarja kirjaa; TGF, transformoiva kasvutekijä; TNF, tuumorinekroositekijä.

solutyypistä ja hoitomuotoa EMT oli selityksin ja paljasti klustereiden mukaan tilaan EMT induktio. Klusterijärjestelyssä jatkui, kun geenit jaetaan vähintään 14 GES aineistoja käytettiin analyysiin. (A) Hierarkkinen klusterointi 365 geenien jaetaan vähintään 10 aineistoja. (B) Hierarkkinen klusterointi 41 geenien jaetaan vähintään 14 aineistoja. Legenda kertoo solutyypistä ja hoitomuotoa (oikea paneeli). *, Transkriptiotekijän vektorit: Runx2, Six1, Etana, Twist ja Goosecoid. GSE: Geenien ilmentyminen laadut (GEO) sarja kirjaa; E.TABM: ArrayExpress (AE) sarja kirjaa; TGF, transformoiva kasvutekijä; TNF, tuumorinekroositekijä.

Generation EMT-core geeni lista

perusteella klusterin analyysi GES, pyrittiin määrittämään merkityksellisen EMT-core geeni lista joka kuvaa suurin osa mukana geenien poikki analysoitiin GES. Klusterin analyysi geenien jaettu vähintään 10 aineistot sisälsivät 365 geenejä (taulukko S2). Kuitenkin, se ei näytä, onko geeni on ylä- tai vaimentua eri GES. Näin ollen luettelo suodatettiin pitää vain geenejä, jotka olivat joko ylä- tai vaimentua vähintään 10 GES aineistot. Tuloksena luetteloa 130 geenejä joista 67 ovat ylä- ja 63 vaimentua (taulukko 2 ja taulukko S3). Tämä valinta geenejä voitaisiin luokitella viiteen ryhmään ((i) soluadheesiota ja muuttoliike, (ii) kehittäminen, solujen erilaistumiseen ja proliferaatioon, (iii) angiogeneesi ja haavan paranemista, (iv) aineenvaihduntaan, (v) muut tai luokkiin) mukaan yhden rikastamiseen analyysin alla kuvatulla tavalla. Useita geenejä olivat läsnä myös useammassa kuin yhdessä näistä luokista (taulukko S3). Kaiken kaikkiaan tämä johtaa EMT-core geeni luettelossa on 130 geenejä, jotka olivat peräisin lukuisista solutyyppejä ja EMT aloittamista menetelmiä.

Tasaisen rikastettu Kegg koulutusjakson ja GO aikavälin analyysi EMT-core-geenin lista

analysoimiseksi edelleen EMT-core lista, joka koostuu 130 geenien tiukan yksi rikastamiseen analyysi yhdistettynä tiukat valintakriteerit suoritettiin. Ensin rikastettu Kegg kautta tai GO merkinnän on oltava vähintään 5 geenit tulo luettelosta ja p-arvo on alle 0,05 katsotaan olevan merkittäviä. Luettelemalla merkittävästi rikastettu ehdot ja reitit on esitetty taulukossa 3. Toinen, huomattavasti rikastettu Kegg kautta tai GO termi oli noudatettava vähintään 4 out of 5 käytettyjen bioinformatiikan välineitä. Kolmanneksi johdonmukaisesti rikastettu Kegg kautta tai GO termi on tunnistettava sekä EMT-core-geenin luettelon ja 365 geeniä luettelosta. Käyttämällä näitä kriteerejä, saimme 6 Kegg polkuja, 20 GO biologiset prosessit ja 15 GO molekyylien toimintoja johdonmukaisesti rikastunut molemmissa luetteloissa (taulukko 4). Kegg reitit koostui MAPK -signalointireitistä, aksoniohjauksen, fokaalisen adheesion, ECM-reseptori vuorovaikutuksen säätely aktiinisytoskeletonin ja reittejä syövässä. GO biologisia prosesseja voitaisiin ryhmitellä prosessit kudosten kehittämiseen, haavan paraneminen, solumigraatio tai solujen lisääntymistä. GO molekyyli- tehtävät koostuivat ECM ja solun tukirangan ainesosia, peptidaasi-inhibiittorit ja sitoutuminen kollageenin, kasvutekijät, hepariinia ja integriini. Kuten odotettua, luetteloa 365 geenien käsitti kaikki merkittävästi rikastettu reittejä ja GO termejä 130 geeneistä EMT-core lista paitsi 2 GO biologisia prosesseja (ECM organisointi ja keuhkojen kehitykseen). Useat enemmän Kegg polkuja, GO biologiset prosessit ja molekyylien toimintoja voitaisiin tunnistaa luettelossa 365 geenejä (taulukko 3 ja 4). Kaikki nämä reittejä, biologiset prosessit ja molekyylitason toiminnot ovat hyvin tunnettuja olla mukana EMT [5], [14] – [16], ja näin vahvistavat eheyden EMT-core-geenin luettelosta. Lisäksi sekä EMT-core lista ja listan 365 geenien näyttää vertailukelpoista rikastamiseen suhde Kegg reittejä ja GO biologisia prosesseja (kuva 3) sekä GO molekyyli- toiminnot (kuva S2). Näin ollen luettelo sisältää 365 geenejä voidaan katsoa paranemisen EMT-core luettelosta, joka sisältää ylimääräisiä geenejä, jotka saattavat olla epäselvä rooli EMT. Yhteenvetona meidän EMT-core lista 130 geenien ja sen parantuminen sisältää 365 geenit osoittavat vahvaa rikastuminen EMT-asiaan liittyviä prosesseja.

rikastamiseen suhde on määrä havaittu geenien määrä jaettuna odotettavissa geenit annettu termi tai polku. Väkevöiminen suhteet saatiin WebGestalt tai laskea tietojen FatiGO. GO, geeni ontologian; BP, biologinen prosessi; Kegg, Kyoto tietosanakirja geenien ja genomien.

kliininen merkitys EMT-core geeni lista

EMT-core geeni luettelo sisältää useita geenejä, joissa vielä tunnistamaton rooleja syövän etenemiseen ja /tai EMT. Meidän tavoitteena oli tutkia kliinistä merkitystä valikoima geenejä. Siksi meidän korreloi niiden lausekkeen eloonjäämisaste kärsivien potilaiden levyepiteelisyövän keuhkosyövän (SCC) [17] ja patologinen täydellinen vaste (PCR) syöpäpotilaista [18]. Vuodesta vaimentua geenit EMT-core geeni lista, alhainen FXYD3 ilme osoitti suuntaus huonosta eloonjäämisaste SCC potilaista (p = 0,17) ja alhainen ilmentyminen LAD1 (p = 0,00074), SLC7A5 (p = 0,0093) ja SLPI ( p = 0,043) korreloi merkittävästi huonompi pCR rintasyöpäpotilaiden. Vuodesta voimistunut geenit EMT-core geeni lista, korkea PTX3 ilmaisu yleensä huono eloonjäämisaste SCC potilaista (p = 0,16) ja korkea ilmentyminen NID2: ksi (p = 0,0091), SPOCK1 (p = 0,038) ja SULF1 (p = 0,00029) korreloi merkittävästi heikentynyt pCR rintasyöpäpotilaiden. Nämä korrelaatiot osoittavat, että vertailu eri tietokokonaisuuksien on tehokas keino tunnistaa uusia asiaan kohdegeenien jotka eivät synny yksittäisistä tutkimuksista.

Keskustelu

Viime vuosikymmenen aikana huomattavan määrän GES jotka käsittelevät EMT on kertynyt kirjallisuudessa. Nämä kattavat useita solutyyppejä, jotka näyttävät EMT ja sisältävät eri liikennemuotojen EMT induktio. Toistaiseksi nämä resurssit ovat vain osittain käytetty verrata yhden kyseessä olevien kirjallisuudessa [8], [19], [20]. Tietääksemme ei on pyritty tutkimaan suurimman itsenäisen GES EMT niiden suhteet toisiinsa. Vaikka olemme tietoisia siitä, että geenien ilmentyminen tietojen EMT eivät ole täydellisiä, olemme analysoineet hetkellä käytettävissä GES tuottamaan EMT-core lista geenien muuttunut useimmin aikana EMT prosessi, kuten on kuvattu vuokaaviossa (kuva S3).

Ryhmittelyanalyysi geenien jaetaan vähintään 10 GES aineistoja paljasti klustereiden GES kanssa sama tai samanlainen kohtelu tyyppi. GES jossa EMT indusoitiin TNF-α joko yksinään tai yhdessä TGF-β, TGF-β yksin tai eri transkriptiotekijät johdonmukaisesti yhdessä. Nämä klusterit jatkui, kun geenit jaetaan vähintään 14 aineistoja käytettiin klusterianalyysillä. Selkeä ryhmittely erityyppisiä EMT induktio, olisi kuitenkin ollut mahdollista vain, jos riittävä määrä GES kaikista näistä EMT aloittamisesta menetelmiä olemassa. Koska useat hoitotapoja vasta edustettuina kerran kirjallisuudessa, kuten GES klusterin kaikkein liittyvän hoidon tyyppi.

Yksi klusterin pääasiassa syntyneet GES TGF-β-aiheuttama EMT, joka koostui 13 aineistoja. Mielenkiintoista on, että ryhmään kuuluvat eksogeenisen ilmentämisen Six1 (Micalizzi

et ai

, GSE23655, [20]), joka on osoitettu lisäävän kasvaimen edistämisen TGF-β signalointia, ja Runx2 (Baniwal

et ai

, GSE24261, [21]), joka toimii alavirtaan TGF-β signalointi [22] – [25]. Näin ollen tämä tukee ryhmittely näiden tutkimusten yhdessä muiden kanssa käyttämällä TGF-β kuten EMT initiaattorina. Tutkimus van Zijl

et al.

(GSE26391; [26]) on kuvattu analyysi epiteeli- ja mesenkymaalisten maksasolusyövän soluja, jotka ovat peräisin saman kasvaimen potilaalle. Klusterointi Tämän tutkimuksen yhdessä muiden tutkimusten TGF-β-aiheuttama EMT ehdottaa osallistumista TGF-β-signalointia perustamisen mesenkyymisolun linja.

klusterin GES TNF-α kuten EMT induktori sisälsi tutkimuksen Takahashi

et al.

joka analysoi ARPE19 solulinja käsiteltiin joko TNF-α yksinään (GSE15205_TNFa), TNF-a: n kanssa TGF-β (GSE12548) tai TGF-β yksinään (GSE15205_TGFb) jotta aiheuttaa EMT [12]. Kaksi aineistot TNF-α hoitoa muodostivat johdonmukainen klusteri. Kuitenkin kolmas aineisto, joka saatiin yksin hoito TGF-β klusteroitu muille GES kuvaavat EMT aloituksen TGF-β. Näin ollen nämä tiedot viittaavat siihen, voimakkaampi vaikutus EMT ärsyke on klustereiden sijasta solutyypistä.

Yksi klusterin koostuivat lähinnä aineistojen välillä Taube

et al.

(GSE24202; [13 ]), jotka ilmoitetaan induktion EMT vuonna HMLE soluissa käyttäen yliekspressio Twist, etana, Goosecoid ja TGF-β sekä knockdovvn E-kadheriinin. Yhdenmukainen ilmoittamat tiedot Taube

et al

, tietokokonaisuuksien peräisin Snail- ja Twist aiheuttama EMT olivat samanlaiset tässä klusterissa. Tämä havainto on yhtäpitävä sen kanssa, että Twist on välittömänä kohteena Snail [27]. Suuri määrä aineistoja tässä tutkimuksessa saattaa johtaa yliedustus sisällä klusterianalyysillä. Lisäksi se, että saman solun linjaa sekä transkriptiotekijöitä samanlaisia ​​tavoitteita kuten Twist ja Snail saattaa johtaa korkean samankaltaisuus sisällä aineistoja tässä nimenomaisessa tutkimuksessa.

klusteri koostuu Ke

et al.

(E-TABM-949; [28]), joka käyttää suuren solutiheyden viljely EPT2 solujen ja Ohashi

et al.

(GSE27424; [29]), joka kuvataan NOTCH3 knock-down in EPC2 soluissa näyttää alhainen suhteessa muihin klustereihin koska ainutlaatuinen tyyppisiä EMT induktio. On todennäköistä, että toisaalta näiden GES muodostavat klusterin, koska ei ole suhdetta muihin ryhmiin. Toisaalta, se voi myös ehdottaa suhteessa niiden tyyppisiä EMT aloittamisesta samoin.

Olemme löytäneet erilaisia ​​tunnettuja markkereita EMT yläreguloituja meidän EMT-core-geenin lista kuten CDH2, CDH11 , COL1A1, COL3A1, FBLN5, FN1, HAS2, LOX, MMP2, PLAT, SERPINE1, VIM, WNT5A ja ZEB1 [15], [30], [31]. Lisäksi havaitsimme vaimentua geenejä raportoitu vähennettävä EMT kuten ANK3, CDH1, CXADR, PRSS8 ja SYK [15], [32] – [34], useat vaimentua epiteelisolujen markkereita, kuten EPCAM, JUP, KRT15, ​​KRT17, OCLN, PKP2 ja PPL [5], [15] ja useita vaimentua tuumorisuppressoreilla kuten KLK10, MTUS1, OAS1 ja SERPINB1 [35] – [38]. Yhdessä nämä geenit tarjota vankka vahvistus meidän EMT-core-geenin luettelosta. Sitä paitsi ne geenit vahvistaa eheyden geenin lista kuitenkin geenien Tuntematon toiminnot sekä tuntematon tai epäselvä suhteessa syöpään ja /tai EMT esiin, jotka ovat uusia ehdokkaita lisätutkimuksia varten. Voimistunut geenejä ovat MAP1B, NID2: ksi, PTX3, SPOCK1, SULF1, TAGLN ja TMEM158 taas vaimentua geenit kuuluivat ABLIM1, LAD1, FAM169A, FXYD3, SLC7A5, SLPI, TMEM30B ja TPD52L1.

Kaksi meta-analyysit EMT rintasyövän syöpä huomioon eri solulinjoja tai tyyppisiä EMT induktio on raportoitu. Nämä ovat tunnistaneet EMT-core geeni luettelot 200 ja 251 geenit [13], [39] kuitenkin päällekkäin noin 10% vain. Meidän EMT-core lista, joka sisältää 130 geenit näyttää huono päällekkäisyys 7% kanssa luettelon Choi

et al.

[39], mutta päällekkäisyys 55% kanssa Taube

et al.

[ ,,,0],13]. Molemmat luettelot Choi

et al.

Ja Taube

et al.

Sisältävät unmapped tunnisteet (ID: t), kuten array tunnuksia, ilmenevän geenin osiksi ja lokuksen tunnukset. Käytimme johdonmukaisesti rikastettua koulutusjakson analyysi tutkia tarkemmin nämä geeni luetteloita. Varsinkin meidän EMT-core lista näkyvissä enemmän rikastettua Kegg reittejä ja GO termejä kuin geenin luettelot Choi

et al.

Ja Taube

et al.

(Taulukko 3 ja 4). Kun vähentää tiukkuutta analyysi kahden geenin sisällä rikastettua tyylinen rikastuminen luettelo Choi

et al.

Ei parantunut, kun lähes kaikki Kegg reittejä ja GO termejä rikastettu meidän EMT-core lista voisi olla havaittu luetteloon Taube

et al.

(tietoja ei ole esitetty, taulukko 4).

EMT-core lista sisältää useita geenejä tuntemattomia toimintoja ja suhteita syövän ja /tai EMT. Pystyimme osoittamaan, että FXYD3 ja PTX3 ilmentyminen liittyy yleensä ottaen heikkoa potilaan eloonjäämiseen SCC potilaiden ja LAD1, SLC7A5, SLPI, NID2: ksi, SPOCK1 ja SULF1 korreloi merkittävästi heikentynyt PCR rintasyöpäpotilailla. FXYD3 on osoitettu liittyvän kasvaimen solujen lisääntymisen ja vaimentua TGF-β signalointi [40], [41]. PTX3 on raportoitu olevan keuhkosyöpä biomarkkereiden [42]. NID2: ksi on osoitettu olevan koholla aikana forboli-12-myristaatti-13-asetaattia aiheuttaman hyökkäyksen useita ihmisen kasvainsolulinjoja ja mahdollisena kasvaimen biomarkkereiden [43], [44]. SPOCK1 on raportoitu olevan osallisena hermosolujen kiinnitys ja matriksimetalloproteinaasi aktivointi [45], [46]. SULF1 on osoitettu olevan mahdollinen biomarkkeri mahalaukun syöpä, joka voidaan saada aikaan TGF-β1 [47], [48]. LAD1 on adaptoriproteiini mukana ERK5 ja JNK polkuja [49]. SLPI on raportoitu toimivan antituumorigeenistä tiettyjen kasvainten sekä edistää muuttoliikettä ja invaasion toisissa [50] – [52]. Näin ollen nämä geenit näyttävät olevan lupaavia ehdokkaita lisätutkimuksia. Yhdessä ehdotamme, että EMT-core lista 130 geenien on erittäin merkittävä EMT ja klusterin analyysi on hyödyllinen yleiskuva suhteista tällä hetkellä saatavilla GES EMT.

Materiaalit ja menetelmät

tietojen keruu ja merkintä

Käsitellyt microarray tiedot ladattiin verkkosivuilla GEO (saatavissa: https://www.ncbi.nlm.nih.gov/geo/) ja AE (saatavissa: http: //www.ebi.ac.uk/arrayexpress/) käyttämällä ”EMT”, kuten avainsanana julkaistu GES vasta helmikuussa 2012. ladattu GES oli lisätty huomautusta hakea virallista geeni symboleja, EntrezID ja geeni nimiä käyttäen Bioconductor 2,9 (saatavilla: http: //www.bioconductor.org/; näytetty: 2012 2 tammikuu) [53] sekä online-työkalu NetAffx (saatavissa: https://www.affymetrix.com/analysis/index.affx; näytetty: 2012 kesäkuu 25). Bioconductor käytettiin sisällä R ympäristössä [54]. Selityksin varustettu data tuotiin MS-Excel 2010 ja log2 muuttunut. Myöhemmin kertamuutoksia ja p-arvot käyttäen kaksipuolista Studentin

t

-testissä laskettiin. Merkittävästi ylä- ja vaimentua geenit valittiin ja erottaa toisistaan, kun näytetään kertamuutos on suurempi kuin 2 tai alle 0,5 ja p-arvo on alle 0,05. Voimistunut geenit tilattiin korkeimmasta matalimpaan kertaluokkamuutos. Kääntäen, vaimentua geenit järjestettiin alhaisimmasta korkeimpaan kertaluokkamuutos. Kopiot poistettiin jälkeenpäin. Gene merkkejä on tarkempaa analysointia ja sitä kutsutaan geenejä.

Ryhmittelyanalyysi

ylä- ja vaimentua geenit kustakin tutkimus tehtiin yhteenveto, tilattu ja kaksoiskappaleet poistettiin saamiseksi luettelo kaikista yksilöllisesti raportoitu geenit kaikissa tutkimuksissa. Voimistunut geenit leimattiin 1 ja vaimentua geenit leimattiin -1. Geenit, jotka eivät merkittävästi vapautui sisällä GES ja geenien havaittiin olevan sekä ylä- ja vaimentua sisällä tutkimuksen leimattiin 0. jakautuminen todettu määrä ylä- ja vaimentua geenien testattiin binomijakau- parametrilla p = 11.78% avulla khiin neliö testi. Laskimme mahdollisuuksia piirustus kunkin sulku vaihtoehto klusterianalyysillä ( 1, 2, 3, ja niin edelleen) sattumalta kanssa binomijakauman toiminto, jonka R (todennäköisyys = 11,78%). Mahdollisuuksia tehdä jokaiselle sulku vaihtoehto sattumalta verrattiin alustavaan Klusterianalyysit kunkin cutoff vaihtoehdon, jotta voidaan määrittää sopivan sulku. Klusterijärjestelyssä suoritettiin Bioconductor 2,9 upotettu R 2.14.1 (64 bit) kanssa paketteja GData [55], gplots [56] ja heatmap.plus [57] käyttäen hierarkkinen heatmap klusterointi Manhattan etäisyyden funktiona.

Tasaisen rikastuminen Kegg reittejä ja GO termejä

geeni luettelot analysoitiin viittä eri bioinformatiikan rikastamiseen työkaluja. Kattava katsaus käytetyn työkaluja ja niiden ominaisuudet on esitetty taulukossa S4. Työkalut FatiGO ja GeneCodis käytettiin sen Babelomics 4 alusta [58], joka antoi pääsyn sekä ohjelmia samanaikaisesti. Valintakriteerit merkittävästi rikastettu polkuja olivat p-arvo tai FDR alle 0,05 ja vähintään 5 geenien tulo listan sisällä rikastetun luokkaan. Lisäksi johdonmukaisesti rikastettu GO termejä ja Kegg reittejä tunnistettiin vähintään 4 5 ohjelmia sekä EMT-core-geenin luettelon ja 365 geeniä luettelosta. Enrichment suhteet (lukumäärä havaittu geenien määrä jaettuna odotettavissa geenien GO tai Kegg luokka) on saatu WebGestalt, tai vaihtoehtoisesti on laskettu kuvannut Zhang

et al.

Tietojen kanssa FatiGO [59].

korrelaatio EMT-core lista kliinistä tietoa

Microarray ja kliiniset tiedot potilailla, joilla levyepiteelisyövän keuhkosyövän (n = 130) ilmoittamat Raponi

et al.

[17] kanssa liittymisen GDS2373 ladattiin GEO. Microarray ja kliiniset tiedot rintasyöpäpotilaiden (n = 133) ilmoittamat Hess

et al.

[18] ladattiin MD Anderson Cancer Center verkkosivuilla (saatavissa: https://bioinformatics.mdanderson.org/pubdata.html; näytetty 2012 7 syyskuu). Potilaat jaettiin korkea ja matala ilmentävät ryhmien valituille geenien sisällä EMT-core lista. P-arvot laskettiin käyttäen kaksipuolista Studentin

t

-testi. Survival analyysi tietojen Raponi

et al.

Suoritettiin chi-neliön testi tasa käyttäen selviytymisen paketin R [60]. P-arvot alle 0,05 pidettiin merkittävinä.

tukeminen Information

Kuva S1.

Cluster analyysi geenien jaetaan vähintään 14 GES aineistot osoittavat pysyviä ja selvästi klustereita.

doi: 10,1371 /journal.pone.0051136.s001

(PDF) B Kuva S2.

130 geenit EMT-core lista ja 365 geenit luetella näytteille vertailukelpoinen rikastamiseen suhde GO molekyylien toimintoja.

doi: 10,1371 /journal.pone.0051136.s002

(PDF) B Kuva S3.

vuokaavion sukupolven EMT-core-geenin luettelosta.

doi: 10,1371 /journal.pone.0051136.s003

(PDF) B Taulukko S1.

Matrix sisältäviä merkittävästi ylä- ja vaimentua geenien poikki analysoitiin GES aineistoja.

doi: 10,1371 /journal.pone.0051136.s004

(XLS) B Taulukko S2.

Luettelo 365 geenien merkittävästi säännelty vähintään 10 GES aineistoja.

doi: 10,1371 /journal.pone.0051136.s005

(DOC) B Taulukko S3.

EMT-core geeni lista 130 ylä- tai vaimentua geenit jaetaan vähintään 10 GES aineistoja.

doi: 10,1371 /journal.pone.0051136.s006

(DOC) B Taulukko S4.

Enrichment työkaluja käytetään tässä tutkimuksessa ja niiden ominaisuuksia.

doi: 10,1371 /journal.pone.0051136.s007

(DOC) B

Vastaa