PLoS ONE: CMS: Web-pohjainen järjestelmä visualisointi ja analysointi genominlaajuisten metylointi Tiedot ihmisen syövissä

tiivistelmä

Background

DNA metylaatio promoottori CpG-saarekkeiden liittyy geenisuppression, ja sen ainutlaatuinen genominlaajuisten profiilit on liitetty syövän etenemiseen. Yhdessä suurikapasiteettisten sekvensointiteknologioihin, se voi nyt tehokkaasti määrittää genominlaajuisten metylaatio profiilit syöpäsoluissa. Myös kokeellisia ja laskennallisia tekniikat tekevät mahdolliseksi löytää toiminnallinen suhde syöpäspesifisessä metylaation ja niiden kliinis parametrit.

Menetelmät /Principal Havainnot

Cancer methylome (CMS) on web -pohjainen tietokanta sovellus on suunniteltu visualisointiin, vertailu ja tilastollinen analyysi ihmisen syöpää erityisiä DNA: n metylaatio. Metylointi intensiteetit saatiin MBDCap-sekvensointi, pre-käsitellään ja tallennetaan tietokantaan. 191 potilaan näytettä (169 kasvain ja 22 normaali näyte) ja 41 rintasyöpä solulinjoja talletetaan tietokantaan, joka sisältää noin 6,6 miljardia ainutlaatuisesti kartoitettu järjestyksessä lukee. Tämä tarjoaa kattavan ja genominlaajuisten epigeneettisellä muotokuvia ihmisen rintasyövän ja kohdun limakalvon syöpä tasalla. Kaksi näkymät ehdotetaan käyttäjiä ymmärtämään paremmin metylaatio rakenne genomitasolla tai systeemisiä metylaatio muutos geeni- tasolla. Lisäksi erilaisia ​​merkintä kappaleet on järjestetty kattamaan genomista tietoa. CMS sisältää tärkeää analyyttisten funktioiden tulkitsemiseen metylaation tietoja, kuten havaitseminen erilaisesti metyloidut alueiden tilastolaskutoimitus globaalin metylaation intensiteettiä, useita geenin sarjaa biologisesti merkittävä luokkiin, vuorovaikutteisuus UCSC kautta mittatilaustyönä reittijälkeen. Olemme myös läsnä esimerkkejä löytöjä hyödyntäen puitteissa.

Johtopäätökset /merkitys

CMS tarjoaa visualisointi ja analyyttisten funktioiden syövän methylome aineistoja. Kattava kokoelma aineistoja, erilaisia ​​sulautettujen analyyttisten funktioiden ja laajat sovellukset biologisten ja translaation merkitystä tämän järjestelmän tehokas ja ainutlaatuinen syövän metylaatio tutkimukseen. CMS on vapaasti saatavissa osoitteesta: https://cbbiweb.uthscsa.edu/KMethylomes/.

Citation: Gu F, Doderer MS, Huang Y-W, Roa JC, Goodfellow PJ, Kizer EL, et al. (2013) CMS: Web-pohjainen järjestelmä visualisointi ja analysointi genominlaajuisten metylointi Tiedot ihmisen syövissä. PLoS ONE 8 (4): e60980. doi: 10,1371 /journal.pone.0060980

Editor: Eric Y. Chuang, National Taiwan University, Taiwan

vastaanotettu: 31 heinäkuu 2012; Hyväksytty 5 maaliskuuta 2013 Julkaistu: 22 huhtikuu 2013

Copyright: © 2013 Gu et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat R01 CA069065, U54 CA113001 (Integratiiviset syöpäbiologian Program), P30 CA054174 (Cancer Center Support Grant), NCATS 8UL1TR000149 (CTSA) Yhdysvaltain National Institutes of Health, Texas CPRIT RP101195-C04, ja antelias lahjoja Cancer terapia ja Research Center Foundation. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

DNA metylaatio promoottori CpG-saarekkeiden liittyy geenisuppression tuumorinäytteissä verrattaessa normaaliin vastine, ja sen ainutlaatuinen genominlaajuisten profiilit on liitetty kasvaimen etenemiseen ja voidaan käyttää ennustamaan potilaan eloonjäämisen [1]. Global hypometylaatio havaittiin rinta- ja paksusuolen kasvaimet verrataan vastaavaan normaaleissa kudoksissa [2], [3]. Tarkemmin sanoen rintasyöpä, on osoitettu, että geeni elin hypometylaatio liittyy geenien, kun taas hypermetylaatiota alueiden lähellä transkription aloituskohdasta (TSS) on taipumus aiheuttaa samanlaisen vaikutuksen [4]. Lisäksi vuorovaikutus DNA: n metylaation ja transkriptiotekijöiden (TF: t) ovat tärkeitä säännellä ihmisen solun fenotyyppejä. Kanssa etenemistä sekvensointitekniikan, laajamittainen analyysi genominlaajuisten metylaatio tulee toteutettavissa. Useat kokeellisia menetelmiä on kehitetty kaapata metyloidut DNA: t, mukaan lukien MeDIP [5], MBD [6], MethylC [7], ja RRBS [8]. Yhdessä suurikapasiteettisten sekvensointiteknologioihin, nämä menetelmät voivat nyt tehokkaasti määrittää genominlaajuisten metylaatio profiileja soluissa. Lisäksi erilaisia ​​laskennallisia ja tilastollisia menetelmiä on ehdotettu analyysi erilaisesti metyloitua aluetta (DMR). Nämä kokeellisia ja laskennallisia tekniikat tekevät mahdolliseksi löytää toiminnallinen suhde syöpäspesifisessä metylaation ja geenisuppression, ja niiden yhdessä kliinis parametreja, mikä tunnistaminen ehdokas biomarkkereita diagnoosi ja prognoosi [9].

Tässä kuvaamme uusi syöpä methylome joka kerää järjestelmällisesti, järjestää, visualisoi ja analysoi suuri joukko DNA: n metylaatio tietojen sekvensoimalla ihmisen kohdun limakalvon ja rintasyöpiä. Aineistot saadaan käyttämällä MBDCap-seq protokolla, tekniikka, jota käytetään kuvaamaan metyloidut DNA: t käyttämällä metyyli-CpG sitova alue (MBD) proteiini sarake seuraa seuraavan sukupolven sekvensointi [10]. Edullisia ja puolueeton näyttö metylaation profiileja sekä CpG ja ei-CpG saarialueiden tekevät siitä sopivan genominlaajuisia metylaatio profiilin analyysiä. 191 potilaan näytettä (169 kasvain ja 21 normaali näyte) ja 41 rintasyövän solulinjat käsiteltiin kanssa MBDCap-seq protokolla, tuottaa yhteensä noin 6,6 miljardia ainutlaatuisesti kartoitettu järjestyksessä lukee. Aineistot olivat valmiiksi käsitelty ja tallennettu MySQL-tietokantaan. CMS tarjoaa käyttäjäystävällisiä työkaluja tunnistaa nopeasti erilaisesti metyloitua aluetta (DMRs) eri ryhmien näytteiden (esim normaali versus kasvain), riippumatta niiden geenin läheisyyden. Metylointi intensiteetit kertyi sekä genominlaajuisten (resoluutio 100 bp) ja geeni (jokaista RefSeq selityksin geeni) tasoilla. Lisäksi geeni ontologian, biologisia polkuja, ja muut molekyylimerkkiaineet geeniperimä tietokannat on integroitu CMS, joka mahdollistaa vertailun (via metylaatio) toiminnallisten ja biologisten korreloivat geenit eri syöpätyyppejä, ja tutkimalla systeeminen muutos on biologinen koulutusjakson, toimintaa ja vuorovaikutusta verkon tasoilla. Käyttäjät voivat ladata metylaatio profiileja (syntyvät seuraavan sukupolven sekvensointiteknologioihin 100 bp resoluutio) tai geeniperimä tarkkailla ero metylaatio vertaamalla ainutlaatuisen kokoelman kasvaimia. Lisäksi käyttäjät voivat ladata metylaatio intensiteetit kiinnostuksen kohteena olevan alueen tai koko genomin tarkempaa analysointia (by klikkaa linkkiä ”Resurssit” sivulla verkkosivuilla). CMS, biologit voi käyttää mitä tahansa geeni, tutkia ja löytää epigeneettiseltä merkittävä ilmiö, kuten (mutta ei rajoittuen) metylaatio eroa kasvaintyypit, geenit korreloi metyloinnin profiilit ja vastaavuutta, differentiaalisesti metyloitu geenien polku, vertailu DNA metylaatio ja histonimodifikaation markkaa.

tulokset

CMS integroi tietokannasta (mistä genominlaajuisten metylaatio sekvenointitulosten ihmisen syövissä), web-käyttöliittymä teknologia, ja voimakas tilastollisia ja analyyttisiä toimintoja yhdessä, mahdollistaa genomi- leveä metylaatio profiilit visualisointi ja mielekäs biologinen ilmiö löytö ihmisen syövissä (Kuva S1 File S1).

genominlaajuiset MBDCap-sekvensointi kohdun limakalvon ja rintasyövän

yhteensä 232 kliinistä näytettä ja johdetut solulinjat ihmisen rinta- ja kohdun limakalvon syöpä kohortteja käsiteltiin ja talletetaan tietokantaan. Niistä 77 ovat rinta- kasvaimia, 10 normaalin rintakudoksen näytteitä, 41 rintasyövän solulinjoissa (ICBP [11]), 92 kohdun limakalvon kasvaimet (71 ei-toistuvia näytteitä ja 21 toistuvat näytettä) ja 12 normaalia kohdun limakalvon näytettä. MBDCap-sekvensointi teknologiaa käytetään havaitsemaan metyloitu alueilla. Metyloitu fragmentit, sitoutuneena metyyli-CpG: tä sitova domeeni proteiinin eluoitiin sekvensointiin kanssa Illumina /Solexa Genome Analyzer II. Noin 12,7 miljardia järjestyksessä lukee syntyi ja 52% lukee kartoitettiin ainutlaatuisiin genomiin paikkoihin. Genominlaajuisten sekvensointi DNA: n metylaatio tämän suuren joukon kliinisten näytteiden ja solulinjojen teki tämän ainutlaatuisen tutkimuksen kasvaimen methylome profiilien (kuva S1 File S1). Tiedot yli 1000 kliinisissä näytteissä, kuten munasarjojen, suun, peräsuolen, maksasyövän, keuhko-, ja eturauhasen syöpiä, lopulta talletetaan tietokantaan.

suunnittelu web-käyttöliittymä ja tietokanta

selainkäyttöliittymästä kehitettiin Java käyttäen SideCache [12] puitteissa, tukee julkisesti saatavilla JavaScript-grafiikka kirjasto (https://www.walterzorn.de/) graafinen ja kuvankäsittelyn. CMB sivusto on sijoitettu Apache Tomcat web-palvelimen (https://tomcat.apache.org/), ja tukee MySQL-tietokannan metylaation tietojen (kuva S1 File S1). Toiminto ja analyyttiset menetelmät upotettu puitteissa kirjoitettiin R script. Lisäksi web-palvelu API myös toteutettu tekevät yhdistämisen muihin genomin sivustot. Tämä web-käyttöliittymä on täysin testattu Firefox, ja on hyvin yhteensopiva Safari ja Chrome. Se on myös yhteensopiva IE yhdellä vammainen (katso visualisointi metylaation aineistojen kohta).

Visualisointi metylaation aineistojen

CMS voidaan visualisoida erilaisuudeen: genomista katsella ja geenin keskeinen näkymä .

genominen View.

genominen näkymä on, että genominlaajuisia visualisointi ja analysointi metylaation intensiteetti (kuva 1).

Tämä verkkosivu on suunniteltu genomi- leveä visualisointi ja analysointi metylaation intensiteetti (A, B, C). Metylointi intensiteetti on valmiiksi laskettu 100 emäsparin bin koon ja näytetään käyttäen punaisia ​​kaltevuus lämpökartta. Erilaisia ​​genomista merkintöjen ja toiminnallinen työkalurivejä antaa käyttäjille enemmän vaihtoehtoja lukemassa verkkosivun. Tilastolliset menetelmät pukea, kuten DMR analyysi (A) ja tilastollinen laskenta (C). Linkit UCSC genomin selain (D) sekä geenin näkymä (E) ovat käytettävissä lisäanalyysiä.

Erilaisia ​​dataraidat toteutettiin Genomisen visualisointi toiminnot (kuvio 1A, B): Genomisen koordinaattiradan (genomisen sijainti visualisoidaan alueella, myös kromosomi, alue alun ja lopun kannat); GC-pitoisuus raita (GC prosenttiosuus on perimän asemaa, laskettuna 100 bp resoluutio); h3k4me1 histonimodifikaation kirjaa GM12878 cell line (saatu UCSC genomista rakentaa hg19, wgEncodeBroadHistoneGm12878H3k4me1StdSig.bigWig pöytä, liftover jotta hg18); sekvenssikonservoinnista kappaleita UCSC (saatu UCSC genomista rakentaa hg18); CpG-saarekkeen kappale (saatu UCSC genomista rakentaa hg18, https://genome.ucsc.edu); Gene merkintä kappale (mukaan lukien geenien alku ja loppu kantoja, geenin symboli ja hakunumero); ja metylointi intensiteetti kappale (t) (metylointi intensiteetti edustaa värisyvyys, tummanpunainen vastaa korkea metylaatio arvoon, valkoinen keinot vähän tai ei metylaatio arvoa, 100 bp resoluutio). Yksityiskohtaiset merkintä näkyy kelluva-tip näkymä, kun käyttäjä liikuttaa hiirtä GC sisällön, CpG-saarekkeen ja geenin merkintä kappaleita. Yksittäinen-napsauttamalla metylaatio profiilien kappale (t) voi tuottaa popup dialogi metylaatiospesifisiin intensiteetti (lukee numero kyseisen aseman, tämä toiminto ei ole käytössä IE). Metylointi intensiteetti raita on joustava useita vaihtoehtoja (valittu ”Jäljet” avattavan työkalupalkin painiketta). Yleisesti on olemassa kahdenlaisia ​​metylaation intensiteetin seuraa, että käyttäjät voivat valita näytön –

yksittäiset

tai

tiivistelmä

kappaleita. Yksittäinen raita näkyy genominlaajuisia metylaatio intensiteetti 100 emäsparin bin koko kunkin kasvaimen /normaali näyte valittu. Käyttäjät voivat näyttää yhden kasvaimen vain (esim rinta- tai kohdun limakalvon), tai kaikki kasvaimet yhdessä. Yhteenveto kappale (kuvio 1 C, katso Sulautettu tilastolliset menetelmät alla) sisältää yleiset tilastot keskiarvon, taajuus ja ero kaikista kasvaimista.

kokoelma hyvin suunniteltu toiminnallisia työkalu-baareja sisältyy tähän verkkosivun. Käyttäjät voivat liikkua ympäri genomin suurentamalla ja ulos, liikkuu vasemmalle tai oikealle pitkin genominen suuntaan tai siirtymässä naapurimaiden geenejä. Käyttäjät voivat etsiä geeni /kohdealueen suoraan kirjoittamalla geeni symboleja tai alueen koordinaatit.

DMR-analyysi (katso Sulautettu tilastollisten menetelmien alla) toteutettiin genomiseen katsoja. Vuonna DMR-toiminto, käyttäjä voi valita ehdokas näytteitä merkitsemällä check-laatikot Metylointilaitteistoon intensiteetin kappale (s), ja täytä sitten tarvittavat parametrit (katso materiaalit ja menetelmät). Oletusarvot ovat ennalta. DMR tulee lähtö tiedoston sarkainerotellussa tekstimuodossa (katso materiaalit ja menetelmät). Kaikki Tulostiedostot syntyy on-demand ja tehokkaasti, mutta voi rajoittaa lataus nopeus käyttäjän verkkoon.

Linkit UCSC genomin selaimen kertyi (kuvio 1D, katso visualisointi DNA metylaatio ja histoni muutostöissä osio esimerkiksi käytöstä). Luettelo geenien sisältyvät nykyiseen genomin alueella näkyy alaosassa vasemmassa perimän mieltä verkkosivun, ja linkit luodaan pääsy geenin keskeinen näkymän tiettyjen geenien (kuvio 1 E).

Gene Centric View.

vaihtoehtoinen tapa havainnollistaa metylaatio data on Gene-keskeinen kuva, joka esittää metylointi heatmap valittujen geenin sarjaa (kuva 2).

Tämä verkkosivu on suunniteltu visualisointi ja analysointi metylaatio intensiteetti geenin tasolla. Työkalupalkin, neljä kerrosta vaihtoehdot ovat käytettävissä, jotta valikoimien geenin sarjaa. Metylointi intensiteettiä promoottorialueille geenien (+/- 2 kb noin TSS alue) olivat ennalta laskettuja ja näytettiin käyttäen punaisia ​​kaltevuus lämpökartta. Valkoinen /vihreä ruutu sivussa geenin symboli osoittaa promoottorialueissa tämän nimenomaisen geenin tai ilman CpG Island (s). Klikkaamalla geeni symboli vasemmalla puolella heatmap paneeli tuo käyttäjän takaisin genomiseen katsojan keskitetään valittuun geeni, joka mahdollistaa visualisoinnin yksityiskohta metylaatiovyöhykkeiden.

Tässä verkkosivun käyttäjät voivat kirjoita geeni symboli ja visualisoida metylaatiostatuksen tietyn geenin kaikissa kasvain näytteet yhdessä top 40 eniten korreloi geenien samanlaisia ​​metylaation laskettu Pearsonin korrelaatio (katso materiaalit ja menetelmät). Vaihtoehtoisesti neljä kerrosta vaihtoehdot ovat käytettävissä, jotta valintojen erityinen biologinen toiminta, vuorovaikutus verkko, ja korreloivat geenin sarjaa (kuva 2). On kahdeksan ensisijaista luokkaa geenin sarjaa (jotkut niistä voivat sisältää subsets). Nämä ennalta ensimmäiseen kerrokseen, kuten Korreloitu geenit (katso materiaalit ja menetelmät), kromosomaalinen, Gene ontologia, häiritsemisestä sarjaa, Biological Pathways, MikroRNA, transkriptiotekijät, ja syövän geeni naapurustossa. Ensisijainen geeniperimä nimet ja niiden lähteet on lueteltu taulukossa 1 [13] – [19]. Metylaatiostatuksen valitun geenin joukon voidaan visualisoida kaikkien kasvaimia CMS, tai kasvain tyypit käyttäjän valinnan. Suuret geeni sarjaa voi hidastaa metylointi heatmap tekee aikaa, joten on suositeltavaa valita pienempi geenin sarjaa aloittaa prosessin. ”Hakujaottelu” vaihtoehdon avulla käyttäjä löytää kaikki geenin sarjaa (paitsi joukossa ”Korreloitu Genes”), jotka sisältävät sanat hakukenttään.

heatmap paneelin metylointi intensiteetit valmiiksi laskettu keskiarvo normalisoitu (lineaarinen normalisointi, katso materiaalit ja menetelmät) lukee numero kuluessa +/- 2-kb transkription aloituskohdasta (TSS) ja säilytettiin MySQL-tietokantaa. Eri genomi mielestä geeni keskeinen katsoja on järjestetty seuraavasti: kasvain tai normaali näytteet sijoitetaan sarakkeisiin, ja geenit ovat rivit, samanlainen yhteinen mikrosirun muodossa. Heatmap väriskaala geenin keskeinen näkemys on sama kuin genomista mieltä. Promoottorialueille tai ilman CpG Island (t), on merkitty valkoisella /vihreän laatikon sivussa geenin symboli. Heatmap paneeli mahdollistaa visualisoida eri /samanlainen /erityinen metylaatio profiileja (katso Discovery käyttämällä CMS §) välillä kasvaintyypit tai joukossa geenejä vastaavia biologisesti merkittäviä luokkia.

Klikkaamalla geeni symboli vasemmalla puolella heatmap paneeli tuo käyttäjän takaisin genomiseen katsojan keskitetään valittuun geeni, joka mahdollistaa visualisoinnin yksityiskohtaisesti metylaatiovyöhykkeiden promoottori, eksonin, intronin ja sen lähialueilla.

Syöttö ja tulostus

genomista mielestä käyttäjiä, jotka haluavat visualisoida ja analysoida omia tietojaan voi mahdollistaa mukautetun radalla. Toimittamat tiedot käyttäjät ovat yksityisiä, istunto-pohjainen (ei tallennettu päätyttyä session) eikä muiden katseltavissa. Yksi Toisaalta varten kohdealueen (alle 1 Mbp, näkyy oikeassa alareunassa sivun perimän view), käyttäjät voivat ladata lukee tiedot (BED muodossa) lisäanalyysiä.

geenin keskeinen mieltä, me myös tiedostonlähetyskiintiö vaihtoehto käyttäjät voivat ladata räätälöityjä geenin sarjaa (virallinen geeni symboleita vain). Mukautettu geeniperimä näkyy nimellä ”User Input” in avattavasta painiketta Gene Set kerros. Käyttäjät voivat myös ladata metylaatio virran voimakkuuden heatmap paneelin klikkaamalla painiketta oikeassa alareunassa verkkosivun.

Sulautettu tilastollisia menetelmiä

hypermetylaatiota CpG-saarekkeiden geenin promoottori on yksi yleisimmistä muutokset johtavat syöpään, ja tärkeä epigeneettisiä mekanismi geenien. Jotta havaitsemisen ero metylaation alueilla kahden näytteen ryhmien DMR tunnistustoiminto upotettiin puitteissa. CMS, yksittäiset methylome kappaleet (mukaan lukien käyttäjien ladata yksilölliseen track) tai tiivistelmä raitoja voidaan asettaa kaksi ryhmää, jotka on määritelty ”käsitelty” ja ”ohjaus” (ks visualisointi metylaation aineistojen jakso). DMR algoritmi, joka perustuu

t

-testi, Wilcoxonin testi tai Pearsonin korrelaatio voidaan valita merkityksen arvioimiseksi ero metylaation enintään 1 mega emäsparia. Kuvaus DMR algoritmin annetaan Materiaalit ja menetelmät.

Lisäksi DMR-toiminto, myös suunniteltu yhteenveto kappaleita visualisoida keskimäärin metylaatio intensiteettiä ja paljastaa luontaisia ​​ominaisuuksia kunkin kasvaimen ryhmän. Kolmenlaisia ​​yhteenveto raidat näkyvät yhteen kuten kuvassa 1C, ne ovat: (a) Mean raita, joka tarjoaa keskimääräinen metylaatiostatuksen tietyltä Näyteryhmä. Tällä hetkellä yleiskatsaustilastot arvioidaan yli i) kaikki näytteet, ii) normaalit, kasvaimet ja solulinjat rinta-, ja iii) kohdun limakalvon kertaluonteisia kasvaimet, toistuva kasvaimia, ja normaali endometriumin; (B) Metylointi taajuuden rata (katso materiaalit ja menetelmät). Mean ja taajuus kappaleet tarjoavat tietoa, onko metylaatio muutos on peräisin suurin osa näytteistä tai vähemmistön näytteet suuret metylaatio intensiteetti; (C) Ero rata, joka visualisoi ero metylaatio keskiarvolla /taajuus ero ryhmien näytteiden jokaisessa bin koon, kuten kasvain vs normaali keskiarvo rintasyövän, ja kertaluonteisten /toistuvat vs normaali-Freq kohdun limakalvon.

Kasvain erityisiä metylaation profiilien

tumorigeneesin mekanismit ovat erilaisia ​​joukossa syöpiä, joten on tärkeää löytää geneettisiä /epigeneettisiä eroja tarkempaa analysointia varten. Tässä käytimme HOXB2 (ihmisen homeobox B2) geenin, jäsen Antphomeobox perhe, joka koodaa nukleaarinen proteiini, jossa on homeobox DNA: ta sitova domeeni ja tunnetun geenin liittyy kasvaimen kasvuun ja invasiivisuus [20], [21] kuin esimerkkinä siitä, miten CMS pystyy määrittämään kasvaimen erityisiä metylaation profiileja rinta- ja kohdun limakalvon syöpää.

genomista mielestä käyttäjät voivat kirjoittaa HOXB2 navigointiruudusta, ja valitse ”Kaikki kasvaimet”, ovat Kappaleet avattavassa ruutuun, valitse ”Refresh View” -painiketta. Saat paremman kuvan metylaation profiilien käyttäjät voivat klikata ”zoom in” -painiketta neljästi. On selvää, hypermetylaation välillä havaittiin rinta- kasvaimia ja normaali (kuvio 3A), mukaan lukien neljä aluetta (

p

-arvo 0,01), laskettu DMR-toiminto oletusparametrejä käyttäen. Kuitenkin hypometylaatio välillä havaittiin kohdun limakalvon kasvaimet ja normaaleissa kudoksissa (kuvio 3B), joista yksi alueen

p

-arvo 10

-4 (taulukko S1 File S1). Lisäksi käyttäjät voivat selata yhteenvedon kappale valitsemalla ”Kaikki tiivistelmät” in raidat avattavasta. Keskimääräinen rata, joka edustaa satoja yksittäisiä kappaleita, yksinkertaistaa visualisointi erilaisesti metyloitua alueisiin ja enemmän intuitiivinen tuloksen. Sen lisäksi geenejä, jotka hypermetyloitunut ainoastaan ​​rinta- kasvaimissa (vrt rinta normaalit), käyttäjät voivat myös löytää geenejä, jotka hypermetyloitunut ainoastaan ​​kohdun limakalvon kasvaimet (vrt kohdun limakalvon normaalit) (kuten CCDC81, kuva S2 File S1), ja molemmissa kasvaimissa (kuten SOX11, kuva S3 File S1).

HOXB2 oli hypermetyloitunut rinta- kasvaimissa verrattuna rinta normaali (A), kun taas hypometyloidut endometriumin syöpäkasvainten verrattuna kohdun limakalvon normaali (B).

Samanlaisia ​​metylaatio profiilit joukossa biologisesti liittyvät geenit

homeodomain geenit koodaavat transkriptiotekijöitä, jotka vaikuttavat erilaistumista ja lisääntymistä kehityksen aikana. Ihmisen perimässä, neljä klustereita homeodomain geenien (HOXA, HOXB, HOXC ja HOXD) on jaettu kromosomeissa 7p15, 17q21, 12q13 ja 2q31, vastaavasti. Non-klusteroitu homeodomain geenit jaetaan koko genomin. Yksi suora kysymys on ”mitä muita geenejä, jotka näyttävät samaa metylaation -kuvioltaan HOXB2, ehkä jakavat saman metylaation mekanismi?” Jatketaan edellisessä vaiheessa sillä genomin mieltä, käyttäjät voivat valita geeni linkkiä vasemmassa alareunassa saada geenin keskeinen mieltä. Top 40 korreloivat geenit HOXB2 on esitetty kuviossa 4. Useimmissa on samanlainen metylaation profiilin HOXB2, joka hypermetyloitunut rintojen kasvaimia (kuvio 4, sininen viiva laatikko), ja on joko hypometyloidut tai ei osoita mitään eroa kohdun limakalvon kasvaimet verrata normaaliin kudoksiin (kuvio 4, vihreä viiva box).

Gene asetettu samanlaisia ​​metyloinnin profiilit HOXB2 löydettiin valitsemalla ”Correlated geeni” geeni asetetaan geenissä centric mieltä. Useimmat geenit hypermetyloitunut rintojen kasvaimia (sininen viiva laatikko), ja joilla ei ole merkittävää eroa kohdun limakalvon näytteistä (vihreä viiva box).

40 korreloi geenien, joista kolme kuuluu HOXB geeniperheen (HOXB2, HOXB4 ja HOXB7), kolme geeniä sisältävät homeodomain (DLX1, LHX4, ja VAX2) ja kaksi niistä kuuluu HIST geeniperheen (HIST1H3I ja HIST1H4L). Samanlainen metylaatio profiili geenien saman geeniperheen määritellään metylointi vastaavuutta, joka voi johtaa synkronoitu geenien. Lisäksi käyttäjät voivat myös löytää genomisen naapureiden HOXB2 valitsemalla ”Kromosomi” geeni asetettu kerroksesta, ”CHR 17” in kerros kaksi, ”q” arm in kerros kolmen ja ”chr17q21” kerroksessa neljä. Tämä cytoband kattaa 287 geenejä, ja suhtautuu HOXB geeni klusterin lukien kolme geeniä (HOXB2, HOXB4 ja HOXB7) kanssa limittäin 40 HOXB2 korreloi geenien. Huomaa, että kolme geeniä ovat molemmat samassa geeniperheen ja sama genominen sijainti, joka voi osoittaa merkittäviä biologisia vastaavuutta näiden geenien. Käyttäjät voivat löytää puuttuvat arvot useiden geenien ”Kromosomi” geeni sarjaa, koska puutteesta transkriptin merkintä sisällä NCBI Reference Sequence (RefSeq) vapautuminen sisältyvät UCSC genomiin selaimessa tai vanhentuneita geenin symboleja. Tämä ilmiö tapahtuu myös muiden 7 luokat luokkien.

Differentially denaturoidulla geeni sarjoihin koulutusjakson

tarkastella systeeminen muutos biologisen signalointia tai toiminnot, jotka liittyvät HOXB2 tai muihin HOX perhe geenejä, tutkimme seuraavanlaista geenin asettaa havainnollistaa toiminnallista löytö käyttämällä CMS työkaluja. HOXB13, HOX perheenjäsen asuu klusterin HOXB2 ja esittää samanlaisen metylaatiokuvion kuin HOXB2. HOXB13, on myös jäsen ”androgeenin välittämän reitin”, kuten on esitetty kuviossa 5. Se osoittaa selvä hypermetylaation kuvio kesken rinta- kasvaimia, mutta ei rintasyövän solulinjat ja kohdun limakalvon syöpien. Erityisesti erillisten hypermetylaation mallia BRCA1, SNURF, GMTM2, NROB1, CDK11B, LATS2, HRAS, MAPK3, RPS6KA3 ja EGR1 rajata klusterin metylaatiostatuksen rintojen kasvain (ei solulinjojen), yhdessä HOXB13.

Euroopan ”androgeenin välittämän Signaling” geeni sarja, joka sisältää HOX klusteri geenejä valittiin esimerkkinä. Useita geenejä sisällä sininen viiva laatikon hypermetyloitunut rintojen kasvaimia verrattuna normaaleihin kudoksiin, kun taas toiset eivät osoita merkittävää eroa. Endometriumin näytteitä, ei merkittävää eroa ei todettu mitään geenin välillä kasvainten ja normaalit.

Myös verrattuna metylaatio profiileja tamoksifeenin vastustuskykyisiä geenejä [22], ja tunnistettiin useita hypermetylaation geenien rinta- kasvaimia, kuten ACTA1, ISG15, PTK6 ja SEPHS2 (kuvio 1 E). Useimmat heistä eivät osoittaneet merkittäviä eroja endometriumin näytteissä.

visualisointi DNA: n metylaatio yhdessä histonimodifikaation tietojen

Kätevä URL-linkki UCSC avaa nykyinen genominen alue UCSC genomissa selain käyttäjille, jotka haluavat katsella muiden genomisten data (alhaalla oikealla perimän katsottuna kuvio 1 D). Vaihtoehtoisesti käyttäjä voi valita jopa neljä intensiteetti kappaleita ja katsella niitä kappaleita yhdessä muiden oletus raidat UCSC genomin selaimen.

Esimerkiksi DLC1 geeni raportoitu olevan kohonnut DNA metylaatio sen transkription aloituskohdasta (TSS ) alue, kun taas vähentynyt histonimodifikaation vuonna H3K4me1, H3K4me3 ja H3K27ac klo TSS alueella [4]. Käyttäjät voivat kirjoittaa DLC1 genomisessa näkymä verkkosivun, ja visualisoidaan TSS alue (CHR 8: 13,033,864-13,035,942) napsauttamalla ”zoom in” ja ”siirtää” painikkeita. Voimme saada kokonaisvaikutelmaa että rintojen kasvaimia hypermetyloitunut suhteessa rintojen normaalit, vaikka kohdun limakalvon kasvaimet osoita eroa suhteessa kohdun limakalvon normaalit. Käyttäjät voivat poimia 4 näytettä satunnaisesti merkitsemällä valintaruutu oikealla puolella verkkosivun rintasyövän näytteitä (esim brn80, brt22, brt69 ja brt37), ja sitten ”visualisoida valitut rivit UCSC Genome Browser painike” in oikeassa alareunassa verkkosivun, avata UCSC verkkosivun. Verrata histonimodifikaation kappaleita, käyttäjien täytyy valita ”täysi” jokaisen mukautettuja radan ja Broad histoni kappaleita. Histoni muutos raitoja (kuva 6) ovat sopusoinnussa edellisessä raportissa [4] Vaikka nämä tiedot eivät saa olla peräisin rintasyöpään. Muokattuja kappaleita (DNA: n metylaatio) rintasyövistä on lisääntynyt metylaatio (samanlainen kuin edelliset havainnot), jossa poikkeuksena (3 rd kappaleen brt22), joka osoittaa potilaan erityisiä kuvioita (kuvio 6A). Ei ole yllättävää, ei ollut kasvanut metylaatio löytynyt endometriumin näytteistä (kuvio 6B).

TSS alue DLC1 käytetään esimerkkinä. 4 näytettä valittiin sattumanvaraisesti merkitsemällä valintaruutu oikealla puolella verkkosivun rintasyövän näytteitä (esim brn80, brt22, brt69 ja brt37). ”Täyttä” vaihtoehto jokaiselle mukautettuja radan ja Broad histoni raidat valittiin vertailussa DNA: n metylaation ja histonimodifikaation markkaa. Samanlaisia ​​tuloksia saatiin edellisessä raportissa [4]. Poikkeuksena (3

rd track, brt22) todettiin, joka osoittaa potilaan tiettyjä malleja (A); ja ei ollut lisääntynyt metylaatio löytynyt endometriumin näytteistä (B).

Keskustelu

Meidän tutkimuksissa HOXB2 käytettiin esimerkkinä selvittää biologisesti merkittävää tietoa käyttämällä CMS . Tämä johtuu siitä, HOXB2 löydettiin säätelijänä kasvaimen kasvua rintasyövän [23]. Mielenkiintoista on, löysimme HOXB2 on hypermetyloitunut kohdun limakalvon normaaleissa kudoksissa verrattuna kohdun limakalvon kasvaimia (kuvio 3B). Aiemmissa tutkimuksessa HOXB2 raportoitiin olevan tärkeitä kohdun limakalvon normaaleissa soluissa [24]. Lisäksi HOXB2, HOXB4 ja HOXB7 yhdessä osoittivat keskeinen toiminto keuhkosyövässä [25]. Tutkimuksessamme olemme myös havainneet, että nämä 3-geenit korreloivat niiden metylaatio profiileja. Tämä saattaisi viitata siihen, että nämä kolme geenit toimivat yhdessä rinta- ja kohdun limakalvon syöpiä. Lisäksi HOXB13 ja BRCA1 ovat kaikki ”androgeenin välittämän reitin” (kuvio 5), ja kaikki todettu hypermetyloitunut rintakasvaimissa kuin normaalien kudosten tutkimuksessamme. Tämä on sopusoinnussa myös aiemman raportin, joka HOXB13 toimii repressorina androgeenireseptorin signalointi eturauhassyövässä, mikä voi vaikuttaa BRCA1 (kofaktori liittyy AR) [26].

On ollut useita epigenetiikka sivustoja saatavilla edellisessä julkaistu raporteissa. Yksi tunnetuimmista on Roadmap Epigenomics Project (REP) (https://www.roadmapepigenomics.org/). Hanke koostuu ryhmä erilaisten tietokantojen, selain /visualisointityökaluja, ja bioinformatiikan työkaluja. Käyttäjät voivat joko tarkastella monenlaisia ​​epigeneettiset tavaramerkeistä selaimen (esim UCSC REP, https://www.epigenomebrowser.org/), tai ladata tiedot yhdestä tietovarantoja (http: //www.ncbi.nlm. nih.gov/epigenomics). Verrattuna CMS, REP on kattavampi sekä tiedot lajikkeen ja johdannainen työkaluja. Kuitenkin CMS on suunniteltu tarjoamaan kliininen kasvain näytteet, ja meillä on tilastollisia menetelmiä nimenomaan genominlaajuisia analyysi ja vertailu näytteistä (kuten DMR havaitseminen ja korreloivat geenien toiminta).

Johtopäätös

tässä tutkimuksessa ehdotimme CMS visualisointiin ja analysointiin metylaation tietokokonaisuuksien syöpiä. Suuri määrä aineistoja kerättiin ja jalostetaan meidän tietokantaan. Useita tilastollisia työkaluja pukea tietojen analysointia. Visualisointi kehitettiin kautta Java-pohjainen web-käyttöliittymän. Hyödyllisiä löydöt tehtiin laaja soveltaminen näissä puitteissa. Suuri aineisto, erilaisia ​​työkaluja ja laaja soveltaminen biologisten ja translaation merkitys tekee tämän kehyksen tehokas ja ainutlaatuinen syövän metylaatio tutkimukseen.

Materiaalit ja menetelmät

kudosnäytteet, solulinja ja MBDCap- seuraavat sivut

Tissue näytteet saatiin osana jatkuvaa työtä luonteenomaiset molekyylitason muutoksia kohdun limakalvon ja rintakarsinoomissa.

ICBP rintasyövän solulinjoissa genominen DNA eristettiin QIAamp DNA Mini Kit ( Qiagen) seuraavasti valmistajan ohjeiden mukaisesti.

Vastaa