PLoS ONE: dbCerEx: Web-pohjainen tietokanta varten Analyysi kohdunkaulasyövän Transcriptomes

tiivistelmä

Background

Kohdunkaulan syövän sijoittui toiseksi eniten vaarallisia sairauksia naisilla maailmanlaajuisesti. Viimeisten kahden vuosikymmenen aikana, mikrosirujen tekniikoita on sovellettu tutkia geenien maligniteetti edistystä. Kuitenkin, useimmissa julkaistu microarray tutkimuksia, vain muutamia geenejä on raportoitu jättää melko suuren määrän dataa käyttämättä. Myös RNA-Seq data on tullut standardi transcriptome analyysia ja on yleisesti käytetty syövän tutkimuksiin. On kasvava kysyntä työkalu auttaa kokeellisen tutkijat, jotka haluavat tutkia kohdunkaulan syövän geeniterapia, mutta ei ole tietokoneella osaamista käyttää ja analysoida suuren suoritustehon geeniekspressiota tiedot.

Kuvaus

Euroopan dbCerEx tietokanta on suunniteltu hakea ja käsitellä geenien ilmentyminen tietoja kohdunkaulan syövän näytteistä. Se sisältää genomin laaja ekspressioprofiilit kohdunkaulasyövän näytteitä, sekä web-apuohjelma klusterin geenejä vastaava ilmaisu kuvioita. Tämä ominaisuus auttaa tutkijoita tehdä lisätutkimuksia paljastaa uutta geeniä toimintoja.

Johtopäätös

dbCerEx tietokanta on vapaasti käytettävissä ei-kaupalliseen käyttöön https://128.135.207.10/dbCerEx/, ja päivitetään ja integroida enemmän ominaisuuksia tarpeen mukaan.

Citation: Zhou L, Zheng W, Luo M, Feng J, Jin Z, Wang Y, et al. (2014) dbCerEx: Web-pohjainen tietokanta varten Analyysi kohdunkaulasyövän Transcriptomes. PLoS ONE 9 (6): e99834. doi: 10,1371 /journal.pone.0099834

Editor: I. Kuningas Jordan, Georgia Institute of Technology, Yhdysvallat

vastaanotettu: 12 marraskuu 2013; Hyväksytty: 19. toukokuuta 2014; Julkaistu: 11 kesäkuu 2014

Copyright: © 2014 Zhou et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus tukee National Natural Science perustaa Kiinan (Ohjelmanro 31202013), Specialized Research Fund tohtorikoulutuskeskukseen of Higher Education of China (Program Ei 20120146120007), perustutkimus rahastoja Keski yliopistot (Program No.2011QC075). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kaupallinen yritys (Yichang Humanwell Pharmaceutical Co., Ltd,), sekä mahdolliset muut työllisyyttä, konsultointi, patentit, tuotteiden kehittämiseen tai kaupan tuotteet jne, ovat ilmoittaneet, etteivät ole kilpailevia intressejä ja taloudellisia tietoja. Tämä ei muuta tekijöiden noudattaminen PLoS One politiikkaa jakaa tietoja ja materiaaleja.

Johdanto

Kohdunkaulan syöpien osuus toiseksi eniten gynekologinen syöpä kuolema tapauksia maailmanlaajuisesti, ja tämä tilanne on pahempi kehitysmaissa takia riittämätön järjestäytyneen seulontaohjelmien. Uskotaan, että ihmisen papilloomavirus (HPV) infektiot ovat pääsyitä invasiivisen kohdunkaulan syövän [1].

Koko ta- genomin ilmaisun profilointi on mullistanut tavalla me tutkimme tautien ja perusbiologian. Vuodesta 1997 lähtien julkaissut useita tuloksia, jotka perustuvat analyysiin geenin ilmentymisen microarray data on kasvanut 30: stä yli 5000 julkaisua vuodessa [2]. DNA-siru tekniikat tähtäävät samanaikaiseen mittaukseen ilmaisun tuhansien geenien yhdessä ainoassa kokeessa. Viime vuosina tämä tekniikka on helpottanut paremmin ymmärtämään monimutkaisia ​​ja heterogeenisiä molekyyliominaisuudet syöpien ja auttoi parantamaan hoitoa syöpiä. Esimerkiksi HOXC10 geeni ensin tunnistettiin kuuluvan 171 merkittävästi ylöspäin geenien kohdunkaulan okasolusyöpää (SCC) suhteessa normaaliin kohdunkaula näytteitä DNA-siru, joka myöhemmin tunnistettiin keskeisenä välittäjänä invaasion kohdunkaulan syövän [3]. Arkistointiin RNA-näytteet 25 potilasta hybridisoitiin Stanford microarray-sirujen rakentaa seitsemän geenin pisteytysjärjestelmä [4]. Tämä geeniekspressiomalli voisi auttaa tunnistamaan potilaita, joilla kohdunkaulansyöpä, jotka voidaan hoitaa sädehoitoa yksin. Konkreettisena ilmentymänä profiilit kandidaattigeenien valittiin tunnistamaan historiallisia alatyyppejä kohdunkaulan syöpä [5]. Lisäksi lukuisat ehdokas biomarkkereita ja hoitotavoitteet on tunnistettu muita syöpiä.

Kuitenkin useimpien julkaistujen microarray tutkimuksia, vain alaryhmiä geenien on raportoitu osoittaa kirjoittajien hypoteesi. Täydellinen microarray aineistot tallennetaan epäjärjestelmällisellä tavalla, ja hyödyllinen vain niille, joilla on laskennallisen asiantuntemusta. Myös RNA-Seq data on tullut standardi transcriptome analyysia ja on yleisesti käytetty syövän tutkimuksiin. Vaikka useimpien kokeellisten tutkijoiden, siellä myös pysyvät vaikeuksia hyödyntää näitä syövän microarray tietokantoihin ja RNA-Seq data ratkaista biologisia kysymyksiä. Jos esimerkiksi yksi uusi geeni hänellä korreloi (positiivinen tai negatiivinen) ekspressiokuviota kanssa apoptoosin liittyvän geenin, se tarkoittaa, että ne voivat jakaa saman sääntelymekanismi, joka voisi tarjota mahdollisuudet tutkimuksen ehdotuksen uuden geenin.

Tässä esittelemme dbCerEx, tietokanta geeniekspressioprofiilien tuotetaan DNA-siru kokeita ja RNA-Seq data. Tietokanta on varustettu integroitu web-pohjainen apuohjelma, joka on tehnyt tiedoista helposti kohdunkaulan syövän tutkimusyhteisöä. Tämän menetelmän, kokeellinen tutkijat voisivat tunnistaa uusia kohdunkaulan syöpään liittyvät geenit ja tutkia suhteita joukossa.

Rakentaminen ja sisältö

Microarray ja RNA-Seq Data

microarray ilmaisun data (GSE matriisi tiedostot) ja alustan merkintä (GPL-tiedostot) haettiin Gene Expression Omnibus (GEO) tietokanta [6] kautta R [7] /Bioconductor [8] GEOquery ”paketti [9]. RNA-Seq tietoja haettiin Cancer Genome Atlas (TCGA) Data portaali [10], joka sisältää kliiniset tiedot, genomin kartoitus tiedot ja korkeatasoinen sekvenssianalyysi kasvain genomien. Aineisto sitten log (base 2) muunnettava ja mediaani keskitetty. Välttämiseksi laskennallinen virhe laskennan aikana, rivi, joka sisälsi ”NA” arvo olisi jättää pois.

Kokeet käsitelty erilaisilla alustoilla (taulukko 1). Jotta ekspressiotietojen haettavissa riippumatta alustoja, koettimet uudelleenkartoitettava virallisten geenin symboleita. Sen sijaan, että geenin symboli tehtävän tietoa, jotkut GPL-tiedostot annetaan vain NCBI GenBank [11], tai NCBI Refseq [12] numeroilla kartoitus koettimia. Voit ratkaista tämän ongelman ”gene2refseq” ja ”gene2accesion” tiedostot haettiin NCBI FTP-palvelimen kautta ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/. Perl-skripti käytettiin kartoittamaan geenin symboleja näihin GenBank tai RefSeq numeroilla, ja lopulta microarray antureista. Geeniekspressiota tasainen tiedostot tallentaa myöhempää päästä sisään.

Predefined Gene Set

Yksi tärkeä ominaisuus tämän tietokanta on, että sen avulla käyttäjät voivat etsiä vastaavia geenin ehdokkaita geenien he opiskelevat joka perustuu ilmentymiskuviot. Vedoten tätä menetelmää, tutkijat voivat löytää mekanismeja näistä geeneistä, jotka saattavat tulla lupaava lähestymistapa löytämässä uuden geenin toiminta. Geeni asettaa ennalta tietokannoissa haettiin eri lähteistä ja jakaa kahteen pääryhmään: Gene ontologia (GO) [19] ja Pathway. Kuten taulukosta 2, GO sarja on Biological prosessi, Molecular toiminnot ja Cellular Component. Vaikka Pathway sarja sisältää Kegg [20], BioCarta (www.biocarta.com) ja REACTOME [21]. Ihmislajin geenin sarjaa käytettiin tässä työssä.

Gene Expression Cluster Analysis

valvomatta hierarkkinen klusterointialgoritmi esiteltiin löytää samanlaisia ​​geenejä perustuen ilmaisun kuvioita. Tämä yritys on käsitelty yhdistämällä etäisyyden mittareita ja sidoksia. Tässä tutkimuksessa etäisyys geenistä x geeni y määritelty 1-r

xy, missä r

xy edustaa Pearson korrelaatio geenin x ja y:

Tietokanta toteutus

dbCerEx tietokanta on web-pohjainen apuohjelma yhdistämällä MySQL (https://www.mysql.com/) tietokannan hallintajärjestelmän [MySQL 5.05.32 (yhteisön Server) kanssa InnoDB moottori]. Etupään web-käyttöliittymä on parantaa java script puitteet, Bootstrap 2.3.1 (https://getbootstrap.com/). PHP [versio 5.3.10] (https://www.php.net/) sovellukset saavat kyselyn käyttäjän, on kytketty tietokanta, johon kerätään tietoja, soita ulkoinen Perl ja R skriptit käsitellä tilastollisia analysoida ja tuottaa HTML näyttävien sivujen tuloksia.

Utility ja keskustelu

dbCerEx tietokanta tarjoaa web-pohjainen käyttöliittymä. Käyttäjät voivat käynnistää haun antamalla yksi kiinnostunut geenin alkuun syöttöruutuun, ja sitten klikkaa ”Etsi” -painiketta. Geeni luettelo näkyy uuden sivun kaikille geenit liittyvät tulon geenin avainsanan. Käyttäjät voivat valita geenin luettelosta kuvauksen mukaisesti tehdä ilmentymisanalyysiä.

Klikkaamalla geeniä, yleinen yhteenveto mukaan lukien täydellinen nimi, alias ja ulkoiset yhteydet kuten HNGC, Entrez Gene, Ensembl. MIM ja GeneCardista tämän geenin näytetään. Samalla sivulla, käyttäjät voivat asettaa parametrit ilmentymisen analyysin kohdunkaulan syöpä. Käyttäjät voivat syöttää kiinnostunut geeni asetetaan käsin tai geenistä settilista kuten Kegg, BioCarta, REACTOME ja Gene ontologia. Käyttäjät voivat valita aineisto päässä käännetty kohdunkaulan syövän ilmaisun aineistoja päässä microarray ja RNASeq, tai vain antaa GEO viitenumero. Klikkaamalla Lähetä kysely -painiketta näytteet valitun aineisto on lueteltu. Käyttäjät voivat valita kaikki tai jotkut asianomaiset näytteitä tehdä ilmentymisanalyysiä.

heatmap näytetään hierarkkinen klusterointi geenien ja näytteet kuvassa (kuva 1). Lisäksi, lämpökarttana joka sisältää merkittävästi positiivisesti tai negatiivisesti korreloi geenien asianomaisten geeni tarjotaan myös (kuvio 2). Pearsonin korrelaatio ja p-arvo näkyy taulukkona oikealla puolella heatmap.

geenejä, joilla on merkittäviä Pearson korrelaatio asianomaisia ​​geeni valittiin piirtää lämpökarttana. Näytteenottajista ovat sarakkeessa, ja tilata ilmentymistä asianomaisten geenin.

Johtopäätös

Esitämme dbCerEx, tietokanta, joka sisältää kohdunkaulan syövän geeniekspressioprofiilien. Lisäksi se tarjoaa uuden apuohjelma geenien ilmentymisen samankaltaisuuden hakua Tietyllä kiinnostunut geenin sarjaa. Uskotaan, että dbCerEx on tehokkaan alustan bioinformatiikan löytö tuo kohdunkaulan syöpä microarray data ja RNA-Seq data, ja analyysi kohdunkaulan syövän tiedeyhteisö saavat helposti ulottuvilla.

saatavuus ja vaatimukset

Euroopan dbCerEx tietokanta sivusto on käytettävissä maksutta verkkosovelluksen: https://128.135.207.10/dbCerEx/.

Vastaa