PLoS ONE: On toistettavuus TCGA munasarjasyövän MicroRNA Profiles

tiivistelmä

säädeltyyn microRNA (miRNA) lauseke on vakiintunut osa ihmisen syövän. Kuitenkin rooli erityisten miRNA määritettäessä syövän tuloksiin jää epäselväksi. Käyttämällä Level 3 lauseke dataa Cancer Genome Atlas (TCGA) tunnistimme 61 miRNA, jotka liittyvät yleiseen eloonjäämiseen 469 munasarjasyöpiä profiloidaan mikrosirulla (p 0,01). Havaitsimme myös 12 miRNA, jotka liittyvät selviytymisen kun miRNA profiloitiin samalla yksilöiden käyttäen Next Generation Sequencing (miRNA-Seq) (p 0,01). Yllättäen vain 1 miRNA transkriptio liittyy munasarjasyövän selviytymisen molemmissa aineistoja. Meidän analyysit osoittavat, että tämä ristiriita johtuu siitä, että miRNA tasot ilmoittamat näiden alustojen korreloivat huonosti, vaikka korjatut pulmia ominaisia ​​signaalin havaitseminen algoritmeja. Korjaukset vääriä löytö ja microRNA runsaus oli vain vähäinen vaikutus tähän ristiriita. Lisätutkimuksia on perusteltua.

Citation: Wan Y-W, Mach CM, Allen GI, Anderson ML, Liu Z (2014) On toistettavuus TCGA munasarjasyövän MicroRNA Profiilit. PLoS ONE 9 (1): e87782. doi: 10,1371 /journal.pone.0087782

Editor: Amanda Ewart Toland, Ohio State University Medical Center, Yhdysvallat

vastaanotettu 6 marraskuuta, 2013 Hyväksytty lukien: 1. tammikuuta 2014; Julkaistu: 29 tammikuu 2014

Copyright: © 2014 Wan et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukee osittain läpi Collaborative edistysaskeleet Biomedical Computing siemenrahoitus Program Ken Kennedy Institute for Information Technology Rice University tukema John ja Ann Doerr Fund for Computational biolääketieteen ja läpi Center for Computational ja Integratiiviset Biomedical Research siemenrahoitus Program Baylor College of Medicine. GA on myös osittain tukevat NSF DMS-1209017. ZD tukee Houston bioinformatiikan Endowment ja NSF DMS-1263932. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

MikroRNA (miRNA) ovat endogeenisiä RNA-transkriptien, jotka säätelevät erilaisia ​​malleja geenin ilmentymisen [1]. Suurin osa ihmisen miRNA transkriboidaan niin kauan esiasteita kutsutaan pri-miRNA. Vuodesta tumassa, pri-miRNA tehdään useita käsittely tapahtumia, jotka lopulta johtaa sytoplasmisen vapauttaa kypsien transkriptien ~22 nukleotidin pituisia. Aikuinen miRNA katalysoivat translaation esto suoraan sitoutumalla RNA: iden (mRNA: t) ja edistämällä niiden hajoaminen [2]. Viimeaikaiset tiedot osoittavat, että miRNA voi estää käännös riippumatta niiden kyvystä aiheuttaa mRNA: n hajoamisen.

Patterns of miRNA ilmaisun on laajalti profiloitu ihmisen kudoksissa. Nyt on selvää, että säädeltyyn miRNA ilme on piirre monissa eri syöpien, kuten rinta-, munasarja- ja keuhkojen [3] – [5]. Kuitenkin määritetään mekanismeja, joilla yksittäiset miRNA edistävät syövän tuloksia edelleen keskeinen haaste biologit haluavat hyödyntää valtaa. Äskettäin Cancer Genome Atlas Consortium (TCGA) kertoi, että munasarjasyöpiä klusterin erillisiin molekyyli alatyyppeihin perustuu niiden malleja geenin ja mikroRNA ilmaisun [6]. Olemme kuitenkin havainneet hälyttävän johdonmukaisuuden puute välisen microRNA (miRNA) ekspressioprofiileja alunperin käyttämälle TCGA ja myöhemmän profiilin miRNA ilmaisun syntyy tämän ryhmän samasta munasarjasyöpä yksilöt käyttävät miRNA-Seq. Koska nämä havainnot kiistämään taustalla olevat tiedot, ne myös viittaavat siihen, että tieteelliset havainnot perustuvat yksinomaan näihin tietoihin tulee tulkita varoen.

Tulokset

hahmotta- miRNA liittyy munasarjasyöpä elossaololuku , suoritimme univariate Coxin regressioanalyysin avulla Level 3 TCGA miRNA tietoja 469 munasarjasyöpiä profiloitu käyttäen Agilent sirutekniikkaa. Alustava regressioanalyysi puhdistetaan edelleen käyttämällä Benjamini-Hochberg (BH) menettely säätää useita hypoteesin testaamiseen [7]. Huomasimme, että 16 kypsän miRNA liittyvät merkittävästi munasarjasyöpä selviytymisen (FDR 0,01) (kuvio 1A). Näistä miR-505, miR-652 ja miR-551b * osoittaa vahvin yhdistysten. Hazard suhde (HR) laskettu näiden miRNA olivat -1,73, -1,8 ja 9,3, tässä järjestyksessä. Tämä tulos osoittaa, että kukin näistä miRNA potentiaalisesti tärkeä rooli päätettäessä munasarjasyövän selviytymisen.

P-arvon kuvaajia yhden muuttujan Coxin regressio MikroRNA liittyy munasarjasyövän selviytymisen tunnistetaan mikrosirulla (A) tai miRNA-Seq (B) data. P-arvo 0,01 (yhtenäinen viiva). False löytö määrä (FDR) 0,1 (pisteviiva). Molemmissa A B, siniset pisteet osoittavat miRNA liittyy selviytymisen miRNA array, kun taas punaiset pisteet osoittavat miRNA liittyy selviytymisen miR-Seq. Green tähdet ovat miRNA liittyy selviytymisen molemmissa aineistoja. (C) prosenttiosuus päällekkäisiä miRNA välillä jono ja NGS seuraavissa alustan eri raja-arvon mukaan Cox p-arvot, BH säädetty FDR, ja Storey q-arvoja.

Validoida Näiden havaintojen me seuraavaksi kuulustellut toinen aineisto on miRNA ilmaisun syntyy samasta munasarjasyöpä näytteitä käyttäen Next Generation Sequencing (miRNA-Seq). TCGA munasarjasyöpä hanke on ainutlaatuinen, että miRNA ilmentyminen on profiloitu käyttäen sekä miRNA array ja miRNA-Seq. Nämä teknisesti erillisiä alustat luovat ainutlaatuisen mahdollisuuden vahvistaa keksintöjä jollakin aineisto vasten. Ihannetapauksessa saadut tulokset tulisi korreloida hyvin. Käyttämällä Cox Proportional vaarat analyysi, huomasimme, että 4 miRNA selostukset liittyy selviytymisen kun miRNA profiloitiin munasarjojen syöpään miRNA-Seq samassa kohdassa FDR tasolle (kuvio 1 B). Ei ole päällekkäisiä saadut tulokset näillä alustoilla, vaikka molemmat aineistot kertyi samasta näytteistä.

Voit selvittää microarray ja Next Gen alustat antavat enemmän johdonmukaisia ​​tuloksia, kun analysoidaan käyttäen rento kynnys, vähensimme p-kynnysarvo käytetään analyyseihin 0,01. Tämä johti enemmän miRNA merkitsevästi yhteydessä potilaan selviytymistä molemmissa aineistoja. Esimerkiksi tunnistimme 61 miRNA tiedoista muodostettu käyttäen jono alustalla. Kuitenkin riskisuhteita arvioitu 12 miRNA identifioitu miRNA-Seq tiedot ovat hyvin lähellä 1.0. Vain miR-652 liittyy selviytymisen sekä miRNA-Seq ja mikrosirujen aineistoja. Korjaa useita hypoteesin testaukseen, sopeutimme Cox malli p-arvoja Benjamini-Hochberg menettely [7]. Suoritettuaan nämä analyysit, ei miRNA korreloivat selviytymistä sekä aineistojen kun väärä löytö määrä asetettiin arvoon 10%.

Voit selvittää, onko valinta usean hypoteesin mukauttamismenettely vaikuttaa näihin tuloksiin, me uudelleen analysoitu TCGA tietoja käyttämällä vaihtoehtoista q-arvon arviointi menettely [8]. Lisäksi olemme laskettu prosenttiosuus päällekkäin miRNA eri FDR tai p-arvo cut-off. Tuloksemme osoittavat, että rajoitettu määrä päällekkäisiä miRNA näiden alustojen välillä on riippumaton valinta useiden hypoteesin säätö menettelyyn tai cut-off raja-arvoja (kuvio 1 C).

Valaistaan ​​mahdollisia syitä tähän odottamattomaan ristiriita, me tutki toistettavuus miRNA ilmaisun välillä TCGA tiedostoja, jotka kuvaavat näitä tietoja. Pearsonin korrelaatiokertoimet (r) laskettiin kullekin 359 ihmisen kypsän miRNA joille Level 3 ekspressiotietojen oli saatavilla sekä miRNA-Seq ja mikrosirujen tietokantoja. Huomasimme, että korrelaatiokertoimet tasoilla yksittäisten miRNA ilmoittamien kunkin tekniikalla vaihtelivat suuresti. Esimerkiksi miR-505 on miRNA eniten vankasti liittyvän potilaiden hoitotuloksiin meidän analyyseja miRNA array data (HR = -1,7, p 9e-5). Kuitenkin tarkasteltuna sekvensointia tietojen riskisuhde mir-505 oli 0,998 (p = 0,03). Tasot miR-505 mitattuna miRNA-array ja miRNA-Seq tiedot korreloivat vain vähän (r = 0,59) (kuvio 2B). Poikkeavuudet havaittiin myös useita muita miRNA, jotka on aiemmin liitetty munasarjasyövän, kuten miR-143 [9]. Korrelaatiokerroin miR-143 meidän analyyseissä oli 0,39 (kuvio 2C). Toinen miRNA hyvin tutkittu munasarjasyövän on miR-141, joka on aikaisemmin raportoitu kohdistaa p38a sekä porrastaa oksidatiivisen stressin vastaus [10], [11]. Kuitenkin korrelaatio tasojen miR-141 TCGA microarray ja miRNA-Seq ekspressiotietojen on vain 0,32 (kuvio 2D). Kaiken kaikkiaan olemme havainneet, että korrelaatiokertoimet ~72% of miRNA profiloitu molemmat aineistot olivat ≤0.5 (kuvio 3A, 3C), mikä osoittaa, huono toistettavuus. Vain 22%: n mRNA: iden mitattu Agilent microarray ja Illumina HiSeq samoja munasarjasyöpä näytteet korreloivat huonosti (r≤0.5, kuvio 3B, 3C). Siten ero raportoimme täällä näyttää olevan rajoitettu TCGA miRNA aineisto.

(A) miR-98, (B) miR-505 (C) miR-143 ja (D) miR-141.

(A) Histogrammi korrelaatiokertoimet yksittäisten miRNA mitattuna miRNA-Seq ja miRNA array. (B) Histogrammi Korrelaatiokertoimet mRNA: iden profiloidaan Illumina HiSeq ja mRNA array. (C) Empiirinen kertymäfunktio (ECDF) välisen korrelaation array ja sekvensointia varten miRNA (musta), suodatetaan miRNA (väri) ja mRNA (harmaa) mittaukset. Lähes 72% miRNA osoittavat korrelaatiokertoimeksi ≤0.5 taas 22% RNA: iden on korrelaatiokerroin ≤0.5. Kun suodatettu perustuu ilmaisun tasolla, prosenttiosuus miRNA kanssa korrelaatio ≤0.5 kyllästetty 56%.

Yksi mahdollinen syy huono toistettavuus voi olla signaali havainnointialgoritmin käytetään ilmoittamaan tasojen miRNA ilmaisua. Taso 3 TCGA miRNA tiedot esitetään kahdessa muodossa. Ensimmäinen, otsikoitu ”Kvantifiointi Data”, kertoo tasot yksittäisten ihmisten miRNA. Kuitenkin yksi eduista miRNA-sekvenssi on se, että transkriptit noutaa tätä tekniikkaa voidaan tarkasti kuvata. Toinen tiedosto Merkinnällä ”Isoformi Data,” on myös vapauttaa TCGA. Tämä tiedosto raportit lukea laskee selostukset niiden genomista sijainti. Osana tätä tiedostoa, selostukset tunnistetaan joko kypsä miRNA miRNA * (3p käsivarret ihmisen miRNA), varsi-silmukka transkriptin tai esiaste. Työskennellessään kautta tiedot, saimme tietää, että miRNA tasot raportoitu TCGA kvantifiointiin tiedosto kuuluu lukea laskee miRNA esiasteita sekä kypsä miRNA. koska miRNA esiasteet ovat tällä hetkellä ajatellaan puuttuvan biologinen aktiivisuus, sisällyttäminen esiasteiden kanssa laskee kypsä miRNA voi hämmentää selviytymisen analyysit. tämän kysymyksen, me haetaan lukea laskee kypsä miRNA vain isoformivyöhykkeet tiedosto ja toistetaan analyysimme. kuitenkin osuus miRNA korrelaatiokertoimet ≤0.5 pysyi peräti 71% käytöstä huolimatta tämän tarkemmin määritelty tietoa.

toinen mahdollinen selitys havaittu ero saattaa olla, että korrelaatioita toimenpiteiden miRNA ilmaisun riippuu siitä, kuinka usein yksittäisiä miRNA selostukset ilmaistaan. Jos näin on, harvoin ilmaistu miRNA voidaan ilmoittaa yhden tai molempien alustojen käytetään profiloitua miRNA ilmaisun satunnaisesti tai epätarkasti. Tutustua hypoteesin, me lasketaan uudelleen korrelaatiokertoimet kullekin miRNA tunnistetaan molemmille alustoille jälkeen lukuun ottamatta transkriptiona, miRNA-Seq aineisto, joiden luku- määrä on alle 5. Tämä vähensi erillisiä miRNA käytettävissä analyysi miRNA- seq datatiedosto 705 380. kuitenkin osuus miRNA kanssa korrelaatiokertoimet ≤0.5 myös laski 72%: sta 56%. Samoin poistamalla huonosti ilmaistu selostukset varastoalueelta mRNA profiloidaan Illumina HiSeq vähentää osuus mRNA: iden, joiden korrelaatiokertoimet ≤0.5 22%: sta 20%. Nämä havainnot osoittavat, että ongelmat havaitseminen harvoin ilmaistaan ​​miRNA voi vaikuttaa kykyä tai toisen tai molempien alustojen luotettavasti ilmoittamaan miRNA ilme. Kuitenkin se, että yli puolet miRNA selostukset oli vielä korrelaatiokertoimet ≤0.5 myös korjatut tämän asian ilmaisee, että huonosti ilmaistu selostukset eivät ole yksin vastuussa ristiriitainen malleja miRNA ilmentymisen ilmoittama kaksi tasoa.

tutkia tätä asiaa syvemmin, laskimme välillä log2 transformoitujen ekspressiotasoja kaikista MikroRNA kahden aineistoja. Olemme myös kehittäneet algoritmin, joka antoi meille mahdollisuuden vaihdella kynnyksen ilmaisun hyväksyttävää sisällyttämistä analysoitavaksi minimiarvoa (0) keskimääräiseen log2 transformoitu ilmentymistason kaikissa selostukset. Jokaista kynnys, me vain harkita MikroRNA ilmaistaan ​​kynnyksen yläpuolella ja recomputed korrelaatio näiden alustojen. Tämä analyysi osoittaa, että poissulkeminen miRNA selostukset ilmaisi harvemmin kuin keskimääräinen vain hieman parantaa yleistä korrelaatio näiden alustojen käytetään profiloitua miRNA ilmaisu (kuvio 3C). Kuten on esitetty graafisesti, olemme havainneet, että 71%: n miRNA osoittaa korrelaatio on vähemmän kuin 0,5 ilman suodatusta. Hyödyntämällä ilmaus tasolle suodatin kuvatulla, huomasimme, että osuus selostukset kanssa korrelaatiokertoimet poikki kahden alustan kyllästetty 56%. Tämä on edelleen huomattavasti korkeampi kuin 22% havaitaan mRNA: n ilmentymisen profilointiin järjestelmiä.

Keskustelu

Paljon meidän yllätys, meidän analyysit osoittavat, että MikroRNA liittyy selviytyminen munasarjasyövän riippuvat suuresti siitä, näytteet profiloitu jonka TCGA käyttämällä mikrosiru tai miRNA-Seq. Meidän analyysit osoittavat, että tämä ristiriita on olemassa, koska miRNA-Seq ja mikrosirujen ovat tuottaneet hyvin erilaisia ​​profiileja miRNA ilmaisun, vaikka tieto pohjautuu samaan munasarjasyöpä yksilöitä. Meillä ei tällä hetkellä ole selkeää selitystä sille, miksi miRNA ekspressioprofiileja raportoimat TCGA ovat ristiriitainen. Kuitenkin ymmärtää tämä ristiriita on viime kädessä tärkeää tunnistaa mikä miRNA mahdolliset ovat tärkeitä määritettäessä munasarjasyöpä tuloksia.

Erilaisia ​​DNA-siru tekniikoita on aiemmin validoitu tutkijat tutkimalla sisällä alustan ja cross-platform toistettavuus [ ,,,0],12] – [14]. Spearmanin korrelaatiokertoimet raportoitu näissä tutkimuksissa vaihtelevat ,59-+0,94 keskiarvon ollessa 0,82. Nämä tulokset ovat samanlaisia ​​kuin mitä olemme havaittu korrelaatioita malleja geenin ilmentymisen profiloituja käyttää mikrosirujen ja Illumina HiSeq alustojen jonka TCGA. Sekä miRNA-Seq ja mikrosirujen teknologioita liittyy useita teknisiä rajoituksia, jotka saattavat selittää erot olemme havainneet. Esimerkiksi ristiinhybridisoitumisen on hyvin tunnustettu ongelma, joka voi vähentää signaali spesifisyys kun profilointi RNA-transkriptien microarray [15]. Kuitenkin on epätodennäköistä, että ristiinhybridisoitumisen on ensisijainen syy ristiriita havaitsimme, koska määrä selostukset korreloi selviytymisen joukko on suurempi kuin useita liittyy selviytymisen miRNA-Seq. Yksi vaihtoehtoinen selitys voisi olla, että signaali louhinta käytetty algoritmi analysoida miRNA-Seq tiedot eivät välttämättä raportoi miRNA tasoilla. Yleensä miRNA-Seq mahdollistaa tarkan transkriptio kartoituksen paljon enemmän luottamusta. Signaali louhinta algoritmi nykyisin käyttävät TCGA ilmoittaa miRNA tasolle sisältää luku- määrä sekä kypsä miRNA ja sen vastaava esiaste. Meidän analyysit osoittavat, että esiasteiden osuus alle 1% koko miRNA laskee vuonna TCGA isoformin tiedosto. Tämä heijastaa todennäköisesti käytön kokofraktionoitiin RNA valmistaa kirjastoja miRNA-Seq [5]. Siten niiden sisällyttäminen tai syrjäytymiseen analyysit TCGA aineisto todennäköisesti ole juurikaan vaikutusta, joka miRNA liittyy munasarjasyöpä säilymiseen.

Yhdessä nämä havainnot korostavat kiireellistä tarvetta hyvin määritellyt algoritmeja signaalien käsittelemiseksi tuottamat miRNA-Seq ja transkription profilointiin alustoille. Käsityksemme on, että samat analyysit on suorittanut TCGA muiden syöpien, kuten paksusuoli-, rinta- ja keuhkosyöpä [16] – [18]. Koska miRNA ilmentymistä näissä muissa syövissä ei ole profiloitu microarray, ei ole mahdollista toistaa analyyseihin onko ero me raportoimme on havaittu muissa syövissä. Lopulta, johdonmukainen ja luotettava genomista tietoa on kriittinen rakentaa kokeellisia hypoteeseja ja saavuttaa täyden potentiaalin TCGA. Havaintomme tunnistaa tärkeän vaara, josta tutkijoiden olisi oltava tietoisia, koska he käyttävät TCGA miRNA data tutkia munasarjasyöpä. Lyhyellä aikavälillä, tieto tästä vaarasta korostaa tarvetta vahvistaa havaintojen kanssa yhden tai molempien TCGA miRNA aineistoja. Kuitenkin pitkällä aikavälillä, ratkaisu tähän ristiriita on tärkeää määritettäessä tehokkain alustan ja signaalin louhinta algoritmit profilointiin miRNA ilmentymisen osana suuren mittakaavan genominen profilointi pyrkimyksiä.

Materiaalit ja menetelmät

Gene ja microRNA Expression data

Level 3 tiedot dokumentointia malleja geenin lauseke 296 munasarjasyöpä yksilöitä profiloitu käyttäen Agilent G4502A paneelit ja Illumina HiSeq olivat ladata TCGA datan portaalin. Taso 3 microRNA ekspressiotietojen myös noutaa 469 munasarjasyöpä yksilöitä profiloitu käyttäen Agilent 4X15k array ja miRNA-Seq. Taso 3 miRNA tietojen profiloidaan miRNA-Seq haettiin sekä miRNA määrällisen ja isoformin tiedostoja saatavilla TCGA data portaalin kanssa metatiedostojen merkitsemiseksi kukin aineisto. Lupaa käyttää kaikki tiedot saatiin Data Access komitea National Center for Biotechnology Information genotyypit ja Fenotyypit Database (dbGAP) National Institutes of Health.

Survival Analyysit

Koodattu elossaololuku data uutettiin TCGA kliiniset tiedot tiedostoa. Coxin suhteellisen vaarat mallia käytettiin arvioimaan yhdistyksen tasojen yksittäisten miRNA. Elossaololuku laskettiin kertaa kuukausiin kulunut päivämäärästä diagnosointiin saakka viimeisimmän kontakti.

TILASTOANALYYSI

Spearmanin rho korrelaatiokertoimet, histogrammit, ja empiirinen kertymäfunktio laskettiin ja piirretty kunkin miRNA ja geeniä käyttäen r. Sekvensointitiedot log-muunnettiin piirtämistä. Sekä suoria luku- määrä ja määrä normalisoidaan mukaan miljoonia miRNA tutkittiin osana analyysejä. Kaikki analyysit suoritettiin käyttäen sekä raaka ja normalisoitu luku- määrä ilmoitetaan osana TCGA miRNA-Seq aineistoja.

Kiitokset

Kirjoittajat kiitollisena tunnustaa tiedonannon David Wheeler, Rehan Akban, Gordon Robertson ja Andy Chu koskevat TCGA miRNA tietojen analysointi algoritmien.

Vastaa