PLoS ONE: Data samankaltaisuus perustuva strategia meta-analyysi Transkription Profiilit Cancer

tiivistelmä

Background

Tukeva transkription allekirjoitusten syöpä voidaan tunnistaa data samankaltaisuus perustuvia meta-analyysi geeniekspressioprofiilien. Puolueeton tiedon integroinnin ja kuulustelut strategia ei ole aikaisemmin ollut saatavilla.

menetelmät ja havainnot

toteutettu ja suorittaa suuri meta-analyysi rintasyövän geeniekspressioprofiilien 223 aineistot, jotka sisältävät 10581 ihmisen rinta- syöpänäytteissä käyttämällä uutta tietoa samankaltaisuus lähestymistapaa (iteratiivinen korottavat). Syöpä geenien ilmentymisen allekirjoituksia uutettu yksittäisistä aineistoja ryhmittyivät tietojen samankaltaisuus ja yhdistettiin meta-allekirjoitusta toistuvia ja yhdenmukaisia ​​geeniekspressiomalli. Retrospektiivinen eloonjääminen analyysi tehtiin arvioimaan ennusteita romaanin meta-allekirjoituksen päätellä transkription profilointiin tutkimuksista ihmisen rintasyöpä. Validointi ikäluokat koostuu 6011 rintasyöpäpotilaiden 21 eri rintasyöpä aineistoja ja 1110 potilasta, joilla muiden pahanlaatuisten kasvainten (keuhko- ja eturauhassyövän) käytettiin testaamaan luotettavuutta havaintomme. Aikana iteratiivinen Exalt analyysi, 633 allekirjoitusta ryhmiteltiin niiden tietojen samankaltaisuus ja muodostivat 121 allekirjoitusta klustereita. Vuodesta 121 allekirjoitusta klustereita, tunnistimme ainutlaatuisen meta-allekirjoitus (BRmet50), joka perustuu klusterin 11 allekirjoitusten jakamiseen fenotyypin liittyvän erittäin aggressiivinen rintasyöpä. Potilailla, joilla on rintasyöpä, oli merkitsevästi yhteydessä BRmet50 ja sairauksien lopputulos, ja ennustetyöväline voima BRmet50 oli riippumaton yhteisten kliinisten ja patologisten kovariantteja. Lisäksi ennusteen arvioinnissa on BRmet50 ei ollut erityinen rintasyövän, koska se ennusti myös eloonjäämisen eturauhas- ja keuhkosyöpää.

Johtopäätökset

Olemme ottaneet käyttöön uudet tietojen samankaltaisuuden-driven meta -analyysiohjelman strategiaa. Tätä lähestymistapaa käyttäen tunnistimme transkriptionaalisen meta-allekirjoitus (BRmet50) rintasyövän ja ennustetekijöiden suorituskykyä BRmet50 oli vahvaa ja sovellettavissa monilla syöpään potilasryhmissä.

Citation: Qiu Q, Lu P, Xiang Y, Shyr Y, Chen X, Lehmann BD, et ai. (2013) Data Samankaltaisuus perustuva strategia meta-analyysi Transkription Profiilit Cancer. PLoS ONE 8 (1): e54979. doi: 10,1371 /journal.pone.0054979

Editor: Aedín C. Culhane, Harvard School of Public Health, Yhdysvallat

vastaanotettu: toukokuu 29, 2012; Hyväksytty: 22 joulukuu 2012; Julkaistu: 29 tammikuu 2013

Copyright: © 2013 Qiu et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tuettiin osittain Howard Ternin palkinnon National Cancer Institute, National Institutes of Health (CA114033 YY), American Cancer Society toimielinten Research Grant (# IRG-58-009-51 YY) ja Vanderbilt Clinical ja Translational Science palkinnot (CTSA) UL1 RR024975 National Center for Research Resources (NCRR), osa National Institutes of Health (NIH), (CRC1838 YY). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Rintasyöpä on yleisin syöpä naisilla ja toiseksi suurin syy syövän kuolemaan naisten Yhdysvalloissa. Molekyylikerros biomarkkereiden joka voi ennustaa todennäköisyys syövän etenemisen invasiivisia tai etäpesäkkeitä voi opastaa, kuinka aggressiivisesti potilaita hoidetaan aluksi [1]. On olemassa selvä tarve ymmärtää paremmin, miten molekyyliprofiilien liittyvät syöpään fenotyypit ja kliinisiä tuloksia ja uusia syövän biomarkkereita määriteltävissä ja toistettavissa suorituskykyä erilaisissa potilasryhmissä.

käyttöönotto genomin mittakaavan geeniekspressioprofilointi on johtanut määritysohjelman transkription biomarkkerit kutsutaan geenien ilmentyminen allekirjoitukset. Löytö geenien ilmentymisen allekirjoituksia kaikista yksittäisistä hyvin toimiva tutkimus on suhteellisen yksinkertaista. Jotkut allekirjoitukset ovat käyttökelpoisia transkription biomarkkereita luokittelussa potilailla, joilla on merkittävästi erilaiset selviytymisen kannalta: rintasyövän [2], [3]. Esimerkiksi transkription profilointi ensisijainen rintasyöpä on käytetty aiemmin tunnistamiseen 70-geenin allekirjoitus (markkinoidaan MammaPrint mutta tässä nimitystä BRsig70) [3], erilliset 76-geenin allekirjoitus (BRsig76) [2], ja muut ( Oncotype DX [4], [5], TAMR13 [6], Genius [7], GGI [8], PAM50 [9] ja PIK3CAGS278 [10]). Tyypillisiä muita transkription biomarkkerit, sekä BRsig70 ja BRsig76 olivat peräisin koulutus asettaa yhdestä tutkimuksen ja sitten validoitu testi asettaa samalta takautuvan potilasaineistoihin. Kun kohdistuu ulkoisia validointi, useimmat allekirjoituksia voi vain validoitu käyttäen yksi aineisto (NKI295) [11] tai muutama pienempi mittausmuistien jälkikäteen kertynyt näytteitä. Tämä validointi menetelmällä on väistämätöntä rajoitukset tilastollinen voima tai näyte valinta bias. Tämän seurauksena yhteinen heikkous tässä lähestymistavassa on se epäjohdonmukainen ja toistettavuus [12] – [16].

Satoja rintasyövän geeniekspression aineistot talletetaan julkisissa tietokannoissa, meillä on nyt mahdollisuus käyttää näitä tietoja täysitehoisesti ja löytää toistuvat ja luotettava geeniekspressio allekirjoituksia rintasyövän ennustetta ennustaminen. Kuitenkin tunnistaminen ennustetyövälineenä ilmaisun allekirjoituksen avulla meta-analyysi yleisesti saatavilla syövän geeniekspressioprofiilien merkitsee liian vähän mahdollisuuksia. On olemassa useita raportteja meta-analyysi kehyksiä, jotka käyttävät useita rintasyöpä aineistoja rakentaa ja vahvistaa prognostiset luokittelijoiden [7], [17], [18]. Nämä lähestymistavat keskittyvät valitsemalla ennustajia yhdistetyistä opetustiedostoiksi, joko keskimääräistä Cox-tulokset [18], tai ottaen huomioon näytteen molekyyli alatyyppejä [7], [17]. Kuitenkin yksi vastaamattomat kysymys on, miten tunnistaa homogeeninen geeniekspressiotutkimuksissa käyttäen hienostunut ja puolueeton valinta menetelmä [19]. Jotta ekstrapoloimiseksi validoitu ennustetekijöiden allekirjoituksia laajempaa potilasryhmässä, uusi biotilastollisen menetelmiä, joissa käytetään samankaltaisuus perustuva analyysi tarvitaan [20].

Jotta heikkouksia yksittäinen tutkimus-johdettu allekirjoituksia ja luoda uusi strategia hyödyntää paremmin käytettävissä geenien ilmentyminen tietoja riippumattomat tutkimukset, olemme kehittäneet meta-analyysi strategia nimeltään exalt (ilmentymisanalyysiä Tool) [21], [22]. Olennainen piirre Exalt on tietokanta, joka sisältää tuhansia geenin ilmentymisen allekirjoitusten uutettu julkaistuista tutkimuksista, joka mahdollistaa allekirjoitus vertailuja. Tässä tutkimuksessa käytimme exalt iteratiivisesti (iteratiivinen exalt) tekemään tietojen samankaltaisuuden perustuva meta-analyysi ja valottaa transkription allekirjoituksia parannettu ennusteen arvioinnissa rintasyövässä. Olemme osoittaneet, että heterogeeninen allekirjoitusta 223 julkisen aineistot, jotka sisältävät 10581 rintasyöpä näytteitä voitaisiin systemaattisesti järjestävät niiden yhteisten tietojen (eli luontainen yhtäläisyyksiä ja sairauksien fenotyypit) ja kootaan uuden allekirjoituksen tietotyyppi kutsutaan meta-allekirjoitusta. Olemme tunnistaneet erityinen meta-allekirjoitus koostuu 50 geenien (BRmet50), joka on voimakkaasti ennustava syövän ennusteen 6011 syöpäpotilaista 21 eri rintasyöpään aineistojen sekä muiden pahanlaatuisten kasvainten kuten keuhko- ja eturauhassyöpä. Nämä havainnot kuvaavat arvon BRmet50 rintasyövän ennustetta riippumaton hoito muuttujia ja osoittavat, että iteratiivinen exalt on uusi meta-analyysimenetelmä, joka pystyy suorittamaan informatiivinen ja vankka löytyminen meta-allekirjoitusten syöpä.

Tulokset

Extraction of Human Cancer allekirjoituksista

järjestää monimutkaisia ​​transkription tiedot, olemme laatineet hierarkkinen tietorakenne. Ylimmällä tasolla koostuu transkription tutkimuksista, ja kukin transkription tutkimus jaettiin kolmeen tasoon: aineistoja, ryhmiä, ja näytteitä. Tutkimus voi sisältää yhden tai useita tietokokonaisuuksien riippuen sen kokeen suunnittelusta [21]. Vuodesta 56 rintasyöpätutkimuksissa (taulukko S1), olemme keränneet 223 rintasyöpä aineistoja edustavat 10581 rintasyöpä näytteitä. Ensisijainen rintasyöpä näytteitä kussakin aineisto ryhmiteltiin niiden kliinisen määritteitä. Jokainen aineisto sisältyy vähintään kaksi ryhmää, kasvaimen näytteitä eri kliinisten fenotyyppien (kuvio 1 yläpaneeli). Esimerkiksi fenotyypit liittyvät syöpään uusiutunut tai huonon ennusteen kuuluvat kasvaimen kokoa, solmukohtien osallistuminen, laatu, lymphovascular invaasio, p53 tila, BRCA1 mutaatio, BRCA2-mutaatio, estrogeenireseptori (ER), ja ihmisen epidermaalisen kasvutekijän reseptori 2 (HER2) tila [23], [24]. Kaksi tai useampia ryhmiä per aineisto tarvittiin tuottamaan tilastolliseen vertailuun. Kaikkiaan 633 merkittävän geeni luettelot ( ”yksinkertainen allekirjoitukset”) kaikista mahdollisista pareittain ryhmässä vertailut muodostettiin vastaavasti käyttämällä Studentin t-testiä [21]. Kaikki 633 ”yksinkertainen allekirjoitukset” säilytettiin sitten ihmisen syövän allekirjoitus tietokanta (HuCaSigDB), joka on saatavilla verkossa (https://seq.mc.vanderbilt.edu/exalt/) [22]. Tärkeimmät menettelyvaiheet louhinta allekirjoituksia annetaan Methods S1.

työnkulku iteratiivisen Exalt menetelmä sisältää kolme suurta prosesseja. (1) uuttaminen 633 rintasyövän allekirjoituksia. Kaikki pariksi näyte ryhmissä kussakin rintasyöpä aineistot (n = 223) verrattiin perustuvat kaikki mahdolliset kliiniset ja patologinen covariates kuten kasvaimen kokoa, solmukohtien osallistuminen, laatu, merkki tila, lymphovascular invaasio, uusiutuminen, etäpesäke, p53 tila, BRCA1 ja BRCA2 mutaatioita. Studentin t-testi suoritettiin sitten kaikkien pareittain vertailuissa, ja yhteensä 633 rintasyövän allekirjoitusten syntyi ja ladataan tietokantaan (HuCaSigDB). (2) Allekirjoitus klustereita ja luokittelu. Iteratiivinen haku suoritettiin käyttämällä kutakin 633 allekirjoitusten kyselyn (ankkuroitu tai siemenet) allekirjoitusta vastaan ​​HuCaSigDB toistuvasti tunnistaa homologinen allekirjoituksia merkittävää tietoa samankaltaisuutta määritelty korottavat. 121 ulos 633 kyselyn allekirjoitusten löytyy ainakin yksi samanlainen allekirjoittamista HuCaSigDB ja muodostivat 121 klustereita ja loput 512 (singletons) ei pystynyt luomaan klustereita. Kaksi tyypillistä tulokset kuvattu kaavamainen kuvaus merkitty ankkuroitua allekirjoitukset: singleton Sig21 ja klusterin Sig24 lukien 11 allekirjoitusta jäseniä kuten Sig544, Sig128, Sig140 jne Tieto perustuu analyysiin allekirjoituksen fenotyyppien ja koot suoritettiin joukossa 121 allekirjoitusta klustereita. Kahdeksan klusterit oli ilmeinen etäpesäke fenotyyppejä. Kahdeksan klustereita, suurin klusteri ankkuroitu kyselyn allekirjoitus (sig24) valittiin lisäanalyysiä varten. (3) tunnistaminen meta-allekirjoituksen BRmet50. Kaikki 6526 allekirjoitus geenit 11 allekirjoitukset klusterin Sig24 koottiin yhteen muodostaen synteettisen allekirjoitus (BRmet). Geenit sisällä BRmet rankattiin perustuvat toistuvia taajuudella ja konkordanssin differentiaalikaavojen edustaa meta-lämpöä kartalla. Top 50 geenit (BRmet50) edusti riveihin määritettiin 100% toistuva taajuus ja geeniekspressioprofiili yhtäpitävyyttä joukossa 11 allekirjoitukset edustettuina sarakkeisiin. Värit meta-lämpökartassa edustavat suuntaan ero geeniekspressiota tietyn transkription profiilin (punainen ylös, vihreä alas, ja mustat puuttuvaa ottelua). Värin voimakkuutta kuvastaa luottamusta tasot differentiaalikaavojen.

geenien ilmentyminen allekirjoitus ( ”yksinkertainen allekirjoitus”) määrittelemien Exalt on joukko merkittäviä geenien kanssa niiden vastaavien tilastolliset tulokset ja geenien ilmentymisen suunnan koodeja ( ylös tai alas). Jotkut ”yksinkertainen allekirjoitukset” biologisesti liittyvät rintasyövän ennustetta, mutta ne olivat peräisin yksittäisistä transkription profilointiin tutkimuksia ja ovat aivan liian usein alimitoitettu, typistettyjä tai heikkolaatuisia. On rajoituksensa tahansa yksittäisen profilointia tutkimuksessa, johon pieni otoskoko suhteessa suuri määrä potentiaalisia ennustavat, rajoitukset teknologisia, näyte vaihtelua, ja bioinformatiikan tai tilastollinen menetelmä puolueellisuudesta. Perimmäinen olettamus teimme muotoilemisessa tässä lähestymistavassa on, että yksittäiset transkription profilointi Tutkimuksessa ei dekoodaa kokonaista ilmaisua allekirjoitus. Sen sijaan nämä ”yksinkertainen allekirjoitukset” edustavat vain fragmentteja täydellisen ja yhteinen transkription profiili (meta-allekirjoitus).

tunnistaminen Novel Breast Cancer Meta-allekirjoituksen

Oletimme, että meta allekirjoitus parannettu ennusteita voitaisiin löysi data samankaltaisuus perustuvia meta-analyysi transkription profiileja useilta liittyvien tutkimusten toteuttaminen. Exalt analyysi tarjosi perustan ryhmittely tai klusterointi ”yksinkertainen allekirjoitukset” jakaa merkittävää tietoa samankaltaisuutta. Iteratiivinen Exalt prosessi kerätty homologisia allekirjoittanut ”yksinkertaisia ​​allekirjoituksia” ja yhdistelty ne meta-allekirjoituksia (kuva 1 keskimmäinen ja alempi paneeli). Lyhyesti, jokainen rintasyöpä allekirjoitusta verrattiin kaikkien rintasyövän allekirjoitusten HuCaSigDB, ja allekirjoitus pareittain merkittävää samankaltaisuutta ryhmiteltiin. Luontainen suhde pairwise allekirjoitusten ensin määritettiin geeni symboli ottelun ja yhteneväinen suuntaan geenin ilmentymisen muutoksen. Sitten normalisoitu yhteensä identiteetti pisteet laskettiin Q-arvot kaksi allekirjoitusta. Merkittävä yhtäläisyystasolla määritettiin simulaatioanalyysiä [21] kuvatulla tavalla Methods S1.

Me tehdään iteratiivinen exalt analysoi jossa kaikki versus kaikki allekirjoituksen samankaltaisuushakuihin tehtiin. Tarkemmin, kukin 633 ”yksinkertainen allekirjoitukset” päässä HuCaSigDB toimi siemenenä (kutsutaan myös kyselyn tai ankkuroitu allekirjoitus) kyselyn kaikille ”yksinkertainen allekirjoitukset” in HuCaSigDB toistuvasti ja tuoda muiden homologisten allekirjoitukset yhteen niiden yhteisiä osia (eli luontainen yhtäläisyyksiä). Tämä iteratiivinen prosessi ”ryhmitetty” tai ”ryhmittyneet” allekirjoitukset perustuu niiden yhtäläisyyksien (kuva 1 keskimmäinen paneeli). Allekirjoitus pareja, jotka olivat riittävän samankaltaisia ​​(p 0,05) on liitetty yhteen muodostaen klustereita. Sen jälkeen iteratiivinen vertailuja, jokainen siemen allekirjoitus joko jäi yksittäiseksi (eli siemen allekirjoitus, joka itse sovitettu mutta ei vastannut mitään muuta allekirjoitusta) tai muodostettu klusterin muiden allekirjoituksia.

Tämä iteratiivinen Exalt prosessi alkaa 633 siemen allekirjoitukset johtivat 121 allekirjoitusta klustereiden ja 512 singletons (kuva 1 keskimmäinen paneeli). Keskityimme kahdeksan tiettyjä klustereita, sillä kahdeksan siemen allekirjoituksia ja kaikki muut aihekokonaisuuksien allekirjoituksia kunkin kahdeksan selvästi liittyvät syöpäsolujen leviämiseen. Loput 113 klusterit ollut johdonmukaista ja selvää syövän etäpesäkkeiden fenotyyppejä. Kahdeksan etäpesäke liittyvä klustereita, jokainen sisälsi erilaisia ​​päällekkäisiä allekirjoitus jäsenet liittyvät fenotyypit, jotka ovat tunnettuja riskitekijöitä syövän etäpesäkkeiden kuten korkea-asteen kasvaimet, ER-negatiivinen tila, pohjapinta-tyyppisten solujen tyyppi, ja syöpä uusiutumisen. Näistä valitsimme suurin allekirjoituksen klusteri, joka sisälsi 11 etäpesäkkeiden liittyvät allekirjoituksia (kuvio 1 ja taulukko 1) [2], [3], [6], [8], [11], [25] – [29]. Koska jokainen allekirjoitus klusterin johdettiin vertaamalla erittäin aggressiivinen ja vähemmän aggressiivisia rintasyöpiä, tämä vertailu tuotti ”huono-ennuste” geeni allekirjoitus (taulukko 1).

Jokainen 11 allekirjoitusten käsittää useita satoja geenejä. Jotta voitaisiin tunnistaa toistuva ja yhdenmukaisten geeniekspressiomalli Metastasoituneessa allekirjoitus klusteri, kaikki geenit, jotka kuuluivat 11 allekirjoitusta (n = 6526) koottiin synteettinen allekirjoituksen nimetty BRmet. Geenit sisällä BRmet rankattiin perustuvat toistuva taajuus ja suunta differentiaalikaavojen (meta-suunta) kaikkien 11 allekirjoitusta. 100% toistuva taajuus levitettiin valita top 50 geenit meta-allekirjoituksen (BRmet50) (kuvio 1 alempi paneeli). Siten BRmet50 profiilit ovat yhdenmukaisia ​​kaikkien 11 aihekokonaisuuksien yksinkertaisia ​​allekirjoituksia (taulukko 1). BRmet50 geenit edustavat merkittävästi differentiaalisesti ilmentyvien geenien paitsi oman aineistoja vaan myös poikki 11 muut niihin liittyvät aineistot (kuva 1).

Lisäykset varten BRmet50 geenien esitetään taulukossa S3. Vain viisi geenit BRmet50 päällekkäin BRsig70, ja kahdella todettiin yhteistä BRsig76. Useita päällekkäisiä geenien välillä BRmet50 ja kuusi muuta syövän allekirjoituksia (Oncotype DX, TAMR13, Genius, GGI, PAM50, ja PIK3CAGS278) on suhteellisen pieni (1% -27%), mikä viittaa siihen, että BRmet50 on selvä allekirjoitus. Koska BRmet50 pääteltiin klusterin allekirjoitusten vertailla erittäin aggressiivinen ja vähemmän aggressiivisia rintasyöpiä, me ennusti BRmet50 olisi liittyy huono ennusteita rintasyövässä kuten syövän uusiutumisen, etäpesäke, ja kuolema. Yleinen ennuste piirre BRmet50 saattaa olla erilainen kuin BRsig70 /76 (BRmet70 ja BRmet76), koska ne on suunniteltu nimenomaan ennustamaan etäpesäkkeiden alkuvaiheen rintasyöpäpotilailla, joilla imusolmuke-negatiivinen tila [2], [3]. Niinpä huomasimme, että kumpikaan BRsig70 eikä BRsig76 oli täysin verrattavissa BRmet50. Pikemminkin he toimi ennustetekijöiden ohjaus allekirjoitukset tässä tutkimuksessa.

Meta-validointi BRmet50 rintasyövässä

Koska BRmet50 pääteltiin allekirjoituksen klusterin vertaillaan enemmän ja vähemmän aggressiivisia syöpiä, me takautuvasti tutki kyky BRmet50 ennustaa ennusteeseen 21 aineistoja, mukaan lukien 11 itsenäistä validointi aineistoja ei käytetty allekirjoitus Klusterointiprosessia (taulukko 2).

tarkastella vakauden iteratiivinen korottavat menetelmän ja välttää yli istuva yhdeksästä koulutuksen aineistoja, käytimme ”jätä-yksi-out” ristivalidointi strategia päätellä yhdeksän BRmet50 ohjaus allekirjoitusta vastaavan yhdeksän koulutusta aineistoja. Kussakin jättää-one-out tutkimuksessa mukana toimitettu allekirjoitukset pysyi aihekokonaisuuksien. Lisäksi kaikki BRmet50 ohjaus allekirjoitukset ”jätä-yksi-out” -menettelyn jakoivat ydinjoukko 50 geenejä. Sitten testataan nämä ohjaus meta-allekirjoitusta vastaava koulutus aineistoja (taulukko S2) ja totesi, että niiden ennustetekijöiden esitykset olivat yhtä hyviä kuin BRmet50 (taulukko 2). Tiedot viittaavat siihen, että iteratiivinen exalt perustuva klusterointi prosessi on vakaa ja luotettava menetelmä, joka ei vaikuta mihinkään tiettyyn allekirjoitus jäsenen BRmet klusterin.

11 itsenäistä validointi aineistoja käytettiin arvioitaessa BRmet50 ennusteen suorituskykyä. Log-rank kokeita arvioimaan eroja selviytyminen analyysi. P-arvot log-rank joissa verrattiin BRmet50, BRsig70, BRsig76, ja kuusi muuta julkaistu syöpää allekirjoituksia (Oncotype DX, TAMR13, Genius, GGI, PAM50 ja PIK3CAGS278) on koottu (taulukko 2 ja taulukko 3). Jokainen allekirjoitus arvioitiin sen kyky luokitella koehenkilöillä, joilla on rintasyöpä osaksi ”hyvän” ja ”huonon” ennustetekijöiden ryhmiä. Expression arvot kullekin allekirjoitusta haettiin kukin vastaa aineisto, sitten valvomatta hierarkkinen klusterointi suoritettiin käyttäen Spearmanin ja ryhmätyöt määritettiin kussakin aineisto perustuu ensimmäiseen kaksijakoisuus ja klustereiden dendrogrammissa [30]. BRmet50 eron hyvän ja huonon ennustetekijöiden ryhmiä onnistuneesti kaikissa aineistoja (taulukko 2), kun taas BRsig70 ja BRsig76 voinut syrjiä ennustetta ryhmien neljä ja kuusi aineistot vastaavasti. Epäonnistuminen BRsig70 ja BRsig76 ositusta ennustetekijöiden ryhmille nämä aineistot jatkunut jälkeen me luokiteltu uudelleen näytteitä alkuperäistä algoritmeja (esim joko Pearson korrelaatio menetelmä [3] tai uusiutumisen pisteet perustuva menetelmä painotettuun Coxin regressio kerroin arvot [2] ). Näin ollen, nämä tulokset olivat riippumattomia tilastollisia menetelmiä. Samanlaisia ​​tuloksia saatiin myös joukossa kuusi muuta vakiintunut syövän allekirjoituksia, koska mikään niistä voisi syrjiä ennusteen ryhmät kaikissa 11 testissä aineistoja (taulukko 3). Toisena Tunnusluku, laskimme c-indeksi syövän allekirjoitusten 11 validointi aineistoja (taulukko 3), joka on yleistys ala vastaanotin toimii (ROC) käyrä [31]. Prognostisia arvo (c-indeksi) varten BRmet50 ja toinen syöpää allekirjoitukset verrattiin. Mille tahansa testin aineisto, BRmet50 c-indeksi on samanlainen kuin muista syöpää allekirjoitukset, mikä viittaa siihen, että BRmet50 ja muiden syöpää allekirjoitukset tarjoavat vertailukelpoisia ennustetekijöiden tietoja.

Suorituskyky mittaukset BR1042

Kaplan-Meier-analyysi käytettiin havainnollistamaan eri uusiutumisen elinaika BR1042 keskuudessa kolmenlaisia ​​allekirjoitusten lukien BRmet50, yksi BRmet50 ohjaus allekirjoitusta, ja kaksi aiemmin tunnistettu allekirjoitusta (BRsig70 ja BRsig76) (kuva 2). Tulokset osoittavat merkittävää eroa uusiutumisen elinaika välillä hyvän ja huonon ennusteen ryhmät kuin ennustettu aineisto BR1042 mukaan BRmet50 sekä BRmet50 ohjaus allekirjoitus (BRmet [-1042]) päässä leave-one-out prosessi (

p

0,05). Potilailla, joille BRmet50 ennustivat hyvää ennustetta, 10 vuoden korko uusiutumisen vapaa elinaika oli 79% verrattuna vain 47% joukossa, joilla on huono ennuste (kuva 2, ylempi vasen paneeli). Taudin uusiutumisen riski ennustama BRmet50 oli merkitsevästi suurempi potilailla on huono ennuste ryhmä kuin joukossa hyvään ennusteeseen ryhmä. Kuitenkin sama aineisto, ei BRsig70 eikä BRsig76 erottaa merkittävää eroa etäpesäkkeitä elinaika välillä hyvän ja huonon ennustetekijöiden alaryhmien.

Tiedot 108 kasvainten aineisto BR1042 stratifioitiin kahteen ryhmään BRsig70 ja BRsig76 (alhaalla paneelit), ohjaus allekirjoitus (BRmet [-1042]) päässä leave-one-out-menetelmässä tai BRmet50 (ylempi paneeli) geeniekspressioprofiilien. Kussakin selviytyminen juoni, kahdenlaisia ​​uusiutumisen vapaa elinaika verrattiin: huono ennuste ryhmä (musta katkoviiva) ja hyvä ennuste ryhmä (punainen yhtenäinen viiva). Uusiutumisen-vapaa päivissä näkyy x-akselin ja y-akseli esittää todennäköisyys uusiutumisen vapaa elinaika. P

arvot ilmaisevat tilastollista merkitystä elinaika eroja näiden kahden ryhmän.

Suorituskyky BRmet50 (c-indeksi: 0,6573, p

arvo

:

0,002) oli parempi kuin BRsig70 ja BRsig76 (c-indeksi: 0,5839 tai 0,5172, vastaavasti, p-arvo 0,14) tutkittaessa BR1042 aineisto. Tuloksemme osoittavat, että ennusteita on BRmet50 on vankka ja sovellettavissa monilla riippumattomien aineistojen.

Sen arvioimiseksi, onko BRmet50 yhdessä ennuste tulos oli erityinen, me tuotetaan 1000 allekirjoitusta samankokoiset (50 geenejä) käyttäen satunnaisesti valittu geenit ihmisen genomin. Kaikki satunnainen allekirjoitukset testattiin samassa paneelissa 21 testin aineistoja. Sen jälkeen 1000 satunnainen permutaatio geenin allekirjoitusta, p-arvo jakelun (-log p-arvo) kustakin kokeen aineisto tuotettiin, ja p-arvot BRmet50 ja kuusi muuta julkaistu syöpää allekirjoitukset myös piirretty X-akselilla jakelua tonttien (kuviot S2 ja S3).

Vaikka joitakin satunnaisia ​​allekirjoitukset ovat merkittävästi (

p

0,05), joka liittyy rintasyöpään tuloksia eri aineistoja, yhdistykset ovat vahvempia seitsemän rintasyöpä allekirjoitukset yli puolet testin aineistot. Ne hallitsevat tulokset tarjoavat voimassa tilastollista tukea niiden ennustetta merkitystä. Lisäksi huomasimme, että suurin osa p-arvoja BRmet50 olivat kaukana oikealla puolella satunnainen p

arvo jakaumat (kuviot S2 ja S3). Sitten verrataan potilaan tulos yhdistys BRmet50 kuin 1000 satunnainen allekirjoitusten samankokoiset (Kuva S2 ja S3), ja varmistimme, että BRmet50 oli voimakkain yhteys valtaosa ( 95%) satunnainen allekirjoitukset. Siten todennäköisyys saada samaa p-arvot BRmet50 sattumalta samassa testissä aineistot Taulukossa 2 on huomattavan alhainen (

p

0,05).

Ennakoiva voima BRmet50 Is riippumaton yhteisen kliiniset ja patologiset kovariaatit

Koska aineisto BR1141 [6] sisältää 269 potilailla, joilla on rintasyöpä ja koko paneeli yhteisiä kliinisiä ja patologisia covariates testasimme onko yhdistys BRmet50 huonon ennusteen tulos oli riippumaton perustettiin kliiniset ja patologiset kriteerit käyttäen vankka BR1141 aineisto tutkittiin Coxin suhteellisen vaarat malleissa (taulukko 4 ja taulukko S4). Yhdistyksen välillä BRmet50 ja riskin huonosta kliinisen tuloksen oli merkittävä riippumatta kasvaimen koon, imusolmukkeiden tila, tai tamoksifeenihoidon (

p

0,05). Lisäksi BRmet50 voisi eristää kasvaimia väli erilaistumista tai ER-positiivisia osaksi hyvän ja huonon prognostiset alaluokat (riskisuhde oli huono ennuste: 2,5;

p

≤0.001), mutta ei niille, jotka olivat ER-negatiivinen. Kumpikaan BRsig70 eikä BRsig76 kykeni kerrostamiselintä kasvaimia joko hyvä tai huono eriyttäminen missään osajoukko BR1141 paitsi tamoksifeenihoidon alaryhmä (taulukko 4). Koska BR1141 oli yksi koulutuksen aineistoja, myös testanneet ”jätä-yksi-out” BRmet50 ohjaus allekirjoitus, ja löysi samanlainen merkitseviä (taulukko S4). Yhdistyksen välinen BRmet50 ja uusiutuminen lopputulos on BR1141 potilasryhmässä ilman tamoksifeenihoidon edelleen kuvataan Menetelmät S1.

Viisi 21 aineistoja käytetään arvioitaessa BRmet50 suorituskyky (BR1042, BR1095, BR1128, BR1141, GSE7390) edusti 1183 kasvaimia ja oli tietoja yhteisten ennusteeseen viittaavia ominaisuuksia, myös kasvaimen kokoa, laatu, imusolmuke tila, ja Nottingham Prognostiset Index (NPI) [32], [33]. Yhden ja usean analyysit näistä viidestä validointi sarjaa tehtiin edelleen arvioida suorituskykyä BRmet50 verrattuna muihin ennustetekijät eli BRsig70, BRsig76, ikä, kasvaimen koko, laatu, imusolmuke tila, ja NPI. Oikaisemattomaan (taulukko S5) ja säätää (taulukko 5 ja taulukko S6) riskisuhteita näiden tekijöiden ja allekirjoitukset määritettiin.

Univariate Coxin suhteellisen vaarat analyysi osoitti, että BRsig70, BRsig76 tai yksittäiset yhteinen ennustetekijä (kasvaimen kokoa, laatu, imusolmuke tilan tai NPI) ei onnistunut ennustamaan syöpä ennusteita kaikissa viidessä aineistoja. Kuitenkin BRmet50 oli ainutlaatuisesti pystynyt merkittävästi erilaistua kasvainnäytteestä kahteen ennustetekijöiden ryhmään kaikissa viidessä validointi sarjaa. Prognostisia arvo BRmet50 oli suurempi kuin kunkin vakiintunut riskitekijöitä (taulukko S5). Esimerkiksi optimaalinen tasoittamattomina hazard ratio (HR) (korkea riski vs. alhainen riski) in BR1128 oli 2,8 (95% CI: 1,5-4,9; p 0,001) (BRmet50 kontrolli), 1,9 (95% CI: 1,1-3,3; p = 0,01) (BRmet70), 2,0 (95% CI: 1,1-3,5; p = 0,02) (BRmet76), ja 2,2 (95% CI: 1,6-2,9; p 0,01) (NPI), vastaavasti. Tiedot ehdotti, että BRmet50 oli tehokkaampi ennustamaan uusiutumisen elinaika BR1042, BR1141, ja GSE7390 ja taudista vapaan eloonjäämisen BR1095 ja BR1128 kuin vakiintunut ennustavia tekijöitä.

Monimuuttujatestaus Coxin suhteellisen vaarat analyysiä käytettiin onko BRmet50, BRsig70 tai BRsig76 lisätä riippumatonta ennustetekijöiden tietoja muille vakio kliinis. Tässä monimuuttuja Coxin suhteellisen vaarat analyysi (taulukko 5), merkitseviä (

p

0,05) havaittiin kaikissa viidessä testissä aineistot välillä BRmet50 ja potilaan uusiutumisen vapaa tai taudista vapaa aika säätämisen jälkeen standardin kliininen kovariantteja. Siten BRmet50 tuoneet uusia ja tärkeitä varoituksia syntymässä olevista pidemmälle toimittamat perustettu kliinisen ennustajia. Suurimmaksi osaksi, BRsig70 ja BRsig76 ei ollut merkittävää yhdistysten Analyysien.

Ennakoiva Power of BRmet50 muissa Cancer Tyypit

Koska BRmet50 onnistuneesti ennusti rintasyövän ennustetta ja koska jotkut molekyylien onkogeenisia tapahtumat ovat konservoitunut useiden syöpätyyppien [34], me arveltu, että BRmet50 saattavat edustaa konservoitunutta transkription profiilin huonon ennusteen useita syöpätyyppejä.

tarkastella ennustetekijöiden spesifisyys BRmet50, me tutkimme, BRmet50 voisi ennustaa ennusteen muissa epiteelin syövät kuten koolon-, keuhko- tai eturauhassyöpä. Kolme aineistot, yksi kutakin syövän tyyppi: paksusuolensyöpä (n = 73) [35], keuhkosyöpä (n = 441) [36], ja eturauhassyövän potilailla (n = 596) (taulukko 6) [37] tehtiin yhden ja usean analyysejä. Pohjalta geeniekspression allekirjoitusten (BRsig70, BRsig76 tai BRmet50), 1110 potilaan näytteet jaotella kahteen ryhmään (taulukko 6). Kaikki kolme allekirjoitukset eivät ennustaa syövän uusiutumisen paksusuolensyöpä [35] (p 0,05). Kuitenkin BRmet50 mutta kumpikaan BRsig70 eikä BRsig76 onnistuneesti ennusti tautikohtaisten eloonjäämisen eturauhassyövässä ja uusiutumisen elinaika keuhkosyöpä (

p

0,01), mikä viittaa siihen, että transkription profiileja huono ennuste voi olla konservoitunutta vuonna rinta-, keuhko-, ja eturauhassyöpää. Vuonna keuhkosyöpä aineisto, hyvä ennuste ryhmät ennusti BRmet50 oli korkein uusiutumisen elinaika ( 40% ja

p

0,01) joukossa 3 allekirjoitukset. Olemme myös päättäneet, onko yhdistys näiden kolmen allekirjoitusten ja kliinisiin tuloksiin potilailla, joilla on eturauhasen, keuhko-, ja paksusuolen syöpä oli riippumaton perustettu kliiniset ja patologiset kriteerit (taulukko 6). Tulokset viittaavat siihen, että BRmet50 voisi toimia ennustetyövälineenä biomarkkeri sekä rinta- ja muiden kuin rintasyöpä ja voi edustaa konservoitunutta transkription profiilin jakamiseen useiden syöpätyyppien.

Keskustelu

Data tuottamat suurikapasiteettisten transkription tutkimukset syöpä on nopeasti kertynyt ja yhä useammat kiinnostusta kääntää tämän tiedon kliinistä arvoa. Vaikka yhden tutkimuksen analyysi voi olla informatiivinen, se vaikuttaa usein rajoituksensa. Nämä rajoitukset voidaan voittaa yhdistämällä niihin liittyvät riippumattomat tutkimusten meta-analyysi. Tutkimuksemme osoitti, että heterogeeninen allekirjoitukset yksittäisiltä syöpään tutkimuksista voidaan systemaattisesti järjestetty meta-allekirjoituksen (BRmet50), joka perustuu niiden luontaisten tietojen yhtäläisyyksiä jota uusi meta-analyysi strategia (iteratiivinen korottavat). Tämä meta-analyysi lähestymistapa voi lisätä tilastollinen voima, minimoivat väärien löytö, vähentää erän vaikutuksia ja parantaa yleistettävyyttä tuloksista.

Vastaa