PLoS ONE: Integroitu analyysi Multiple Microarray Tietoaineistot Tarkoittaa Toistettavissa Survival Predictor munasarjasyöpää Cancer
tiivistelmä
Background
Julkinen data integraatio voi auttaa voittamaan haasteet kliinisissä täytäntöönpanossa microarray profiileja. Me integroitu useita munasarjasyöpä aineistoja tunnistaa toistettavan ennustaja selviytymisen.
Menetelmät /Principal Havainnot
neljä mikrosirujen aineistoja eri toimielinten käsittää 265 pitkälle kasvaimet tasaisesti käsitellään uudelleen yhteen koulutus aineisto, myös Asennuslaitteet laboratorioiden välisiä vaihtelu ( ”erä-vaikutus”). Valvottu Pääkomponentti eloonjääminen analyysi käytettiin tunnistamaan ennustemalleja. Mallit olivat itsenäisesti validoitu 61-potilas kohortti käyttämällä mukautettua array GeneChip- ja yleisesti saatavilla 229-array aineisto. Molecular vastaavuutta korkean ja matalan riskin tuloksen ryhmien välillä koulutuksen ja validointi aineistot osoitettiin käyttäen alaluokka Mapping. Aiemmin perustettu molekyyli fenotyyppien 2
nd validointi asetettu korreloivat korkean ja matalan riskin tuloksen ryhmiä. Toiminnalliset esittäviä ja polku analyysiä käytettiin tutkimaan geenin verkkoihin liittyy korkea ja matala riski fenotyyppejä. 19-geenin mallin osoittivat optimaalisen suorituskyvyn harjoitussarjassa (mediaani 31 ja 78 kuukautta, p 0,01), 1
st validointi setti (mediaani 32 kuukautta vs. ei-vielä-saavuttanut, p = 0,026) ja 2
nd validointi setti (mediaani 43 vs. 61 kuukautta, p = 0,013) säilyttää itsenäinen ennustetekijöiden valtaa monimuuttujamenetelmin. Siellä oli vahva molekyyli- kirjeenvaihtoa vastaavien korkean ja matalan riskin kasvainten välillä koulutuksen ja 1
st validointi asetettu. Matala ja korkean riskin kasvainten rikastettiin positiivisista ja negatiivisista molekyylitason alatyyppejä ja polkuja, on aikaisemmin määritelty julkisella 2
nd validointi asetettu.
Johtopäätökset /merkitys
Integrointi aiemmin luotu syöpä mikrosirujen aineistoja voi johtaa vankka ja laajasti sovellettavissa selviytymistä ennustajia. Nämä ennustavat eivät ole pelkästään kokoelma prognoosi- geenien mutta ilmeisesti seurata todellista molekyyli- fenotyyppien liikearvon ja huono-tuloksen.
Citation: Konstantinopoulos PA, Cannistra SA, Fountzilas H, Culhane A, Pillay K, Rueda B , et ai. (2011) Integroitu analysointi Useita Microarray Tietoaineistot Tarkoittaa Toistettavissa Survival Predictor munasarjasyövässä. PLoS ONE 6 (3): e18202. doi: 10,1371 /journal.pone.0018202
Editor: Tšad Creighton, Baylor College of Medicine, Yhdysvallat
vastaanotettu: 17 marraskuu 2010; Hyväksytty: 23 helmikuu 2011; Julkaistu: 29 maaliskuu 2011
Copyright: © 2011 Konstantinopoulos et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä tutkimus tukivat kautta NIH /NCI P50CA105009 munasarjasyöpä SPORE (urakehitys palkinto Dimitrios Spentzos, ja Project 4 Daniel Cramer /Stephen Cannistra), kliinisen tutkimuksen koulutusohjelma, Beth Israel Deaconess Medical Center ja Harvard-MIT Division of Health Sciences ja Technology, Boston, ja Panagiotis Konstantinopoulos The Bernice Shopkin Weisman Fund, Munasarjojen Cancer Research Fund muistoksi Amy Sachs Simon, LeAnn rahasto, ja Sisters Against munasarjasyöpä. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
epiteelikasvaimet munasarjasyöpä (EOC) on esimerkki lupaus ja haasteet käyttää mikrosiruanalyysi prognostisiin biomarker tutkimukseen. Perustuu sen hyvin heterogeeninen taudinkulku [1], [2], [3] (jopa kehittyneet EOC, joka edustaa yli 70% tapauksista) ja vaatimaton erottelukykyä tavanomaisten ennustavat tekijät (määrä sairautta jäljellä alkuperäisen leikkauksen, ikä, kasvaimen ja histologinen alatyyppi [1], [4], [5]), microarray tutkimuksia jatkettiin yritetään selittää molekyyli- ja biologinen sairauden monimutkaisuus [6], [7], [8] [9], [10]. Kukaan ei kuitenkaan tuottanut geeniekspressiota allekirjoitus, joka on ollut asianmukaista kliiniseen käyttöön. Tämä johtuu suurelta osin muun muassa siksi, muuttuva tai pieni otoskoko, riittämätön validointi, tai sisällyttäminen alatyyppejä (kirkas solu, mucinous, papillaarinen EOCs), jotka muodostavat erillisen molekyylikokonaisuuksiin [11]. Vaikka kollektiivisesti nämä tutkimukset voivat olla riittävä tunnistaa hyödyllinen allekirjoituksia, yhdistämällä tietoja tai analyysitulokset on vaikea monista syistä, mukaan lukien käyttö erilaisia array alustoilla, eri tietojen normalisointi ja analyysi lähestymistapoja, ja vaihtelu koemenettelyn ja potilaan valinnan. Lopuksi, monissa tapauksissa ei ole selvää, jos ennustetekijöiden allekirjoituksia kuvastavat toistettavissa stabiili tauti fenotyypit tai ovat yksinkertaisesti yhdistelmä prognoosi- geenejä. Nämä rajoitukset, jotka eivät ole ainutlaatuisia munasarjasyöpä, osoittaa haasteet soveltamisrajoitukset microarray allekirjoitusten syövän hoitoon ja tutkimukseen, etenkin syövät enemmän rajallisen saatavuuden asianmukaisen kudoksen resursseja.
Kun pyritään käsittelemään näitä haasteet, me koottu, kuratoinut, ja käsitellään kokoelma 265 raaka-geenin ilmentymisen paneelit neljästä aiemmin raportoitu munasarjasyövän microarray tutkimuksia [10], [12], [13], [14] soveltaen yhtenäisiä tietojen normalisointi, laadunvalvonta, ja analyyttinen menetelmiä. Multi-geeni mallia tunnistettiin tässä komposiitti joukko, joka sitten itsenäisesti validoitu kahdessa erillisessä kasvaimen ikäluokat, joista yksi oli profiloitu mukautetun array GeneChip- ja toinen oli yleisesti saatavilla standardin oligonukleotidi array aineisto [15]. Lopuksi osoitimme, että tämä monen geenin malli ei ole pelkästään ennustetekijöiden tuloksiin vaan kuvastaa toistettavissa munasarjasyöpä fenotyyppejä ja näyttää samanaikaisesti seurata vapauttamisen useista biologisista tai onkogeenisten väyliä tässä sairaudessa.
Tulokset
kehittäminen usean geenin ennustetekijöiden luokittelijoiden integroitu koulutus asetettu
kuvassa 1 työnkulun Tutkimuksemme (consort kaavio). Suunnittelimme mukautetun array geenisiruun joka sisälsi noin 650 tehokkaimmat kandidaattigeenit tunnistaa soveltamalla valvottujen Pääkomponentti selviytyminen analyysin kunkin neljän aiemmin raportoitu aineistoja. Sitten yhdistimme kaikki neljä mikrosirujen aineistot yhdistetyksi koulutus asettaa (pois lukien 39 outlier näytettä), joka koostui 239 kasvaimen paneelit (taulukko 1, kuva 1). Hierarkkinen klusterointi yhdistetyssä harjoitussetti paljasti, että ennen soveltaminen erän säätö algoritmi, kukin aineisto selkeästi erillään kaikista muista heijastava ei-biologisten kokeellinen variaatio ( ”erä vaikutus”), kun taas säätämisen jälkeen erän vaikutus, kasvain näytteet kaikista aineistot olivat hyvin sekoitetut (kuva 2).
Mittaustulosten (Affymetrix .CEL tiedostot) neljästä aiemmin raportoitu mikrosirujen aineistoja eri toimielinten käytettiin. Outlier näytteet ulkopuolelle ja erän vaikutus säädettiin määrätään lopullisesti harjoitussarjassa (239 paneelit). 650 geenit valittiin suorittamalla eloonjääminen analyysi kussakin aineisto ja käytettiin kehittää ennustemalleja lopullisessa koulutusta asetettu. Tietojen esikäsittely- (laadunvalvonta ja erän säätö) ja normalisointi johtaa integroidun koeryhmä tehty erikseen valittaessa 650 geenejä, jotka on valittu itsenäisesti suorittamalla eloonjääminen analyysi kussakin 4 aineistot (MD ANDERSON, PENN, Duke , BIDMC). Nämä ennalta 650 geeniä avulla kehitettiin ennustemalleja yhdistetyssä koulutusta asetettu. Nämä mallit olivat itsenäisesti validoitu kaksi riippumatonta aineistot: 61-kasvain kohortti käyttämällä mukautettua array, joka sisältää 650 ennalta geenit ja 229-kasvain julkaisi äskettäin munasarjasyöpä microarray aineisto. Vastaavuus on matalan ja korkean riskin fenotyypit arvioitiin käyttäen SubMap.
Moniulotteinen skaalaus yhdistetyn harjoitussetti paljasti, että ennen soveltaminen erän säätö algoritmi, kukin aineisto selkeästi erillään kaikista toiset ( ”erä vaikutus”), kun taas korjauksen jälkeen erän vaikutus, näytteet kaikista aineistot olivat hyvin sekoitetut.
myöhemmin käytetään altaan 650 markkerigeenin (ilman tietoa niiden suorituskykyä mukautetun array) luodakseen usean geenin ennustetekijöiden luokittelijoiden yhdistetty harjoitus setti. Liittyvien geenien säilymisen (p 0,05) rankattiin perustuu niiden absoluuttinen Coxin regressiokertoimia, ja ennustemalleja kanssa huippuyliopistoja geenit kehitetty valvottu Pääkomponentti eloonjääminen analyysi [16].
Koska tavoitteenamme oli kehittää oligogene ennustetekijöiden allekirjoitusta ensin tunnistettu mallien kanssa pienin määrä geenejä, jotka voisivat tarjota prognostista tietoja integroitua koulutusta asetettu. Mallit, joissa on niin vähän kuin 2 geenit on erotettava korkean ja matalan riskin ryhmässä eloonjäämisen yhdistetyssä harjoitussarjassa (HR = 1,7, p = 0,003). Sitten arvioimme mallit, joissa suurempi määrä geenien harjoitussarjassa ja huomannut progressiivisesti lisääntynyt hazard ratio (t), kunnes oli tasangolla, jossa on vakaa, tilastollisesti merkitsevä HRS välillä 14 ja 19 geenit (eli HR = 2.1-2.3, p 0,001). Näistä malleissa 19-geeni malli osoitti parhaan ennustetekijöiden suorituskykyä ilmeistä sen korkeamman riskisuhde muihin verrattuna. Paras ennustetekijöitä malli (19 geenejä, taulukko 2) eron korkean ja matalan riskin ryhmään (mediaani 31 ja 78 kuukautta, log rank p 0,01, permutaatio p = 0,02) (kuva 3).
19-geeni malli eron korkean ja matalan riskin ryhmässä koulutukseen asetettu mediaani OS oli 31 kuukautta ja 78 kuukautta (log rank p 0,01, permutaatio p = 0,02), korkean ja matalan -risk ryhmä OS 1
st validointi setti (mediaani 32 kuukautta vs. ei-vielä-saavutti vastaavasti, log rank p = 0,026), ja korkea ja matala-riskiryhmään OS 2nd validointi asetettu (mediaani 43 kuukautta vs. 61 kuukautta vastaavasti log rank p = 0,013).
Riippumaton validointi usean geenin ennustetekijöiden luokittelijoiden
19-geeni ennustetekijöiden luokittelija levitettiin ilman mitään lisämuokkaamista 1
st validointi joukko, johon kuului ilmaisu saatujen tietojen riippumattoman kohortti pitkälle munasarjojen syöpiä (taulukko 1, n = 61) käyttämällä mukautettuja array, joka sisältää 650 aiemmin valittu geeneistä; nämä geenit oli valittu ilman tietoa niiden ennustetekijöitä suorituskyky validointi asetettu. 19-geeni malli eron korkean ja matalan riskin ryhmään (mediaani OS 32 kuukautta versus ei-vielä-saavutti vastaavasti, log rank p = 0,026, 33 kuukauden seuranta ylös, kuva 3). Huomattavaa on, että kun me priorisoinut 19 geenit perustuu niiden korrelaatio pääkomponentit aineisto tai painoa niiden osuus mallin, luokittelijoiden lukien alkuun 8-19 geenit olivat myös ennusteen voimassa ensimmäinen validointi setti (Text S1 ).
19-geeni ennustetekijöiden luokittelija sovellettiin myös ilman muita muutoksia 2. validointi asettaa joka sisältyi lauseke dataa 229 munasarjasyöpiä (taulukko 1, n = 229). Jälleen 19-geenin malli eron korkean ja matalan riskin ryhmään (mediaani OS 43 kuukautta vs. 61 kuukautta vastaavasti log rank p = 0,013, kuva 3). Samanlainen 1
st validointi asettaa, kun priorisoitu 19 geenit perustuu niiden korrelaation pääkomponenttien tai niiden painosta panos mallin, useat luokittelijoiden lukien alkuun 8-19 geenit olivat myös ennusteen voimassa 2nd validointi setti (Text S1).
Mikä tärkeintä, olemme yrittäneet kopioida ennustetekijöiden kahden potenssi aikaisemmin ilmoitettiin allekirjoitusta, alkaen BIDMC ja Duke aineistoja, vastaavasti [6], [10]. Kumpikaan allekirjoitus oli toistettavissa jompaankumpaan kahden riippumattoman validointi sarjaa (Text S1). Päättely, että tämä voi johtua eri analyyttinen algoritmeja sovelletaan aiemmissa tutkimuksissa, yritimme rakentaa uusia allekirjoituksia valvottu pääkomponenttina selviytymistä menetelmä erikseen jokaiseen 4 aineistoja käsitti integroitua koulutusta asetettu. Myöskään mikään allekirjoituksista voitaisiin validoitu joko kaksi itsenäistä sarjaa (Text S1). Nämä havainnot korostavat arvo integroimalla useita ilmaisun aineistoja, jotta voidaan määritellä laajasti toistettavissa allekirjoituksia.
Independent ennustetekijöitä merkitys lajittelijan oikaistu tiedossa oleva kliininen ja patologinen ennustetekijät
Me tehdään monimuuttujamenetelmin ja muodollisesti todettu, että 19-geenin malli säilyy itsenäinen ennustetekijöitä merkitystä oikaistu sekoittavat tekijät, sekä koulutusta ja kaksi riippumatonta validointi sarjaa (kuvio 4A ja taulukko 3). Tarkemmin sanottuna riskisuhde (HR) kuoleman varten epäsuotuisa verrattuna suotuisa ryhmä oli 2,47 koulutukseen joukko (95% CI, 1,71-3,56; p 0,01), 2,2 vuonna 1
st validointi joukko (95% CI, 1,01-7,76; p = 0,04), (kuvio 4A) ja 1,59 vuonna 2
nd validointi joukko (95% CI, 1,05-2,4; p = 0,03), (taulukko 3). Koska vain 8/229 (3%) ja kasvaimia ehdottomasti tiedettiin suboptimally rajatusta että 2
nd validointi asetettu rajaamisvai- tila oli mukana monimuuttuja analyysiin 2
nd validointi asetettu ”paljain silmin ”vs.” ilman näkyviä ”jäljellä sairaus leikkauksen jälkeen. Erityisesti riippumattoman ennusteen arvioinnissa profiilin pätenyt riippumatta siitä huono laatu määriteltiin luokan 1 tai luokan 1 ja 2 tautia (taulukko 3).
) Prognostic arvo 19-geeniekspressioprofiili oikaistu tiedossa ennustetekijöiden Coxin suhteellisten riskien regressio koulutukseen ja 1
st validointi sarjoiksi. B) Kaplan-Meier analyysi OS funktiona 19-geenin profiilin homogeeninen potilasryhmissä optimaalisen ja optimaalinen debulking asema koulutus asetettu. C) yhdistelmä optimaalisen debulking ja matalan riskin 19-geeni profiilin liittyi mediaani 119 kuukautta koulutuksen asetettu ja ei-vielä-saavutettu validointi asetettu, kun taas yhdistelmä optimaalisella debulking ja korkean riskin 19 -geenin profiili liittyi mediaani 23 kuukauden harjoitussarjassa (HR = 7,3, 95%: n luottamusväli 3,4-13,5) ja 21 kuukautta 1
st validointi asettaa (HR = 5,8, 95% CI 2.1- 16).
Data kemoterapiaa vastaus oli saatavilla vain ensimmäinen validointi asetettu. Kun mukana kemoterapia vasteen (eli saavuttaminen täydellisen kliinisen vasteen (CCR) jälkeen ensilinjan kemoterapiaa versus saavuttaminen CCR) monimuuttujakalibrointiin analyysi ensimmäinen validointi asetettu, 19-geeni profiilin säilytti itsenäisen ennustetekijöitä merkitys (HR = 3,96, 95% CI 1,56-10,1; p = 0,004).
Kuvio 4B osoittaa myös, että 19-geenin profiili oli vielä ennustetekijöiden OS kun sovelletaan homogeeninen potilasryhmissä optimaalisen ja optimaalinen debulking asema koulutuksessa sarja. Tämä alaryhmä analyysiä ei voida suorittaa 1
st validointi joukko johtuen näytteen kokorajoitukset, ja 2
nd validointi asettaa koska vain 8/229 kasvaimia (3%), oli ehdottomasti tiedettiin suboptimally rajatusta .
Geenien ilmentyminen malleja ja rajaamisvai- tila oli vahvin riippumattomia ennustajia selviytymisen; Siksi olimme kiinnostuneita arvioida niiden yhteenlaskettu ennustetekijöiden voima, joka on myös esitetty kuviossa 4C. Erityisesti yhdistelmä optimaalisen debulking ja matalan riskin 19-geeni profiilin liittyi mediaani 119 kuukautta koulutuksen asetettu ja ei-vielä-saavutettiin 1
st validointi asettaa, kun taas yhdistelmä optimaalisella debulking ja korkean riskin 19-geeni profiilin liittyi mediaani 23 kuukauden harjoitussarjassa (HR = 7,3, 95%: n luottamusväli 3,4-13,5) ja 21 kuukautta 1
st validointi asettaa (HR = 5,8, 95% CI 2,1-16), mikä osoittaa, että yhdistelmä kahdesta muuttujasta on paljon tehokkaampi kuin kumpikaan niistä erikseen. Tätä yhdistelmää ei voida arvioida 2
nd validointi setti koska vain 3%: n kasvainten ehdottomasti tiedettiin suboptimally rajatusta.
Genominlaajuiset molekyyli vastaavuus korkean ja matalan riskin ryhmiin välillä koulutus ja validointi sarjaa
usein on epäselvää, ennustetekijöiden geeniekspressiota mallit ovat korvikkeita taustalla laajempaa molekyyli- tai biologisia fenotyyppejä, tai yksinkertaisesti yksilöterapian prognostisten geenejä. Jotta hypoteesin testaamiseksi, että ennustemalleja seuraat molekyyli- fenotyypit huipulla pienen riskin munasarjasyöpä, käytimme menetelmää (alaluokka Mapping-SubMap), joka on ainutlaatuinen sopiva arvioida genominlaajuisten molekyyli vastaavuus ennalta laaditun alatyyppien riippumattomat ja jopa teknisesti erilaisia aineistoja [17]. Erityisesti me tutkimme, korkea tai matala riskin kasvaimia yhdistetyn koulutuksen asetettu olivat molecularly homologinen korkea tai matala riskin kasvaimia 1
st validointi asettaa muutenkin kuin kourallinen geenien sisältämän malleissa. Tämä tapahtuu osoittamalla rikastuminen geenin profiilin ”korkean riskin” (tai ”pieni riski”) ryhmä koulutukseen asetettu useita markkereita geenien ”korkean riskin” (tai ”pieni riski”) ryhmä validointi asettaa ja päinvastoin. Kuten kuviossa 5A, että 19-geenin mallin, korkean ja matalan riskin kasvainten yhdistettyyn harjoitussarjassa vastasi korkea tilastollisella varmuudella korkean ja matalan riskin kasvainten vastaavasti validointi set (taulukko S1). Tämä tulos toistettiin käyttäen erilaisia alaryhmiä markkerimuotoja varten 19-geenin mallin.
SubMap analyysi genominlaajuisten kirjeenvaihto (samankaltaisuus) välillä vastaavien korkean ja matalan riskiryhmiä koulutukseen ja 1
st validointi sarja. Legenda esittää suhdetta värin ja FDR-oikaistu p-arvot. Punainen väri tarkoittaa suuri luottamus kirjeenvaihtoa varten; sininen väri merkitsee eivät vastaa (taulukko S1). B) Toiminnallinen geeniperimä analyysi ja toiminnallisten esittäviä analyysi korkean ja matalan riskin tauti näytteitä. Gene set analyysi (GSA) laajalla erilaisesti ilmaisi geenien paljasti 8 polkuja, jotka olivat tilastollisesti merkitsevä ilmentyvät eri. (Efron-Tibshirani GSA, p 0,05). Valitut reitit-geenin sarjat on esitetty, jotka yliedustettuina korkean riskin ja matalan riskin kasvainten toiminnallisten esittäviä analyysi käyttäen EASE (vajaan-järjestelmä FDR ≤0.01). Täydellinen luettelo näistä reiteistä löytyy taulukoissa S2, S3 ja S4. Tähdellä (*): llä polkuja, jotka olivat samalla ilmaistu vastaava prognostisten ryhmissä 2
nd validointi asetettu.
2
nd validointi aineisto, suotuisa (C3 ja C6) ja epäsuotuisa (C1, C2, C4, C5) prognostisia molekyyli- alatyyppejä oli jo määritelty tekijät [15]. Siksi arvioi näiden aiemmin määritellyn molekyyli alatyyppejä toistettiin matalan ja korkean riskin ryhmiin kuten määritelty myös 19-geenin profiili 2
nd validointi setti (kuva 3). Itse asiassa 2
nd validointi asettaa, matalan riskin ryhmään (kuten määritelty 19-geeni profiilin) rikastettiin suotuisalle (C3 ja C6) alatyyppeihin ja riskiryhmään rikastui varten epäsuotuisa alatyyppejä, kuten aiemmin on määritelty [15] (2-puolinen Fisherin p = 0,0016).
Pathway analyysi korkean ja matalan riskin tautiryhmistä
jotta saadaan käsitys polun monimutkaisuus high ja alhaisen riskin tauti, suoritimme polku ja esittäviä analyysien tunnistaa selityksin polkuja ja funktionaalinen geeni ryhmiä, jotka olivat yliedustettuina (rikastettu) geenissä profiilit kaksi riskiluokan suuressa harjoitussarjassa (mukautettu array, suunnittelun, sisälsi liian harvat geenit suorittaa tämän analyysin validointi asetettu).
GSA polku analyysi tehtiin laajalla erilaisesti ilmaisi geenien korkean ja matalan riskin ryhmiin [käyttäen t-testi, p 0,01 (3264 geenit ) niin alhaiseksi kuin 0,0001 (1698 geenit)], ja paljasti kahdeksan väyliä (kuva 5B), jotka olivat tilastollisesti merkitsevä ilmentyvät eri (Efron-Tibshirani GSA testi p 0,05).
esiintynyt myös toiminnallinen esittäviä analyysi käyttäen EASE keskuudessa geenejä, jotka upregulated ja vaimentua siinä korkean versus matalan riskin potilailla (käyttäen t-testi, p 10
-6). Löysimme 22 ja 54 reitit yliedustettuina geenien ilmentyminen lisääntyy ja vaimentua korkean riskin kasvainten vastaavasti klo kuluessa-järjestelmä FDR kynnys 0,01. Täydellinen luettelo näistä reiteistä löytyy taulukoissa S2, S3 ja S4, kun taas valitut reitit on esitetty kuviossa 5B.
Mielenkiintoista, useat näistä reiteistä (kuvio 5B), jotka upregulated korkean riskin kasvainten eli ”sytokiini-sytokiinireseptorien vuorovaikutus”, ”cell viestintä”, ”ECM-reseptori vuorovaikutuksen”, ”patogeeniset invaasio”, ”solujen kasvua”, ja matalan riskin kasvainten eli ”eriyttäminen”, olivat myös samalla ilmaistu korkean ja matalan riskin kasvaimet kuten aiemmin raportoitu 2
nd validointi setti [15].
Prognostiset geeniekspression malleja heijastavat aktivaation tiedetään onkogeenisten reittejä yksittäisissä tuumorinäytteissä
koska GSA tai EASE voi määrittää koulutusjakson aktivoinnin tila yksittäisille kasvainnäytteet, sovelsimme aikaisemmin kehittäneet geeniekspressiota ”lukemien” johtuvat kokeellisesti ohjataan aktivoimalla tiettyjä onkogeenisten väyliä (src, b-kateniinin ja E2F3), jotka on osoitettu kantamaan ennustetekijöiden merkitystä munasarjasyövän [12]. Havaitsimme, että 239-kasvain training set kertoimet-suhteet aktivointi src ja b-kateniinin reittejä meidän korkea verrattuna matalan riskin ryhmässä oli 3,42 (95%: n luottamusväli 1,89-6,18) ja 2,77 (95% CI 1.59- 4.8) vastaavasti, kun taas kertoimet-suhde E2F3 oli 0,251 (95% CI 0,141-0,446). Tämä vastaa aiempien tutkimusten osoittaa, että aktivointi src ja b-kateniinin reitit liittyy huono tulos, kun taas aktivoinnin E2F3 liittyy hyvään lopputulokseen, ja se osoittaa, että analyysimme kaappaa biologisesti merkityksellistä tietoa, jota ei ole ilmiselvää tutkimalla sisältöä 19-geenin profiilin. Vuonna Monimuuttuja-analyysissä myös 19-geenin malli ja 3 onkogeeniset polkuja, 19-geenin malli säilyy itsenäinen ennustetekijöiden merkitystä, kun taas aktivointi malleja onkogeenisel- reitit eivät (dataa ei esitetty).
Keskustelu
Vaikka soveltuvuutta geeniekspressioprofilointi varten ennustus on osoitettu munasarjasyöpä [6], [8], [10], useat haasteisiin on vastattava ennen kuin siitä tulee kliinisesti hyödyllinen työkalu. Aiemmat ennustetekijöiden microarray tutkimuksia rajoittavat otoskoko, laboratorioiden välisiä vaihtelevuus, ettei ulkoisia (pois tutkimus) validointi, ei-standardoituja analyyttisiä lähestymistapoja ja osallisuutta histologisten alatyyppien erottuva geneettisiä profiileja ja tulos (eli kirkas solu, ja mucinous syövät) [11 ]. Tässä tutkimuksessa kuvataan onnistunut putki, joka voi olla hyötyä myös vastaavia toimia muissa syövissä. Me jälleenkäsitellä ja integroitu raakadataa neljästä eri, aiemmin tuotettu mikrosiru aineistot [10], [12], [13], [14] peräisin eri laboratorioissa ja ajaa eri alustoilla, isoon ja homogeeninen joukko, ilman mucinous ja selkeä solu EOCs, maksimoiden voimamme tunnistaa vankka profiileja minimoiden vääriä positiivisia havaintoja. Me korjattu ei-biologinen kokeellinen variaatio ( ”erä effect”) [18], joka oli selvästi nähtävissä eri tutkimuksissa (kuvio 2) ja muodostuu lopullinen koulutus kohortin 239 kasvaimia. Käytimme myös standardoitua selviytymisen analyysimenetelmä, joka erottuu edukseen muihin menetelmiin sovelletaan microarray data [16], [19]. Tuloksena ennustetekijöiden mallia validoitu kahdesti, kaksi erillistä toisistaan riippumatonta. Tämä on ensimmäinen kerta, tietojemme mukaan tämä on yritetty tässä sairaudessa. Kasvaimet sisältyy kaksi validointi kohortteja peräisin eri laitosten ja ajettiin eri laboratorioissa ja ajanjaksojen kuin kasvaimia sisältyvät yhdistetyn koulutuksen kohortissa. Custom siru käytettiin 1
st validointi asettaa, ja suuri julkisesti saatavilla koko genomin aineisto käytettiin 2
nd validointi asettaa, kun taas koulutus näytteet aiemmin toimia erilaisilla (koko-genomin) alustat monta vuotta aikaisemmin. Sen lisäksi, että kurinalaisuus tämän validointiprosessiin, meidän yleisesti saatavilla olevien aineistojen ja räätälöidyn suunnittelun siru minimoi toteuttamisen kustannuksista geenin-profilointi tekniikka rutiininomaisessa kliinisessä käytännössä.
19-geeni malli optimaalinen ennustetekijöiden suorituskyky harjoitussetti syrji korkean ja matalan riskin ryhmässä OS kahdessa validointi sarjaa, säilyttäen sen riippumattomat yhdessä selviytymisen monimuuttujamenetelmin säätämisen tiedossa ennusteeseen viittaavia sekoittavat tekijät. Huomattavaa on, että aiemmin raportoitu geenin ilmentyminen allekirjoitusta yksittäisen osan aineistoja koulutuksen set [6], [10], tai vasta luotu malleja käyttämällä nykyisiä menetelmiä näissä aineistoja, eivät olleet toistettavissa kummassakaan kahden riippumattoman validointi aineistoja. Tämä viittaa siihen, että strategiaamme yhdistää tietoa eri ja teknisesti erilaisia aineistoja yhdistetyksi opetusjoukkoa täydentää meidän kyky vangita laajalti toistettavissa ennustetekijöiden geeniekspressiomalleja. Vaihtelua riskisuhde arvioita 19-geeni profiilin välillä koulutuksen ja kaksi validointi sarjaa, todennäköisesti heijastaa eroja eri kliinisen ikäluokat, joiden ominaisuudet ovat harvoin identtisiä microarray tutkimuksissa. Esimerkiksi 2
nd validointi asettaa näyttää ylivoimaisesti koostuvat optimaalisesti rajatusta siten parannetun ennusteen potilaille. Kuitenkin tämä korostaa entisestään pätevyyden profiilin sovellettuna monenlaisia munasarjasyövän potilasryhmissä.
Geenien ilmentyminen mallit olivat niin voimakas kuin rajaamisvai- tila, vahvin tunnettu kliininen ennustaja selviytymisen kehittyneiden EOC [4 ], ja yhdistelmä optimaalisen debulking ja matalan riskiprofiilin määritellyt väestö, jolla on pitkä selviytymisen tasanne (70% 5 vuoden pysyvyys sekä koulutukseen ja 1
st validointi asetettu). Toisaalta yhdistelmä optimaalisella debulking ja korkean riskiprofiilin määritellyt väestöstä vain 10% 5 vuoden pysyvyys. Tällainen voimakas ennustetekijöiden kerrostuneisuus kehittyneissä EOC ei ole mahdollista perinteisillä kliiniset tekijät aikaan diagnoosi ja ne voivat olla käyttökelpoisia kerrostuminen korkean riskin potilailla, joita pidetään tutkimuslääkkeiden lähestymistapoja käyttäen huolto- ja /tai vakauttamisstrategiat tai alhaisen riskin lääketieteellisesti epävakaa potilaat, jotka voivat välttää suhteellisen myrkyllinen vatsaonteloon kemoterapiaa [20].
Tutkimuksemme tavoitteena oli myös tutkia kuihtua profiilin ei ole pelkästään matemaattinen yhdistelmä 19 prognoosi- muuttujia, mutta on myös seuranta molekyyli- fenotyyppejä korkea- versus alhainen -risk munasarjasyöpä. Menetelmää käyttäen (SubMap), joka on ainutlaatuinen sopiva arvioida laajemman genomista yhtäläisyys alatyyppejä tunnistettu useita erillisiä, ja erilaisia aineistoja [17], varmistimme, että matalan ja korkean riskin ryhmiin määrittämä meidän ennustemalleja olivat molecularly homologisia välillä koulutus ja validointi sarjaa, mikä viittaa siihen, että emme ole pelkästään validoitu matemaattinen ennustetekijöiden toiminto mutta myös totta molekyyli- fenotyyppien liikearvon ja huono-tuloksen. 2nd validointi asetettu, molekyyli- tulos alatyyppejä oli vahvistettu jo tekijät [15]. Meidän havainto, että nämä molekyyli alatyyppejä olivat yliedustettuina (rikastettu) korkean ja matalan riskin ryhmissä tunnistetaan meidän 19-geenin profiilin, lisäksi osoitus ajatus, että profiili on seurata oikean ja toistettavissa tulos fenotyyppejä EOC.
Vaikka se oli kuulu Tutkimuksemme selvittää tarkka biologinen rooli minkään tietyn reitin, on huomionarvoista, että reittejä, jotka upregulated että korkean riskiryhmän ovat sekaantuneet munasarjan syövän synnyn ja /tai liittyy aggressiivinen sairaus ja huono tulos [21], [22], [23]. Lisäksi polkuja, jotka olivat yliedustettuina geenien yli-ilmennetään korkean riskin kasvaimia on myös liitetty huonompi tulos [24], [25], [26], luotonanto biologinen uskottavuus on fenotyypit huomasimme. Tärkeää on, useat näistä reiteistä (kuvio 5B) on myös samalla ilmaistu korkean ja matalan riskin kasvainten aiemmin raportoitu yleisesti saatavilla 2
nd validointi asettaa, mikä osoittaa toistettavuus biologisten verkkojen liittyy hyviä ja huonoja-tuloksen välillä eri aineistot [15].
Lopuksi käytti aiemmin kehitetty geenin ilmentymisen ”lukea out” johtuvat kokeellisesti ohjattu onkogeenisistä reitin aktivointi (src, b-kateniinin ja E2F3) arvioida aktivoinnin tila yksittäisissä kasvainnäytteestä [12], [27]. Vaikka jatkuvaa keskustelua siitä, miten onkogeenisel- polku analyysi kuvanneet Bild et al. [12]. sovellettiin eräässä tutkimuksessa [28], alkuperäinen onkogeeninen polku analyysimenetelmä kuvanneet Bild et al. ei ole kiistetty. Yhdenmukainen tiedossa ennen tietojen src ja b-kateniinin reittejä oli useammin aktivoitu korkean riskin verrattuna alhaisen riskin kasvainten, kun taas päinvastainen oli totta, että E2F3 reitin [12], [27], [29]. Romaani yhdistys onkogeenisel- reitin aktivoinnin tilan fenotyyppiä ”vangiksi” kirjoittanut markkeri 19-geenin profiilin, joista yksikään reitin geenien kuuluu, osoittaa, että biologinen päättely microarray tutkimuksia ei pitäisi rajoittaa usein sovellettu lähestymistapa seulomiseksi listan top merkki geenien ennusteen allekirjoitus. Huomattavaa on, että nämä onkogeenisiä reittejä menettänyt itsenäisen ennustetekijöiden merkitys Monimuuttuja-analyysissä, kun profiili oli mukana, mikä viittaa siihen, että meidän ennustetekijöiden luokittelija on syömällä monimutkaisia fenotyyppejä ja että lopputulos erot munasarjasyöpä ei saa riittävästi selittää vapautuminen yhden kasvaimia synnyttävän tai signalointireitin.
Yhteenvetona lähestymistapamme esimerkki miten integraatio ja kurinalaista analyysi rikkaan tietosisällön julkaistu, mutta hajanaisia syöpä mikrosirujen aineistoja voi voittaa edellinen rajoitukset ja johtaa vahvojen ja mahdollisesti hyvin sovellettavissa ennustetekijöiden luokittelijoiden. Muokattu joukko voi olla myös käytännöllinen työkalu tutkimuksessa ja hoidon syövän.