PLoS ONE: Discovery ja validointi on Eturauhassyöpä Perimän luokitin joka ennustaa Early Etäpesäke jälkeen eturauhasen

tiivistelmä

Tarkoitus

viittaavia tekijöitä ja biokemialliset toistuminen ovat herkkiä, mutta ei erityisiä, ennustajia etäpesäkkeitä ja tappava eturauhassyöpää. Oletamme, että genomista ilmaus allekirjoitus havaitaan primaarikasvaimen edustaa todellista biologista potentiaalia aggressiivinen sairaus ja tarjoaa paremman ennusteen varhaisen eturauhassyövän etäpesäkkeiden.

Methods

sisäkkäisiä tapaus-verrokki muotoilu käytettiin valitse 639 potilasta Mayo Clinic kasvain rekisterin, joille tehtiin eturauhasen vuosien 1987 ja 2001. genomista luokittelija (GC) on kehittänyt mallintamalla ero RNA ilmaisun käyttäen 1,4 miljoonaa ominaisuus tiheitä ilmentymisen paneelit miesten rikastettu nousevalle PSA jälkeen eturauhasen, mukaan lukien 213 kokeneiden varhaisvaiheen kliinistä etäpesäke jälkeen biokemiallisten uusiutuminen. Koulutuspaketti sarja käytettiin kehittämään satunnainen metsä luokittelija 22 markkereita ennustaa tapauksissa, – miesten varhaisvaiheen kliinistä etäpesäkkeitä nousun jälkeen PSA. Suorituskyky GC verrattiin ennustetekijöiden kuten Gleason pisteet ja edellinen geeniekspression allekirjoitusta pidätettävä validointi asetettu.

Tulokset

Expression profiilit kertyi 545 ainutlaatuinen potilaan näytteitä, joissa mediaani seuraavia up 16,9 vuotta. GC saavuttanut ala vastaanotin toimii ominaiskäyrän 0,75 (0,67-0,83) validointi, ylittäen kliinisten muuttujien ja geeni allekirjoitukset. GC oli ainoa merkittävä ennustetekijä monimuuttuja analyysit. Sisällä Gleason pisteet ryhmien tapauksissa korkea GC tulokset kokenut aikaisemmin kuolemaa eturauhassyöpään ja vähentää yleistä eloonjäämistä. Merkit on luokittelija todettiin liittyvän useita keskeisiä biologisia prosesseja eturauhassyövän metastaattisen taudin etenemisen.

Johtopäätös

genomista luokittelija kehitettiin ja validoitiin suuri potilaan kohortin rikastettu eturauhasen syöpään etäpesäke potilaiden ja nouseva PSA joka meni kokea etäpesäkkeitä. Tämä varhainen etäpesäkkeiden ennuste mallia, joka perustuu genomisen ilmentymisen primaarikasvaimen voi olla käyttökelpoinen tunnistamiseksi aggressiivinen eturauhassyöpä.

Citation: Erho N, Crisan A, Vergara IA, Mitra AP, Ghadessi M, Buerki C, et al. (2013) Discovery ja validointi on Eturauhassyöpä Perimän luokitin joka ennustaa Early Etäpesäke jälkeen eturauhasen. PLoS ONE 8 (6): e66855. doi: 10,1371 /journal.pone.0066855

Editor: Tšad Creighton, Baylor College of Medicine, Yhdysvallat

vastaanotettu 4 helmikuuta 2013 Hyväksytty: 10 toukokuu 2013; Julkaistu: 24 kesäkuu 2013

Copyright: © 2013 Erho et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus tuettiin osittain National Research Council of Canada, Industrial Research Assistance Program (https://www.nrc-cnrc.gc.ca/eng/irap/index.html), ja Mayo Clinic Eturauhassyöpä SPORE P50 CA91956 ( PI: Donald Tindall Ph.D.) rahoittajat ei ollut roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: kirjoittajat lukenut lehden politiikan ja on seuraavat ristiriitoja: NE, AC, IV, MG, CB, ZH, BZ, TS, TT, ja ED ovat työntekijöitä GenomeDx biotieteiden Inc. ED ja TT oma varastosta GenomeDx biotieteiden Inc. ED on saanut tutkimusrahoitusta GenomeDx Biosciences Inc. ja National Research Council – Industrial Research avun ohjelma. PB on saanut tutkimusrahoitusta GenomeDx Biosciences Inc. GK on saanut tutkimusrahoitusta Beckman Coulter. KB, EB, RC, SF, RK, RJ, ja TK ovat ilmoittaneet, etteivät ole kilpailevia intressejä olemassa. Tämä ei muuta kirjoittajat noudattamista kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja.

Johdanto

Yli 240000 miehet ovat diagnosoitu eturauhasen syöpä Yhdysvalloissa vuosittain, ja suurin osa niistä satama paikallinen tai alueellinen sairaus, jossa pitkän aikavälin ennuste on erinomainen [1]. Noin puolet näistä miehistä tehdään eturauhasen (RP) ja lähes 40% esittää yhden tai useamman viittaavia tekijöitä, kuten korkean Gleason (GS), kapselin ulkopuoliseen laajennus (ECE), positiivinen kirurgiset marginaalit (SM +), rakkularauhanen invaasio (SVI) tai imusolmuke osallistuminen (N +), jotka ovat yhteydessä lisääntynyt riski kliinisten etäpesäkkeiden [2] – [4]. Vaikka vain pieni osa näistä miehistä ovat todella vaarassa kuolla heidän syövän [5], monet näistä ”kliinisesti korkean riskin” potilaat saavat lisäksi leikkauksen jälkeisen interventioita (esim adjuvantti säteily) ja kärsivät usein hoitoon sairastuvuutta. Toisaalta monet miehet esittää ilman haitallisia kliinisiä piirteitä ja silti kuolla eturauhassyöpään. Nykyiset välineet ovat rajalliset tunnistaa, klo RP, miehiä, jotka ovat suurimmassa vaarassa etäpesäkkeiden ja eturauhassyövän kuolema – tällaiset potilaat hoidetaan nykyisin aggressiivisesti vasta havainnon nousevat PSA (prostataspesifisen antigeenin) tai biokemialliset toistumisen (BCR) . Viimeaikaiset kliiniset kokeet viittaavat siihen, että näillä potilailla olisi todennäköisesti enemmän suotuisia jos käsitelty aiemmin jälkeinen RP [6] – [10]. Siten rajallinen suorituskyky kliinisten tekijöiden ennustamiseen miesten altteimpia etäpesäke johtaa suboptimaalisille potilaan hoidossa.

Viime vuosikymmenen aikana, monet tutkimukset ovat yrittäneet puuttua tyydyttämätön kliininen tarve ennustamiseen aggressiivinen eturauhassyöpä käyttämällä erillisiä biomarkkerit tai geenin ilmentymisen allekirjoituksia [11] – [30]. Näillä tekniikan ponnistelut eivät ole nähneet laajasta käytöstä kliinisessä käytännössä, koska mikään niistä ei ole osoitettu vakuuttavasti parantunut ennuste yli perustettu kliiniset tekijät kuten GS. Tämä johtuu pääasiassa rajoituksia näytteen koon ja tehon, pitkiä kliinistä seurantaa noudatettava metastaattista tai tappava eturauhassyöpä tapahtumia ja käyttöä BCR korvikkeena päätepiste; herkkä, mutta ei-spesifinen, ennustaja sairauden etenemisen [31]. Niinpä useimmat biomarkkereiden tutkimukset huonosti näyte kliinisesti todistettu aggressiivinen eturauhassyöpä tapauksia. Lisäksi useimmat geeniekspressiota allekirjoitukset kehitettiin määrityksiä, joita tarvitaan tuoreita tai pakastettuja kudos, joka ei ole tavallisesti saatavilla olevissa kliinisessä käytännössä, ja rajoittuivat profilointi proteiini-koodaus geenit – tutkii vain vähemmistö aktiivisen genomin (ts transcriptome) . Aikaisemmassa raportissa saadun arkistoituja formaliinikiinnitetyt parafiiniin upotetut (FFPE) ensisijainen eturauhassyöpä yksilöitä Mayo Clinic kasvain rekisterin, johon sisältyi suuri määrä potilaita, jotka kehittyi etäpesäkkeitä. Pitkäaikaisessa seurata me selville biomarkkereiden allekirjoitus, joka voi tunnistaa miehet vaarassa etenemiseen kliiniseksi etäpesäkkeitä ja tappava eturauhassyöpää [20]. Kuitenkin validointi emme osoittaa merkittävää parannusta suorituskykyyn verrattuna kliinisiin muuttujia ja me arveltu, että tämä saattaa johtua siitä, että rajoitetun keskittyä joukko noin 1000 proteiinia koodaavan geenien.

Tässä laajentaa tähän työhön uudelleen profilointi potilaiden alkuperäisen tutkimuksen hyödyntäen korkean tiheyden transcriptome laajuinen mikrosirun, joka arvioi ilmentymistä yli 1,4 miljoonaa RNA ominaisuuksia, kuten ~22,000 tunnettua proteiinia koodaavan geenien sekä useita tuhansia koodaamattomasta RNA: t. Tällaisia ​​ei-koodaavat RNA: t ovat nyt tunnustettu niiden kyky säädellä toiminnan onkogeenien ja tuumorisuppressorigeeneille mukana kehittämässä taudin uusiutumisen ja metastasointiin [32], [33]. Esitämme kehittäminen ja validointi perimän luokittelijan (GC) riskien ennustamiseen varhainen kliininen etäpesäke, joka on rikastettu ei-koodaavat RNA: t. Osoitamme, että GC tarjoaa riippumatonta ja tilastollisesti merkitsevä prognostisia muut tieto ennusteeseen viittaavia muuttujat ja osoittavat, että GC päihittää aiemmin raportoitu geeni allekirjoitukset.

Materiaalit ja menetelmät

Potilasjoukko ja Kliiniset tulokset

potilasta tässä tutkimuksessa valittiin käyttäen sisäkkäisiä tapaus-verrokki design Mayo Clinic eturauhasen kasvain rekisterin, kuten aiemmin on kuvattu [20]. Lyhyesti, saavista potilaista eturauhasen (HE) ja ensisijaisen eturauhasadenokarsinoomaa ensimmäisen vaiheen hoidossa Mayo Clinic Kattava Cancer Center vuosien 1987 ja 2001 olivat takautuvasti luokitellaan seuraaviin tulos ryhmistä:

Ei todisteita taudin (NED) eteneminen ryhmä

: Näytteillä ei biokemiallisten tai muita kliinisiä sairauden etenemisen seuraavista RP, joilla on vähintään 7 vuoden seurannassa.

eturauhasen antigeenin (PSA) -recurrence ryhmä

: Kokenut biokemialliset toistumisen (BCR), määritellään kahden peräkkäisen potilaiden PSA mittauksissa yli 0,02 ng /ml (kanssa myöhemmin toimenpide 0,05 ng /ml yläpuolella ensimmäinen mittaus) ilman havaittavaa kliinisiä etäpesäkkeiden (katso jäljempänä) 5 vuoden sisällä BCR.

Clinical etäpesäkkeiden ryhmä (etäpesäke) B: Kokeneet BCR ja kehitetään alueellisia tai kaukaisia ​​etäpesäkkeitä, vahvistettu luu- tai TT, 5 vuoden sisällä BCR. Tätä ryhmää kutsutaan systeeminen Progression (

SYS

) edellisessä tutkimuksessa [20].

Kaikkiaan 213 potilasta täytti määritelmää etäpesäkkeiden ryhmän ja nimettiin tapauksissa [20]. Kutakin tapauksessa yksi potilas kumpikin PSA ja NED ryhmät valittiin perustuu matching kriteerien kuvattu aiemmin [20] ja nimettiin valvontaa.

Ethics selvitys.

Tutkimus hyväksyttiin Institutional Review Board of Mayo Clinic ja johtuen arkistointia luonteesta yksilöitä, potilaan suostumus oli luopunut hallituksen.

RNA ja Microarray Hybridisaatio

alkuperäisestä tutkimuksessa (n = 639 ), RNA oli käytettävissä microarray 545 ainutlaatuinen potilaista. Kuten edellä on kuvattu, kun histopatologiset uudelleen tarkastelun asiantuntija urogenitaalinen patologi, kasvain oli macrodissected ympäröivistä peruskudos 3-4 10 um kudosleikkeiden pääasiallisesta Gleason arvosana indeksin vaurion (korkein patologisen GS) ja kokonais-RNA uuttamalla [20 ]. Kokonais-RNA suoritettiin monistus käyttäen WT-Ovation FFPE v2 sarja yhdessä eksoni-moduuli (NuGen, San Carlos, CA) valmistajan suositusten vähäisin muutoksin. Amplified tuotteet olivat hajanaisia ​​ja merkitty käyttäen Encore Biotiini Module (NuGen, San Carlos, CA) ja hybridisoitiin ihmisen eksoni 1.0 ST GeneChips (Affymetrix, Santa Clara, CA) seuraavat valmistajan suosituksia. Ihmisen eksoni GeneChips profiilin koodaus ja ei-koodaavat alueet transcriptome käyttää noin 1,4 miljoonaa koetin valinta alueilla (hankkeen tilaa), jäljempänä ominaisuuksia.

Microarray Processing

Microarray laadunvalvontaa.

Näistä 545 potilaalla, joiden kudoksen ja RNA, yhteensä 59 näytettä epäonnistui alkuperäisestä QC (arvioituna Affymetrix Power Tools AUC metrinen [34]) ja olivat uusinnassa. Lisäksi suoritetaan PC3 solulinja (ATCC, Manassas, VA) kontrolli ajettiin jokaisen erän ja käyttää tunnistamaan epäluotettavia ominaisuuksia (katso jäljempänä). Ihmisen eksoni array vastaavat tiedot tämän tutkimuksen ovat saatavilla National Center for Biotechnology Informationin Gene Expression Omnibus-tietokanta (GSE46691).

Microarray normalisoituminen, Poistaminen Epäluotettava ominaisuudet ja Erä Effect korjaus

Ominaisuus yhteenvetoa ja normalisoituminen ilmaisun arvot suoritettiin jäädytetyt vankka multi-array-analyysi (fRMA; [35]), joka on saatavilla Bioconductor. Muokattu joukko jäädytetyn vektoreita kertyi satunnaisesti valitsemalla 15 paneelit kustakin 19 erien koko tutkimuksen. Ominaisuudet kuulustellut joilla on vähemmän kuin neljä antureista tai rajat hybridisoituva koettimilla (kuten määritelty Affymetrix) poistettiin (https://www.affymetrix.com). Varianssi ominaisuuden ilmentymisen arvot PC3 solulinjoja käytettiin arvioimaan teknisen vastaan ​​biologisen vaihtelevuuden. Ominaisuuksia, joilla on korkein 10% varianssi PC3 solulinjoissa poistettiin ilmaisun matriisi. Lopuksi, jotta voidaan arvioida ja poistaa erän vaikutus, data oli hajotetaan sen pääkomponenttien ja varianssin analyysiä mallin avulla. Ehdottivat aiemman tutkimuksen [36], ensimmäinen 10 pääkomponentit tutkittiin niiden vastaavuus erän vaikutus. Näistä 10 pääkomponentit (syömällä 31% koko varianssi), kaksi komponenttia, jotka eniten korreloi voimakkaasti erän vaikutus poistettiin.

määritelmä Training ja validointi setit, Feature Selection ja Perimän luokitin Development

Koulutus ja validointi sarjoiksi.

Kun arvioidaan molekyylitason eroja kolmen potilasryhmät, hyvin rajallinen differentiaalikaavojen välillä havaittiin NED ja PSA-toistumisen ryhmiä. Differential ilmentyminen yksittäisten ominaisuuksien kautta saatiin pairwise vertailu tuloksista ryhmien (Crisan et ai., Käsikirjoitus valmisteilla). Tällä kertamuutosta kynnyksen 1,5 (korjatut väärien discovery), vain 2 (pois ~1.4 miljoonaa) ominaisuuksia havaittiin ekspressoitua eri välillä NED ja PSA ryhmät, verrattuna 1186 ja 887 vuonna etäpesäkkeitä tuloksiin verrattuna NED ja BCR-vasta-ryhmässä [37]. Tämän vuoksi ja jotta voitaisiin kehittää allekirjoitus, joka ennustaa aikaisin kliininen etäpesäke, nämä kaksi ryhmää yhdistettiin yhdeksi kontrolliryhmään. Tehtävä potilaiden koulutukseen (n = 359) ja validointi (n = 186) oli määriteltyjä edellisessä tutkimuksessa [20].

Feature valinta.

Koska aluksi suuren määrän ominaisuudet (~1.4 miljoonaa), kukin ominaisuus suodatettiin käyttäen t-testiä (p 0,01) ja monimutkaisuus alennus harjoitussarjassa (kuva S1). Ominaisuudet olivat edelleen seulottu seuraavissa selektiovaiheita. Tunnistaa tehokkaita ominaisuuksia, laillistettu logistinen regressio sovellettiin [38], [39], jossa on joustava verkko sakko α = 0,5. Tämä menettely bootstrapped 1000 kertaa ja kuinka monta kertaa ominaisuus oli valinnut regularisoitua regressio sopii yhteen. Ominaisuudet, jotka on valittu vähintään 25% ajasta käytettiin luokitin kehittämiseen.

Genominen luokittelija kehitystä.

satunnainen metsä koneoppimisen algoritmia käytettiin koota valittujen ominaisuuksien osaksi luokittelija [ ,,,0],40]. Lopullinen valinta vaiheessa käytettiin optimoida ominaisuus asetettu luokittelun algoritmin. Käyttämällä rfcv toiminto sisällä randomForest paketti [41], 10-kertainen cross validointi tarkoittaa neliövirheen (MSE) Mallien pienentyessä määrän ominaisuuksia piirrettiin. Kussakin iteraatio, ominaisuuksia on pois, jos heillä oli alhaisin 10% Gini Index. Ominaisuudet, jotka osoittivat vain vähän panos suorituskykyä malli ei sisällytetty lopulliseen luokittelija, pitäen niitä piirteitä, polven yläpuolelle MSE käyrän (kuva S2). Tämän lopullinen ominaisuuden asetettu, mtry ja nodesize satunnainen metsä parametrit viritettiin joiden tarkkuus-optimointiin ruudukkohaulla. Etsimään parametriavaruuden jatkettiin kanssa tune.randomForest toiminto E1071 paketti [42]. Tarkemmin sanottuna opetusjoukolla (joka koostuu 359 näytettä) oli edelleen jaettu 1/3 koulutusta ja 2/3 testaus- ja käytetty 1000 toistojen bootstrapping parantaa suorituskykyä arvioiden ja valvoa istuva. Lopullinen genomista luokittelija (GC) antaa jatkuvana muuttujana pisteet vaihtelevat välillä 0 ja 1, missä korkeampi pistemäärä osoittaa suurempi todennäköisyys kliinisen etäpesäke.

Kliininen luokittelija ja integroitu genomista kliinisen luokittelija.

vertailtaisiin ennustetekijöiden kykyä GC kehitimme ’kliininen vain ”luokittelija (CC), koulutettu samalla potilaiden käytetään löytää GC. CC yhdistää patologisen GS, ennen leikkausta PSA (pPSA), SM +, SVI, ECE ja N + logistisen regressiomallin. Kun pisteytys potilaat, CC tuottaa pisteet välillä 0 ja 1, analoginen GC. Lisäksi jotta voidaan mitata yhteisten ennustetekijöiden kyky molekyyli allekirjoituksen ja ennusteeseen viittaavia muuttujia, integroitu genomista-kliininen luokittelija (GCC) rakennettiin yhdistämällä CC ja GC malleja logistisen regressiomallin.

Vertaaminen Ulkoiset biomarkkereiden allekirjoitukset

suorituskyky GC verrattiin aiemmin julkaistujen geenin allekirjoituksista [11] – [13], [15], [16], [18] – [24], [28] – [30 ] ja yksittäisten genomisen merkkiaineita, jotka liittyvät eturauhasen syövän etenemisessä, mukaan lukien cHga [43], DAB2IP [44], GOLPH2 [45], PAP [46], ETV1 ja ERG [47], KI-67 [48], PSA [49], PSCA [50], PSMA [51], AMACR [52], GSTP1 [53], pCA3 [54], B7-H3 [55], TOP2A [14] ja CAV1 [56]. Jokainen genominen markkeri ja geeni allekirjoitukset kartoitettiin sen liittyvien Affymetrix

ydin

transkripti klusteri (https://www.affymetrix.com/analysis/index.affx) jos käytettävissä, toisin

laajennettava

transkripti klusteri käytettiin. Perustuu fRMA tiivistää ilmaisun arvot yksittäisiä geenejä, allekirjoitukset mallinnettiin harjoitussarjassa käytettäessä satunnaista metsä ja viritetty kanssa

tune.randomForest

toiminto E1071 R paketti. Tuning mukana suoritetaan 20 20 grid haku löytää optimaalinen ”mtry” ja ”nodesize” mallin parametrit arvioitiin kautta 5-kertainen cross validointi, jotta voidaan maksimoida tarkkuutta.

Performance Assessment of Luokitteluosuudet ja Clinical muuttujat

Tilastolliset analyysit tehtiin R v2.14.1, ja kaikki testit olivat kaksipuolisia käyttäen 5%: n merkitsevyystaso. Prognostisia kyky kaikkien luokittelijoiden (GC, CC, GCC, ja ulkoinen biomarkkereiden allekirjoitukset) verrattiin käyttämällä ala ROC käyrien (AUC), syrjintä boxplots ja univariable (UVA) logistinen regressio. Tärkeys luokittelijoiden suhteessa kliiniset tiedot ja riippumattoman ennustetekijöiden kykyä verrattiin käyttämällä monen muuttujan (MVA) logistinen regressio.

Kliiniset muuttujat laskettiin luokiteltuna tai muuttaa seuraavasti. GS oli kaksijakoinen ryhmiin kanssa kynnyksellä ≥8; vaikka sopimus on eristää GS kolmeen ryhmään (≤6, 7, ≥8) on suhteellisen vähän potilaita, joilla GS≤6 sai dichotomization GS. PPSA mitattuna välittömästi ennen RP, oli log

2-muuttunut. Seuraavat muuttujat olivat binary: ECE, SVI, SM +, ja N +. Hormoni ja sädehoito sisällytettiin erillisinä binary covariates jos rokote annetaan adjuvanttia ( 90 päivää jälkeinen RP) tai pelastus (seuraava PSA nousun) asetus. Hoidot annetaan myöhemmin kliinisen etäpesäkkeitä ei ollut mukana.

Perustuu enemmistövallan kriteeri, potilaiden GC, CC ja GCC tulokset yli 0,5 luokiteltiin suuri riski taas pistemäärällä pienempi tai yhtä suuri kuin 0,5 luokiteltiin alhainen riski. Kaplan Meier selviytymisen dikäyrät eturauhasen syöpä aiheuttamaan kuolleisuuteen (PCSM) ja yleinen elossaolopäätetapahtumiin. Lopuksi kaikki seuranta kertaa raportoitu kuvattua menetelmää Korn [57].

Tulokset

Kliininen Ominaisuudet Study Population

Vuodesta tutkimuspopulaatio 639 potilasta [20], 545 (85%), joka vastaa 192 tapausta ja 353 valvonta oli saatavilla RNA ja onnistuttiin hybridisoitiin microarray analysoitavaksi (katso menetelmät). Mediaani-ikä miesten Tässä tutkimuksessa 66 (IQR: 61-70) vuotta, mediaani oli 16,9 vuoden seurannassa. Kliininen ominaisuudet näistä potilaista on kuvattu taulukossa 1. Kaiken kaikkiaan 60%: ssa tapauksista (116/192) oli GS ≥8 kanssa vain kuusi GS ≤6, kun taas valvonta olivat pääasiassa GS 7 (57%) ja GS ≤6 (16 %). Vastaava osuus molemmissa tapauksissa ja valvontaa, (49% ja 45%, tässä järjestyksessä) olivat patologisia vaihe T3 /4. Valvonta oli 47% T2 tauti (toisin kuin 27% tapauksista), ja 23% tapauksista oli N +, toisin kuin vain 8% valvontaa. Hieman korkeampi SM + havaittiin tapauksissa (54%) verrattuna kontrolleihin (46%). Odotetusti antanut tutkimuksen suunnittelu, mediaaniaika BCR oli hyvin samankaltainen tapauksista (2,3 vuotta) ja PSA valvonta (1,7 vuotta). Vaikka oli 21 kliinisiä etäpesäke tapahtumien joukossa valvontaa, nämä tapahtui mediaani oli 9,39 (IQR: 7,5-+10,95) vuotta, kun taas tapauksissa kokenut paljon nopeampia tapahtumia mediaani 5,47 (IQR: 3,7-8,14) vuotta post-RP. Kaiken mediaaniaika PCSM (n = 132) oli 10,5 vuotta. Karakterisoimiseksi todellisen biologisen potentiaalin kasvaimia potilailla, joiden edetä aikaista kliinistä etäpesäkkeiden nousun jälkeen PSA, suoritimme transcriptome laajuinen differentiaalikaavojen analyysi testata hypoteesia, jonka ilmaus allekirjoituksen primaarikasvainten voisi paremmin ennakoida kliininen etäpesäke kuin kliininen muuttujista yksinään .

kehittäminen mallit ennustaa Early Clinical etäpesäke

Kotelot ja valvonta verrattiin ja käytettiin kehittämään genomista (GC), kliininen vain (CC) ja integroidut ( GCC) luokittelija malleja ennustamiseksi tapauksissa (ts varhainen kliininen etäpesäke nousun jälkeen PSA) ensisijaiseksi päätepiste (katso menetelmät). 545 näytteet jaettiin koulutus (n = 359, 39% tapauksista) ja validointi (n = 186, 37% tapauksista) asetetaan (kuvio 1). GC kehitettiin analyysiin 1,1 miljoonaa RNA ominaisuuksia mikrosirulla koulutukseen asettaa poistamisen jälkeen rajat hybridisoituvan ja epäluotettava ominaisuuksia (katso menetelmät). Ensimmäinen ominaisuus valinta askel perustuu t-testit monimutkaisuuden vähentämiseen tuotti 18902 ilmentyvät eri ominaisuuksia tapausten ja kontrollien välillä (kuva S1). Edelleen valikoima näitä ilmentyvät eri toiminnoille tasoittuvan logistinen regressio vähensi luettelon yhteensä 43. Viimeisenä vaiheena, nämä 43 ilmentyvät eri ominaisuuksia on edelleen suodatetaan vain ne, jotka osoittivat parantaa satunnainen metsäperustaista suoritusarvot (katso menetelmät ). Tämä johti viimeiset 22 markkereita, jotka vastaavat RNA: t koodaus- ja ei-proteiinia koodaavia alueita genomin (taulukko 2). Moniulotteinen skaalaus analyysi kuvaa klusterointi tapauksissa ja hallinta perustuu ilmaus 22 markkereita (kuva 2). Satunnainen metsäkone-oppiminen algoritmia käytettiin tuottamaan GC tulokset kokoamisen jälkeen 22 markkereita metsien parametrit optimoida erittäin tarkasti harjoitussarjassa. Logistinen regressio käytettiin koota kuuden ennusteeseen viittaavia riskitekijät osaksi CC ja myös integroitu GC rakentaa GCC.

Tutkimus eritellä tapauksia ja valvontaa. Koulutus ja validointi sarjoiksi näkyvät.

Controls on merkitty sinisellä ja tapaukset punaisella. Sekä koulutus ja validointi asettaa valvonnan taipumus keskittyä vasemmalla tontin ja tapaukset oikealla tontin. Tällä tavalla suurin osa biologisten erojen ilmaistaan ​​ensimmäisen ulottuvuuden skaalaus. Random metsä läheisyys [https://www.stat.berkeley.edu/~breiman/] käytettiin mittaamaan 22 merkki väli näytteiden.

luokitin Performance in Training ja validointi Set

training set ROC pinta-käyrän alla (AUC) arvot GC, CC ja GCC olivat 0,90, 0,76 ja 0,91 vastaavasti suurempi kuin yksittäiset kliininen muuttuja (kuva 3). Vuonna validointi asetettu, GC ja GCC oli korkein AUC 0,75 ja 0,74, vastaavasti ennustamiseen tapauksissa. Kliiniset Vain CC oli AUC 0,69, joka oli vain hieman parempi kuin patologinen GS yksinään (0,65). Muoto ROC käyrät GC ja GCC osoittaa, että nämä mallit ovat korkeimmat spesifisyys ja herkkyys verrattuna kliinisiä malleja ylittäne -50% spesifisyys (kuva S3). Syrjintä rasiakuvaajien edelleen osoittamaan enemmän mediaani eroja GC ja GCC tulokset tapausten ja kontrollien välillä kuin CC (kuva 4).

Kunkin ennustaja, AUC saatu koulutus ja validointi sarjaa, sekä 95 % luottamusväli tämä tieto näkyy. CC: kliininen vain luokittelija. GC: genomista luokittelija. GCC: yhdistetty genomista-kliinisessä luokittelija.

jaettavat tulokset piirretään A) CC B) GC ja C) GCC valvonnasta ja tapauksia. Mediaani tulokset ja 95%: n luottamusväli edustaa vaakasuora musta viiva ja kolot, vastaavasti. Non-päällekkäisiä kolot osoittavat, että erot jakelun tulokset tapausten ja kontrollien välillä ovat tilastollisesti merkittäviä. Poikkeavien arvojen edustettuina pistettä pidemmälle boxplot viikset.

GC uudelleenluokittelu GS Ryhmät

Jakelu tapaukset ja valvonnan validointi asettamat sekä GC GS [58] riskiryhmiin havainnollistetaan kuvassa 5 ja yhteenvetona taulukossa 3. Niistä GS ≤6 kasvain (n = 18) ei kellään korkea GC tulokset, vaikka joukossa GS 7 kasvain (n = 97), lähes kolmasosa (29%) oli korkea GC tulokset ja puolet oli tapauksia, joka kehittyi varhain etäpesäkkeitä nousun jälkeen PSA. Vaikka useimmat potilaat, joilla on korkea GS (≥8) oli korkea GC tulokset, joukossa 29 (40%), joilla on alhainen GC tulokset oli vain 7 tapauksissa 3 kuolemantapauksia eturauhassyöpää. Kaiken kaikkiaan 116 joukosta 186 (62%) validointi joukko potilaista oli alhainen GC tulokset, joista vain 21 oli tapauksia, jolloin 7 kuolemantapausta eturauhassyöpään. Niistä 70 (38%) potilailla, joilla on korkea GC tulokset oli 42 tapausta ja 25 näistä miehistä kuolivat eturauhassyövän.

GC tulokset piirretään kanssa värinää jotta helpommin erottaa potilaat keskenään patologinen GS (x-akseli) kanssa. Case (punainen) ja valvonta potilasta (sininen) esitetään kullekin. Katkoviivalla on merkitty mustalla viivalla GC sulku 0,5. Trendit osoittavat potilaat, joilla on korkea GC tulokset yleensä korkea GS samoin.

GC on riippumaton Prognostiset Variable

Jotta testata vaikutuksen koko yksilön muuttujat sekä riippuvuuksia näistä muuttujista suoritimme univariable ja monimuuttuja analyysit logistisen regressiomallin validoinneista setti (taulukko 4). Vuonna univariable analyysissä, löysimme GC, CC, GCC, GS, SVI ja ECE olevan tilastollisesti merkitsevä ennustajia tapauksista (p 0,05). Kertoimet suhde GC oli 1,42 kutakin 10% lisäys GC pisteet. Kun kahtia matalan ja korkean GC riskiryhmiin kuten edellä on kuvattu, kertoimet suhde oli 6,79 (95% CI: 3,46-13,29), yli kaksinkertainen kertoimet suhde GS (OR: 3,02 (95% CI: 1,61-5,68) ) ennustamiseksi tapauksissa. Monimuuttuja-analyysi, kun säädön jälkeiseen RP hoito, GC jäi ainoa merkittävä ennustetekijöiden muuttuja (p 0,001) ja OR = 1,36 jokaista 10% lisäys GC pisteet. Itsenäinen merkitys GC viittaa siihen, että suorempi mitta tuumoribiologiassa (eli 22-markkeri ilmentymisen allekirjoitus) lisää merkittävästi prognostisia tietojen ennustamiseksi varhaisen etäpesäkkeiden nousun jälkeen PSA, joka ei ole kiinni kliinisen muuttujista patologisten analyysi.

Kotelot high GC Scores Die Aiemmin eturauhassyöpää ja muita syitä

vieressä verrattuna selviytymisen tulokset tapauksissa ja valvonnan Kaplan-Meier-analyysi pienen ja suuren GC pisteet ryhmiä. Tapaukset, joissa alempi GC tulokset mediaani oli 6,9 vuotta eturauhasen syövän erityinen eloonjääminen verrattuna mediaani 2,9 vuotta tapauksissa, joilla on korkea GC tulokset (p = 0,003) (kuvio 6). Sillä kokonaiselossaolo, oli merkittävä (p = 0,03) erilaiseen tulokseen, jossa kokonaiselinajan mediaani jälkeen etäpesäke 2,5 ja 4,98 vuotta tapauksissa, joissa korkean ja matalan GC tulokset, tässä järjestyksessä. Kaikista valvonnan 21 potilaista kehittyi kliininen etäpesäke ulkopuolella tutkimuksen tapaus-verrokki määritelmien (ts 5 vuotta nousun jälkeen PSA). Arvioimme myös GC pystyi eristää potilaita, joilla oli myöhään esiintyvät etäpesäke tapahtumien joukossa PSA säätimet (kuva S4). GC pystyi merkitsevästi (p 0,05) erotella PSA potilaat, jotka menevät kokea myöhemmin kliinisen etäpesäke, niistä, jotka eivät. Tämä ero tuloksiin vahvistaa edelleen käsitystä, että GC toimenpiteet komponentti biologisen mahdollisuuksia etäpesäke ja että ne potilaat, joilla on korkein GC tulokset voivat olla suurin riski varhain metastasointiin jälkeinen RP.

Kotelot erotettiin osaksi korkea ( 0,5) tai alhaisen riskin mukaisesti GC pisteet. Log-rank p-arvot on esitetty oikeassa yläkulmassa. Aika PCSM ja OS mitataan BCR vuosiin.

Vertailut Ulkoinen biomarkkereiden allekirjoitukset

Jotta vertailla GC aiemmin raportoitu geeni allekirjoitukset, me koottu geenit liittyvät ulkoiset allekirjoituksia ja yhdistettiin ne yhdeksi Random Forest luokittelija (katso menetelmät). Lisäksi arvioimme ilmentyminen yksittäisten geenien aiemmin raportoitu liittyvän eturauhassyöpää tuloksia. Suorituskyky luokittelijoiden ja yksittäisten geenien arvioitiin sittemmin sekä koulutukseen ja validointi sarjaa (kuviot 7 ja S5). Kuten odotettua, vietämme korkea AUC koulutuksessa lähes kaikki ulkoiset allekirjoitukset, samanlainen kuin mitä havaittiin GC. Kun levitetään validointi, AUC kunkin mallin vähentynyt. Niistä 17 ulkoisen allekirjoitukset, jotka on mallinnettu, 12 olivat tilastollisesti merkittäviä ennustajia etäpesäkkeiden (so, niiden 95%: n luottamusväli ei laske alle kynnysarvon sattumaa AUC 0,5) (kuvio 7). AUC GC oli 0,08 prosenttiyksikköä korkeampi kuin tehokkaimmat ulkoinen allekirjoitusta, 16-geeni allekirjoituksen raportoineet Bibikova et al [12], joka oli AUC 0,68 (95% CI: ,60-0,76,). Toisin kuin ilmaisun allekirjoitus malleja, suorituskyky 16 yksittäisten geenien testattu odotettiin olevan samanlainen koulutukseen ja validointi sarjoiksi. Nämä genomista markkereita osoittamaan yleiseen sopimukseen suorituskyky, joissa erot merkitys todennäköisesti selittyy pienemmän otoksen koosta validointi asetettu verrattuna opetusjoukolla (kuva S5). Niistä 16 genomista markkereita, vain B7-H3 (CD276), GSTP1 ja pCA3 olivat tilastollisesti merkitseviä sekä koulutus ja validointi sarjaa (kuva S5). Myöskään mikään yksittäisten genomista markkereita outperform GC tai tehokkaimmat kliininen ennustajan, GS (AUC ≤0.64).

Kunkin allekirjoitusta, toimielin liittyy se, julkaisuvuosi, pääkirjoittaja, AUC saatu koulutukseen ja validointi sarjaa, samoin kuin 95%: n luottamusväli tähän metristä näkyy.

keskustelu

Tämä tutkimus suunniteltiin testaamaan hypoteesia, jonka biologinen arviointi sekä koodaus ja ei-koodaavat ilmentymisen profiilit primaarikasvaimia voisi ennustaa kehitystä varhaisen kliinisen etäpesäkkeiden seuraavat BCR. Havaitsimme 22-markkeri genomi- luokittelija (GC), joka, uhraamatta herkkyyttä, oli erityinen validointi kuin vahvistettu ennustetekijöiden kuten GS. Tulosten perusteella esitetään tässä, GC mittaa komponentti biologinen mahdollisuudet varhaiseen kliiniseen etäpesäke parempi kuin kliininen muuttujia tai aikaisemmin raportoitu biomarkkereiden allekirjoituksia.

Vastaa