PLoS ONE: Tarkka Eturauhassyöpä Prognosticator käyttäminen Seven-Gene Signature Plus Gleason pisteet ja ottaminen Cell Type heterogeenisuus huomioon

tiivistelmä

Yksi suurimmista haasteista kehityksessä eturauhassyövän ennustetekijöitä biomarkkereiden on solu- heterogeenisyys kudosnäytteistä. Kehitimme objektiivisen Cluster-Correlation (CC) analyysi tunnistaa geeniekspression muutoksia eri solutyyppejä, jotka liittyvät etenemiseen. In Cluster vaiheessa näytteet ryhmittyivät (ilman valvontaa), joka perustuu ilmentymisen arvoja kunkin geenin seoksen läpi, jossa malli yhdistää useita lineaarista regressiomallia, jossa solutyypissä prosenttia tietoja käytettiin hajoamisen. Vuonna Korrelaatio vaiheessa Chi-square testiä käytettiin valita mahdollisten prognostisten geenejä. SERT analyysi tunnistimme 324 merkittävästi ilmaistuna geenejä (68 kasvain ja 256 strooman solujen ilmaistuna geenejä), jotka olivat yhteydessä havaitun biokemiallisten uusiutuminen tila. Merkitys analyysi Microarray (SAM) käytettiin sitten kehittää seitsemän geeniä luokittelija. Luokitin on validoitu käyttämällä kahta itsenäistä Tietojoukot. Yleinen ennuste tarkka ja herkkä 71% ja 76%, vastaavasti. Sisällyttäminen Gleason summa seitsemän geeniä luokittelija nosti ennusteen tarkkuus ja herkkyys 83% ja 76% vastaavasti perustuu riippumattomaan testaukseen. Nämä tulokset osoittivat, että meidän ennustetekijöiden malli, joka sisältää solutyypin säädöt ja käyttämällä Gleason pisteet ja seitsemän geeniä allekirjoitus on joitakin apuohjelma ennustamiseen tuloksia eturauhassyövän yksittäisille potilaille aikaan ennustetta. Strategia voisi olla sovelluksia parantaa merkki suorituskykyä muiden syöpien ja muita sairauksia.

Citation: Chen X, Xu S, McClelland M, Rahmatpanah F, Sawyers A, Jia Z, et al. (2012) tarkka Eturauhassyöpä Prognosticator käyttäminen Seven-Gene Signature Plus Gleason pisteet ja ottaminen Cell Type heterogeenisuus huomioon. PLoS ONE 7 (9): e45178. doi: 10,1371 /journal.pone.0045178

Editor: Bart O. Williams, Van Andelin Institute, Yhdysvallat

vastaanotettu: toukokuu 17, 2012; Hyväksytty: 16 elokuu 2012; Julkaistu: 28 syyskuu 2012

Copyright: © Chen et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat National Institutes of Health strategiakumppanit arviointijärjestö Cancer Allekirjoitukset (SPECS) konsortion avustus U01 CA1148102 ja National Cancer Institute Early Detection Research Network (EDRN) konsortion avustus U01 CA152738. Tätä työtä tuki myös University of California, Irvine tiedekunnan Urakehitys Award (ZJ) ja myöntävät P30CA62203 päässä Chao Family Kattava Cancer Center, University of California, Irvine (ZJ ja DAM). Myös tämä tuettiin osittain puolustusministeriön congressionally Suunnatun Medical Research Programs myöntää W81XWH-08-1-0720, ja jonka University of California, Irvine Institute for Cancer Research Training Grant Fellowship (T32CA009054 National Cancer Institute) ( FR). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: D. Mercola ja M. McClelland ovat hallituksen jäsenet Proveri Inc., joka on lisenssillä Regents Kalifornian yliopiston kehittämiseen kliinisen määrityksiä eturauhassyövän. Toinen Kirjoittajat julistaa heillä ei ole eturistiriitoja tämän julkaisun. Tämä ei muuta tekijöiden sitoutuminen kaikkiin PLoS One: n politiikkaa jakaa tietoja ja materiaaleja.

Johdanto

Eturauhassyöpä on useimmin diagnosoitu miesten yleisin ja toiseksi yleisin syy syövän kuolema miehillä Yhdysvalloissa [1]. Eturauhasen on tehokas vaihtoehto, kun syöpä on lokalisoitu eturauhanen [2], [3]. Kuitenkin ajankohtana diagnoosi on vaikea määrittää, mitkä potilaat harbor aggressiivinen tauti joka ilmaantua uudelleen käsittelyjen tarkoituksena on parantaa ja jotka ovat veltto ja soveltuvat ennaltaehkäisyyn ja muihin strategioihin. Toistuvat sairaus johtaa usein etäpesäkkeitä, merkittävä syy eturauhassyövän kuolema [4], [5]. Siksi suuri nykyinen asia kliinisessä hoidossa on määrittää luotettava ennustetekijöiden indikaattoreita, jotka erottavat veltto syöpä niistä, jotka uusiutuisi. Luokittelu järjestelmiä, kuten Kattan nomogrammit [6], D’Amico luokitus [7], ja CAPRA (eturauhas- Risk Assessment) pisteet [8], jotka sisältävät mittaus useiden preoperatiivisen ja leikkauksen jälkeisiä kliinisiä merkkiaineita voidaan käyttää ennustamaan todennäköisyys uusiutumisen jälkeen eturauhasen. Kuitenkin eturauhassyövän samanlaisten potilaiden kliiniset ja patologiset ominaisuudet ei voida erottaa näiden luokittelujärjestelmät yksittäisinä riski ei tarkasti otettu huomioon. Laajat aikaisemmat yritykset ovat yrittäneet tunnistaa geenien ilmentymisen muutoksia aggressiivisten tapauksissa ja veltto tapauksissa [9] – [11]. Standard analyyttisiä lähestymistapoja, kuten t-testi, merkitys analyysi microarray (SAM) [12] ja lineaarisia malleja microarray data (Limma) [13], on sovellettu näihin tutkimuksiin. Harvat toistettavissa ja kliinisesti käyttökelpoisia prognostisia biomarkkereita on syntynyt. Yksi syy jotka tällaisia ​​epäjohdonmukaisuus eri tutkimuksissa voi olla heterogeenisyys suhteen solun koostumuksen,

eli

, kudosnäytteiden käyttää määrityksissä olivat yleensä sekoitus eri solutyyppejä vaihtelevalla prosentit [14] – [16] kuten sekä geneettinen heterogeenisuus polyklonaalisten ja multifokaalisia luonteesta eturauhassyöpää. Siksi havaitut geenien ilmentymisen muutoksia joukossa näytteitä voi johtua osittain ero solussa koostumuksessa näistä näytteistä [16]. Kuitenkin tällainen koostumus heterogeenisuus on harvoin huomioitu biomarkkereiden tutkimuksissa, koska ei ole yksinkertaista tapaa käsitellä tällaisia ​​vaihtelu säännöllisillä geeniekspressiota analyysejä.

Täällä tutkimme onko vaihteleva solutyyppi koostumus on tärkeä rooli tunnistamiseksi differentiaalisesti ilmentyvien geenien. Olemme kehittäneet Cluster-Korrelaatiotutkimus malli [17], joka sisältää useita lineaariregressiomallin harkita solutyypin koostumus näytteissä on koostumukseltaan tunnettujen. Osoitamme, että tämä menetelmä voidaan käyttää tunnistamaan differentiaalisesti ilmentyvien geenien välillä biokemiallisten uusiutuminen ja ei-uusiutumisen potilasnäytettä jälkeen eturauhasen. Soveltamalla tätä lähestymistapaa havaitsimme yli kolmesataa geenien ilmentymisen muutoksia ja luokiteltu nämä otetaan pääasiassa kasvainsolun ilmaistuna geenejä tai strooman solujen ilmaistuna geenejä. Olemme tunnistaneet osajoukko seitsemän tuumorisolujen ilmaisi geenit osoittivat merkittävimmät muutokset ja käyttää näitä johtaa luokittelija. Luokitin Sitten testattiin kahden riippumattoman Tietojoukot suurella tarkkuudella ja herkkyys. Luokitus malli kampaus tämä seitsemän geenin allekirjoitusta Gleason summa oli vielä parempi ennuste suorituskykyä. Tuloksemme tarjota uusia oivalluksia kehittymistä eturauhassyövän ennustetta.

Materiaalit ja menetelmät

Eturauhassyöpä Potilasnäytteet ja Microarray Analysis

Data Set 1 koulutukseen käytettiin. Se sisältää 136 post eturauhasen jäädytettyä kudosnäytteitä saadaan 82 aiheista kirjallisen tietoon perustuvan suostumuksen hyväksymä UCI Office Tutkimushallinto Institutional Review Board (IRB). IRB erikseen hyväksynyt tämän tutkimuksen vuosittain (HS # 2005-4806). Kaikki kudokset kerättiin kirurgian ja saatettiin patologian nopeutettua tarkastelua, leikkely ja snap jäätymisen nestemäisessä typessä. ”Top” ja ”bottom” osiin manuaalisesti microdissected (katso Manuaalinen mikrodissektiomenetelmiä) jäädytetyt kudoksia käytettiin kehosta määrittämiseen. Loput osat ohjeen mikropaloitelluista pakastetut kudokset käytettiin RNA: n valmistaminen ja mikrosirujen hybridisaatio. Kudos koostumus (kasvain epiteelisolujen, stroomasoluilla, epiteelisolut BPH ja laajentuneet kystinen rauhaset) määritettiin ryhmän jäsenten neljän patologeja joista kolme on hallituksen Certified kun edelleen on vastaavasti sertifioitu (UK, FRCP) käyttäen kuvattuja menetelmiä aiemmin [15]. Boxplot kudosta prosenttiosuuden tiedot annetaan esitetään kuvassa S3. Tuloksena Microarray data on talletettu Gene Expression Omnibus (GEO) tietokantaan hakunumerolla GSE8218 [16]. Out of 136 näytettä, 80 näytettä olivat biokemiallisia uusiutunut potilaista, 50 näytettä biokemiallisten kuin uusiutunut potilaalla on seurannan 3-80 kuukautta, ja 6 näytteitä normaaleista kohteista. Kliinisiä markkereita, kuten eturauhasen antigeenin (PSA), post-eturauhasen Gleason summa, ikä, patologisen vaiheessa kerättiin myös ja esitetään taulukossa S1 ja S2.

tietojoukoiksi 2 ja 3 ovat riippumattomia testi sarjaa. Data Set 2 [GSE25136 [18]] sisälsi 79 näytettä, joka koostuu 42 biokemiallisten kuin uusiutuneen ja 37 biokemialliset uusiutunut näytteitä. Data Set 3 [GSE3325 [19]] koostuu 13 näytettä luokiteltu 4 hyvänlaatuinen, 5 ensisijainen, ja 4 metastaattisen eturauhassyöpänäytteissä. Tutkimuksessamme olemme käsiteltiin 4 hyvänlaatuinen ja 5 ensisijainen eturauhassyöpänäytteissä biokemiallisia ei-uusiutumisen näytteitä ja 4 metastaattinen eturauhassyöpä näytteitä uusiutumisen näytteitä. Microarray alustat Data Set 2 ja 3 ovat Affymetrix U133A ja U133 plus 2.0, vastaavasti. Kudos komponentit tiedot arvioitiin kautta CellPred ohjelmistojen [16] puutteessa solutyypin prosentuaalinen tietoja kahden riippumattoman Tietojoukot. Post prostatektomia Gleason summia, Tautivapaa elossaolo Times, ikä, patologinen vaiheessa kerättiin ja esitetty taulukossa S1 ja S2.

Tilastollinen analyysi

Cluster-Korrelaatioanalyysiä malli.

Olemme kehittäneet uuden Cluster-Correlation (CC) analyysi menettelyä [17], jolla määritetään ero geeni-ilmentymisen erilaisissa solutyypeissä. CC analyysi on toteutettu 2 vaihetta, eli valvomattoman ryhmän askel ja korrelaation vaiheen (kuva S1).

valvomaton klusteri vaihe perustuu kahteen pääasialliseen oletuksiin. Olettamus 1, havaitut geenien ilmentyminen arvoja kuten ilmaisu matriisi on summa vastausta eri tyyppisiä soluja, jotka muodostivat näytteen (yhtälö. 1). (1) Jos

Z

i

on klusterin indikaattori

i

nnen näytteen,

p

iT

ja

p

on

tunnetaan kasvain ja strooman prosentit [16]

i

nnen näytteen,

β

kT

ja

β

kS

ovat kasvain ja strooman solutyyppi kertoimet määritetään moninkertaisen lineaarisen regression tulos että

k

th klusteri, ja

ε

i

on jäännösvirhetaso. Jokainen solu-tyyppinen panos on puolestaan ​​johtuu tuotteen prosenttiosuus solutyypin läsnä ja yksittäisen solun tyypin lauseke kerroin tietylle geeniä. Olettamus 2, yksittäiset solutyyppi ilmaisu kertoimet

β

T

ja

β

S

tietylle geeni voi vaihdella biokemiallisia tuloksia näytteen,

esim

biokemiallisten uusiutuminen tila. Näillä oletuksilla, potilaan näytteitä seoksen muodostamiseksi jakelu, joka voidaan analysoida EM-algoritmi (odotusarvon maksimointi) [20]. EM-algoritmi löytää optimaalisia ratkaisuja läpi iteratiivinen laskenta. Tulokset EM-algoritmi on kaksi taittuu. Ensimmäinen, näytteet jaettiin useisiin klustereihin (ilman valvontaa), joka perustuu ilmentymisen arvoja kunkin geenin. Toiseksi, voimme laajuuden määrittämiseksi geenin ilmentymisen tuumorisoluissa ja stroomasoluilla.

korrelaatio vaiheessa valitsimme geenit, jotka uusiutumisen ja ei-uusiutumisen tapausta hyvin ominaista valvomatta klustereiden menettely. Jokaista geeniä, muodostimme 2 x 2 kontingenssitaulukkomenetelmillä yhdellä ulottuvuuden havaitun uusiutumisen tila ja toinen ulottuvuus kuin valvomatta klusterointi tulos (cluster identiteetti). Chi-square testiä käytettiin laskettaessa p-arvon kullekin geeni (kunkin kontingenssitaulukkomenetelmillä). Geenit p-arvojen 0,005 valittiin korreloi välillä valvomaton ja havaittujen klusterin jäsenyyden.

merkittäviä geenejä tunnistettu korrelaatio vaiheessa, päätimme onko niiden ilmentyminen ilmenee pääosin kasvainsoluissa ja strooman solut. Kaksi rajoitettu malleja suhteessa kasvainsolujen ja strooman solut määriteltiin. Kasvaimen rajoitettu malli, oletamme vain

β

T

vaihtelee klusterin jäsenyyden. Vuonna strooman rajoitettu malli, oletamme vain

β

S

vaihtelee klusterin jäsenyyden. Kaksi rajoitetut mallia verrattiin sitten käyttämällä Bayes tietoa kriteerin (BIC) [21]. Malli pienemmän BIC pisteet on valittu. Erot vähintään 2 kahden BIC tulokset pidetään vahvana osoituksena suosi yhtä mallia toiseen [22].

CC analyysialgoritmi ja testituloksia set ovat saatavilla http: //www.pathology.uci . edu /tiedekunnan /Mercola /UCISpecsHome.html ja voidaan soveltaa ilmaisun Tietojoukot annetaan tieto solutyypin jakeluun.

Statistical työkaluja R.

modifioitu quantile normeeraustoiminto ”REFnormalizeQuantiles ”[14] käytettiin suorittamaan normalisointi tietojoukoiksi 2 ja 3 viittaamalla Data Set 1. Koska koetinsarjojen varten U133A alusta on osajoukko peräisin U133 plus 2.0 alustalla, toteutimme normalisoinnin yhteisen koetin sarjaa kaksi tasoa.

merkittävä analyysi Microarray (SAM) [12], että ”siggenes” paketti, toteutetaan R, käytettiin valita merkittävin geenit saatu kaksivaiheisen klusterianalyysillä.

ennustaminen analyysi Microarray (PAM) [23], että ”PAMR” paketti, toteutetaan R, käytettiin kehittämään prognostisen luokittelija käyttämällä opetusjoukkoa ja suorituskykyä lajittelijan testattiin käyttämällä riippumatonta sarjaa. Data Set 1 oli käsitelty training set ja tietojoukoiksi 2 ja 3 käsiteltiin testi sarjaa.

R-pohjainen verkkopalvelu, CellPred [16] osoitteessa https://www.webarray.org käytettiin ennustamaan solun koostumus prosenttiosuuden tietojoukoiksi 2 ja 3, jotta voidaan tunnistaa kasvainsolun rikastettu näytteitä sellaisten lajittelijan. Näytteitä valittiin tietojoukoiksi 2 ja 3 käyttäen perustetta 50% kasvain epiteelisolujen mukainen CellPred.

immunohistokemia tietojen analysointi.

Jotta validoimiseksi solutyypin spesifisyys RNA ilmaisun ennusti täällä, vertasimme solutyypin ilmaisun voimakkuus,

β

T

, vastaavan proteiinin ilmentymistä kasvainsoluissa ja strooman solujen havaittiin Human Protein Atlas (HPA; www.humanprotein .atlas.org). Kukin HPA vasta-ainetta yhden histologia osaa kustakin kolmesta terveille henkilöille ja kaksi histologia osaan kustakin 12 eturauhassyöpäpotilaalla mikä tuottaa kolme korkean resoluution kuvia normaalin tapauksissa ja 24 korkean resoluution kuvia 12 syöpäpotilailla. Kaikki levykkeet noudettiin mikä tarjoaa kaikki pikseliarvot kolme väriä kanavaa. Taso proteiinin ilmentyminen tiivistää käyttäen asteikkoa: punainen, voimakas; oranssi, kohtalainen; keltainen, heikko; ja valkoinen, negatiivinen toimittamat HPA. Kaksi tarkkailijaa, hallituksen sertifioitu patologi (DAM) ja toinen tarkkailija (XC) luokitellaan edelleen taso proteiinin ilmentymisen lisäämällä kohtuullisesta voimakkaaseen, heikko tai kohtalainen, ja hyvin heikko mukaan IHC värin intensiteetin ja tiivistää seitsemän tasoa käyttämällä koodi: 5, voimakas; 4, kohtalainen vahva; 3, kohtalainen; 2, heikko tai kohtalainen; 1, heikko; 0,5, erittäin heikko; ja 0, negatiivinen. Proteiini ekspressiotasot kasvain- ja strooman solut voidaan arvioida perustuen koodi kullekin kuvalle. Keräsimme tiedot 71 liittyvien vasta-aineiden 49 kasvainsolun ilmaistuna geenejä (ei HPA-aineet olivat jäljellä olevista 19 geenejä). Otimme 28 differentiaalisesti ilmaisi vasta välillä normaalihenkilöillä ja eturauhassyöpäpotilaille varten korrelaatiotutkimuksen (vasta ilman proteiinin ilmentymisen muutosta välillä normaalihenkilöillä ja eturauhassyöpäpotilaalla pidetään ei-ilmentyvät eri vasta-aineet). 28 valitut vasta-aineet, jotka liittyvät 23 kasvainsolujen ilmentyvien geenien. Kunkin vasta-aine, proteiini ekspressiotaso kasvain ja strooman on keskimäärin yli 12 potilaan näytettä. Kaikki 672 IHC havaintoja käytettiin.

Tulokset

Kehitetään Prognostiset luokitin

Cluster Korrelaatioanalyysiä, valitsimme 130 paneelit eturauhassyöpänäytteissä saatu Data Set 1

eli

. jättämällä loput kuusi normaalia näytettä. Oletimme, että EM-algoritmi CC analyysin malli olisi luokittelevat 130 näytteet kahteen ilmaisun klustereihin ja käsitellään kahta ilmaisua klusterien mahdollisen matalan riskin ja korkean riskin ryhmiin (

cf.

Kuva S1). Sitten Chi-square suoritettiin mittaamaan yhdistyksen oletetun riskiryhmät ja havaitun biokemiallisten uusiutuminen ja ei-uusiutumisen ryhmiä. 324 geenit tunnistettiin p-arvot alle 0,005. 324 geenit edelleen luokitella 68 pääasiassa kasvainsolun ilmaisi geenien ja 256 vallitsevasti strooman solujen ilmaisi mukaan BIC tulokset kasvaimen ja strooman rajoitettu malleja.

Meidän nykyisessä tutkimuksessa keskitymme tutkimiseen kasvainsolun ilmaistu geenit koska suurin osa näytteistä käytettävissä riippumattoman testauksen katsotaan alla ovat kasvain rikastettua näytteissä. 68 kasvainsolun ilmentyvien geenien pidettiin kandidaattigeenit kehittää prognostisen luokittelija perustuu niiden ero geenin ilmentymisen välillä havaittu uusiutuminen ja nonrelapse ryhmien ja soveltamista SAM. Kuitenkin, se ei ole tarkoituksenmukaista tehdä ero ilmentymisen analyysi kasvaimen komponentin suoraan kaikki 130 näytettä Data Set 1, koska arvioitu kudoksen komponenttien osoitti suurta vaihtelua solutyypin koostumus prosenttiosuus näistä näytteistä, myös näytteet lähes yksinomaan strooman. Joten ensin valitaan 23 näytteitä, joissa kasvainsolujen osuus on yli 50%. Niistä 23 valittujen kasvainsolun rikastettu näytteitä, 11 näytettä eivät ole uusiutumisen näytteet ja 12 näytteet ovat uusiutumisen näytteitä. Käyttämällä 68-geenien syötteenä SAM, olemme tunnistaneet 7 merkittävimmät geenien välillä uusiutumisen ja ei-uusiutumisen ryhmiin, joissa kukin p-arvo oli 0,002 (taulukko 1). Yleinen menettely kehittämisestä ennustetekijöiden luokittelija on esitetty vuokaaviona kuvassa S1.

validoimiseksi ennustearvon, PAM-pohjainen Seven-geeni Prognostiset luokitin syntyi voidakseen suorittaa rajat -validation testissä käytetään kasvain rikastettua näytteiden Data Set 1. rajat validointi, me satunnaisesti valitun 9 uusiutuminen ja 8 ei-uusiutumisen kasvainsolujen rikastettua näytteissä opetusjoukkoa jättää loput 3 uusiutuminen ja 3 ei-uusiutumisen näytteissä Koepakettia. PAM-pohjainen luokittelija oli sitten testattu kaikki mahdolliset kierrokset (36300 kierrosta) rajat validointi joiden keskimääräinen tarkkuus 74%, spesifisyys 72%, ja herkkyys 77%. Nämä tulokset osoittavat, että seitsemän geeniä Prognostiset luokitin on korkea ennustearvon, spesifisyys ja herkkyys jälkeen rajat varmennuskokeen ja ehkä tehokas ennustamaan tuloksia eturauhassyöpäpotilaalla riippumattomien Tietojoukot.

Riippumaton testaus seitsemän-geeni prognostiset luokitin

merkittävä este kehittämisessä kliinisesti käyttökelpoisia ennustetekijöitä profiileja eturauhasen syöpä on ollut puutetta yleisyyttä poikki aineistoja. Siksi testattiin seitsemän-geenin Prognostiset luokitin otetuista näytteistä kahden itsenäisen Tietojoukot (materiaalit ja menetelmät). Olemme kuitenkin aikaisemmin havaittu, että useat suuret käytettävissä ilmentymisanalyysiä aineistoja ovat hyvin heterogeeninen suhteessa solutyyppiä koostumus [16]. Testinäytteet valittiin sillä perusteella, että ne koostuvat vähintään 50%: kasvainsolujen sisältö arvioitiin soveltamalla CellPred [16]. Neljäkymmentä kahdesta seitsemään kasvainsolun rikastettu näytteiden tietojoukoiksi 2 ja 3 alussa täyttäneet. Kukin tapaus sitten luokiteltuna PAM käyttämällä 7-geenin Prognostiset luokitin. Taulukko 2 esittää tulokset luokittelun. Yleinen tarkkuus, spesifisyys ja herkkyys kahden testin Tietojoukot olivat 71%, 65%, ja 76%. Arvioitava edelleen voima ennustetekijöiden luokituksen suoritimme Kaplan-Meier selviytyminen analyysi (kuva 1) (Kaplan-Meierin eloonjääminen analyysi sovellettiin Data Set 2 vain siksi Tautivapaa elossaolo Times ei ole käytettävissä Data Set 3. Vertailu osoittaa, että mediaani uusiutumisen elinaika potilaista matalan riskin ryhmässä määritelty seitsemän geeniä ennustetekijöiden luokittelija oli 35 kuukautta. 73%: lla potilaista korkean riskiryhmän oli taudin uusiutumisen 5 vuoden kuluessa, kun taas 63%: lla alhaisen riskin ryhmä pysyi uusiutumisen vapaana vähintään 5 vuotta. arvioitu riskisuhde matalan riskin ja korkean riskiryhmän oli 2,6 merkittäviä p-arvo 0,035 (logrank testi).

Kaplan-Meier-arvio aika 42 riippumattomien potilaiden Data Set 2 (GSE25136) mukaan seitsemän geeniä luokitin.

jälkeen tutkittiin tahansa eri kliinisen tuloksen arvoja, Gleason pisteet, PSA, ikä , tilavuus, T vaiheessa N vaiheessa ja M vaiheessa oli ennustetekijöitä arvot parannettu suorituskyky lajittelijan. Seitsemän geenit yhdessä kunkin kliiniseen tulokseen kehitettiin uusia luokittelijoiden. Vuonna PAM analyysissä, panokset kliinisen tuloksen ja seitsemän geenit ovat tasaisesti painotetut. Vain post eturauhasen Gleason summa merkittävästi parantunut tuloksia huomattavaa laskua p arvon 0,035-,009 logrank- testi. Sisällyttäminen Gleason summaa seitsemän geeniä allekirjoitusta testausmenetelmää käyttäen itsenäistä Data Set 2 paransi tarkkuutta ja herkkyyttä 74% ja 84% Data Set 2 (vain Data Set 2 käytettiin tässä analyysissä johtuu puuttumisesta Gleason summa Data Set 3). Kaksi muuta havaittua uusiutumisen potilasta luokitella korkean riskin ryhmään. Kaplan-Meier selviytyminen analyysi (kuvio 2) osoittaa, että mediaanielossaolosta potilaista korkean riskiryhmän määritelty seitsemän geeniä post eturauhasen Gleason summa ennustetekijöiden luokitin 34,6 kuukautta. 75% potilaista korkean riskiryhmän oli taudin uusiutumisen 5 vuoden kuluessa, kun taas 71%: lla potilaista matalan riskin ryhmään pysyivät uusiutumisen laisinkaan vähintään 5 vuotta. Arvioitu riskisuhde matalan riskin ja korkean riskiryhmän oli 3,8, jolla on merkittävä p-arvo 0,009.

Kaplan-Meier elinaika 42 riippumattomien potilaiden testituloksia Set 2 (GSE25136) mukaan seitsemän geeniä luokitin kanssa Kirurginen patologia määrätyn Gleason summa. Gleason summa muuttuja on sama painoarvo kuin kunkin geenin määrityksessä luokituksen.

Lopuksi suoritimme Monimuuttuja Coxin suhteellisen vaarat regressioanalyysi ennustuksen teki meidän luokittelija yhdessä kliinisen muuttujia ikä, pre-op PSA, patologinen vaiheessa ja kirurgiset marginaali mutta ei Gleason summa, joka on mukana meidän luokittelija. Vain p-arvo ennusteen meidän luokittelija lähestyi merkittävä taso (p = 0,0686). P-arvot muiden ”ennustavat” ovat suurempia kuin 0,1. Tulokset osoittivat, että meidän luokittelija oli parempi suorituskyky riski kerrostumista. Lisäsimme tämä tulos tekstiksi sivulla 12-13. Tulos osoitti, että meidän luokittelija voi paremmin kerrostuvat riskiä.

validointi 23 Protein ekspressöivät on 68 Kasvaimen Gene Set

Jotta validoida käytetään tässä tunnistamiseksi kasvaimen solu- ilmentymistä vertasimme solutyyppispesifisiä ilmaus löytynyt RNA eli

β

T

ja

β

S

, jossa se havaittiin vastaavan proteiinin ilmentymistä kasvain ja strooman solujen tarjoamia Human Protein Atlas (HPA) testinä onko solu erityisiä tehtäviä ilmaisu- tiedot olivat tarkkoja. Kaikki 68 geenit tunnistettu täällä kasvainsolun tietyn tutkittiin. Odotimme, että 68 geenit tunnistettu täällä kasvainsolun tietyn osoittaisi proteiinin ilmentymistä, joka on enemmän korreloi voimakkaasti havaitun proteiinin ilmentyminen kasvainsoluissa kuin stroomasoluilla. Proteiini ilmentymisen profilointi suoritettiin käyttäen havaittu immunochistochemical (IHC) värjäytyminen arvot havaittiin HPA kuvatulla (materiaalit ja menetelmät). Keräsimme tiedot 75 liittyvien vasta-aineiden 49 68 kasvainsolun ilmaistuna geenejä (ei vasta-aineita jäljellä 19 geenit) ja sitten valitsi 23 49 geenien osoittivat ilmennetty eri vasta-intensiteetin välillä normaalihenkilöillä ja eturauhassyöpäpotilaille varten korrelaatiotutkimuksen . Kunkin vasta-aine, proteiini ekspressiotaso kasvain ja strooman on keskimäärin yli 12 potilaan näytettä. Kaikissa 672 IHC havaintoja käytettiin.

RNA geenien ilmentymisen panos kasvain ja strooman saatu CC analyysin malli 23 kasvaimen geenejä. Korrelaatio tutkimuksessa mittasimme kahden korrelaation:-geeni-proteiini-ilmentymisen korrelaatio kasvaimen ja geeni-proteiini-ilmentymisen korrelaatio strooman. Tulokset osoittivat, että kasvain korrelaatio saatiin Pearsonin korrelaatiokerroin 0,41 merkittäviä p-arvo 0,03, kun strooman korrelaatio oli merkityksetön kanssa korrelaatio -0,02 (p-arvo 0,92). Vertailun vuoksi viime tarkastelu paperin [24], jossa kuvataan korrelaatiota proteiinin ja geenin ilmentymistä eri organismien, kuten ihmisen osoitti, että korrelaatio 0,41 on verrattavissa suurin korrelaatio havaittiin

homo sapiens

(0,46, s 0,001). Kuvassa S2 esittää scatterplot proteiinin ilmentymisen

versus

geenien ilmentyminen kaikesta datasta. Korrelaatio tutkimus osoittaa, että 23 informatiivinen geenit tunnistaa meidän ehdotti CC riskianalyysejä todellakin tarkasti tunnistaa kasvainsolun ilmaistuna geenejä.

Keskustelu

Oletimme, että luotettavampi syöpä luokittelijoiden voidaan tunnistaa, jos solutyyppi heterogeenisuus on otettu huomioon. Olemme kehittäneet uuden Cluster-Correlation analyysi, jossa vaihtelun aiheuttama solutyyppiä jakelu ohjataan moninkertaisen lineaarisen regression (MLR). Ehdotettu CC analyysi on uusi geeni ero ilmentymisanalyysiä. On olemassa kaksi suurta ominaisuuksia analyysi (kuva S1). Ensin sisällytetty tunnetun solutyyppiä prosenttiosuus osaksi analyysiä, välttäen väärän tunnistaminen pelkästään aiheuttama vaihteleva solutyyppi koostumus välillä kudosnäytteitä. Toiseksi, suoritimme valvomattoman klusterointia, välttämällä suoraa käyttöä biokemiallisia toistumisen tietoja, joita ei useinkaan ole lopullinen vuoksi tietojen sensurointi. Kaksi yksinomainen ominaisuudet tekevät CC analyysi paremmin kuin perinteiset geeniekspression analyysejä. Aikaisemmassa tutkimuksessa [17] vertasimme CC riskianalyysejä perinteisiin geenin differentiaalikaavojen analyysit esimerkiksi SAM ja Limma. Simulointi Tulokset osoittivat, että uusi malli päihitti perinteinen geenin ero ilmentymisen analyysit kannalta herkkä ja spesifinen. Lisäksi, kun näitä menetelmiä sovelletaan eturauhassyövän tiedot, CC-analyysi voidaan tunnistaa geenejä, jotka ovat merkittävästi rikastettu tai joka liittyy eturauhasen syöpään liittyvät reitit, kuten Wnt-signalointireitin, ECM-reseptorin vuorovaikutus, fokaalisen adheesion ja TGF-

β

signalointireitin [17].

käyttämällä CC riskianalyysejä, tunnistimme 68 kasvainsolun ilmaistuna geenejä käsitellään ehdokas kliininen biomarkkereita lisätutkimuksia varten. Seitsemän Merkittävin kasvainsolun ilmaistuna geenejä tunnistettiin analysoimalla kasvainsolu rikastettu näytteitä SAM. Nämä seitsemän geenejä käytettiin PAM muodostamaan luokittelija, joka sittemmin validoitu kahden riippumattoman Tietojoukot. Näiden testien, käytimme testinäytteet 50% kasvainsolujen pitoisuus arvioima CellPhred. On mahdotonta saada puhdasta kasvain näytteet johtuen solun tyypin heterogeenisuus luontainen useimpiin Gleason histologian kuvioita ja johtuvat eriasteista strooman ja muiden elementtien kanssa kudosnäytteiden valittu microarray analyysi ”kasvaimia”. Vertaamalla ennusteen tarkkuus valitut näytteet eri kasvainsolu prosenttiosuudet (näytteiden 10% kasvainsolu osoitteeseen 50% kasvainsolujen), huomasimme, että paras ennuste saatiin, kun kasvainsolun prosenttiosuus Tietyn näytteet oli suurempi yli 50%. Siksi tarkkuus, herkkyys ja spesifisyys meidän riippumattoman testauksen vuoksi omiaan

aliarvioida

suorituskykyä joka saataisiin käyttäen puhtaampaa kasvainnäytteestä.

päärajoituksena useimmat aiemmat biomarkkereiden havaitseminen tutkimuksissa on, että yksittäinen kliininen tietojoukon käytettiin sekä allekirjoituksen löytämisen ja validointi. Äskettäin ensimmäinen tutkimus suorittaa allekirjoituksen löytö ja validointi riippumattomiin tietoihin [25] käytetään toistumisen algoritmi, joka johti herkkyys 68%. Herkkyys parannettiin sisällyttämällä PSA mutta vain jos erottelu uusiutumisen ja ei-uusiutumisen alaryhmien määriteltiin testituloksia, joka on samanlainen kuin strategiaa aiempien tutkimusten – löytö ja validointi samalla kliinisen Data Set. Sen sijaan meidän seitsemän geeniä allekirjoituksen havaittiin ensimmäisen harjoitustiedot ja validoitu riippumattomien Tietojoukot.

lisäarvioimiseksi suorituskyky meidän seitsemän-geenin allekirjoitusta, toteutimme PAM perustuvan ennustuksen vertailu meidän geeni allekirjoitus ja muut geeni allekirjoitukset tunnistettu muissa tutkimuksissa. Taulukossa 2 esitetään vertailun viidestä eri geenistä allekirjoitusta – meidän seitsemän geeniä Allekirjoituksen Bismar geeni allekirjoitusta [26], ja Glinsky geeni allekirjoitukset 1-3 [25]. Tulokset osoittivat, että meidän seitsemän geeniä allekirjoitus edellyttäen paras tarkkuus ja paras tasapaino herkkyyden ja spesifisyyden riippumattomissa testeissä.

Jotta vertailu riippumattoman ja tarkka ennustaja, myös käytetty luokitusjärjestelmä CAPRA maalin [8] selvittää uusiutumisen riskiä Data Set 1. tulos osoitti, että tarkkuus CAPRA pisteet on vain 54%, mikä ei ole verrattavissa tarkkuutta meidän allekirjoitus. Tämä ristiriita voi edustaa eroa piirteille väestöstä verrattuna väestöön käytetty kehittämisessä CAPRA Pisteet [8].

Yhteenvetona seitsemän geeniä ennustetekijöiden allekirjoitus läheisesti liittyy biokemiallisia uusiutumista potilailla jälkeen eturauhasen. Tämä allekirjoitus ehdottaa käytännön sovelluksiin kuten kerrostuminen potilaiden mukaan riskin tutkimuksissa adjuvanttihoitona ja kohteiden määrittelyssä kehittämiseksi hoidon eturauhassyövän etenemiseen.

tukeminen Information

Kuva S1.

Vuokaavio kehittämisen seitsemän geenin luokittelija.

Vastaa