PLoS ONE: Cross-tutkimus Ennusteet Genomisen Biomarkers: arviointi in Cancer Genomics

tiivistelmä

Ihmisen sairauksien tutkimuksiin käyttämällä DNA-mikrosiruja sekä kliinisissä /havainto- ja kokeellinen /kontrolloituja tutkimuksia, on yhä enemmän vaikutusta ymmärrystämme monimutkaisuus ihmisen sairauksia. Olennainen konsepti on käyttää geeniekspression kuin ”yhteinen valuutta”, joka yhdistää tulokset

in vitro

ohjatuista kokeista

in vivo

havaintoihin ihmisen tutkimuksissa. Monet tutkimukset – syövän ja muiden tautien – ovat osoittautuneet lupaaviksi käyttämällä

in vitro

solun manipulointia parantamaan ymmärrystä

in vivo

biologian, mutta kokeet usein yksinkertaisesti eivät näy valtava fenotyyppinen muutos nähdään ihmisen sairauksiin. Me puuttua tähän puitteet ja menetelmät leikellä, parantamaan ja laajentamaan

in vivo

hyödyllisyys

in vitro

peräisin geeniekspression allekirjoituksia. Vuodesta kokeellisesti määritetty geeniekspressio allekirjoitus käytämme tilastollinen tekijä analyysi tuottaa

useita

määrällisiä tekijöitä ihmisen syövässä geenien ilmentyminen tietoja. Nämä tekijät säilyttävät suhdetta alkuperäisiin, yksiulotteinen

in vitro

allekirjoitus mutta paremmin kuvaavat monimuotoisuutta

in vivo

biologiassa. Kun rintasyövän analyysi, osoitamme, että tekijät voivat heijastaa olennaisesti erilaisia ​​biologisia prosesseja liittyy molekyyli- ja kliinisiä piirteitä ihmisen syöpien, ja että yhdessä ne voivat parantaa ennustuksen kliinisten tulosten.

Citation: Lucas JE, Carvalho CM, Chen JL-Y, Chi JT, West M (2009) Cross-tutkimus Ennusteet Genomisen Biomarkers: arviointi in Cancer Genomics. PLoS ONE 4 (2): e4523. doi: 10,1371 /journal.pone.0004523

Editor: Sridhar Hannenhalli, University of Pennsylvania School of Medicine, Yhdysvallat

vastaanotettu: 1. syyskuuta 2008; Hyväksytty: 31 joulukuu 2008; Julkaistu: 19 helmikuu 2009

Copyright: © 2009 Lucas et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoittajat: Tutkimus osittain tukee National Science Foundation (DMS-0342172) ja National Institutes of Health (NCI U54-CA-112952). Kaikki mielipiteet, havainnot ja johtopäätökset tai suositukset ilmaistuna tässä työssä ovat kirjoittajien omia eivätkä välttämättä edusta NSF tai NIH.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä olemassa.

Johdanto

Microarray tekniikka mahdollistaa pyydystäminen erilaisia ​​näkökohtia geneettisten, ympäristö-, onkogeeninen ja muut tekijät heijastuvat globaalissa mRNA ilmaisun ja avaa mahdollisuuden henkilökohtaistamisen sairauden hoidossa [1], [2 ]. Monet tutkimukset ovat ottaneet ”ylhäältä alaspäin” profilointia geenin ilmentyminen ihmisen syövissä, ja tämä on johtanut tunnistamiseen kasvaimeen alatyypeistä tunnista aiemmin sekä geeni allekirjoitukset ennustamiseen erilaisten kliinisten fenotyyppien [3] – [7]. Vaihtoehtoisesti muut tutkimukset ovat ottaneet ”alhaalta ylös” -lähestymistapa määrittää muutos geenien ilmentyminen aiheuttamia erityisiä manipulointia viljeltyjen solujen

in vitro

. Näissä tutkimuksissa geeniekspressiota toimii yhteinen fenotyyppi tunnistaa samanlaisia ​​piirteitä ihmisen syövissä

in vivo

ja tarjoavat suoran kytkös tunnetaan biologinen häiritseekin ja kliinisen yhteyksissä [8] – [12].

Vaikka monet tällaiset tutkimukset ovat osoittaneet lupaavia tuloksia käyttämällä

in vitro

solun manipulointia ymmärtää

in vivo

biologian, tämä lähestymistapa ei voi täysin vastaa valtava fenotyyppiset vaihtelu nähdään ihmisen syövissä. Sellaiselta tutkimukset, voidaan johtaa

allekirjoituksia

. Nämä määrittelemme olla luetteloita geenejä, jotka ilmentyvät differentiaalisesti yhdessä niihin liittyvät tasot differentiaalikaavojen (jota kutsumme painoja). On kuitenkin lähes aina huono ottelua allekirjoituksista ja ilmaisun kuviot samat geenit

in vivo

. Siksi käsitteelliset puitteet tarvitaan edelleen leikellä, parantamaan ja laajentamaan

in vivo

hyödyllisyys

in vitro

johdettu allekirjoitus. Tässä esitämme tekniikka tämän tarkoituksen saavuttamiseksi. Ehdotamme johtuvat useita tekijöitä, jotka perustuvat ihmisen syövän geeniekspressiotutkimuksissa peräisin kokeellisesti määritelty allekirjoitus. Nämä johdettu tekijät säilyttävät suhdetta alkuperäisiin allekirjoitusta vaan edustavat erillisiä biologisia prosesseja. Tärkeää on, osoitamme, että eri johdettu tekijät voidaan yhdistää, jotta saadaan paljon parempia ennustavaa arvot kliinisiä tuloksia. Eri tekijät huomioon myös erilaiset biologiset prosessit ja jotka liittyvät eri näkökohtia molekyyli- ja kliinisiä piirteitä ihmisen syöpien.

On olemassa useita mahdollisia lähestymistapoja tähän ongelmaan. Yksi suosittu lähestymistapa on ollut vertailla identiteettejä differentiaalisesti ilmaisi antureista tietokantoihin ennalta määriteltyjä reittejä. Kuvaukset Tällaisten lähestymistapojen löytyy [13] – [15]. Vaikka nämä lähestymistavat vetoavat heidän tulkittavuutta, he luottavat asianmukaisesti ennalta määriteltyjen reittien sijaan tiedon rakenteen tutkittavana. Vaihtoehtoisesti voidaan yksinkertaisesti määritellä allekirjoituksen aktiivisuustason näytteen painotettuna keskiarvona

in vivo

ekspressiotasoja (jos geenit jonka yli laskea painot ja painot itse ovat peräisin alkuperäisestä allekirjoitus). Vaikka jotkut tutkimukset ovat osoittaneet vallan käsitteen, on selvää, että yksi ei voi toivoa kaapata heterogeenisuus

in vivo

biologian yksiulotteinen ohjattu biologisen vasteen

in vitro

allekirjoitus heijastaa.

luontainen heterogeenisyys ympäristön ja solutyypin kudosnäytteistä tarkoittaa, että geenit allekirjoituksen saattavat liittyä monia muita toimintoja ei ole ilmeinen

in vitro

. Edelleen kokeita kloonattuja solulinjoja yhden solutyypin kasvatettu tiukasti valvotuissa olosuhteissa tietyksi (ja suhteellisen lyhyt) aika saattaa kontrasti koruttomasti kanssa kliiniset näytteet uutetaan elävistä organismeista, jotka sisältävät useita solutyyppejä, jotka ovat olleet dynaamisessa ympäristössä kuukausia tai vuosia. Ei ole selkeästi ”oikea” tapa ottaa mitä on oppinut microarray kokeilu kulttuuriin ja soveltamalla sitä arvioimaan signalointia kudosnäytteistä. Jotkut geenit voivat olla huonompi edustajia signalointia

in vivo

koska ne ovat todennäköisesti olla mukana muita väyliä, koska ne reagoivat ympäristöolosuhteet, jotka eivät ole läsnä

in vitro

, tai lukemattomia muita syitä. Sen vuoksi on tärkeää säätää tilastollinen ja käsitteellinen kehys, joka voi antaa meille mahdollisuuden käyttää

in vivo

ekspressiotietojen edelleen leikellä, tarkentaa ja parantaa

in vitro

-johdannainen geeni allekirjoitukset .

Signature Factor profilointi Analysis

(SFPA), joka perustuu harva tilastollinen tekijä malleja, [16], [17] on kehys kartoittamiseen

in vitro

allekirjoituksia kokoelma

in vivo

tekijöitä. Vaikka tämä kuulostaa samanlainen hierarkkinen klusterointi (josta on tullut oletuksena menetelmän tällaisia ​​ongelmia), on merkittäviä eroja. Ensinnäkin, kun taas hierarkkinen ryhmittely voidaan rikkoa joukko näytteitä ryhmiin, jossa ilmaisu on samankaltaista jollain tavalla, se ei mitata tämän samankaltaisuutta. Toiseksi, hierarkkinen klusterointi edellyttää, että kunkin havainnon (geeni) olla jäsenenä vain yksi klusteri. Tämä estää määrittämällä klustereita biologisille polkuja, koska monet yhdistelmät signalointia ovat mahdollisia. Lopuksi koska tekijät syntyvät tilastollinen malli, on mahdollista tunnistaa radioaktiivisuuden kussakin tekijöiden äskettäin mitattuja ilman redoing tilastollista analyysiä. Vaikka on olemassa tekniikoita muita kuin hierarkkinen klusterointi joka käsitellään joitakin näistä ongelmista, esimerkiksi soft-klusterointia [18] ja K-means klusterointi [19], meidän algoritmi käsittelee ne kaikki yhden yhteisen ja johdonmukaisen tilastopuitteet. SFPA säädetään:

Tukeva tilastollinen mallintaminen sekä kokeellisen geenin ilmentymisen ja kudosnäytteen ilme.

tunnistaminen ja korjaaminen määrityksen esineitä, joiden tiedetään olevan merkittävä ongelma liittyy käyttöön microarray teknologian .

kartoituksen yhdestä allekirjoitusta, syntyy

in vitro

, että kokoelma tekijät hallussaan asiaankuuluva ominaisuudet allekirjoituksen taas paremmin heijastaa epäyhtenäisyys

in vivo

liittyvän biologisen häiriön allekirjoitus edustaa.

malli laskennallisten arvojen tekijöiden uusia kokoelmia kudosnäytteiden vaikka nämä näytteet voivat olla peräisin eri ryhmien ja eri aikoina.

Me tutustua tähän analyysiin, kääntää kokoelma geenin allekirjoitusten heijastaa soluvastetta viidelle tunnetulle kasvain microenvironmental tekijät, löydettiin

in vitro

[8], jossa painotetaan erityisesti allekirjoituksen liittyy vastaus maitohappoasidoosiin. Osoitamme, että useita tekijöitä kertyy rintasyövän yhteydessä edelleen edustaisi yksittäisten microenvironmental reitin vastauksia, joista ne on johdettu. Lisäksi nämä tekijät erottavat keskeisiä biologisia fenotyyppejä rintasyövässä, voivat parantaa kliinisen ennusteet useille syöpään aineistoja, ja säilyttävät ennakoivan kykynsä vaikka levitetään näytteitä otettu valtavasti eri aikoina tai eri tutkimuskeskukset.

tulokset

Context, data ja analyysi strategia

Aloitamme viisi allekirjoitusta määritellään transkription vasteet viljellyissä ihmisen rintarauhasen rintojen epiteelisolujen viisi microenvironmental häiriöiden: hypoksia, maitohappoasidoosi, hypoksia plus maitohappo asidoosi, lactosis, ja asidoosi. Jokainen näistä nähdään ihmisen syövissä ja kuljettaa varoituksia syntymässä olevista suhteen hoitotuloksia [8]. Allekirjoitukset ovat muutokset geenien, sarjan väliin ohjaus havaintoja ja soluja kasvatettiin, kun läsnä maitohappoasidoositapauksia (25 mM maitohappoa, pH 6,7), hypoksia (2% O2), maitohapon ja hypoksian, lactosis (25 mM natrium- laktaatti, neutraali pH), ja asidoosi (pH 6,7 ilman laktaatti). Ilmentämismääritykset käytetään Affymetrix U133 + 2,0 mikrosiruja ja allekirjoitukset heijastaa kunkin microenvironmental tekijöitä on kuvattu [8]. Kuten esitetään [8], hypoksia, maitohappoasidoosi ja asidoosin on vahva prognostista merkitystä useissa tutkimuksissa rintasyöpiä. Meidän Tavoitteena on tutkia eri osien alkuperäisen geenin allekirjoitukset arvioimaan mahdollisuutta edistämään heidän prognoosi- arvot ja dissecting ne erillisiin biologisiin reittiin merkityksellisiä tekijöitä kanssa kliinistä merkitystä.

Käytämme Bayes Factor regressiomallinnus (BFRM) [20] määritellä ja arvio tekijät perustuvat tietyn allekirjoituksen. Tämä alkaa pieni kokoelma geenejä, jotka ovat erittäin herkkiä alkuperäisen intervention (erittäin ilmentyvät eri välillä ohjaus ja koeryhmien soluviljelmissä) ja sitten iteratiivisesti tarkentaa geeniperimä, joka perustuu koekspressoimalla in vivo tietokokonaisuus, vuonna yhteydessä tilastollinen kerroin analyysi. Ensinnäkin yhteiset kuviot ilmaisun (tekijöiden) havaitaan osajoukon geenien parhaillaan. Seuraavaksi yhdistys näiden tekijöiden ja koko joukko geenien array voimme tunnistaa uusia geenejä, jotka sisällytetään tarkistamista faktorianalyysin. Perusteluna tälle on, että arvioidessaan tekijöitä alkuperäisen valitun allekirjoituksen geenejä voimme valaista

in vivo

vaihtelua, joka ei ole läsnä

in vitro

, lisäämällä geenejä ulkopuolella alkuperäinen allekirjoitus voi parantaa luonnehdinta näiden tekijöiden samalla yhteydet muihin asiaan reittejä. Running SFPA kunkin viiden allekirjoitusten itsenäisesti, saadaan 11 hypoksia tekijät, 10 maitohappoasidoositapauksia tekijät, 20 hypoksia plus maitohappoasidoositapauksia tekijät, 17 lactosis tekijät ja 9 asidoosi tekijät. SFPA lakkaa löytää tekijöitä, kun suurin osa vaihtelusta alkuperäisessä geeniperimä on selitetty.

Signature-Factor Relationships

Keskitymme, nyt, on kymmenen maitohappoasidoosin tekijöitä. Tutkii geenejä kussakin tekijät (kuvio 1 a) osoittaa, että kaikki tekijät ovat edustajia alkuperäinen allekirjoitus lisäksi geenien lisätään prosessin aikana sopiva tekijä malli. On tärkeää varmistaa, että löytö näiden kymmenen tekijät, emme ole menettäneet alkuperäinen allekirjoitus. Tarkistamme tämän taantumassa 10 sarjaa eristetyllä tekijä pistemäärän maitohappoasidoosin allekirjoitus tulokset. (Laskeminen allekirjoitusta pisteet kuvataan Menetelmät jaksossa.) Witin yhden monimuuttujatestauksen regressiomallin, huomaamme, että 7 10 ovat merkitsevä 0,01 tasolla, ja että kun me poistaa loput kolme tekijää päässä monimuuttuja regressio, näistä seitsemästä edelleen merkittäviä. Siten ainakin seitsemän tekijät osoittavat merkittävää yhdistyksen alkuperäinen allekirjoitus.

(a) väliset liitokset geenien ja 10 maitohappoasidoosia tekijöinä tilastollinen tekijä analyysi rintasyövän tietoja [21]. Geenit sisältävät alkuperäisen valitun allekirjoituksen geenit (musta) ja ne lisättiin läpi iteratiivista rikastamiseen analyysi (punainen), musta tai punainen osoittaa, että geeni (rivi) on erittäin liittyy kertoimella (sarake), ja valkoinen osoittaa vähän tai ei lainkaan -alueella. Cross-talk välillä oletetun reitin liittyvät tekijät ja geenien, on ilmeinen. (B) Maitohappoasidoosia allekirjoitus (pystyakseli) on ennustaa lineaariregressio sovitus (vaaka-akseli) on seitsemän tekijän merkitsevästi liittyy maitohappoasidoosin allekirjoitus. (C) Kuva kynnysarvo korrelaatioita 67 tekijöiden (pystysuora) ja 10 maitohappoasidoosia tekijät (vaaka), musta osoittaa paria tekijöistä, joiden pairwise näyte korrelaatio ylittää 0,9 absoluuttisena arvona.

Kuva 1b esittää asennettu arvot regressio maitohappoasidoosin allekirjoituksen pistemäärä maitohappoasidoosin tekijöistä analyysin 251 kasvainnäyte datasarjan [21]. Kirjoita Tähän regressio on korkea (0,74), mutta se on mahdollista jo kymmenen tekijät voisivat selittää monia eri allekirjoitukset. Osoittaakseen, että tämä ei ole väärä yhdistys, testataan hypoteesia, että tämä taso on riippumaton, mitkä geenit osoitetaan joka painoja. Me uudet näytteet painot 10000 kertaa, joka kerta taantumassa allekirjoittamisen pisteet vektori lasketaan näistä painot 10 maitohappoasidoosin tekijöitä ja laskemisessa, arvo. 10000 arvoja niin laskettu alle nollahypoteesin, maksimi oli 0,48 varmistaa, että p-arvo «10

-4. Jos me lähentää jakelu arvojen beeta jakauma (lasketaan menetelmällä hetkiä) saamme hyvin lähellä sovi (katso kuva S1) ja arvioida p-arvo on ≈10

-13. Koska vain listan erittäin differentiaalisesti ilmentyvien geenien päässä maitohappoasidoosin allekirjoitus, eikä painot, joita käytetään tekijä löytö, ja koska painot ovat kriittisiä laskentaa maitohappoasidoosin allekirjoituksen tulokset, kyky toipua allekirjoitus pisteiden tekijöistä on vahva näyttö kahden välinen suhde.

kolme tekijää johdettu maitohappoasidoosin allekirjoitusta, jotka eivät olleet tärkeitä ennustamisessa allekirjoituksen tulokset saattavat silti edustaa aktiivisuuden merkitystä läsnäolon maitohappo, mutta ne eivät ole voimakkaasti ennustava alkuperäisen allekirjoituksen. Ne voivat myös yksinkertaisesti edustaa aktiivisuutta biologisen polkuja, jotka sisältävät hyvin suuria sarjaa geenejä, ja ovat siten havainneet, monista mahdollisista eri lähtökohdat. Siitä huolimatta, ne edustavat merkittävää rakenteen ilmentyminen laajennetun allekirjoituksen geeni asetettu kasvain data, ja mikään näistä tekijöistä olisivat havaittavissa tutkimalla allekirjoituksen yksin ilmiasuun.

tekijät voivat heijastaa erillisiä näkökohtia biologista aktiivisuutta. Kuvio 1 c esittää, mitkä 67 tekijöiden (kaikki tekijät löydettiin kustakin viidestä alkaen allekirjoitukset) ovat vahvasti yhteydessä 10 maitohappoasidoosin tekijöistä Millerin rintojen data-analyysi [21]. Huomaa, että ei kaksi maitohappoasidoosin tekijät korreloi, siksi nämä tekijät näyttävät kuvaamaan erillistä prosessia. Osa 10 tekijöistä, kuten maitohappoasidoosi tekijä 8 mm, korreloi hyvin voimakkaasti useita muita tekijöitä, mikä osoittaa, että nämä tekijät on tunnistettu useista alkuperäisestä allekirjoituksia. Useimmat kuitenkin osoittaa alhainen pairwise korrelaatio. Niistä 67 tekijöistä, 40 pääkomponentit tarvitaan osuus 95% havaitusta vaihtelua (täydentävä kuva S2) esitetään, että suhteellisen suuri biologinen ”ulottuvuus” taustalla 67 tekijät – ne heijastavat monipuolinen kokoelma biologista aktiivisuutta, ja oletettavasti polkuja muuttanut että soluvasteita maitohappoasidoosiin sisällä ihmisen rinta- kasvaimia. Kuvio 1 a esittää välisiä yhteyksiä geenien ja 10 maitohappoasidoosia tekijöiden analyysiin. Geenit sisältävät alkuperäisen valitun allekirjoituksen geenit ja ne lisätään kautta iteratiivista rikastamiseen analyysi. SFPA johdettu tekijät säilyttävät suuren osan geenejä, jotka on osoitettu olevan muutoksen ilmaisu, kun solut altistetaan läsnä maitohapon

in vitro

, joka esittää toisella tavalla, että nämä tekijät edelleen säilyttää yhteydessä alkuperäinen allekirjoitus. Rajat talk tekijöiden välillä, mitattuna geenien määriteltäessä yli tekijä, on myös ilmeinen.

Factors Veikkaa Molecular Ominaisuudet

SFPA johdettuja tekijät voivat edustaa erillistä aluetta biologisten prosessien liittyy kliininen fenotyyppejä. Arvioida tämän selvitimme osajoukko regressiomalleja ennustaa useissa kliinisissä fenotyyppien Millerin tietojoukon [21] – fenotyyppien myös ER ja PRK tila, p53 tila ja selviytymistä kertaa. Molekyyli tilailmaisimet mallinnettiin binary probit regressoitava tekijöistä, ja selviytyminen standardin Weibull selviytymisen malleja. Hyödynsimme Shotgun Stokastinen Search (SSS) menetelmää [22], [23] tunnistaa pieniä osajoukkoja osoittavat tekijät ennustearvo suhteessa kuhunkin näistä fenotyyppejä. SSS on vaihteleva valikoima malli, joka mahdollistaa käytön mallin keskiarvon (perustuen posterior todennäköisyys) ennustamiseen. Malli keskimäärin on osoitettu toimivan paremmin kuin algoritmeja, jotka käyttävät yhden paras malli ennuste (esim AIC tai BIC), koska se antaa oikeampi arvio epävarmuus [24]. Tämä analyysi suoritettiin tietue [21], ja sen jälkeen saatu asennettu /koulutettu regressiomalleja käytettiin ennustamaan fenotyyppejä kussakin viidestä erillisestä ja biologisesti monimuotoiset rintasyövän tietomääriä [25] – [28]. Kaikki tiedot asetetaan ovat saatavilla Gene Expression Omnibus (GEO).

tekijät ennustavat ER tila.

analyysi osoittaa, että erittäin pisteytys regressiomalleja ennustamiseen ER asema hyödyntää yksi tekijöistä – Asidoosi 1, Hypoksia 4, maitohappoasidoosi 2, tai Lactosis 5. kuvassa 2a, voidaan nähdä, että korrelaatio kahden näistä tekijöistä on korkea, niin voimme viitata niihin kollektiivisesti kuin ER tekijöistä. Kuvio 3a osoittaa kykyä tämän tekijän ennustaa ER asema harjoitussarjassa [21] ja 3b esittää ennustaminen on erillinen ja täysin erilaisia ​​Koepakettia [27]. Tutkia geeni ontologian (GO) koostumus luettelon liittyvien geenien ER tekijät, olemme soveltaneet KERÄTÄÄN analyysi [29] ja huomaavat, että GO liittyvät termit solusyklin, lisääntymistä ja ja mitoosin suuresti rikastunut nämä tekijät (taulukko 1), joka vahvistaa tunnettu yhteyden solun etenemistä ja ER. On myös odotettavissa, että läsnäolo maitohapon tai hypoksia säädöksiä sammuttaa solusyklin ja ER tekijä näyttää suoraan yhdistää kaksi prosessia.

Jokainen piste näissä tontteja edustaa yhtä potilasta päässä aineisto in [21]. (A) Pairwise scatterplots tekijöistä Asidoosi 1, Hypoksia 4, Maitohappoasidoosi 2, ja Lactosis 5 kuusikymmentäseitsemän tekijöistä. Kukin näistä tekijöistä on peräisin eri lähtökohdista allekirjoitus ja ne ovat tärkeitä, ja vaihdettavissa ennustamiseen ER tilan. Tontit lävistäjä akselilla osoittavat histogrammit pistemäärän kunkin tekijöistä. (B) Kolme ei ole merkittävää korrelaatiota ER ja PRK tekijöistä. (C) ER ja p53 tekijät osoittavat joitakin todisteita suhteen, mutta ovat selvästi erilaiset rakenteet (arvot ovat aktiivisuus vastaavien tekijöiden tietoja [21]).

ER ja PRK tekijät ennustavat progesteronireseptorille tila: (a) koulutus datajoukon [21]; (B) heijastetaan Wang tiedot. Tulokset ovat PgR- (sininen, obs = 0) ja PRK + (punainen, obs = 1). ER tekijät (Asidoosi 1, Hypoksia 4, maitohappoasidoosi 2, tai Lactosis 5): (c) koulutus setti [21], liittyy voimakkaasti ER asema; (D) ennustetaan kasvaimeen ekspressiotietojen täysin eri tutkimus – Wang datasarjan tässä tapauksessa 25 – pystyvät ennustamaan ER tila. Tulokset ovat ER (sininen, obs = 0) ja ER + (punainen, obs = 1). (E) p53: ennustaminen, jossa tulokset p53 villityypin (blues, obs = 0) ja mutantti (punaiset, obs = 1) jaettiin koulutus (tumman sininen ja punainen) ja testi /validointi (vaaleansininen ja vaaleanpunainen) näytteitä.

tekijät ennustavat PgR tila.

estrogeenin ja progesteronin tiedetään olevan antagonisteja, joten on odotettavissa, että ER tekijät voivat ennustaa progesteronireseptorin tila. Käyttämällä SSS huomaamme, että erittäin pisteytys regressiomalleja PRK tila liittyy ER tekijä lisäksi maitohappoasidoosiin kerroin 10 – merkitsemme tämän PGR kerroin. Kuviot 3c ja 3d esittävät asennettu ja ennakoivan kyky näistä kahdesta tekijästä käytetään binary regressiomalli sopivaksi progesteroni reseptoristatus. Ei ole mitään merkittävää korrelaatiota kasvaimen ilmentymisen välillä PgR ja ER tekijät (kuvio 2b). Gene ontologia varten geenien PGR kerroin (taulukko 2) vahvistavat joitakin tunnettuja yhteyksiä progesteronin ja RNA aineenvaihduntaa rintasyövän [30].

tekijät ennustavat p53 tila.

kolmas binary fenotyyppi, villityypin versus mutantti p53-geeni, on läsnä vain datasarjan [21]. SFPA uudelleen ajettiin satunnaisesti valitun 50% Näiden tietojen ja käytetään ennustamaan muita 50% (kuvio 3). Erittäin teki malleja p53 liittyy ER tekijä, PGR kerroin, ja yksi joko Hypoksia 1 tai maitohappoasidoosi 3. Korrelaatio kahta viimeksi mainittua tekijää on 99%, joten merkitsemme niihin kollektiivisesti kuin p53 kerroin. Gene ontologia sillä tämä tekijä on samanlainen kuin ER tekijä poikkeuksin, että ”solujen lisääntymistä” ja ”DNA: n replikaation aloittamiseen” ilmaisulla ”ydin jako” ja ”M vaihe”. Kaikkien geeni ontologiat lueteltu alkuun kahdeksan nämä kaksi tekijää, Bayes tekijät ovat ≥10. Koska hyvin samankaltaisia ​​geenissä ontologian, on houkuttelevaa yrittää rinnastaa nämä kaksi tekijää. Kuvio 2c esittää scatterplot aktiivisuuden kasvaimia tietoja [21] kustakin kahdesta tekijästä. P53 tekijä on merkittävästi bimodaalinen, ja lievä korrelaatio voi nähdä johtuu kokonaan tämän kaksihuippuisuutta, kuten kasvain näytteet korkealla ER tekijä aktiivisuus ovat todennäköisemmin toisessa tilassa p53 tekijä. Olemme teoretisoida, että tämä bimodaalinen liittyy erityisesti alatyypin p53-mutaatio. Ei ole kuitenkaan mitään todisteita multimodaalisuutta ER tekijä, ja p53-kerroin ennustaa ER tila huonosti. Näiden erojen vuoksi ja koska solu replikointi on monimutkainen prosessi, on todennäköistä, että nämä kaksi tekijää liittyvät erillisiä ominaisuuksia solujen kehitystä.

Korostamme, että jos me hillitä itsemme ottaen alkuperäistä

in vitro

maitohappoasidoosin allekirjoitus, meillä ei ole kykyä sovittaa tai ennustaa mitään näistä biologisista fenotyypit (taulukko 3). Lisäksi nämä tekijät aiheutuneet kokonaan ottamatta huomioon ER tila, PRK tila, tai p53 tila näytteitä. Tämä on toisin kuin enemmän tyypillinen malli, jossa allekirjoituksia liittyvät fenotyypit määritellään tiukasti perustuvat geenien ilmentymisen profiilit, jotka vastaavat näitä fenotyyppejä (esimerkiksi [21]). Tämäntyyppinen suunnittelun vaivaa vaikeuksia, jotka johtuvat useita geenejä, ulos kymmeniä tuhansia array, jossa ilme vastaavia malleja mielivaltaiseen fenotyyppi. Jossa SFPA, etsimme geenejä, jotka ilmentyvät yhdessä riippumatta fenotyyppiin, ja olemme siksi paljon vähemmän todennäköisesti koettelevat vääriä löytö (kuten todistettu meidän pois näytteestä ennakoivaa tarkkuus).

tekijöitä Ennakoi Clinical fenotyypit

SFPA tarjoaa tekniikkaa kyselevän yksi riippumaton kasvain näytteen vastaan ​​minkä tahansa määrän biologisesti määritetyn allekirjoituksia, ja sitten seuraava yhdistäminen tekijöitä fenotyyppien voivat olla kliinisesti merkittäviä tuloksia kuten potilaiden eloonjäämisen tuloksiin ja huumeiden vastaus .

tekijät parantaa ennustamista rintasyöpä selviytymistä.

osajoukkoja 67 tekijöitä arvioitiin Weibull selviytymisen regressiomallien käyttäen SSS menetelmää tunnistaa ja pisteet mallien ennustavat selviytymistä. Jokainen malli on tuloksena joukko erittäin pisteytysmallit tuottaa asennettu eloonjäämiskäyrien ja voidaan käyttää ennustamaan selviytymistä varten uusia näytteitä. Bayes-analyysi valtuutukset keskimäärin ennustukset tällaisesta joukko malleja, ja tämä tehtiin johtavan kuvion 4a. Tämä osoittaa sopii selviytymisen käyrät harjoitustietosivut setti [21], sekä ulos näytteen ennusteita neljässä muita aineistoja joista tietoja säilymiseen olemassa. Muista, että nämä ovat tietoja settejä, jotka selvästi ja lukuisia tutkimuksia, joten arvioimme mallia sovitettu yhden datasarjan neljään varsin haastavaa pois näytteestä validointitiedot sarjaa. Vaikka ei ole kuvattu tarkemmin täällä, BFRM tilastollista mallia analyysiä käyttämä SFPA käsitellään myös geenien-näytteen tutkimuksessa konkreettisia vaikutuksia sisällä analyysin ja pystyy korjaamaan tarpeeksi ominaispiirteisiin ja bias luonnostaan ​​microarray määrityksissä säilyttää ennustavan tarkkuus [19 ], [31]. Tulokset osoittavat, että factorprofiles näiden

in vitro

ympäristön allekirjoituksia voidaan parantaa selviytymistä ennustuksen merkittävästi useiden testituloksia sarjaa. Samanlaisia ​​tuloksia saadaan ennustamiseen etäpesäkkeiden vapaa elinaika.

(a) Ennustettu selviytymisen kertaa keskimäärin Weibull selviytymisen malleja, joissa käytetään jakaa 251 näytteet [21] mukaan yli /alle mediaani ennusteita ja tuloksena empiirinen eloonjäämiskäyrät (Kaplan-Meier-käyrät) on esitetty. Punainen /sininen kerrostuminen potilaiden on analyysin avulla osajoukkoja 67 tekijöiden (punainen – suuri riski 50%, sininen pieni riski 50%); harmaa käyrät ovat samasta analyysin avulla kaikki alkuperäisen viisi allekirjoitukset (siis ei korvausta yli istuva täällä). P-arvot kussakin tonttien vastaavat jaottelu faktorianalyysia (top, musta) ja ositus käyttämällä allekirjoituksia (pohja, harmaa). Tiedot [21] käytettiin tunnistamaan selviytymistä malleja, siksi tämä juoni edustaa asennettu arvoja. Neljä ylimääräistä tontit edustavat ennustus neljässä eri rintasyöpäkohteisiin näytteiden analyysin perusteella vain harjoitusdatasta. Ennustavan merkitystä, ja merkitys, tekijöistä on ilmeinen ja yhdenmukainen kaikissa tutkimuksissa, ja johdonmukaisesti parannetaan joka saavutetaan käyttämällä allekirjoituksia yksin. (B) Ensimmäinen Maitohappoasidoosin tekijä ennustaa selviytymisen potilailla, jotka hoidettiin tamoksifeenin (vasen puoli), mutta ei osoita ennustearvo potilailla, jotka eivät saaneet lääkettä (oikea puoli). Kaikissa näissä kuvioissa, p-arvot edustavat merkitystä Coxin suhteellisen vaarat malli.

tekijät ennustavat Tamoxifen vastausta.

Neljä rintasyövän aineistoja olla kliinistä huomautusta liittyvät käsittely tamoksifeenin. Vaikka 67 tekijät eivät ole mitenkään erityisesti suunnattu tamoksifeenin, me tiedämme ne liittyvät asiaan biologisia polkuja. Meidän 67 tekijöistä, huomasimme, että Maitohappoasidoosi 1 ennustaa tamoksifeenin vastarintaa. Se erottaa etäpesäkkeitä elinaika potilailla, jotka saivat lääkettä ja osoittaa mitään ennustavaa kykyä potilailla, jotka eivät (kuvio 4b, analyysin taustalla noudatti samaa lähestymistapaa kuin olemassaolostaan ​​edellä). Koska kaikki potilaat, jotka saivat tamoksifeenin olivat ER positiivinen, lääkeresistenssin liittyy tämän tekijän on oltava riippumaton antagonistiset lääkkeen vaikutusta estrogeenin reseptoreihin. Koska yksikään näistä aineistoja käytettiin koulutuksessa tekijän malli, kyky näiden tekijöiden erottaa vastustuskykyä Tamoksifeeni on merkittävä ja osoittaa, että ne ovat kestäviä keräämiseen harhat usein nähty microarray kokeiluja. Olemme jälleen käytetään KERÄTÄÄN tutkia ontologian geenien mukana tässä kerroin (taulukko 4). Tämä yhdistää kanssa tiedossa oleville tamoksifeenin kanssa fosfaatin kuljetuksen [32], [33] sekä soluadheesiota [34], [35]. Erityisesti, Cowell et ai. raportoivat, että p130Cas /BCAR1 on adheesiomolekyyli, joka edistää vastustuskykyä Tamoxifen kautta tiettyyn fosforylaatioreitti. Sen lisäksi, että nämä yhteydet sivuvaikutusten Tamoksifeeni on tunnettu yhteys eloonjäämisen potilailla tamoksifeenin ja myrkyllisyyttä, jotka liittyvät veren hyytymisen [36]. Edelleen tutkimus geenien tämä tekijä voi johtaa käsityksen mekanismi takana tamoksifeenin vastus ER rintasyöpä.

Discovery elinspesifisten tekijöistä maitohappoasidoosiriskin allekirjoituksia.

Vaikka samat biologiset prosessit voivat myötävaikuttaa kasvaimen fenotyypit eri syövissä, prosessi, jossa tämä tapahtuu, voi olla täysin erilainen annetaan erityisesti solun yhteydessä, kudosspesifisiä geenin ilmentymisen ja epigeneettiset vaikutteita. Koska SFPA voi käyttää

in vivo

syövän geenien ilmentymisen leikellä

in vitro

-muodostunutta geeni allekirjoitus, se tarjoaa mahdollisuuden tunnistaa kudosten ja elinspesifiseen liittyvät tekijät samasta geenistä allekirjoitukset. Tämä sovellus on mahdollista erottaa osa-polkuja, jotka ovat konservoituneita monilla kudostyypit niistä, jotka ovat elinspesifisiä. Voit valaista asiaa, hyödynnämme keuhkosyöpä datasarjan julkaistu [11] ja munasarjasyöpä datasarjan [10]. Olemme saaneet keuhkosyöpä tietoja GEO ja munasarjasyöpä tietoja Duke Integroidun syöpäbiologian Program (ICBP) kotisivuilta (https://data.cgt.duke.edu/platinum.php).

Vastaa