PLoS ONE: Kestävä ennustaminen Anti-Cancer Drug Herkkyys ja Herkkyys-Specific biomarkkereiden
tiivistelmä
henkilökohtainen genomiikan aikakausi on herättänyt paljon huomiota syövän hoitoon potilaan-analyysin. Potilas-analyysin avulla löytö yksittäisten genomista ominaisuudet kullekin potilaalle, ja näin voimme tehokkaasti ennustaa yksittäisten geneettinen riski taudin ja suorittavat yksilöllisiä syövän hoitoon. Vaikka nykyiset menetelmät potilaan-analyysin onnistuneesti kattamatonta ratkaiseva biomarkkereita, niiden esiintyminen tapahtuu äkillinen käänne pahin läsnäollessa poikkeavuuksien koska menetelmät perustuvat ei-vankka tapoja. Käytännössä kliinisessä ja genomin muutosten aineistot sisältävät tavallisesti harha eri lähteistä (esim koe virhe, koodausvirheestä jne) ja harha voi merkittävästi vaikuttaa tulokseen potilaan-analyysin. Ehdotamme vakaa metodologia potilaan-analyysin mukaisesti NetwrokProfiler. Ehdotetussa menetelmässä vieraat havainnot korkean ulotteinen geeniekspressiotasot ja lääkevaste aineistoja samanaikaisesti ohjataan vankka Mahalanobiksen etäisyyden vankka pääkomponenttianalyysin tilaa. Näin voimme tehokkaasti suorittaa ennustamiseen syöpälääkettä herkkyyttä ja tunnistaa herkkyys erityisiä biomarkkerit yksittäisille potilaille. Huomaamme läpi Monte Carlo simulaatiot että ehdotettu luotettava menetelmä tuottaa poikkeuksellisia suorituksia ennustamiseen vastemuuttuja läsnäollessa harha. Käytämme myös ehdotettu menetelmiä Sanger aineisto pyritään paljastamaan syöpä biomarkkereita ja ennustaa syöpälääkettä herkkyys, ja näyttää tehokkuutta menetelmämme.
Citation: Park H, Shimamura T, Miyano S, Imoto S (2014) Robust ennustaminen Anti-Cancer Drug Herkkyys ja Herkkyys-Specific biomarkkereiden. PLoS ONE 9 (10): e108990. doi: 10,1371 /journal.pone.0108990
Editor: María Mar Abad-Grau, Granadan yliopisto – Q1818002F, Espanja
vastaanotettu: 03 huhtikuu 2014; Hyväksytty: 27 elokuu 2014; Julkaistu 17. lokakuuta 2014
Copyright: © 2014 Park et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Data Saatavuus: Tällä kirjoittajat vahvistavat, että kaikki tiedot taustalla olevat havainnot ovat täysin saatavilla rajoituksetta. Sanger Genomics of Drug Herkkyys Cancer aineisto päässä Cancer Genome Project (https://www.cancerrxgene.org/).
Rahoitus: Kirjoittajat saanut mitään erityistä rahoitusta tähän työhön.
kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Viime aikoina useat tutkimukset ovat yrittäneet henkilökohtaisen hoidon ja lääketiede perustuu edistykselliseen biolääketieteen teknologioiden [2], [9] . Keskeinen kysymys henkilökohtaiseen genomin tutkimuksen paljastaa genomiseen ominaisuuksia yksittäisen potilaan, jotka ovat merkityksellisiä hoitoon. Elastinen verkko-tyyppinen tasoittuvan regressio (esim harjanne [11], suopungin [29], joustava verkko [34], jne.) On käytetty laajasti paljastaa biomarkkereiden, ja suoritettu onnistuneesti tunnistaa genomista ominaisuuksia ja ennustamisessa vastemuuttuja perustuvat korkea-ulotteinen geeniekspressiota aineisto. Menetelmät kuitenkin voi antaa vain tuloksia, jotka perustuvat keskimääräiseen genomiseen piirteitä kaikista potilaista. Pohjimmiltaan se ei ole vielä mahdollista käyttää näitä menetelmiä tunnistaa genomista ominaisuuksia yksittäiselle potilaalle, mikä on vaikea tehokasta henkilökohtaista hoitoa ja lääketieteessä.
Wang et al. [30] käsitteli potilaskohtaista polku toiminta perustuu yhdistettyä mallia, jossa kiinteiden vaikutusten mallin keskimääräinen polun geeniekspressioiden profiileja potilasryhmien ja sattumanvaraiset vaikutukset kuvataan potilas vaihtelut ryhmästä keskiarvo. Shimamura et ai. [28] esitetty menetelmä, jota kutsutaan NetworkProfiler, tunnistamiseksi potilaan geenistä säätelyverkkojen perustuu vaihtelevan kertoimen malli ja ytimen perustuva joustava verkko-tyypin säännönmukaistamiseksi regressio. Käyttämällä Gaussin ydin toimintoa, NetworkProfiler voidaan tehokkaasti hoitaa potilas-analyysin perusta naapurustossa näytteistä noin potilaalle. Vaikka nykyinen joustava verkko-tyyppinen laillistaminen menetelmiä suorittaa tehokkaasti potilaan analyysin, niiden suorituskyky kestää äkillinen käänne pahin läsnäollessa poikkeavuuksien koska menetelmät rakennetaan kuin vankka tapojen (esim pienimmän neliön tappiofunktion). Käytännössä kliinisessä ja genomisten muutosten aineistot sisältävät tavallisesti harha eri lähteistä (esim koe virhe, koodausvirheestä jne), ja näin nykyiset menetelmät eivät pysty tehokkaasti paljastaa potilaskohtaista biomarkkereita ja ennustaa syövän huumeiden herkkyys.
Vaikka kysymys on ratkaisevan tärkeää, suhteellisen vähän huomiota on kiinnitetty luotettavuutta potilaan-analyysin. Pidämme vankka menetelmä paljastaa potilaskohtaista genomista ominaisuuksia ja ennustaa syöpälääkettä vasteen mukaisesti NetworkProfiler. Genominen Muutokset aineisto on yleensä rakennettu useita ominaisuuksia pieni määrä näytteitä (eli korkea ulotteinen aineisto), ja havaita ja valvoa harha korkean kolmiulotteinen aineisto ovat vaikeita tehtäviä. Viittaamme ohjaustavan harha käyttäen vankka Mahalanobiksen etäisyyden perustuen pääkomponenttianalyysi (PCA) [25]. Käyttämällä pääkomponentit, voimme havaita vieraat havainnot korkean ulotteinen genomista muutos aineisto perustuu vankan Mahalanobiksen etäisyys voittamalla laskettaessa käänteinen kovarianssimatriisin. Lisäksi, koska pääasiallinen komponentti tila määritellään maksimoida varianssi pitkin jokaisen komponentin, ja harha lisätä varianssi tietojen voimme tehokkaasti suorittaa arvojen havaitsemiseen [5], 25.
Ehdotamme vankka mallinnus strategia potilas-analyysin, joka päättelee potilaskohtaista biomarkkerit liittyvät syöpälääkettä vastausta. Ehdotettu strategia perustuu ydin-pohjainen joustava verkko-tyyppinen laillistaminen, ja näin voidaan suorittaa potilaan-analyysin kautta naapuruston näytteiden ympärille tavoite potilaalle. Lisäksi meidän menetelmää voidaan suorittaa tehokkaasti ennustamiseen syöpälääkettä herkkyyttä ja tunnistaa lääkevaste erityisiä biomarkkerit kullekin potilaalle jopa läsnäollessa harha, sillä menetelmä perustuu vankka tasoittuvan regressio käyttämällä painon läpi Mahalanobiksen etäisyys pääkomponenttina space [25].
Teemme Monte Carlo simulaatioiden tutkia tehokkuuden ehdotettu menetelmä, ja näyttää erinomaista suorituskykyä menetelmämme mielestä pisteen ennusteen tarkkuutta. Käytämme myös ehdotettu mallinnus strategiaa julkisesti saatavilla Sanger Perimän of Drug Herkkyys Cancer aineisto päässä Cancer Genome Project (https://www.cancerrxgene.org/). Menetelmämme paljastaa biomarkkereiden yksittäisille potilaille ja ennustaa syöpälääkettä vastaus annetaan IC 50-arvot perustuvat geeniekspressiotasot. Vaikka Monte Carlo simulaatioiden ja hakemus Sanger aineisto, voimme nähdä, että menetelmä toimii tehokkaasti potilaskohtaista ominaisuuksien hallintaan ja ennustaminen mielenkiintoisia vastemuuttuja, vaikka läsnä harha-arvot.
Methods
Oletetaan, että meillä riippumattomia havaintoja, jossa ovat satunnaisia vastemuuttujia (esim syöpälääkettä vaste) ja ovat
p
ulotteinen vektorit ennustajan muuttujat (esim perimän muutokset). Tarkastellaan lineaarista regressiomallia, (1) missä on siepata, on tuntematon
p
ulotteinen vektori regressiokertoimia ja ovat satunnaisia virheitä, joiden oletetaan olevan itsenäisesti ja samoin jakautuneita keskiarvolla 0 ja varianssi.
paljastaa biomarkkereiden, elastinen verkko-tyyppinen laillistaminen menetelmiä (esim harjanne, suopungin, joustava verkko, jne.) ovat laajalti käytössä, ja käytetty menestyksekkäästi tunnistamaan ratkaiseva geenien perustuu seuraaviin optimoinnin ongelma, (2) missä (3) ja jossa on regularisaatioparametri ohjaamiseksi mallin monimutkaisuutta. Rangaistus toimikausi joustava verkko on kupera yhdistelmä harjan ja lasso seuraamuksia. Kun elastinen verkko tulee harjun regressio rangaistuspotkusta, kun taas silloin kun se tulee lasso ilman seuraamuksia. Elastinen verkko suorittaa muuttuvan valinta ja arviointi yhdessä ominaisuuksia sekä lasso ja harjun regressio.
joustava verkko-tyyppinen seuraamuksia voimme samanaikaisesti tunnistaa ratkaiseva biomarkkereita ja ennustaa lääkkeen vaste. Lisäksi voimme tehokkaasti suorittaa regressiomallinnus korkean ulottuvuuden genomista muutoksia aineisto ja läsnäollessa multikollineaarisuus määräämällä rangaistusta pienimmän neliösumman tappiofunktion. Vaikka nykyisten menetelmien onnistuneesti tunnistaa ratkaiseva biomarkkereita ja osoittaa huomattavaa suorituskyvyn ennustamiseksi lääkevaste, niitä on käytetty tunnistamaan keskimäärin biomarkkereita kaikille potilaille. Toisin sanoen, nykyinen menetelmä ei voi tunnistaa potilaan ominaispiirteet on sairaus.
NetworkProfiler
Shimamura et al. [28] Ehdotettu uusi tilastollinen menetelmä päätellä potilaskohtaista geeni säätelyverkkojen perustuu vaihtelevan-kerroin rakenteellinen yhtälö malli. Antaa on mahdollista sääntelyviranomaisten ja olla kohdegeenin ohjataan sääntelijöiden [28]. Vaihtelevat kerroin rakenteellinen yhtälö malli annetaan (4) missä on regressio kerroin päälle modulaattorin. Potilas-erityisiä regressiokertoimia arvioidaan kautta ydin-pohjainen laillistaminen menetelmällä minimoimalla, (5) missä, ja (6) missä on paino rekursiivinen joustava verkko rangaistus tehokkaan ominaisuuksien hallintaan [28], ja on Gaussin ydin toiminto kaistanleveys, (7) B
Gaussin ydin toimintoa käytetään sopimaan mallia perustuu näytteistä naapurustossa potilaan ympärillä. Käyttämällä Gaussin ytimen toiminto regularisoitua regression suoraa, jonka NetworkProfiler suorittaa tehokkaasti päätellä potilaskohtaista geeni säätelyverkkojen, ja tulokset voimme tehokkaasti yksilöllisiä syövän hoitoon.
On kuitenkin hyvin tiedossa, että genomisen muutokset aineistot sisältävät tavallisesti harha eri lähteistä (esim koe virhe, koodausvirheestä jne). Se merkitsee sitä, että nykyiset menetelmä ei toimi hyvin ja paljastamiseksi biomarkkereita ja ennustamiseen syöpälääkettä vastaus, koska nykyinen menetelmä (5) perustuu rangaistaan pienimmän neliösumman tappiofunktion. Se oli aikaisemmin osoitettu, että joustava verkko-tyyppinen laillistaminen menetelmiä, jotka perustuvat ainakin neliön tappiofunktion tehottomasti läsnäollessa poikkeavuuksien ja useat vankka menetelmien on ehdotettu haittojen poistamiseksi pienimmän neliön tappiofunktion regularisoitua regressiomallinnus [ ,,,0],1], [14], [25].
Ehdotamme yksinkertaista menetelmää potilaan-analyysin mukaisesti NetworkProfiler.
kestävä laillistamista varten harha-resistenttejä potilaskohtaista analyysi
ensimmäinen näyttää, kuinka vieraita havaintoja voivat vaikuttaa arviointiprosessi käytettäessä rangaistaan pienimmän neliösumman menetelmää. Kuvio 1 esittää iterointi kertoimien aikana optimointia sääntöjen mukaisiksi regressiomallinnus kanssa suopunki rangaistus [25] alle alkuperäisen ja saastuneen diabetes aineistot [3] (A) ja (B), tässä järjestyksessä. Saastunut aineisto sisältää 10% harha varten ja joukossa 10 ennustaja muuttujia. Kertoimet lähenivät jälkeen 26 toistojen alkuperäisessä aineisto, kuten kuvassa 1 (A). Läsnäollessa harha kuitenkin optimointitoi- kanssa lasso estimaattorin häiriintyy ja iteraation numero tarvittava lähentyminen on huomattavasti kuvion 1 (B). Tämä tarkoittaa, että poikkeavia havaintoja merkittävästi häiritse tasoittuvan regressiomallinnus, ja voi siten johtaa huonoihin tuloksiin paljastamiseksi biomarkkereita ja ennustamiseen lääkevaste jossa potilas-analyysin.
Ehdotamme luotettava menetelmä tehokkaasti paljastamaan potilas- erityisiä syöpä biomarkkereita ja ennustaa syöpälääkettä herkkyys mukaisesti NetworkProfiler. Genominen ominaisuudet aineisto on rakennettu useita ominaisuuksia ja suhteellisen pieni määrä näytteitä (eli korkea ulotteinen aineisto), ja havaita ja valvoa harha korkean kolmiulotteinen aineisto ovat yleensä vaikeita tehtäviä. Voit ratkaista ongelman, pidämme painon ohjaamiseksi vieraat havainnot perustuvat vankan Mahalanobiksen etäisyyden laskettu vankka pääkomponentti tilaa, kuten aiemmin osoitettu Park ja Konishin [25], (8), jossa on 95% kvantiili jakelun [14] , ja on vankka Mahalanobiksen etäisyyden perustuu voimakkaasti arvioitu keskiarvo ja kovarianssimatriisi jonka vähimmäismäärä Ellipsoid (MVE) lasketaan vankka pääkomponenttien tila seuraavasti, (9) missä on matriisi vankka pääkomponentit perustuu vankka kuormitukset käyttämällä projektio-harjoittamisesta tekniikkaa [12]. Käyttämällä vankka pääkomponentti tilaa, voimme tehokkaasti havaita harha perustuu vankka Mahalanobiksen etäisyyttä, jolloin tuotteita laskettaessa käänteinen kovarianssimatriisin korkean ulotteinen aineisto. Lisäksi pääkomponentit tila määritellään maksimoimalla varianssi pitkin jokaisen komponentin, ja koska harha lisätä varianssi aineisto, voimme enemmän uskollisesti havaita harha [5]. Se merkitsee sitä, että paino perustuu vankka Mahalanobiksen etäisyys laskettu vankka pääkomponentti tila on hyödyllinen väline valvontaan vieraat havainnot korkean ulotteinen genomista tietoa.
viittaavat paino (8) harha kestävä potilaiden erityisiä analyysi, ja ehdottaa vankka menetelmä paljastamiseksi biomarkkereita ja ennustamiseen huumeiden herkkyys yksittäiselle potilaalle seuraavasti, (10) (11) missä on paino mukautuva joustava verkko rangaistus [35].
ehdotettu mallinnus strategia on todellisuudessa toteutetaan käyttäen koordinoida laskeutuminen algoritmi perustuu painotettuun päivityksen [6]. Meidän menetelmää voidaan tehokkaasti suorittaa potilaskohtaista analyysi perustuu Gaussin ytimen toiminto, ja sen tehokas suorituskyky voidaan johdonmukaisesti viiveellä myös vieraiden havaintojen ohjaamalla vieraita havaintoja kautta paino.
Tulokset
tutkimme tehokkaasti ehdotetuilla mallintamisen strategiaa vankka menetelmä potilaskohtaista analyysiin Monte Carlo simulaatioiden ja soveltaminen syövän genomiikan tietoja. Arvioida ehdotetun menetelmän, verrataan ennustearvon ja vaihteleva valikoima tuloksia meidän menetelmän NetworkProfiler ja joustava verkko. Meidän tutkimuksen NetworkProfiler käytetään paljastaa yksittäisiä biomarkkereita sijaan geenin verkoissa. Sillä numeerinen tutkimuksia, käytämme mukautuva joustava verkko rangaistus [35] ehdotetussa menetelmässä, NetworkProfiler ja joustava verkko. Valitsemme viritysparametrejä ja kaistanleveys Gaussin ytimen toiminto perustuu k-kertainen cross validointi [18], (12) missä on validointi näytteitä, ja tietoja käytetään arvioitaessa kunkin. Vuonna numeerinen tutkimuksissa, käytämme 3-kertaiseksi cross validointi, jota on käytetty korkea ulotteinen data-analyysi, kuten genomisen data-analyysi [13], [20], [22], [26], [32]. Vankka Mahalanobis etäisyys lasketaan perustuu vankka pääkomponentit, jotka vaikuttivat 95% koko vaihtelu.
Monte Carlo simulaatiot
simuloitu 100 aineistoja koostuu havaintoja malli (13), jossa oletetaan jaettavaksi ja syntyvät tasaisen jakelu. Korrelaatio ja on ja on kolmiulotteinen monimuuttuja normaalijakaumaa jonka keskiarvo on nolla. Pidämme 1000 ulotteinen vektori kertoimet satunnaisesti valittua 100 ei-nolla ja 900 nolla-kertoimia.
kahdentyyppisiä kertoimen toimintojen edellä vaihtelevia kerroin malli pidetään, kuten on esitetty kuviossa 2. Tarkastellaan näytteiden poikkeavat havainnot näytteissä. Jos näyte on poikkeavuuksien ja seurannan. Tässä asetetaan, ja 20, ja sekä simulaatioita 1 ja 2, vastaavasti.
Katsomme, koulutus aineisto 75 näytettä ja testin aineisto 25 näytettä kussakin 100 simulaatioita. Hyperparameters valitaan 3-kertaiseksi rajat validointi koulutuksessa aineisto ja ennustevirheet lasketaan testin aineisto perustuu valittujen parametrien. Sitten vertailla ennustetarkkuus annetaan keskiarvona mediaani potenssiin virhe, ja muuttuja valinta tarkkuus annetaan oikeita positiivisia (eli keskimääräinen osuus nollasta poikkeavien kertoimien, jotka arvioitiin ei-nolla) ja tosi negatiivinen (eli keskimääräinen prosenttiosuus totta nolla-kertoimia, jotka on määritetty oikein nolla) kullekin 100 syntyy aineistot.
suuri määrä ennustaja muuttujia johtaa aikaavievä analyysi, ja näin ollen lisää yleistä laskennallisen kustannukset menetelmän . Lisäksi on altistunut, että suuri määrä ennustajan muuttujien meluisa geenit voivat häiritä mallintamisen menettelyä, ja näin johtaa huonoon tulosennusteita [19]. Taulukko 1 esittää ennusteen tarkkuus NetworkProfiler perustuu kaikkiin ominaisuuksia ja perustuvat ennalta valitun pieni määrä ominaisuuksia, joilla on korkein varianssi. Se näkyy läpi Taulukko 1 että tarkasteltava kaikkia ominaisuuksia ei tuota korkea ennustaminen suorituskyky verrattuna suorituskyky regressiomallin rakennettiin ennalta valitun pieni määrä ominaisuuksia. Se tarkoittaa, että ei ole tarvetta harkita kaikkia ominaisuuksia potilas-analyysin, koska se johtaa tehottomaan mallintamiseen parantamatta mallin tehokkuuden.
Näin vertaamme ehdotettu luotettava menetelmä on NetworkProfiler ja elastinen netto perustuu malliin, jossa ennustaja muuttujia, joilla on korkein varianssi kaikissa näytteissä. Taulukot 2 ja 3 esittävät simulaation tulokset (eli tosi positiivinen (TP), tosi negatiivinen (TN) ja ennustevirhe (PE)) simulaatioissa 1 ja 2, vastaavasti, jossa rohkea arvot osoittavat paras suoritus kolmesta menetelmästä ( eli joustava verkko: ELA, NetworkProfiler: NP, luotettava menetelmä: R). Vaihtelevat kerroin Malli tuottaa erotteleva muuttuja valinnan tulokset jokaisen näytteen, ja näin me vain vertailla ominaisuuksien hallintaan tulokset NetworkProfiler ja ehdotti vankka yksi, koska joustava verkko voi suorittaa näytteen erityispiirre valinta.
taulukot 2 ja 3 osoittavat, että suunniteltu luotettava menetelmä potilaan-analyysin päihittää ennustamiseen vastemuuttuja kaikissa simulointi tilanteissa ja kerroin funktiotyyppejä. Olemme myös huomauttavat, että ehdotettu yksinkertaista menetelmää ja NetworkProfiler mitään merkitystä tulosten vaihtelevan valinnassa. Tuloksista nähdään, että ohjaamalla vieraat havainnot mallinnuksessa menettely tuottaa harha-resistenttejä estimointitulosten, ja tulokset johtavat erinomainen ennustamiseen mielenkiintoisia vastemuuttuja.
Tosielämän esimerkki: Sanger aineisto
Käytämme ehdotettu mallinnus strategiaa julkisesti saatavilla Sanger Genomics of Drug Herkkyys Cancer aineisto päässä Cancer Genome Project (https://www.cancerrxgene.org/). Tärkein Projektin tavoitteena on tunnistaa molekyyli- piirteitä eri syöpien ja ennustaa herkkyyden syöpälääkkeet. Aineisto koostuu geeniekspressiotasot, kopiomäärä ja mutaatio tilan 654 solulinjoja. IC 50-arvot (ts puolet maksimaalisesta inhiboiva lääkepitoisuudet) 138 lääkkeet annetaan luonnollisena lokin huumeiden herkkyysarvon. IC50-arvot Sanger aineisto sisältää ei muutamia puuttuvia arvoja, ja näin teemme biomarkkereiden löytö ja syöpälääkettä vasteen ennustaminen perustuu 200 satunnaisesti valittua näytettä, joista 150 solulinjoja käytettiin harjoitustiedot ja 50 solulinjoja käytettiin testituloksia kullekin 138 huumeita.
arvioitava ehdotetut vakaa metodologia, ensin päättää, onko aineisto rakennettu IC 50-arvot kunkin lääkkeen ja ekspressiotasot 13321 geenien saastuneiden tai ei. Kullekin 138 aineisto (eli geenien ilmentymisen tasoja ja IC 50-arvot), jotka vastaavat 138 lääkkeet, löydämme ensimmäinen pääasiallinen komponentti aineisto, ja sitten päättää perustuu seuraaviin kriteerin (14), jossa on vankka Mahalanobiksen etäisyys lasketaan ensimmäinen pääkomponenttina. Peruste on nolla ei-saastunut aineisto, kun taas suuri arvo osoittaa, että aineisto sisältää poikkeavia havaintoja. Kuvassa 3 lajitellut arvot 138 aineistoja.
Pidämme mittausmuistien sijaitsee oikeassa yläkulmassa kuvion 3 saastuneeksi aineistoja, joissa on suhteellisen suuria arvoja, jotka ovat erittäin poikkesi keskiarvosta arvoja. Ehdotettu yksinkertaista menetelmää sovelletaan sitten saastunut aineistoja arvioida suorituskykyä menetelmiä tunnistettaessa biomarkkereita ja ennustamiseen syöpälääkettä herkkyys. Vertaamme ennustetarkkuus Yhteensä 10 aineistoja, jotka vastaavat 10 huumeiden näkyvät punaisina pisteinä kuviossa 3: huumeet FTI.277, DMOG, NSC.87877, AKT.inhibitor.VIII, MIDOSTAURIININ, BMS.754807, Thapsigargin, bleomysiini, doksorubisiini , Epothilone.B.
Kuten aikaisemmin on mainittu, on suuri määrä ominaisuuksia, ei ainoastaan johtaa tehottomaan mallinnus, mutta voi myös tuottaa huonoja tuloksia verrattuna mallinnuksen ennalta valitun pieni määrä ominaisuuksia. Ensin verrataan ennustearvon (eli mediaani neliö virhe 50 testinäytteiden) on syöpälääke hoitovaste ekspressiotasot 133 (1% koko 13321-geenien) geenejä, ja 500-geenit, joilla on korkein varianssi perustuu NetworkProfiler taulukossa 4. Taulukko 4 osoittaa, että mallinnus perustuu ekspressiotasot 133 geenien tuottaa erinomaisen ennustearvon verrattuna mallinnuksen 500 geenejä. Tuloksesta, voimme myös päätellä, että ei ole tarpeen tutkia suuri määrä geenejä melua, ja että suuri määrä ominaisuuksia vain johtaa tehottomaan mallintamiseen ja huono ennuste tuloksia. Näin ollen meidän arvioida ehdotetun luotettava menetelmä verrattuna NetworkProfiler ja joustava verkko, joka perustuu ekspressiotasot 133 geenejä. Taulukossa 5 on esitetty mediaani squared error 50 testinäytteitä kuin ennustevirhe on syöpälääke vasteen. Ehdotettu yksinkertaista menetelmää päihittää nykyisiä menetelmiä ennustamiseen syöpälääkettä vasteen saastunut aineistoja.
Kuva 4 esittää paljastetun syöpä biomarkkerit, jotka valitaan yli 80% malleja kukin 150 kudoksia (eli valittu yli 120 näytettä perustuvat erilaisiin kerroin mallista) meidän menetelmällä kunkin lääkkeen vastaus. Jotta näyttää luotettavuutta menetelmän, me osoittavat myös 10 useimmin löydetty geenien ennustettaessa herkkyys 10 huumeiden ja niiden viittaukset taulukossa 6. On eroja biomarkkerit löysi perustuvat menetelmää ja ne löydettiin käyttämällä elastista net [8], koska menetelmämme tunnistaa syövän biomarkkereita kunkin potilaan mieluummin kuin keskimäärin biomarkkereita kaikille näytteille. Kuitenkin huumeiden herkkyys erityisiä biomarkkerit löysi menetelmämme vahvasti tuettuja totta syöpä biomarkkereita, että kirjallisuudessa (sarake ”Reference” taulukossa 6). Tulos viittaa siihen, että ehdotettu menetelmä potilaskohtaista analyysi tuottaa luotettavaa tulosta paljastamiseksi syöpä biomarkkereita.
Lyhyesti sanottuna menetelmä on hyödyllinen työkalu ennustamiseen syöpälääkettä herkkyys ja paljastamiseksi potilaskohtaiset syövän biomarkkerit.
keskustelu
Olemme ehdottaneet uutta harha kestävä menetelmä paljastamiseksi potilaskohtaista biomarkkereita ja ennustamiseen syöpälääkettä vastausta. Käyttämällä vankka Mahalanobiksen etäisyys laskettu vankka pääkomponenttina tilaa, ehdotettu menetelmä tehokkaasti tunnistaa ja ohjaa harha korkean ulotteinen genomista muutoksia aineistoja. Niinpä ehdotettu luotettava menetelmä voidaan tehokkaasti suorittaa paljastamaan syöpä biomarkkereita ja ennustaa huumeiden herkkyys, vaikka läsnä harha-arvot. Vuodesta Monte Carlo simulaatiot, olemme havainneet, että meidän menetelmä osoittaa erinomaisen ennustetarkkuus verrattuna nykyisiin NetworkProfiler ja joustava verkko. Olemme myös soveltaa ehdotettua menetelmää Sanger aineisto päässä Cancer Genome Project. Käyttämällä menetelmämme, olemme paljaana syöpä biomarkkereita ja ennusti syöpälääkettä vastausta. Se voidaan nähdä tuloksista, että ehdotettu menetelmä on hyödyllinen työkalu ennustamiseksi syöpälääke vasteen. Lisäksi biomarkkerit paljastui meidän menetelmällä oli aikaisemmin tunnistettu syöpää biomarkkereita. Tulokset merkitsee sitä, että meidän menetelmä tarjoaa paitsi luotettavia ominaisuuksien hallintaan, mutta myös tarkan ennusteen tuloksiin.
Tällä hetkellä paljon keskustelua potilas-analyysin ja henkilökohtaisen lääketieteen perustuu korkeaan ulotteinen genomista aineistoja. Odotamme, että menetelmämme on hyötyä aloilla, koska genominen data sisältää yleensä poikkeavia havaintoja.
Vaikka potilaskohtaista perustuva menetelmä vaihteleva kerroin malli on tehokas väline, se ohjaa vaikutukset havaintojen järjestyksessä antaa näytteen erityisiä tuloksia. Toisin sanoen, se vähentää vaikutusta havaintoja kaukana kohde potilaan, ja johtaa siten korkean ulotteinen datakehyksen. Rakennus mallit perustuvat useita ominaisuuksia pieni määrä näytteitä voidaan johtaa overfitting ominaisuus valinta, ja voi tuottaa tehottomia tulosennusteita. Parantaakseen mallinnus suorituskykyä, tuleva työ voi liittyä ulottuu potilaan-analyysin perusteella bootstrap tekniikkaa.
Sanger aineisto päässä Cancer Genome Project tarjoaa kattavaa tietoa molekyyli- ominaisuudet syöpä (esim mutaatio, ekspressiotasot ja kopioluvun vaihtelu) ja vaste eri syöpälääkkeet. Siten analyysi aineisto voi antaa informatiivisia tuloksia noin systeemibiologian syövän ja arvokasta tietoa yksilöllisten ja syövän hoitoon. IC50-arvot 138 huumeita annetaan lääkettä herkkyys kuitenkin sisältää paljon puuttuvia (44-364 puuttuvat arvot yhteensä 654 solulinjoissa). Jotta tehokkaasti käyttää Sanger aineisto paljastaa mekanismia syövän sijaan välittämättä epätäydellinen kenttiä, oikea käsittely puuttuvat arvot vaaditaan.
Lisäksi olemme myös tunnistettu numeerinen tutkimuksissa, että suuri määrä meluisia ominaisuudet saattavat häiritä mallinnus suorituskykyä, ja siten strategioita esivalinnan ehdokasjoukon vaaditaan parantamaan mallintamista suorituskykyä.
Kiitokset
Tämä tutkimus käytetty laskentaresursseja K tietokoneen edellyttäen jonka RIKEN Advanced Institute Laskennallisen tieteen kautta HPCI System Tutkimushanke (Project ID: hp140230) ja Super Computer System, Human Genome Center, Institute of Medical Science, University of Tokyo. Tekijät haluavat kiittää avustava toimittaja ja nimetön arvioijat rakentavasta ja arvokkaita kommentteja että paransi paperin laatua.