PLoS ONE: Context Sensitive Modeling of Cancer Drug Herkkyys
tiivistelmä
Viimeaikaiset seulonta huumeiden herkkyyden Suurten levyjen syöpäsolulinjois- tarjoaa arvokkaan resurssin kehittääkseen algoritmeja, jotka ennustavat lääkevastetta. Koska enemmän näytteitä, lisääntynyt tilastollinen voima, useimmat lähestymistavat ennustamiseen huumeiden herkkyys altaan useita syöpätyyppejä yhdessä, eroa. Kuitenkin yleiseurooppalainen syövän tulokset voivat olla harhaanjohtavia, koska vaikuttavat sekoittavat kudosten tai syövän alatyyppejä. Toisaalta, riippumaton analyysi kunkin syöpä-tyyppistä haittaa pieni otoskoko. Tämän tasapainottamiseksi kompromissi, esitämme CHER (pika heterogeenisuus Käytössä regressio), algoritmi, joka rakentaa ennustavia malleja huumeiden herkkyyttä valitsemalla ennakoivaa genomista ominaisuuksia ja päättää mitkä tulisi-ja saisi-jaeta eri syöpiä, kudoksia ja huumeet . CHER tarjoaa huomattavasti tarkemman malleja huumeiden herkkyys kuin vertailukelpoinen elastinen verkko perustuvia malleja. Lisäksi CHER antaa paremman käsityksen taustalla olevat biologiset prosessit etsimällä harva joukko yhteisiä ja tyyppikohtaista genomista ominaisuuksia.
Citation: Chen BJ, Litvin O, Ungar L, Pe’er D (2015) Context Sensitive Modeling of Cancer Drug herkkyys. PLoS ONE 10 (8): e0133850. doi: 10,1371 /journal.pone.0133850
Editor: Julio Vera, University of Erlangen-Nürnberg, Saksa
vastaanotettu 4 helmikuuta 2015 Hyväksytty: 3. heinäkuuta 2015 Julkaistu: 14 elokuu 2015
Copyright: © 2015 Chen et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään
Data Saatavuus: Tiedot ovat Cancer Cell Line Encyclopedia hanke (https://www.broadinstitute.org/ccle/home) ja ovat käytettävissä, kun käyttäjä rekisteröinnin verkkosivuilla.
Rahoitus: Tämä tutkimus tukivat Stand Up To Cancer Innovative Research Grant (IRG08), National Institutes of Health (R01CA164729) ja National Centers for Biomedical Computing Grant 1U54CA121852-01A1. D.P. omistaa Packard Fellowship varten Science and Engineering.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Kun viimeaikaisen kehityksen seuraavan sukupolven sekvensointi teknologiat, näkymiä terveyspalveluja näyttää kirkkaammalta kuin koskaan [1]. Käyttö genomiikan ohjata kliininen hoito on ehkä yleisin syöpä [2, 3]. Monet edelläkävijä tutkimukset ovat osoittaneet, kuinka voidaan käyttää allekirjoitusta geenien ilmentymisen ennustaa hoitotuloksia yksittäisten potilaiden [4-6]. Viime aikoina kaksi suuria kokoelmia täsmäsi huumeiden näytöt ja genomiikka profiilit syöpäsolulinjoissa on julkaistu [7, 8]. Näitä tietoja on käytetty rakentaa ennustavia malleja lääkevaste liittämällä genomista ominaisuuksia huumeiden herkkyys syöpäsolulinjoissa [9-12]. Lisäksi yhdistää huumeiden herkkyys tietyille genomista toiminnoilla voidaan valottaa mekanismeja lääkkeen toiminnan ja valottaa taustalla syitä vastustuskykyä hoitoon. Siten nämä tiedot tarjoavat mahdollisuuden kehittää menetelmiä, joita voidaan käyttää yksilöllisten.
Keskeinen haaste yhdistämällä geneettisiä ominaisuuksia huumeiden herkkyys on kontekstin roolia biologisissa järjestelmissä. Esimerkiksi geenin ilmentymisen säätelyyn on osoitettu olevan kuvioita erityisiä kudoksia ja solutyyppejä [13-16]. Kasvainten synnyssä, monipuolinen malleja mutaatio, geenien ilmentyminen, ja epigeneettiset sääntelyn on havaittu myös syöpään erityinen tai kudosspesifisiä tavalla [17, 18]. Tässä yhteydessä riippuvuus on tärkeä rooli hoidon tehoon. Esimerkiksi, PLX4732, joka on RAF-estäjän kohdistaminen onkogeeninen
BRAF
V600E
, on tehokas hoito melanooman potilailla, joilla on mutaatio, [19]. Kuitenkin, paksusuolen syövän potilaille, joilla on sama mutaatio eivät vastaa PLX4732 [20]. Siksi on tärkeää ottaa huomioon yhteydessä syntyvät syöpätyyppeihin analysoitaessa genomiikka huumeiden herkkyys.
Ei ole yllätys, että ennustemallit rakennettu käyttäen vain melanooma data antaa paremman ennusteen melanooman näytteistä kuin rakennettu käyttäen data sekalaisen syöpätyyppien [7]. Tämä esittää, että meidän pitäisi keskittyä yhteen syöpätyypin rakennettaessa malleja huumeiden herkkyys. Vaikka tällainen strategia antaa meille mahdollisuuden välttää sekoittavia vaikutuksen yhteydessä rajoittaa meitä pieni määrä näytteitä. Johtuen otoskoko, nykyinen aineistot puuttuu tilastollinen voima rakentaa erillisiä malleja kaikille syöpään.
Käytämme yhteistä keskenään syöpätyyppeihin ja huumeiden voittaa niukasti tietoja. Ehdotamme CHER (pika heterogeenisuus Käytössä regressio), algoritmi, joka rakentaa ennustavia malleja valitsemalla genomista ominaisuudet ja päättämään, mitkä ovat yhteisiä tai ei välillä syöpätyyppien, kudosten ja huumeita. CHER on valtuudet kaksi oletuksiin. Ensinnäkin CHER olettaa samanlaisia syöpätyyppeihin voi olla samanlaisia mekanismit huumeiden herkkyys. Esimerkiksi pohjapinta-kuin rintasyöpä ja munasarjasyöpä on monia molekyyli allekirjoitusta [21]; Siksi nämä kaksi syövät ovat todennäköisesti samanlaisia ennustavan genomista piirteitä huumeiden herkkyys. Toiseksi CHER oletetaan, että jos kaksi lääkkeet aiheuttaa samankaltaisia vasteita, niiden ennustemallit ovat todennäköisesti samankaltaisia. Nämä oletukset sallivat CHER lisätä sen valta paljastaa biomarkkerit ennustavan huumeiden herkkyyden jakamalla tietoja välillä syövät ja huumeiden.
sovellettu CHER kolmeen aineistoja päässä Cancer Cell Line Encyclopedia (CCLE) [7], ja osoittaa, että CHER antaa huomattavasti tarkempi mallinnus huumeiden herkkyyden näissä aineistoja verrattuna muihin menetelmiin. Aiemmista menetelmiä, jotka olettavat kaikki näytteet on samat ennakoivaa ominaisuuksia, CHER nimenomaisesti oppii joka ennustavaa ominaisuuksia olisi jaettava vai ei välillä syöpiä tai alatyyppejä. Tietojen on useita alatyyppejä näytteitä, CHER myös tunnistaa aina kyseessä alatyyppi, joka määrää yhteydessä spesifisyys, joka tarjoaa mahdollisuudet valottaa päälle mekanismeista farmakogenomiikkaa.
Alla esitämme aluksi motivaatiota ja käsite CHER, jota seuraa tulokset sovelluksen CCLE tietoja. Sitten vertailla CHER suorituskykyä muilla menetelmillä ja osoittaa Cherin ylivoimainen suoritus. Esimerkki malleja CHER ovat esillä ja niistä keskustellaan. Yksityiskohtia CHER algoritmi sitten esitetty materiaalit ja menetelmät sekä S1 teksti.
Tulokset
pika heterogeenisuus Käytössä regressio
Käytämme tietoja Cancer Cell Line Encyclopedia (CCLE) [ ,,,0],7] analyysimme. CCLE kohortti sisältää 36 erilaista syöpätyyppejä, joita tyypillisesti keskittää yhteen analyysiä ei tehdä eroa eri [7]. Kuitenkin vaikutukset kudosten huumeiden herkkyys ovat ilmeisiä (S1 Kuva).
Yksi tapa ratkaista tämä ongelma on taantua ulos keskimääräinen vaikutus kudosten kautta monimuuttuja varianssianalyysi (MANOVA) ja sitten mallintaa jäännösten kaikki näytteet yhdessä [8]. Tämä ei kuitenkaan ole huolehtia asiayhteyteen vaikutus. Tämä tarkoittaa, että vaikutus kudoksen-geenin vuorovaikutusta. Esimerkiksi
MDM2
yliekspression tiedetään ennustavan herkkyys Nutlin-3 akuutti myelooinen leukemia [22] ja akuutti lymfaattinen leukemia [23]. Kuitenkin korrelaatio
MDM2
ilmaisun ja herkkyys Nutlin-3 vaihtelee huomattavasti kudosten (Pearsonin korrelaatiokerroin r: -0,01 ~ -0,53). S2B Kuvio osoittaa yhdistyksen välillä
MDM2
ilmaisun ja herkkyys Nutlin-3 eri kudoksissa. Vaikka tämä yhdistys voidaan havaita kaikissa näytteissä (r = -0,38, p 5e-8), kuten yhdistys on harhaanjohtava, koska
MDM2
ilmaisua ei ole ennusteita kudoksia sellaisenaan keuhko- tai haiman (S2B kuvio). Lisäksi jos me hävitä näytteet näitä kudoksia, joissa yhdistys on poissa, voimme nähdä parannettu yhdistys (S2A kuvio) ja kasvu
MDM2: n
ennusteita näissä kudoksissa. Koska jokainen kudos voi olla eriasteinen välisen assosiaation
MDM2
ilmentyminen ja herkkyys Nutlin-3, kuten kudosspesifisiä geenin vaikutuksia tulee
kudos-geenin yhteisvaikutus
, kun kaikki näytteet yhdistettiin analysoitavaksi. Käyttämällä MANOVA yksinkertaisesti taantua lasketaan keskiarvo vaikutus kunkin kudoksen ei ratkaise tällaisia kudosspesifisiä geenin vaikutus.
optimaalisesti rajoittaisi analyysin yhteen syöpätyypin kerrallaan, mutta valitettavasti tuloksena otoskoko on tällä hetkellä liian pieni. Käytettävissä olevat lääke herkkyyttä datan CLLE sisältää vähemmän kuin 40 näytettä varten useimmat syövät, paitsi keuhkosyöpä (n = 91), syövät peräisin hematopoeettisten ja imukudoksen (n = 70), ja ihosyöpä (n = 40) (S3 kuvassa) ja jopa nämä otokset ovat suhteellisen pieniä. Puute tilastollinen voima johtuu pienen otoksen koosta pahentaa vielä koko ja monimutkaisuus ihmisen genomin.
Saada tilastollinen voima ja osuus on edelleen yhteydessä spesifisyyden kehitimme
CHER
(pika heterogeenisyys Käytössä regressio), algoritmi perustuu siirto oppiminen [24], joka valitsee ennustavan genomista ominaisuuksia ja rakentaa regressiomallien huumeiden herkkyys. Toisin kuin muut algoritmit, CHER pyrkii paljastamaan ennustavan ominaisuuksia, jotka ovat yhteisiä koko konteksteissa, sekä ominaisuuksia, jotka ovat ennustavia vain tietyissä yhteyksissä. Konteksti voi olla syöpä tyyppi, kudostyypin tai syöpä alatyyppiä. Viittaamme tässä yhteydessä, koska
asiaa alatyyppi
, tai
split
, joka erottaa yksilöt kahteen ryhmään, joissa ennakoivaa ohjelma huumeiden herkkyys voi olla erilainen.
CHER samanaikaisesti saavuttaa kaksi tavoitetta: CHER nimenomaisesti suorittaa harva ominaisuuksien hallintaan optimoimalla suorituskyvyn ennustaminen huumeiden herkkyys. Kun taas optimoimalla ennustaminen huumeiden herkkyys ennustaminen on ratkaisevan tärkeää tarkkuus lääketieteen, harva ominaisuus valinta mahdollistaa biologisen tulkinnan tuloksena malleja. Jälkimmäinen on erityisen tärkeää, koska se voi antaa ymmärtää lääkeresistenssin jotka voisivat valottaa tapoja parantaa lääkekehityksessä tai yhdistelmähoidossa.
algoritmi on saanut vaikutteita siirto oppimisen teoria [24]. Me lisätä valtaa jakamalla tietoja välillä syövät ja huumausaineiden välillä. Ensin opimme malleja samanlainen syövät lähinnä tietojen jakamiseen välillä syöpiä olettaen, että ne voivat jakaa saman genomista ominaisuudet vastaavat lääkeaineen herkkyys (kuvio 1A). Yhdistämällä näytteitä vastaavien syövät kasvatamme valta oppia ennustavia niille yhteisiä. Saat asiayhteyskohtaisia, tai syöpä-tyyppikohtaista ennustavia, esittelemme
split
muuttuja, joka edustaa tyyppiä /alatyyppejä syöpiä. Tämä jako eri edellytykset ennakoivan vaikutusten yhteydessä erityispiirteet vuorovaikutuksen kautta termien jaetun muuttujan ja ennustajia mallissa (esimerkkejä, geeni A ja mutaatio M melanooman, kuviossa 1A). Huomaa, valinta split on osa optimoinnin ongelma. CHER oppii erottamaan näytteitä kahteen ryhmään, kun tällainen erottaminen näytteistä lisää ennusteita. Tässä vaiheessa CHER on oppinut alustavan malli, joka voi sisältää sekä ennustavina että jaetaan syövät tai erityisten yksi heistä.
. Esimerkki mallin oppinut CHER, jossa lääkeaine herkkyyttä melanooma näytteet voidaan ennustaa M: n mutaatio ja geenin ilmentymisen ja S, kun taas gliooma, ilmentyminen geenin S ja B ovat ennustajia. CHER hyödyntää yhdistämisen näytteiden yhdessä saada tilastollinen voima, tunnistaminen sekä yhteisiä (geeni S) ja konteksti-erityispiirteet (A, B ja M). Tapauksissa, joissa asiayhteys on tuntematon, algoritmi etsii parasta ”split”, jos sellainen on, erilliset näytteet kahteen ryhmään. Yi lääkeaineen herkkyys i: nnen näytteen, xi ovat vastaavia ominaisuuksia i: nnen näytteen, zit = 1 esittää i: s näyte on melanooma, ja I (.) On indikaattori funktio. B. Iteratiivinen oppiminen järjestelmän CHER. CHER aluksi oppii mallit yhtenäisillä ennen (tarkoittaa, että jokainen genomista ominaisuus on sama todennäköisyys tulla mukana mallissa). Jokaisen iteraation CHER kouluttaa regressiomallit kanssa bootstrapping, joka mahdollistaa algoritmin määriteltävä, kuinka usein kunkin ominaisuuden ollessa valittuna. Sitten CHER säätää prioritodennäköisyydet mukaan jakeluun taajuuden ja samankaltaisuuden fenotyyppien.
Seuraavaksi lisätä CHER oppimista siirtämällä tietoa huumausaineiden välillä (kuvio 1 B). Oletamme, että jos kaksi huumeet aiheuttaa samanlaisen vastauksen, niiden ennustemallit ovat todennäköisesti samankaltaisia kuin hyvin. Jos esimerkiksi kaksi lääkettä indusoi korreloi vastauksista ja olemme havainneet geeni
ennustajana herkkyyttä yhtä lääkettä, on todennäköisempää geeni
on myös ennustava muiden huumeiden . Näin voimme säätää uskoamme kunkin ominaisuuden ollessa ennustavan huumeiden herkkyyden vertaamalla malleja johdettujen samankaltaisia lääkkeitä. Vuodesta Bayes näkökulmasta alkuperäisen malleja lääkeaineen herkkyys opitaan olettaen kunkin ominaisuuden on yhtä suuri todennäköisyys tulla valituksi (yhtenäinen etukäteen), ja myöhemmin jakamisen mallien välillä lääkkeiden avulla voimme oppia ominaisuuksien hallintaan ennen kunkin lääkkeen. Tämä iteratiivinen jakaminen huumeiden on keskeinen oppimisen voiman CHER.
aikana jokaisen iteraation käytämme L0-normi tasoittuvan regressio valitsemaan ennustavan ominaisuuksia herkkyyttä kunkin lääkkeen. Vuonna L0-normi tasoittuvan regressio, sovelletaan seuraamusta suhteessa useita ominaisuuksia lisätä malliin, kuten klassisen vaiheittain regressiomenetelmiä, mutta ominaisuudet lisätään malliin ei kutistettu kuin lasso [25] tai joustava-net [26]. L0-normi laillistaminen on useita etuja. Ensinnäkin laillistamista termi regressio on nonparametric, koska harva valinta ennustavat in L0-normi laillistaminen ohjaavat Minimum Description Length (MDL), jossa valinta jokainen toiminto on koodattu
kustannus
tai rangaistus, joka takaa niukkuus mallin (materiaalit ja menetelmät). Toiseksi välisen vastaavuuden MDL ja Bayes tilastot voimme iteratiivisesti säätää uskomme asettamalla kustannukset kunkin ominaisuuden mukaan todennäköisyys, että ominaisuus on valittu. Kussakin iteraatio käytämme L0-normi laillistaa regressio kanssa bootstrapping rakentaa todennäköisyysjakauman (ennen) kunkin ominaisuuden perusteella, kuinka monta kertaa se on valittu. Tämä priorijakauma edelleen säätää tietojen jakaminen huumeiden, rakentaa rangaistuspotku ominaisuuden valintaa seuraavaan toistoon (kuvio 1 B). Kolmanneksi, käytämme ahne algoritmi tehokkaasti rakentaa L0-normi normalisoitu regressio; mallien johtuvat tämä haku on osoitettu olevan erinomainen suorituskyky [27]. Vastike asiayhteyteen ennustajia edellyttää, että etsintä tila kuuluu vuorovaikutus genomista ominaisuuksia ja yhteyksissä. Vaikka tällaiset suuret ominaisuus tilaan voi aiheuttaa haasteita monille algoritmien ahne-haku sallii CHER tehokkaasti hankkia asianmukaiseksi ennustajia tässä suuressa ominaisuuden tila.
arvioimiseksi CHER suorituskykyä, meidän testata sitä synteettinen aineisto, joka on simuloidaan todellisen datan (S1 Text). Vertaamme CHER että joustava verkko algoritmi aiemmin käytetty tämän datan ja arvioida kolme mittarit: tarkkuus, muistaa, ja F-mitta (S1 teksti, kuva 2). F-toimenpide tulokset harmonisen keskiarvon tarkkuus ja palauttamista ja edustaa yleistä suorituskykyä kahden algoritmeja. CHER kauppaa pois joitakin muistaa tuottaa enemmän tarkkuutta verrattuna joustava verkko. Biologisessa sovelluksissa tarkkuus on usein parempana muistaa, koska minimoi vääriä positiivisia säästää tulevaisuudessa kallista kokeellista vahvistukset. Siten tarkkuus ja F-toimenpide tulokset lopullisessa toistojen ehdottaa paremmuudesta kokonaisuutena CHER tunnistamisessa oikeassa ennustavia (S1 Teksti ja S4-S6 kuviot).
bootstrapped joustava verkko (EN) verrataan bootstrapped CHER. Kynnys 0,3 ja 0,5 sovelletaan asiaa taajuuden (
τ
) määritellä vankka ominaisuuksia CHER ja joustava, vastaavasti. Tarkkuus, muistaa, F-mitta kunkin fenotyypin EN (x-akseli) piirretään että vuodesta CHER (y-akseli). Ensimmäisellä rivillä on esitetty tulokset CHER ensimmäisestä iteroinnin ja toinen rivi tulokset CHER alkaen 10
th iteraation. Jokainen piste edustaa fenotyyppi, värittää melutaso lisätty.
soveltaminen CHER jotta CCLE aineistoja
CHER hyödyntää yhdistämällä näytteiden samankaltainen syövät lisätä valtaa. Olemme rakennettu testi aineistoja perustuu etukäteen tietoa syövän samankaltaisuuden ja käytettävissä olevien näytteet jokaisesta syöpätyypin (S3 kuvassa), jotka suurelta osin rajoitettua valikoimaan. Olemme yhdistäneet veren ja imukudoksen syöpäsolulinjoissa (n = 70, CCLE-Blood) perustuva kudosalkuperää. Olemme yhdistäneet rinta (n = 27) ja munasarjojen (n = 25) syöpänäytteissä (CCLE-BreastOvary), koska genomi yhtäläisyyksiä pohjapinta kaltainen rintasyöpiä ja laadukkaat serous munasarjasyöpiä [28]. Lopuksi, kaikkien saatavilla CCLE data, me edelleen yhdistettiin melanoomaa (n = 38) ja gliooman (n = 25) (CCLE-SkinGlioma) koska melanosyyttejä ja neurogliaa ovat molemmat alkiokehityksellisesti johdettu ectoderm. Jaettu kasvaimeen liittyvät antigeenit [29] ja säädeltyyn polkuja [30] on raportoitu melanooma ja gliooma. Lisäksi havaitsimme korkea samankaltaisuus näytteiden keskushermoston ja ihon kudoksia, koska se näkyy projektio näytteiden pääkomponentit peräisin geeniekspressioprofiilien (S7 kuvio). Näin ollen, on mahdollista, että nämä kaksi syövät jakaa joitakin biologisia polkuja tai genomisen ominaisuuksia edistää lääkeaineen herkkyys.
Jokainen aineisto sisältää eri määrä mahdollisia jaetun muuttujien määrittää mahdollisten asiayhteyteen vaikutteita. In CCLE-SkinGlioma, vain yksi mahdollinen split sallitaan: onko näyte gliooma vai ei. In CCLE-BreastOvary, kaksi mahdollista jakaa pidetään: Voimme erottaa näytteistä kudosalkuperää (rinta vs. munasarja) tai patologiaa (luminal rintasyöpä vs. pohjapinta kaltainen rinta- ja munasarjasyöpä). Lopuksi seitsemän mahdollisia halkeamia joita tarkastellaan CLLE-Veri osajoukko, joka edustaa syöpätyyppeihin eri sukuperää alkuperää (S1 taulukko). Kaksi muuttujaa käytetään edustamaan herkkyys kunkin lääkkeen: pitoisuus, joka estää 50% proliferaation (IC50), ja toiminta-alue käyrän yläpuolella asennettu lääkeaineen vasteen data (ACT). Tavoitteet CHER ovat (1) tunnistaa parhaat split mahdollisesti (2) Valitse ennustavan genomista yhteisiä ominaisuuksia tai asiayhteyskohtaisia (määritelty valitun split) kunkin lääkeaineen herkkyys fenotyyppi, ja (3) oppia regressiomalli ennustaa huumeiden herkkyys.
johtuen pienestä otoskoko, me rajoittaa edelleen mahdollisia ominaisuuksia pienentää hakua tilaa ja siten lisätä valtaa. Olemme koonneet luetteloita liittyvien geenien kuhunkin syöpään kirjallisuudesta ja tautien tietokanta [31]. Vain mutaatio, kopioluku ja geenin ilmentyminen liittyvien geenien kanssa analysoitiin syöpiä ovat mukana mahdollisten ennustajia. S2 Taulukossa yhteenveto määrä fenotyyppien, ominaisuuksia, ja saatavilla näytteet kussakin aineisto.
Arvioimme Cherin suorituskykyä CCLE aineistot kanssa kymmenkertaiseksi ristivalidointi (materiaalit ja menetelmät). Pearsonin ja Spearmanin korrelaatiokertoimet käytetään tehokkuuden arvioimiseksi. Elastinen verkko-algoritmi [26] on myös sovellettu CCLE osajoukot vertailua, kun se on onnistuneesti käytetty tunnistamaan genomisen ominaisuuksia lääkeaineen herkkyys [7, 8, 32]. Joustava verkko regressio mahdollistaa valinnan ennakoivan genomiikan ominaisuuksia perustuu L1 ja L2-normien; jälkimmäinen on sopiva korreloituneita geeniekspression ominaisuudet [32]. Kuitenkin naiivi joustava verkko algoritmi ei salli asiayhteyteen ennustavia, ja siten kukin valittu genomista ominaisuutta käytetään ennustamaan lääkeaineen herkkyys jokaisesta näytteestä, riippumatta yhteydessä. Soveltaminen joustava verkko täällä on sama kuin asetus [7], jossa ei asiayhteyteen ominaisuuksia pidettiin. Täydentää puutetta asiayhteyteen mallintaminen joustava verkko, split käytettyjen muuttujien CHER sisältyvät myös kuten binary ominaisuuksia ominaisuus allas joustava verkko.
Kuva 3 verrataan suorituskykyä CHER ja joustava verkko (Materiaalit ja menetelmät). Kuten kuviossa 3A, joustava verkko malleja paremmat kuin ensimmäisen iteraation CHER. Kuitenkin, kun kymmenen toistojen jakaminen mallien (kuvio 3B), CHER osoittaa merkittävää parannusta joustava verkko. Tämä johtuu siitä, että yhtenäinen ennen käytetään ensimmäistä iterointia ei saatiin malleja monia fenotyyppejä. Kuitenkin suorituskyky paranee kautta lisää toistojen, koska tiedot vaihdetaan malleja samankaltaisia fenotyyppien ja prioritodennäköisyydet ominaisuuksia säädetään. Vaikutus siirto oppimista voidaan jo havaita toisen iteroinnin (S8 ja S9 kuviot), jotka osoittavat hyödyllisyys siirto oppimisen välillä huumeiden samanlaisia vasteita, kuten lääkkeet, jotka jakavat samanlaiset tavoitteet usein aiheuttaa samanlaisia herkkyys (S10 kuvassa).
Pearsonin korrelaatiokertoimet välillä ennusteen ja todellisen herkkyyden tiedot lasketaan kullekin algoritmin ja piirrettiin vastakkain (x-akseli: joustava verkko, y-akseli: CHER). Jokainen piste edustaa fenotyyppi. A. Ennusteet melanooman ja gliooman näytteitä alkuperäisestä iteraation CHER algoritmi verrattuna päässä joustava verkko. B. Ennusteet melanooman ja gliooman näytteitä CHER kymmenen toistojen verrataan päässä joustava verkko. C., D. Samoin mutta rinta- ja munasarjasyövän näytteitä. E., F. Vastaavasti mutta verinäytteet.
Vuoden lopussa jatkuvan oppimisprosessin, CHER antaa paremman ennakoivaa suorituskyky (Pearsonin korrelaatiokertoimet, katso materiaalit ja menetelmät) kuin kimmo-net 60% (70/116) lääkeaineen herkkyys fenotyyppejä kaikissa kolmessa aineistot (p 6e-6, yksi pyrstö pariksi t-testiä, vertailla Pearsonin korrelaatio; p 2e-7 vertailla Spearmanin korrelaatio, kuvio 3, S8 ja S9 kuviot). Lisäksi nämä 70 fenotyyppien, parantamista CHER ennustus yli joustava verkko on suuri, joiden keskimääräinen parannus 0,24 Pearson korrelaatio (S11 kuvio). Joustava verkko päihittää CHER vain 46 fenotyypit kanssa keskimääräinen parantuminen 0,12.
vertailu ominaisuuksia valitsema CHER ja elastinen-net
perehtyä mallien CHER tuottaa, me vertailla ominaisuuksia valitsema CHER ja joustava verkko. Molemmat algoritmit sovelletaan kaikkiin näytteisiin kunkin aineisto kanssa bootstrapping. Vain ominaisuuksia, joita vahvasti valittu kautta bootstrap säilytetään lopullisessa mallissa (materiaalit ja menetelmät). Huomautus on monia fenotyyppejä, joille joustava verkko ei valita minkä tahansa koska ei ominaisuudet valitaan ”riittävän usein” keskuudessa bootstrap kulkee, viitaten siihen, ettei kestävyydestä joustava verkko n ominaisuuksien hallintaan. Esimerkiksi elastinen verkko ei valita mitään tehokkaita ominaisuuksia useimmille fenotyyppien (35 out of 39) CCLE-BreastOvary, kun taas CHER vain epäonnistuu yhdellä fenotyyppiin. Näin ollen, CCLE-BreastOvary pudotetaan vertailun. Kahden muun aineistot, vertailuja tehdään fenotyypin vain silloin, kun elastinen verkko on myös valittu tehokkaita ominaisuuksia seuraavien bootstrap.
Ensimmäinen, vertaamme useita ominaisuuksia valitsema kunkin algoritmin (kuvio 4A). Verrattuna CHER, elastinen verkko valitsee usein paljon enemmän ominaisuuksia, mikä johtuu todennäköisesti joustava verkko n L2-normi laillistaminen, mikä suosii valitsemalla vastaaviin ominaisuuksiin. Vertaamme päällekkäisiä ja ainutlaatuisia ominaisuuksia kahden algoritmit erottamalla ne viiteen luokkaan: (1) ominaisuuksia, jotka valitaan molemmat algoritmit (
päällekkäisiä mutta CHER jaettu
kuviossa 4A), (2) ominaisuudet, valitaan molemmat, mutta ovat vain ennustavan alatyypin näytteiden CHER (
päällekkäisyyttä, mutta CHER-asiayhteyteen
), (3) ominaisuuksia, jotka ovat vain valittu CHER ja ovat ennustavan kaikki näytteet (
CHER -vain jaettu
), (4) ominaisuuksia, joita vain valittu CHER ja ennustavat vain alatyypin näytteiden (
CHER vain asiayhteyteen
) ja (5) ominaisuuksia, joita vain valitsee joustava verkko (
FI vain
).
. Useita ominaisuuksia valittujen sekä ja yksittäisiä algoritmeja kunkin fenotyypin. Kunkin fenotyypin (x-akseli), numeroita ominaisuuksia valitsema CHER ovat edustettuina positiivisen y-akselilla taas valitaan joustava verkko ovat edustettuina negatiiviseen y-akselilla. Ominaisuudet erotetaan viiteen ryhmään, jotka vastaavat ominaisuudet valitaan molemmat algoritmit tai yksittäisille algoritmeja. Fenotyyppi 1-14 ovat CCLE-SkinGlioma ja loput ovat peräisin CCLE-Veri. B. Oikaistu R
2 CHER ja joustava verkko malleja käyttäen ominaisuuksia valitaan molemmat algoritmit (piirteitä kahteen ensimmäiseen luokkaan A). C. Kuten B, mutta kaikki ominaisuudet valitaan kunkin algoritmin käytetään. Fenotyyppejä kaikissa kolmessa luvut lajitellaan ero R
2 välillä CHER ja joustava verkko C.
Tästä hajoaminen, huomaamme, että 40/45 fenotyypit on vähintään yksi ominaisuus, joka valitaan sekä CHER ja joustava verkko. Käyttämällä vain näitä ominaisuuksia, arvioimme varianssi selitti (oikaistu R
2) Cher ja joustava verkko (kuva 4B). Sillä CCLE-SkinGlioma (Fenotyyppikuvaus 1-14 kuvassa 4B), oikaistu R
2: n on samankaltainen CHER ja joustava verkko. Tämä johtuu siitä, että on olemassa vain kaksi alatyyppiä näytteiden data, ja se voidaan koodata binary ominaisuus joustava verkko. Kuitenkin, kun alatyyppejä näytteiden muuttuu vaikeammaksi kuin CCLE-Blood, ansio CHER mallit ilmentyy vahvistuksen R
2 (Fenotyyppikuvaus 15-45 kuviossa 4B). Vaikka samoja valitut ominaisuudet (luokat 1 ja 2 edellä), CHER kertoo enemmän vaihtelua kuin joustava verkko 12 fenotyyppien harkitsemalla asiayhteyteen vaikutuksia ominaisuuksia.
Kun otetaan huomioon kaikki ominaisuudet valitaan kunkin algoritmin, me katso CHER saavuttaa paremmin mukautetun R
2 kuin joustava netin 29/45 fenotyyppien (p 0,007, yksisuuntaisen pariksi t-testi, kuvio 4C), vaikka CHER mallit sisältävät usein vähemmän ominaisuuksia kuin joustava verkko. Cherin voitot R
2 on myös merkittävämpi kuin joustava verkko: CHER voitot 0,2 R
2 yli joustava netin 11/29 fenotyyppien, kun taas joustava nettovoitot 0,2 R
2 yli CHER for 2/14 fenotyyppien. Yhdessä tulokset viittaavat CHER lopullista mallia selittää lisää varianssia tiedot, todennäköisesti saavuttaa mallintamisen yhteydessä.
Vertailu ylimääräisiä menetelmiä
Lisäksi joustava verkko, vertasimme myös suorituskykyä CHER jotta Multiple Inclusion Criterion (
MIC
) [27], monitaitoisuutta suopunki (
MTLASSO
) [33], elastinen net yhteysherkät geenin vuorovaikutuksen piirteet (
FI-INT
), ja Bayesian monitaitoisuutta multi-ytimen regressio (
BMKL
) että äskettäin voitti NCI-DREAM huumeiden herkkyys ennustus haaste [34]. MIC on algoritmi, joka valitsee ominaisuudet kautta L0-normi ja on osoittanut voimakasta suorituskyvyn ominaisuuksien hallintaan ja ennustaminen tehtäviä. Se on edeltäjä CHER, kuten CHER ulottuu MIC lisäämällä siirto oppimista ja konteksti (materiaalit ja menetelmät). MTLASSO on jatkoa suopunki että kuitenkin soveltaa niukkuus rajoite kaikki oppimistehtäviä kerralla. Se on pääasiallisesti samaa ominaisuuksia kaikkien fenotyyppejä. Sen sijaan BMKL on menetelmä, joka käyttää ensin useita ytimiä kunkin datatyypin (esimerkiksi mutaation tai geenin ilmentymisen) tiivistää samankaltaisuuden näytteitä, ja sitten käyttää Bayesin päättelyn oppia regression painot seuraavilla ennustaa lääkeaineen herkkyys [34]. Etuna BMKL on, että regressiomallit voi olla epälineaarinen kautta ydin laskelmat. Lopuksi lisätään kaikki syövän tyypin ja geenin vuorovaikutuksen kannalta (asiayhteyteen ominaisuuksia) osaksi piirreavaruutta ja soveltaa joustava net vuorovaikutuksia (EN-INT). Eli me sisällyttää ominaisuus altaat binary muuttujia määritellään syöpätyyppeihin ja syöpä-tyypin erityispiirteet (esim. Tuotteet binary muuttujia ja genomista ominaisuuksia) ja EN-INT. Huomaa kaikki split käytettyjen muuttujien CHER sisältyvät myös kuten binary ominaisuuksia ominaisuus allas kaikilla menetelmillä.
Käytämme kaikkia menetelmiä kuin CCLE aineistoja ja vertailla niiden suorituskyky kymmenkertaista ristivalidointi (Materiaalit ja menetelmät). Kuva 5 ja S12 kuviossa esittävät yleistä suorituskykyä kunkin menetelmän. Kaikissa kolmessa aineistoja, CHER päihittää useimmat menetelmät ja suorittaa vertailukelpoisella kanssa BMKL. Erityisesti CHER päihittää FI (p 6e-6, yksi pyrstö pariksi t-testiä, vertailla Pearsonin korrelaatio; p 2e-7 vertailla Spearman), MTLASSO (p 6e-5 Pearson, p 2e-8 Spearman), EN-INT (p 1e-3 Pearson, p 3e-7 Spearman) ja MIC (p 3e-19 Pearson, p 3e-24 Spearman). CHER päihittää BMKL in CCLE-SkinGlioma (p 0,05 Pearson, p 4e-3 Spearman), on samanlainen suorituskyky BMKL in CCLE-BreastOvary, mutta BMKL toimii paremmin kuin CHER in CCLE-Veri.
Pearsonin korrelaatiokertoimet välillä ennusteen ja arkaluonteisuuden data lasketaan kullekin algoritmia. Korrelaatiokertoimet kustakin algoritmi (x-akseli) verrataan kohteesta CHER (y-akseli). Jokainen piste edustaa ennuste suorituskykyä yhtä lääkettä herkkyys. Menetelmä lyhenne: EN, elastinen verkko, MIC, useita kriteerinä; BMKL: Bayes monitaitoisuutta monen ytimen regressio; MTLASSO: monitaitoisuutta suopunki; EN-INT: EN kontekstispesifisellä-geenin vuorovaikutusta. P-arvot osoittavat merkitys CHER ennustuksen verrattuna muihin menetelmiin (yksisuuntaisen t-testi).
Nämä vertailut korostaa etuja CHER. Ensinnäkin CHER päihittää EN-INT, vaikka kaikki asiayhteyteen toiminnot ovat saatavilla joustava verkko. Tämä osoittaa CHER esimies ominaisuuksien hallintaan, todennäköisesti hyötyvät informaation siirtämiseksi useiden fenotyyppien. Toiseksi asiayhteyteen ominaisuudet ovat tärkeitä, koska CHER päihittää MIC vaikka CHER ja MIC käyttää samoja menetelmiä ominaisuuksien hallintaan.
Huolimatta samanlainen suorituskyky välillä CHER ja BMKL, CHER myös tulkittavuutta varten suhdetta genomi-ominaisuudet ja huumeiden herkkyys. Kolmessa aineistoja, CHER tunnistaa monia ennakoivaa ominaisuuksia, jotka ovat joko suoraan tavoitteita huumeiden tai vastaavissa väyliä, mikä viittaa suhde näiden ominaisuuksien ja huumeiden herkkyys. Esimerkiksi CHER tunnistaa BRAF ennustajana herkkyyttä RAF estäjä PLX4720 ja MEK estäjien (AZD6244 ja PD-0325901) in CCLE-SkinGlioma; ErbB2 ennustajana herkkyyttä Lapatinibin (EGFR ja erbB2 estäjä) in CCLE-BreatOvary; ABL1 herkkyyttä ABL1 estäjien (AZD0530, Nilotinibia) in CCLE-Blood (S3-S5 taulukot). Tämä korostaa CHER kykyä johtaa malleihin, jotka eivät ole ainoastaan ennustavia huumeiden herkkyys, mutta myös auttaa valaista vaikutusmekanismi.
Tapaustutkimus on Herkkyys Paklitakselin Melanooma ja glioomasolulinjoja
0,05.