PLoS ONE: Data Mining lähestymistavat Genominen biologisten merkkiaineiden kehitystyö: Applications käyttäminen huumeseulonta Tiedot Cancer Genome Project ja Cancer Cell Line Encyclopedia

tiivistelmä

Kehittäminen luotettava biomarkkerit kasvainsolun lääkeaineen herkkyys ja kestävyys voivat ohjata hypoteesia perustuvaa perustutkimuksen tieteellisiä ja vaikuttaa ennalta hoidon kliinisiä päätöksiä. Suosittu kehittämisstrategian biomarkkerit käyttää luonnehdintoja ihmisen kasvainnäytteestä vastaan ​​erilaisia ​​syöpälääkkeen vastauksista, jotka korreloivat genomista muutoksia; kehittyi suurelta osin ponnisteluja Cancer Cell Line Encyclopedia (CCLE) ja Sanger Cancer Genome Project (CGP). Tämän tutkimuksen tarkoituksena on tarjota riippumaton analyysi näistä tiedoista, joka pyrkii eläinlääkäri nykyisiä ja lisätä uusia näkökulmia biomarkkereiden löytöjä ja sovelluksia. Olemassa olevan ja vaihtoehtoisen tiedon louhinta ja tilastollisia menetelmiä käytetään a) arvioida lääkevasteita yhdisteiden kanssa samanlainen vaikutusmekanismi (MOA), b) tarkastelemaan toimenpiteitä geeniekspression (GE), kopioluku (CN) ja mutaatio tila (MUT) biomarkkerit yhdistettynä geeniperimä rikastamiseen analyysi (GSEA), sillä olettamalla biologiset prosessit tärkeää lääkevaste, c) suorittaa globaalin vertailuja GE, CN ja MUT biomarkkereina kaikissa lääkkeet seulottiin CGP aineisto, ja d) arvioimaan positiivinen ennustearvo voima CGP johdettujen GE biomarkkerit ennustajina lääkkeen vaste CCLE kasvainsoluissa. Näkökulmat johdetut yksilön ja globaalin tutkimukset GES, müts ja CN vahvistavat nykyisiä ja paljastaa ainutlaatuinen ja yhteinen roolia näissä biomarkkereita kasvainsolun huumeiden herkkyys ja kestävyys. Hakemukset CGP johdettujen genomista biomarkkereiden ennustaa lääkkeen vaste CCLE kasvainsolujen löytää erittäin merkittävä ROC, positiivinen ennusteita 0,78. Tulokset Tämän tutkimuksen laajentaa käytettävissä tiedon louhinnan ja analyysimenetelmät genomista biologisten merkkiaineiden kehitystyöhön sekä tarjota lisätukea käyttää biomarkkerit ohjata hypoteesi perustuva perustutkimuksen tieteellisiä ja pre-hoidon kliinisiä päätöksiä.

Citation: Covell DG ( 2015) Data Mining Approaches for Genominen biologisten merkkiaineiden kehitystyö: Applications käyttäminen huumeseulonta tiedot Cancer Genome Project ja Cancer Cell Line Encyclopedia. PLoS ONE 10 (7): e0127433. doi: 10,1371 /journal.pone.0127433

Editor: Anguraj Sadanandam, Institute of Cancer Research (ICR), Yhdistynyt Kuningaskunta

vastaanotettu 22 lokakuuta 2014; Hyväksytty: 15 huhtikuu 2015; Julkaistu: 01 heinäkuu 2015

Tämä on avoin pääsy artikkeli, vapaa kaikki tekijänoikeudet, ja saa vapaasti jäljentää, levittää, välittää, modifioitu, rakennettu, tai muuten käyttää kuka tahansa laillista tarkoitusta. Teos on saatavilla Creative Commons CC0 julkisuuteen omistautumista

Data Saatavuus: Kaikki tiedot peräisin Cancer Genome Project (CGP) (https://cancer.sanger.ac.uk/cosmic) ja Cancer Cell Line Encyclopedia (CCLE) (https://www.broadinstitute.org/ccle/home).

rahoitus: Tämä kirjailija ei ole tukea tai rahoitusta raportoida.

Kilpailevat edut: tekijä on ilmoittanut, että ei kilpailevia etuja olemassa.

Johdanto

Suuret sekvensointi ponnisteluja johdolla lähinnä kansainvälisen Cancer Genome Consortium (https://icgc.org/) ja The Cancer Genome Atlas (https://cancergenome.nih.gov/), ovat edistäneet kehitystä lääkehoitojen että valikoivasti tavoite genomista muuttuu; kuten esimerkiksi; BCR-ABL1 translokaatiot (Imatinibiin) [1,2], EML4-ALK translokaatiot (EGFR ja ALK estäjien) [3] ja BRAF: V600E mutaatio (BRAF estäjät) [4]. Viime aikoina pyrkimykset järjestelmällisesti tunnistaa genomista muutokset, jotka saattavat olla biomarkkerit terapeuttisen lääkeherkkyysmenetelmien johtanut välistä yhteistyötä The Wellcome Trust Sanger-instituutti ja Massachusetts General Hospital (tiedot yli 700 kuolemattomaksi kasvainsoluihin ja 138 syöpälääkkeiden) ja Broad-instituutin ja Novartis yhteistyö (profilointi 24 syöpälääkkeet poikki 479 kuolemattomaksi kasvainsoluja); Kunkin vaivaa ohjattu, osittain uraauurtava NCI60 huumeiden näyttö [5]. Vaikka arvostelijat nämä ponnistelut usein huomata rajoitukset kuolemattomaksi ihmisen kasvainsolujen tilille sopivasti kasvaimeen stroomavuorovaikutuksiin, immuunivalvonnan, invaasio ja metastaasi, angiogeneesiä ja rooli kantasolukkoa [6], kannattajia testaavat onko genomista biomarkkereita niistä johdetut näyttöjä voidaan luotettavasti avustamaan hypoteesi perustuva perustiedettä ponnisteluja, ja kliininen pyrkimyksiä määrittää hoito, seurata vastaus ja ennustaa tuloksia (esim Precision Medicine, MATCH Trial, IMPACT, I-SPY). Koska putkilinja uusien lääkekeksintöjensä laajenee, edistymistä tehokkaampia hoitoja voidaan auttaa tutkimustyötä että eläinlääkäri nykyisten, sekä kehittää uusia menetelmiä tunnistaa genomista biomarkkerit, jotka liittyvät yhdisteen tehoon.

Background

CGP [7] ja CCLE [8] raportit tarjoavat pakottavia assosiaatioita huumeiden herkkyys (tyypillisesti mitattu log lääkkeen pitoisuus 50% kasvun estämistä, viitataan koko tekstin GI50) ja erityiset genomista muutokset , sisältäen geeniekspression (GE), geenimutaatio (MUT), kopioluku (CN), ja alueelta toiselle siirtäminen. Niiden tulokset löytää edut monen geenin, yksinään vs. geenin biomarkkerit, indikaattoreina kasvainsolun GI 50; johtuvat, toisessa ääripäässä, epäonnistumisista löytää luotettava assosiaatioita yksittäisen geenin muutosten ja GI 50; ja, toisessa ääripäässä, tilanteesta, jossa GI 50 näyttää välittyvän monipuolinen, hieman kytkemättä, multi-geeni, biologiset mekanismit. Lisäksi niiden asiantuntija soveltaminen state-of-the-art data mining ja tilastolliset menetelmät edustaa järjestelmällisesti kuin tuottaneet tulosta sopusoinnussa lääkkeen herkistävä translokaatiot ja müts tiedetään ennustavan kliinisten tulosten. Yhdessä nämä ponnistelut ovat ratkaiseva askel saada ymmärtämään syövän, joka perustuu genomin kartoitus ihmisen kasvainnäytteestä vastaan ​​erilaisia ​​syöpälääkkeen vastauksista, jotka korreloivat genomisen muutosta. Koska nämä ja muut järjestelmällinen jatkuvat, on tärkeää tunnustaa, että yleisön pääsy CGP ja CCLE data tarjoaa rikkaan ja ainutlaatuisen tilaisuuden riippumattomia arvioita tämän tietojen [9], jotka voivat auttaa kehittämään edelleen monipuolisia genomista biomarkkerit ohjeistoiksi perus- ja prekliininen tutkimus ja varhaisen kliinisiä kokeita. Motivoi näitä tavoitteita, ja rakennuksen aiemmista ponnisteluista, tämä analyysi keskittyy i) Tutkiessaan nykyisiä tuloksia, ii) käyttämällä vaihtoehtoisia data mining ja tilastollisia menetelmiä biomarkkereiden löytö, iii) antamalla uusia tulkintoja CGP ja CCLE tietokannat ja iv) käytön arvioimiseksi biomarkkerit kuten ennustava kasvainsolun lääkkeen vaste.

Methods

Tiedon louhinta ja tilastollisia strategiat analysointiin suurten tietokantojen koostuvat usein vakio ja käyttäjän määrittämiä (ad hoc ) osat, jotka voi olla keskeinen rooli tietojen tulkinta. Tiedon louhinnan ja tilastollinen strategiat tässä on monia yhtäläisyyksiä, joita käytetään Garnett et al. [7] ja Barretina ym. [8]: sisältäen hierarkkinen klusterointi, joustava verkko (EN) regressio ja koulutusjakson analyysi valittujen geenien. Huomionarvoista lähdöt ovat; i) muutokset niiden menetelmä hierarkkinen klusterointi GI50 arvoista, ii) sovellukset EN regressioissa perustuu yksinomaan GES, iii) jonka jälkeen arvioinnit rooleja CN ja MUT on GI50 vastausten iv) laajennukset EN geenin asettaa sisällyttää Gene Set Enrichment Analysis (GSEA) oletuksen biologisia polkuja edistää GI50 vastauksia, v) asetetaan maailmanlaajuinen analyysi GE, CN ja MUT dataa vääriä löytö määrä (FDR) -adjusted valinta merkitseviä näiden biomarkkereiden huumeiden vaste ja vi) sovelluksia ROC analyysi CGP johdettujen genomista biomarkkerit ennustajina GI 50 on CCLE data. Lyhyt kuvaus näiden vaihtoehtoisten menetelmien ja käsitellään jäljempänä. Tarkemmat tiedot näkyvät S1 File.

Hierarkkinen klusterointi GI 50

puuttuminen samanlaisia ​​GI50 arvot lääkkeitä, joilla on sama vaikutusmekanismi (MOA) esittelee suuren esteen tahallisten liittää genomista allekirjoituksia huumeiden vastaus; ja laajentaa näitä yhdistyksiä oletuksen biologisia prosesseja, joiden rooleja lääkeaineiden tehoon. Kuten CGP raportissa [7], lääkkeitä päällekkäisiä spesifisyys (viitataan jäljempänä kuin MOA luokka) ei aina jaa korreloi GI50 arvot, eivätkä ne aina jakaa genomista allekirjoituksia. Hierarkkinen klusterin analyysi Garnett ym. [7] luokitellaan huumeita

klustereita

perustuu GI50 samankaltaisuuden, sisäisiin klusterin lääke korrelaatioita, mikä tuotti 22

yhteisö klustereita

käyttäen toimenpiteitä huumeiden herkkyys varten ~ 700 kasvaimen solut CGP tietojen täydentävä Taulukko 1 [7]). Vaikka aikomus vaivaa täällä ei pyritä tyhjentävästi näyte saatavilla hierarkkinen klusterointi menetelmiä ja järjestelmiä tunnistaa

yhteisö klustereita

, kohtuullisen hyvä yhdistyksen välillä GI50 arvojen huumeiden samanlaisen MOA luokka voitaisiin löytää pienin muutoksin että ryhmittelymenetelmät Garnett ym. [7]. Sen sijaan hierarkkinen klusterointi perustuu GI50 samankaltaisuuden, kaikki pareittain GI 50 korrelaatioita käytettiin kunkin lääkkeen ja satunnaistettu resampling [10] käytettiin määrittämään

yhteisö klustereita

. Tämä ryhmittely menettely, saatavissa kuten CRAN asennettu paketti, pvclust [10], R ohjelmointikielellä, katsoo, että on tärkeää otantavirhe panosta epävarmuus klusterin tuloksia käyttämällä satunnaistettu resampling menetelmää tunnistaa tapaukset, joilla on suuri taajuus esiintyvien klusteri jäsentä. Muita yksityiskohtia tämän Ryhmäanalyysin esiintyvät S1 File: A. hierarkkinen klusterointi GI50, kuva A, Kuva B ja C. Concordance välillä MOA luokan ja EN GE.

Elastinen Net regressio Gene Expression

Elastinen Net (EN) regressio on tilastollinen menettely, joka sopii yleistetty lineaarinen malli havaintojen (genomista data) GI 50-arvot poikki joukko kasvainsolun. Vaihtoehtona ryhmittely kaikki genomiseen data (GE, CN ja MUT) osaksi EN analyysi [7], tulokset tässä keskitytään FI analyysi on johdettu vasta GES mitattiin CGP kasvainsoluissa; jonka jälkeen arvioinnit CN ja MUT asema näiden EN peräisin olevien geenien. FI analyysi on suoritettu käyttäen glmnet paketti [11] R-ohjelmointikieli. Glmnet tarjoaa säädettävän parametrin, α, jonka avulla FI regressio vaihtelevat suopunki (α = 1) ja harjanteen (α = 0) regressio. Jälkimmäinen sovellus tyypillisesti tuottaa tarkka sovitus (GI 50

ennustettu) on GI50 tietojen (GI 50

havaittu) käyttäen kaikki GES kaikkien kasvainsolujen kanssa GI50 mittauksen, kun taas suopungin esimerkiksi mallien GI 50 käyttämällä supistetun joukon jonka GES saamiseksi alle istuvuuden välillä GI 50

ennustettu ja GI 50

havaittu. On selvää, malli, joka sopii GI50 täydellisesti, kun taas käyttäen kaikki GES, anna mitään lukumäärän väheneminen geenien arvioitaessa mahdollista roolia biomarkkereita yhdisteen GI 50. Valitaan sopiva tasapaino hyvyys EN mallin sovitus dataan ja numerot geenien valittu EN regressio voidaan määrittää saadut tulokset eri arvoja α. Esimerkiksi ylempi paneeli kuviossa 1 piirtää korrelaatiokertoimen (GI 50

havaittu ja GI 50

ennustettu) versus FI geeni count α = 0,7. Ilmeistä tämä tulos on taipumus saada paremmin FI malli sovi suuremmalle joukolle EN geenejä. Toisaalta, FI tuloksia, jotka käyttävät vain muutamia geenejä näyttää olevan heikentynyt kyky ennustaa GI50. Alempi paneeli Kuviossa 1 piirtää keskimääräinen korrelaatiokertoimen verrattuna keskimäärin FI geenejä (EN regressio konvergoituvat varten 129 138 huumeet) varten α vaihtelee 0,2-1,0. Kuten odotettua, trendi paremmin EN malli sopii käyttämällä suurempia määriä geenien (pienempiä arvoja α) on ilmeinen. Tämä tulos löytää yleinen ryhmityksen vasemmassa alakulmassa forα välillä 0,6-1,0. Käyttämällä tätä tulosta, heuristista valikoima α = 0,7 valittiin kohtuullinen tasapaino hyvyyttä EN istuvuuden ja vähentää numerot EN geenejä. Valitsemalla α = 0,7 saatiin yleinen sopiva tarkkuus ~ 0,5 (r

2), käyttäen keskimäärin 75 EN geenejä. Perustuvat analyysit hieman pienempi tai suurempi valintoja α ei ilmeisesti voimakkaasti vaikuttaa tuloksiin seurata.

Plot korrelaatiokerroin (GI 50

ennustettu vastaan ​​GI 50

havaittu) versus määrä geenien yhdistelmälaitteiden FI regressiomallin α = 0,7. Nämä tulokset saatiin keskimäärin korrelaatio on 0,69 (± 0,12) välillä GI 50

havaittu ja GI 50

ennustaa keskimääräinen lukumäärä 75 (± 44) EN geeniekspressioiden varten 129 huumeiden jossa EN regressio lähentyneet. Alempi paneeli. Tontti keskimääräinen korrelaatio FI malli sopii versus niiden keskimääräinen EN geenejä. Tulokset representα vaihtelee 0,2-1,0. Virhepylväät edustavat keskivirhe keskiarvon. Boxed alue oikeassa alakulmassa näyttää tulokset α = 0,5).

Tyypillinen lähtönä glmnet laskennan, käyttäen esimerkkinä PD-0325901 (a MEK1 /2 kohdistaminen yhdiste), näkyy kuvassa C 3. Tämä kuvio näyttää FI geeni count versus malli Mean-Squared Error (MSE). Tässä esimerkissä malli saavutti vähintään MSE käyttäen 103 geenejä, joten vähennystä on 99,2% enemmän kuin 13325 geeniekspressioiden asetetun 514 kasvainsolujen, joiden GI 50 vastaus PD-0325901. FI regressio saadaan korrelaatio 0,84 välillä GI 50

havaittu ja GI 50

ennusti. Kuvio 2 näyttää heatmap (käyttäen heatmap.2 R ohjelmointikielellä) varten 103 geeniekspressioiden poikki 514 kasvainsolut PD-0325901. Oikeanpuoleisin reuna tämä kuva näyttää barplot varten GI 50

havaittiin näille 514 syöpäsoluja. Tilkkutäkki lohkot punaisia ​​ja sinisiä että heatmap edustavat suhteellisen yli ja ali ilmaistuna geenejä, tässä järjestyksessä, osoittaen laadullinen yhdistys näistä GE kuvioita barplot on GI50 kunkin kasvainsolujen näkyy vasemmassa reunassa. Heatmaps EN GES käytetään, laadullisesti, visuaaliseen vertailuja yli ja alle ilmaisi liittyviä geenejä huumeiden herkkyys ja välinpitämättömyys.

Kuva piirtää 103 geeniekspressioiden (x-akseli) varten 514 kasvainsolujen EN (y-akseli). Tulokset kuvaavat vain kasvainsolut, joiden GI 50 mittaukseen PD-0325901.Heatmap tilataan pitkin kukin akseli mukaan dendrogrammissa näkyvät yläosassa ja vasemmassa reunassa. Yli ja alle ilmentyvien geenien merkitty punainen ja sininen, vastaavasti. GI 50

havaittiin näille 514 kasvainsolujen näyttää pylväskaaviona oikeaan reunaan kuvan. Bars vasemmalle ja oikealle vastaavat herkkä ja tunteeton GI50 vastauksia, vastaavasti.

Concordance välillä MOA luokan ja EN GE

FI regressio geenejä voidaan alistaa hierarkkisen klusterin analyysi arvioida vastaavuutta välillä huumeiden samankaltaisten MOA luokkiin ja niiden EN geeniekspressioiden (mallintaa GI 50). Concordance mitataan onko a) EN geenit näkyvät klusteri naapurit lääkkeiden (ts MOA luokat) ja b) voidaanko nämä EN geenit ovat suhteellisen ainutlaatuinen jokaiselle MOA luokkaan. Vastaaminen osa a) perustaa onko MOA konkordanssin perustuu samankaltaisuus GI 50

havaittu myös silloin, kun käytetään ilmaisua EN geenien mallintaa GI 50

havaittu. Vastaaminen osa b) on keskeinen kehittää geeniekspressioiden biomarkkereina of GI 50 vastaavat erityisiin MOA lääkeluokista ja ulottuvat näiden tulosten hypoteesin biologiseen reittejä mukana lääkeaineiden tehoon. Tarkempi kuvaus Tämän analyysin näkyy S1 File; C. Concordance välillä MOA luokan ja EN GE 🙂

GSEA analyysi EN johdettujen GES

jälkeen Garnett ym. [7], tarkastelu EN geenien eniten ja vähiten herkkä kasvainsoluja voidaan käyttää priorisoimaan GI 50-EN-geenin yhdistyksiä. Tätä tarkoitusta varten EN geenit kunkin lääkkeen suodatettiin suorittamalla Studentin t-testi tunnistaa tilastollisesti merkitsevä (p 0,05) FI GES ylä- eniten ja alhaalla vähintään 10

persentiilin tuumorisolujen lääkevasteita (tämä mallia kutsutaan tämän jälkeen nimellä ”minimaalinen FI malli” kunkin lääke). Kuvio 3 näyttää heatmap varten minimaalinen FI malli PD-0325901 esimerkki kuvassa 2. Sen sijaan näyttö GI 50 pylväskaaviona reunassa (kuten kuvassa 2), GI50 data upotetaan heatmap (katso sarake merkintä ”GI 50 ’sijaitsee lähellä keskustaa kuva), jossa herkin soluja, tunnistettu tummansininen, näkyvät ylä- ja alaosia heatmap ja kaikkein resistentit solut, joissa niiden GI 50-arvot tunnistettu punainen, näkyvät keskellä osa lämpökartta. Tässä esimerkissä supistunut noin 82% (1-94 /514) kasvaimen solujen määrän ja 11%: n vähennys (103 alas 94 geenejä) PD-0325901: n FI geeniperimä pysyy vähäisenä EN malli.

Suhteellinen yli ja ali ilmentyminen on merkitty punainen ja sininen, vastaavasti. GI50 arvot PD-0325901 on upotettu siinä heatmap, joka sijaitsee kolonnin lähellä keskellä, merkitty GI 50. GI50 arvot herkkiä ja resistenttejä kasvainsoluja on merkitty sinisellä ja punaista väriä, vastaavasti.

FI regressio yksi keino tunnistaa suppean joukon geenejä, joiden ilmaukset ovat riittävät antamaan kohtuullisen mallista kutakin lääkkeen GI 50 vastaus (vrt 1) ja voidaan käyttää oletuksen biologisia polkuja, jotka saattavat olla merkitystä lääkkeen vastaus. Monet laskennallisia työkaluja nykyä polun analyysiä (GSEA, DAVID, kekseliäisyyttä, jne.). Mukana varoittava varoitukset näiden menetelmien on, että tulokset voivat johtaa yli tulkintoihin, kun geenit on jaettu monia polkuja, tai ne tuota tietoja, niitä tapauksia varten joko puuttuvat tilastollisesti merkitsevä polkuja tai joissa on paljon polkuja löydetään, jotka eivät paljasta johdonmukaista biologinen teema. GSEA [12] tarjoaa heuristista suojautua nämä varoitukset rajoittamalla tulokset vain reittejä, joilla on vähintään 2 jaetut geenit ja soveltamalla False Discovery Rate (FDR) vastaan ​​mahdollisuus löytää tyypillisessä kynnys 0,05. Entinen vaatimus vältetään tapauksissa suuri määrä polkuja on vain yksi EN geeniä, kun taas jälkimmäinen vaatimus rajoittaa sattumaa polkuja monia yhteisiä, ja usein esiintyviä geenejä. Näiden ajatusten pohjalta, GSEA käyttäen minimaalinen EN johdettuja GES, käytettiin oletuksen biologisista prosesseista, jotka saattavat liittyä huumeiden vastausta. GSEA raportointi rajoitetaan vain ylimpään merkittävä (FDR pisteet) väyliä, rajoitettu enintään 10 tapausta.

raportointi GSEA Tulokset korostavat toistuvia biologinen teemoja merkittäviä reittejä eikä yksittäisiä reittejä. Esimerkkinä voidaan mainita, GSEA [12] polkuja, johdettu Kegg, BioCarta ja GO geeni osajoukot käyttäen minimaalinen FI GES varten MEK estäjä, PD-0325901, on esitetty taulukossa C. Nämä tulokset löytää DNA_REPAIR kuin GSEA polkuun paras tilastollinen merkitys, jossa RESPONSE_TO_DNA_DAMAGE_STIMULUS ja DNA_METABOLIC_PROCESS seuraavaksi merkittävin reittejä. Alempana luettelossa on kolme väyliä liittyvät MERKINANTO. Yleinen teemat Näiden GSEA tulokset osoittavat, että kasvain soluvasteen PD-0325901 olisi arveltu ottamaan DNA ja SIGNALLING. Näyttöä yhdistyksen välillä MEK-ERK signalointi ja DNA_REPAIR ovat raportoineet Sato et al. [13] ja Marampon ym. [14], mikä johtaa ehdotukseen käyttää MEK estäjien lisätä kasvainsolujen radioherkkyyttä mukaan alaspäin säätelemällä DNA korjaus signaalien . Viime aikoina Pei et ai. [15] ovat ehdottaneet yhdistelmähoitoa multippelin myelooman käyttäen CHK1 estäjä estää soluja pidättämällä vaiheittain solusyklin jotka helpottavat korjaus DNA-vaurion ja MEK-estäjä estää soluja aktivoimalla erilaisia ​​proteiineja, jotka säätelevät DNA: n korjaukseen prosesseja edistää samalla kertyminen pro-kuolema proteiineja. GSEA havainnot täällä, on koulutusjakson liittyviä aiheita DNA korjauksen tai vaurioita ja solun signalointi, ovat johdonmukaisia ​​olettamalla roolin PD-0352901 in liittyviä signaaleja DNA ylläpitoon.

Huomattavaa varovaisuutta on sovellettava, kun Tuloksia tulkittaessa . Esimerkiksi, vaikka muut kolme MEK1 /2-estäjät, CI-1040, AZD6244 ja RDEA199, näkyvät samassa klusterissa, joka perustuu GI50 (taulukko A) ja EN GES (taulukko B ja kuvio D), vain AZD6244 jakaa joitakin sen GSEA reitit PD-0325901, kun taas CI-1040 ja RDEA119 eivät. Yhdessä nämä tulokset, ja samalla tuetaan yleistä johdonmukaisuutta näissä MEK1 /2-estäjä n GI 50 profiilit (taulukko A), jolla on riittävän ainutlaatuisia EN geenien niiden näkyvän sisällä yhteisiä klustereita (taulukko B ja kuvio D), saanto EN geenien riittävän eroavat toisistaan ​​tuottaa ei-päällekkäisiä GSEA reittejä. Todennäköinen tekijä näiden EN-geenin GSEA erot voivat olla vaikutus soluihin, joissa PD-0325901 on keskimäärin enemmän kuin yhden suuruusluokan tehokkaampi kuin muut kolme MEK1 /2-estäjät, että CGP kasvainsoluja. Ilmeisesti EN geenit PD-0325901 ovat riittävän ainutlaatuisia paljastaa sen rooli DNA huolto- ja signalointi ei löytynyt muita MEK1 /2-estäjät. Nämä tulokset korostavat sitä todennäköisyyttä, että vaikka yhdisteet voivat jakaa oletetun MOA tavoite ja tuottaa vastaavia GI50 vasteita, GSEA vähäinen EN geenien on vain hypoteettinen yhdistyksen välillä ainutkertaiset EN geenien ja tiettyjä biologisia prosesseja, jotka liittyvät kunkin lääkkeen GI 50. Vaikka kirjallisuudesta tukea annetaan GSEA valittujen polkuja, biologinen vahvistus selvästi tarvitaan.

Global analyysi CN ja MUT minimaalinen EN GES

Tulokset sellaisia ​​lääkkeitä voidaan ulottaa sisältävät maailmanlaajuinen analyysi CGP kuvaavien tietojen müts ja CN muutoksia, jotka mahdollisesti on rooli huumeiden vastausta. Analogisesti aikaisemman analyysi, jossa minimaalinen FI geenit tunnistettiin perustuen, joilla on tilastollisesti merkitsevä ero GE välillä eniten ja vähiten herkkä kasvainsoluja, merkittäviä geeni MutS ja CN muutoksia voidaan määrittää samalla tavalla. Valitaan kunkin lääkkeen minimaalinen FI kasvainsolujen, kaksisuuntaista Studentin t-testiä käytettiin laskea kaikki p-arvot, jotka perustuvat MUT tai CN eroja herkin ja resistenttejä syöpäsoluja. Nämä tulokset suodatetaan käyttämällä Benjamini-Hochberg (B-H) [16] vääriä löytö nopeudella 0,1 tunnistaa merkittävästi erilaiset biomarkkereita. T-tilastotieto Näissä vertailuissa on kätevä toimenpide hierarkkinen klusterointi merkittäviä tuloksia. Heatmap visualisointeja voi olla värikoodattu punaisiksi osoittamaan lujuuden tilastollisen merkityksen, jossa punainen osa spektristä heijastaa tapauksissa, joissa resistenttien kasvainsolujen esiintyy enemmän biomerkkiainevaste verrattuna herkkiä kasvainsoluja ja sininen osa spektri edustaa tapausta korkeampi biomarkkerin arvojen herkkiä kasvainsoluja verrattuna resistenttejä syöpäsoluja. Numerot merkittäviä müts ovat riittävän pieniä yhdistää osajoukot geenien erityisiä GSEA polkuja. Sen sijaan numerot geenien merkittäviä CN muutokset ovat riittävän suuria edellyttää lisää hierarkkinen klusterointi GSEA polkuja helpottamiseksi tulkinnan.

GSEA analyysi merkittävistä müts ja CN

Heatmap visualisointeja tilastollisesti merkitsevä MutS ja CN jotka läpäisevät BH-oikaistu kynnys tilastollisen merkitsevyyden voidaan käyttää maailmanlaajuisesti-pohjainen GSEA. Klusterin dendrogrammissa merkittävien CN ja müts voidaan leikata, jolloin saadaan pieniä ryhmiä geenien GSEA. Nämä tulokset tuottavat maailmanlaajuisesti johdettu FDR-oikaistu merkitystä sijoituksen biologisten reittien liittyvät osa-klustereita minimaalinen EN GES. Klusterointi näistä globaalisti johdettu tulokset voidaan liittää GI 50 vasteita biomarkkerit ottaa välillä tilastollista merkitystä kestävä ja herkkä kasvain soluvasteita.

ROC analyysi CGP ges kuin ennustavia CCLE lääkevaste

”Signature” geenejä käytetään yleisesti arvioida, onko osajoukko geeniekspressioiden ovat riittävän vertailukelpoisia vaikuta todennäköiseltä, että samanlainen biologisen tilansa tai terapeuttisen vasteen [17,18]. Vähäinen FI GES voidaan myös ehdotettu allekirjoitus geenejä ennustamiseen lääkkeen vaste. Tavoitteena testata tähän lähtökohtaan, minimaalinen EN GES kehitetty CGP joukko lääkkeitä käytettiin valitsemaan ei-CGP kasvainsoluja yhteensopivat ges ennustajina huumeiden tehon Koelääkkeiden. Epäonnistuminen saavuttaa mitään menestystä tällä menetelmällä voi vaikuttaa tulevaisuuden sovelluksia tämän lähestymistavan. Kuitenkin kohtalainen menestys voi tarjota motivaatiota suunnitella enemmän optimaalisen vaiheet saavuttamiseksi suotuisia tämän lähestymistavan. CCLE aineisto (24 lääkkeet testattiin 479 kasvainsoluja) jakaa 16 lääkkeiden kanssa CGP aineistot. Käyttämällä CGP johdettuja minimaalinen FI malli kullekin 16 vastaavat lääkkeet, GES näiden kahden aineistoja verrataan (käyttämällä keskiarvoa neliövirheen, MSE) ja käytettiin listalla täydellinen CCLE tuumorisoluja. Jotta ”testi” biomarkkereiden olla ennakoivaa apuohjelma, MSE tulokset on oikein listalla CCLE kasvainsolu lääkevastegenotyypin top (herkkä) tai alhaalta (kestävä) kaikista CCLE syöpäsoluja. Vain top 5

persentiilin MSE pistemäärät CCLE kasvainsolut valitaan. On huomionarvoista korostaa jälleen, että minimaalinen FI malli käyttää GES ennustaa GI 50. Niinpä herkkyys ja kestävyys ovat olennainen osa tätä mallia. Standard arviointi false /true-positiivisten /negatiivisten käyttäen ROCS käytetään tulosten arvioinnissa.

Tulokset

Hierarkkinen klusterointi GI 50

Konkordanssi huumausaineiden välillä saman MOA luokka ja GI 50 etsii kohtuullisen hyvän sopimuksen. Käyttämällä modifioitua hierarkkinen klusterointi (pvclust) ja muunnetun metrinen (kaikki-to-kaikki korrelaatiot GI50), yli puolet (16/30 = 0,53) ja lääkkeitä, jotka jakavat MOA luokan myös ilmaistava samassa yhteisössä klusterin; kanssa 4 5 SRC tekijöille yhteiset yhden klusterin. Tämä analyysi ulotettiin määrittää välistä yhdenmukaisuutta MOA ja co-klusterointia EN johdettujen GES (katso S1 File. – C. Concordance välillä MOA luokan ja EN GE lisätietoja). Suodattaminen 129 lääkkeen FI taantumat että lähentyneet ja tuotti yli 10 FI geenien tuotti vähemmän kuin ~ 2k alkuperäisen 13325 GES varten 87 lääkkeet, jotka jakavat vähintään 2 FI geenejä. Hierarkkinen klusterointi geenin ilmentymisen näiden suodatettua geenien (kuvio D) toteaa, että yli kaksi kolmasosaa (59/87 = 0,68) EN geeniekspressioiden huumeiden kanssa yhteinen MOA esiintyä samassa klusterissa. Nämä tulokset osoittavat, että hierarkkinen klusterointi, joka perustuu GES johdettu EN-regressio malleja GI50, tuottaa korkeamman konkordanssin kuluessa MOA huumeiden luokkiin verrattuna klustereiden perustuu GI 50 samankaltaisuus yksin. Keskimääräinen päällekkäisyys vain 1,67 välillä EN-geenien kunkin lääkkeen viittaa siihen, että EN-geenit ovat suhteellisen yksilöllinen kullekin lääkkeelle. Yhdessä suhteellisen korkea concordance, joko GI 50 tai EN johdettuja GES että malli GI50, ja olemassaolo suhteellisen vähän yhteisiä geenejä kunkin lääkeaineen EN mallissa, tukevat potentiaalinen sovellus geenipohjaisten toimenpiteitä ainutlaatuinen biomarkkereita GI 50.

vähäinen FI regressio

Kunkin lääkkeen minimaalinen FI malli tuottaa suppean joukon geenejä, jotka saattavat olla rooli sen GI 50. Sen jälkeen raportin Garnett ym. [7], minimaalinen EN GES, CN ja müts kaikella välillä tilastollista merkitystä herkkä ja tunteettomia kasvain soluvasteen voidaan tarkastaa johdonmukaisuus kirjallisuusraporttien sekä olettamalla uusia biologisia rooleja kussakin huumeiden vastaus. Tulokset Valittujen yhdisteiden raportoidaan.

Cisplatin.

Ensimmäinen esimerkki, käyttämällä DNA ristisitojaa, sisplatiini, vahvistaa tulokset Garnett ym. [7] Seitsemänkymmentä FI geenejä ja 108 kasvainsolut määritellä minimaalinen EN malli. Tilastollinen analyysi merkittäviä eroja CN ja MUT tilan vain minimaalinen FI geenit sisplatiinipiikin herkkiä ja resistenttejä kasvainsoluja (lueteltu taulukossa 1) toteaa, että herkkyys sisplatiiniin liittyy MutS in EWS_FLI1, PTEN, erbB2 ja APC (http: //cancer.CGP.ac.uk/CGP/gene/overview?ln=APC ja Niedner et ai. [19]). Ei sisälly CGP raportissa [7] on ulkonäkö KRAS_MUT mahdollisena biomarkkereiden sisplatiinin herkkyys. Tukea tälle lisäperspektiivi näkyy hiljattain Lin et al. [20], jossa KRAS_MUT todettiin olevan ennustaja herkkyys sisplatiinin analogi oksaliplatiini. KRAS yliekspressio mutantti vektoreiden aiheuttamat Leikkauskorjauksessa rajat komplementaatioryhmä 1 (ERCC1) alaspäin sääntely proteiinia ja mRNA-tasojen, ja parannettu oksaliplatiini herkkyyttä. Tärkeys XRCC1 vuonna sisplatiinin herkkyys tukee lisäksi Xu ym. [21], jossa proteiinin ilmentymistä XRCC1 lisääntyi merkitsevästi sisplatiini-resistenttien solujen ja itsenäisesti osaltaan sisplatiinin vastarintaa. Tulokset taulukossa 1 myös laajentaa sisplatiini analyysi oletuksen rooleja sisplatiinin herkkyys CN muutoksia kahden histoni lysiiniä demethylases (KMD6A_CN ja KMD5C.JARDIC_CN). Epigeneettiset roolit histonien lysiiniä demethylases alkavat nousta tärkeitä rinta- ja munasarjasyövän syöpiä [22].

Bortetsomibi.

minimaalinen EN regressiomallin bortetsomibia koostuu 44 geenien ja 64 tuumorisoluja (kuvio E), joka mallintaa GI 50

havaittu korrelaatiokerroin 0,69. Tilastolliset tulokset alkuun merkittävin ilmentyvät eri minimaalinen FI geenien välillä herkkä ja tunteeton kasvainsoluja luetellaan taulukossa 2. Ulkonäkö NQO2 yläosassa tämän listan voi tarjota hyödynnettävissä tietoa bortetsomibin hoito. NQO2 on flavoproteiinista, joka toimii kinoni oksidoreduktaasi, tunnettu suojella soluja vastaan ​​säteilyn ja kemiallisten aiheuttamaa oksidatiivista stressiä. 20S proteasomin ja NQO2 molemmat vuorovaikutuksessa Myelooisessa erilaistumistekijää C /EBPalpha [23]. Toinen kinoni oksidoreduktaasi, NQO1, löysi CCLE [8] olevan alkuun ennustaja herkkyys Hsp90 -estäjä 17-AAG. Hsp90 on rooli kokoonpano ja ylläpito proteasomin [24]. Samanaikainen inhibitio Hsp90 ja proteasomin tehostaa tuumorin vastaista aktiivisuutta sekä lääkkeiden [25]. Vaikka tarkkaa mekanismia tämä havainto ei ole vielä ratkaistu, tulos esitetään tässä ehdottaa kaksoisrooli varten kinoni oksidoreduktaasi biomarkkerit (NQO2, NQO1) käytön HSP90 /proteasomin kohdentamisaineita yksittäisinä ja yhdistettynä hoitoihin [25].

Temsirolimuusi.

seuraava esimerkki, että mTOR kohdistamisaineena temsirolimuusille, tuotti minimaalinen FI malli koostuu 67 geenien ja 108 syöpäsoluja.

Vastaa