PLoS ONE: tunnistaminen Druggable Cancer Kuljettajan Genes Amplified poikki TCGA Datasets

tiivistelmä

Cancer Genome Atlas (TCGA) hankkeet ovat edistäneet ymmärrystämme kuljettajan mutaatioita, geneettiset taustat ja keskeiset polut aktivoituvat poikki syöpätyyppeihin. Analyysi TCGA aineistojen ovat enimmäkseen keskittynyt somaattisten mutaatioiden ja toiselle siirtäminen, vähemmän painotetaan geenin monistuksissa. Tässä kuvaamme bioinformatiikan seulontastrategia tunnistaa otaksuttu syöpää kuljettaja geenit monistetaan poikki TCGA aineistoja. Suoritimme GISTIC2 analyysi TCGA aineistojen ulottuen 14 syöpä alatyyppejä ja tunnistaa 461 geenejä, jotka monistettiin kahdessa tai useammassa aineistoja. Luetteloa rajattiin 73 syöpään liittyvien geenien kanssa mahdollisten ”druggable” ominaisuuksia. Suurin osa geenien lokalisoitu 14 amplikoneja eri puolilla genomiin. Tunnistaa mahdolliset syöpää kuljettaja geenit kartoitettiin geenikopiomäärä ja mRNA: n ilmentymisen dataa yksittäisen potilaan näytteitä ja tunnistettu 40 otaksuttu syöpä kuljettaja geenit liittyvät erilaisiin onkogeenisia prosesseihin. Kasvaimia synnyttävän aktiivisuuden edelleen vahvistanut siRNA /shRNA Knockdown ja viittaamalla Project Achilles aineistot. Monistettujen geenien edustivat useita geeniperheisiin kuten epigeneettiset sääntelyviranomaiset, solusyklin liittyvien geenien, DNA-vaurion vaste /korjaus geenit, metabolinen sääntelyviranomaisten, ja geenit liittyvät Wnt, Notch, Hedgehog, JAK /STAT, NF-KB ja MAPK signalointireittejä. Niistä 40 otaksuttu kuljettaja geenit tunnettiin kuljettaja geenejä, kuten

EGFR

,

ErbB2

ja

PIK3CA

. Villityypin

KRAS

monistettiin useissa syöpätyypeissä, ja

KRAS

-amplified syöpä solulinjoja herkin

KRAS

shRNA, mikä viittaa siihen, että

KRAS

vahvistus oli itsenäinen onkogeenistä tapahtuma. Useita MAP-kinaasin adapterit co-monistettiin niiden reseptorityrosiinikinaasit, kuten FGFR sovittimen

FRS2

ja EGFR-perheen sovittimen

GRB7

. Ubikitiinipromoottori kaltainen ligaasi

DCUN1D1

ja histoni metyylitransferaasi

NSD3

todettiin myös uusia otaksuttu syövän kuljettajan geenejä. Käsittelemme potilas räätälöintiä vaikutuksia nykyisten syöpälääkkeen tavoitteita ja olemme edelleen keskustella mahdollisista uusia mahdollisuuksia lääkeaineiden ponnisteluja.

Citation: Chen Y, McGee J, Chen X, Doman TN, Gong X, Zhang Y, et al. (2014) tunnistaminen Druggable Cancer Kuljettajan Genes Amplified poikki TCGA Datasets. PLoS ONE 9 (5): e98293. doi: 10,1371 /journal.pone.0098293

Editor: Masaru Katoh, National Cancer Center, Japani

vastaanotettu: 06 maaliskuu 2014; Hyväksytty: 30 huhtikuu 2014; Julkaistu: toukokuu 29, 2014

Copyright: © 2014 Chen et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus rahoittivat Eli Lilly and Company. Rahoittaja antoi tukea muodossa palkoista kaikille tekijöille, mutta ei ollut mitään ylimääräistä roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen. Erityinen roolit nämä kirjoittajat ovat muotoutuneet tekijän maksujen osiossa.

Kilpailevat edut: Tämä tutkimus rahoitetaan kokonaan Eli Lilly and Company, työnantaja kaikkien tekijöille. Ei ole olemassa patentteja, tuotteiden kehittämiseen tai kaupan tuotteiden julistaa. Tämä ei muuta tekijöiden noudattaminen kaikki PLoS ONE politiikan tietojen jakamiseen ja materiaaleja, yksityiskohtaisena online-oppaassa tekijöille.

Johdanto

Viimeaikaiset edistysaskeleet DNA sekvensointi teknologia on mahdollistanut sekvensoinnin koko syövän genomien ja tunnistaminen yleisesti mutatoidun, monistettiin, ja poistetut geenit koko syöpätyyppeihin. Cancer Genome Atlas (TCGA) vaivaa perustettiin järjestyksessä ja analysoida useita tuhansia yksittäisiä syöpiä, jolloin tilannekuvan tautikohtaisia ​​geneettiset taustat ja syövän kuljettajien [1] – [6]. Integroitu analyysi TCGA aineistojen tunnistettu 127 merkitsevästi mutatoitunut syöpään liittyvien geenien edustavat erillisiä biologisia polkuja ja soluprosessien [6]. Keskimäärin kuljettajan mutaatioiden kohti kasvain näyte oli kaksi-kuusi, mikä viittaa siihen, että pieni määrä mutatoituja kuljettajan geenit voivat aiheuttaa syövän synnyn [6]. Vuonna rintasyöpiä, vain kolme geeniä (

GATA3

,

PIK3CA

, ja

TP53

) havaittiin mutatoitu 10% ilmaantuvuus kaikissa potilaan kasvaimia. Tarkempi analyysi paljasti reittiin geneettisen kuljettaja mutaatioiden rintasyövän alatyyppejä, kuten

BRCA1 /2

muutoksia ja

PIK3CA

muutoksia perus-kuvaus ja luminaaliselle rintasyöpiä, vastaavasti [4]. Peräsuolen syöpiä, kaksikymmentäneljä geenejä yleisesti mutatoitunut ja useimmat geenit kartoitettiin Wnt, TGF-b, PI3K p53 ja RAS signalointireitteihin [3]. Vuonna keuhkosyövässä, yksitoista geenit olivat yleisesti muuntunut, kuten

TP53

, oksidatiivisen stressin muuniresponssigeeneinä ja suomuinen erilaistumista geenit [1]. Nämä tutkimukset ovat valottaa osaksi suurta geneettistä kuljettajien syövän alatyyppejä ja ovat myös tunnistettu mahdollisesti druggable väyliä yhteys näihin alatyyppejä. Edistysaskeleista nopeuttaa lääkekehityksen tarjoamalla uusia potilaan räätälöintiä strategioita reittiin erityisiä estäjät. Kuitenkin TCGA tutkimukset ovat enimmäkseen keskittyneet mutaatioita ja harvinaisia ​​toiselle siirtäminen, vähemmän huomiota saatetaan geeni monistuksia syövissä. Koska geenin monistaminen on tärkeä mekanismi, syövän, pyrimme louhia TCGA aineistoja tunnistaa uusia kohteita ja ohjaimet monistettiin yli syöpätyyppeihin.

Geenin monistuminen syöpäsoluissa tarjoaa keinon yliekspressio syövän edistämiseen kuljettajan geenejä , kuten

EGFR

ja

ErbB2

kromosomeissa 7 ja 17, tässä järjestyksessä. Geenimonistus tapahtuu somaattisesti rajoitettuun alueen syövän genomin eri mekanismien kautta, kuten rikkoutuminen-fuusio-sillat sykliä [7]. Nämä monistetut alueet, jotka tunnetaan amplikoneja, voi ulottua kiloemästä kymmeniä megabases ja voi sisältää useita onkogeenisten geenien sekä matkustajien geenit monistettiin alueilla [8]. Pituus amplikonien voi vaihdella huomattavasti, joka perustuu genomisen lokuksen ja syövän tyyppi. Esimerkiksi yksittäinen geenimonistuminen

KIT

kromosomissa 4 voi esiintyä kiveskasvaimia [9], mutta suurempi amplikoneihin sisältää

KIT

,

PDGFRA

, ja

KDR

monistuvat glioblastoma [10]. Koska amplikonit sisältävät usein monia geenejä, mukaan lukien henkilöautot geenit eivät liity onkogeneesiin, on usein vaikeaa tunnistaa syövän kuljettajan geeni (t), joka vastaa vahvistusta. Strategiat tunnistamaan syövän geenien ajo amplikoni sisältää kartoitus minimaalinen alueen vahvistus (MRA) monilla kasvainnäytteet, tunnistaa positiivinen korrelaatio kopiomäärä ja mRNA geenien ilmentymistä, ja kokeellinen validointi siRNA /shRNA knockdown soluissa. Tällaiset analyysit ovat tähän mennessä tunnistettu monistettujen geenien kanssa osoitti rooli syövän synnyssä [7]. Kuitenkin useimmat analyysit tähän mennessä ovat luottaneet pieniä näytteitä koot, jotka johtavat suuria MRA ja mahdollisia vääriä positiivisia geenejä. TCGA aineistot tarjoavat ainutlaatuisen kokoelman kasvainnäytteestä suuret otoskokoihin tunnistaa monistettiin syöpää kuljettaja geenien erillisiä syöpätyyppeihin.

Ohessa kuvataan bioinformatiikan seulontastrategia selville mahdolliset druggable syöpä kuljettaja geenit monistetaan poikki TCGA aineistoja. Käytimme GISTIC2 analyysi TCGA aineistot (cBio portaali) ja tunnistettiin 461 geeniä, jotka olivat tilastollisesti monistettiin kahdessa tai useammassa TCGA aineistot käsittävät 14 syöpätyyppeihin. Geenejä otaksuttu tai todennettujen roolista syövässä tunnistettiin käyttämällä Cancer geenejä cBio tietokantaan. Me annetaan druggability pisteet kullekin geeniä integroimalla dataa neljä ulkoista druggability indeksit. Vuodesta 461 geenit, tunnistimme 73 mahdollisesti druggable monistettujen geenien, joilla on tunnettu tai otaksuttu rooli syövän synnyssä. Sitten käytimme korrelaatioanalyysiä kopio numero ja mRNA: n ilmentymisen dataa useita tuhansia TCGA potilaan näytteitä tunnistaa mahdolliset syöpää kuljettaja geenien keskuudessa luettelo. Tämä johti tunnistamiseen 40 otaksuttu syövän kuljettaja geenit liittyvät erilaisiin onkogeeniset prosesseihin, kuten epigeneettiset sääntelyviranomaiset, solusyklin liittyvien geenien, DNA-vaurion vaste /korjaus geenit, metabolinen sääntelyviranomaisten, ja geenit liittyvät Wnt, Notch, Hedgehog, JAK /STAT, NF-KB ja MAPK signalointireitteihin. N oletettu syöpä kuljettajan toimintaa entisestään vahvistanut päästä shRNA hiusneula toimintaa syöpäsolulinjoissa käyttämällä Project Achilles tietokantaan [11]. Ylimääräisen suoritettiin osajoukko geenien käyttäen siRNA /shRNA pudotus syöpäsolulinjoissa, joka sisältää geenin monistuminen etua. Niistä 40 otaksuttu kuljettaja geenit tunnettiin kuljettaja geenejä, kuten

EGFR

ja

ErbB2

sekä uusia tavoitteita, kuten

DCUN1D1

ja

NSD3

.

KRAS

, merkittävä syövän kuljettaja, joiden tiedetään aktivoivan mutaatio syövän [12], havaittiin monistuvan osajoukko munasarja-, maha-, keuhko-, ja kohdun syöpiä. Käsittelemme vaikutukset lääkekehityksen ponnisteluja ja tunnistamme uudet potilas räätälöintiä strategioita olemassa olevien terapeuttisten tavoitteiden.

Materiaalit ja menetelmät

bioinformatiikan analyysi

TCGA aineistoja 14 syöpään alatyypeistä olivat analysoitiin geenin monistamisen käyttäen GISTIC2 algoritmin cBio portaalissa (https://www.cbioportal.org). 14 syöpä alalajit sisältävät BLCA – Virtsarakon urothelial Karsinooma, BRCA – Breast invasiivinen karsinooma, CRC – peräsuolen syövän (COAD ja LUE tutkimukset yhdistetään), GBM – glioblastooma, HNSC – Pään ja kaulan okasolusyöpä, KIRC – Munuainen munuaisten kirkas cell syöpä, LGG – Brain Lower asteisen gliooman, LUAD – Lung adenokarsinooma, LUSC – Lung okasolusyöpä, OV – Munasarjojen vakavien kystadenokarsinooma, PRAD – Eturauhasen adenokarsinooma, SKCM – Skin ihomelanooman, STAD – Vatsa adenokarsinooma, ja UCEC – kohdun Corpus endomet- syöpä . Geenit, jotka monistettiin kahdessa tai useammassa TCGA tutkimuksia yhdistettiin yhdessä tehdä lista 461 geenejä. Taso 3 SNP6 ja RNAseq version 2 tietoja haettiin TCGA verkkosivuilla, ja taso 3 SNP6 tietoja edelleen kuvata geenin tasolla käyttäen R paketti CNTools. Pearsonin korrelaatiokertoimet geenikopiomäärä (SNP6) versus geenien ilmentyminen (RNASeq) laskettiin kiinnostavia geenejä käyttämällä toimintoa cor () R. Tietojen analysointi koodin R ja gawk voidaan toimittaa pyynnöstä. Kukin geeni osoitettiin druggability pisteet tietojen perusteella ulkoisesta tietokannoista Ensembl, Interpro-Blast, BioLT-drugbank ja Qiagen Druggability lista. Kunkin tietokannan geeni sai 0-4 druggability pisteet, jossa 0 on undruggable ja 4 olevan vakiintunut lääke kohde. Geeni, jossa ”1” druggability pisteet tahansa neljästä tietokantojen pidettiin ”potentiaalisesti druggable” ja sisällytetty lopulliseen geenin luettelosta. Geeni lista myös ladataan Cancer Geenit tietokanta (cBio portaali) ja geenit liittyvät onkogeneesiin sisällytettiin lopulliseen geenin luettelosta.

Project Achilles

Project Achilles tietokanta koostuu shRNA ehtyminen pisteiden yhdistetyssä genomisesta kirjastosta testattiin yli paneeli syöpäsolulinjojen [11]. Olemme kehittäneet menetelmän pisteet geeni riippuvuuden kussakin solulinjassa painottamalla kutakin hiusneula mukaan yhdenmukaisuus muiden hiusneuloja suunniteltu vastaan ​​samaa geeniä, samalla tavalla kuin on kuvattu Shao et. al [13]. Me perusteltu, että jos tuumorisolulinjoissa vaihteli riippuvuutta tietyn kuljettajan geeni, sitten hiusneuloja tehokkaasti suuntaamalla geeni pitäisi antaa samanlaiset shRNA ehtyminen tulokset epäitsenäisissä linjat. Laskimme pairwise korrelaatioita ehtymisen tulokset elementin poikkisuunnassa kaikkien hiusneuloja ryhmästä shRNA konstruktien suunniteltu kohdistamaan tietyn geenin. Sitten jokainen shRNA oli painotettu useissa muissa shRNAs geenistä asettaa, että korreloivat voimakkaasti sitä (Spearman korrelaatiokerroin on suurempi kuin 0,35, joiden p-arvo 0,01). Geeni-tason komposiitti pisteet (shRNA pisteet) saatiin sitten painotettu summattu shRNA ehtyminen tulokset. Nämä geeni riippuvuus profiileja käytettiin laskettaessa todennäköisyys suhde pistemäärät assosiaatiosta geenimutaatio tai kopioida numeron shRNA herkkyys vertaamalla geenimutaatio malli ”nolla malli” (ilman geenimutaatio).

Cells

Solut saatiin American Type Culture Collection (ATCC) ja niitä kasvatettiin Dulbeccon muokatussa Eaglen elatusaineessa (DMEM), johon oli lisätty 10% naudan sikiön seerumia. Amplified ja vahvistamattoman solulinjat valitaan kullekin syöpää monistettu geeni. Jokaista syöpä monistettu geeni, käytetyt solulinjat validointitutkimuksia ja niiden vastaavan geenin kopio luvut ovat seuraavat: (1)

NSD3

: H1581 (7 kappaletta), H1703 (6 kappaletta), SW48 (5 kappaletta ), SW837 (ei-monistettu); (2)

DCUN1D1

: KYSE (6 kappaletta), T47D (4 kopiota), SW48 (vahvistamattoman), HCT15 (vahvistamattoman). Kopioi numero arvot saatiin julkaistuista CCLE aineistot [14].

Gene pudotus

geenin pudotus geenejä, käytimme shRNA lentiviraalinen transduktiopartikkeleilla Sigma (Mission, SHCLNV).

DCUN1D1

shRNA konstruktit olivat TRCN0000133666, TRCN0000134440, TRCN0000134715, TRCN0000136858, ja TRCN0000137482. Sillä

NSD3

Knockdown tutkimuksissa käytimme On-Targetplus SMARTpool siRNA kohdistaminen ihmisen Nsd3 (Thermo Scientific). Solut infektoitiin lentiviruksen shRNA hiukkasia infektiokertoimella (MOI) vaihtelevat 5-10, kun läsnä on 10 ug /ml polybreeniä. siRNA /shRNA kokeet suoritettiin vakiintuneiden protokollien [15].

Cell perustuvissa määrityksissä

Vasta-aineita käytetään western blot-analyysi ovat kanin anti-DCUN1D1 (Sigma, HPA035911), kanin anti- WHSC1L1 (Proteintech, 11345-1-AP). Western blot suoritettiin tavanomaisten käytäntöjen mukaisesti. Solujen lisääntyminen ja apoptoosin määritykset suoritettiin Cell Titer Glo ja kaspaasi Glo määritykset (Promega) valmistajan ohjeiden mukaisesti. Solusyklianalyysiä suoritettiin propidiumjodidivärjäys syöpäsolun riviä käyttäen tavanomaisia ​​protokollia [15].

Tulokset

tunnistaminen geenin monistuksia TCGA aineistot

TCGA aineistot käsittävät 14 syöpätyyppeihin analysoitiin GISTIC2 algoritmilla (cBio portaali) tunnistaa geeni monistuksia potilaalla kasvain näytteissä. Geenit pisteytettiin tilastollisen todennäköisyyden monistamisen, ja niitä geenit osoittavat vahvistus kahdella tai useammalla aineistot tunnistettiin (kuvio 1). Kaikkiaan 461 geenejä tunnistettiin potentiaalisesti monistettujen geenien (taulukko S1). Joissakin tapauksissa, useiden geenien (esim.,

CD274

ja

NDUFC2

) monistettiin kahdessa tai useammassa aineistoja, jotka ovat peräisin yhdestä syövän alatyypin (kuvio 1, taulukko S1). Geeni lista edelleen kaventunut tunnistamalla osajoukko geenien vakiintuneiden tai otaksuttu rooli oncogenesis sekä geenit, jotka olivat mahdollisesti druggable. Ensimmäinen geeni luettelo oli rajat viitataan kanssa Cancer Genes tietokannan (cBio portaali), joka osoitti, että vähemmän kuin 25% 461 geenien liittyy kasvaimen synnyssä. Seuraavaksi geenit osoitettu druggability pisteet perustuu druggability indeksit neljästä ulkoisten tietokantojen (Ensembl, Interpro-Blast, BioLT-drugbank ja Qiagen Druggability lista). Kunkin tietokannan geeni sai 0-4 druggability pisteet, jossa 0 on undruggable ja 4 olevan vakiintunut lääke kohde. Geeni, jossa ”1” druggability pisteet tahansa neljästä tietokantojen pidettiin ”potentiaalisesti druggable” ja sisällytetty lopulliseen geenin luettelosta. Analyysin yhteensä 73 mahdollisesti druggable syöpä monistettujen geenien havaittiin poikki TCGA aineistot (kuva 1).

TCGA aineistoja louhitaan geenimonistusmääritystä (GISTIC2 analyysi, cBio portaali) ja 461 geeniä tiomonistukset tunnistettiin . Luetteloa rajattiin 73 geenejä syöpään liittyvien geenien, jotka olivat mahdollisesti ”druggable” perustuen ulkopuoliseen druggability tietokantoihin. Vuodesta 73 geenit, 40 oletetun syövän kuljettajan geenejä tunnistettiin perustuen kopioluku versus mRNA: n ilmentymisen analyysi TCGA tietoja.

73 syöpä monistetut geenit sijaitsevat eri puolilla genomin ja suurin osa geenien ryhmitelty taudin loci (kuva 2). Niistä 73 geenit, 57 geenejä ryhmitelty 14 loci poikki genomin ja loput 18 geenit olivat polttovälin monistuksissa. Ryppään sisällä, geenit oli taipumus monistaa vastaavia syöpätyypeissä. Esimerkiksi kromosomissa 20q klusteri, joka käsittää neljä geeneistä (

PTK6

,

SRM

,

RTEL1

, ja

PRPF6

) olivat kaikki monistettu kohdun /kohdun limakalvon syöpiä ja keuhkojen adenokarsinooman. Kromosomi 1q klusteri sisälsi 12 geenejä, kuten

SETDB1

,

BCL9

,

PIAS3

, ja

MCL1

, ja 11 12 geenejä monistettiin keuhkojen levyepiteelikarsinooma syövät ja virtsarakon syöpien (kuva 2). Hyvin tutkittu klusteri kromosomissa 4q sisältää

PDGFRA

,

KIT

, ja

KDR

monistettiin gliooman ja ihosyövän [10]. Koska tiukkuus käytetään Gistic2 analyysissa todennäköisesti aliarvioi syöpätyyppejä, joissa geenien monistuminen tapahtunut. Siksi on todennäköistä, että 73 syöpä geenit tunnistimme monistettiin ylimääräisiä syöpätyypeissä ole edustettuna tässä (kuva 2).

Alkuperäisestä luettelosta 461 geenien monistetaan yhdessä tai useammassa TCGA aineistoja, 73 monistaa geenejä tunnistettu mahdollisesti ”druggable” ominaisuuksista sekä vakiintunut /otaksuttu roolit oncogenesis. Geenit /amplikonista järjestää kromosomaalisen sijainnin, niiden genomisen sijainti merkinnät ovat (Mb = miljoonan emäksen). Värilliset laatikot osoittavat syöpätyyppeihin kanssa TCGA nimityksiä, seuraavasti: BLCA – Virtsarakon urothelial Karsinooma, BRCA – Breast invasiivinen karsinooma, CRC – peräsuolen syövän (COAD ja LUE tutkimukset yhdistetään), GBM – glioblastooma, HNSC – Pään ja kaulan okasolusyöpä , KIRC – Munuainen munuaisten kirkas cell carcinoma, LGG – Brain Lower asteisen gliooman, LUAD – Lung adenokarsinooma, LUSC – Lung okasolusyöpä, OV – Munasarjojen vakavien kystadenokarsinooma, PRAD – Eturauhasen adenokarsinooma, SKCM – Skin ihomelanooman, STAD – Vatsa adenokarsinooma, UCEC – Kohdun Corpus endomet- karsinooma.

Niistä 73 syöpä monistettujen geenien olivat useita vakiintuneita lääkekohteita, kuten

EGFR

,

ErbB2

ja

KIT

(kuvio 2).

ErbB2

kromosomissa 17 monistettiin 5 syöpätyyppeihin ja oli mukana monistetaan MAP-kinaasin sovitin

GRB7

ja

PPP1R1B

.

EGFR

kromosomissa 7 monistettiin yhtenä geeni 7 syöpätyyppejä, validointi tärkeyttä tämän lääkkeen tavoite syöpään [16]. Lista myös useita tavoitteita parhaillaan kliinisessä kehityksessä koko alalla, kuten

CDK6

,

PIK3CA

,

PIK3C2B

ja

NOTCH2

.

CDK6

kromosomissa 7q monistettiin yhtenä geeni keuhkojen levyepiteelikarsinooma syöpä ja glioblastooma, kun taas

PIK3CA

oleskellut kromosomissa 3q klusterin 6 muiden geenien ja monistettiin useita syövän tyypit (kuva 2) [17]. Useat aiemmin validoitu syöpä monistettujen geenien, kuten

FAK Twitter /

PTK2

, ei ollut määritelty analyysissä, mikä johtuu osittain korkean ankaruuden, joka oli sovellettu bioinformatiikan analyysi vähentämään vääriä positiivisia osumia [18].

tunnistaminen monistettujen syövän geenien kanssa otaksuttu syövän kuljettajan toimintaan

koska osa geenien tunnistettu syöpää monistettujen geenien voi olla matkustaja geenien amplikoneista, me edelleen analysoineet geeniperimä tunnistaa otaksuttu syöpää kuljettajan geenejä. Tämä tehtiin laskemalla Pearsonin korrelaatiokerroin kopiomäärä ja mRNA: n ilmentymisen arvon TCGA potilaan kasvain tiedot. Korrelaatiokertoimet laskettiin kullekin 14 syöpätyyppien ja keskimääräinen korrelaatiot kaikkien syöpätyyppien laskettiin (kuviot 3-4). Analyysi paljasti laajan valikoiman kopioluvun verrattuna mRNA: n ilmentymisen korrelaatiot geenit. Otaksuttu syöpä kuljettaja geenien odotetaan osoittavan suuren kopiomäärän verrattuna mRNA ilmaisun korrelaatio. Validoitu syöpä kuljettajat kuten

ERRBB2

,

EGFR

, ja

KRAS

osoitti suuren kopiomäärän verrattuna mRNA: n ilmentymisen korrelaatio vastaavaan syöpätyypeissä ne säätelevät (

erbB2

r = 0,9 rintasyövässä,

EGFR

r = 0,8 keuhkojen adenokarsinooma,

KRAS

r = 0,9 munasarjasyöpä) (Kuva 3-4).

Pearsonin korrelaatiokertoimet laskettiin analysoimalla geenikopiomäärä ja mRNA ilmentyminen potilaan johdettujen näytteiden TCGA aineistoja. Siinä on esitetty korrelaatiokertoimet kunkin TCGA syövän alatyypin ja keskimääräinen korrelaatio kaikkien syöpätyyppien (punainen tarkoittaa korkea korrelaatio, sininen tarkoittaa alhainen korrelaatio). Lyhenteet TCGA aineistot on lueteltu kuviossa 1.

Pearsonin korrelaatiokertoimet laskettiin analysoimalla geenikopiomäärä ja mRNA ilmentyminen potilaan johdettujen näytteiden TCGA aineistoja. Siinä on esitetty korrelaatiokertoimet kunkin TCGA syövän alatyypin ja keskimääräinen korrelaatio kaikkien syöpätyyppien (punainen tarkoittaa korkea korrelaatio, sininen tarkoittaa alhainen korrelaatio). Lyhenteet TCGA aineistot on lueteltu kuviossa 1.

kopioluku versus ilmaisun analyysi paljasti mahdollisen kuljettajan geenejä, jotka monistettiin geeni klustereita. Esimerkiksi kromosomi 1q klusterin 12 monistettujen geenien sisälsi 4-geenien kopioluku vs. ilmaisun korrelaatio on suurempi kuin 0,5 (

SETDB1

,

ARNT

,

APH1A

, ja

CHD1L

), viittaa siihen, että nämä voivat olla kuljettajan geenejä amplikonin (kuvio 3). Niistä 12 geenit,

SETDB1

osoittivat korkeimmat korrelaatio, yhdenmukaisia ​​viimeaikaisten raporttien että

SETDB1

on syöpä monistetun geenin kanssa osoitti kuljettajan toimintaa [19], [20]. Kolme muuta geenit saattavat myös olla potentiaalisesti merkittävä rooli syövän synnyssä –

APH1A

on gammasekretaasia monimutkainen alayksikön Notch koulutusjakson,

ARNT

on alayksikkö on HIF1 monimutkainen, ja

CHD1L

on DNA helikaasin että DNA-vaurioita vastaus koulutusjakso [21]. Neljä geenien amplikonin näkyy kopiomäärä verrattuna ilmentymisen korrelaatio alle 0,3 (

PDE4DIP

,

S100A11

,

S100A9

, ja

S100A8

) (Kuva 3). Kromosomissa 3 klusterin 7 geenien sisälsi 2-geenien kopiomäärä verrattuna ilmentymisen korrelaatio on suurempi kuin 0,5 (

DCUN1D1

ja

PRKCI

) ja 4 geenien kopiomäärä verrattuna ilmaisun alle 0,3 (

kiksi tert

,

SKIL

,

GNB4

, ja

Sox2

).

PRKCI

on seriini /treoniini-kinaasi, että NF-KB-reitin ja edellinen kudosten microarray data validoitu tämän geenin mahdollisena uusi syöpää kuljettajan geeni [22].

DCUN1D1

on E3 ubikitiinipromoottori ligaasilla monimutkainen alayksikköä mahdollisten syöpää kuljettajan toimintaa, jota edelleen validoitu shRNA taintumisen (alla). Vaikka

PIK3CA

näkyy yleinen korrelaatiokerroin 0,4, se näkyy suuri korrelaatio rintasyövässä (r = 0,9), pään ja niskan levy- syöpä (r = 0,8), ja kohdun /kohdun limakalvon syöpiä (r = 0,7) ( kuva 3).

kromosomi 11q klusteri sisälsi 5 geenejä, kuten

CCND1

, vakiintunut solukierron säädin ja onkogeenisten kuljettaja. Vaikka

CCND1

näkyy suuren kopiomäärän vs. ilmaisun korrelaatiot maksasyövän (r = 1,0), virtsarakon syöpä (r = 0,8), keuhkosyöpä levyepiteelikarsinooma syöpä (r = 0,7), pään ja kaulan caner (r = 0,7) ja rintasyöpä (r = 0,7), korrelaatiot heikompi muissa syöpätyypeissä, mikä viittaa siihen, että

CCND1

vahvistus on taudin aiheuttaman onkogeenisiä kuljettaja (kuva 3). Kaksi muuta geenien amplikonin,

FADD

, ja

PPFIA1

, näytetään korkeampi yleinen korrelaatio poikki syöpätyyppejä, syytetään nämä geenit mahdollisina uusia syövän ajurit lisätutkimuksia.

FADD

, apoptoottinen effektorimolekyylin, aiemmin tunnistettu uusi syöpää kuljettaja geenin paneeli 167 kurkunpään /nielun syöpiä, jotka oikeuttavat lisätutkimisesta sen mekanismi syövän synnyn [23]. On tärkeää huomata, että korrelaatio mRNA: n ekspression kopioida numero ei ole välttämätöntä periaatteessa geenin olla syöpää kuljettajan geeni. Siksi geenejä, joilla on alhainen mRNA ilmaisun versus kopiomäärä korrelaatio ei välttämättä matkustaja geenejä. Esimerkiksi kromosomiin 1q klusterin sisälsi

MCL1

, geeni, jolla on syöpä kuljettajan allekirjoitus perustuu Project Achilles (tuloksia ei ole esitetty), mutta keskimääräinen mRNA: n ilmentymisen verrattuna kopioluvun korrelaatio 0,31.

tunnistamiseksi monistettiin syövän geenien kanssa korkeimmat syövän kuljettajan toimintaan, me sijoittui geenien järjestyksessä eniten kopioluvun versus mRNA: n ilmentymisen korrelaatio kaikilla syöpätyyppeihin. Havaitsimme 40 geenien kanssa yleisen r on yli 0,3 (taulukko 1). R = 0,3 sulku oli käytetty, koska useat geenit osoittivat korkea r pieni määrä syöpätyyppeihin. Esimerkiksi

FGFR3

näytetään r 0,7 neljässä syöpiä (virtsarakon syöpä, glioblastooma, keuhkosyöpä suomuinen, ja melanooma), mutta r 0,5 muissa syövissä. Vastaavasti

CDK6

osoittanut r 0,7 vain 4 syöpiä (glioblastooma, pään ja kaulan alueen syöpä, keuhkojen adenokarsinooma, ja keuhkojen levyepiteelikarsinooma syöpä), kun taas

IGF1 R

oli r 0,7 vain yhdessä syövän ( rintasyöpä) (Kuva 3-4). Niistä 40 geenit korkein syöpä kuljettajan toimintaan, kaksi ylintä pisimmälle paremmuusjärjestykseen geenit olivat

NSD3 Twitter /

WHSC1L1

ja

SETDB1

, kaksi tärkeää histoni metyylitransferaasit (taulukko 1) . Vaikka

SETDB1

äskettäin perustettu bona fide monistettu syöpä kuljettajaa melanooman ja keuhkosyövän [19], [20], rooli

NSD3 Twitter /

WHSC1L1

on ei ole määritelty, ja niin me edelleen validoitu sen onkogeeninen rooli in vitro (alla). Kaksi muuta chromatin valvojat, kromatiinin lukija Brd4 ja histoni liasetyylitransferaasi

YEATS4

, olivat myös hyvin rankattu otaksuttu syövän kuljettajan geenejä. Muita geeniperheistä jotka olivat edustettuina luetteloon kuuluu Notch-reitin geenit (

NOTCH2

,

APH1A

), metabolinen säätelygeenit (

NDUFC2

,

PRKAB2

), Hedgehog-reitin geenit (

DCUN1D1

), Wnt-reitin geenit (

BCL9

), NF-KB-reitin geenit (

ERC1

,

PRKCI

,

IKBKB

), JAK /STAT-reitin geenit (

PIAS3

), MAPK signalointi effektorit (

KRAS

,

FRS2

,

GRB7

), reseptorityrosiinikinaaseilla (

FGFR3

,

EGFR

,

ErbB2

,

IGF1 R

), DNA-vaurion vaste /korjaavien geenien (

RAD51AP1

,

RTEL1

,

ERCC5

,

RAD52

,

CHD1L

), p53 liittyvien geenien (

MDM2

MDM4

,

GTPBP4

), ja solusyklin säätelygeenit (

CCNE1

,

TPX2

,

CCND3

,

CDK6

) (taulukko 1).

kopioluku vaihtelee syövän monistettujen geenien analysoitiin yksittäisten TCGA potilaan kasvaimia laajuuden määrittämiseksi geenin monistamisen (kuvio. S1, S2) . Jotkut geenit näkyvät korkean tason vahvistus vastaa 10-20 geeniä kappaletta, kun taas muiden geenien näkyvissä alhainen 3-8 kopiomäärä monistuksissa. Kromosomi 1Q amplikoni, joka sisälsi

PRKAB2

,

APH1A

,

ARNT

, ja

SETDB1

osoitti alhainen vahvistusta (3-10 kappaletta) , kun taas kromosomi 12q amplikonin, joka sisälsi

MDM2

,

YEATS4

, ja

FRS2

, osoitti korkea vahvistus (10-20 kappaletta) (Fig. S1, S2 ). Muita geenejä korkean tason monistuksissa sisältävät

PRKAB2

(6-10 kappaletta munasarjasyöpä),

MDM4

(10-30 kappaletta glioblastoma),

MDM2

(10- 15 kappaletta keuhkoadenokarsinooma),

PIK3CA

(5-20 kappaletta keuhkojen levyepiteelikarsinooma syöpä),

DCUN1D1

(5-15 kappaletta keuhkojen levyepiteelikarsinooma syöpä),

FADD

ja

PPFIA1

(jokaisessa on 5-10 kappaletta pään ja kaulan alueen syöpä),

NDUFC2

(5-15 kappaletta munasarjasyöpä), ja

RAP1B

(5- 15 kappaletta keuhkoadenokarsinooma). MAP-kinaasi liittyy geenien osoitti myös korkean tason vahvistus, jossa reseptorityrosiinikinaaseilla

ErbB2

,

IGF1 R

, ja

EGFR

kaikki erittäin monistettu, odotetusti. MAP kinaasi adaptoriproteiineja

FRS2

ja

GRB7

myös erittäin monistettiin (10-20 kappaletta keuhkoadenokarsinooma ja rintasyöpä, vastaavasti). Cell lukiertosäätelijöistä, kuten

CCNE1

(10-20 kappaletta munasarjasyöpä), olivat myös erittäin monistettiin odotetusti. Lisäksi kopioida numerosarjat, taajuus geenivahvistus potilaan kasvaimissa laskettiin käyttäen kopiomäärä 4 kuin katkaisu vahvistusta (Fig. S4). Huomattava määrä geenejä monistettiin yli 30 prosenttia syöpäpotilailla, kuten

DCUN1D1

(43% keuhkojen levyepiteelikarsinooma syövät),

FADD

ja

PPFIA1

(~ 30% pään ja kaulan syövät), ja

PRKCI

(36% keuhkojen levyepiteelikarsinooma syövät) (Fig. S4). Kun vahvistus oli ensisijainen genomisen muutos näiden geenien useita geenejä myös suorittaa somaattisista mutaatioista, kuten

PIK3CA

,

KRAS

ja

NOTCH2

. Näissä tapauksissa liitetyt ja mutaatiot olivat suurelta osin toisensa poissulkevia (Fig. S4).

MAPK-reitin monistettujen geenien

73 syöpä monistettujen geenien analysoitiin edelleen shRNA validointi tarkistaa syövän kuljettajan toimintaa . Project Achilles on laajamittainen vaivaa kuvastoon geneettinen haavoittuvuuksia syöpäsolulinjoissa käyttämällä genominlaajuisten shRNA kirjasto geenien tunnistamiseen, jotka vaikuttavat syöpäsolun selviytymistä /lisääntymiseen [11]. Me louhitaan Akilleen tietokannasta, johon on 73 syöpää monistettujen geenien voi olla rooli syövän solujen selviytymistä /lisääntymiseen. Achilles kirjasto koostuu useista shRNA hiusneuloja ja laskimme komposiitti shRNA pisteet perustuvat vaikutukset useiden lentiviruksen shRNA pinnit saastuneilla syöpäsolun linjat. Geenit, jotka osoittavat alhaisen shRNA pisteet infektoituneissa solulinjoissa oletetaan olevan tärkeitä syöpäsolun selviytymisen ja voi edustaa otaksutun syöpä kuljettajia. ShRNA pisteet ovat voimassa vain silloin, kun useita shRNA pinnit johdonmukaisesti osoittaa syöpäsolun esto (kutsutaan ”suuri korrelaatio”). Achilles tietokanta tiedustellessa kanssa 73 geenit ja ne geenien ”suuri korrelaatio” shRNA aktiivisuus tunnistettiin, ja niiden shRNA tulokset laskettiin poikki useita satoja syövän solulinjoissa (kuvio. S3). Useita geenejä oli negatiivinen shRNA tulokset lähes kaikkialla syöpäsolun linjat ja olivat oletettavasti kriittinen syöpäsolujen selviytymistä /lisääntymiseen. Nämä geeni sisältyi

KRAS

,

PRKAB2

,

GRB7

,

BRD4

,

PRPF6

,

BCL9

PPFIA1

ja

NOTCH2

. Muut geenit osoittivat negatiivista shRNA arvosanat osajoukko syöpäsolun linjat, kuten

CCND1

,

NDUFC2

,

YEATS4

,

GTPBP4

, ja

CHD1L

(Fig. S3). Näissä tapauksissa lisävalidointia siRNA tai shRNA on tarkistettava esto syöpäsolujen lisääntymistä tai selviytymistä.

73 syöpä monistettujen geenien mukana useita reseptorityrosiinikinaaseissa GTPaaseja, adapterit ja signalointi geenien MAP kinaasireittiä.

Vastaa