PLoS ONE: tunnistaminen Druggable Cancer Kuljettajan Genes Amplified poikki TCGA Datasets
tiivistelmä
Cancer Genome Atlas (TCGA) hankkeet ovat edistäneet ymmärrystämme kuljettajan mutaatioita, geneettiset taustat ja keskeiset polut aktivoituvat poikki syöpätyyppeihin. Analyysi TCGA aineistojen ovat enimmäkseen keskittynyt somaattisten mutaatioiden ja toiselle siirtäminen, vähemmän painotetaan geenin monistuksissa. Tässä kuvaamme bioinformatiikan seulontastrategia tunnistaa otaksuttu syöpää kuljettaja geenit monistetaan poikki TCGA aineistoja. Suoritimme GISTIC2 analyysi TCGA aineistojen ulottuen 14 syöpä alatyyppejä ja tunnistaa 461 geenejä, jotka monistettiin kahdessa tai useammassa aineistoja. Luetteloa rajattiin 73 syöpään liittyvien geenien kanssa mahdollisten ”druggable” ominaisuuksia. Suurin osa geenien lokalisoitu 14 amplikoneja eri puolilla genomiin. Tunnistaa mahdolliset syöpää kuljettaja geenit kartoitettiin geenikopiomäärä ja mRNA: n ilmentymisen dataa yksittäisen potilaan näytteitä ja tunnistettu 40 otaksuttu syöpä kuljettaja geenit liittyvät erilaisiin onkogeenisia prosesseihin. Kasvaimia synnyttävän aktiivisuuden edelleen vahvistanut siRNA /shRNA Knockdown ja viittaamalla Project Achilles aineistot. Monistettujen geenien edustivat useita geeniperheisiin kuten epigeneettiset sääntelyviranomaiset, solusyklin liittyvien geenien, DNA-vaurion vaste /korjaus geenit, metabolinen sääntelyviranomaisten, ja geenit liittyvät Wnt, Notch, Hedgehog, JAK /STAT, NF-KB ja MAPK signalointireittejä. Niistä 40 otaksuttu kuljettaja geenit tunnettiin kuljettaja geenejä, kuten
EGFR
,
ErbB2
ja
PIK3CA
. Villityypin
KRAS
monistettiin useissa syöpätyypeissä, ja
KRAS
-amplified syöpä solulinjoja herkin
KRAS
shRNA, mikä viittaa siihen, että
KRAS
vahvistus oli itsenäinen onkogeenistä tapahtuma. Useita MAP-kinaasin adapterit co-monistettiin niiden reseptorityrosiinikinaasit, kuten FGFR sovittimen
FRS2
ja EGFR-perheen sovittimen
GRB7
. Ubikitiinipromoottori kaltainen ligaasi
DCUN1D1
ja histoni metyylitransferaasi
NSD3
todettiin myös uusia otaksuttu syövän kuljettajan geenejä. Käsittelemme potilas räätälöintiä vaikutuksia nykyisten syöpälääkkeen tavoitteita ja olemme edelleen keskustella mahdollisista uusia mahdollisuuksia lääkeaineiden ponnisteluja.
Citation: Chen Y, McGee J, Chen X, Doman TN, Gong X, Zhang Y, et al. (2014) tunnistaminen Druggable Cancer Kuljettajan Genes Amplified poikki TCGA Datasets. PLoS ONE 9 (5): e98293. doi: 10,1371 /journal.pone.0098293
Editor: Masaru Katoh, National Cancer Center, Japani
vastaanotettu: 06 maaliskuu 2014; Hyväksytty: 30 huhtikuu 2014; Julkaistu: toukokuu 29, 2014
Copyright: © 2014 Chen et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä tutkimus rahoittivat Eli Lilly and Company. Rahoittaja antoi tukea muodossa palkoista kaikille tekijöille, mutta ei ollut mitään ylimääräistä roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen. Erityinen roolit nämä kirjoittajat ovat muotoutuneet tekijän maksujen osiossa.
Kilpailevat edut: Tämä tutkimus rahoitetaan kokonaan Eli Lilly and Company, työnantaja kaikkien tekijöille. Ei ole olemassa patentteja, tuotteiden kehittämiseen tai kaupan tuotteiden julistaa. Tämä ei muuta tekijöiden noudattaminen kaikki PLoS ONE politiikan tietojen jakamiseen ja materiaaleja, yksityiskohtaisena online-oppaassa tekijöille.
Johdanto
Viimeaikaiset edistysaskeleet DNA sekvensointi teknologia on mahdollistanut sekvensoinnin koko syövän genomien ja tunnistaminen yleisesti mutatoidun, monistettiin, ja poistetut geenit koko syöpätyyppeihin. Cancer Genome Atlas (TCGA) vaivaa perustettiin järjestyksessä ja analysoida useita tuhansia yksittäisiä syöpiä, jolloin tilannekuvan tautikohtaisia geneettiset taustat ja syövän kuljettajien [1] – [6]. Integroitu analyysi TCGA aineistojen tunnistettu 127 merkitsevästi mutatoitunut syöpään liittyvien geenien edustavat erillisiä biologisia polkuja ja soluprosessien [6]. Keskimäärin kuljettajan mutaatioiden kohti kasvain näyte oli kaksi-kuusi, mikä viittaa siihen, että pieni määrä mutatoituja kuljettajan geenit voivat aiheuttaa syövän synnyn [6]. Vuonna rintasyöpiä, vain kolme geeniä (
GATA3
,
PIK3CA
, ja
TP53
) havaittiin mutatoitu 10% ilmaantuvuus kaikissa potilaan kasvaimia. Tarkempi analyysi paljasti reittiin geneettisen kuljettaja mutaatioiden rintasyövän alatyyppejä, kuten
BRCA1 /2
muutoksia ja
PIK3CA
muutoksia perus-kuvaus ja luminaaliselle rintasyöpiä, vastaavasti [4]. Peräsuolen syöpiä, kaksikymmentäneljä geenejä yleisesti mutatoitunut ja useimmat geenit kartoitettiin Wnt, TGF-b, PI3K p53 ja RAS signalointireitteihin [3]. Vuonna keuhkosyövässä, yksitoista geenit olivat yleisesti muuntunut, kuten
TP53
, oksidatiivisen stressin muuniresponssigeeneinä ja suomuinen erilaistumista geenit [1]. Nämä tutkimukset ovat valottaa osaksi suurta geneettistä kuljettajien syövän alatyyppejä ja ovat myös tunnistettu mahdollisesti druggable väyliä yhteys näihin alatyyppejä. Edistysaskeleista nopeuttaa lääkekehityksen tarjoamalla uusia potilaan räätälöintiä strategioita reittiin erityisiä estäjät. Kuitenkin TCGA tutkimukset ovat enimmäkseen keskittyneet mutaatioita ja harvinaisia toiselle siirtäminen, vähemmän huomiota saatetaan geeni monistuksia syövissä. Koska geenin monistaminen on tärkeä mekanismi, syövän, pyrimme louhia TCGA aineistoja tunnistaa uusia kohteita ja ohjaimet monistettiin yli syöpätyyppeihin.
Geenin monistuminen syöpäsoluissa tarjoaa keinon yliekspressio syövän edistämiseen kuljettajan geenejä , kuten
EGFR
ja
ErbB2
kromosomeissa 7 ja 17, tässä järjestyksessä. Geenimonistus tapahtuu somaattisesti rajoitettuun alueen syövän genomin eri mekanismien kautta, kuten rikkoutuminen-fuusio-sillat sykliä [7]. Nämä monistetut alueet, jotka tunnetaan amplikoneja, voi ulottua kiloemästä kymmeniä megabases ja voi sisältää useita onkogeenisten geenien sekä matkustajien geenit monistettiin alueilla [8]. Pituus amplikonien voi vaihdella huomattavasti, joka perustuu genomisen lokuksen ja syövän tyyppi. Esimerkiksi yksittäinen geenimonistuminen
KIT
kromosomissa 4 voi esiintyä kiveskasvaimia [9], mutta suurempi amplikoneihin sisältää
KIT
,
PDGFRA
, ja
KDR
monistuvat glioblastoma [10]. Koska amplikonit sisältävät usein monia geenejä, mukaan lukien henkilöautot geenit eivät liity onkogeneesiin, on usein vaikeaa tunnistaa syövän kuljettajan geeni (t), joka vastaa vahvistusta. Strategiat tunnistamaan syövän geenien ajo amplikoni sisältää kartoitus minimaalinen alueen vahvistus (MRA) monilla kasvainnäytteet, tunnistaa positiivinen korrelaatio kopiomäärä ja mRNA geenien ilmentymistä, ja kokeellinen validointi siRNA /shRNA knockdown soluissa. Tällaiset analyysit ovat tähän mennessä tunnistettu monistettujen geenien kanssa osoitti rooli syövän synnyssä [7]. Kuitenkin useimmat analyysit tähän mennessä ovat luottaneet pieniä näytteitä koot, jotka johtavat suuria MRA ja mahdollisia vääriä positiivisia geenejä. TCGA aineistot tarjoavat ainutlaatuisen kokoelman kasvainnäytteestä suuret otoskokoihin tunnistaa monistettiin syöpää kuljettaja geenien erillisiä syöpätyyppeihin.
Ohessa kuvataan bioinformatiikan seulontastrategia selville mahdolliset druggable syöpä kuljettaja geenit monistetaan poikki TCGA aineistoja. Käytimme GISTIC2 analyysi TCGA aineistot (cBio portaali) ja tunnistettiin 461 geeniä, jotka olivat tilastollisesti monistettiin kahdessa tai useammassa TCGA aineistot käsittävät 14 syöpätyyppeihin. Geenejä otaksuttu tai todennettujen roolista syövässä tunnistettiin käyttämällä Cancer geenejä cBio tietokantaan. Me annetaan druggability pisteet kullekin geeniä integroimalla dataa neljä ulkoista druggability indeksit. Vuodesta 461 geenit, tunnistimme 73 mahdollisesti druggable monistettujen geenien, joilla on tunnettu tai otaksuttu rooli syövän synnyssä. Sitten käytimme korrelaatioanalyysiä kopio numero ja mRNA: n ilmentymisen dataa useita tuhansia TCGA potilaan näytteitä tunnistaa mahdolliset syöpää kuljettaja geenien keskuudessa luettelo. Tämä johti tunnistamiseen 40 otaksuttu syövän kuljettaja geenit liittyvät erilaisiin onkogeeniset prosesseihin, kuten epigeneettiset sääntelyviranomaiset, solusyklin liittyvien geenien, DNA-vaurion vaste /korjaus geenit, metabolinen sääntelyviranomaisten, ja geenit liittyvät Wnt, Notch, Hedgehog, JAK /STAT, NF-KB ja MAPK signalointireitteihin. N oletettu syöpä kuljettajan toimintaa entisestään vahvistanut päästä shRNA hiusneula toimintaa syöpäsolulinjoissa käyttämällä Project Achilles tietokantaan [11]. Ylimääräisen suoritettiin osajoukko geenien käyttäen siRNA /shRNA pudotus syöpäsolulinjoissa, joka sisältää geenin monistuminen etua. Niistä 40 otaksuttu kuljettaja geenit tunnettiin kuljettaja geenejä, kuten
EGFR
ja
ErbB2
sekä uusia tavoitteita, kuten
DCUN1D1
ja
NSD3
.
KRAS
, merkittävä syövän kuljettaja, joiden tiedetään aktivoivan mutaatio syövän [12], havaittiin monistuvan osajoukko munasarja-, maha-, keuhko-, ja kohdun syöpiä. Käsittelemme vaikutukset lääkekehityksen ponnisteluja ja tunnistamme uudet potilas räätälöintiä strategioita olemassa olevien terapeuttisten tavoitteiden.
Materiaalit ja menetelmät
bioinformatiikan analyysi
TCGA aineistoja 14 syöpään alatyypeistä olivat analysoitiin geenin monistamisen käyttäen GISTIC2 algoritmin cBio portaalissa (https://www.cbioportal.org). 14 syöpä alalajit sisältävät BLCA – Virtsarakon urothelial Karsinooma, BRCA – Breast invasiivinen karsinooma, CRC – peräsuolen syövän (COAD ja LUE tutkimukset yhdistetään), GBM – glioblastooma, HNSC – Pään ja kaulan okasolusyöpä, KIRC – Munuainen munuaisten kirkas cell syöpä, LGG – Brain Lower asteisen gliooman, LUAD – Lung adenokarsinooma, LUSC – Lung okasolusyöpä, OV – Munasarjojen vakavien kystadenokarsinooma, PRAD – Eturauhasen adenokarsinooma, SKCM – Skin ihomelanooman, STAD – Vatsa adenokarsinooma, ja UCEC – kohdun Corpus endomet- syöpä . Geenit, jotka monistettiin kahdessa tai useammassa TCGA tutkimuksia yhdistettiin yhdessä tehdä lista 461 geenejä. Taso 3 SNP6 ja RNAseq version 2 tietoja haettiin TCGA verkkosivuilla, ja taso 3 SNP6 tietoja edelleen kuvata geenin tasolla käyttäen R paketti CNTools. Pearsonin korrelaatiokertoimet geenikopiomäärä (SNP6) versus geenien ilmentyminen (RNASeq) laskettiin kiinnostavia geenejä käyttämällä toimintoa cor () R. Tietojen analysointi koodin R ja gawk voidaan toimittaa pyynnöstä. Kukin geeni osoitettiin druggability pisteet tietojen perusteella ulkoisesta tietokannoista Ensembl, Interpro-Blast, BioLT-drugbank ja Qiagen Druggability lista. Kunkin tietokannan geeni sai 0-4 druggability pisteet, jossa 0 on undruggable ja 4 olevan vakiintunut lääke kohde. Geeni, jossa ”1” druggability pisteet tahansa neljästä tietokantojen pidettiin ”potentiaalisesti druggable” ja sisällytetty lopulliseen geenin luettelosta. Geeni lista myös ladataan Cancer Geenit tietokanta (cBio portaali) ja geenit liittyvät onkogeneesiin sisällytettiin lopulliseen geenin luettelosta.
Project Achilles
Project Achilles tietokanta koostuu shRNA ehtyminen pisteiden yhdistetyssä genomisesta kirjastosta testattiin yli paneeli syöpäsolulinjojen [11]. Olemme kehittäneet menetelmän pisteet geeni riippuvuuden kussakin solulinjassa painottamalla kutakin hiusneula mukaan yhdenmukaisuus muiden hiusneuloja suunniteltu vastaan samaa geeniä, samalla tavalla kuin on kuvattu Shao et. al [13]. Me perusteltu, että jos tuumorisolulinjoissa vaihteli riippuvuutta tietyn kuljettajan geeni, sitten hiusneuloja tehokkaasti suuntaamalla geeni pitäisi antaa samanlaiset shRNA ehtyminen tulokset epäitsenäisissä linjat. Laskimme pairwise korrelaatioita ehtymisen tulokset elementin poikkisuunnassa kaikkien hiusneuloja ryhmästä shRNA konstruktien suunniteltu kohdistamaan tietyn geenin. Sitten jokainen shRNA oli painotettu useissa muissa shRNAs geenistä asettaa, että korreloivat voimakkaasti sitä (Spearman korrelaatiokerroin on suurempi kuin 0,35, joiden p-arvo 0,01). Geeni-tason komposiitti pisteet (shRNA pisteet) saatiin sitten painotettu summattu shRNA ehtyminen tulokset. Nämä geeni riippuvuus profiileja käytettiin laskettaessa todennäköisyys suhde pistemäärät assosiaatiosta geenimutaatio tai kopioida numeron shRNA herkkyys vertaamalla geenimutaatio malli ”nolla malli” (ilman geenimutaatio).
Cells
Solut saatiin American Type Culture Collection (ATCC) ja niitä kasvatettiin Dulbeccon muokatussa Eaglen elatusaineessa (DMEM), johon oli lisätty 10% naudan sikiön seerumia. Amplified ja vahvistamattoman solulinjat valitaan kullekin syöpää monistettu geeni. Jokaista syöpä monistettu geeni, käytetyt solulinjat validointitutkimuksia ja niiden vastaavan geenin kopio luvut ovat seuraavat: (1)
NSD3
: H1581 (7 kappaletta), H1703 (6 kappaletta), SW48 (5 kappaletta ), SW837 (ei-monistettu); (2)
DCUN1D1
: KYSE (6 kappaletta), T47D (4 kopiota), SW48 (vahvistamattoman), HCT15 (vahvistamattoman). Kopioi numero arvot saatiin julkaistuista CCLE aineistot [14].
Gene pudotus
geenin pudotus geenejä, käytimme shRNA lentiviraalinen transduktiopartikkeleilla Sigma (Mission, SHCLNV).
DCUN1D1
shRNA konstruktit olivat TRCN0000133666, TRCN0000134440, TRCN0000134715, TRCN0000136858, ja TRCN0000137482. Sillä
NSD3
Knockdown tutkimuksissa käytimme On-Targetplus SMARTpool siRNA kohdistaminen ihmisen Nsd3 (Thermo Scientific). Solut infektoitiin lentiviruksen shRNA hiukkasia infektiokertoimella (MOI) vaihtelevat 5-10, kun läsnä on 10 ug /ml polybreeniä. siRNA /shRNA kokeet suoritettiin vakiintuneiden protokollien [15].
Cell perustuvissa määrityksissä
Vasta-aineita käytetään western blot-analyysi ovat kanin anti-DCUN1D1 (Sigma, HPA035911), kanin anti- WHSC1L1 (Proteintech, 11345-1-AP). Western blot suoritettiin tavanomaisten käytäntöjen mukaisesti. Solujen lisääntyminen ja apoptoosin määritykset suoritettiin Cell Titer Glo ja kaspaasi Glo määritykset (Promega) valmistajan ohjeiden mukaisesti. Solusyklianalyysiä suoritettiin propidiumjodidivärjäys syöpäsolun riviä käyttäen tavanomaisia protokollia [15].
Tulokset
tunnistaminen geenin monistuksia TCGA aineistot
TCGA aineistot käsittävät 14 syöpätyyppeihin analysoitiin GISTIC2 algoritmilla (cBio portaali) tunnistaa geeni monistuksia potilaalla kasvain näytteissä. Geenit pisteytettiin tilastollisen todennäköisyyden monistamisen, ja niitä geenit osoittavat vahvistus kahdella tai useammalla aineistot tunnistettiin (kuvio 1). Kaikkiaan 461 geenejä tunnistettiin potentiaalisesti monistettujen geenien (taulukko S1). Joissakin tapauksissa, useiden geenien (esim.,
CD274
ja
NDUFC2
) monistettiin kahdessa tai useammassa aineistoja, jotka ovat peräisin yhdestä syövän alatyypin (kuvio 1, taulukko S1). Geeni lista edelleen kaventunut tunnistamalla osajoukko geenien vakiintuneiden tai otaksuttu rooli oncogenesis sekä geenit, jotka olivat mahdollisesti druggable. Ensimmäinen geeni luettelo oli rajat viitataan kanssa Cancer Genes tietokannan (cBio portaali), joka osoitti, että vähemmän kuin 25% 461 geenien liittyy kasvaimen synnyssä. Seuraavaksi geenit osoitettu druggability pisteet perustuu druggability indeksit neljästä ulkoisten tietokantojen (Ensembl, Interpro-Blast, BioLT-drugbank ja Qiagen Druggability lista). Kunkin tietokannan geeni sai 0-4 druggability pisteet, jossa 0 on undruggable ja 4 olevan vakiintunut lääke kohde. Geeni, jossa ”1” druggability pisteet tahansa neljästä tietokantojen pidettiin ”potentiaalisesti druggable” ja sisällytetty lopulliseen geenin luettelosta. Analyysin yhteensä 73 mahdollisesti druggable syöpä monistettujen geenien havaittiin poikki TCGA aineistot (kuva 1).
TCGA aineistoja louhitaan geenimonistusmääritystä (GISTIC2 analyysi, cBio portaali) ja 461 geeniä tiomonistukset tunnistettiin . Luetteloa rajattiin 73 geenejä syöpään liittyvien geenien, jotka olivat mahdollisesti ”druggable” perustuen ulkopuoliseen druggability tietokantoihin. Vuodesta 73 geenit, 40 oletetun syövän kuljettajan geenejä tunnistettiin perustuen kopioluku versus mRNA: n ilmentymisen analyysi TCGA tietoja.
73 syöpä monistetut geenit sijaitsevat eri puolilla genomin ja suurin osa geenien ryhmitelty taudin loci (kuva 2). Niistä 73 geenit, 57 geenejä ryhmitelty 14 loci poikki genomin ja loput 18 geenit olivat polttovälin monistuksissa. Ryppään sisällä, geenit oli taipumus monistaa vastaavia syöpätyypeissä. Esimerkiksi kromosomissa 20q klusteri, joka käsittää neljä geeneistä (
PTK6
,
SRM
,
RTEL1
, ja
PRPF6
) olivat kaikki monistettu kohdun /kohdun limakalvon syöpiä ja keuhkojen adenokarsinooman. Kromosomi 1q klusteri sisälsi 12 geenejä, kuten
SETDB1
,
BCL9
,
PIAS3
, ja
MCL1
, ja 11 12 geenejä monistettiin keuhkojen levyepiteelikarsinooma syövät ja virtsarakon syöpien (kuva 2). Hyvin tutkittu klusteri kromosomissa 4q sisältää
PDGFRA
,
KIT
, ja
KDR
monistettiin gliooman ja ihosyövän [10]. Koska tiukkuus käytetään Gistic2 analyysissa todennäköisesti aliarvioi syöpätyyppejä, joissa geenien monistuminen tapahtunut. Siksi on todennäköistä, että 73 syöpä geenit tunnistimme monistettiin ylimääräisiä syöpätyypeissä ole edustettuna tässä (kuva 2).
Alkuperäisestä luettelosta 461 geenien monistetaan yhdessä tai useammassa TCGA aineistoja, 73 monistaa geenejä tunnistettu mahdollisesti ”druggable” ominaisuuksista sekä vakiintunut /otaksuttu roolit oncogenesis. Geenit /amplikonista järjestää kromosomaalisen sijainnin, niiden genomisen sijainti merkinnät ovat (Mb = miljoonan emäksen). Värilliset laatikot osoittavat syöpätyyppeihin kanssa TCGA nimityksiä, seuraavasti: BLCA – Virtsarakon urothelial Karsinooma, BRCA – Breast invasiivinen karsinooma, CRC – peräsuolen syövän (COAD ja LUE tutkimukset yhdistetään), GBM – glioblastooma, HNSC – Pään ja kaulan okasolusyöpä , KIRC – Munuainen munuaisten kirkas cell carcinoma, LGG – Brain Lower asteisen gliooman, LUAD – Lung adenokarsinooma, LUSC – Lung okasolusyöpä, OV – Munasarjojen vakavien kystadenokarsinooma, PRAD – Eturauhasen adenokarsinooma, SKCM – Skin ihomelanooman, STAD – Vatsa adenokarsinooma, UCEC – Kohdun Corpus endomet- karsinooma.
Niistä 73 syöpä monistettujen geenien olivat useita vakiintuneita lääkekohteita, kuten
EGFR
,
ErbB2
ja
KIT
(kuvio 2).
ErbB2
kromosomissa 17 monistettiin 5 syöpätyyppeihin ja oli mukana monistetaan MAP-kinaasin sovitin
GRB7
ja
PPP1R1B
.
EGFR
kromosomissa 7 monistettiin yhtenä geeni 7 syöpätyyppejä, validointi tärkeyttä tämän lääkkeen tavoite syöpään [16]. Lista myös useita tavoitteita parhaillaan kliinisessä kehityksessä koko alalla, kuten
CDK6
,
PIK3CA
,
PIK3C2B
ja
NOTCH2
.
CDK6
kromosomissa 7q monistettiin yhtenä geeni keuhkojen levyepiteelikarsinooma syöpä ja glioblastooma, kun taas
PIK3CA
oleskellut kromosomissa 3q klusterin 6 muiden geenien ja monistettiin useita syövän tyypit (kuva 2) [17]. Useat aiemmin validoitu syöpä monistettujen geenien, kuten
FAK Twitter /
PTK2
, ei ollut määritelty analyysissä, mikä johtuu osittain korkean ankaruuden, joka oli sovellettu bioinformatiikan analyysi vähentämään vääriä positiivisia osumia [18].
tunnistaminen monistettujen syövän geenien kanssa otaksuttu syövän kuljettajan toimintaan
koska osa geenien tunnistettu syöpää monistettujen geenien voi olla matkustaja geenien amplikoneista, me edelleen analysoineet geeniperimä tunnistaa otaksuttu syöpää kuljettajan geenejä. Tämä tehtiin laskemalla Pearsonin korrelaatiokerroin kopiomäärä ja mRNA: n ilmentymisen arvon TCGA potilaan kasvain tiedot. Korrelaatiokertoimet laskettiin kullekin 14 syöpätyyppien ja keskimääräinen korrelaatiot kaikkien syöpätyyppien laskettiin (kuviot 3-4). Analyysi paljasti laajan valikoiman kopioluvun verrattuna mRNA: n ilmentymisen korrelaatiot geenit. Otaksuttu syöpä kuljettaja geenien odotetaan osoittavan suuren kopiomäärän verrattuna mRNA ilmaisun korrelaatio. Validoitu syöpä kuljettajat kuten
ERRBB2
,
EGFR
, ja
KRAS
osoitti suuren kopiomäärän verrattuna mRNA: n ilmentymisen korrelaatio vastaavaan syöpätyypeissä ne säätelevät (
erbB2
r = 0,9 rintasyövässä,
EGFR
r = 0,8 keuhkojen adenokarsinooma,
KRAS
r = 0,9 munasarjasyöpä) (Kuva 3-4).
Pearsonin korrelaatiokertoimet laskettiin analysoimalla geenikopiomäärä ja mRNA ilmentyminen potilaan johdettujen näytteiden TCGA aineistoja. Siinä on esitetty korrelaatiokertoimet kunkin TCGA syövän alatyypin ja keskimääräinen korrelaatio kaikkien syöpätyyppien (punainen tarkoittaa korkea korrelaatio, sininen tarkoittaa alhainen korrelaatio). Lyhenteet TCGA aineistot on lueteltu kuviossa 1.
Pearsonin korrelaatiokertoimet laskettiin analysoimalla geenikopiomäärä ja mRNA ilmentyminen potilaan johdettujen näytteiden TCGA aineistoja. Siinä on esitetty korrelaatiokertoimet kunkin TCGA syövän alatyypin ja keskimääräinen korrelaatio kaikkien syöpätyyppien (punainen tarkoittaa korkea korrelaatio, sininen tarkoittaa alhainen korrelaatio). Lyhenteet TCGA aineistot on lueteltu kuviossa 1.
kopioluku versus ilmaisun analyysi paljasti mahdollisen kuljettajan geenejä, jotka monistettiin geeni klustereita. Esimerkiksi kromosomi 1q klusterin 12 monistettujen geenien sisälsi 4-geenien kopioluku vs. ilmaisun korrelaatio on suurempi kuin 0,5 (
SETDB1
,
ARNT
,
APH1A
, ja
CHD1L
), viittaa siihen, että nämä voivat olla kuljettajan geenejä amplikonin (kuvio 3). Niistä 12 geenit,
SETDB1
osoittivat korkeimmat korrelaatio, yhdenmukaisia viimeaikaisten raporttien että
SETDB1
on syöpä monistetun geenin kanssa osoitti kuljettajan toimintaa [19], [20]. Kolme muuta geenit saattavat myös olla potentiaalisesti merkittävä rooli syövän synnyssä –
APH1A
on gammasekretaasia monimutkainen alayksikön Notch koulutusjakson,
ARNT
on alayksikkö on HIF1 monimutkainen, ja
CHD1L
on DNA helikaasin että DNA-vaurioita vastaus koulutusjakso [21]. Neljä geenien amplikonin näkyy kopiomäärä verrattuna ilmentymisen korrelaatio alle 0,3 (
PDE4DIP
,
S100A11
,
S100A9
, ja
S100A8
) (Kuva 3). Kromosomissa 3 klusterin 7 geenien sisälsi 2-geenien kopiomäärä verrattuna ilmentymisen korrelaatio on suurempi kuin 0,5 (
DCUN1D1
ja
PRKCI
) ja 4 geenien kopiomäärä verrattuna ilmaisun alle 0,3 (
kiksi tert
,
SKIL
,
GNB4
, ja
Sox2
).
PRKCI
on seriini /treoniini-kinaasi, että NF-KB-reitin ja edellinen kudosten microarray data validoitu tämän geenin mahdollisena uusi syöpää kuljettajan geeni [22].
DCUN1D1
on E3 ubikitiinipromoottori ligaasilla monimutkainen alayksikköä mahdollisten syöpää kuljettajan toimintaa, jota edelleen validoitu shRNA taintumisen (alla). Vaikka
PIK3CA
näkyy yleinen korrelaatiokerroin 0,4, se näkyy suuri korrelaatio rintasyövässä (r = 0,9), pään ja niskan levy- syöpä (r = 0,8), ja kohdun /kohdun limakalvon syöpiä (r = 0,7) ( kuva 3).
kromosomi 11q klusteri sisälsi 5 geenejä, kuten
CCND1
, vakiintunut solukierron säädin ja onkogeenisten kuljettaja. Vaikka
CCND1
näkyy suuren kopiomäärän vs. ilmaisun korrelaatiot maksasyövän (r = 1,0), virtsarakon syöpä (r = 0,8), keuhkosyöpä levyepiteelikarsinooma syöpä (r = 0,7), pään ja kaulan caner (r = 0,7) ja rintasyöpä (r = 0,7), korrelaatiot heikompi muissa syöpätyypeissä, mikä viittaa siihen, että
CCND1
vahvistus on taudin aiheuttaman onkogeenisiä kuljettaja (kuva 3). Kaksi muuta geenien amplikonin,
FADD
, ja
PPFIA1
, näytetään korkeampi yleinen korrelaatio poikki syöpätyyppejä, syytetään nämä geenit mahdollisina uusia syövän ajurit lisätutkimuksia.
FADD
, apoptoottinen effektorimolekyylin, aiemmin tunnistettu uusi syöpää kuljettaja geenin paneeli 167 kurkunpään /nielun syöpiä, jotka oikeuttavat lisätutkimisesta sen mekanismi syövän synnyn [23]. On tärkeää huomata, että korrelaatio mRNA: n ekspression kopioida numero ei ole välttämätöntä periaatteessa geenin olla syöpää kuljettajan geeni. Siksi geenejä, joilla on alhainen mRNA ilmaisun versus kopiomäärä korrelaatio ei välttämättä matkustaja geenejä. Esimerkiksi kromosomiin 1q klusterin sisälsi
MCL1
, geeni, jolla on syöpä kuljettajan allekirjoitus perustuu Project Achilles (tuloksia ei ole esitetty), mutta keskimääräinen mRNA: n ilmentymisen verrattuna kopioluvun korrelaatio 0,31.
tunnistamiseksi monistettiin syövän geenien kanssa korkeimmat syövän kuljettajan toimintaan, me sijoittui geenien järjestyksessä eniten kopioluvun versus mRNA: n ilmentymisen korrelaatio kaikilla syöpätyyppeihin. Havaitsimme 40 geenien kanssa yleisen r on yli 0,3 (taulukko 1). R = 0,3 sulku oli käytetty, koska useat geenit osoittivat korkea r pieni määrä syöpätyyppeihin. Esimerkiksi
FGFR3
näytetään r 0,7 neljässä syöpiä (virtsarakon syöpä, glioblastooma, keuhkosyöpä suomuinen, ja melanooma), mutta r 0,5 muissa syövissä. Vastaavasti
CDK6
osoittanut r 0,7 vain 4 syöpiä (glioblastooma, pään ja kaulan alueen syöpä, keuhkojen adenokarsinooma, ja keuhkojen levyepiteelikarsinooma syöpä), kun taas
IGF1 R
oli r 0,7 vain yhdessä syövän ( rintasyöpä) (Kuva 3-4). Niistä 40 geenit korkein syöpä kuljettajan toimintaan, kaksi ylintä pisimmälle paremmuusjärjestykseen geenit olivat
NSD3 Twitter /
WHSC1L1
ja
SETDB1
, kaksi tärkeää histoni metyylitransferaasit (taulukko 1) . Vaikka
SETDB1
äskettäin perustettu bona fide monistettu syöpä kuljettajaa melanooman ja keuhkosyövän [19], [20], rooli
NSD3 Twitter /
WHSC1L1
on ei ole määritelty, ja niin me edelleen validoitu sen onkogeeninen rooli in vitro (alla). Kaksi muuta chromatin valvojat, kromatiinin lukija Brd4 ja histoni liasetyylitransferaasi
YEATS4
, olivat myös hyvin rankattu otaksuttu syövän kuljettajan geenejä. Muita geeniperheistä jotka olivat edustettuina luetteloon kuuluu Notch-reitin geenit (
NOTCH2
,
APH1A
), metabolinen säätelygeenit (
NDUFC2
,
PRKAB2
), Hedgehog-reitin geenit (
DCUN1D1
), Wnt-reitin geenit (
BCL9
), NF-KB-reitin geenit (
ERC1
,
PRKCI
,
IKBKB
), JAK /STAT-reitin geenit (
PIAS3
), MAPK signalointi effektorit (
KRAS
,
FRS2
,
GRB7
), reseptorityrosiinikinaaseilla (
FGFR3
,
EGFR
,
ErbB2
,
IGF1 R
), DNA-vaurion vaste /korjaavien geenien (
RAD51AP1
,
RTEL1
,
ERCC5
,
RAD52
,
CHD1L
), p53 liittyvien geenien (
MDM2
MDM4
,
GTPBP4
), ja solusyklin säätelygeenit (
CCNE1
,
TPX2
,
CCND3
,
CDK6
) (taulukko 1).
kopioluku vaihtelee syövän monistettujen geenien analysoitiin yksittäisten TCGA potilaan kasvaimia laajuuden määrittämiseksi geenin monistamisen (kuvio. S1, S2) . Jotkut geenit näkyvät korkean tason vahvistus vastaa 10-20 geeniä kappaletta, kun taas muiden geenien näkyvissä alhainen 3-8 kopiomäärä monistuksissa. Kromosomi 1Q amplikoni, joka sisälsi
PRKAB2
,
APH1A
,
ARNT
, ja
SETDB1
osoitti alhainen vahvistusta (3-10 kappaletta) , kun taas kromosomi 12q amplikonin, joka sisälsi
MDM2
,
YEATS4
, ja
FRS2
, osoitti korkea vahvistus (10-20 kappaletta) (Fig. S1, S2 ). Muita geenejä korkean tason monistuksissa sisältävät
PRKAB2
(6-10 kappaletta munasarjasyöpä),
MDM4
(10-30 kappaletta glioblastoma),
MDM2
(10- 15 kappaletta keuhkoadenokarsinooma),
PIK3CA
(5-20 kappaletta keuhkojen levyepiteelikarsinooma syöpä),
DCUN1D1
(5-15 kappaletta keuhkojen levyepiteelikarsinooma syöpä),
FADD
ja
PPFIA1
(jokaisessa on 5-10 kappaletta pään ja kaulan alueen syöpä),
NDUFC2
(5-15 kappaletta munasarjasyöpä), ja
RAP1B
(5- 15 kappaletta keuhkoadenokarsinooma). MAP-kinaasi liittyy geenien osoitti myös korkean tason vahvistus, jossa reseptorityrosiinikinaaseilla
ErbB2
,
IGF1 R
, ja
EGFR
kaikki erittäin monistettu, odotetusti. MAP kinaasi adaptoriproteiineja
FRS2
ja
GRB7
myös erittäin monistettiin (10-20 kappaletta keuhkoadenokarsinooma ja rintasyöpä, vastaavasti). Cell lukiertosäätelijöistä, kuten
CCNE1
(10-20 kappaletta munasarjasyöpä), olivat myös erittäin monistettiin odotetusti. Lisäksi kopioida numerosarjat, taajuus geenivahvistus potilaan kasvaimissa laskettiin käyttäen kopiomäärä 4 kuin katkaisu vahvistusta (Fig. S4). Huomattava määrä geenejä monistettiin yli 30 prosenttia syöpäpotilailla, kuten
DCUN1D1
(43% keuhkojen levyepiteelikarsinooma syövät),
FADD
ja
PPFIA1
(~ 30% pään ja kaulan syövät), ja
PRKCI
(36% keuhkojen levyepiteelikarsinooma syövät) (Fig. S4). Kun vahvistus oli ensisijainen genomisen muutos näiden geenien useita geenejä myös suorittaa somaattisista mutaatioista, kuten
PIK3CA
,
KRAS
ja
NOTCH2
. Näissä tapauksissa liitetyt ja mutaatiot olivat suurelta osin toisensa poissulkevia (Fig. S4).
MAPK-reitin monistettujen geenien
73 syöpä monistettujen geenien analysoitiin edelleen shRNA validointi tarkistaa syövän kuljettajan toimintaa . Project Achilles on laajamittainen vaivaa kuvastoon geneettinen haavoittuvuuksia syöpäsolulinjoissa käyttämällä genominlaajuisten shRNA kirjasto geenien tunnistamiseen, jotka vaikuttavat syöpäsolun selviytymistä /lisääntymiseen [11]. Me louhitaan Akilleen tietokannasta, johon on 73 syöpää monistettujen geenien voi olla rooli syövän solujen selviytymistä /lisääntymiseen. Achilles kirjasto koostuu useista shRNA hiusneuloja ja laskimme komposiitti shRNA pisteet perustuvat vaikutukset useiden lentiviruksen shRNA pinnit saastuneilla syöpäsolun linjat. Geenit, jotka osoittavat alhaisen shRNA pisteet infektoituneissa solulinjoissa oletetaan olevan tärkeitä syöpäsolun selviytymisen ja voi edustaa otaksutun syöpä kuljettajia. ShRNA pisteet ovat voimassa vain silloin, kun useita shRNA pinnit johdonmukaisesti osoittaa syöpäsolun esto (kutsutaan ”suuri korrelaatio”). Achilles tietokanta tiedustellessa kanssa 73 geenit ja ne geenien ”suuri korrelaatio” shRNA aktiivisuus tunnistettiin, ja niiden shRNA tulokset laskettiin poikki useita satoja syövän solulinjoissa (kuvio. S3). Useita geenejä oli negatiivinen shRNA tulokset lähes kaikkialla syöpäsolun linjat ja olivat oletettavasti kriittinen syöpäsolujen selviytymistä /lisääntymiseen. Nämä geeni sisältyi
KRAS
,
PRKAB2
,
GRB7
,
BRD4
,
PRPF6
,
BCL9
PPFIA1
ja
NOTCH2
. Muut geenit osoittivat negatiivista shRNA arvosanat osajoukko syöpäsolun linjat, kuten
CCND1
,
NDUFC2
,
YEATS4
,
GTPBP4
, ja
CHD1L
(Fig. S3). Näissä tapauksissa lisävalidointia siRNA tai shRNA on tarkistettava esto syöpäsolujen lisääntymistä tai selviytymistä.
73 syöpä monistettujen geenien mukana useita reseptorityrosiinikinaaseissa GTPaaseja, adapterit ja signalointi geenien MAP kinaasireittiä.