PLoS ONE: Kopioi numero analyysi jakautuu Novel vuorovaikutukset Perimän Loci munasarjasyöpää Cancer

tiivistelmä

Munasarjasyöpä on heterogeeninen tauti näyttää koko genomin muutoksia, ja näin ollen se on ollut vaikea määritellä tärkeimmät kopiomäärä muutoksia asteikon tutkimusten tasalla. Saimme genominlaajuisten kopioluvun muutos (CNA) tiedot neljästä eri SNP array alustoja, joiden lopulliset tiedot joukko 398 munasarjakasvainten, enimmäkseen vakavien histologisten alatyyppi. Usein CNA poikkeavuuksia kohdennettua tuhansia geenejä. Kuitenkin korkean tason amplikonien ja homotsygoottisia deleetioita mahdollisti suodatusta tästä luettelosta merkityksellisimmät. Suuri tietokokonaisuutta käytössä tarkentaminen minimaalinen alueiden ja tunnistaminen harvinaisten amplikonien kuten at 1p34 ja 20q11. Suoritimme uusi co-esiintyminen analysoitaviksi yhteistyötä ja yksinoikeuden CNAs ja analysoidaan niiden suhdetta potilaiden hoitotuloksiin. Positiiviset yhdistykset tunnistettiin välillä voitot 19 ja 20q, voitto 20q ja menetys X, ja useiden alueiden menetyksen, erityisesti 17Q. Löysimme heikko korrelaatioita CNA at genomista loci kuten 19q12 kliinisten tutkimusten tulosten kanssa. Olemme myös arvioitiin genomin epästabiilisuuden toimenpiteitä ja löysi korrelaatio määrää suurempi amplitudi kasvu on huonompi kokonaiselossaolo. Kokoamalla suurin kokoelma munasarjojen kopioluvun dataa mennessä olemme pystyneet tunnistamaan yleisimmät poikkeavuuksien niiden vuorovaikutusta.

Citation: Gorringe KL, George J, Anglesio MS, Ramakrishna M, Etemadmoghadam D, Cowin P, et ai. (2010) Kopioi numero analyysi jakautuu Novel vuorovaikutukset Perimän Loci munasarjasyövässä. PLoS ONE 5 (9): e11408. doi: 10,1371 /journal.pone.0011408

Editor: I. Kuningas Jordan, Georgia Institute of Technology, Yhdysvallat

vastaanotettu: 11 helmikuu 2010; Hyväksytty: 16 huhtikuu 2010; Julkaistu 10 syyskuuta 2010

Copyright: © 2010 Gorringe et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat National Health ja Medical Research Council of Australia; Victorian Breast Cancer Research Consortium (VBCRC), Australia; ja Yhdysvaltain puolustusministeriön (DOD), Yhdysvallat. JG tukee Australian jatko palkinnon. MR tukee Syöpä neuvoston Victorian jatko Scholarship. Tämä tutkimus tuki myös Victorian Life Sciences Computation Initiative (VLSCI) avustus sen Peak tietokonekeskuksessa yliopistossa Melbourne ja Victorian Partnership for Advanced Computing (VPAC). Australian munasarjasyöpä Study (AOCS) tukivat Yhdysvaltain armeijan Medical Research ja Materiaalilaitoksen Esikunta alle DAMD17-01-1-0729, The Cancer neuvosto Victoria, Queensland Cancer Fund, The Cancer neuvosto New South Wales, The Cancer neuvosto South Australia, Syöpäsäätiön Länsi-Australian, The Cancer neuvosto Tasmania, ja National Health ja Medical Research Council of Australia (NHMRC). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

epiteelikasvaimet munasarjasyöpä (EOC) on yksi tappavimmista maligniteettien korkea toistuminen ja huonosta eloonjäämisasteesta [1]. Geneettinen poikkeavuuksia havaittu EOC ovat erittäin monimutkaisia, joka sisältää usein aneuploidiaa ja moninkertaistuvat jäsensi kromosomien [2], [3]. Heterogeenisuus kopioluvun muutokset (CNA) havaittiin EOC on vaikeuttanut pieniä tutkimuksia pystyä täsmällisesti todellisen taajuuden harvinaisempia CNAs tai toistettavasti tunnistaa CNAs joka korreloi kliinisten parametrien. Pieni otoskoko myös vaikea tunnistaa CNAs että yhteistyössä olemassa tai ovat toisensa poissulkevia, mikä on edellytys tunnistamaan yhteisiä väyliä, jotka voidaan vapautettiin EOC kautta muutoksiin geenikopiomäärä. Paradigman toisensa poissulkevia aberraatioita kohdistaminen samaa reittiä asetettiin Kolorektaalituumorien varten

APC

ja

CTNNB1

mutaatioita [4] ja laajennetaan muissa esimerkeissä kuten yksinoikeus

BRAF

ja

KRAS

mutaatiot [5]. Sitä vastoin muita geneettisiä poikkeamia ovat yleistyneet samalla kasvain kuin olisi ollut odotettavissa sattumalta, mikä viittaa osuuskunta vaikutus, esimerkiksi merkittävän yhdistyksen 11q13 ja 8p12 amplikonien rintasyövän [6]. Munasarjasyövän, yhdistyksiä on todettu välillä

CCNE1

ja 12p vahvistus [7], ja välillä

MYC

ja 20q vahvistus [8] fluoresenssilla

in situ

hybridisaatiolla. Harvat tutkimukset ovat tarkastelleet yhdessä operativity tai komplementaation CNA on genomin laajuisesti. Tappiot 4q ja 18q havaittiin liittyvän yhdessä tutkimuksessa [9], mutta tämä ei ollut toistettavissa hiljattain analyysi [10], joka tunnistaa 7 CNA yhdistysten ja 6 anti-korrelaatioita.

Läsnäolo high taso geeni monistuksia munasarjasyövän on havaittu jonkin aikaa, mutta useimmat tutkimukset ovat alitehoinen näytteen koko [10] tai genomista resoluutio [11], [12] pystyy havaitsemaan taajuus ja tavoite näistä tapahtumista. Samoin harvat vankka yhteenliittymät CNA kliiniseen parametreja kuten pelastusveneiden on tunnistettu [13], [14]. Havaitseminen Näiden CNA on merkitystä paitsi tunnistamisen kasvain alaryhmien ja vaikuttavia reittejä kasvaimissa, mutta myös kohdentaa molekyyli hoitomuotojen munasarjasyöpä. Tässä tutkimuksessa olemme kokosi yhteen suuren kohortin yhden emäksen monimuotoisuus (SNP) kartoitus array data voimakkaasti merkintöjä CNAs vuonna serous ja endomet- munasarjojen syöpien tunnistamiseksi geenien kohteena nämä geneettiset tapahtumat ja kuinka nämä korreloi kliinisten parametrien. Lisäksi olemme arvioineet vuorovaikutusta CNA arvioimalla niiden yhteenliittymien ja anti-yhdistysten.

Materiaalit ja menetelmät

Peter MacCallum Cancer Center (PMCC) tietokokonaisuus: kudosnäytteitä ja DNA: n eristämiseksi

kaikki näytteet kerättiin potilaan tietoisen suostumuksen ja hyväksyi tutkimuksen kaikkien osallistuvien sairaalan Human Research Ethics valiokunnat. Munasarjasyöpäpotilaalle tunnistettiin neljä primaarilähteistä vuosina 1992 ja 2006: a) 53 sairaaloihin Southampton, Iso-Britannia, b) 141 läpi Australian munasarjasyöpä Study, joista 20 alkaen Westmead gynekologinen Oncology Tissue Bank, c) 15 kautta PMCC Tissue Bank (Melbourne, Australia) ja d) 41 alkaen Jikei University (Tokio, Japani). Pathology tarkastus on suoritettu joko formaliinilla, parafiiniin kudoksen ja /tai tuore-jääleikkeille kudoksen läheisyyteen, josta DNA: ta uutettiin (n = 141) tai tutkiminen alkuperäinen diagnostisten patologian raportit (n = 109) (Taulukko 1 , taulukko S1).

Kaikki kudosnäytteet kerättiin tuore materiaali. Edustava hematoksyliinillä ja eosiinilla värjätystä leikkeestä arvioitiin ja näytteitä 80% epiteelisolujen käytettiin suoraan DNA uutetaan koko kudoksesta. Muilta, neulan tai laser leikkely suoritettiin käyttäen 10 um: n osia saada suuri osa kasvain epiteelisolujen komponentti. DNA uutettiin, kuten aiemmin on kuvattu [14], [15]. Normaali DNA uutetaan veren lymfosyyteistä oli käytettävissä 106 potilasta.

Cancer Genome Atlas (TCGA) tietokokonaisuus: kudosnäytteitä ja DNA: n eristämiseksi

Näytteet kerättiin tuore materiaalia sairaaloista USA (n = 163). Kasvaimen näytteet arvioitiin 80% epiteelisolujen ennen DNA uutetaan koko kudoksesta, kuten edellä [16]. Normaali DNA uutetaan veren lymfosyyteistä oli käytettävissä 161 potilasta. Tulokset julkaistaan ​​täällä ovat osittain perustuu tuottamien tietojen Cancer Genome Atlas pilottihanke perustettu NCI ja NHGRI. Tietoa TCGA ja tutkijat ja laitokset, jotka muodostavat TCGA tutkimusverkosto löytyy https://cancergenome.nih.gov.

Kopioi numero paneelit

Näytteet käsiteltiin kuten aiemmin on kuvattu Affymetrix Mapping paneelit a) n = 108 50 K

Xba

I [14], GSE 13813 b) n = 27 250 K

Sty

I paneelit c) n = 32 500 K paneelit (250 K

Sty

I ja 250 K

NSP

I, [17]) d) n = 83 SNP6.0 (1,8 M koetinsarjojen [15], [18], GSE19539). Kun käytettävissä, yhteensovitus normaali DNA analysoitiin myös samalla array alustan ja samassa erässä. TCGA SNP6.0 CEL-tiedostot 163 näytteet ladata Data Portal (https://tcga-data.nci.nih.gov/tcga/homepage.htm).

Data esikäsittely- ja analyysi

Kaikki SNP Mapping paneelit normalisoitiin ensin menetelmillä saatavilla R paketti ”aroma.affymetrix” [19], mukaan lukien tekniikat poistaa järjestelmällisten harhojen käyttöön johtuen alleeliset rajat puhua, PCR-fragmentti pituus harhaa ja erot GC-pitoisuus . DNA: n kopioiden lukumäärä arvioitiin koetin set-viisasta vertaamalla normalisoidun signaalin kasvaimen näyte dataa normaalin lymfosyytin DNA samasta potilaasta, jos se on käytettävissä. Kasvaimen näytteitä, jotka vastasivat normaali kudos ei ollut saatavissa, keskimääräinen signaali kaikki normaalit syntyy samassa laboratoriossa käytettiin viitteenä. Laadunvalvonta vaiheet on kuvattu Menetelmät S1. Vain mukana näytteet on esitetty taulukossa 1.

pyöreä binary segmentointi menetelmää käytettiin segmentin kopion normalisoitu data [20], [21]. Jokainen koetin sarjat sisällä CNA joka oli läsnä 5% normaalista näytteistä jätettiin pois kasvain analyysin ennen segmentointi poistaa yhteisiä kopioluvun polymorfismit (CNP). Segmentit, joissa on alle 10 koetinsarjojen (SNP6) tai 5 koetin sarjaa (500 K) yhdistettiin viereisen segmentin lähinnä kopioluvun kuin edellinen QPCR analyysi ehdotti, että aberraatioita edustaa harvat antureista näissä ympäristöissä eivät välttämättä ole luotettavia [17]. Lisäksi käytimme Genomic merkityksellisten tavoitteet Ravussa (synergisillä), joka on menetelmä, joka yhdistää tiedot yli erilaiset kasvaimet yrittää erottaa kuljettajan ja matkustajan poikkeamia, jossa yhdistyvät yleisyys ja amplitudi [22]. Tämä tekniikka suoritettiin käyttämällä web-pohjainen käyttöliittymä (https://genepattern.broadinstitute.org) kanssa CNA kynnysarvoja ± 0,3, vähintään 10 merkkiä ja Q-arvon kynnys 0,25.

hierarkkinen klustereiden, kaikki kasvaimia, analysoitiin ( ”1”) tai puuttumisen ( ”0”) kunkin synergisillä piikin muutos (n = 89), jossa päällekkäisyys pidettiin läsnäoloa. Hierarkkinen klusterointi käyttävät keskimäärin Euclidean ryhmittely näytteistä (n = 398) suoritettiin käyttäen Partek Genomics Suite v.6.4 (Partek Inc., St. Louis, MO).

Association alueiden välillä poikkeavuuksien

sitoutui analyysi yhdistyksen on TCGA datasarja (josta meillä uudelleen juoksi synergisillä) ja sitten jäljellä näytteistä. Kaksi eri menetelmiä käytettiin laskemiseen assosiaatioita alueiden voiton ja tappion. Synergisillä tulokset yhteenvetona matriisi X kasvaimia riveinä ja alueilla poikkeamia kuin sarakkeita. Kunkin kasvain (t) ja tarkennusalueen poikkeama (i), mittaus X [t, i] oli 1 jos poikkeavuus oli läsnä, että kasvaimen ja 0 muutoin. Poisson log-lineaarinen malli sovitettavaksi kontingenssitaulukkomenetelmillä kuvaava poikkeavuus tila. Tilastollinen merkitys yhdistyksen laskettiin käyttäen pisteet tuottava testi standardoitua normaalijakaumaa z-tilaston [23]. Tämä vastaa neliöjuurisella tavallista Pearson testin tilastollinen itsenäisyyden, allekirjoitti suunnan mukaan yhdistyksen. Benjamini ja Hochberg menetelmää käytettiin korjaamaan useita testaus [24].

Association alueiden välillä poikkeavuuksien testattiin myös käyttäen Monte Carlo permutaatio testi. Lyhyesti, jokainen sarake matriisiin X oli vuorotella itsenäisesti (säilyttäen merkintöjen määrän sarakkeissa olevan sama). Pisteet assosiaatiota laskettiin käyttäen permutoitua matriisi kuvatulla muuttujen testiä edellä. Keskimääräinen sijoitus saadaan jokainen pari aluetta useita permutaatioiden käytettiin arvioitaessa väärä löytö korko ja kuinka monta kertaa testin tilastollinen suurempi tai alkulämpötilaa testin tilastollinen käytettiin laskemaan p-arvo. Käyttäen 5% vääriä löytö korko menetelmistä valittua 98% samaa paria alueilla. Päätimme käyttää ensimmäistä menetelmää on kuvattu alueen valinta, mutta molemmat raportoidaan.

analyysi ilmaisun korrelaatioita liittyy kopiomäärän säännöttömyyksien

posited että korrelaatio alueiden poikkeavuuksien pitäisi johtaa korrelaatio mRNA tasoilla geenien alueella. Affymetrix U133A array tiedot saatiin kaikkien näytteiden TCGA. Kaikista liittyvät alueet yllä, neljä Pearsonin korrelaatio testit tehtiin geenit alueilla: a) korrelaatio kopioluvun välillä Gene X alueen A ja Gene Y Region B, b) välinen korrelaatio kopiomäärä ja ilmentyminen Gene X alue A, c) välinen korrelaatio kopiomäärä ja ilmentyminen Gene Y Region B ja d) korrelaatiota ilmentymisen välillä Gene X ja Gene Y. Kaikki neljä testiä oli oltava merkitsevä p 0,05.

Survival Yhdistykset

Coxin suhteellinen vaara mallia käytettiin laskemiseen yhdistyksen alueiden välillä poikkeama havaitaan synergisillä ja yleinen tai ilman taudin etenemistä, korjaamalla useita testejä käyttäen Benjamini-Hochberg menetelmällä. Laske selviytymisen yhdessä paria alueiden näytteet luokiteltiin neljään ryhmään perustuu poikkeavuus tilan paria alueilla. Samoin genomisen toimenpiteiden näytteet binned johonkin neljään ryhmään perustuu tietoihin kvartiileja kunkin toimenpiteen. Survival yhdessä tällä tavoin yksilöityyn ryhmään laskettiin käyttäen Coxin suhteellista riskin malliin.

Tulokset

integrointi kopioluvun muutoksia 398 munasarjakarsinoomat

koottu korkean resoluution kopiomäärä tietoja lähes 400 munasarjasyöpä näytteitä, jotka edustavat kahta histologinen alatyyppi, vakavien ja endomet- (taulukko 1), 270 josta oli vastaavia normaalin lymfosyyttien DNA-tietoja. Tiedot koottiin useista lähteistä: korkealaatuinen Affymetrix SNP6.0 Mapping Array ”CEL” tiedostot hankittiin läpi Cancer Genome Atlas (TCGA, 157 tapausta) tai hankittu Peter MacCallum Cancer Centre (83 tapausta [18]) SNP Mapping array saatuihin tietoihin pienempi resoluutio Affymetrix alustoilla kuten 108 tapausta analysoituna 50 K

Xba

I taulukot [14], 27 tapausta 500 K paneelit [15] ja 23 tapausta 250 K

Sty

I paneelit saatu Japanista, olivat mukana myös. Laaja laadunvalvontakriteerit sovellettiin kaikkiin tietokokonaisuuksia (katso Methods S1). Sen jälkeen normalisointia kunkin datasarjan, kopioiden määrä muutokset (CNA) havaittiin pyöreitä binary segmentointi [21]. Arvioimme useita mahdollisuuksia yhdistää aineistoja kuten kohortti-erityiskynnyksiä (katso Methods S1), mutta tämä juurikaan eroa lopulliseen CNA malli ja standardin kynnyksen +/- 0,3 (log

2) levitettiin yleisesti ovat aikaisemmin kuvanneet meille [17] ja muut [10].

vertailu viiden tietolähteet osoittivat huomattavaa yhdenmukaisuutta CNA poikki genomin, joka osoittaa korkea kuin satunnaisuutta CNA ja yhtä tärkeämpänä, mitään merkittäviä array erän vaikutuksia (kuva S1). Poikkeuksena oli Japani datasarjan, joka ilmestyi näyttää pienempi määrä muutoksia. Kuitenkin genominlaajuisten suoritettiin alueiden tunnistamiseksi poikkeavaan eri taajuuksilla eri alustoille ja ei ole havainnut mitään tilastollisesti merkitseviä alueita toistuvassa testaus korjauksen.

arvioitiin mahdollisuutta molekyyli alaryhmien yhdistetyssä kohortissa määritellyn by kopiomäärä käyttämällä hierarkkisia klusterointi (kuva S1). Vain yksi ryhmä näytteitä oli erotettavissa; nämä olivat muutamat CNAs ja näyttivät olevan matala-asteista näytteiden tai Japani näytteitä, joille arvosana oli yleensä ole saatavilla. Ei ollut muita erillisiä klustereihin tai suuria ryhmittymiä johtuvat histologinen alatyyppi tai arvosana. Erityisesti korkea laatu serous ja korkealuokkaisesta endomet- olivat tasaisesti integroitu, mikä on sopusoinnussa aiemmin havaittu samankaltaisuutta näiden alatyyppiä arvioitiin käyttäen immunohistokemiallista markkereita [25] ja geeniekspressioprofiilien [26].

Jotta tunnistaa olennaisimmat CNAs teimme useita täydentäviä analyysejä sillä jokainen menetelmä on omat vahvuutensa ja heikkoutensa, jotka voidaan täydentää toisella. Ensinnäkin synergisillä sovellettiin kaikkiin 240 SNP6 näytteet tunnistaa ”polttoväli” ja ”laaja” huiput (määritelty [22]) (kuvio 1, taulukko S2). Kuitenkin, synergisillä voi helposti integroida näytteitä eri alustoilla. Siksi päättänyt käyttää toista täydentävä menetelmä synergisillä: yleinen taajuus lähestymistapa, joka yhdistyi segmentoituja kopiomäärä data riippumaton alustan analysoida koko 398 näytettä kohortissa. Kuten odotettua, merkittävin alueiden kopioluvun vahvistuksen ennusti sekä synergisillä ja yleinen esiintyvyys oli sijoitettu 3q (63% näytteistä, joissa on CN voitto) ja 8q (62% näytteistä CN gain) (kuvio 1). Muita tavallisia voitot havaittiin 20q (47%) ja 12p (39%). Yleisin alueet menetyksen tunnistettu tässä tutkimuksessa (kromosomien X, 8p, 22q, 17, 4q, 19p ja 16, 40%) ovat yhdenmukaisia ​​aiempien tutkimusten meille [15] ja muut [10], [27] . Valitseminen olennaisimmat geenit, me ensin ilmoittaa niille alueille voitto ja tappio vähintään 30% taajuus tai synergisillä huippuja ja sitten tunnistaa geenejä, jotka suunnattiin myös kohonneet amplitudi tapahtumia, vaikka tämä oli alemmalla taajuudella (taulukko S2 ). Koska ei ole selvää yksimielisyyttä siitä, mikä on ”korkean tason” vahvistus, raportoimme alueet usein lisäämisessä log

2 suhdeluvut 0,6 (40 tai useampia näytteitä, 10% +), 0,8 ( 5% +) ja 1 (2,5% +). Menetyksistä, me pidetään homotsygoottisia deleetioita (log

2 suhdeluvut -1) läsnä vähintään 4 näytettä. Luettelo geenien etusijalla ottaen huomioon taajuuden korkean amplitudin CNA ja päällekkäin synergisillä (taulukot 2 ja 3). Erityiset alueet voitto on esitetty kuvioissa S2, S3, S4, S5, S6, ja S7.

voitot (A) ja tappiot (D) 240 näytteet SNP6 paneelit analysoitiin synergisillä. Voitot (B) ja tappiot (C) 398 näytettä eri array alustoilla. Näytejaokkeiden asetettiin päällekkäin Partekissa Genomics Suite v 6.4, luo datapiste kustakin segmentin määritellään kopiomäärä breakpoints, ja sitten piirretty näytteiden määrä.

Käyttämällä tätä joustavaa lähestymistapa huomasimme, että jotkin alueet olivat vain selkeästi yhdellä tai toisella menetelmällä. Ottamalla mukaan useita korkeamman amplitudi CN kynnysarvot ja huiput ennusti synergisillä, lisäalueita tunnistettiin kuten luovutusvoittoja kromosomeissa 1, 6p, 11q, 19 ja tappiot 5q, 6q26, 10q23, 13q ja 18q22. Lisäksi korkean resoluution alustoilla kuten SNP6 array, synergisillä yleensä tunnistaa hyvin pieniä alueita, mahdollisesti puuttuu asiaan geenejä. Esimerkiksi on 3q26 oli kaksi lähekkäin huiput merkitys synergisillä profiilin (kuvio S2). Korkeimmat näistä jota hyvin täpärästi (-log q arvo 93,88

vs

. 93.43), ei leikkaa mitään geenejä, kun taas toinen huippu on päällekkäinen

MECOM

(

MDS /EVI1

); on olemassa hyvä todiste tästä geenistä on onkogeenin munasarjasyöpä [28]. Niinpä, vedoten synergisillä yksin käsinkirjoittaa 3q26 alueen, jolla ei ole kiinnostuksen kohteena olevia geenejä. Sen sijaan käyttämällä taajuutta lähestymistapaa, suurin taajuus ollenkaan kopioluku kynnykset kattaa

MECOM

.

Samoin oli myös muita alueita, joille käyttää taajuutta lähestymistapaa jäänyt geenejä tai antoi ristiriitaisia ​​tietoja. Esimerkiksi on 19q12, kukin kopio määrä kynnyksen tunnistettu hieman eri alueella huipputaajuus- vaihtelevasti tunnistaminen

CCNE1

,

C19ORF2

tai ei geenin piikin (kuva S3). Sen sijaan kyky synergisillä integroida amplitudin vahvistuksen kaikkien näytteiden selvästi

CCNE1

kuin geenin huippu. On hyviä todisteita, että

CCNE1

on oikea puhelun, koska sykliini E on keskeinen solusyklin proteiinin ja sen vahvistusta ja yli ilme on aiemmin tunnistettu avaintekijä potilaan vaste kemoterapiaan serous munasarjasyöpäpotilailla [14 ]. Suurimmat johtopäätöksiä johtuvat analyysimme yksittäisten poistot ja amplikoneja, kuten oivalluksia mahdollisia kuljettaja geenejä, annetaan keskusteluun.

assosiaatioiden CN muutoksiin

käsite osuuskunnan ja toisensa poissulkevia geneettisiä muutoksia on harvoin tutkittu tasolla CNAs tai genomin laajuisesti. Halusimme tietää, onko CNAs, jotka tekevät yhteistyötä munasarjojen kasvainten synnyssä, tai jotka ovat toiminnallisesti tarpeeton toisiinsa, esimerkiksi jos ne toimivat samaa reittiä. Mitata arvioimme, onko mitään CNAs jotka olivat enemmän tai vähemmän todennäköisesti liittyä toisiinsa, enemmän kuin sattumalta, käyttämällä tilastollista analyysiä. Lyhyesti, laskimme näytteiden määrä positiivisia CNA (esim voitto) on alue saisi yksin, alue B yksin, molemmilla alueilla eikä alue, ja verrattiin tuloksia odotettuihin yhteistyön esiintyminen kokonaispainon perusteella taajuus CNA A kerrottuna taajuuden B. esimerkiksi taajuudella vahvistus 20q11 ja 68/183 (37%) ja 19q12 on 50/183 (33%), odotamme 12% näytteistä olla sekä voitot. Olemme kuitenkin tarkkailla todellinen tiheys näytteitä sekä muutoksia, jotka eroavat huomattavasti tästä, so 35/183 (19%, p 0,0001), mikä osoittaa kasvua yhteistyössä esiintyminen yläpuolelle mahdollisuus ja siten mahdollisesti yhteistyössä CNAs. Menetelmää voidaan myös yhtä hyvin käyttää havaitsemaan pienenee yhteistyössä esiintyminen. Kun tätä menetelmää genomin laajuinen, haimme useita testaus korjauksen kanssa FDR on alle 5%.

sitoutui Analyysin ensimmäinen käyttäen TCGA tiedot, koska se on kaikkein homogeeninen-luokan ja alatyyppi, ja on korkea resoluutio. Toistimme synergisillä analyysi tämän tietokokonaisuus yksin saada 46 huiput kopioluvun voitto ja 27 tappiota (ilman alueiden normaalien kopioluvun vaihtelua, tai kopiomäärän polymorfismit (CNPS)). Näytteet tunnistetaan olevan positiivinen tai negatiivinen kunkin CNA huippu, kun vahvistus huiput pisteytettiin positiivisiksi voittoja vain ja tappio huiput teki positiivisena tappioista vain, ja analyysi yhdistyksen tehtiin kuten menetelmissä. Tällä väärä löytö nopeudella 5%, 305 paria alueiden poikkeama korreloivat positiivisesti ja 18 paria negatiivisesti korreloivat (taulukko S3, kuva 2). Jotkut yhdessä esiintyvät synergisillä piikit sijaitsevat samassa laaja synergisillä alueella ja vaikka synergisillä analyysi osoitti, että nämä alueet kopioluvun muutos olivat erillisiä, koska ne ovat fyysisesti läheisesti toisiinsa ne eivät välttämättä ole toisistaan ​​riippumattomia. Koska riippumattomuus on välttämätöntä yhdistyksen suoritettua testiä, niitä ei analysoitu tarkemmin. Olemme myöskään kuulu näiden yhteenliittymien joissa joko huippu oli CNP, jättäen 98 paria alueita, jotka korreloivat positiivisesti, kaikki vaan joista 16 sijaitsee eri kromosomissa aseiden (taulukko 4). 12 paria alueiden negatiivisesti korreloivat.

(A) Menetelmä tunnistaa siihen liittyvät poikkeamia (tarkemmin Methods S1). (B) Yhteenveto merkittävistä yhdistysten kukin tietokokonaisuus ja näitä merkittäviä molemmissa. Kuten taulukosta edetessä tiettyjen yhdistysten suodatetaan pois, numeroarvot jäljellä jotka läpäisevät suodattimen. Ensinnäkin liittyvä loci jotka ovat saman laajan synergisillä sisäisistä kromosomialueelle poistetaan ja toisaalta alueet, jotka ovat päällekkäisiä kanssa CNP poistetaan. (C) Circos juoni. Ulompi rengas osoittaa kromosomin asema kunkin poikkeamia (värilliset palkit). Sisäinen violetti linjat osoittavat merkittävää keskinäistä kromosomi yhdistysten (ilman niitä, joihin liittyy CNP), joka on validoitu toisen tietojoukon.

Jotta vahvistaa yhdistysten tunnistettiin käyttäen TCGA data, me toistuva yhdistys analyysi käyttäen samaa ”TCGA synergisillä määritellystä” alueet kuin edellä kaikista muista korkealaatuista serous ja endomet- näytteitä (n = 183). Tämän tieto asettaa, 296 alueet korreloivat positiivisesti ja 5 negatiivisesti korreloivat. Kaiken kaikkiaan 29 positiivisen yhdistysten eikä negatiivista olivat yhteisiä kahden aineistot (kuva 2). Näistä 14 oli järjestöjä kahden voittoja, joista 11 oli samassa kromosomissa, ja 14 yhdistykset olivat kahden tappioita. Mikään tappiota tappio yhdistykset olivat intra-kromosomi, koska kaikki tämän tyyppiset yhdistelmät jätettiin joko ne sijaitsevat yhtä laajasti synergisillä alue tai ollessa CNP; todellakin, enemmän synergisillä piikin tappiot olivat CNPS (n = 35) verrattuna voitot (n = 15) todennäköisesti johtuu naamiointiryhmän vaikutus Heterotsygotian menetys on päällä CNP havaitseminen kasvain [29]. Oli yksi yhdistyksen välillä voitto ja tappio, välillä amplikoni on 20q11 ja menetys Xq. Vahvin positiivinen yhteys välillä voitot eri kromosomeissa oli monistuksiin kromosomissa 19q12 (todennäköisin kohdistus

CCNE1

) ja 20q11 (viisi geeniä). Menetyksistä, voimakkain yhteinen yhdistys oli välillä kromosomin 4q ja kromosomi 17. 17q12 tappio oli kaikkein siveetön Interactor, jossa 8 yhteiset positiivinen yhteys.

tunnistettujen geenien sijaitsevat tai lähellä positiivisesti siihen liittyvät huiput ja käyttää geeniekspression tiedot sen arvioimiseksi, onko jokin geeneistä osoittivat korrelaation kopiomäärä ja ilmaisun, ja jos olisi korrelaatio tasolla geenien ilmentymisen eri alueilla (taulukko S4). Huomasimme, että vahvin yhdistykset eri alueiden mukana geenien saaduista 19q12 tai 19p13.11, ja geenit saaduista 20q11. Muita positiivisia geenien ilmentyminen yhdistysten mukana

CD47

(saaduista 3q13.12) ja

UQCRFS1

tai

POP4

(molemmat saaduista 19q12). CD47 tunnistettiin ensin munasarjakasvain antigeeni [30], mutta siellä ei ole tunnettua toiminnallista yhdessä joko 19q12 kumppanin.

Korrelaatio kliinisten parametrien ja lopputulos

Käytimme TCGA kliinisiä tietoja suhteen arvioimiseksi kopioluvun ja potilaiden hoitotuloksiin käyttämällä muuttujan Coxin suhteellisten riskien analyysi synergisillä huiput (taulukko S5). Voitto 3q29 liittyi kokonaiselinaika, mutta tämä korrelaatio ei ollut merkittävä toistuvassa testaus korjauksen. Positiivinen CN yhteenliittymien 17q12 /22q tappiot ja 3q13 /19q12 voitot olivat kukin korreloi eloonjäämiseen mutta ei ilman taudin etenemistä (taulukko S5).

Erityisiä geenien kopioluvun muutos ja geneettinen epävakaus, jotka korreloivat potilaan lopputulokseen, mukaan lukien simplex, saha ja firestorm, on kuvattu rintasyövän [31]. Malleja kromosomiaberraatiotestissä munasarjasyövän on vaikea luokitella ryhmiksi kuvataan Hicks

et al

. koska useimmat ovat yhdistelmä saha ja firestorm. Siksi me määritelty useita erilaisia ​​toimenpiteitä genomin epävakautta ja analysoitiin niiden vastaavuus potilaiden hoitotuloksiin käyttäen TCGA datajoukon (taulukko S5). Nämä toimenpiteet sisältyvät: määrä kopioluvun muuttuu eli voitot, tappiot, korkeamman tason voitot ( 0,6 log

2 amplitudi) ja kokonaismäärä segmenteissä; prosenttiosuus genomin kohteena kopioluvun muutos (voitto, tappio ja korkea vahvistus); ja ”Hicks indeksi” kuvatulla [31] varten voittoja, tappioita ja molemmat. Näytteet jaettiin kvartiileja perustuu kunkin näistä indeksien ja testattiin yhteyksiä kliinisiin tuloksiin käyttämällä muuttujan Coxin suhteellisten riskien analyysi. Näistä toimenpiteistä, vain määrä suurempi amplitudi voitot (p = 0,019) havaittiin korrelaatio ilman taudin etenemistä, mutta ei eloonjäämiseen (kuvio S8). Prosenttiosuus genomin sisältyvät korkeamman tason voittoja ei ollut merkitsevä (p = 0,88), mikä viittaa siihen, että se ei ole osa DNA: n monistettujen mutta määrä vahvistus tapahtumia, jotka on tärkein.

Keskustelu

Aneuploidy ja sytogeneettinen poikkeamia on jo pitkään tunnustettu syöpää tunnusmerkkejä. Epiteelin syövät, kopioluvun muutoksia on osoitettu olevan kuljettajat syövän fenotyypin kautta monistuminen ja yli ilmentyminen onkogeenien, kuten

ErbB2:

ja menetys tuumorisuppressoreita kuten

CDKN2A

. Munasarjasyöpä on sekä heterogeeninen ja sytogeneettisesti monimutkainen tehden vaikea tulkita keskeiset genomialuetta vaikuttaa CNA. Aiemmat tutkimukset ovat yleisesti alitehoinen suhteen resoluutio ja /tai näytteen numero, enimmillään käsittää noin 100 tapausta [10], [11], [12]. Tämä tutkimus kokoaa yhteen suuren kokoelma munasarjakarsinoomat profiloitu kappale numero, jota olemme analysoitiin sekä synergisillä ja taajuus lähestymistapoja antaa lopullista merkinnästä kuljettajan muutoksia. Tärkeimmät alueet esitetään yhteenveto taulukoissa 2 ja 3, kun taas kattavampi luettelo, joka kattaa liitto molempien menetelmien on esitetty taulukossa S2. Koska suuri määrä geenejä ja alueiden mukana, ei ole mahdollista käsitellä kaikkia yksityiskohtaisesti, mutta mainituilla alueilla valaisevat joitakin oivalluksia peräisin työskennellä tämän suuren tietokokonaisuutta.

päättänyt käyttää täydentäviä analyyttisiä lähestymistapoja sillä jokainen tekniikka on omat vahvuutensa ja heikkoutensa: taajuus lähestymistapa alueille kuten 3q26 oli parempi pystyä tunnistamaan todennäköiset kuljettaja geeni,

MECOM

, kun taas 19q12 kyky synergisillä integroida suuruus kopioluvun vahvistuksen jokaisesta näytteestä tunnistettu

CCNE1

. Käytetään vaiheittaista taajuus lähestymistapa yhteistuumin synergisillä tarjosi syvemmän ymmärryksen monimutkaisia ​​alueilla, joille ei ole selkeää kuljettaja. Aiemmat tutkimukset ovat tunnistaneet vahvistus kromosomista 11 18% munasarjojen syöpiä, ja ovat ehdottaneet, että kohdegeenin tämän tapahtuman on

EMSY

(

C11ORF30

) [32]. Muissa syöpätyyppejä, kuten rinta- syövän, huippu vahvistus tällä alueella voivat olla erilaisia, kohdistaminen

EMSY

ja /tai

CCND1

[33], [34]. Vuonna Tässä esitetyt tiedot, pääasiassa amplikoni ei näytä kohdistavan

CCND1

, joka on 5 Mb ulkopuolella piikin alueen (kuva S4). Synergisillä tunnistaa huippu käsittää neljä geeneistä (

THRSP

,

NDUFC2

,

ALG8

ja

KCTD21

), monistus joiden on osoitettu rintasyövässä korreloivan yli-ilmentyminen ja huono selviytyminen [35]. Yleisimmin kohdegeenin matalan tason vahvistus on

GAB2

(30%).

Vastaa