PLoS ONE: High Resolution Kopioi numero vaihtelu Data NCI-60 Cancer Cell Lines Whole Genome mikrosirut pääsee CellMiner

tiivistelmä

Array-pohjainen vertaileva genominen hybridisaatio (aCGH) on tehokas tekniikka havaitsemiseksi geenin kopioluvun vaihtelua. On yleisesti pidetään vankka ja kätevä, koska se mittaa DNA sijaan RNA. Nykyisessä tutkimuksessa yhdistämme kopiomäärä arvioi neljästä eri alustoilla (Agilent 44 K, NimbleGen 385 K, Affymetrix 500 K ja Illumina Human1Mv1_C) laskea luotettavasti, korkearesoluutioinen, helppo ymmärtää lähtö mitta kopioluvun muutoksia 60-syöpäsoluissa NCI-DTP (NCI-60). Sitten liittyvät tulokset geenin ilmentymisen. Kerromme, kuinka käyttää kyseistä tietokantaa käyttämällä CellMiner web-työkalu ja antavat esimerkin Vertailun helpottamiseksi transkriptio ilme, koko exome sekvensointi, microRNA ilmaisun ja vastaus 20000 huumeita ja muita kemiallisia yhdisteitä. Sitten osoittavat, miten tiedot voidaan analysoida integratively kanssa transkriptio ekspressiotietojen koko genomin (26065 geenejä). Vertailu kopioluvun ja ekspressiotasot esitetään yleiskaavio Keskikorkealle korrelaatio (mediaani r = 0,247), jossa on huomattavasti suurempi korrelaatiot (mediaani r = 0,408) ja tunnettujen tuumorisuppressorigeeneille. Tämä havainto on sopusoinnussa hypoteesin, että geeni menetys on tärkeä mekanismi kasvaimia estävä inaktivoitumisen. Integroitu analyysi samanaikaisen DNA kopioluvun ja geenien ilmentymisen muutos esitetään. Rajoittamalla huomion keskipiste DNA voitot tai tappiot, tunnistamme ja paljastaa uusia ehdokas tuumorisuppressoreilla yhteensopivat muutoksia transkriptio tasolla.

Citation: Varma S, Pommier Y, Sunshine M, Weinstein JN, Reinhold WC (2014) Korkea resoluutio Copy Number vaihtelu Data NCI-60 Cancer Cell Lines Whole Genome mikrosirut pääsee CellMiner. PLoS ONE 9 (3): e92047. doi: 10,1371 /journal.pone.0092047

Editor: Kwok-Wai Lo, Kiinan University of Hong Kong, Hongkong

vastaanotettu 17. lokakuuta 2013 Hyväksytty: 18 helmikuu 2014; Julkaistu: 26 maaliskuu 2014

Tämä on avoin-yhteys artikkeli, vapaa kaikki tekijänoikeudet, ja saa vapaasti jäljentää, levittää, välittää, modifioitu, rakennettu, tai muuten käyttää kuka tahansa laillista tarkoitusta. Teos on saatavilla Creative Commons CC0 public domain omistautumista.

Rahoitus: Tätä työtä tukivat Center for Cancer Research, Intramural ohjelmaansa National Cancer Institute. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Sudhir Varma on työntekijä HiThru Analytics LLC sopimusosapuolena NCI tarjota bioinformatiikan ja laskennallisen palvelut. Hänellä ei ole muuta kaupallista kiinnostusta tutkimus julkaistiin tässä artikkelissa. Margot Sunshine on työntekijä Systems Research and Applications (SRA) sopimusosapuolena NCI, joka tarjoaa laskennallinen ja web kehittämispalvelut. Hänellä ei ole muuta kaupallista kiinnostusta tutkimus julkaistiin tässä artikkelissa. Tämä ei muuta tekijöiden noudattaminen kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja.

Johdanto

NCI-60 on joukko 60 laajalti käytetty syövän johdetut solulinjat 9 kudosten alkuperän mukaan lukien rinta-, keskushermoston, paksusuoli-, keuhko-, eturauhas-, munasarja- ja munuaisten, sekä leukemian ja melanoomat [1]. Me ja muut, ovat aikaisemmin saatavilla molekyylitason tietoa useilla alustoilla varten NCI-60 [2] – [7], joten se ainutlaatuinen resurssi sekä farmakogenomiikkaa [8], [9] ja systeemibiologian [10], [ ,,,0],11]. Nämä solulinjat säilyttävät geeniekspressiomalleja alkuperäisestä syöpäkudokset-of-alkuperää, on osoituksena yhteistyössä klustereiden [4], ja verrattuna kliinisissä näytteissä [12]. Kyky vertailla lääkevaste ja genomin tietoja näitä solulinjoja on yksikään toinen kliinisiä tai syöpäsolu tietokannoista [8], [11], [13], [14].

Ennen tutkimusten DNA-kopion numero aCGH useilta syöpäsolu linjoja ja kliiniset näytteet ovat lisänneet ymmärrystä DNA vaihtelu solutasolla [15], sekä tuottavat translaation oivalluksia [16]. aCGH tarjoaa mittaus genomin epästabiilisuuden [17], tunnusmerkki syövän [18]. Associations välillä geenikopiomäärä ja ilme on myös tutkittu, joissakin tapauksissa saadaan vaikutuksia koskevat mekanismeja syövän etenemisen [19], [20].

Data useilla alustoilla profilointi NCI-60 pääsee läpi CellMiner verkkosovellus [21]. Viime aikoina olemme ottaneet käyttöön www-pohjaiset työkalut, jotka mahdollistavat ei-bioinformatician arvioida ja rajat vertailla tietokantojen [8]. Nykyisessä tutkimuksessa laajennamme tätä integrointikapasiteettia esittämällä korkean resoluution DNA kopioluvun tiedot NCI-60 syntetisoitiin yhdistämällä tiedot neljältä alustojen (taulukko S1), ja asetti sen muodossa stereotyyppisen muihin muotoihin tietoja. Esittelemme ”Gene DNA copy number” web-työkalu, jonka tarkoituksena on mahdollistaa ei-bioinformatician, kyselyn, visualisoida ja lataa suhteellinen DNA kopiomäärä tietoja. Ulostulo tämä työkalu helpottaa integroinnin DNA kopioida meidän muiden tietokantojen, parantaa niiden integraatiokyvyn.

Analyyttisesti tarjoamme suhteellisten DNA kopioluvun vaihtelua sisällä ja välillä solulinjoista, laskea useita toimenpiteitä perimän epävakaisuus , ja korreloida suhteellinen DNA kopiomäärä kanssa geeniekspressiotasot. Eteneminen alla oletusta, että syöpä polttoväli voitot ja tappiot ovat seurausta valikoivaa painetta perustuu niiden sääntelyyn vaikutusta geenien ilmentyminen, me korreloivat tulokset keskipiste DNA kopioluvun muutos, ja geenien ilmentyminen tunnistaa otaksuttu tuumorisuppressoreilla.

Materiaalit ja menetelmät

DNA Isolation

DNA eristettiin kuten aiemmin on kuvattu [22]. Lyhyesti, genomista DNA: ta puhdistettiin soluista käyttämällä QIAamp DNA veren Cell Culture Maxi Kit, (Qiagen Inc., Valencia, CA) valmistajan ohjeiden mukaisesti. Laatu arvioitiin optisella tiheydellä 260/280-suhde käyttämällä spektrofotometriä (Beckman-Coulter, Fullerton, CA) ja 0,8% agaroosi (SeaKem GTG, FMC-Bioproducts, Rockland, ME) geelielektroforeesi 1 x TAE (Roche, Indianapolis, IN) .

DNA Kopioi numero NCI-60 neljällä Microarray Platforms

DNA kopiomääriin kaikkien geenien määritettiin integrointi koettimia i) ihmisen genomista CGH Microarray 44A (Agilent Technologies , Inc., GEO liittymistä GPL11068) kanssa 44 k antureista, ii) H19 CGH 385K WG Laatoitus v2.0 array (Roche NimbleGen Systems, Inc., GEO liittymisen GPL13786,), jossa on 385 k antureista, iii) GeneChip- Human Mapping 500 k array Set (Affymetrix Technologies, Inc., GEO liittymistä GPL3812) 500 k antureista, ja iv) Human Human1 Mv1_C BeadChip array (Illumina, GPL6983) kanssa 1100 k koettimilla. Tiedot näitä mikrosiruja pääsee osoitteessa CellMiner [21]. Lisäksi raaka tiedot on talletettu Gene Expression Omnibus (GEO) seuraavissa liittymisen numerot Agilent 44 k (GSE48568) Affymetrix 500 k (GSE32264), NimbleGen 385 K (GSE30291), Illumina 1 M (GSE47620).

Probe kartoitus ja intensiteetit

Koettimet Agilent, NimbleGen ja Illumina taulukot valittiin uudelleen kartoitettu uusimpaan HG19 viitteen BLAST + (versio 2.2.25) [23]. Sillä Affymetrix array, käytimme uusin merkintä ladattavissa Affymetrix NetAffx verkkosivuilla [24]. Kunkin alustan, me keskimäärin samanlaiset näytteet (jos käytettävissä, katso taulukko S1). Probe voimakkuudet määritettiin seuraavien valmistajien suosituksia aikaisemmin on kuvattu Agilent [25], NimbleGen Roche [26], Affymetrix [27], ja Illumina [28] mikrosiruja.

Kaikille alustoille, lokin anturi intensiteetit kukin näyte normalisoitiin keskiarvo-keskitys, ennen jokaista seuraavaa analyysiä. Keskimääräinen log koetin intensiteetit vähennettiin kaikista koetin intensiteettejä että näyte.

segmentointi alueiden kanssa Yhtenäiset Copy Number

segmentointi tarkoittaa eristämiseen kunkin kromosomi vierekkäisiä segmenttejä siten, että kopioluku on sama sisällä segmentti ja on olemassa merkittävä ero kopioluvun vierekkäisten segmenttien. Meidän analyysi, käytimme Circular Binary Segmentointi (CBS) [29]. CBS palauttaa keskimääräinen luminoivan kussakin segmentissä arvio log

2 kopioluvun kyseisessä segmentissä. Siten keskimääräinen luminoivan nolla vastaisi mitattu kopiomäärän 2N (eli diploidi), arvo -1 vastaa kopioluvun 1N ja 1 vastaa 4N.

Huomaa, että Affymetrix 500 k tietoja on käytetty ennen havaitsemaan alueille LOH (Loss heterotsygoottisuuden), mutta algoritmi käytetään havaitsemaan kopioluvun vaihtelut oli

pennCNV

joka ei sovellu genominlaajuisten kopioluvun arvio syövän näytteitä [30] . Olemme siis uudelleen analysoi dataa Circular Binary Segmentointi (CBS).

Yhdistelmä Kopioi numero arvioiden Four Platforms

Käytimme uutta algoritmia yhdistää segmentoidun kopiomäärä arvioita neljän alustat kunkin solulinjan. Käytimme segmentointi kopioluvun määritellä

keskeytyskohdat

risteyksessä kahdella vierekkäisellä segmenttiä. Tällä keskeytyskohta, diskreetti hyppy (lisäys tai vähennys) kopioluvun tapahtuu. Nämä pisteet vastaavat sijainnit kromosomi taukoja.

kohdista keskeytyskohdat neljästä alustoja saman solulinjan käyttäen seuraavaa menetelmää: Raja eri alustoja, jotka ovat 100000 emäsparin toisistaan ​​ja niillä on sama suunta kopioluvun muutos on sovitettu toisiinsa. Verkko kokoaa yhteen breakpoints eri alustoja, oletettavasti viittaavat samaan kromosomaaliseen tauko. Raja-arvot, jotka eivät vastaa minkään murtuessa toisen alustan hylätään. Sitten laskemme keskimäärin murtuessa sijainti kustakin ryhmästä sovitetun keskeytyskohdat keskiarvona sijainnit keskeytyskohtia eri alustalla. Laskemme

keskimääräinen segmentin kopioluku

keskiarvoistamalla segmentoitu arvot kahden vierekkäisen keskiarvona raja-arvot yli neljä alustoilla.

Kunkin geenin, löydämme segmentissä, jossa se on. Kopion numero geeni on

keskimääräinen segmentin kopioluku

kyseiselle segmentille. Tämä osoittaa kopiomäärä arvioi 41 tai enemmän solulinjoja 23413 geenejä.

kopioluku estimaatteja geenit verrattiin kopioida numeron arvioi päässä Cancer Cell Line Encyclopedia (CCLE) [13] käyttäen 44 solulinjoja yhteisiä molemmille aineistoja. Me lasketaan Pearsonin korrelaatio Mittausratkaisujemme kopioluvun ja CCLE kopioluvun poikki 44 solulinjojen jokaista geeniä.

Näkyvä ja Focal voitot ja tappiot

tunnistaa suurimman maakunnan , visuaalisesti vaikuttava voittoja ja tappioita, asetamme mielivaltainen kynnysarvo 1,5 absoluuttiseen log

2 kopiomäärä ja liittyi segmenttejä, jotka olivat alle 500 kiloemästä poispäin toisistaan ​​(mukaan lukien kaikki segmentit niiden välillä).

järjestelmällistä tunnistamista kaikilla polttoväleillä kopioluvun (tai tappioista) jokaisesta näytteestä, käytimme CBS (segmentoidut) tiedot löytää osia genomin jotka ovat suurempia (tai alempi) kuin sekä niiden vasen ja oikea naapureita . Käytimme kolme kriteeriä kutsumiseen voiton tai tappion polttoväli: i) segmentin täytyy olla ero log

2 kopiomäärä vähintään 0,3 sekä sen vasen ja oikea naapureita, molemmat erot ovat joko myönteinen tai kielteinen; ii) leveys segmentin on oltava alle 5 Mb; ja iii) pitäisi olla enemmän kuin 10 antureista kartoitus segmentin sisällä. Mikä tahansa geeni, joka on (osittain tai kokonaan) päällekkäisiä segmentti kutsutaan fokaalisesti saanut tai menettänyt.

perimän epävakaisuuden parametrit

Käyttäen segmentoituja kopiomäärä data, laskimme kahta perimän epävakaisuuden; i) osuus genomin, joka on saatu tai menetetty ja, ii) määrä voittoja ja tappioita. Osuus genomin, joka on saanut tai menettänyt laskettiin segmentoidun taulukon arvot CGH. Arvioimme tämän ottamalla osuutta koettimien kuuluvien segmenttien kanssa absoluuttinen keskimääräinen intensiteetti suurempi kuin 0,3 (DNA kopiomäärä voitto tai tappio 0,46). Määrä voittoja ja tappioita laskettiin kokonaismäärä (voitto /tappio alueet) absoluuttisella keskimääräinen intensiteetti suurempi kuin 0,3 yli 10 antureista kartoitus alueelle.

Gene Expression määrittäminen ja sen korrelaatio DNA kopiomäärän

Expression varten 26065 geenejä otettiin integroituna z-mittausten viidestä geeniekspressiota alustoja, kuten aiemmin on kuvattu [31]. Geenit kanssa ilme z-arvoja oli sovitettu geenien kopioluku. Tämä johti 18504 geenejä sekä ilmaisun ja kopioluvun arvioihin. Copy numerot näille 18504 geenit verrattiin geeniekspression käyttämällä Pearsonin korrelaatio (taulukko S3). Histogrammi korrelaatiokäsite piirrettiin käyttämällä

R

(versio 2.15.2). Mediaani korrelaatiot kaikkien geenien, sekä sarjaa tunnettujen onkogeenien ja tuumorisuppressoreilla, laskettiin.

Arvio tunnettujen ja Otaksuttavat tuumorisuppressoreita

Valitsimme geenejä perustuen kokouksessa neljään kriteeri; i) Tilastollisesti merkittävä korrelaatio kopiomäärä ja ilmaisun (False Discovery Hinta FDR 0,05), ii) geeni fokaalisesti saanut tai menettänyt vähintään 3 näytettä (polttoväli voitot ja tappiot määritelty Segmentation jaksossa), iii) useita solulinjoja, joilla polttoväli tappiot on vähintään 3 kertaa suurempi kuin määrä solulinjoja polttoväli voitot, iv) geenit olivat yli 2 miljoonaa emäsparia etäisyydellä tunnettujen tuumorisuppressoreilla. Kriteeri 4 käytettiin poistamaan ”matkustaja” geenejä, joiden valinta saattaa johtua genomista läheisyyden.

Tulokset

Array CGH tietoja voidaan käyttää ja visualisoidaan CellMiner ”Gene DNA Kopioi numero” web Analysis Tool

helpottamiseksi louhinta NCI-60 DNA: n kopioiden määrä dataa, esittelemme intuitiivinen työkalu kysellä ja visualisoida aineisto. Tämä työkalu löytyvät CellMiner verkkosivuilla [21] puitteissa ”NCI-60 Analysis Tools” välilehti (Kuva 1A). Kuten kuviossa 1A, käyttäjien ensimmäinen valitse ”Cell linja allekirjoitus” vaiheessa 1, ja sitten ”Gene DNA copy number”. Vaiheessa 2, jopa 150 geenejä kohteisiin voidaan syöttää joko kirjoittamalla geenin nimet ”Input tunnisteen” ruutuun tai lataamalla ne teksti- tai Excel-tiedoston avulla ”Lataa tiedosto” valintanappi. Vaiheessa 3, käyttäjät syöttää sähköpostiosoitteen, ja klikkaa ”Get data”. Tulokset lähetetään sähköpostitse jokaiselle geeniä, jossa on linkki ladata Excel-tiedoston. Tämä tiedosto sisältää neljä laskenta: i) ”DNA copy number” sisältävän taulukon tarkoittaa intensiteettisuhteet (testin DNA verrattuna oletetaan normaali) ja arvioitu DNA-kopion numeroita, ja baari juoni arvioidusta DNA-kopion numerot (kuvio 1 B), ii ) ”Graafinen Output” sisältävä sirontakuviot yksilön koetin intensiteettejä kiinnostavan geenin sekä 2 Mt vierusalueeseen kunkin solulinjan (kuvio 1 C), iii) ”input”, joka sisältää normalisoitu data niille antureista, jotka osuvat geeni (korostettu keltaisella) sekä 2 x 10

6 nukleotidin vierusalueeseen molemmissa päissä, ja iv) ”Alaviitteet”. Kuvio 1 esittää esimerkin 3 syövän merkityksellisiä geenien (kuvio 1A), CDKN2A koodaa sykliini-Dependent Kinase Inhibitor 2A (p16

INK4a, p19

ARF), joka on yleisesti poistettu syöpä, CCNE1, jotka koodaavat sykliini E , joka on yleisesti monistetaan syöpiä, ja KRAS koodaavat Kirsten Rat sarkooma Viral Oncogene, joka aktivoituu syöpien mutaatioiden ja harvemmin vahvistusta. Paneelit B ja C (kuvio 1) osoittavat, että monet solulinjat osoittavat ehtyminen CDKN2A lokuksen (vasemmanpuoleiset paneelit), kun taas munasarjan syöpäsolujen OVCAR3 ja OVCAR5 nähdään paikallisia monistus CCNE1 ja KRAS, vastaavasti.

. Työkalua voidaan käyttää tällä CellMiner verkkosivuilla klikkaamalla ”NCI-60 analyysi työkaluja” välilehti (boxed punaisella). Tässä esimerkissä 3 syöpään liittyvien geenien kysely tehdään samanaikaisesti: CDKN2A, CCNE1 ja KRAS. B. tuotantoon kuuluu baari juoni arvioidusta kappale numero kunkin solulinjan. X-akseli on DNA: n kopioiden määrää. Y-akseli esittää solulinjat, jossa palkit värillisiä perustuen kudoksen alkuperän. Bars vasemmalla 2N osoittavat menetys taas palkit oikealle osoittavat genomista vahvistusta. Pisteviivat osoittavat solulinjat kopio määrä voittoja CCNE1 ja KRAS C. parvikuvio annetaan myös kustakin solulinjasta. X-akseli esittää kromosomaalisen sijainnin. Y-akseli esittää log2 voimakkuuden arvot vasemmalla. Punaiset pisteet osoittavat antureista, jotka kuuluvat geenissä. Siniset pisteet osoittavat reunustavat alueet. Tiedot saadaan Excel-tiedostoja. Katso teksti yksityiskohtia.

Ainutlaatuinen piirre CellMiner sivusto on, että kopiomäärä kuvio saatu CellMiner varten geeniä voidaan käyttää syötteenä Pattern Vertailu työkalu löytää korreloi geenien ilmentymisen ja huumeiden aktiivisuutta. Kuvio 2 esittää kopioluvun CDKN2A (p16), geeni, jolla on korkein-korreloi ilmentymistä (CDKN2A), ja lääke, jonka vaste on eniten korreloi negatiivisesti (NSC-301739). Vankka korrelaatio DNA kopiomäärä ja transkriptio ilme tunnistaa vankka vaikuttaa, että DNA kopiomäärä muutos on päällä transkriptio ilmaisun tämän geenin. Negatiivinen korrelaatio DNA kopion numeron lääkeaineen tunnistaa FDA-hyväksytty lääke mitoksantronia (NSC-301739) olevan aktiivisempia useita esiintymiä syöpäsolujen kanssa CDKN2A poisto (kuva 2, oikea paneeli ja pisteviivat).

Vasemmanpuoleinen juoni näyttää barplot kopioluvun arvojen CDKN2A saadaan kyselemällä CellMiner. Keskimmäinen kuvaaja esittää geenin ilmentymisen ja oikeanpuoleisin juoni näyttää vastauksena Mitoksantroni, huumeiden merkittäviä negatiivinen korrelaatio kanssa kopioluku tilan CDKN2A. Katkoviivat osoittavat joitakin solulinjat, jossa suunta kopioluvun muutos on samaan suuntaan kuin geenin ilmentymisen ja vastakkaiseen suuntaan kuin lääkkeen aktiivisuus.

Korrelaatio Cancer Cell Line Encyclopedia

on 44 solulinjat yhteinen välillä NCI-60 ja CCLE. Erityisesti yhdistetyt kopiomäärä arvioi NCI-60 korreloi hyvin kopioluku Arvioiden CCLE mediaani korrelaatio 0,833. Tämä on korkeampi kuin korrelaatio kopioida numeroita yksittäisiä alustalla (Agilent: Agilent: 0,660, NimbleGen: 0,448, Affymetrix: 0,821, Illumina: 0,804) ymmärtää, että yhdistämällä alustat yhdessä parantaa arviointia. Mitä suurempi korrelaatio Affymetrix alustan voisi johtua Itse CCLE data myös generoidaan Affymetrix paneelit (Affymetrix SNP 6,0).

Laaja Muutoksia DNA Copy kokoonpano Esiintyy NCI-60 Cell Lines

globaali näkymä NCI-60 genomista koostumus tuotettiin käyttäen CBS segmentoitu aCGH tuloksia. Kuva 3 näyttää edustavia esimerkkejä useiden genomin vaihtelun tyyppejä. Täydellinen versio NCI-60 on saatavana kuvassa S1 ja nettisivuillamme [21]. Nämä näytöt osoittavat, että useimmat solulinjat osoittavat genomista muutoksia, kuten usein genomista tappiot ja voitot sekä muuttuneessa ploidia. Tyypit vaihtelua genomien kuitenkin vaihtelevat suuresti NCI-60. Vain jotkut solulinjat osoittavat normaali (2 N) kopiomäärä muutamia muuttunut segmenttien, kuten CO: HCT_15. Joissakin on useita muutetun genomi segmenttejä noin 2 N kokonaismäärä kopiomäärä (esim RE: CAKI_1). Toiset ovat paljon muuttunut segmenttien sen lisäksi, että siirtynyt 2N, kuten BR: MCF7, CNS: SF_268, LE: RPMI_8226, ME: MALME_3M, OV: NCI_ADR_RES, ja PR: PC_3. Tiedot osoittavat selvästi vaihtelua esiintyy poikkeavuuksia NCI-60-genomien.

x-akseli on kromosomaalinen sijainti koettimien, värillinen kromosomi numero ja tilata perimän aseman. Y-akselilla on log suhde anturin intensiteetit. Musta horisontaalinen merkit osoittavat keskimäärin log

2 kappale, kussakin segmentissä, kun se laskettiin Circular Binary segmentointi (katso materiaalit ja menetelmät). Määrä hajonta ylä- ja alapuolella segmenttien mustia merkkejä osoittaa tason anturi vaihtelua. Paikoissa Joidenkin syöpään liittyvien geenien, joilla on polttoväli voitot tai tappiot on myös osoitettu. Korkean resoluution kuvia kaikille NCI-60 solulinjoja ovat saatavilla kuvassa S1 ja verkkosivustollamme [21].

korkean intensiteetin (absoluuttinen log

2 arvo on suurempi kuin 1,5, eli n kopiomäärän suurempi kuin 5,60 tai alle 0,71) monistuksissa (voitot) ja poistot (tappiot), visualisoitu kuviossa 3 ja kuviossa S1, luetellaan niiden sijainnit taulukossa S2 solulinja, koska niiden mahdollisille merkitystä. Nämä suuret voitot ja tappiot ovat kromosomi harhojen, jossa on kolme kromosomia (9, 3 ja 6), jossa on useita muutoksia useissa solulinjoissa, ja yksi (kromosomi 21), jossa ei ole merkittyjä voittoja tai tappioita. Nämä tiedot tunnistaa chromosome- ja soluspesifisiä polttovälin monistukset ja poistot.

Global DNA Kopioi numero Alteration NCI-60

edelleen luokitella genomisen kopiomäärä vaihteluja NCI-60, kaksi parametrit olivat peräisin aCGH (taulukko 1). ”Osuus genomin saanut tai menettänyt” on yleinen osa genomin, joka on saanut tai menettänyt (verrattuna 2N); ”numero on saanut tai menettänyt alueita” kohti genomin edustaa kumulatiivinen määrä muuttuneen segmenttejä (saanut tai menettänyt verrattuna 2N).

vertailu kahden parametrin (osuus ja lukumäärä voitot ja tappiot) osoittivat tilastollisesti erittäin merkitsevä positiivinen korrelaatio (Pearson r = 0,76, p-arvo = 1,2 × 10

-12), liittämällä taajuus kumulatiivinen osa genomista muutoksia. Solulinjat vähiten usein genomista muutoksia mukaan ensimmäinen toimenpide (osuus genomin saanut tai menettänyt) ovat CO: HCC_2998 ja OV: IGROV1, ja ne, joilla on eniten ovat RE: A498 ja BR: T47D. Toisen toimenpiteen (alueiden lukumäärä, joilla voitot /tappiot), solut vähiten muutokset ovat CO: HCC_2998 ja CNS: SNB_75, ja solulinjat, joilla on eniten muutokset ovat BR: MCF7 ja RE: SN12C.

Keskeiset alueet Genome kanssa Focal copy Number muutokset, ja niiden suhdetta tiedossa ja tulevaisuuden tuumorisuppressoreita

Seuraavaksi etsittiin genomista kopiomäärä muutoksia, jotka olivat ”polttoväli” luonteeltaan. Lähestymistapamme oli etsiä genomisten segmenttien kanssa: i) eroa log

2 kopiomäärä vähintään 0,3 sekä sen vasen ja oikea naapureita (erot nousevat joko molemmat positiivisia tai molemmat negatiivinen); ii) leveys alle 5 Mb; ja iii) vähintään 10 (aCGH) antureista. Taulukossa 2 on yhteenveto näistä polttovälin muutoksia tunnettujen onkogeenien ja tuumorisuppressoreilla. Taulukossa S3 tarjoaa polttopiste muutos tila kaikille (18504) geenit sekä kopiomäärä ja geenien ilmentymisen (katso sarake S), ja niiden genomista kannat (sarakkeet Q ja R).

Yleisimmin fokaalisesti Poistetaan segmentti esiintyy 24 solulinjoissa, ja sisältää CDKN2A tuumorisuppressorigeeniä (p16

INK4a ja p14

ARF) kromosomissa 9 (kuvio 1 B, 2 ja 4A). CDKN2A deleetiot esiintyvät useimmissa NCI-60 kudostyypit, korkein esiintyvyys munuaisten (6 out of 8 riviä) ja keskushermoston soluissa (4 out of 6 riviä). CDKN2A poistot ovat harvinaisempia rintasyövän (1 ulos 5) ja munasarjojen (2 out of 7) ja poissa paksusuolen ja eturauhasen linjat. Yksityiskohtaiset tiedot CDKN2A löytyy taulukosta S3 (sarake Q). Seuraavaksi yleisimmin poistettu tuumorisuppressorigeeniä on PTEN kromosomissa 10 (taulukko 2 ja taulukko S3), joka on selvästi aliedustettuna 4 solulinjoissa: CNS: SF_539, LE: CCRF_CEM, PR: PC_3 ja RE: RXF_393. Se on myös fokaalisesti saadut OV: OVCAR_4. Erityisesti TP53, joka inaktivoituu mutaatioista 47 NCI-60 [3], [32] (meidän toimittanut tulokset) on polttoväli menetys vain kaksi solulinjoissa LE: HL_60, RE: TK_10 (taulukko S3), jotka osoittavat spesifisyyttä mekanismi toiminta knockdovvn tuumorisuppressoreilla.

. CDKN2A ja reunustavan sekvenssin kromosomissa yhdeksän kuusi solulinjoissa. Keskeinen pystysuora lila alue rajataan geenin sijainti. B. MYC ja reunustavan sekvenssin kromosomissa kahdeksan viiden solulinjoja. Keskeinen pystysuora lila alue rajataan geenin sijainti. C. ABCB1 (MDR1), ABCB4 ja reunustavan sekvenssin kromosomissa 7 emo OVCAR_8 ja sen lääkkeille vastustuskykyisiä johdannainen NCI_ADR_RES. Vihreä ja vaaleanpunainen keskipystyakselin alueiden rajaamiseksi uraa ABCB1 ja ABCC4, vastaavasti. A, B, ja C x-akseli on nukleotidin sijainnin. Y-akselin arvot vasemmalla ovat keskimäärin log intensiteettisuhteet, ja oikealla arvioidaan DNA-kopion numeroita. Musta vaakaviivoja tarkoittavat keskimääräistä lokin intensiteetin suhde kussakin segmentissä, kun taas ruskea pistettä lokin intensiteettisuhteet kunkin koetin.

tunnetun onkogeenien, yleisin polttoväli vahvistus tapahtuu CCND1 ( sykliini D1) kromosomissa 11, ja MYC, kromosomista 8. CCND1 on polttoväli voittoja 4 solulinjoissa (CNS: SF_295, ME: SK_MEL_28, ME: SK_MEL_5, RE: TK_10) mukaan lukien 2 melanoomat. MYC monistetaan neljällä solulinjoissa CO: SW_620, LE: HL_60, LE: RPMI_8226 ja PR: PC_3 (kuvio 4B).

Lisäksi tunnetaan onkogeenien ja tuumorisuppressoreilla, yksi voimakas monistukset havaittiin OV: NCI_ADR_RES solulinjaa kromosomissa 7q21.12 (kuvio 3, alempi vasen paneeli ja kuvio 4C). Tämä vahvistus käsittää kaksi effluksipumpun ABC transporter geenejä, ABCB1 ja ABCB4 (kuvio 4C), ja on yhdenmukainen korkea doksorubisiini (adriamysiini) vastus tämän solulinjan [33], [34]. Muut kuin tämä kromosomi 7 polttoväli vahvistus, OV: NCI_ADR_RES solulinja esittää aCGH profiilin verrattavissa sen emolinjan OV: OVCAR_8 (Kuva S1).

korrelaatio Gene Expression ja DNA Kopioi numero

määrittämiseksi suhde DNA: n kopioiden lukumäärä, ja transkripti ekspressiotasot, laskimme väliset korrelaatiot kahden parametrin kaikille (18504) geenit sekä kopioluku ja geenin ilmentymistä. Taulukko 2 ja taulukko S3 antaa näille korrelaatioarvoa, sekä vastaava p-arvo ja FDR varten tuumorisuppressorien, ja kaikkien geenien, vastaavasti. Histogrammi kuviossa 5 osoittaa, että mediaani Pearsonin korrelaatio on r = 0,247, joka tarjoaa maailmanlaajuisen indikaattori vaikutuksesta geenikopiomäärä ilmentymiseen.

Histogrammi Pearsonin korrelaatiot kopiomäärä ja geenien ilmentyminen täydellistä joukko 18504 geenien molempien arvojen kanssa käytettävissä. Alempi ja ylempi sarjaa viivamerkkien yläpuolella x-akselin esittävät korrelaatioita yksittäisten onkogeenien (punaisella) ja kasvaimen vaimentimet (sininen), tässä järjestyksessä.

mediaani korrelaatio yhdistetyn datan on suurempi kuin minkään yksittäisen alustan (Agilent: 0,212, NimbleGen: 0,149, Affymetrix: 0,242, Illumina: 0,226), jälleen ymmärtää, että yhdistetyn datan parantaa kopiomäärä arvio yli käyttäen yksittäisen alustalla.

osajoukko 101 tunnetaan tuumorisuppressoreilla oli merkittävästi korkeampi mediaani korrelaatio (r = 0,408, kuvio 5) kuin koko genomin (r = 0,247, kuvio 5). Alijoukko 96 tunnettujen onkogeenien osoitti vain hieman suurempi korrelaatio verrattuna koko genomin (mediaani r = 0,255; kuvio 5). Nämä tulokset osoittavat, että geenin menetys vaikuttaa ilmentymisen tiedetään tuumorisuppressoreilla suuremmassa määrin kuin joko ”kaikki geenit” tai onkogeenit ryhmiä.

tunnistaminen Novel Oletetut tuumorisuppressorigeeneille

Koska polttoväli muutokset DNA kopioluku tunnettujen tuumorisuppressorigeeneille (kuvio 1 B ja C, kuva 3, taulukko 2) osoittivat erittäin merkittävä korrelaatio opintosuoritusotteensa ekspressiotasoja (kuvio 5, taulukko 2), käytimme tätä ominaisuutta etsiä ja tunnistaa muita geenejä, joilla on potentiaalisia suhteessa syöpää. Meidän lähestymistapamme perustui tulokset tunnetun tuumorisuppressoreilla CDKN2A ja PTEN (taulukko 3). Valintakriteerit uusia geenejä tarvitaan: i) väliset korrelaatiot DNA kopiomäärä ja transkripti merkittävässä määrin on FDR 0,05, ii) polttoväli -tappioiden at-vähintään kolme solulinjojen [polttoväli muuttuu määriteltiin -tappioista pienempi kuin 5 mb, jotka limittyvät geeni], ja iii) 03:01 tai suurempi suhde määrä solulinjoja tappioita verrattuna voittoja. Lisäksi me tarvitaan, että geenit kulkea neljäs kriteeri, joka ei saisi olla tiedossa tuumorisuppressoreilla sisällä 2 MB (välttämiseksi havaitsemiseen ”naapureita” tunnettuja kuljettaja tuumorisuppressoreilla).

arvioinut kaikki 18504 geenejä, joissa on sekä geenien ilmentymisen ja kopioluvun arvioi tunnistaa ne, jotka läpäisivät edellä mainitut kriteerit. Kolmekymmentä yksi geeneistä kulunut kriteerejä 1-3 (taulukko S4), ja 22 täyttää kaikki neljä perustetta (sarakkeessa esitettyä U ja merkitty vihreällä). Ne geenit ryhmän osaksi 12 ”geeni klustereita” siten, että geenit samassa ryppäässä ovat vierekkäin ja on kopio numerot, jotka korreloivat voimakkaasti (toisiinsa) poikki NCI-60 (Pearsonin korrelaatio 0,8), mikä osoittaa, että ne ovat suurelta osin kadonneet tai saavuttanut ryhmänä. 22 uusi tuumorisuppressorin klusterit ovat cytobands 11q13.4, 17p12, 17p11.2, 17q23.1, 21q11.2, 21q21.1, 22q11.21, 22q12.2, 22q13.1 ja Xp22.31. Taulukossa 3 luetellaan kymmenen geenien, jotka kuuluvat nämä klustereiden ja on raportoitu olevan kasvaimia estävä ominaisuuksia.

Keskustelu

Nykyisessä tutkimuksessa yhdistimme tietoja NCI-60-solulinja paneelissa neljästä korkean resoluution array CGH alustoilla. Yhdistämällä neljä alustat saadaan aineisto, jossa i) lisääntynyt koetin kattavuus, ii) korkeampi korrelaatio kopioluku arvioi päässä CCLE (Cancer Cell Line Encyclopedia), ja iii) suurempi korrelaatio geenien ilmentymisen, mikä osoittaa paremmin arvioi, että jokin alustalla yksin .

aineisto lisää joukko molekyylitason tietoja varten NCI-60, helpottaa integroiva ( ”integromic”) [4], [8], [32], [35] tutkimuksia syövän biologian ja molekyyli- farmakologian. Tiedot ja analyysityökaluja laitteistojen käyttö ovat julkisesti nähtävillä myös NIH CellMiner web suite [21] (kuvio 1A). Tarjoamme myös esimerkki siitä, millaisia ​​integroiva analyysi voidaan tehdä. Vertaamalla DNA kopion numero CDKN2A, tunnettu kasvain vaimennin sen mRNA: n ilmentymisen paljastaa vankka tapa, jolla tämä molekyylien muutos liittyy geenien ilmentymisen, ja sen usein inaktivaatiomenetelmät NCI-60 (katso kuvio 1 ja taulukko S3). Vertaamalla DNA kopion numero CDKN2A yhdisteeseen tietokantaan paljastaa FDA-hyväksytty lääke mitoksantronilla (NSC301739) olevan aktiivisempi solulinjoissa CDKN2A Knockout (kuva 2).

kuvioita voitot ja tappiot

Vastaa