PLoS ONE: S-Score: pisteytysjärjestelmää tunnistus- ja priorisoinnin ennustettu Cancer Genes

tiivistelmä

Uusi menetelmä, joka mahdollistaa tunnistamisen ja priorisoinnin ennustetun syövän geenien tuleville analyysin esitetään. Tämä menetelmä tuottaa geenispesifiseen pisteet nimeltään ”S-Score” sisällyttämällä tietoja eri tyyppisiä analyysejä, mukaan lukien mutaation seulonta, metylaatiostatus, copy-numero vaihtelua ja ilmaisun profilointi. Menetelmää sovellettiin tietoja Cancer Genome Atlas ja auttanut tuomaan esiin tunnettujen ja mahdollisesti uusia oncogenes ja tuumorisuppressoreita liittyvät eri kliinisiä piirteitä kuten lyhin aikavälillä hengissä munasarjasyöpää sairastavilla potilailla ja hormonaalista alatyyppejä rintasyöpäpotilailla. Lisäksi ensimmäistä kertaa genomin laajuinen etsiä geenejä, jotka käyttäytyvät kuten onkogeenien ja tuumorisuppressoreita eri kasvaintyypeissä suoritettiin. Me kuvitella, että S-pisteet voidaan käyttää standardimenetelmää tunnistamista ja priorisointia syövän geenien seurantatutkimuksissa.

Citation: de Souza JES, Fonseca AF, Valieris R, Carraro DM, Wang JYJ, Kolodner RD, et ai. (2014) S-Score: pisteytysjärjestelmää tunnistus- ja priorisoinnin ennustettu Cancer Genes. PLoS ONE 9 (4): e94147. doi: 10,1371 /journal.pone.0094147

Editor: Gil Ast, Tel Avivin yliopisto, Israel

vastaanotettu: 12 marraskuu 2013; Hyväksytty: 13 maaliskuu 2014; Julkaistu 7 huhtikuuta 2014

Copyright: © 2014 de Souza et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus tukivat CNPq avustus 483775 /2012-6 on SJS ja National Institutes of Health myöntää GM26017 on RDK. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

saatavuus eri ”omiikka” teknologiat ja viimeaikainen kehitys seuraavan sukupolven sekvensointi ovat tuoneet uusia näkökulmia alan syöpätutkimuksessa [1]. Cancer Genome Atlas (TCGA) hanke, esimerkiksi, on herättänyt suuria tietomääriä soveltamalla erilaisia ​​”omiikka” teknologiat tutkimaan elin-paikkasidonnainen syöpä yksilöitä [2] – [5]. TCGA tiedot sisältävät somaattisia mutaatioita, geenien ilmentyminen, metylaatio ja kopioluvun vaihtelu, joka yhdessä kliinisen tiedon potilaan ovat merkittävä voimavara uusien strategioiden diagnostisten ja hoitotoimenpiteiden sekä tarjoaa lähtötietoja yksityiskohtaisemman tutkimuksia geenien ja reitit [2] – [5].

Nämä genominlaajuisten tietoja on käytetty tunnistamaan geenejä, jotka ovat muuttuneet syövässä. Nämä muutokset esiintyvät tyypillisesti tuumorisuppressorigeeneille kuten p53 tai onkogeenien kuten KRAS. Muutoksia tuumorisuppressorigeeneille yleensä johtavat lakkaa toimimasta vastaavien proteiinien samalla muutoksia onkogeenien johtaa lisääntyneisiin tai muuttuneen toiminnan joko johtui ilmentymisen tai aktivoivia mutaatioita. Vaikka on olemassa geenejä, jotka ovat usein muuttuneet syöpä, silmiinpistävä esimerkkinä p53, yksi tärkeimmistä päätelmiä ensimmäisestä suuren mittakaavan tutkimuksia on, että kasvaimia prosessi ohjaa muutoksia erilaisia ​​geenejä, sekä erikseen ja yhdessä, riippuen yksittäisestä yhteydessä potilaan, muiden tekijöiden ohella [2] – [7].

Yksi tärkeä kysymys analysoitaessa näitä ”omiikka” aineistoja on, miten mitata kaikkien geneettisiä muutoksia löytyi kohortin näytteitä. Mitä vaaditaan tällainen vaikutus tutkimus on geenispesifiseen pisteet, joka on sekä laadullisia (osoittaa mikäli geeni on vaimennin, onkogeenin, jompikumpi tai molemmat) ja määrällisiä (joka ilmaisee taajuuden muutoksia kyseisen geenin annetulle kasvaimet). Aikaisemmat yritykset tuottaa tulokset syövän geenejä on käytetty yhden tyyppistä dataa, joko mutaation taajuus tai ekspressiokuvio [6], [8]. Viime aikoina, Volgestein et ai. [1] ehdotti strategiaa, jossa otetaan huomioon sekä tyyppi somaattisten mutaatioiden (toistuva missense varten onkogeenien ja inaktivoivat mutaatiot varten tuumorisuppressoreilla) ja niiden taajuus (hyväksyivät 20% sääntö, eli ne tyypit mutaatioiden piti ilmestyä at vähintään 20% analysoiduista näytteistä). Vaikka tämä strategia voi tehokkaasti tunnistaa yleisimmät kuljettaja mutaatioiden kasvaimissa, se ei tutustua koko kirjo geneettisiä /epigeneettiset muutokset, jotka tuottavat ominaisuus geneettinen heterogeenisyys kasvaimia. Toinen lähestymistapa on ollut mukana laskettaessa määrä ei-tarpeeton näytteet, jossa tietty geeni tai joukko geenejä on muutettu. Vaikka tämä strategia on käytetty laajasti, kuten esimerkiksi CBio Cancer Genome portaali [9], se ei erottele onkogeeninen ja kasvaimen tukahduttamalla muutoksia eikä salli käyttäjää antamaan eri painot tyypin geneettinen muutos löydetty.

Tässä ehdotamme S-pisteet, joka integroi tietoa mutaatiostatus, ilme kuvio, metylaatiostatus ja kopioluvun tuottaa ainutlaatuista arvoa suoraan verrannollinen taajuuteen, jossa tietty geeni on muuttunut syövän tyyppi. Kriittinen arvo tässä menetelmässä on, että se helpottaa tunnistamista ennustetun syövän geenien, järjestyskäskyjä ne priorisoida ne myöhempää syvällistä analyysia ja osoittaa mitkä ominaisuudet (esim mutaatio, ilme, metylaatio, kopiomäärä muutos ja niiden yhdistelmät) olisi tutkittava tarkemmin. Osoituksena Periaatteessa tässä S-pisteet menetelmää sovellettiin saatuihin tietoihin Cancer Genome Atlas (TCGA) hanke GBM, peräsuolen, munasarja- ja rintasyövän kasvaimia.

Materiaalit ja menetelmät

Tietolähde

Expression z-arvoja, metylaatio ja synergisillä CNV (kopiomäärä vaihtelu) tiedot saatiin cBIO portaaliin käyttämällä CGDS-R-paketti, joka tarjoaa perustiedot joukko toimintoja istä Cancer Genominen data Server (CGDS) kautta R alustan tilastollisia computing (https://cran.r-project.org/web/packages/cgdsr/index.html). Somaattiset mutaatiot tiedot saatiin COSMIC tietokannasta [10] ja paikallisen koottu kaikki somaattisista mutaatioista löytyy kirjallisuudesta. Kynnysarvot kaikenlaisia ​​tietoja käsitellään jäljempänä. Kliiniset tiedot kaikista näytteistä saatiin TCGA kotisivuilta (https://tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp).

CNV vahvistusta ja poisto

Otaksutuista kopioluvun pyytää näytteitä määritettiin synergisillä [9]. Julkaistut synergisillä kynnysarvoja käytetään tässä tutkimuksessa olivat: homotsygoottisia poistetaan, = -2; poisto, -2 = -1; neutraali -1 +1; voitto, = +1 2; ja vahvistus, = 2. Boxplots luotiin käyttäen ggplot2, kuvatyökalulla R- tilastopaketilla.

Expression analyysin

Expression data cBio portaalia käytettiin analyysissä esitetään tässä [9]. Ilmaisu tasolla, koska on suhteellisen ilmaus tietyn geenin verrattuna ilmentymisen että geenin vertailupopulaatioon (joko vieressä normaali näytteitä tai kasvaimia, jotka ovat diploidinen että geeni). Ylös ja alas-asetusta oli päätellyt Z-score kyseisen ilmaisun tasolla, eli montako tavallista poikkeamat keskiarvosta ilmaisun viiteväestöstä. Samaa ilmaisua tietoja käytettiin laskettaessa S-pisteet kuviossa 1 ja myös itsenäisenä aineisto kuvassa 2.

Poikittain harmaat viivat osoittavat Z-score kynnysarvo 3. GBM, glioblastoma; OV, munasarjasyöpä; BRCA, rintasyöpä; ja COADREAD, peräsuolen syöpä.

Kukin tietopiste vastaa näytteen. (A) Scatter graafinen esitys lauseke (Y-akseli) ja metylaatiostatuksen (X-akseli) varten TMEM101 sarjassa munasarjojen kasvainten TCGA. (B) Scatter graafinen esitys lauseke (Y-akseli) ja kopioi numero tilan FBXO25 munasarjasyöpään alkaen TCGA. Perustuen synergisillä arvoihin, näytteet jaetaan eri luokkiin (X-akseli). Katso Menetelmät synergisillä kynnysarvoja. (C) Scatter graafinen esitys lauseke (Y-akseli) ja kopioi numero tilan ACTR5 paksusuolen kasvainten TCGA. Perustuen synergisillä arvoihin, näytteet jaetaan eri luokkiin (X-akseli).

Somaattiset mutaatiot

Jos haluat laskea S-pisteet, me vain harkita nonsensemutaatiota (muuttuja ns vuonna yhtälöt esitetään tekstissä) löytynyt vastaavan geenin että kasvaimen tyyppi. Vaihteleva ositettiin kaksi mahdollista tilannetta: jos vain nonsensemutaatiota esiintyy kasvaimen näytteistä TCGA otettiin huomioon ja missä nonsensemutaatiota esiintyvät samassa kasvaimen tyyppi (kaikki näytteet saatavilla COSMIC) katsottiin. käytettiin tiedot esitetään kuvioissa 3 ja 4, kun käytettiin analyysiin esitetty kuvassa 1, kuva 5 ja Taulukko 1.

heatmap käyrä kuvaa geenien S-pisteiden merkitsevää eroa lyhyen ja pitkän -term selviytymisen Munasarjasyöpäpotilaiden kasvaimia. Sininen on osoitus negatiivinen S-pisteet, kun keltainen osoittaa positiivinen S-pisteet.

S-pisteet vertailua varten 50 top onkogeenien ja 50 top tuumorisuppressoreita välillä ER-PR- ja ER + PR + rintasyöpä alatyyppejä. Jokainen tietokohtaan on geeni. X ja Y-akselien edustaa S-pisteet ER + PR + ja ER-PR- alatyyppejä, vastaavasti.

Genominlaajuiset analyysi geenien käyttäytyy tuumorisuppressoriproteiinia yhdessä kasvaimen tyyppi ja onkogeenin toinen kasvain tyyppi. Kuusikymmentäseitsemän geenien S-pisteet -2,5 yhdessä kasvaimen tyyppi ja S-pisteet 2,5 eri kasvaintyyppi valittiin ja lämpökarttana osoittaa niiden S-pisteet kaikkien kasvaintyyppien esitetään. Sininen edustaa negatiivinen S-tulokset taas keltainen edustaa positiivista S-pisteet.

Tulokset ja keskustelu

S-pisteet saadaan yhtälöstä # 1: (1) jossa, (2) ja (3) B-

jossa

= määrä nonsensemutaatiota vastaaville geenin.

= näytteiden lukumäärä, joissa kunkin geenin on metyloitu .

= näytteiden kokonaismäärä informatiivinen metylointianalyysi.

= näytteiden lukumäärä, joissa kunkin geeni on deletoitu

= näytteiden kokonaismäärä informatiivinen CNV analyysiä.

= näytteiden lukumäärä, joissa kunkin geeni monistetaan.

= näytteiden lukumäärä, joissa kunkin geenin yli-ilmentyy.

= näytteiden kokonaismäärä informatiivinen geeniekspressioanalyysiä varten.

= näytteiden lukumäärä, jotka vastaavat geeni on ekspressoitu.

= indeksi vahvistusta.

= indeksi yli-ilmentyminen.

= indeksi nonsensemutaatiota.

= indeksi metylaation.

= indeksi poistoista.

= indeksi alle-ilmaisua.

Jos 1 ja 1, niin (4) B

Jos 1 ja 1, sitten (5) B

Jos ja ovat molemmat pienempiä kuin 1 sitten. Tässä katsauksessa loki on esitys log

2.

käyttö log yhtälössä # 1 mahdollistaa S-pisteet vaihtelevat negatiivinen (merkki kasvaimen tukahduttaa tai pienentää geenin aktiivisuus) positiiviseen (merkki onkogeeni tai lisääntynyt geenin aktiivisuutta) arvoja. S-pisteet kuin suhde (yhtälö # 2) ja (yhtälö # 3) tarkoituksena on myös antaa enemmän arvoa niille geenien esittää yksinoikeudella rakenteessa joko kasvaimen tukahduttaa tai onkogeeni aktiivisuuden vastaavaan kasvaimen tyyppi. Toinen tärkeä asia syytä korostaa, että kunkin tyyppiset tiedot, CNV, mutaatio, ilmaisun ja metylaatio, käsitellään erikseen ja on verrannollinen painoon antamaa Numeroindeksi liittyvät erilaiset tiedostot.

S-pisteet menetelmä testattiin käyttämällä tietoja TCGA projektin neljän tyyppisiä kasvaimia: glioblastooma (GBM), peräsuolen kasvain, rinta- kasvaimen ja munasarja kasvain. Kriittinen parametri laskettaessa S-pistemäärä on numeerinen indeksi käytetään kunkin tyyppistä tietoa. Löytää paras indeksi parametrien arvot yhtälöissä # 2 ja # 3, kaksi arvoa kullekin indeksille testattiin. Kaikissa skenaarioissa, enemmän painoa annettiin nonsensemutaatiota johtuu siitä, että tällainen muutos johtaa yleensä laski merkittävästi toimintaa vastaavan proteiinin. Lisäksi kaikissa skenaarioissa metylaatio ei käytetty koska laadun valvontaa.

Luettelo 138 syövän geenien tunnistaa Volgestein et al [1] käytettiin vertailukohtana arvioitaessa joissa asetetaan indeksien valitsisi enemmän tiedossa onkogeenien ja tuumorisuppressoreilla. Vaikka tämä lista koottiin käyttäen tietoja useista kasvaintyyppeihin ja täällä olemme vain analysoida neljä kasvaintyypit, uskomme analyysi on riittävän kattava tällaisen testin. Jokaisen kasvaintyyppi analysoitu tässä määrä geenejä S-pisteet -2 tai +2 laskettiin kunkin skenaarion (taulukko S1). Testata mahdollisen rikastamisen Monte Carlo simulaatio suoritettiin jossa random sarjaa 138 geenien (pois kaikki tunnetut ihmisen geenien S-pisteet kunkin kasvain) valittiin ja määrä äärimmäinen S-pisteet lasketaan. Kaikista testattu skenaarioissa tätä korkeamman arvon nonsensemutaatiota (= 5) ja arvon 0,5 kaikille muille indeksit edistänyt merkittävin rikastamista tunnettujen syövän geenien kaikkien kasvaintyyppien (taulukko S1). Lisäksi välttää bias takia mielivaltainen kynnysarvo (S-pisteet -2 tai +2), käytimme uuden kynnyksen jokaiselle kasvaintyyppi määritellään S-ottelun Z pisteet 2 (keskiarvo kaikki S-tulokset plus tai miinus kaksi keskihajonnat) (taulukko S2). Samoja indeksit, kuten edellisen analyysi osoitti korkeampi rikastamista tunnettujen syövän geenien. Tämä joukko indeksejä (= 5; = 0,5, = 0,5, = 0,5 ja = 0,5) käytettiin sitten kaikkien muiden tutkimusten.

saada enemmän tietoa ennustuskapasiteettia S-pisteet menetelmässä eri vertailuarvo strategia suoritettiin määritellä ”positiivinen ennustearvo” ja ”negatiivinen ennustearvo” jokaiselle tuumorikipua. Tuhat satunnainen sarjaa 50 geenien valittiin luettelosta 138 geenien Volgestein et al. [1] ja käytettiin laskettaessa keskimääräinen oikeilla positiivisilla ja vääriä negatiivisia. Samalla tavalla, tuhat random sarjaa 50 geenejä valittiin kaikista ihmisen geeneistä (miinus 138 syöpä geenit) valittiin ja käytetään laskettaessa keskimääräinen tosi negatiivit ja vääriä positiivisia kunkin kasvaimen tyyppi. Nämä arvot on esitetty taulukossa S3 On syytä mainita kuitenkin, että luettelo syövän geenien Volgestein et al. [1] ei ole kultainen standardi tämäntyyppisen analyysin, koska se sisältää useita geenejä, jotka ovat joko onkogeenien tai vaimentimia kasvaimen tyyppejä eri kuin tässä analysoitavissa. Nämä ominaisuudet todennäköisesti aliarvioidaan ennustuskapasiteettia S-pisteet menetelmällä.

Nämä aiemmat analyysit osoittavat, että S-pisteet menetelmä pystyy tunnistamaan

bona fide

onkogeenien ja tuumorisuppressoreilla. Tiedot on esitetty taulukossa 1 vahvistaa, että kokoaminen syövän geenien Volgestein et al. [1] painottuu äärimmäinen S-tulokset ( +2 tai -2). Kun normalisoitu kynnys käytetään (S-pisteet edustavat keskimääräistä S-pisteet plus tai miinus kaksi keskihajonnat) sama kuvio havaitaan (taulukko S4).

Kuva 1 tonttien jakamisesta S-pistemäärät kaikki ihmisen geenit kunkin kasvaimen tyyppi. Ne ihmisen geenejä S-tulokset, jotka olivat positiivisia tai negatiivisia ääripäät (Z pisteet 3) ainakin yhdellä kasvaintyyppi ovat taulukossa S5. Koska vahvistuksen tämän menetelmän, joka aiemmin tunnettiin tuumorisuppressorit ja oncogenes esittävät äärimmäistä S-arvosanoilla tämäntyyppisille kasvaimia. GBM Esimerkiksi geeni, jolla on korkein S-pistemäärä on EGFR. Muut geenit, joilla on korkea positiivinen S-tulokset ovat ne, jotka on kartoitettu samaan lokuksessa kuin EGFR (kuten SEC61G, LANCL2 ja ECOP) ja siksi monistetaan yhdessä EGFR. Vaikka nämä geenit eivät välttämättä kausaalisesti osallisena kasvaimia prosessissa, ne edustavat bona fide geneettisten muutosten kasvaimen tyyppi, joka voi tarjota uusia terapeuttisia ja diagnostisia mahdollisuuksia, kuten raportoitu matkustaja deletoitu kasvaimissa [11], ja siten olisi raportoitava . Tehokkuutta meidän menetelmä on myös kuvattu toisessa päässä ja S-pistemäärä jakeluun. Niistä geenit kielteisimmin S-pisteet ovat tunnettuja tuumorisuppressorigeeneille kuten CDKN2A (kielteisimmin S pisteet GBM), PTEN, NF1 ja RB1. S-pisteet kaikki ihmisen geenit neljän kasvaintyypeissä annetaan taulukossa S6.

Yksi hyöty S-Score on, että se on helppo tunnistaa geenien kiinnostavia lisäanalyysi. Otetaan esimerkiksi geenit FBXO25 (S-Score = -3,18 munasarjasyövän), TMEM101 (S-Score = -1,6 in munasarjasyöpä) ja ACTR5 (S-Score = 3,69 paksusuolen syöpä), jotka luokitellaan analyysimme kuten vaimennin, otaksuttu vaimennin ja onkogeeni, vastaavasti. Arviointi tonttien ilmaisun vs. kopioluvun tai metylointi näitä geenejä, tarvittaessa (kuva 2) helposti tunnistaa näiden geenien olevan tunnistettavissa osa TCGA tapauksista liittyy alentunut kopiomäärä ja vähentää ilmaisun (ehdokas estävä geeni), vähentää ilmaisun ja lisääntynyt metylaatio (ehdokas vaiennetaan estävä geeni) ja lisääntynyt kopiomäärä ja lisääntyneen ilmentymisen (ehdokas onkogeeni), tässä järjestyksessä. Havainnollistamiseksi käyttökelpoisuutta strategian tontteja tunnettujen onkogeenien ja vaimentimien tarjotaan kuvissa S1-S3. Tämäntyyppinen yksityiskohtaisempi luokittelu sitten helpottaa seurantatutkimuksissa tarjoamalla priorisointi geenejä, jotka perustuvat pisteet, tarkempaa analysointia. Yksikään kolmesta geenien edellä on aikaisemmin tunnistettu ollut mukana kehittämässä kunkin kasvaintyypeissä.

S-pisteet myös mahdollistaa suoran vertailun näytteiden luokiteltu eri tavalla biologisen ja /tai kliinisten parametri. Havainnollistamiseksi Tässä hakemuksessa näytteiden TCGA korkealaatuisesta serous munasarjasyöpään data jaettiin kvartiileja mukaan kokonaiselinaikaa. Sitten lasketaan S-pisteet kaikkien ihmisen geenien avulla näytteet kuuluvat ensimmäiseen (lyhin eloonjääminen) ja viimeinen (pisin selviytymisen) neljännekseen selviytymisen jakelun. Vertailu S-pisteiden laskettu kahden ryhmän antoi meille mahdollisuuden tunnistaa otaksuttu onkogeenien (positiivista S-pisteet) ja oletettua tuumorisuppressorigeeneille (negatiivinen S-tulokset), joka liittyy joko lyhintä tai pisintä eloonjääminen (kuvio 3). Useat identifioitujen geenien tiedetään markkereita hengissä. Esimerkiksi, Cdc42 inhibitio on liittynyt elinajan pitenemiseen hiirillä eturauhassyöpäksenografteissa [12]. Toinen esimerkki on CANX jonka alassäätöä on liitetty pidempään hengissä GBM potilailla [13]. Lisäksi geneettiset variantit RGS12 on liittynyt eloonjäämisen myöhäisvaiheen ei-pienisoluinen keuhkosyöpä [14]. Toinen mielenkiintoinen geeni on TJP2 jonka yli-ilmentyminen on liitetty pysyvyyttä GBM [15], kanssa rakenteessa kuvassa 3.

Niistä geenit tunnistaa tällä pisteytystä liittyvän selviytymisen, mielenkiintoisimpia ovat ne, joilla päinvastainen luokitusten (positiiviset ja negatiiviset tulokset) lyhin tai pisin selviytymisen kvartiileja. Huomasimme, että glucoronidase B (GUSB) oli positiivinen pistemäärä (3,04, osoittaa onkogeenin) lyhimmän selviytymisen ryhmän ja negatiivinen pistemäärä (-1,40, osoittaa tuumorisuppressorin) pisin selviytymisen ryhmässä. Glukuroni- ovat tunnettuja olla mukana leviämisen syöpäsolujen alkuperäisellä alueella [16] ja GUSB on hiljattain sisällytetty allekirjoituksen ennustamiseen imusolmuke etäpesäke kohdunkaulan syövän [17]. S-pisteet menetelmä vahvistaa sen ajatuksen, että GUSB on onkogeenisessä toiminto aggressiivisempia kasvaimia (lyhin selviytyminen). Kuitenkin sen kielteiset S-pistemäärä on vähemmän aggressiivisia kasvaimia osoittaa, että menetys GUSB voi ajaa munasarjasyöpää kehityksen tuloksena kasvainten ollessa vähemmän aggressiivisia. Mielenkiintoinen havainto meidän analyysi on yhdistys RAD23B ja XPC, molemmat kielteisiä S-tulokset, jossa lyhyen aikavälin elinkelpoisuuden (kuva 3). Koodaamia proteiineja näitä geenejä muodostuu kompleksi osallistuu DNA-vaurioitunut korjaus. Joukko muita geenejä, joilla vastapäätä S-tulokset lyhin ja pisin selviytymisen ryhmiä on esitetty kuvassa 3. Nämä geenit voivat edustaa mahdollisia prognostisia biomarkkerit sekä tavoitteet uusien hoitomuotojen kehittämiseen.

lähemmin potentiaali S-pisteytysjärjestelmän geenien tunnistamiseen liittyvien eri kliinisten parametrien, syöpäpotilaista päässä TCGA kohortin jaettiin mukaan kaksi hormonaalista alatyyppiä: ER + PR + ja ER-PR- (ER: Estrogeenireseptori, PR: progesteroni reseptorin ). Tiedot potilaista kummassakin alatyyppiä käytettiin sitten laskea S-pisteet kaikkien ihmisen geenien. Vaikka onkogeenejä kahdessa alatyyppejä ovat periaatteessa samat, paljon suurempi ristiriita havaitaan tuumorisuppressorigeeneille. Tämä näkyy sirontakuvaajaan kuvassa 4, joka sisältää alkuun 50 otaksuttu onkogeenien ja 50 otaksuttu vaimentimien (luokiteltu ER + PR + alatyyppi). Vaikka kaikki onkogeenien ER + PR + alatyyppi (S-pistemäärä noin 4) luokitellaan myös onkogeenien ER-PR- alatyypin (S-pistemäärä vaihtelee 1,42-5,50), kasvain vaimentimet ER + PR + (S -score noin -4) on erilainen luokittelu ER-PR- alatyypin (S-pistemäärä vaihtelee -4,85-+2,69). Itse asiassa suuri osa vaimentimet ER + PR + alatyypin luokiteltiin onkogeenien muiden alatyypin (kuvio 4). Nämä tulokset viittaavat siihen, että erot biologiset ja kliiniset piirteet näiden kahden rintasyövän alatyyppiä voi johtua eroista niiden tuumorisuppressoreilla geenejä. Nämä geeni allekirjoitukset tarjoavat tilaisuuden kehittämistä varten tavoitteita uusia diagnostisia, prognostisia ja hoitomenetelmät.

S-pisteet menetelmää käytettiin myös genomin laajuinen etsiä geenejä, jotka voivat käyttäytyä kuin vaimentimen yhdessä kasvaimen tyyppi ja onkogeenit eri kasvaimen tyyppi. Viime vuosina muutamia geenejä on osoitettu esittää tällaista mallia. Notch1, esimerkiksi, on tunnettu onkogeenin T-solujen akuutti lymfaattinen leukemia [18] – [19], mutta on esitetty myös tuumoria tukahduttavan aktiivisuuden ihon kasvaimissa [20] ja maksasyöpä [21]. Käyttämällä joukko tiukat kriteerit (S-pisteet 2,5 yhdessä kasvaimen tyyppi ja S-pisteet -2,5 eri kasvaintyyppi), huomasimme 65 geeniä, jotka osoittivat kasvaimia synnyttävän ja kasvaimen tukahduttava toimintaa eri kasvaintyypeissä (joukossa neljä tyyppiä analysoidaan täällä). Analyysimme tunnistettu LMO7 geeniksi käyttäytyy kuin kasvaimia estävä ja onkogeeni. Tämä geeni on raportoitu säädellä vähentävästi keuhkosyövän [22] ja joilta puuttuu tämä geeni on lisääntynyt alttius spontaani keuhkosyöpään [23]. Toisaalta, geeni näyttää olevan onkogeenin sekä rintojen [24] ja maksasyövän [25]. Toinen mielenkiintoinen ehdokas on USP12, geeni, joka koodaa deubiquitinase. Viime aikoina, USP12 on osoitettu olevan positiivinen säätelijä androgeenireseptorin, joka vaikuttaa pro-proliferatiivinen tavalla eturauhassyövässä [26]. USP12 voi toimia myös tuumorisuppressorina negatiivisesti säätelemällä AKT aktivointi ja siten edistää apoptoosia [27]. Muita erittelyjä tarvitaan täysin tutkia kaikki geenit esitetään kuviossa 5. On tärkeää korostaa, että Notch1 ei ole esiintynyt listallamme johtuu siitä, että emme ole käyttäneet leukemia tietoja meidän tutkimuksissa.

haittapuoli S-pisteet menetelmä, joka on rajoitus, kun pyritään luomaan tämäntyyppisen pisteytysjärjestelmä, on puute indeksin aktivoimiseen mutaatioita esiintyy onkogeenien. Esimerkiksi, aktivoimalla mutaatiot KRAS tiedetään olevan ratkaiseva tekijä monissa kasvaintyypeissä [28]. Vaikka S-pisteet KRAS oli positiivinen kolme neljästä kasvainten analysoidaan täällä, meidän menetelmä ei kyennyt täysin mitata tämäntyyppisiä aktivoivia mutaatioita onkogeenien. Yksi mahdollisuus olisi käyttää missensemutaatioita, voitaisiinko kyseiseen Volgestein et al. [1]. Eräs ongelma missensemutaatioita, kuitenkin se, miten arvioida niiden vaikutuksia proteiinin tasolla, ovatko ne aktivoivat, inaktivoivat tai neutraaleja. Vaikka on olemassa laskennallisia työkaluja, joiden tarkoituksena päätellä vaikutuksen missensemutaatio proteiinitasolla, olemme edelleen sitä mieltä, että niiden suorituskyky on yleisesti ottaen huono [29]. Koska kuitenkin paremmin ymmärtää luonteesta missensemutaatioita, nämä tyypit geneettisiä muutoksia voidaan sisällyttää laskennassa S pisteet.

Jotta S-pisteytysjärjestelmän enemmän hyötyä yhteisölle, portaali on tarjolla https://www.bioinformatics-brazil.org/S-score kanssa genominlaajuisten tulokset ladattavissa sekä hakujärjestelmään räätälöityjä kyselyitä. Lisäksi käyttäjät voivat muokata arvoja kaikki parametrit yhtälöissä # 2 ja # 3 ja tuottaa S-pisteet kaikkien tunnettujen ihmisen geenit. Luettelo kaikista TCGA näytteet jokaisesta kasvaintyyppi Tässä tutkimuksessa käytetyt palvelee taulukko S7.

tukeminen Information

Kuva S1.

Expression X metylointi juoni tunnetuista kasvaimia estävä MGMT. Kukin tietopiste edustaa GBM näyte. Tiedot osoittavat vaiennettaisi MGMT useissa GBM näytteissä.

Doi: 10,1371 /journal.pone.0094147.s001

(TIF) B Kuva S2.

Expression X kopioluvun vaihtelua kuvaaja tunnetun tuumorisuppressorin CDKN2A. Kukin tietopiste edustaa GBM näyte. Luokat kopioluvun vaihtelun määritteli synergisillä luokituksen. Homdel = homotsygoottinen poisto; Hetloss = menetys heterozygosis.

Doi: 10,1371 /journal.pone.0094147.s002

(TIF) B Kuva S3.

Expression X kopioluvun vaihtelua juoni tunnetuista onkogeeni erbB2. Kukin tietopiste edustaa rintasyöpä näyte. Luokat kopioluvun vaihtelun määritteli synergisillä luokituksen. Hetloss = menetys heterozygosis; Amp = vahvistusta.

Doi: 10,1371 /journal.pone.0094147.s003

(TIF) B Taulukko S1.

valinta indeksit parametrien S-pisteet yhtälöt. Kukin rivi edustaa skenaario arvot indekseissä. Numero suluissa vastaa geenien lukumäärän kynnysarvon ylittävien (S-pisteet +2 tai S-pisteet -2) todellisessa joukko 138 geenien Volgestein et al. [1]. Numerot kussakin solussa vastaavat lukumäärää simuloitu sarjaa, jossa määrä geenejä S-tulokset kynnyksen yläpuolella on yhtä suuri tai suurempi vastaava luku todellisessa asetettu (suluissa).

Doi: 10,1371 /journal. pone.0094147.s004

(DOCX) B Taulukko S2.

valinta indeksit parametrien S-pisteet yhtälöt. Kukin rivi edustaa skenaario arvot indekseissä. Suluissa vastaa geenien lukumäärän kynnyksen yläpuolella (S-pistemäärä arvot, jotka vastaavat keskiarvoa plus tai miinus kaksi keskihajonnat) todellinen joukko 138 geenien Volgestein et al. [1]. Numerot kussakin solussa vastaavat lukumäärää simuloitu sarjaa, jossa määrä geenejä S-tulokset kynnyksen yläpuolella on yhtä suuri tai suurempi vastaava luku todellisessa asetettu (suluissa).

Doi: 10,1371 /journal. pone.0094147.s005

(DOCX) B Taulukko S3.

Tuhat satunnainen sarjaa 50 geenien valittiin luettelosta 138 geenien Volgestein et al. [1] ja käytettiin laskettaessa keskimääräinen oikeilla positiivisilla ja vääriä negatiivisia. Positiivinen ennustearvo (PPV) laskettiin seuraavalla yhtälöllä: oikeita positiivisia /oikeita positiivisia + vääriä positiivisia. Samalla tavalla, tuhat random sarjaa 50 geenejä valittiin kaikista ihmisen geeneistä (miinus 138 syöpä geenit) ja käytetään laskettaessa keskimääräinen tosi negatiivit ja vääriä positiivisia kunkin kasvaimen tyyppi. Negatiivinen ennustearvo on laskettu seuraavalla kaavalla: true negatiivinen /true negatiivinen + vääriä negatiivisia.

Doi: 10,1371 /journal.pone.0094147.s006

(DOCX)

Taulukko S4.

Tunnetut syöpä geenit ovat äärimmäisen S-tulokset. Joukko geenejä (Real Set) S-tulokset suurempi kuin keskimääräinen plus kaksi keskihajontaa (Z pisteet = 2) tai pienempi kuin keskimääräinen miinus kaksi keskihajonnat (Z pistemäärä = -2) on 138 syövän geeni listan Volgestein et al. [1]. Numerot ”10000 simuloitu sarjat” rivi vastaa keskimäärin geenien S-pisteet yli tai alle kynnysarvon 10000 sarjoista, jotka 138 geenejä satunnaisesti valittu. Sulkeissa on aikaväli, joka vastaa keskimääräistä +/- 2 x standardipoikkeama. P-arvo eroa todellisen ja näennäisen sarjaa näkyy viimeisellä rivillä.

Doi: 10,1371 /journal.pone.0094147.s007

(DOCX) B Taulukko S5.

Korrelaatio Z-score ja S-pisteet BRCA kasvain. Jokainen taulukkolaskenta luettelot kaikista ihmisen geenien S-tulokset, jotka olivat positiivisia tai negatiivisia ääripäät (Z-score 3).

Doi: 10,1371 /journal.pone.0094147.s008

(XLSX) B Taulukko S6 .

S-pisteet kaikkien ihmisen geenien. Kunkin neljän kasvaintyypeissä analysoidaan tässä, kaikki ihmisen geenit aakkosjärjestyksessä listattu niiden vastaavat S-tulokset.

Doi: 10,1371 /journal.pone.0094147.s009

(XLSX)

Taulukko S7.

tunnistaminen kaikkien TCGA näytteet tässä tutkimuksessa käytetyt. Tunnistenumero kaikille TCGA näytteet tässä tutkimuksessa käytetyt.

Doi: 10,1371 /journal.pone.0094147.s010

(XLS) B

Kiitokset

Kirjoittajat ovat indebt Raimundo Furtado Neto auttamiseksi optimoinnissa S-pisteet algoritmia.

Vastaa