PLoS ONE: Yin Yang Gene Expression Ratio allekirjoitus Keuhkosyöpä Ennuste

tiivistelmä

Useat tutkimukset ovat osoittaneet geeniekspressiota perustuvia ennustetekijöiden allekirjoitukset keuhkosyöpään. Kaikki nämä allekirjoitukset rakennettiin harjoituskentältä aineistoja oppimalla korrelaatio geenien ilmentymisen kanssa potilaiden elinaika. Ne vaativat jokaisen uuden näytteen tiedot olla normalisoitu harjoitusdatasta, johtaa lopulta yhteisiä ongelmia alhaisen toistettavuus ja epäkäytännöllistä. Näiden ongelmien voittamiseksi, ehdotamme uuden allekirjoituksen malli, joka ei liity tietojen koulutusta. Oletamme, että epätasapaino kahden vastakkaisen vaikutuksia keuhkojen syöpäsoluja, edustaa Yin ja Yang geenit, määrittää potilaan ennustetta. Valitsimme Yin ja Yang geenien vertaamalla ekspressiotietojen normaalista keuhko- ja keuhkosyövän kudosnäytteitä käyttäen sekä valvomatta klustereiden ja polkuja analyysejä. Laskimme Yin ja Yang geenin ilmentyminen tarkoittaa suhdetta (YMR) kuin potilaan riski tulokset. Kolmekymmentäyksi Yin ja kolmekymmentäkaksi Yang geenejä tunnistettiin ja valittiin allekirjoituksen kehittämistä. Normaalissa keuhkojen kudoksia, YMR on pienempi kuin 1,0; keuhkosyövän tapauksissa YMR on suurempi kuin 1,0. YMR testattiin keuhkosyöpä ennuste ennustaminen neljä itsenäistä tietomääriä ja se merkittävästi ositettu potilaita korkean ja matalan riskin selviytymisen ryhmissä (p = 0,02, HR = 2,72; p = 0,01, HR = 2,70; p = 0,007, HR = 2.73; p = 0,005, HR = 2,63). Se osoitti myös ennustus kemoterapian tulokset vaiheessa II III. Monimuuttuja analyysissä YMR riskitekijä oli onnistunut ennustamaan hoitotuloksia kuin muiden yleisesti käytettyjen kliiniset tekijät, lukuun ottamatta kasvain vaiheessa. YMR voidaan mitata yksittäisen potilaan klinikalle riippumaton geenien ilmentymisen alustalla. Tämä tutkimus tuotti uutta käsityksen biologia keuhkosyövän ja valottavat kliinistä sovellettavuutta.

Citation: Xu W, Banerji S, Davie JR, Kassie F, Yee D, Kratzke R (2013) Yin Yang Gene Expression Ratio allekirjoitus Keuhkosyöpä ennuste. PLoS ONE 8 (7): e68742. doi: 10,1371 /journal.pone.0068742

Editor: Tone Frost Bathen, The Norja University of Science and Technology (NTNU), Norja

vastaanotettu: 15 tammikuu 2013; Hyväksytty: 3 kesäkuu 2013; Julkaistu: 17 heinäkuu 2013

Copyright: © 2013 Xu et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Kirjoittajat ei ole tukea tai rahoitusta raportoida.

kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Keuhkosyöpä on johtava syy syövän liittyvän kuolemat Pohjois-Amerikassa. Vaikka on ollut laskua keuhkosyöpäkuolemista miehillä johtuen vähentämisestä tupakoinnin viimeisten 50 vuoden aikana, se on edelleen osuus 29% kaikista mies syöpäkuolemista 2010 [1]. 5 vuoden yleinen eloonjäämisaste keuhkosyöpä on niinkin alhainen kuin 16% ja ei ole merkittävästi parantunut viimeisten 30 vuoden aikana [1]. Ei-pienisoluinen keuhkosyöpä (NSCLC) on yleisimmin diagnosoitu keuhkosyöpä osuus 85% vuotuisesta tapauksista. Noin 25%: sta 30%: NSCLC potilaista on alkuvaiheessa I tauti ja saada kirurgisia toimenpiteitä. Kuitenkin yli 20% näistä potilaista relapsi viiden vuoden kuluessa [2]. Adjuvanttihoidon on parantunut selviytymistä potilasalaryhmässä vaiheen II ja III sairaus. Ei kuitenkaan ole tiedossa, jotka potilaat ovat todennäköisesti taudin uusiutumiseen ja hyötyisivät enemmän ylimääräisiä hoitoja.

parantamiseksi kliinisiä tuloksia, tutkijat ovat investoineet paljon vaivaa tunnistamaan keuhkosyöpä biomarkkereita, joiden avulla lääkärit tehdä varhainen diagnoosi , ennustaa taudin luonnollisesti ja käsittelyn vaikutus. Genominlaajuisten ilmentymisen profilointi käyttäen mikrosirujen tekniikkaa on havainnut mahdollisia geeni allekirjoitukset luokitella potilaita eri selviytymisen lopputulokseen ikäluokat [3] – [17]. Aikaisemmin raportoitu mallit rakennettiin oppimalla korrelaatiokertoimet välillä geeniekspressiota ja potilaiden elinaika harjoituskentältä tietomääriä ja ne edellyttävät, että uusia testituloksia sarjaa normalisoidaan harjoitusdatasta. Näin ollen nämä allekirjoitukset on alhainen toistettavuus ja ovat epäkäytännöllisiä klinikalla ympäristössä. On vain vähän todisteita siitä, että jokin raportoitu geenin ilmentymisen allekirjoitukset ovat valmiina kliiniseen käyttöön [18].

Näiden ongelmien ratkaisemiseksi kehitimme empiirinen malli, joka ei perustu tietoon potilaiden elinaika varten määritetään keuhkosyöpä biomarkkereiden allekirjoitus. Gene sääntely on monimutkainen moniulotteinen prosessi, joka sisältää kirjon geenejä, jotka ovat joko käytössä tai tukahdutetaan, ja jonka ilme on joko jatkuva tai tilapäinen. Oletamme, että ennuste määräytyy kahden vastakkaisen ryhmää geenejä, jotka kutsumme Yin ja Yang. Keuhkosyövän soluja, normaali geenin ilmentyminen on väärin säädellystä johtaa soluproliferaatioon ja vähentynyt erilaistumista. Voima Yin Yang teoria on, että se yksinkertaistaa monimutkaisia ​​moniulotteisia näkökohtia geeniekspression kahteen vastakkaiseen mitat – Yin ja Yang, ja kun tasapaino Yin ja Yang varmistaa terveen tilan soluja. Aiemmin julkaistut tutkimukset ovat viitanneet vastakkaisten toimintojen tunnettujen tuumorisuppressoreilla ja onkoproteiineja Yin ja yang kasvainten synnyssä [19] – [21]. Oletamme, että sen sijaan, että yksittäisen geenin kaksi toiminnallisesti epätasapainoinen geeniryhmien (Yin ja Yang) keuhkosyövän soluja päättää kohtalosta kasvainsolujen, joka lopulta määrittää potilaan elinaika. Tarkka tunnistaminen Yin ja Yang geenit kasvaimen kehitystä voidaan käyttää kehittämään ennusteen allekirjoitus.

Materiaalit ja menetelmät

Keuhkosyöpä Patient Datojen

keskittyneet tutkimuksessamme on adenokarsinooma koska se on yleisempää keuhkosyöpää ja geeniekspression data liittyviä kliinisiä tietoja on helpommin saatavilla. Näyte tiedot Bhattacharjee

et al

. on kuvattu aiemmin [22]. Se koostuu 203 keuhkosyöpään potilaan näytettä, myös 139 adenokarsinoomat, 20 keuhkojen karsinoidien, 21 okasolukarsinoomia, 6 pienisoluinen keuhkosyövässä, ja 17 normaalin keuhkokudoksen kudosnäytteitä vierekkäisten osioiden. Niistä 139 adenokarsinoomat, 125 potilaan näytteet liittyvät kliinistä seurantaa tiedot elossapysymisaikojen ja toistumisen. Näyte tiedot Bild

et al

. sisältää 58 ensisijainen adenokarsinoomat kerätään Duke Keuhkosyöpä Prognostiset Laboratory [23]. Nämä näytteet liittyvät 1-6 vuotta potilaiden seuranta. National Cancer Institute johtajan Challenge Consortium (DCC) varten Molecular luokittelu Lung Adenokarsinooma näytteitä koostuu 442 adenokarsinoomien potilas- kliinisiä tietoja [13]. Nämä näytteet kerätään ja käsitellään 4 itsenäinen toimielimissä: Kanada /Dana-Farber Cancer Institute (CAN /DF), University of Michigan Cancer Center (UM), HL Moffitt Cancer Center (HLM) ja Memorial Sloan-Kettering Cancer Center (MSK ). Vaiheet I, II ja III adenokarsinoomat kerättiin, jossa noin 60% näytteiden vaiheen I kasvaimia. Kukaan potilaista sai ennen leikkausta kemoterapiaa tai sädehoitoa ja vähintään 2 vuoden seurannassa oli saatavilla. 288 keuhkojen adenokarsinooma (LUAD) näytteet The Cancer Genome Atlas (TCGA) Project on kattava kliinistä tietoa. Ulkopuolelle aineisto oli 20 potilasta, joiden elinaika ei ole käytettävissä ja 9 elävät potilaalla on seurata aikaa alle 2 päivää.

Gene Expression Data

geeni ilmentymistä Bhattacharjee näytteiden havaittiin Affymetrixin HU_U95Av2 GeneChip-. Raaka hybridisaatio intensiteetti tiedostoja (CEL) ladattiin https://www.broadinstitute.org/mpr/lung/. Geenin ilmentyminen indeksit prosessoitiin MAS5.0 algoritmin avulla Expressionist jauhin moduulin (GeneData, Inc, San Francisco, CA, USA). Ei vielä normalisointi tehtiin kussakin tietokokonaisuus pitääkseen yksilön näytteen riippumattoman geenien biomarkkereiden tunnistus. Paitsi kokosi analyysi ilmentyvät eri geenin tunnuksilla, Robust Multi-array Average (RMA) johdettu ja normalisoitu ekspressiomittaukset laskettiin raaka CEL tiedostoja. Geenin ilmentyminen Bild näytteiden havaittiin Affymetrix HU_U133plus2 GeneChip ja signaali-intensiteetti laskettiin MAS5.0 algoritmin. Tietojoukko on ladattu NCBI GEO tietokannasta (GSE3141). DCC Raaka HG_U133A CEL tiedostot on ladattu NCI caArray tietokannasta (https://array.nci.nih.gov/caarray/project/details.action?project.id=182) [13]. MAS5.0 algoritmia käytettiin geeniekspression yhteenvetoa. Ei normalisointi tai esisuodatus levitettiin näytteitä tai geenejä. 259 RNA-seq tietoja ladataan TCGA Data Portal (https://tcga-data.nci.nih.gov/tcga/tcgaDownload.jsp). Geeniekspressiota RKPM (lukee per kiloemästä kohden miljoonaa kartoitettu lukee) arvo eristettiin näytteestä tiedostoja.

Allekirjoitus Geenit tunnistaminen ja valinta

Ilmaisu indeksit yhteenvedon RMA-algoritmia ja edelleen normalisoitu itemwise Z-normalisointi käyttäen Genedata Analyst moduuli (GeneData, Inc., San Francisco, CA, USA). 2-D hierarkkinen Euclidean L2 etäisyys klustereiden täysin sidoksen puitteet sekä geenien ja näytteiden avulla selvitettiin differentiaalisesti ilmaisi biomarkkereiden geenien keuhkokasvaimia. Sääntelemättömät ja vaimentua geenien syövän kudoksissa valittiin 2D klusterointi. Geenit, jotka ilmaistiin suurempi normaalissa keuhkojen kudoksissa kuin keuhkosyövän soluja kutsutaan ”Yang” geeni ehdokkaita, toisaalta geenit ilmaistuna suurempi keuhkosyövän soluja kuin normaali keuhkojen kudoksia kutsuttiin ”Yin” geeni ehdokkaita. Nämä kaksi geeniä luettelot syötetty IPA9.0 (Ingenuity® Systems, www.ingenuity.com) vuorovaikutukseen verkon ja polku analyysi. Verkot rakennetaan suoraan vuorovaikutusta. Verkot, merkittävät tulokset valittiin lisäanalyysiä.

Gene Allekirjoitus luokitin Development

Ilmaisu arvot valitun Yin geenit ja Yang geenit poimittiin julkaistiin microarray ilmaisun tietoja. Aluksi Yin (Y) ja Yang (y) lauseke aritmeettinen keskiarvo suhde (YMR) laskettiin allekirjoituksen luokittelija kullekin näytteelle (YMR =). Koska 31 Yin geenejä ja 32 Yang geenejä tunnistettiin koetinsarjojen HG-U95A GeneChip- käytimme näitä koetinsarjojen poimia Yin ja Yang geeniekspression arvoja Bhattacharjeès näytteitä. Voit purkaa Yin ja Yang geenit eri alustoilla, käytimme näitä 63 koetinsarjojen ja /tai niiden geeni symboleita vastaamaan koetin sarjaa muita alustoja. Ensin tarkasteltiin paras ottelu koetinsarjojen jotka jakavat korkea identtisyys ja edustavat samat geenit. Paras ottelu koetinsarjaa tiedostoja voidaan ladata Affymetrix (https://www.affymetrix.com). Jos paras ottelu koetinsarjojen ei löydy tietyssä alustan, käytimme Yin ja Yang geenin symboleja. Yksi Yin tai Yang geeni symboli voi sisältää yhden koetinsarjaa (-pelissä) tai useita koetinsarjojen. Useiden tunnusten samassa geenissä symboli, keskiarvo käytettiin. In HG-133plus2 of Bild tietokokonaisuus, 62 geenit on laskettu keskimääräisen ilmaisu arvojen useilta koetinsarjojen koska vain yksi vastasi parhaiten koetin asetetaan HG-U95A 39651_at (RECQL4 geeni). In HG-133A alustan DCC tietokokonaisuus, 22 Yin geenien ilmentyminen oli peräisin 22 vastasi parhaiten koetinsarjojen, 3 geenit vastaavat yhden koetinsarjojen ja 6 geenien ilmentyminen oli keskimäärin ilmaus useiden koetin sarjat; 29 Yang geenien ilmentyminen oli peräisin vastasi parhaiten koetinsarjojen, ja 2 geenit useista koetinsarjojen. Potilas riskiluku oli peräisin YMR arvoista. Käyttämällä YMR raja-arvot, jaoimme potilaita korkean ja matalan riskin ennustetekijöiden ryhmiä. Koska 2-kertainen ero on usein valittu mielivaltainen arvo kahden vertailuihin, määrittelimme 2-kertaista Yin yli Yang kuin cutoff ja säädettiin sitten se perustuu normaalissa näytteessä tarkoittaa YMR tai syöpä näyte tarkoittaa YMR. Jos normaali keuhkojen näyte YMR on merkittävästi pienempi kuin 1,0 (esimerkiksi TCGA RNAseq tiedot), YMR cutoff sopeutetaan olla pienempi kuin 2,0. Jos normaali näyte tarkoittaa YMR ei ole käytettävissä tietylle datajoukon (esimerkiksi DCC ja Bild aineistoja), sopeutimme sulku arvo, joka on lähellä keskimääräistä YMR keuhkosyöpä datajoukon koska monet tutkimukset käyttävät keskimääräinen riski pisteet ositusta potilaille. Ilmaisu geenin arvoa voidaan mitata yhdellä näytteenottimella asetettu yhdellä alustalla mutta useita koetin asetetaan muissa alustalla. Tämä ero ilmentymisessä mittaus voi johtaa erilaisiin YMR sulku arvoja eri alustoilla. Odotamme samaa YMR kynnysarvon samalle alustalle. On syytä huomata, että nämä suuren mittakaavan ilmaisu alustoja alun perin suunniteltu tutkimus tarkoitukseen, ei kliiniseen käyttöön. Mielivaltainen YMR raja-arvot määritetään näiden eri alustoilla käytetään vain varten YMR allekirjoituksen validointi. Jatkossa optimoi yhden YMR sulku arvo johtuu kliinisesti merkittävää alustalla, kuten qPCR.

Vertasimme myös aritmeettinen YMR kanssa geometrinen keskiarvo Yin ja Yang Ratio (gYMR). Testata optimaalisen geenin koko, havaitsimme vaikutus pudottamalla geenit 31 Yin ja 32 Yang geenin luettelosta yhteyksiä kliinisiin tuloksiin. Olemme myös arvioineet merkitys YMR allekirjoituksen vertaamalla YMR ja suhde sattumanvaraisesti ryhmiin sama ryhmäkoko.

Tilastollinen analyysi

arvioimiseksi suorituskykyä YMR allekirjoitusta, käytimme kukin YMR kuten dikotominen tai jatkuva kovariaattina on Coxin suhteellisten riskien mallia, jossa 5-6 vuotta kokonaiselossaoloaika tai toistumisen-vapaa kuin tulosmuuttuja [13], [24] – [26]. Arvioitu riskisuhde 95%: n luottamusväli ja p-arvo antoi meille mahdollisuuden vertailla suoraan esityksiä YMR kovariaattina muita kliinisiä muuttujia. Kaplan-Meier tuote-raja menetelmiä ja log-rank testejä käytettiin arvioimaan ja koe erot eloonjäämistodennäköisyys välillä matalan ja korkean riskin potilasryhmissä. Perhe toiminto piirrettiin kunkin alaryhmän. Kaikki tilastolliset analyysit suoritettiin käyttäen Partek® ohjelmistoa, versio 6.3 (Partek Inc., St. Louis, MO, USA) tai R tilastollinen paketti Survcomp [27].

Validation

Jotta vahvistaa, että YMR on alle 1,0 normaaleissa keuhkojen kudoksiin ja yli 1,0 keuhkosyövän kudosnäytteistä, mittasimme YMR uusien itsenäisten aineistoja. Näitä aineistoja käsiteltiin eri alustoilla kuten Affymetrix GeneChip- HG-U95, HG-133A, HG-133plus2, Illumina BeadChip, ja kaksikanavainen array. YMRs laskettiin näistä aineistoja tai ilman tietoa normalisointi perustuu alkuperäiseen tietolähteiden.

validoimiseksi YMR allekirjoituksen keuhkosyövän ennuste, neljä itsenäistä aineistoja käytettiin: 125 Bhattacharjee adenokarsinooman Otostiedoille setti of HG_U95Av2 alustan, jonka elinaika ei käytetty mallissa rakennuksessa, 58 Bild adenokarsinoomat näytedatan HG-133Plus2 alustan, 442 DCC mallitiedostot HG-133A-alusta ja 259 TCGA näytteitä RNA-seq alustalla. Nämä ovat hyvin määritelty potilaan näytteitä kliinistä tietoa. Analyyseihin tässä tutkimuksessa selviytyminen tai toistumista vapaa tulokset verrattiin mukaan korkean riskin YMR (ts YMR on suurempi kuin 2,0 tai oikaistu sulku) ja matalan riskin YMR (YMR on pienempi tai yhtä suuri kuin 2,0 tai mukautetun sulku ) potilailla. YMR pisteet kerrostuneisuus samat vaiheet ja hoitovastetta testattiin seuraavissa ryhmissä DCC lla: vaihe I; vaiheen II III; saaneet kemoterapiaa; no kemoterapiaa; kemoterapian lavalla I; kemoterapian lavalla II III; ei kemoterapiaa lavalla I; ei kemoterapiaa lavalla II III.

Tulokset

tunnistaminen Candidate keuhkosyöpään biomarkkereiden Genes

Vertasimme normaali keuhkojen näytteitä kanssa keuhkosyöpä näytteistä potilailta sekoitettu kasvain vaiheissa eri selviytymisen kertaa tunnistaa ja valita geenien ryhmiä allekirjoitettavaksi kehittämiseen. Käyttämällä ilman valvontaa ryhmittely analyysi microarray tietojen Bhattacharjee

et al

. [22], tutkimme ero geeniekspression 17 normaalin keuhkokudoksen kudosnäytteitä ja 83 näytteitä eri keuhkosyöpä tyyppejä. 2D klusterointi, valitsimme alueella, jossa geenit vaimentua normaaleissa näytteissä, mutta yläreguloituja lähes kaikkien keuhkosyövässä (kuvio S1A). Alueella, jossa geenit ilmentyivät yksi tai muutama syöpätyyppien ei valittu. Havaitsimme 74 koetinsarjojen tällä alueella (kuvio S1B, taulukko S1). Olemme myös tunnistaneet alueen, jossa geenit yläreguloituja normaaleissa näytteissä mutta vaimentua lähes kaikkien keuhkosyövässä (kuvio S2A). Alueella, jossa geenit vaimentua yhdessä tai muutamassa syöpätyyppien ei valittu. Havaitsimme 108 koetinsarjojen tällä alueella (kuvio S2B, taulukko S2, kuva 1A).

. Klusterointi geenien tunnistamiseen. Koetin sarjat ovat riveihin ja näytteet ovat sarakkeissa. Ilmaisu indeksit Kaikkien 12625 koetin sarjat 100 näytettä yhteenvedon RMA-algoritmia ja edelleen normalisoitu itemwise Z-normalisointi. 74 voimistunut geenit (alaosa rivit) ja 108 (yläosa riviä) alas geenien syöpäkudoksiin valittiin 2D klusterointi alueilla. Esivalittu 74 ja 108 probsets näytettiin ryhmittelemällä uudelleen. B. Yin (alhaalla) ja Yang (ylhäällä) geenien valinta toiminnallinen analyysi. Ympyrät edustavat kaksi ydintä toiminnallisten vaikutusten Yin ja Yang. Geenit esiin sama väri ovat samassa vuorovaikutusta verkossa.

vertaamalla geenin ilmentymisen eri solutyyppien keuhkosyöpään normaalin keuhkojen solut, yhteinen Yin ja Yang-geenien kesken eri syöpiä voi voidaan tunnistaa. Gene klustereiden sijaan ryhmä tilastotieto testi, paitsi havaitsee ilmaisua kuvioita, mutta osoittaa myös jossain määrin geenin vuorovaikutusta samassa rakenteessa. Toisin ero geenien ilmentyminen johtuvat kahden ryhmän tilaston testejä, geeniekspressiomalleja johtuvat klustereiden on suurempi toleranssi vaihteluista johtuen näytteen keräys- ja tietojenkäsittely. Yksittäiset geenit voivat ole läsnä ero geeni lista johtuen suuria eroja löytyy muutamia näytteitä, mutta sama geenit voivat osoittaa samanlaista yleistä ilmentämiskuviota klusterianalyysillä.

Yin Yang geenit osoittivat vähän päällekkäisyyttä aiemmin raportoitu keuhkosyöpä prognostisten allekirjoitus geenejä. Kuitenkin monet Yin geenit raportoitu täällä havaittiin aiemmissa tutkimuksissa, jotka liittyvät keuhkosyövän tai muun kudoksen tyyppi syövän kehitykseen, kuten GRIN2D [28], GAST [29], AMH [30], TCF3 [31], EXOSC2 [32], GRM1 [33], CDT1 [34], RecQL4 [35], CSTF2 [36], FCGR2B [37], RNASEH2A [38], Cdc6 [39], CACYBP [40], BIRC5 [41], CDC25 [42], sääntelyviranomaisten [43], EN2 [44], ja MIF [45]. Vaikka

n-ras

esikasvaintekijän on Yin geenin luettelosta, emme löytäneet muita onkogeenien, jotka liittyvät keuhkojen kasvaimien syntyyn. Tämä voi johtua muutoksiin eri onkogeenien eri osajoukkoja keuhkosyövässä. Olemme kuitenkin spekuloida, että eteneminen geenit voivat pelata suurempi merkitys kuin geenien aloittamiseen tai edistäminen edennyttä keuhkosyöpää tumorigeneesin määritettäessä keuhkosyövän ennuste.

Pathway ja vuorovaikutuksen verkosto analysoi näistä 74 geeneistä annettiin valitsemalla kaksi verkot, jotka liittyvät kasvaimen morfologian (taulukko S3, verkko merkittävä pistemäärä 42) ja DNA: n replikaation (taulukko S4, verkosto merkittävät pisteet 30). Nämä verkot osallistuvat kanoninen Molecular Mechanisms of Cancer koulutusjakson (kuvio 1 B, kuva S3). Nämä verkot sisältävät 31 geenejä, joiden geeni symbolinimiä Hyväksytty Affymetrix U95 AV2 koetinsarjaa tunnisteita. Valitsimme nämä 31 geenejä Yin geeni ehdokkaat (taulukko 1). 108 vaimentua geenit muodostuvat kahdesta verkon ylläpitoon liittyvien (verkko merkittävä pistemäärä 63) ja solujen kehitystä (verkko merkittävä pistemäärä 23) prosesseja. RAR Aktivointi reitti ja Maksan stellate Cell Activation reitti (kuvio S4) vetoaa Yang geenit aiheuttavat monenlaisia ​​vaikutuksia kudosten homeostaasin, solujen proliferaatiota, erilaistumista, ja apoptoosin. On näyttöä siitä, että keuhkokudoksesta satamat Maksan stellate kaltaisia ​​soluja, jotka ovat vitamiini-A-tallentamiseksi keuhkojen soluihin [46] – [47]. Me haetaan painopiste geenit verkkoja, jotka osallistuvat solujen ylläpitoon ja solujen kehitysprosessin tuloksena on kaksi geenin ryhmissä. Nämä kaksi ryhmää (taulukko S5, S6) yhdistettiin, jolloin 32 ainutlaatuista geenien yhteensä. Me määritelty nämä 32 geenejä Yang geenin ehdokkaita allekirjoitettavaksi kehittämiseen (taulukko 2).

Gene allekirjoitus Lung Cancer

Rakentaa allekirjoitus malli, me laskenut YMR potilaalle riskin tulokset. YMR edustaa yksinkertainen yhdistelmästä tai vuorovaikutuksesta vaikutus Yin geenien ja Yang geenejä. Yhdistetty kulusuhde kertoo Yin ja Yang tasapaino asema keuhkosoluissa tai mikä ryhmä geenejä on aktiivisempi kuin muut ja laajuudesta tämän eron. Normaaleissa keuhkojen soluihin, Yang on suurempi kuin Yin. Syöpä fenotyypit ovat korkeammat YMR pisteet sitten liittyy suurempi riski taudin. Ensin validoitu meidän hypoteesia, että YMR on alle 1,0 normaaleissa keuhkojen kudoksiin ja yli 1,0 keuhkosyövässä kudoksissa. Käytimme useita riippumattomia näyte aineistoja eri alustoilla ja eri esikäsiteltyjä (taulukko S7). YMRs olivat vähemmän kuin 1,0 kaikissa normaaleissa keuhkoissa aineistoja [48] – [52] (kuvio 2). Olemme myös mitattiin YMRs 12 eri normaalista ihmiskudostyypeistä yhden datasarjan [52] (taulukko S8). YMRs olivat vähemmän kuin 1,0 normaalissa keuhkossa, samoin kuin muissa normaaleissa kudoksissa, kuten sydämen, perna, luustolihas, ja eturauhasen, mutta suurempi kuin 1,0 muissa kudoksissa, kuten maksassa. Tämä tulos viittaa siihen, että Yin ja Yang geeniekspressioprofiilien ovat kudos- tyypistä. Vuonna 83 näytteitä eri keuhkosyöpä tyyppejä, joista Yin ja Yang geenit tunnistettiin kautta ero geenien ilmentymisen määritystä kaikki näytteet oli YMR yli 1,0. YMRs yli 1,0 muissa itsenäisissä keuhkosyövän näytteestä aineistoja on myös esitetty kuviossa 2.

Microarray geenien ilmentyminen aineistoja eri raportteja eri alustoilla käytettiin. Aineistot kuvattiin taulukossa S7.

YMR Allekirjoitus ennustaa Survival Outcomes

arvioitiin YMR varten ennustetta neljän datasetin jossa potilas kliiniset tiedot olivat saatavilla. Ensin vahvisti YMR malli riski tuloksesta Bhattacharjee datajoukon [22], josta mallista rakennettiin. Koska potilaiden elinaika tai toistumisen vapaa aika tietoja ei käytetty mallinnuksessa, nämä tiedot asetetaan siis toimii itsenäisenä tietojoukko. Ensin testataan YMR jatkuvana muuttujana käytetään suhteellista riskin malliin ja osoittaneet, että lisääntynyt YMR liittyy huonompi tulokset viimeistään 6 vuoden toistumisen vapaa korko (p = 0,044, HR = 1,96) (taulukko S9). Sitten tutki YMR kuin dikotominen muuttuja ositusta potilaiden korkean ja matalan riskin ryhmiin. Koska normaali keuhko näytteet samoilta datajoukon esittää keskimääräisen YMR 0,91 ja 125 adenokarsinoomista on keskimääräinen YMR 2,23, me määritteli YMR sulku 2,0. Ryhmittelimme 125 adenokarsinooman potilaita suuri riski (YMR 2,0, n = 65) ja matalan riskin (YMR = 2,0, n = 60) ryhmät. Kuten kuviosta 3A YMR merkittävästi ositettu korkea toistuminen ja alhainen toistumisen riskiryhmiin (p = 0,013, HR = 2,7). Aiemmat tutkimukset ovat raportoineet merkittävän p-arvo niiden geenien allekirjoitukset. Tämä on odotettavissa kuin allekirjoitukset ovat kehittäneet potilaiden elinaika ja sitten käyttää uudelleen ennustaa elinaika. Kuten myöhemmin osoitti, ongelmana nämä lähestymistavat on niiden alhainen toistettavuus uusien itsenäisten aineistoja. Sitä vastoin YMR lähestymistapa ei ole koulutettu tiettyyn aineisto ja se olettaa työskennellä tietoja asetettu. Me sattumanvaraisesti 500 paria ryhmien samanlaisia ​​ryhmäkoot Yin ja Yang geenien 12625 geenit HU-95av2 alustan ja käytetään samassa suhteessa cutoff kuin YMR 2.0. 500 p-arvot ovat keskimääräinen p-arvo 0,75 (sd = 0,32) (kuva S5). Teimme löytää että neljä p-arvot näiden pistokokeiden ovat hyvin alhaiset (0, 0, 0, 1 E-18, vastaavasti), mutta niiden HRS ovat 1.0 tai lähes 1,0 näin nämä ryhmät eivät voi kerrostuvat riskiryhmiin.

. Vapaa-paluuaika toiminto käyrän (vähäinen riski n = 60; korkean riskin n = 65) adenokarsinoomien potilaiden Bhattacharjee

et al

. B. Kaiken elinaika toiminto käyrä adenokarsinoomien potilaista (vähäinen riski n = 27; korkean riskin n = 31) välille Bild

et al

. C. Potilaan näytettä (vähäinen riski n = 248; korkean riskin n = 194) ja DCC projektin. D. RNA-seq näytettä (vähäinen riski n = 121; korkean riskin n = 137) alkaen TCGA. Matala YMR tulokset (vihreä) ovat korkeinta ennustettu eloonjäämistä ja korkea YMR tulokset (punaisella) vastaavat suurin ennustettu riski.

sitten arvioitiin YMR suuri itsenäinen DCC tietokokonaisuutta . Näitä aineistoja kerätty ja käsitelty neljästä eri toimielimissä. Ne sisälsivät patologisten tietojen ja kliinisten kuvaavia tietoja taudin vakavuus leikkauksen ja kliinisen taudin kulku näytteenoton jälkeen [13]. Ryhmittelimme nämä 442 potilaiden YMR suurriskialueille (YMR 1,8, n = 194) ja matalan riskin (YMR = 1,8, n = 248) henkilöillä, koska keskimääräinen YMR on 1,85. Kuten kuviosta 3C nähdään ja taulukossa S9, selviytyminen tulokset näiden kahden ryhmän välillä olivat merkitsevästi erilaisia ​​(p = 0,005, HR = 2,63). Samoin käytimme YMR cutoff 1,4 Bild datajoukon koska keskiarvo YMR on 58 adenokarsinoomien on 1,6. YMR merkittävästi ositettu (p = 0,019, HR = 2,72) tämä riippumaton tietokokonaisuus osaksi korkea (YMR 1,4, n = 31) ja matalan (YMR = 1,4, n = 27) riskiryhmiin (kuvio 3B). Laskimme YMR suhde käyttäen RNA-seq data 259 TCGA näytteitä. Jatkuva YMR tulokset liittävät eloonjäämisaste merkitsevästi (p-arvo 0,007, HR 1,87) (taulukko S9). Dikotomista YMR allekirjoitus merkittävästi ositettu kehitti high (n = 137) ja matalan riskin (n = 121) ryhmät (p = 0,007, HR = 2,73) (kuva 3D ja taulukko S9).

Laskimme geometrinen keskiarvo Yin ja Yang geenien ilmentymisen suhde (gYMR) ja testattiin sen yhdessä huonon lopputuloksen sekä jatkuvana muuttujana ja dikotomisen vaihteleva. Kuten taulukosta S10, jatkuva gYMR ei toimi Bhattacharjee tietojen ja Bild tiedot, ja dikotomista gYMR ei toimi Bhattacharjee tietojen myöskään. Aritmeettinen YMR on vankka neljässä aineistoja. Jatkuva YMR ei osoittanut sen yhteyksiä kliinisiin tuloksiin on Bild tietojen joukko HG-133plus2 alustan (p = 0,49). Tämä johtuu siitä, että pieni datan koon herkkyys potilaan harha tai poikkeuksia. Sen jälkeen poistimme potilas GSM70223 jonka YMR on 6,35, p-arvo jatkuvasti YMR laski 0,08. Kun olemme kauempana potilaan GSM70159 jonka YMR on 2.87, mutta selvisi 73 kuukautta, p-arvo laski merkittävästi tasolle 0,0199. Meillä ei ole riittävästi tietoa auttaa selittämään, miksi tämä poikkeus on korkea YMR vaan pitkän elinaika. Kuitenkin nämä harha tai poikkeukset eivät vaikuta dikotomista YMR (cutoff 1,4), joka merkittävästi stratifies potilaiden riski tässä datajoukon (p = 0,02, HR = 2,72) (taulukko S9).

käyttäminen DCC tietokokonaisuus, testasimme vaikutus pudottamalla geenit Yin ja Yang geeni (Kuva S6). Pudottamalla yksi Yin geeni (217871_s_at, geeni MIF) parani merkittävästi p-arvo YMR, mutta sen HR pienenee samanaikaisesti (yläpaneeli kuvion S6). Pudottamalla yksi Yin geeni vaikuttaa p-arvo gYMR mutta ei vaikuttanut HR (keskimmäinen paneeli kuvion S6). Pudottamalla yksi Yang geeni aika ei vaikuta p-arvo sekä YMR ja gYMR (tietoja ei ole esitetty), eikä HR YMR ja gYMR (alapaneeli kuvion S6). Verrattuna YMR, gYMR kestää paremmin pudota-off vaikutus tai suurentunut riski yhdistys jonkin geenejä luovuttiin. Pudottamalla kolme Yin geenejä (HIST1H4J, CDC25A, ja IGFBP5) tuottaa parhaan suorituskyvyn gYMR DCC data (Middle paneeli kuvion S6). Kanssa lukuun ottamatta Bhattacharjee dataa kaksiluokkaisia ​​YMR, saman geenin pudottamalla ei paranna suorituskykyä joko YMR (taulukko S11) tai gYMR muissa kolmessa tietokokonaisuuksien (taulukko S12). Nämä tulokset osoittavat, että Yin ja Yang geeni lista voitaisiin optimoida pienempiin poistamalla yksi ja kolme geeniä. Tämä optimointi rajoittavat elinaika datajoukon testattu samanlainen rajoituksista tietojen koulutusta lähestymistapaa. Odotamme, että noin 30 Yin ja 30 Yang geenien varmistettaisiin edustuksen koko Yin ja Yang vaikutuksia syöpäsolujen ja tasaisen suorituskyvyn eri tietokokonaisuuksien. Pienemmät geeni luettelot voivat pitää saman tai parantaa suorituskykyä yhden datajoukon, mutta ei välttämättä toimi hyvin muiden tietojen käyttöä.

vertailu YMR aikaisemmin raportoitujen allekirjoitukset

Vertasimme eri näkökohtien YMR kuin aikaisemmin raportoitu allekirjoituksia. Jotka esitetään taulukossa 3, YMR on edennyt toistettavuus ja käytännöllisyys. Vertasimme myös ennustetekijöiden suorituskykyä YMR mallin äskettäin raportoitu 15-geenin allekirjoitusta [17]. Tämä allekirjoitus Väitettiin ylivoimainen moniin muihin aiemmin raportoitu keuhkosyöpä ennustetekijöiden allekirjoitukset testaamalla samat tiedot asetetaan kaikkien muiden allekirjoituksia. Käytimme samaa DCC datasarjan ja Bild adenokarsinooma data [23] peräisin eri alustalla (U133plus2) tässä vertailussa. Kuten kuviosta S7A, 15-geenin allekirjoitus merkitsevästi ositettu DCC näytteistä (p = 0,011, HR = 2,68), mutta ei Bild näytteistä (kuvio S7b, p = 0,6). Kuitenkin YMR paitsi ositettu DCC näytteet korkeaa riskiä ja pieni riskiryhmiin lisää merkittävästi (kuvio S7C, p = p = 0,005, HR = 2,63) kuin 15-geenin allekirjoitus, mutta myös (kuvio S7D, p = 0,019, HR = 2,72) erotti Bild näytteet korkean ja matalan riskin ryhmiin, että 15-geenin allekirjoitusta voinut. Emme vertailla kahta muuta aineistoja (NLCI, Agilent 44k, JBR 10, RT-qPCR), joita käytettiin Zhu

et al

tutkimuksen [17], koska näillä alustoilla eivät sisällä tarpeeksi YMR allekirjoitus geenit . Löysimme 15-geenin allekirjoitus toimii parhaiten levyepiteelisyövän keuhkosyövän joukossa kaikki viisi aineistoja, mutta YMR ei toimi näitä tietoja (tietoja ei esitetty), mikä todennäköisesti johtuu erosta tuumoribiologiassa välillä okasolusyöpä keuhkosyöpä ja adenokarsinooma.

Analyysi YMR ja Clinical kovariaatit

Arvioimme YMR kanssa klinikalla covariates keuhkosyövässä ennustetta.

Vastaa