PLoS ONE: soveltaminen Multi-SNP Approaches Bayes LASSO ja AUC-RF havaita Tärkeimmät vaikutukset Inflammatorinen Gene liittyvät muunnelmat virtsarakon syövän riski
tiivistelmä
Suhde tulehdus ja syöpään on vakiintunut useita kasvain tyypit, mukaan lukien virtsarakon syöpä. Suoritimme yhdistyksen tutkimuksen välillä 886 tulehduksellinen-geenin variantit ja virtsarakon syöpäriskiä 1047 tapauksissa ja 988 valvontaa Espanjan virtsarakon syövän (SBC) /EPICURO Study. Alustava tutkimus kanssa laajalti käytetty yhden muuttujan logistista regressiota lähestymistapa ei havaittu merkittäviä SNP korjaamisen jälkeen useita testejä. Olemme edelleen soveltaa kahta kattavampi menetelmiä kaapata monimutkaisuus virtsarakon syövän geneettistä alttiutta: Bayes Threshold LASSO (BTL), laillistettu regressiomenetelmä, ja AUC-Random Forest, koneellisesti oppimisen algoritmi. Molemmat lähestymistavat tutkia yhteisvaikutus markkereita. BTL-analyysi tunnisti allekirjoitus 37 SNP 34 geenien esittää yhdessä virtsarakon syöpä. AUC-RF havaitaan optimaalinen ennustearvo osajoukko 56 SNP. 13 SNP tunnistettiin molemmat menetelmät on koko väestöstä. Käyttämällä resursseja Texas virtsarakon syövän tutkimus pystyimme toistamaan 30% SNP arvioitu. Liitot välinen tulehduksellinen SNP ja virtsarakon syövän tarkasteltiin uudelleen keskuudessa tupakoimattomien vaikutuksen poistamiseksi tupakan, yksi vahvimmista ja yleisin ympäristöön liittyvä riskitekijä tähän kasvain. -A-9 SNP-allekirjoitusta havaittiin BTL. Kirjoittajat raportoivat, ensimmäistä kertaa, joukko SNP tulehduksellisten geenien yhdessä liittyy virtsarakon syövän riskiä. Nämä tulokset korostavat monimutkaisen rakenteen geneettinen alttius liittyy syöpäriskiä.
Citation: de Maturana EL, Ye Y, Calle ML, Rothman N, Urrea V, Kogevinas M, et al. (2013) soveltaminen Multi-SNP Approaches Bayes LASSO ja AUC-RF havaita Tärkeimmät vaikutukset Inflammatorinen Gene liittyvät muunnelmat Virtsarakon syövän riski. PLoS ONE 8 (12): e83745. doi: 10,1371 /journal.pone.0083745
Editor: Chuhsing Kate Hsiao, National Taiwan University, Taiwan
vastaanotettu: 25 kesäkuu 2013; Hyväksytty: 07 marraskuu 2013; Julkaistu: 31 joulukuu 2013
Copyright: © 2013 de Maturana et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Työ oli osittain tukee Fondo de Investigación Sanitaria, Instituto de Salud Carlos III (G03 /174, 00/0745, PI051436, PI061614, PI09-02102, G03 /174 ja Sara Borrell apurahan ELM) ja tiede- ja innovaatio (MTM2008 -06747-C02-02 ja FPU apurahan palkinto VU), Espanja; AGAUR-Katalonian (Grant 2009SGR-581); Fundacióla Maratóde TV3; Red Temática de Investigación Cooperativa en syöpä (RTICC); Asociación Española Contra el Cancer (AECC); EU-FP7-201663; ja RO1- CA089715 ja CA34627; Espanjan instituutti Bioinformatics (www.inab.org); ja jonka Intramural tutkimusohjelma of Division of Cancer Epidemiology and Genetics, National Cancer Institute, USA. MD Anderson tukea tälle Projekti sisälsi U01 CA 127615 (XW); R01 CA 74880 (XW); P50 CA 91846 (XW, CPD); Betty B. Marcus Tuoli rahasto in Cancer Prevention (XW); UT Research Trust Fund (XW) ja R01 CA 131335 (JG). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Virtsarakon syöpä (BC) on viidenneksi yleisin kasvain kannalta ilmaantuvuuden teollisuusmaissa osuus on noin 5-7% ja 2-2,5%: n vasta diagnosoitu syöpäsairauksia miehillä ja naisilla, vastaavasti. BC on yksi yleisimmistä syövistä johtuu sen kroonisesta luonteesta [1]. Tupakka ja työperäiseen aromaattisia amiineja ovat kaksi parasta perustettu ympäristö- riskitekijät [2], [3]. Lisäksi vahvaa näyttöä vaikutuksen yhteisen geneettisiä variantteja BC kehitys on saatu viime vuosina [4], [5]. Geneettinen alttius BC on tutkittu suhteessa geenejä, jotka koodaavat entsyymejä, jotka osallistuvat metaboliaan vierasaineiden, apoptoosin, solusyklin kontrolli, angiogeneesi, ja tulehdus [4]. Kuten jälkimmäisen prosessin, on olemassa todisteita siitä, että tulehdussolujen, proinflammatoristen sytokiinien, ja kemokiinit edistävät immunosuppression, syövän kasvua, ja etenemiseen [6]. Välinen yhteys krooninen tulehdus ja BC tukee yhdistysten välillä havaittu
Halkiomadot haematobium
ja okasolusyöpä [7] ja, vähemmän johdonmukaisesti, välillä uroteelisyövässä ja muita virtsatieinfektio [8]. Lisäksi suojaavaa vaikutusta pitkäaikaisen käytön steroideihin kuulumattomia tulehduskipulääkkeitä havaittu joillakin asia valvontaa tutkimuksia tukee tulehduksen roolista tämä syöpä [9], [10].
Useimmat yhdistys tutkimukset ovat keskittyneet havaitsemiseen tärkeimmät vaikutukset käyttämällä allele- tai genotyyppi-pohjainen testi jokaiselle yhden emäksen monimuotoisuus (SNP) erikseen. Kuitenkin tiedetään, että monimutkaiset piirteet, kuten BC, selittyvät useita lokusten melko pieniä yksittäisiä vaikutuksia [11]. Siten tämä yksinkertainen strategia todennäköisesti kaapata vain pieni osuus koko geneettinen varianssi taudin myönnetyn kaikki vaihtoehdot [12]. Siksi strategiat arvioida samanaikaisesti useita SNP ja niiden vuorovaikutuksia tarvitaan. Standard tilastollisia menetelmiä, kuten logistinen regressio eivät sovellu hyvin tähän tarkoitukseen. Tämä taso geneettisen monimutkaisuus merkitsee tilastollista haaste yhdistys tutkimuksissa, koska suuri määrä regressiokertoimia (
p
) verrattuna näytteeseen koko (
n
). Koneoppimisen algoritmeja tarjota vaihtoehtoja suorittamiseksi usean SNP-analyysi [13]. Nämä algoritmit ovat erittäin houkutteleva, koska ne ovat mallin erittely-vapaa ja voi kaapata piilotetut tiedot. Random Forest (RF), luokittelu algoritmi ehdottaman Breiman [14], jota voidaan käyttää tunnistamaan tärkeimmät liittyviä muuttujia tauti, on myös käytetty menestyksellisesti genomiin laaja tiedot [15]. Äskettäin algoritmi muuttuvan valintaan on ehdotettu (AUC-RF): se tunnistaa muuttujia, joilla on korkein ennakoivan tarkkuutta optimoimalla AUC (pinta-ala ROC käyrä) sarjasta satunnainen metsien [16]. Muita menetelmiä käsitellä oversaturated regressio ongelmia [17], että ovat saamassa tunnustusta ovat laillistaa regressiomenetelmiä, kuten harjanne regressio [18], vähiten Absolute Kutistuminen ja valinta Operator (LASSO) [19], ja sen Bayes version [20] . Nämä menetelmät rangaistaan todennäköisyys menettelyjä, joissa sopivia rangaistus toimintoja lisätään negatiivinen log-todennäköisyys automaattisesti kutistua vääriä vaikutuksia (vaikutukset tarpeeton covariates) kohti nollaa samalla tehokkaasti arvioimalla merkityksellisimmät. Bayes versio LASSO tarjoaa useita etuja verrattuna harjun regressio tai klassisen LASSO. Kuten muut bayesiläistä, se tarjoaa toimenpiteitä epävarmuutta arvioihin ja ennusteisiin, ja sen seurauksena, vakioidut virheitä, jotka voivat olla ongelmallista frekventistisessä LASSO [21]. Lisäksi se tuottaa merkki-spesifisiä kutistumisen vaikutus arvioiden, toisin Ridge regressio, ja voittaa tärkein rajoitus LASSO, joka sallii korkeintaan
n
-1 nollasta poikkeava regressiokertoimia [22].
Vuoteen hetkellä koko genomin yhdistys tutkimukset (GWAS) analysoidaan yksittäin valtava määrä SNP, useimmat niistä sijaitsevat alueilla ei liity piirre kiinnostusta taas toiset LD kanssa syy variantti. Tämä lähestymistapa on epätyydyttävä ominaisuuksia vaikuttaa suuri määrä variantteja /geenien [12]. Vaihtoehtoinen strategia on polku analyysi, jossa käsitellään yhteisen arvioinnin osajoukko SNP kanssa mahdollisen toiminnallinen vaikutus fenotyyppiin kiinnostava.
päätavoitteena Tämän tutkimuksen tarkoituksena oli arvioida, onko SNP tulehdukseen liittyvien geenien rooli BC kehitystä suuressa tapauksessa kontrolli tutkimuksessa Espanjassa ja myöhemmin tunnistaa kuvion näiden variantit (allekirjoitus) liittyy BC riski levittämällä kaksi hiljattain kehittänyt tilastollisia menetelmiä, Bayes kynnys LASSO (BTL) malli ja AUC-RF. Arvioida luotettavuutta strategian asiaan liittyvät tulokset analysoitiin myös riippumattoman tutkimuksen, Texas Virtsarakon syövän Study.
Tulokset
Yhteenvetotilasto
Taulukossa 1 esitetään ominaisuudet tapausten ja valvonnan koko näytteen ja ei-tupakoitsija alaryhmässä. Kaiken kaikkiaan tutkimus käsitti 1047 tapauksia ja 988 säätimet Genotyyppaustulokset varten 886 SNP 194 tulehduksellinen geenejä. Ei-tupakoitsija osajoukko koostui 424 yksilöitä, 147 joista BC tapauksissa. Mediaani-ikä potilaiden diagnoosi oli 68 ja 70 vuotta (vaihtelee 22-80 v) koko väestön ja tupakoimattomien, vastaavasti. Kaiken tupakointi oli yleisempää tapauksissa kuin verrokeilla (86%
vs.
72%) ja miehillä kuin naisilla (87%
vs.
22%). Näin ollen miesten osuus oli erilainen kummassakin yksilöiden: 87% ja 35% koko tutkimuksen ja tupakoimattomien, vastaavasti.
Yhteensä Väestöanalyysi
soveltaminen Bayes Threshold LASSO määritellään jokaisen SNP sen taka todennäköisyys liittyy BC. Kuviossa 1, osoitamme jakelu posteriori todennäköisyys kunkin SNP, sijoittui alenevassa järjestyksessä. SNP katsottiin liittyvän BC jos posteriori todennäköisyys on suurempi /pienempi kuin 0. 80%. Tämä strategia tunnistaa 37 SNP 34 geenit osoittavat yhdistys BC. Korkeimmat posteriori todennäköisyys (eli tärkeimmät yhdistys) oli 96,07% ja
CASP3-
rs3087455, kun taas alhaisin oli 51.98% ja
TLR2-
rs3804100. SNP suojaavalla pieni alleeli olivat:
CASP3-
rs3087455,
CCR3-
rs3091312,
CASP9-
rs2020902,
IL17A-
rs8193036,
MAP3K7-
rs150126,
IL6R-
rs8192284,
BLNK-
rs3789928,
SCARB1-
rs4765621,
fos-
rs7101,
TBK1-
rs10878176,
BIRC5-
rs744120,
LY96-
rs17226566,
AICDA-
rs11046349,
MAP2K4-
rs4791489,
IL15-
rs17461269,
CD14_IK-r
s2569190,
JAK3-
rs11888 ja
TNFRSF10A
-rs4871857. OR taka tarkoittaa vaihteli 0,81-0,93 verrattaessa pieniä yhteismarkkinoille homotsygoottinen genotyyppien (taulukko 2). SNP alaikäisen alleeli liittyy lisääntynyt riski BC olivat:
PRF1-
rs10999426,
IL7R-
rs1494555,
ABCA1-
rs2230806,
IFNAR2
rs2236757,
MASP1-
rs710459,
BLNK-
rs12357751,
MAP3K3-
rs7209435,
BLNK-
rs10882755,
TLR2-
rs3804099,
SOCS6-
rs723279,
IL17C-
rs899729,
TLR4-rs2737191
,
fos-
rs1063169,
ABCC4-
rs3765535,
PARP4-
rs13428,
BIRC3-
rs11602147,
IL21R-
rs8049804,
FADD
-rs7939734 ja
ICAM1-
rs5498. Posterior keinot syrjäisimpien vaihteli 1,10-1,20, verrattaessa pieniä yhteisiä homotsygoottinen genotyypit. Kaikki havaitut SNP oli Hardy-Weinberg tasapainon vertailupopulaatiossa. Single-SNP logistinen regressio mallien tuotti
p-arvot
0,05 17 heistä (yhteensä 32, taulukko S1), jossa on vähintään
p
–
arvo
of 0,0021, ei korjata useita testejä. Arvioitu TAI vastaavat 37 SNP-allekirjoitus oli 4,92 (katso kuviot S1 ja S2 lisätietoja). 95% aikaväli OR verrattaessa suurin riski genotyypin yhdessä korkeimman suojaava yksi vaihteli 31,2-629,4. Laaja uskottavuuden välin näkyy suuri virhe liittyy arvio. Posterior keskiarvo, mediaani ja moodi epäsymmetrinen posteriorijakauma olivat 206,5, 123,5 ja 63,8, vastaavasti.
piste piste viiva osoittaa rajakohta 80%, jonka yläpuolella SNP katsottiin.
AUC-RF pidetään sekä geneettisiä ja ei-geneettisten muuttujien ja havaittujen optimaalinen osajoukko 59 tekijöistä, mukaan lukien 56 SNP (taulukko S2). Kaikki ympäristön kovariaatit, lukuun ottamatta sukupuolta, oli ensimmäistä sijaa: tupakointi asema sijoittui olennaisimmat muuttuja, joiden keskimääräinen vähennys Gini-indeksi (MDG) 11,55, minkä jälkeen maantieteellisen alueen, jonka suhteellinen merkitys 35,2%. Ikä potilaan sijoittui kolmanneksi, joiden suhteellinen merkitys 19,4%, jonka jälkeen SNP. Taulukko 3 esittää 12 tärkeimmät SNP: iden havaita tällä menetelmällä. Niiden suhteellinen merkitys vaihteli 20,8% ja
JAK3
-rs2286662 14,4% ja
AKR1C3
-rs1937845.
Kolmetoista SNP
CASP3
PRF1
,
IL7R
,
ABCA1
,
IL6R
,
MASP1
,
SCARB1
,
TLR2
,
IL17C
,
MAP2K4
,
CD14_IK
,
FADD
, ja
ICAM1
tunnistettiin asiaan sekä BTL ja AUC-RF lähestymistapoja (röyhkeä SNP taulukossa 2; katso myös kuvio 2a.). Heistä 6 SNP sijaitsee
CASP3
,
PRF1
,
IL7R
,
ABCA1
,
IL6R
ja
CD14_IK
oli
p-arvo
0,05 logistinen regressio säätää covariates (katso taulukko 2, lisätietoja). Merkitys yksikään niistä jälkeen pidetyssä Bonferroni korjauksen useille testaus [23]. Huolimatta siitä, että mitään merkittävää havaittu yhteyttä tehtyään yhden merkkianalyysit, sijoitusta SNP korreloi voimakkaasti, että saadaan posteriori todennäköisyys BTL-pohjainen tuloksiin (Spearmanin korrelaatio, rho = 0,78).
(A ) lukumäärä SNP havaita kunkin menetelmän koko väestöstä. (B) määrä SNP havaita kukin menetelmä ei-tupakoitsija osajoukko. (C) määrä yhteisiä SNP havaita BTL koko väestöstä ja tupakoi osajoukko, jossa posterior todennäköisyydet vähintään 80% ja 75% vaikuttamaan poikkeaa 0. (D) määrä SNP havaita AUC-RF sekä koko väestöstä ja tupakoimattomien osajoukko.
genotyypit varten 17/37 SNP kanssa posteriori todennäköisyys yli 80% vuonna tietojenkeruuvaiheessa olivat saatavilla TXBC tutkimuksen ja tätä tietoa käytettiin replikointiin tarkoituksiin. Lisäksi 13 SNP korkean LD kanssa SNP havaita BTL tietojenkeruuvaiheessa sisällytettiin vaiheessa 2 analyysit. Taulukossa S3 osoittaa posterior todennäköisyydet on suurempi /pienempi kuin 0 ja taka keskiarvo syrjäisimpien saatu lisääntymään asetettu. Kaksi SNP (
IL6R-
rs4129267 ja
TBK1-
rs10878182) korkean LD kanssa
IL6R
-rs8192284 ja
TBK1-
rs10878176 havaittu löytö tutkimuksen mukaan BTL oli posterior todennäköisyydet, jolla on ei-null vaikutus yli 90%. OR Näiden korvike SNP olivat vaarassa, kun taas mainittuja löytö tutkimuksessa olivat suojan. Viisi ylimääräistä SNP (
IL21R-
rs9930086 – korkean LD kanssa
IL21R
-rs8049804, ja
MAP3K3-
rs7209435, IL17A-rs8193036, FADD-rs7939734, ja TLR2- rs3804099) osoitti posteriori todennäköisyydet 70%, kynnys harkita lisääntymään. Syrjäisimmillä alueilla Näiden 5 SNP olivat samaa suuruusluokkaa ja suuntaa ne löytyvät löytö tutkimuksessa.
tupakoi osajoukko analyysi
Tupakoinnin on vahvin ja yleisin ympäristön riskitekijä BC ja se voi muuttaa vaikutusta SNP tulehduksessa liittyviä geenejä. Siksi teimme yhdistys analyysi keskuudessa tupakoimattomien ohittaa sen vaikutus. Tällaisessa tilanteessa, BTL havaittu vain kaksi asiaa SNP (
BCL10-
2647396 ja
NFKBIA-
rs696), johon liittyy riski BC kanssa posterior todennäköisyys on vähintään 80%. Kaksi SNP havaittiin myös AUC-RF (katso kuva 2b). Kun laajennettu posteriori todennäköisyys (≥75%), määrä SNP havaita molemmat lähestymistavat kasvoi jopa 8 8 geenejä (katso taulukko 4). Tai lantio tarkoittaa vaihtelivat 1,12-1,16 niille SNP osoittavat lisääntynyt riski BC, kun vertaillaan kahta homotsygoottinen genotyyppiä, ja +0,89-+0,91 niille, joilla on suojaava vaikutus. Univariate regressioanalyysimme tuottanut merkittäviä tuloksia 8 SNP vähintään
p
–
arvo
on 0,0032, ei korjata useita testejä. OR mediaani taka tiheys vastaa 9 SNP-allekirjoitusta havaitaan BTL oli 2,73, joiden taka todennäköisyydellä 99% olemisen 1 ja välillä 1,35 ja 6,66 95% uskottava välein (katso kuva S3).
AUC-RF havaitaan optimaalinen osajoukko 93 liittyviä muuttujia BC, joista 90 oli SNP (taulukko S4). Toisin kuin havaintoja koko väestöstä, sukupuoli oli tärkein kovariaattina liittyvät BC keskuudessa tupakoimattomien, ja iän ja alueen olivat kolmanneksi ja neljänneksi vastaavasti.
Yhteinen SNP tehtyjen ja ei- tupakoitsija aineistot
Kuviot 2c ja 2d esittävät määrä SNP havaita molemmat BTL ja AUC-RF SBC /EPICURO tutkimus sekä koko väestöä ja tupakoimattomien yksilöitä. Ei ollut yhteistä SNP havaita BTL niille väestölle, joissa on posteriorinen todennäköisyyksillä yli 80%. Kuitenkin, kun posteriori todennäköisyyden perusteella oli ≥75%, kolme SNP: tä havaittiin sekä aineistot:
MAP2K4-
rs4791489,
PRF1
-rs10999426 ja
BCL10
-rs2647396.
Kun keskitytään AUC-RF tuloksia, 24 SNP (
ABCA1-
rs2230806,
AICDA-
rs2580874,
ALOX5-
rs1369214,
BCL10-
rs2647396,
CD2-
rs3136701,
CD4-
rs2707210,
FADD-
rs7939734,
FASLG-
rs929087,
H2AFX-
rs640603,
H2AFX-
rs643788,
IKBKB-
rs3747811,
IL15RA-
rs2296135,
IL21R-
rs2189521,
JAK3-
rs2286662,
MAP2K4-
rs4791489,
MASP1-
rs710459,
NFKBIA-
rs696,
OPRD1-
rs204076,
PRF1-
rs10999426,
suhteessa
rs11820062,
suhteessa
rs1466462,
SCARB1-
rs4765621,
TBK1
-rs10878178 ja
TMED7-
rs2052834) havaittiin molemmissa aineistoja, jotka edustavat 43% ja 27%: n SNP valittujen yhteensä ja tupakoimattomien aiheita, vastaavasti.
keskustelu
Koska kaikki monimutkaiset sairaudet, BC ei ole yksi SNP /geenin häiriö. Pikemminkin monet SNP pieniä vaikutukset voivat johtaa heikentyvän keskeisten reittejä mukana niiden patofysiologiassa. Tunnistaminen tällaisten SNP-allekirjoitusta edustaa analyyttisen haaste vaaditaan soveltamaan uusia kattava tilastollinen lähestymistapoja. Tietääksemme tämä on ensimmäinen tutkimus BC analysoidaan useita SNP kanssa BTL joka on tunnistanut osan niistä yhdessä mukana tässä ilmiasuun asiaa suuruus riski, paljon suurempi kuin se, jonka tarjoaa tupakointi (OR = 5 [ ,,,0],2]), tärkein riskitekijä BC.
Kolmetoista SNP 13 geeniä tunnistettiin molemmat BTL ja AUC-RF, jota voidaan pitää sisäisenä validointi. SNP
CASP3
,
IL6R
,
SCARB1
,
MAP2K4
ja
CD14_IK
osoitti suojaava vaikutus taas ne,
PRF1
,
IL17R
,
ABCA1
,
MASP1
,
TLR2
,
IL17C
,
FADD
ja
ICAM1
liittyi suurempi riski BC. Jokainen SNP osoitti pieniä yksittäisiä vaikutuksia, joita ei olisi todettu logistinen regressio, yhteisen analyyttisen lähestymistavan käytetään GWAS, levityksen jälkeen konservatiivinen Bonferronin korjausta useille testaus.
Löysimme aiemmin julkaistu todisteita siitä yhdistyksen useat näistä SNP /geenit syöpäriskiä, vaikka tätä tietoa ei käytetty SNP valinnassa. Niistä,
SCARB1
koodit scavenger-reseptorin luokan B tyypin I-geenin, joka on solun pinnan reseptori, joka sitoutuu HDL-kolesteroli (HDL-C) ja välittää HDL-C oton [24], [ ,,,0],25].
SCARB1
-rs4765621 karttoja introni 1 ja on liitetty suurentunut riski BC yhdistettynä
SLC23A2
-rs12479919,
AKR1C3
-rs2275928 ja
PLA2G6 –
rs2016755 [26]. Tämä SNP on kytkentäepätasapainossa kanssa
SCARB1
-rs4765623 joka on liittynyt munuaissyövän [27].
MAP2K4
koodaa kahteen eri Ser /Thr proteiinikinaasi. Alleeliset epätasapainot tässä geenissä on raportoitu rakkokasvaimista [28]. Lisäksi deleetiot ja mutaatiot
MAP2K4
on kuvattu ihmisen haiman, keuhko-, rinta-, kives, ja peräsuolen syövän solulinjat, mikä viittaa siihen, tuumorisuppressori rooli [29].
MAP2K4-
rs4791489 sijaitsee 1226 emäsparia alavirtaan geenin ja tämä on ensimmäinen tutkimus raportoi yhdistys fenotyyppiä.
IL7R
koodaa reseptorin IL-7, sytokiini osallistuu T-solujen erilaistumisen ja aktivaation.
IL7R
vaihtelu on linkitetty kroonisten tulehdustautien ja syövän:
IL7R
-rs1494555 on liitetty suurentunut riski mahalaukun syövän [30], hematologiset kasvaimet – vuorovaikutuksessa korkea painoindeksi – [31], ja ei-pienisoluinen keuhkosyöpä, jossa se todettiin sekä logistinen regressio ja satunnainen metsä testit [31]. Tämä SNP johtaa Ile
138Val korvaaminen, joille ei ole toiminnallista näyttöä.
CD14
on merkittävä rooli taudinaiheuttajista aktivoitu signaalintransduktioreitteihin ja tulehduksellisten sytokiinien [32].
CD14_IK-
rs2569190 on liittynyt eturauhassyövän Afrikkalainen amerikkalaiset [33], ja sepelvaltimo- ja aivoverenkierron sairauksista [34], [35].
PRF1
koodit perforiini 1, yksi tärkeimmistä myrkyllisiä proteiineja sytolyyttisen rakeet ja keskeinen efektori T-solu- ja luonnollisten tappajasolujen-soluvälitteinen sytolyysi. Sen muutokset aiheuttavat familiaalinen hemophagocytic lymphohistiocytosis tyypin 2 (HPLH2), harvinainen ja tappava peittyvästi periytyvä häiriö varhaislapsuudessa.
PRF1
-rs10999426 on ryhmitelty muiden geenien liittyy sytotoksisten T-solujen on kolorektaalisyöpä tutkimus: korkea ilmentyminen sytotoksisten klusterin geenit liittyi pitkään tautivapaan elinajan [36]. Liukoinen interleukiini-6-reseptori-α-alayksikköä (
IL-6R
) on voimakas sytokiini, jolla on tärkeä rooli immuunivasteessa. Muunneltu geeni, joka ilmentyminen on liittynyt multippeli myelooma, autoimmuunisairauksien ja eturauhasen syövän riskiä [37]. SNP
IL6R
-rs7529229, kytkentäepätasapainossa kanssa
IL6R
-rs8192284, on myös liittyvän riskin multippeli myelooma [37].
lisäksi keskittynyt arviointi tupakoimattomien hävittämään mahdollisen modifioiva vaikutus tupakan yhdistyksen välillä perimä ja virtsarakon syövän riskiä. Vain kaksi polymorfismit liittyvät BC havaittiin molemmat analyysimenetelmiä:
NFKBIA-rs696
ja
BCL10-rs2647396
.
NFKBI
on mukana reaktio stressiin, säätelee
COX-2
ja proinflammatoristen sytokiinien, ja on tärkeä välittäjä syövän synnyn [38].
NFKBIA-rs696
homotsygootista on liittynyt heikompi selviytymisen Ruotsin potilailla, joilla peräsuolen syöpä [39]. Muut tutkimukset ovat liittäneet poistamista
NFKBIA
kanssa glioblastoma multiforme [40] ja Hodgkinin lymfooma yksilöt [41].
NFKBIA-
rs696 on kytkentäepätasapainossa kanssa rs8904, muunnos, joka on liittynyt kivun vakavuuden keuhkosyöpäpotilaiden [42].
BCL10
, liittyy suojaa BC tutkimuksessamme, on tärkeä rooli NF-kappaB ja STAT signalointireitteihin [40], on ehdotettu osallistua haimakarsinooma- [43] ja
MALT
lymfoomat osana t (1,4) (P22, q32) translokaatio [44].
BCL10-rs2647396
on introni ja mitään toimintoa on tunnettu tähän polymorfismi.
Käyttämällä itsenäinen väestö ja korvike SNP korkean LD mainittuja löytö tutkimuksessa olemme monistaa yhdessä SNP in
IL6R
ja
TBK1
tunnistaa BTL. Se, että syrjäisimpien alueiden saatu lisääntymään tutkimuksessa oli vastakkaiseen suuntaan kuin havaittu löytö tutkimus voidaan selittää käytettäessä korvike SNP. Greene
et al.
Äskettäin todistaneet simuloitu tietojen erot alleelin taajuus voidaan myös antaa käänteistä alleelinen vaikutus on replikointi tutkimuksessa [45]. Kun kynnys posteriori todennäköisyys alennettiin 70%, yhdistys viisi ylimääräistä SNP toistui myös. Kaiken pystyimme toistamaan 30% valitusta SNP: iden erottamiseksi BTL saatavilla TXBC tutkimuksessa luku on merkittävä, kun otetaan huomioon, että BC on pitkälti ympäristötekijöistä aiheutuvien ja että molemmat tutkimukset tulevat eri maantieteellisillä alueilla ja keskukset erillisten potilaan lähete kuvioita (vuonna SBCS tutkimuksessa useimmat keskukset ovat yleisiä sairaaloissa taas TXBC tutkimus suoritettiin MD Anderson Cancer Center). Muut ehdotetut syitä puute lisääntymään geneettisiä heterogeenisyys, ympäristön vuorovaikutus, iästä riippuvia vaikutuksia, riittämätön tilastollinen voima, ja geeni-geeni vuorovaikutukset, jälkimmäinen selitys osoittaa suuremman monimutkaisuuden taustalla geneettisen arkkitehtuurin [45]. Emme yrittäneet jäljitellä SNP tunnistaa AUC-RF koska tämä menetelmä riippuu pitkälti alkuperäistä muuttujia harkita. Valitettavan, data useista alkuperäisen SNP tarkastellun tietojenkeruuvaiheessa ei ollut saatavilla tutkimuksessa käytetty lisääntymään.
Tämä tutkimus on useita merkittäviä vahvuuksia. Mikä tärkeintä, se koskee innovatiivisia analyyttisten lähestymistapojen käsittelevät biologisen monimutkaisuutta fenotyypin. Association analyysit tehtiin soveltamalla regularisoitua regressiomallia (BTL) ja parametristä muuttuja valintatapa (AUC-RF), lisäksi yksi merkki ehdoton logistinen regressio, käytetään useimmissa assosiaatiotutkimuksiin. Ensimmäiset kaksi menetelmää voittaa tärkein rajoitus jälkimmäisen, koska ne pitävät kaikki geneettinen tieto yhteisesti. Sovellus Yksittäisten logistinen regressio järkevää olettaen, että vain harvat geenit vaikuttavat geneettinen alttius [12], joka ei varmasti ole kyse BC. BTL katsoo, a priori, että suurin osa SNP on pieni (jos on) vaikutusta taudin kehitykseen ja suorittaa merkki erityinen kutistuminen vaikutus arvioiden [20]. Tämä lähestymistapa sallii käsittelee ”pieni
n
suuri
p”
ongelma ja estää overfitting. De los Campos et al [22] ehdotti tätä menetelmää mielenkiintoinen vaihtoehto suorittaa taantumat on merkkiaineita alle lisäainetta malli. Me katsotaan liittyvän BC ne SNP kanssa posteriori todennäköisyys 0,8 vaikuttamaan suurempi (pienempi) kuin 0, kuten [45]. Muita perusteita, kuten Bayes LOD 3,2 [46] tai ”periytyvyys merkkiaineen” 0,5% [47], on käytetty aiemmissa sovelluksissa BL. Valinta näiden kriteerien on mielivaltainen, koska niitä ei ole muodollisesti verrattuna vielä. Päinvastoin, AUC-RF ei ota mallia ja käsittelee kaikki mahdolliset vuorovaikutukset kovariaatit niissä analyyseissä. Se antaa mitan tärkeydestä muuttujan, vaikka se ei osoita, onko vaikutus tämän muuttuja on suojaava tai riskialtista. On myös tärkeää korostaa, että valitut muuttujat AUC-RF eivät välttämättä merkittävästi liittyvä piirre; vaan ne edustavat yhdistelmä genotyyppien parhaiten ennustaa taudin indikaattorin ja siten ansaitsee lisätutkimuksia. Annoimme etusijalle ne SNP valitaan molemmat menetelmät vaikka SNP valitaan vain yksi niistä ei pitäisi hävittää, koska eriluonteisia ja oletuksia kunkin lähestymistavan. Edelleen menetelmien vahvuuksia Tutkimuksen ovat suuren otoksen koko, korkea osallistumisaste, ja korkea laatu tiedon altistumista ja genotyypitys SBC /EPICURO Study.
Kuitenkin, joitakin rajoituksia on otettava huomioon tulkittaessa nämä tulokset. On mahdollista, että mahdollisesti informatiivinen alttius markkereita ei valittu genotyypitykseen. Lisäksi epätäydellinen koodaus valitun geenit voivat olla seurausta käytön aiemman HapMap päästämistä valita tag SNP. Näin ollen nämä geenit SNP ilman merkityksellisiä tuloksia tässä tutkimuksessa ei pitäisi jättää huomiotta mahdollisesti liittyy BC. Mitä rajoitteista lähestymistapojen, BTL vain olettaa lisäainetta periytymistapa eikä yhteisvaikutuksia tarkasteltiin. Yleinen haitta koneoppimisen menetelmiä, kuten AUC-RF, on, että ne tyypillisesti tunnistaa SNP joukko, joka tuottaa parhaan luokitustarkkuudesta mutta ei välttämättä vastaa voimakas yhteys sairauden kanssa. Todellakin, koneoppimisen lähestymistavat pyrkivät esitellä vääriä positiivisia, koska sisällyttämällä monia SNP kasvattaa luokitus tarkkuudet [48].
suuri ero riskiestimaattien mukaan BTL välillä koko ja ei-tupakoitsija aineistot ehdottaa mahdollisia modifioiva vaikutus tupakan yli SNP-allekirjoituksen BC riskiä. Vaikka tilastollinen alimitoitettu tuloksia ei voida hylätä, suuri tupakointi * SNP vuorovaikutuksen arvioinnin huomioon kaikki SNP mukana tutkimuksessa tulisi suorittaa. Tämä analyysi vaatii Uudet menetelmät innovaation ja suuria laskennallisia infrastruktuuri.
Yhteenvetona raportoimme tässä yhteisvaikutus useiden varianttien tulehduksellisten geenien vahva yhteys BC riski. Käyttäminen usean SNP arvioinnin lähestymistapoja tutkia piilotettuja periytyvyys monimutkaisten sairauksien on erittäin lupaava yhdistyksen analyysi kenttään. Vaikka näiden menetelmien soveltamiseen at genomin laajuisesti on suoraviivainen, suuri laskennallinen kysyntä edustaa tärkein rajoite ja harvat tutkimukset ovat sovittaneet ne genominlaajuisten tietojen yhdistys [15] tai ennustaminen asetukset [49] asti läsnä. Meillä on yksi ensimmäisiä tutkimuksia soveltaa tällaista menetelmiä suuren joukon SNP syöpätutkimuksessa.
Materiaalit ja menetelmät
Ethics selvitys
Tietoon kirjallinen suostumus saatiin TET. Tutkimuksen hyväksyi Institutional Review Board of US National Cancer Institute, eettisten toimikuntien kunkin osallistuvan sairaalan, MD Anderson Cancer Center, ja Baylor College of Medicine.
Tutkimuskanta
väestön katsotaan tässä analyysissä tulee Espanjan virtsarakon syövän /EPICURO Study. Tämä on sairaala-pohjainen tapauskontrollitutkimuksessa toteutettiin vuosien 1998-2001 aikana 18 sairaaloissa viidellä alueella Espanjassa (Asturias, Barcelona pääkaupunkiseudulla, Vallès /Bagesin Alicante ja Teneriffa), kuten kuvattu muualla [50]. Hyväksyttävät tapaukset olivat iältään 21-80 vuotta ja vasta diagnosoitu on histologisesti vahvistettu siirtymäkauden cell carcinoma virtsarakon perustuvat vuoden 1998 järjestelmän WHO ja International Society of Urologisessa patologian [51].