PLoS ONE: arviointimenetelmä Multiple sovittelijoita: Mediating vaikutukset Tupakointi ja COPD esillä yhdistyksen välisestä CHRNA5-A3 Variant ja keuhkosyövän riski

tiivistelmä

sovittelu malli tutkii suorat ja epäsuorat vaikutukset välillä itsenäinen muuttuja ja riippuvan muuttujan mukaan lukien muiden muuttujien (tai välittäjiä). Sovittelu analyysi on hiljattain käytetty leikellä suorat ja epäsuorat vaikutukset geneettisiä variantteja monimutkaisia ​​sairauksia käyttäen tapaus-verrokki tutkimuksissa. Kuitenkin bias voi syntyä arvioiden geneettisen variantin-välittäjänä yhdistys koska läsnäolo tai puuttuminen välittäjänä tutkittavat näytteet ei näytteitä seuraavia periaatteita tapauskontrollitutkimuksessa muotoilu. Tällöin sovittelu analyysi käyttäen tietojen tapausverrokkitutkimukset voisi johtaa puolueellinen arvioita kertoimien ja epäsuorat vaikutukset. Tässä artikkelissa selvitettiin usean sovittelu malli liittyy kolmen polun välittävä vaikutus kahden välittäjäaineiden avulla tapauskontrollitutkimuksessa data. Ehdotamme lähestymistapaa korjaamaan bias kertoimien ja antaa tarkkoja arvioita erityisiä välillisiä vaikutuksia. Lähestymistapamme voidaan käyttää myös silloin, kun alkuperäisessä tapauskontrollitutkimuksessa on taajuus Hyväksytty yksi välittäjäaineiden. Meillä työskentelee bootstrapping merkityksen arvioimiseksi välillisten vaikutuksia. Teimme simulointi osoittavien suorituskykyä ehdotetun lähestymistavan, ja osoitti, että se antaa tarkempia arvioita välillisten vaikutusten sekä prosenttia välittämä kuin standardi regressiota. Sitten soveltanut tätä lähestymistapaa tutkia välittämiseen vaikutuksia sekä tupakointi ja keuhkoahtaumatauti (COPD) on assosiaatiota CHRNA5-A3 geenilokuksen ja keuhkosyövän riskiä käyttämällä dataa keuhkosyöpä tapauskontrollitutkimuksessa. Tulokset osoittivat, että geneettinen variantti vaikuttaa keuhkosyövän riskiä epäsuorasti kaikkien kolmen eri reittejä. Prosentuaalinen Geneettisen yhdistyksen välittämien oli 18,3% läpi tupakoinnin yksin, 30,2% kautta COPD yksin, ja 20,6% polun läpi lukien sekä tupakointi ja keuhkoahtaumataudin, ja koko geneettinen muunnos-keuhkosyöpä yhdistys selittyy kaksi välittäjien oli 69,1%.

Citation: Wang J, Spitz MR, Amos CI, Wu X, Wetter DW, Cinciripini PM, et al. (2012) arviointimenetelmä Multiple sovittelijoita: Mediating vaikutukset Tupakointi ja COPD esillä yhdistyksen välisestä CHRNA5-A3 Variant ja Lung Cancer Risk. PLoS ONE 7 (10): e47705. doi: 10,1371 /journal.pone.0047705

Editor: Juan P. de Torres, Clinica Universidad de Navarra, Espanja

vastaanotettu: 2. heinäkuuta, 2012 Hyväksytty: 14 syyskuu 2012; Julkaistu: 15 lokakuu 2012

Copyright: © Wang et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Yhdysvaltain National Institutes of Health (NIH) avustus R01CA131324 (SS) ja tiedekunnan apurahan The University of Texas MD Anderson Cancer Center Duncan Family Institute for Cancer Prevention and Risk Assessment (JW). Tämä tutkimus käyttää keuhkosyövän tuottamien tietojen tukea NIH avustusten U19CA148127 ja R01CA121197. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

sovittelu malli on tilastollinen lähestymistapa, joka tutkii suorat ja epäsuorat vaikutukset itsenäinen muuttuja (eli alkuperäisen muuttuja) on riippuva muuttuja (eli tulos muuttuja) sisällyttämällä yksi tai useampi välittävä muuttujia (tai välittäjiä ) [1]. Joissakin tilanteissa, sovittelu malli voi päätellä syy vaikutukset alkuperäisestä muuttujan välittäjänä muuttuja ja sitten tulosmuuttuja [1]. Sovittelu mallit ovat laajalti käytössä monilla eri aloilla [2], kuten psykologia, käyttäytymiseen tieteen, geneettisen epidemiologian, ennaltaehkäisy tutkimus, ja poliittinen viestintä tutkimusta. Viime aikoina on ponnisteltu käyttämään sovittelua analyysin leikellä suorat ja epäsuorat vaikutukset geneettisiä variantteja monimutkaisia ​​sairauksia geneettinen variantti assosiaatiotutkimuksiin [3] – [7]. Useimmat näistä tutkimuksista käytettiin tietojen genomin laajuinen yhdistys (GWA) tutkimukset, joissa lopputulos muuttujat valittiin perusteella tapauskontrollitutkimuksessa muotoilu. Esimerkiksi ryhmämme on sovellettu yhden välittäjänä analyysi (eli Baron-Kenny menettely) tunnistamaan sovittelu tupakoinnin vaikutukset ja keuhkoahtaumatauti (COPD) on assosiaatiota CHRNA5-A3 geneettinen lokus ja keuhkosyövän riskiä käyttämällä dataa tapaus-control GWA tutkimus keuhkosyöpään [6]. Kuitenkin välittämättä tapauskontrollitutkimuksessa suunnittelu ja soveltamalla standardin taantumat saattavat johtaa yksipuolisiin arvioita välillisten vaikutusten. Uusimpien tutkimusten johdetun fenotyyppien, harha voi syntyä arvioiden geneettisen variantin-välittäjänä yhdistys koska läsnäolo tai puuttuminen sovittelija (eli tapausten ja kontrollien suhteen sovittelija) ei näytteitä seuraavia periaatteita tapaus -Säätimet tutkimuksen suunnittelu [8] – [12]. Tällöin sovittelu analyysi käyttäen tietojen tapausverrokkitutkimukset voisi johtaa puolueellinen epäsuoran vaikutuksen arvioiden joko yli- tai aliarvioida riippuen esiintyvyydestä arvoihin tuloksen ja välittäjäaineiden.

Keuhkosyöpä GWA tutkimukset ovat johdonmukaisesti osoittaneet, että CHRNA5-A3 geeni klusteri on vahvasti liittyy suurentunut riski sairastua keuhkosyöpään. Lisäksi useat tutkimukset ovat liittäneet SNP ulottuivat tämän alueen runsas tupakointi, nikotiiniriippuvuus, tupakoinnin lopettaminen ja keuhkoahtaumatauti [13] – [19]. Näin ollen on keskustelua siitä, onko perimä vaikuttaa keuhkosyövän riskiä suoraan tai aiheuta niiden vaikutus pitkälti syvällinen vaikutus varianttien tupakoinnin intensiteetti [20] – [22] tai COPD [23]. Lisätyötä Tutkimme tätä yhdistys totesi, että on olemassa kaksi polkuja välillä geneettisen muunnoksen ja keuhkosyöpää yhdistys, itsenäisesti kautta suora vaikutus keuhkojen syövän synnyn ja läpi tupakointikäyttäytymiseen [6], [7], [15], [24] – [26 ]. Uudemmat tutkimukset nykyisistä tupakoitsijoista ovat osoittaneet, että geneettiset variantit on CHRNA5-A3 geeni klusteri on vahvempi yhdessä kotiniini tasolla kuin itse ilmoitettu nikotiiniriippuvuus, ja ehdotti, että vaikutus perimä keuhkosyöpään riski, on suurelta osin, jos ei yksinomaan, kautta niiden vaikutus tupakoinnin intensiteettiä [27] – [29]. Kuitenkin mukana toimituksellisen Spitz et al [21] todettiin, että missä määrin yhdistyksen välittyy tupakointi on vielä määrittelemättä. Ennen tutkimukset keskittyivät yksi välittäjä (esim tupakointi) kerrallaan, ja kukaan ei ole tutkinut useita välittäjäaineita samanaikaisesti yksi malli. Kuitenkin todellisuudessa enemmän kuin yksi sovittelija voi vaikuttaa yhdistyksen välillä geneettisen muunnoksen ja keuhkosyövän riskiä. Edellisessä analyysi [6], huomasimme, että yhden välittäjänä analyysien tupakoinnin ja COPD olivat välittäjiä yhdistyksen välisen yhden emäksen monimuotoisuus (SNP) rs1051730 ja keuhkosyövän riskiä. Kuitenkin analysoimalla useita välittäjinä yksi malli voisi olla joitakin etuja kuten single-välittäjänä analyysit [30].

usean sovittelun mallia käytetään tutkimuksen SNP, tupakointi, COPD ja keuhkosyövän riskiä on kuvattu polkuna kaavio kuvassa 1. usean sovittelu malli sisältää kolmen polun välittävä vaikutus kautta sekä tupakointi ja COPD, joka mahdollistaa yhden sovittelijan (eli tupakointi) ja syy vaikuttaa muuhun välittäjään (eli COPD) [31]. Tämä syy-yhteys on biologisesti vakuuttava, koska tupakointi on tiedossa suuri riskitekijä keuhkoahtaumatauti [32]. Taustalla oletus tämän kolmen polun välittävä vaikutus on, että yksilöt kantavat haitallisia alleelin rs1051730 ovat todennäköisemmin runsaasti tupakoivat, mikä puolestaan ​​johtaa suurempi riski COPD, mikä puolestaan ​​lisää riskiä sairastua keuhkosyöpään. Niinpä sen lisäksi, että epäsuorat vaikutukset läpäisee kunkin välittäjien yksin, tutkimme epäsuora vaikutus kulkee molempien välittäjäaineiden.

X

: alustava ennustajan muuttuja (SNP).

M

1

: sovittelija (tupakointikäyttäytymiseen).

M

2

: sovittelija (COPD).

Y

: tulosmuuttujana kohteisiin (keuhkosyöpä).

Tietääksemme ei ole edellisessä tutkimuksessa, niin useita sovittelua mallia tapauskontrollitutkimuksessa suunnittelu asetus , jossa standardi regressio lähestymistapa voisi tarjota puolueellinen estimaatteja epäsuorat vaikutukset kuten edellä on kuvattu. Siksi olemme kehittäneet lähestymistapa tehdä usean sovittelu analyysi mallin kuvassa 1. Olemme suorittaneet simulaatioita tutkimaan suorituskyky ehdotetun lähestymistavan, ja nämä osoittivat lähestymistapa voi antaa tarkkoja arvioita välillisiä vaikutuksia. Käynnistysprosessi lähestymistapaa sovellettiin merkityksen arvioimiseksi välillisten vaikutusten ja kokonaisvaikutus. Olemme myös kehittäneet lähestymistavan, kun alkuperäinen tapauskontrollitutkimuksessa on taajuus Hyväksytty yksi välittäjäaineiden, kuten meidän keuhkosyöpä tapauskontrollitutkimuksessa jossa valvonta on taajuus sovitettu tapauksiin nähden tupakoinnista. Käytimme ehdotettu lähestymistapa usean sovittelun tutkimus samanaikaisesti välittäjänä tupakoinnin vaikutukset ja COPD yhdistyksen välillä SNP rs1051730 ja keuhkosyövän riskiä käyttämällä keuhkosyöpä tapauskohtaisesti ohjaus GWA tutkimustuloksia.

Methods

Anna

X

,

M

1

,

M

2

, ja

Y

kuvaamaan geneettistä variantti, kaksi sovittelija fenotyyppejä, ja tauti muuttuja, tässä järjestyksessä. Oletimme binary satunnaismuuttujien sekä välittäjänä muuttujat ja taudin muuttuva, merkitään, ja vastaavasti ja jossa 0 edustaa ei-esiintyminen ja 1 edustaa esiintyminen välittäjänä fenotyyppien tai sairauden. Me pidetään SNP lokuksen kahden alleelin: vahingollisia alleeli

ja normaali alleeli

. Ensin oletettiin määräävässä tai resessiivinen geneettinen malli geneettisen muunnoksen ja merkitään sitä binary satunnaismuuttuja,. Jotta hallitseva geneettinen malli, 0 edustaa genotyyppi (

,

) ja 1 edustaa genotyyppien (

,

) ja (

,

); for resessiivinen geneettinen malli, 0 edustaa genotyyppien (

,

) ja (

,

) ja 1 edustaa genotyyppi (

,

). Huomaa, että jos lisäaine geneettinen malli oletettiin, kategorinen satunnaismuuttujaa oli merkitty edustamaan genotyyppien (

,

), (

,

), ja (

,

), tässä järjestyksessä. Koska satunnaismuuttujat,

X

,

M

1

,

M

2,

ja

Y

, yhdistys kaikkien satunnaismuuttujia kuvassa 1 voidaan ilmaista käyttäen seuraavia ehdolliset todennäköisyydet kanssa logistista mallia: (1) (2) (3), jossa

0

,

b

0

,

c

0

,

1

,

2

,

b

1

,

b

2

,

d

, ja

c ’

ovat regressiokertoimia ja

i

,

j

,

k

= 0, 1. on olemassa erilaisia ​​välillisiä vaikutuksia tässä mallissa [33] (katso kuva 1): (i) epäsuorat vaikutukset kulkee sovittelija

M

1

, ohittaen

M

2

, jota voidaan arvioida

1 b

1

(merkitään

IE

1

); (Ii) epäsuoria vaikutuksia kulkee sovittelija

M

2

, ohittaen

M

1

, jota voidaan arvioida

2 b

2

(merkitään

IE

2

); ja (iii) kolmen polun epäsuora vaikutus kulkee molempien välittäjäaineiden, joita voidaan arvioida

1 dB

2

(merkitään

IE

3

) . Siksi koko välillinen vaikutus kautta kulkevan välittäjiä voidaan antaa summattu edellä välillisiä vaikutuksia:

1 b

1

+

2 b

2

+

1 dB

2

(merkitään

IE

t

). Regressiokerroin

c ’

edustaa vaikutusta geneettisen variantin taudista ei välitä myöskään välittäjänä ja kutsutaan yleensä välitön vaikutus. Yleisesti, koko vaikutus geneettinen variantti sairauden arvioidaan taantuu taudin muuttuja geneettinen variantti muuttuja suoraan. Kuitenkin edellisessä analyysissä on osoittanut, että kokonaisvaikutus arvioidaan tällä tavalla, voidaan esijännitetty, kun sairaus muuttujan ja /tai välittäjänä muuttujat ovat binaarisia [34]. Siksi tässä tutkimuksessa raportoitu kokonaisvaikutus (

TE

) käyttäen vaihtoehtoista kaavaa määritellään summattu epäsuorat ja suorat vaikutukset (merkitään

TE

=

IE

t

+

c ’

). Tässä tapauksessa prosenttiosuudet yhdistyksen selittyy eri sovittelun polut (prosenttia välittämän,

PM

) voidaan arvioida erityiset välilliset vaikutukset jaettuna määritelty kokonaisvaikutus vastaavasti ja merkitään

PM

1

=

IE

1 Twitter /

TE

,

PM

2

=

IE

2

/

TE

,

PM

3

=

IE

3 Twitter /

TE

, ja

PM

t

=

IE

t Twitter /

TE,

joka edustaa

PM

on

M

1

ohitus

M

2

,

PM

on

M

2

ohitus

M

1

,

PM

of molemmat

M

1

ja

M

2

, ja kokonaismäärä

PM

eri reittejä, vastaavasti.

Kun tiedot kiinnostava satunnaisesti poimittu väestössä, arvioiden välillisten vaikutusten ja prosenttinen välittämän ovat tarkkoja. Kuitenkin, jos tiedot ovat näytteitä perustuvat tapauskontrollitutkimuksessa suunnittelu, arvioitu yhdistysten kesken alkuperäisen muuttujan ja molemmat välittäjiä (ts

1

,

2

ja

d

) vääristyy, jos vakio logistinen taantumat käytetään, mikä puolestaan ​​johtaa puolueellinen arvioita välillisiä vaikutuksia ja prosentuaalinen välittämän [8] – [12]. Saada tarkkoja arvioita kertoimien

1

,

2

, ja

d

, muutimme bias-korjauksen ehdotettu lähestymistapa meidän edellisessä tutkimuksessa [12]. Lyhyesti, puolueellinen kerroin arvioitiin logistisen regression, esiintyvyys arvot taudin, ja molemmat sovittelija fenotyypit voidaan ilmaista käyttäen epälineaarisia yhtälöitä. Esiintyvyys arvot on saatu kirjallisuuden ja luotettavuutta tämän lähestymistavan misspecification esiintyvyyden arvoista on tutkittu edellisessä teosten [12], [35]. Solving järjestelmä epälineaarinen yhtälöt antaa meille korjattu kertoimia. Varten useita-välittäjänä malli, erilaiset ei-lineaariset yhtälöt käytettiin korjaamaan eri kertoimet. Korjausta lähestymistapa regressiokerroin

d

varten

M

1

M

2

yhdistys, kun taas taantuu

M

2

on

M

1

ja

X

(katso kuva 1), on esitetty alla. Korjausta lähestymistapoja muiden parametrien, nimittäin

1

ja

2

, annetaan teksti S1.

korjaus kerroin

d

Kuten edellä todettiin, regressio kerroin

d

, että

M

1

M

2

yhdistys taas taantuu

M

2

M

1

ja

X

, voisi olla puolueellinen. Käytimme seuraavia epälineaarinen estimointiyhtälölle lähestymistapa korjaamiseksi bias. Koska näyte

N

osallistujaa, joista

N

1

tapauksia (

Y

= 1) ja

N

0

ovat valvonta (

Y

= 0) suhteessa taudin kertoimet suhde (OR) yhdistyksen välisestä välittäjien

M

1

ja

M

2

(exp (

d

)) voidaan esittää seuraavasti: (4) missä

E

kj

on odotettu henkilöiden määrä näytteessä, jossa

M

2

=

k

ja

M

1

=

j

, joka annetaan aswhere

j

k

,

r

= 0, 1. ehdollinen todennäköisyys

p

kj

Vastaa