PLoS ONE A Novel HMM-Based -menetelmä rikastetun transkriptiotekijä toutumiskohtiin paljastaa RUNX3 mahdollisena Target Haimasyöpä Biology
tiivistelmä
Background
Haiman adenokarsinooma (PAC) on yksi hankalimmista syöpäsairauksia. Jotta etsiä mahdollisia uusia terapeuttisia kohteita, olemme luottaneet laskennallisiin menetelmiin, joilla pyritään tunnistamaan transkriptiotekijän sitoutumiskohtia (TFBSs) yliedustettuina promoottorialueissa geenien differentiaalisesti ilmaistut PAC. Vaikka monet laskennalliset menetelmät on toteutettu tämän saavuttamiseksi, mikään niistä ei ole saavuttanut yleistä hyväksyntää tai tuotetut todistettu uusia tavoitteita PAC. Tätä varten olemme kehittäneet DEMON, uusi menetelmä motiivi havaitsemiseen.
Menetelmät
DEMON vetoaa piilotettu Markovin mallin pisteet ulkonäkö jaksoryhmittymät ottaen huomioon kaikki mahdolliset sivustot edistäjänä mahdollisesti vaihtelevia sidosaffmiteetti. Osoitamme DEMON n tarkkuuden simuloitu ja todellinen aineistoja. Hakeminen DEMON PAC liittyvistä tiedoista identifioi RUNX perheen hyvin rikastettu PAC liittyviä geenejä. Käyttämällä uutta kokeellista paradigman erottaa normaali ja PAC-soluissa, olemme huomanneet, että RUNX3 mRNA (mutta ei RUNX1 tai RUNX2 mRNA: t) esiintyy ajasta riippuva nousu normaalia, mutta ei PAC-soluissa. Nämä korotukset ovat mukana muutokset mRNA-tasojen oletettujen RUNX geenikohteet.
Johtopäätökset
integroitu soveltaminen DEMON ja uusi eriyttäminen järjestelmä johti tunnistamiseen yhden perheenjäsenen, RUNX3, joka yhdessä neljän oletetun tavoitteiden osoitti vankan vastaus eriyttäminen ärsyke terveissä soluissa, kun taas tämä säätelymekanismi oli poissa PAC soluissa korostaen RUNX3 kuin lupaava kohde lisätutkimuksia.
Citation: Levkovitz L , Yosef N, Gershengorn MC, Ruppin E, Sharan R, Oron Y (2010) romaani HMM-Based -menetelmä rikastetun transkriptiotekijä toutumiskohtiin paljastaa RUNX3 mahdollisena Target Haimasyöpä biologian. PLoS ONE 5 (12): e14423. doi: 10,1371 /journal.pone.0014423
Editor: Dov Joseph stekel, University of Nottingham, Yhdistynyt Kuningaskunta
vastaanotettu: 2. helmikuuta 2010 Hyväksytty 10 syyskuuta 2010 Julkaistu: 22 joulukuu 2010
Tämä on avoin-yhteys artikkeli jaettu ehdoilla Creative Commons Public Domain ilmoitus, jonka mukaan, kun se on saatettu julkisia, tämä työ saa vapaasti kopioida, levittää, lähetetään, modifioitu, rakennettu, tai muuten käyttää kuka tahansa laillista tarkoitusta.
Rahoitus: Tätä työtä tukivat Era-Net taudinaiheuttamismekanismien avustuksen ER ja RS, ja Israel Cancer Association avustus ER, RS ja YO. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Haiman adenokarsinooma (PAC) on yksi aggressiivinen syövät. Vaikka 10th esiintymistiheyden, se on neljänneksi yleisin syy syöpäkuolemista länsimaissa. PAC on ominaista myöhäinen diagnosointi, nopea eteneminen ja laaja etäpesäkkeiden ja on lähes kokonaan tulenkestävä kaikille lääkehoidossa. Vaikka 10-15% PAC kasvaimia voidaan hoitaa osittain pancreatectomy, välin välillä diagnoosin ja kuolema on 3-6 kuukautta ja 5 vuoden pysyvyys on alle 5%. Yhdysvalloissa noin 30.000 uutta tapausta diagnosoidaan vuosittain ja lähes sama määrä PAC potilaita kuolee vuosittain sairauden [1], [2]. Tämä synkkä kuva tekee syöpä arvoinen aihe etsimiseen uusia terapeuttisia kohteita. Kuitenkin julkaistut geeniekspressiotutkimuksissa toistaiseksi ei ole pystytty osoittamaan käyttökelpoisia terapeuttisia kohteita.
tunnistaminen transkriptiotekijöiden (TF: t) osallistuvien keskeisten biologisten prosessien ja erilaisten patologisten tilojen, erityisesti syövän ja perinnöllisen sairauden, on saavuttanut suosiota viime vuosina. TF: t ovat pääohjausjärjestelmät muutoksista ilmentyminen useiden geenien ja voi siten toimia parempana tavoitteet hoitoja ihmisten sairauksien. Suhteellisen suuri määrä menetelmät niiden rikastettu TF sitoutumiskohtia (TFBSs) olemassa [3] – [5], mutta mikään yksittäinen menetelmä on saanut yleinen etusija muihin nähden.
soveltaminen state-of-the- art PRIMA algoritmi [4] tietomääriä mikä ero geenien ilmentymistä PAC viittasi ZNF350 tärkeänä TF PAC biologia (julkaisematon). Kuitenkin qRT-PCR kokeet osoittivat vain vaatimattomia muutoksia ZNF350 ilmaisun yhteydessä seerumin poistamisen PAC solujen (kts. S1). Ottaen huomioon tämän menetelmän, pyrimme kehittämään uuden menetelmän, jolla pyritään parantamaan ennustearvo biologisissa kokeissa.
Suhteellisen suuri määrä PAC geeniekspression ole tehty, käyttäen sekä terveitä ja sairaita haiman kudoksista ja PAC rivit in vitro. Brandt
et al.
[6] tarkistetaan tiedot 10 ilmaisun tutkimuksista ja tunnistaa noin 1000 geenien ilmentymistä, joka muuttuu PAC; 148 näistä geeneistä havaittiin kahdessa tai useammassa tutkimuksessa. Lista koonnut Brandt
et al
. sisältää geenejä, jotka ilmentyvät suuri osuus PAC tutkimuksia ja oli liittynyt monenlaisia syöpiä, kuten Ras, Ink4, P53, jne. Ei ole kuitenkaan ilmeisesti selittää ”katastrofaalinen” [7] etenemistä tämän taudin . Vaikka yksittäiset proteiinit voivat toimia lupaavia kohteita lääkekehitykselle, etsimistä terapeuttisia kohteita PAC on epäonnistunut, toistaiseksi, tuottamaan uusia lupaavia huumeiden johtaa. Käsitteellisesti hoitoja suunnattu TF: t, jotka ovat master-säätelijöinä suuri määrä geenejä, ovat mahdollisesti enemmän omiaan vaikuttamaan syöpä solubiologian ja ovat erityisen houkuttelevia.
Tässä on sovellettu uutta menetelmää, DEMON varten havainnoinnin rikastettu TFBSs ja uuden paradigman verrattaessa normaaliin haiman ja PAC-soluissa. Hakeminen demonin PAC kokeellisten tietojen joukko ennusti sitoutumiskohtia RUNX alaryhmään TF: ille on hyvin rikastettu asiaankuuluvan ilmentyvät eri geenin sarjaa. qRT-PCR vahvisti RUNX3 kuin ilmentyvät eri TF. Lopuksi DEMON osoittautui hyödyllinen ennustava työkalu TFBSs analyysiin ja yhdessä Koetulokset, viittaa siihen, että RUNX3 voi osoittautua tärkeäksi tavoitteeksi TF haiman syöpätutkimuksessa.
Tulokset
havaitsemiseksi Rikastettu motiivit yhdessä geenien (DEMON) B
koska tavoitteeksi asetettu promoottorit yhteistyön geenien ja joukon tunnettuja TFBS motiivien (edustettuina asento paino matriisit päässä Transfac tietokannasta [8], katso Methods), DEMON pyritään motiiveja, jotka esiintyvät näissä promoottorit useammin kuin sattumalta odotettua (ts motiiveja, jotka ovat rikastuneet asetettu tavoite). Algoritmi käyttää piilotettu Markovin malli (HMM) kuvaamaan todennäköisyyspohjaisia prosessi, joka luo promoottorisekvenssit, ja arvioida, kuinka todennäköistä on, että tiettynä motiivi rikastuu asetettu.
Jokainen HMM sisältää valtioille ainutlaatuinen aihe, ja taustan todetaan malli välinen motiivi segmenttejä (Fig. 1). DEMON tulokset kukin promoottori ulkonäkö tahansa motiivi. Tämä tilanne heijastaa todennäköisyyttä, että sekvenssi luotiin perustuu HMM kuvaava aihe, vs. todennäköisyys, että se luotiin perustuu yksinkertaiseen taustalla malli. Annettu asetettu yhteistyön geenien, tulokset promoottorien lasketaan yhteen kullekin HMM, ja verrataan summia tulokset saadaan satunnainen tavoiteindikaattoreita. Tässä vertailussa on käytetty määrittää
p
-arvo kullekin motiivi, joka kuvastaa sen runsautta promoottorialueiden asetettua tavoitetta (ks. 2 ja menetelmät).
HMM muodostuu of motiivin valtioiden (vaaleanpunainen), tausta valtiot (sininen) ja alkutila. Tausta tila on määritelty kunkin nukleotidin (neljä tilaa), ja kuvio tila on määritelty kaikissa asennoissa pitkin PWM vastaa TFBS kohteisiin. Päästöjen todennäköisyydet motiivin valtioiden määritellään mukaan PWM, ja ne taustan valtiot asetetaan 1 vastaavan nukleotidin. Siirtyminen todennäköisyyksien välillä taustan valtioiden heijastavat jakelua dinukleotidien kaikilla otaksuttu promoottorialueet ihmisen. Siirtyminen todennäköisyys kustakin motiivi valtion seuraavaan on 1. Jäljellä siirtymät ovat siirtymässä tausta todetaan (katkoviivoilla) tai siirtymässä ensimmäiseen motiivi tila (kiinteä nuolet). Nämä siirtymät ovat oppineet käyttäen Baum-Welch-algoritmi.
a. Haetaan luetteloa koekspressoi geenien suuren suoritustehon kokeita. b. Kunkin HMM-promoottorin pari pisteet lasketaan suhteena todennäköisyys päästää promoottorisekvenssin käyttäen TFBS HMM ja todennäköisyys päästää promoottorisekvenssin käyttäen tausta HMM. Summa pistemäärät kullekin TF käytetään laskettaessa yksittäisen pisteet heijastaa TF yleistä runsautta tulo promoottori asetettu. c. Valitaan satunnaisesti 100 promoottori tietuekokonaisuudet samankokoinen kuin alkuperäinen keräämiseen. Pisteet lasketaan kuten ennenkin näiden tietokokonaisuuksien. d. Jokainen TF on määritetty empiirisesti p-arvo määritellään prosenttiosuutena satunnaisten joissa se sai korkeampi.
Suorituskyky arviointi simuloitu ja todellinen data
Voit testata lähestymistapamme, ensin vertailtava DEMON simuloituun tietoihin. Tätä varten me simuloitu sarjaa 100 satunnainen promoottoreita, joiden sekvenssit valittiin taustamelun mukaan todennäköisyys dinukleotideissä real promoottorialueille (menetelmät). Sitten istutettu todellinen motiivi x% (10≤x≤90) promoottorien kussakin sarjassa (kolme instanssia motiivien istutettiin kuhunkin promoottori). Me toisti menettely kaikkien selkärankaisten asentoon paino matriisit (pulssinleveysmodulaattorit) on Transfac tietokantaan [8] (katso menetelmät).
Kuva 3 verrataan suorituskykyä DEMON kuin PRIMA algoritmin. Valitsimme PRIMA edustajana ryhmä menetelmiä, jotka käyttävät kovan kynnyksen tunnistaa oletetun esiintymisiä kuvioita missä tahansa promoottori. Tällaiset menetelmät eivät ehkä aina havaitse ”heikko” esiintymät motiivin ja usein eivät ota huomioon todellista määrää esiintymien motiivin (esimerkiksi psykososiaalisten, promoottorit ovat luokiteltu niille on 0, 1, 2, tai yli 2 esiintymiä motiivin).
Kun vertaillaan demonin ja Priman suorituskykyä aineistoja eri prosenttiosuus promoottorien kanssa istutettu motiiveja.
on selvää, että kaikissa tapauksissa DEMON saavuttaa parempia tuloksia olipa kyse spesifisyys ja herkkyys. Teimme ylimääräisiä simulaatioita, vaihtelemalla määrä promoottoreita kutakin, tai määrä istutettu motiiveja kussakin promoottori. Tulokset pysyivät kvalitatiivisesti samanlaisia (kuviot S2 ja S3).
Prima on marginaalinen etu DEMON pieniin aineistoja (30 promoottorit, demoni väärien positiivisten määrä (FPR) on 0,0006 vs. 0,0004 varten PRIMA, ks . S3). Nämä hyvin vähän tekevät FPR molempien menetelmien olennaisesti sama.
Seuraavaksi vertasimme kahta menetelmää äskettäin julkaistua
Amadeus
metazoan vertailuarvo, joka on kokoelma TF ja microRNA kohdegeenin sarjaa peräisin suurikapasiteettisten kokeita (geenien ilmentymisen microarray ja chip-on-chip kokeita) [9]. Me ladata kaikki ihmisen ja hiiren merkinnät tämän kokoelman, jossa jokainen osa sisältää yhden TF ja listan kohdegeenien (vaihteluväli 25-2238 geenejä).
Taulukossa 1 esitetään tulokset DEMON ja PRIMA kaikkien tutkituista syötetyt tiedot. DEMON tunnistettu tosi TF 70,3% tapauksista (missä 51,8% tapauksista todellisen TF on sijoittunut ensimmäiseksi tai toiseksi) kun PRIMA tunnistimme sen 55,5% tapauksista (vuonna 48,1% tapauksista, todellinen TF on sijoittunut ensimmäiseksi tai toiseksi). Lisäksi 37%: ssa tapauksista DEMON sijoittui oikeaan TF korkeampi PRIMA taas PRIMA sijoittui oikeaan TF korkeampi DEMON vain 18,5%: ssa tapauksista.
havaitseminen TF: iä osallisena transkription säätelyyn in PAC
käytettiin aluksi listan ilmentyvät eri geenien PAC koonnut Brandt
et al.
[6] 10 tutkimuksissa. Saimme tästä luettelosta pienempi listan 45 geeniä, jotka havaittiin differentiaalisesti ilmaistaan 3 tai enemmän tutkimuksia, joista 38 (30 että ilmeni kohonneita ja 8, joissa havaittiin vähentynyt ilmaus) Hyväksytty meidän kokoelma ihmisen promoottorien (katso taulukko S1). Analysoimme tätä listaa käyttämällä DEMON ja havaitsi merkittäviä rikastaminen 6 motiiveja, joista korkeasti rikastetun motiiveja olivat varten RUNX alaryhmä ien (kutsutaan myös AML alaryhmä). Kun rajoitimme konsensus tiedot asetettu 30 geenejä, jotka osoittivat lisääntynyt transkriptio, DEMON havaittu merkittävää rikastumista 8 motiiveja, joista pisimmälle rikastettu motiiveja olivat myös RUNX.
TF: ille on RUNX alaryhmä , ovat sitovia kumppaneita heterodimeerisen transkription sääntelyviranomaisten merkitään CBFs (core-sitova tekijät), joista CBFA (RUNX) jäsenet sitoutuvat suoraan DNA ja kaksi vaihtoehtoisesti-saumattu CBFb (tunnetaan myös PEBP) jäsentä sitoutuvat CBFA alayksikköä ja parantaa sen DNA: ta sitovan [10]. On huomionarvoista, että PEBP näkyy kolmannen ja toiseksi rikastettu TF, vastaavasti (katso taulukko 2).
käytetään PRIMA analysoida samoihin listoihin, ja löysi huomattavan väkevöiminen motiivin, ZBRK1, jota kutsutaan myös ZNF350 (katso taulukko S2). Kuitenkin qRT-PCR kokeet osoittivat vain vaatimattomia muutoksia ZNF350 ilmentymisen PANC-1s upon seerumin peruuttamisesta (julkaisemattomat tulokset, ks. S1).
Kolmen erittäin homologisia ihmisen RUNX TF: ien (RUNX1, 2, ja 3 ) ovat sekaantuneet kehitys- prosesseja ja etenkin syövän. RUNX1 (tunnetaan myös AML1) on laajasti dokumentoitu tärkeä tekijä hematopoieesia ja etiologiassa akuutti myelooinen leukemia (katsausta varten katso [11]). RUNX2 on osoitettu olevan osallisena luun kehitykseen (katso katsaus [12]) ja RUNX3 dokumentoitiin tärkeäksi TF kehittämisessä T-lymfosyyttien [13] – [15] ja on liittynyt patogeneesin useiden maligniteettien [ ,,,0],16], kuten PAC [17], [18]. Siten DEMON analyysi ennustaa, että RUNX TF perheenjäsenet ovat top ehdokkaita vastaavat muuttuneita transkriptio geenien PAC konsensus keräämiseen.
RUNX kokeellinen validointi
Suurin osa kokeellista tietoa syövän vertailla geenien ilmentyminen syövän kudosten kanssa terveiden kudosten ihmisluovuttajia. Vertailussa suodattaa vaihtelevuutta geenien ilmentymisen vuoksi sukupuoli ja potilaan ikä, sairauden vaiheesta, osallistuminen liity patologisia tiloja, erilaiset (syöpä kohdistetut ja muut) lääkehoidot, sekä etnisiä genetiikka ja elämäntavat. Näin ollen ainoastaan geenit yhteisiä PAC taustalla kaikki edellä lähteet vaihtelua ovat edustettuina. On huomionarvoista, että Brandtin et al. [6] luettelon lähes tuhat differentiaalisesti ilmentyvien geenien kutistuu 148 ja 45, kun siihen lisätään vaatimus, jonka mukaan sen on oltava vähintään kaksi tai kolme tutkimusta, vastaavasti.
välttämiseksi potilaiden välinen vaihtelu, päätimme tutkia ero geeniekspressiomalleja havaittiin kaksi viljelmän solutyyppejä: HIPC, haiman edeltäjä soluja, jotka selvitä viljellyistä ihmisen Langerhansin saarekkeissa terve kuolleelta luovuttajien ja PANC-1-solut, vakiintunut linja ihmisen PAC. Tärkeää on, että molemmat solut läpikäyvät mesenkymaalisten-to-epiteelin siirtymistä (MET) ja osittain eriyttää, jotta neuroendocrine fenotyypin, kun sallitaan yhdistää seerumittomassa väliaineessa [19], [20]. Vaikka HIPC lakkaavat lisääntyä ja jotkut heistä kuolee PANC-1-solut lisääntyvät nopeasti näissä olosuhteissa.
Ensisijainen olettamus meidän paradigma on, että vastaus eriyttäminen ärsyke paljastaa muutoksia geenien ilmentyminen, jotka erottavat normaalit PAC soluista. Parhaan tietomme mukaan ei ole mitään todisteita kirjallisuudessa, että verrattaessa prosessit normaaleissa ja syöpäsoluissa samaa alkuperää olosuhteissa, jotka indusoivat osittaisderivoinnin tuottaa käsityksen syöpään liittyvien geenien ilmentymisen. Jatkuva solujen lisääntymistä seerumittomassa väliaineessa voisi johtua mutaatioista keskeisten geenien (esim., K-Ras). Kuitenkin kaikki syöpäsolun piirteet (esim. Maahanmuutto, invasiivisuus, stimulaatio angiogeneesin, vastustuskyvyn sytotoksisille aineille) voidaan suoraan niiden kykyyn lisääntyä ilman kasvutekijöiden. On mahdollista, että tämä malli tuottaa geenejä, jotka jäivät perinteisessä terveen vs. sairaan kudoksen menetelmiä. Meillä on siis viljellään sekä HIPC ja PANC-1-solut seerumivapaassa väliaineessa 24 h ja verrattiin muutoksia geeni-ilmentymisen sekä solutyypeissä. Vertailussa saatiin manuaalisesti kuratoitu joukko 30 geenejä, joiden ilmentyminen muuttunut merkittävästi yhdessä solutyypissä ja joko eivät muuttuneet tai näytteille muutos vastakkaiseen suuntaan muissa (katso taulukko S3). Analysoimme tätä setti DEMON (katso taulukko S4). Vaikka PEBP (CBFb) oli vain marginaalisesti rikastettu (p~0.1) tässä luettelossa, se näytti joukossa kymmenen eniten TFBSs näytteille alimman p-arvot sekä luetteloissa johdetaan demoni konsensus aineistoja (sijalla 2. ja 3.) ja HIPC-maiden vs. PANC-1-soluissa kokeilun datajoukon (sijalla 6). Tämä havainto tuki ennustaa, että RUNX Saharan perheenjäsenet voivat olla mukana PAC. Analyysi samat tiedot asetettu PRIMA ei löytänyt mitään rikastettua motiiveja (katso taulukko S5).
Jos haluat saada kokeellista näyttöä varten RUNX erottamaan normaalit ja PAC soluissa, me seurataan ilmaus RUNX1, 2 ja 3 mRNA: iden qRT-PCR ajan funktiona seerumin menetyksen HIPC ja PANC-1-solut (Fig. 4). Oli juurikaan muuttunut ilmaus RUNX1 ja 2 transkriptien joko solutyypissä. Ilmentymisen RUNX3, oli kuitenkin merkittävästi lisääntynyt ajasta riippuvalla tavalla HIPC kun ei ollut käytännöllisesti katsoen mitään muutosta PANC-1-soluissa. Se vaikuttaa siltä, että ilmentyminen RUNX3 säädellään HIPC erilaistumisen aikana, mutta ei vastaa erilaistumista ärsyke PANC-1-soluissa.
HIPC ja PANC-1-soluja joko viljeltiin seerumia sisältävässä väliaineessa (t = 0) tai osoitetut kertaa seerumivapaassa väliaineessa. RNA uutettiin ja qRT-PCR suoritettiin, kuten on kuvattu Materiaalit ja menetelmät. Tulokset on esitetty%: n muutos mRNA-tasojen kolmen RUNX geenien ajan funktiona seerumittomassa väliaineessa.
edelleen vahvistaa tätä päätelmää, me määritettiin HIPC ilmentymisen viiden oletetun RUNX tavoitteet, ECM2, DUSP2, ESAM, PECAM, ja ITGB4, jotka on valittu luettelosta oletetun RUNX tavoitteet generoidaan perustuen samanlainen menettely kuin se kuvattua menetelmää [4]. Neljä näistä mRNA: iden näytteillä merkittäviä muutoksia ilmaisun (ks. 5A), kun taas viides, ITGB4, osoitti vain ohimenevä kaksinkertainen lisäys. Vertailun vuoksi näiden geenien ilmentymistä ei muuttunut PANC-1-soluissa (ks. 5B). Kun ilmaus samat geenit tutkittiin microarray data, kukaan (mukaan lukien RUNX3) olivat riittävän korkea merkittävää analyysia, joka vahvistaa ylivoimainen herkkyys qRT-PCR.
. HIPC ja B. PANC-1-soluja joko viljeltiin seerumia sisältävässä väliaineessa (t = 0) tai osoitetut kertaa seerumivapaassa väliaineessa. RNA uutettiin ja qRT-PCR suoritettiin, kuten on kuvattu Materiaalit ja menetelmät. Tulokset on esitetty%: n muutos mRNA-tasojen on osoitettu geenien ajan funktiona seerumittomassa väliaineessa.
Keskustelu
Olemme esitelleet uuden algoritmin ilmaisemiseksi rikastettu TFBSs tietyssä joukko promoottoreita. Algoritmi käyttää HMM-pohjainen pisteet ottamaan huomioon kaikki mahdolliset jäsentää promoottorin sekvenssin sitoutumiskohtiin ja tausta nukleotidin. Se painaa periaatteellisesti tavalla kaikkia mahdollisia sitoutumiskohtia pitkin promoottori, jolloin on mahdollista harkita useita heikosti sitovaa sivustoja, jotka eivät olisi läpäisseet merkitys kynnys. Tämä on ensimmäinen käyttää tällaista menetelmää rikastamiseen testejä. Osoitamme, että se päihittää aiemman lähestymistapa (PRIMA) ongelmaan, joka käyttää kynnys tehdä binary päätöksiä todellisten sitoutumiskohdat.
kolme näkökohtia koetuloksista Tässä raportissa esitetyt näyttävät olevan suuri merkitys . Ensinnäkin ne kokeellisesti vahvistaa valtaa DEMON analyysin ennustaa TF: t (ja niiden kohdegeenien) pienestä määrästä erilaisesti ilmaistuna geenien PAC. Vaikka DEMON osoittautunut ylivoimaiseksi PRIMA simulointi kokeiluja, sen arvo voidaan osoittaa vain sen kokeellinen ennakoivaa kyky. Meidän tapauksessamme valta DEMON ollut ainoastaan validoitu RUNX3, mutta myös luonnostaan johdonmukaista tunnistaminen CBFb, heterodimeeristä kumppani (t) RUNX alaryhmä.
Toiseksi tuloksemme viittaavat vahvasti siihen että RUNX3 ja sen heterodimeeriproteiinia kumppani CBFb tulisi tutkia tarkemmin koskien niiden mahdollinen rooli (t) PAC verestä. Poikkeamat ilmaus RUNX1 havaittiin merkittävä osa leukemiat [11]. RUNX2 ja 3 geenejä on tutkittu laajasti kehitykselliset TF: iä. RUNX2 osoitettiin olevan ratkaiseva luuston ja luuston kehitykseen [12]. RUNX3 osoitettiin suoraan mukana sitoutuminen CD4 + /CD8 + solujen CD8 + T-soluissa ja kypsymistä dendriit- T-solujen [15], [21]. Jotkin raportit osoittavat roolin RUNX3 kehittämisessä aisteihin hermosolujen järjestelmän [22], [23]. Hypermetylaatiota RUNX3 promoottorialueen on korreloitu eri etäpesäkkeistä syöpää, kuten rinta-, ei-pienisoluisen keuhkosyövän, mahalaukun, haiman, peräsuolen, tai maksasolukarsinoomat [24]. Tärkeää on, että palauttaminen RUNX3 ilmentymistä syöpäsolulinjoissa johtaa apoptoosin tai vähentynyt syöpäsolujen lisääntymistä ja niiden erilaistumista [25] – [28]. Nämä ja vastaavia raportteja, vahvistettiin, että RUNX3 näyttää toimivan tuumorisuppressorina. Niitä vahvistaa lisäksi meidän havainto, että transformoimaton mesenkymaaliset HIPC vastata erilaistumista ärsyke lisääntynyt RUNX3 transkriptio ja leviämisen pidätys, kun taas pahanlaatuiset PANC-1 solut näyttävät menettäneen tämän sääntelytoimilla ja edelleen lisääntyä. Ihmisen PAC, hypermetylaation ja heterotsygoottisuuden menetys RUNX3 löydettiin suuri osa PAC kudosten ja korreloivat huonompi ennuste [17], [18]. Nämä havainnot aseta RUNX3 toisena PAC liittyvän geenituotteen. DEMON analyysi kuitenkin asettaa RUNX ja sen kumppani, PEBP, sillä oletettavasti erittäin tärkeänä TF: ien valvoa ilmaisua monien PAC liittyviä geenejä.
Kolmanneksi, tulokset vahvistavat oletusta, että erot normaalin haiman ja PAC-solut paljastuvat jälkeen eriyttäminen ärsyke. Tätä olettamusta vahvistaa vielä äskettäin analyysi transcriptomes osallisina syövän ja kehittämiseen [29]. Lisääntyvissä HIPC ja PANC-1-soluissa, sekä joilla mesenkymaaliset fenotyypit [19], muutaman RUNX3 transkriptit ovat läsnä (kynnysarvot 31,5 ja 30 sykliä, vastaavasti). 24 h erilaistumiseen väliaineessa kuitenkin tasot RUNX3 mRNA HIPC kasvanut yli 1000-kertainen taas ei käytännössä ollut vastetta PANC-1-soluissa. Samoin otaksuttu RUNX3 kohdegeenien näytteillä muuttuneessa transkription HIPC mutta ei muutoksia PANC-1-soluissa. Tärkeää on, Li
et al
. [30] ovat havainneet, että RUNX3 ilmentyy vain saarekkeet ja suhteessa PAC kudoksiin. Meidän kokeelliset tiedot osoittavat, että vaikka RUNX3 mRNA ilmentyminen voi olla erilainen lisääntyvissä normaaleissa ja PAC soluissa, sen rooli paljastuu vasta sen jälkeen, erilaistumista ärsyke, mikä selittää näennäinen erimielisyys havainnot Wada
et al.
Ja Nomoto
et al.
[17], [18] ja ne, Li
et al
. [30].
On tärkeää, että eriyttäminen aiheuttama vaste RUNX3 ja sen viiden otaksuttu tavoitteensa HIPC ei voida päätellä mikrosiruanalyysi puuttumisen vuoksi signaalin tai niiden hyvin alhainen. Vaikka PECAM1 ja CBFA2T1 signaaleja kasvoi yli kaksinkertaiseksi, niiden signaalit olivat liian alhainen olevan merkittäviä. Tämän vuoksi on perusteltua käyttää laskennallisia menetelmiä, kuten DEMON tai PRIMA, tunnistaa geeni tavoitteet ja niiden validointi herkempi qRT-PCR-tekniikkaa. Tosin qRT-PCR voi paljastaa epigeneettiseltä-ohjattu asetusten solun fenotyypin.
tulokset viittaavat menetys vasteen RUNX3 geenin PAC ja ehdottaa lisätutkimuksia, kuten tutkimus metylaation sen promoottorin, ja enemmän laaja ilmaus tutkimus oletettujen RUNX kohdegeenien.
Materiaalit ja menetelmät
demoni algoritmi
DEMON algoritmi käyttää HMM edustaa TFBSs. Jokainen HMM muodostuu kahdenlaisia todetaan: motiivin valtiot ja taustan valtiot (Fig. 1). Tausta tila on määritelty kunkin nukleotidin (neljä tilaa), ja kuvio tila on määritelty kaikissa asennoissa pitkin PWM vastaa TFBS kohteisiin. Päästöjen todennäköisyydet motiivin valtioiden määritellään mukaan PWM, ja ne taustan valtiot asetetaan 1 vastaavan nukleotidin. Siirtyminen todennäköisyyksien välillä taustan valtioiden heijastavat jakelua dinukleotidien kaikilla otaksuttu promoottorialueet ihmisen. Siirtyminen todennäköisyys kustakin motiivi valtion seuraavaan on 1. Jäljellä siirtymät ovat siirtymässä tausta toteaa (Fig. 1, katkoviivoilla) tai siirtymässä ensimmäiseen motiivi tila (Fig. 1, kiinteät nuolet). Nämä siirtymät ovat oppineet käyttäen Baum-Welch-algoritmi [31] (tukeminen Information S1).
panoksia DEMON on luettelo kiinnostavat geenit (Fig. 2a) ja joukko TFBS motiivien edustaa pulssinleveysmodulaattorit . Tuotos on luettelo TF: istä, joiden sitoutumiskohdat ovat tilastollisesti yliedustettuina promoottori alueille annetaan luettelo geenejä.
Ensimmäiseksi, me rakentaa HMM jokaisesta tietyn PWM, ja kukin HMM- promoottori pari osoitetaan pistemäärällä heijastaa todennäköisyyttä, että kunkin TFBS näkyy kunkin promoottorialueen. Tämä tilanne on yhtä kuin suhde kahden arvon (Fig. 2b): (i) todennäköisyys päästää promoottorisekvenssin käyttäen TFBS HMM kuviossa 1, ja (ii) todennäköisyys päästää promoottorisekvenssin käyttäen HMM koostuu yksinomaan taustan toteaa. Todennäköisyys arvot lasketaan käyttämällä Forward algoritmi [32]. Pareittain tulokset ovat sitten käytetään laskettaessa yksittäisen pisteet kullekin TF, mikä heijastaa sen yleistä runsautta tulo promoottori asetettu. Tämä pisteytys on määritelty summana kaikkien tulokselle asetettujen erikseen jokaisen promoottori.
Toisessa vaiheessa, käytämme empiiristä lähestymistapaa arvioimiseksi tilastollista merkitystä yleiseen todennäköisyyteen tulokset lasketaan varten TF: ille. Me satunnaisesti valita saman verran promoottoreita kuten alkuperäisessä datajoukon varastoalueelta kaiken inhimillisen promoottorialueiden ja laske uusi pisteet kullekin TF kuten edellä (Fig. 2c). Toistamme tämän menettelyn 100 kertaa, päätyen empiirinen jakauma satunnainen todennäköisyys tulokset. Jokainen TF sitten määritetty empiirisesti
p
-arvon määrittelee todennäköisyys nähdä asetettu summan tulokset, koska satunnainen määrät, jotka oletetaan normaalijakaumaa (Fig. 2d). so me laskettava keskiarvo ja keskihajonta satunnainen tulokset, ja käyttää normaalia kertymäfunktio laskea todennäköisyys sille, että havainto tavallisesta normaalijakaumasta on suurempi kuin asetettu summan tulokset. P-arvot korjataan useiden hypoteesien testaus käyttäen väärää löytö korko menettelyn [33]. Raportoimme kaikki havainnot vääriä löytö korko alle 5%.
Data Acquisition ja PRIMA toteuttamiseen
Saimme joukon nukleotidin jakelu matriisien että malli selkärankaisten TFBSs päässä Transfac tietokannasta (release 11,1) [ ,,,0],8]. Yhteensä 588 selkärankaisten matriiseja ladattu tietokannasta. Matriisit muunnettiin todennäköisyys matriisit, joissa kartoitetaan todennäköisyys kunkin nukleotidin näkyvän kussakin asemassa TFBS. Koska tietokanta on tarpeeton ja jotkut matriisien kuvaavat samanlaista TFBS, me ryhmitelty matriiseihin esikäsittely vaiheessa samanlainen menettely kuin se, jota käytettiin [4]. Tätä varten rakensimme PWM
w
kustakin todennäköisyys matriisin
m
, ja käytetään alhaisen ennalta laskettu kynnys
t
skannata ihmisen genomin promoottoreita. Kynnysarvo lasketaan käyttämällä kahta tausta promoottorien: (i) satunnainen promoottorit, jotka on rakennettu nukleotidisekvenssin perusteella jakelun kaikissa promoottorit, (ii) valitaan satunnaisesti segmentit todellista promoottorit. Nämä kaksi sarjaa skannataan kukin PWM
w
ja kynnys
t
määritellään välinen maksimiarvo 100
th korkeimmat pisteet kustakin kaksi taustan aineistoja (mikä tarkoittaa FPR 0,01). Jokainen alasekvenssi että oli samankaltaisuus pisteet PWM
w
kynnyksen yläpuolella
t
oli merkitty oletetun esiintymä
w
. Sitten kunkin parin matriiseja, että
x
% niiden esiintymisiä promoottori asetetaan päällekkäisten on ryhmitelty ja matriisi, jolla on alhaisempi tietosisällön (eli matriisi, joka on vähemmän eri tasainen jakauma) poistettiin . Koska arvo
x
lisääntyessä klustereiden kriteeri tulee tiukempi ja johti matriisien asettaa kasvaa, ja päinvastoin. Käytimme
x
= 0,2 saamiseksi joukko 219 matriisien käyttää analyysimme.
ladataan täydelliset ihmisen promoottorien UCSC Genome Browser tietokantaan [34], [35 ]. Alustavien testaus ja viimeaikaiset tutkimukset väittävät, että suurin osa TFBSs ihmisen promoottorit ovat lähellä transkription aloituskohdasta [36], määritellään promoottorialueet geenien ja 500 ep: n sekvenssi ylävirtaan transkription aloituskohdasta.
Olemme toteuttaneet PRIMA kuvatulla [4].
Soluviljelmät
Human islet johdettuja haiman esiastesolujen (HIPC) eristettiin ja kasvatettiin modifioidussa CMRL väliaineessa kuten aikaisemmin on kuvattu [ ,,,0],20]. Ihmisen haiman adenokarsinooman solulinjaa PANC-1 hankittiin American Tissue Type Collection ja ylläpidetään Dulbeccon modifioitua minimaalinen Eaglen (DMEM) kuten aiemmin on kuvattu [20]. Osittainen erilaistuminen joko solutyypin saatiin aikaan viljelemällä soluja seerumittomassa väliaineessa, oleellisesti, kuten aikaisemmin on kuvattu [20]. Soluja kasvatettiin ja ylläpidettiin 95:5% ilmassa: CO
2 ilmakehässä 37 °.
DNA-siru
Affymetrix GeneChip- Human Genome U133 Plus 2,0 mikrosiru (luettelo # 900466) käytettiin, jolloin saatiin 12760-sekvenssejä. HIPC analysoitiin kolmena kappaleena, kukin erillinen biologisessa näytteessä. PANC-1-soluja määritettiin pentaplicate paneelit, kaksi erillistä biologisesta rinnakkaisnäytteiden ja toisen biologisen toisinto suoritettiin kolminkertaisina taulukot. Kukin sarja käsitti näytteet eristettiin lisääntyviä soluja (t = 0, 10% naudan sikiön seerumia sisältävässä väliaineessa) ja soluja sen jälkeen, kun 24 h seerumittomassa (erilaistuminen) väliaineessa.