PLoS ONE: uusi algoritmi Integroitu analyysi miRNA-mRNA Interactions Perustuen Yksittäiset Classification paljastaa Oivalluksia Virtsarakon Cancer

tiivistelmä

Background

MikroRNA (miRNA) ovat pieniä ei-koodaavat RNA: t jotka säätelevät geenin ilmentymistä. On ehdotettu, että miRNA tärkeä rooli syövän kehittymisessä ja etenemisessä. Niiden kyky vaikuttaa useita geeni reittejä suuntaamalla eri mRNA: t tekee niistä mielenkiintoisen luokan sääntelyviranomaisten.

Menetelmät /Principal Havainnot

Olemme kehittäneet algoritmin, luokittelu perustuu analyysi Pariksi Expression data RNA (CAPE RNA), joka pystyy tunnistamaan muuttunut miRNA-mRNA sääntelyn välillä kudosnäytteistä, joka määrittää vuorovaikutus valtiot kunkin näytteen ilman ennestään kerrostuminen ryhmiä. Jakauma osoitetun vuorovaikutuksen valtioiden verrattuna tietyn koeryhmään käytetään laadun arvioinnissa ennustetun vuorovaikutusta. Osoitamme sovellettavuus lähestymistapamme analysoimalla urothelial karsinooma ja normaalissa virtsarakossa kudosnäytteitä peräisin 24 potilasta. Käyttämällä lähestymistapa, normaali ja kasvaimen kudosnäytteet sekä eri vaiheissa syövän etenemisen olivat onnistuneesti kerrostunut. Myös meidän tulokset viittaavat mielenkiintoinen säädellään eri tavalla miRNA-mRNA vuorovaikutukset liittyy virtsarakon syövän etenemiseen.

Johtopäätökset /merkitys

Tarve työkaluja, joiden avulla integroiva analyysi mikroRNA ja mRNA: n ilmentymisen data on ollut osoitettu. Tämän tutkimuksen, tarjoamme algoritmi, joka korostaa jakamisesta näytteiden listalla säädellään eri tavalla miRNA-mRNA vuorovaikutusta. Tämä on uusi näkökulma verrattuna nykyisiin lähestymistapoihin. Vuodesta bootstrap analyysi, meidän ranking tuottaa ominaisuuksia, jotka rakentaa vahvoja luokittelijoiden. Tarkempi analyysi paljastaa geenejä tunnistettu differentiaalisesti säännellään miRNA rikastettu syövän reittejä, mikä viittaa biologisesti mielenkiintoinen vuorovaikutusta.

Citation: Hecker N, Stephan C, Mollenkopf HJ, Jung K, Preissner R, Meyer HA (2013 ) Uusi algoritmi Integroitu analyysi miRNA-mRNA Interactions Perustuen Yksittäiset Classification paljastaa Oivalluksia virtsarakon syövän. PLoS ONE 8 (5): e64543. doi: 10,1371 /journal.pone.0064543

Editor: Panayiotis V. Benos, University of Pittsburgh, Yhdysvallat

vastaanotettu: 12 lokakuu 2012; Hyväksytty: 17 huhtikuu 2013; Julkaistu: toukokuu 24, 2013

Copyright: © 2013 Hecker et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus rahoittivat BMBF (MedSys myöntää nro 0315450) https://www.bmbf.de/and Deutsche Forschungsgemeinschaft (DFG) GRK 1772 ”Computational Systems Biology” https://www.dfg.de. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Virtsarakon syöpä on neljänneksi yleisin syöpä teollistuneissa maissa [1]. Lihas invasiivinen virtsarakon syöpä on edelleen korkea kuolleisuus, vaikka parempia hoitoja paremmalla kirurgisten tekniikoiden ja aggressiivisia hoitoja. Noin 90% kaikista urothelial kasvaimet luokitellaan uroteelisyövässä (UCC), joka voidaan jakaa kliinisten ja morfologisia parametreja kahdessa eri alaryhmiin [2], [3]. Valtaosa UCC kuuluu ryhmään papillaarisen ei-invasiivisia kasvaimet (vaihe PTA), yleensä nämä kasvaimet ovat hyvin eriytetty, taipumus kasvaa hitaasti ilman suuria leviää ja on hyvä kliininen ennuste. Jäljellä kolmasosa UCC ovat invasiivisia kasvain (vaihe pT1 ja uudemmat) huonosti erilaistuminen, korkea eteneminen hinnat ja kyky muodostaa etäpesäkkeitä. Molekyylitasolla, useimmat ei-invasiivisia UCC liittyvät FGFR3 mutaatio ja kromosomin 9 tappio [4], [5], kun taas inaktivoinnin p53 ja PTEN toiminto on tärkeä rooli etenemistä invasiivisen UCC [6]. Useissa julkaisuissa, transcriptomic ilmaisu kuviot on yhdistetty kliininen tulosten urothelial karsinooma [7] – [10]. Lisäksi ensimmäinen integroitu analyysi sekä miRNA ja mRNA tietojen suoritettiin saada tarkemman käsityksen säätelyverkkojen ja mukana syövän signaalintransduktioreitteihin jotka aiheuttavat virtsarakon syöpää [11], [12]. Kuitenkin tarkkaa mekanismia käynnistymiseen ja etenemiseen virtsarakon urothelial karsinooma edelleen suurelta osin epäselvä. Lisätutkimuksia geeniekspression ja miRNA ekspressiotietojen on ratkaisevan tärkeää havaita ne tuntemattomia prosesseja, jotka johtavat tumorgenesis. Perustamalla microarray sovellusten useat laskennalliset menetelmät on kehitetty analysoida geenien ilmentyminen tietoja. Gene asettaa analyysi ja geenin rikastaminen analyysiä käytetään usein tunnistamaan differentiaalisesti ilmentyvien geenien [13], [14]. Yleisin työkaluja ja web-palveluita, jotka soveltavat periaatteita geenin rikastaminen analyysi ovat DAVID [15], GeneTrail [16], Gorilla [17], GeneCodis [18] ja GOEAST [19], sillä yleinen katsaus katso viite [20] .

Lukuun ottamatta koekspressoi geenejä, differentiaalisesti säännelty paria miRNA ja mRNA: iden tärkeä rooli useissa solu- prosesseja ja sairauksia. Arvioida tämän ongelman useita menetelmiä on kehitetty ennustamaan vuorovaikutuksia miRNA ja mRNA: t perustuvat niiden sekvenssit. Useimmat työkaluja hyödyntää siemen täydentävä välillä miRNA ja 3’UTR spesifisten mRNA, tietoja sekvenssikonservoinnista vierekkäisten emäksiä ja termodynaamisten ominaisuuksien miRNA-kohde-mRNA vuorovaikutusta. Eri menetelmät ovat äskettäin arvioitu [21]. Jotkut yleisimmistä työkalut ovat TargetScan [22] – [25], PicTar [26] – [29], Miranda [30] – [32] ja PITA [33]. Useat web resursseja tarjota validoitu tai ennustettu miRNA-mRNA vuorovaikutukset, esim. TarBase [34], miRecords [35], miRGen [36] ja miRBase [37], miRGator tarjoaa miRNA ja mRNA: n ilmentymisen profiilit [38], STARBASE [39] ja DORINA [40] ovat tietokantoja, jotka integroivat miRNA ja ribonukleoproteiini- sitoutumiskohdista.

on olemassa tarve menetelmille, joissa otetaan huomioon erityispiirteet miRNA aiheuttama sääntelyn. miReduce [41] ja Sylamer [42] voidaan käyttää arvioitaessa korrelaatio siemen motiivi rikastusta in 3’UTRs mRNA erilaisesti geenien in miRNA poistokokeita. DIANA-mirExTra toteuttaa samankaltainen geeni motiivi arviointimenetelmiä kuin verkkopalvelun [43]. Creighton et al kehittämä kokoelma Excel makroja yhdistää sarjaa rikastettua geenien kanssa miRNA-mRNA vuorovaikutus ennustukset [44]. Äskettäin menetelmät ja web-palvelut integroidun analyysin miRNA ja mRNA: n ilmentymisen tiedot on kehitetty kuten MAGIA [45], [46], MMIA [47], mirAct [48], miRConnX [49] ja miRTrail [50] . GenMIR ++ toteuttaa Bayesian oppimisen lähestymistapa tunnistaa ero miRNA-mRNA asetuksen [51], [52]. HOCTAR laskee negatiiviset korrelaatiot miRNA ja mRNA: n ilmentymisen [53]. Muut menetelmät perustuvat regressioanalyysin [54], [55]. Perustuva lähestymistapa clustering miRNA ja mRNA: n ilmentymisen tiedot yhdessä t-testi kehitettiin Jayaswal et al. [56]. Useimmat nykyiset välineet ovat puutteita esimerkiksi käyttämällä menetelmiä, jotka ovat virhealtista ja harha tai ne eivät salli tunnistaa ero asetuksen kahden ryhmän välillä näytteitä.

Tässä tutkimuksessa esittelemme uusi lähestymistapa, joka arvioi ero miRNA -mRNA asetus yhdistettynä näytteiden jakelu yhden vuorovaikutuksen. Oletamme, että yhden miRNA-mRNA vuorovaikutukset ovat ominaisia ​​tietylle tilan kasvaimen. Pidämme ero miRNA aiheuttama geenisäätelyssä kuin kahden luokan ongelma ja käyttää seuraavaa oletusta. Koska välinen vuorovaikutus miRNA ja mRNA, joka on ominaista eroa kaksi ryhmää näytteiden miRNA on säädelty ja mRNA alassäädetty ensimmäiseen ryhmään nähden toiseen ryhmään, tai vastavuoroisesti. Lähestymistapamme luokittelee kukin ennustettu vuorovaikutus kullekin näytteelle riippumatta ryhmästä tietoa. Tällä tavalla voidaan analysoida yksittäisiä eroja sisällä kollektiivinen näytteitä tietylle vuorovaikutusta. Lisäksi annettiin vuorovaikutus, voimme osittaa näytteet arvioidaan ryhmiin, jotka heijastavat miRNA aiheuttama geenisäätelyn. Välinen sopimus odotettu ryhmien ja kokeellinen niistä saadaan mielekäs ranking erottaa mahdolliset yhteisvaikutukset niistä, jotka ovat epätodennäköisiä. Viimeisessä vaiheessa, me sisällyttää tietoja negatiivinen korrelaatio miRNA ja mRNA: n ilmentymisen eliminoimiseksi vääriä positiivisia.

tunnistaminen säädellään eri tavalla miRNA-mRNA vuorovaikutukset on pohjimmiltaan eräänlaista ominaisuuksien hallintaan. Validoida eri vaiheita lähestymistapamme, olemme suorittaneet Pääkomponenttianalyysin analysoida erottaminen näytteiden jälkeen tehtävän vuorovaikutuksen valtioiden ja arvioitu suorituskyky meidän ranking rakentaa luokittelijoiden.

Erityisesti olemme käyttäneet lähestymistapamme kollektiivinen terveen virtsarakon kudosnäytteistä ja virtsarakon kasvain näytteet eri vaiheissa. Lisäksi olemme tutkineet kyky lähestymistapamme luokitella eturauhassyövän kasvaimia ja tervettä kudosta, sekä paksusuolen syöpä näytteet ja terveen kudoksen käyttäen pientä näytemäärää [57]. Suorituskyky meidän luokittelijoita verrattiin vakiintunut menetelmä geeniekspression tietojen Prediction Analyysi Microrarrays R (PAMR), joka on parannettu lähin painopisteen luokittelija [58]. Lisäksi laskimme koulutusjakson rikastamiseen pistemäärät geenien ennustettu vuorovaikutus ja ehdottaa mielenkiintoisia vuorovaikutuksia virtsarakon syövän syövän etenemiseen.

Materiaalit ja menetelmät

Potilaille ja Kudosnäytteiden

Valikoima 24 urothelial näytteitä kollektiivinen virtsarakon syöpäpotilailla kuvattu aiemmin käytettiin tässä tutkimuksessa [59]. Kahdeksan näytettä uutetaan ei-pahanlaatuisten virtsarakkokudos (8 miespotilailla; mediaani-ikä 69, vaihteluväli 47-80 vuotta), 8 näytteet heikompilaatuisen papillaarinen urothelial karsinooma (8 miespotilailla; mediaani-ikä 72,5, vaihteluväli 59-79 vuotta; 2x pTaG1 ja 6x pTaG2)), ja 8 näytteitä invasiivisen kasvaimet (6 miestä, 2 naispotilaiden; mediaani-ikä 73, vaihteluväli 62-76 vuotta, 1x pT1G1, 4x pT1G3 ja 3x pT2G3). Näytteet kerättiin välittömästi leikkauksen jälkeen nestemäisessä typessä ja säilytettiin -80 ° C: ssa lisäanalyyseihin saakka. Tuumorin luokitus suoritettiin mukaisesti Kansainvälisen syöpää vastaan ​​ja histologinen luokitus mukaisesti WHO /ISUP kriteerit 2004 [60]. Kaikki virtsarakon syöpäpotilailla meni läpi radikaalin cystectomy tai höyläysleikkaus yliopistollisessa sairaalassa Charité Berliinissä 2008 ja 2009 välillä ja annoimme kirjallinen lupa käyttöön edustavan kudosnäytteiden tutkimustarkoituksiin. Tutkimuksen hyväksyi Ethic komitean yliopistollisen sairaalan Charité (File: EA1 /153/07).

eristäminen RNA ja karakterisointi Määrä ja laatu

analysoitiin tuumorikudoksia näytteet sisälsivät yli 80% tuumorisoluja, kuten aiemmin on kuvattu [59]. Noin 20-30 mg märkäpainoa kudosta käsiteltiin 350 ui lyysipuskuria ja kokonais-RNA eristettiin käyttäen miRNeasy Mini Kit (Qiagen, Hilden, Saksa) mukaan valmistajan protokollaa. Ylimääräinen DNaasi I ruoansulatusta askel RNA sitovan silikageeli kalvo tehtiin. Määrä ja laatu eristetyn RNA määritettiin NanoDrop 1000 spektrofotometrillä (NanoDrop Technologies, Wilmington, DE, USA) ja Bioanalyzer 2100 (Agilent Technologies, Santa Clara, CA, USA). Vain näytteiden RNA eheyden numero (RIN) arvot 5 käytettiin. RNA näytteitä eristettiin ei-pahanlaatuisten samoin kuin ei-invasiivisia ja invasiivisia kasvainkudoksen näytteet osoittivat verrattavissa mediaani 260/280 absorbanssi suhde (2,02, 2,03 ja 2,03) ja mediaani RIN arvot (7,3, 6,7, ja 7,2, Kruskal-Wallisin testiä, P = 0,486).

Microarray-pohjainen RNA Analysis

miRNA ilmaisun analyysi tehtiin yhden värin hybridisointeja ihmisen luettelo 8-plex 15 K microRNA mikrosiruja (AMADID 019118) Agilent (Agilent Technologies, Santa Clara, CA, USA), joka suljettu 723 ihmisen ja 76 viruksen MikroRNA päässä Sanger miRBase (release 10,1). Kaikki reaktio vaiheet suoritettiin, kuten on aiemmin kuvattu yksityiskohtaisesti [61]. Hybridisaation jälkeen mikrosiruja pestiin, skannattu, ja käsitellään toimittajan protokollan. Raakadata normalisoitiin käyttämällä GeneSpring GX11 Software (Agilent) oletusparametrit (kynnys raaka signaali 1,0, prosenttia siirtyminen 90 persentiiliä normalisoitumisena algoritmia eikä lähtötilanteessa muutosta). Kaikki microarray data on talletettu NCBI GEO tietokantaan hakunumerolla GSE36121.

mRNA ilmaisun analyysi tehtiin yhden värin hybridisointeja kokonaisiin ihmisen genomin mikrosirujen 4 × 44 K v2 (026652) Agilent käsittää koettimina ihmisen 34184-mRNA dokumenttinsa. Hybridisaation jälkeen mikrosiruja pestiin, skannattu, ja käsitellään toimittajan protokollan. Raakadata normalisoitiin käyttämällä GeneSpring GX11 Software (Agilent) oletusparametrit (prosenttia siirtyminen 75. prosenttipiste normalisoitumisena algoritmi ja mediaani lähtötilanteen muutos kaikista näytteistä). Kaikki microarray data on talletettu NCBI GEO tietokantaan hakunumerolla GSE40355.

luokittelu miRNA-mRNA vuorovaikutukset

miRNA-mRNA vuorovaikutus keräämiseen.

Validoituja ihmisen miRNA -mRNA vuorovaikutukset saatiin Tarbase 5.0 ja miRecords (versio 11-2010) [34], [35], [62]. Ihmisen kohde-mRNA ennusteita miRNA poimittiin TargetScan 5.2 ja microRNA.org (versio 8-2010) [22] – [25], [63]. MicroRNA.org resurssi käsittää ennusteita lasketaan Miranda algoritmilla [30], [31]. Mikäli microRNA.org ainoa ennusteita, joita pidettiin, olivat ne selityksineen nimellä ”säilyneitä miRNA” ja ”hyvän mirSVR pisteet”. Analyysia varten leikkauspisteessä microRNA.org ja TargetScan ennusteet lisättiin joukko validoitu vuorovaikutusta. miRNA perheet uutetaan määritelty TargetScan keräämiseen.

algoritmi luokittelua varten ilmaisun arvoista.

Tavoitteena algoritmi on eristämiseen ilmaisun vastaavat arvot kutakin mittapää kolmet : ”korkea”, ”medium” ja ”matala”.

Antaa on log-normalisoitu ilmentymisen arvo tietyn koetin tietyllä näytteellä, joka on joko viittaa miRNA tai mRNA. on vastaava joukko ilmaisun arvojen että koetin yli kaikki näytteet. Aluksi ilmaisu arvot exponentiated, so. Tällä tavoin voimme välttää joitakin numeerisia kysymyksiä. Kaikki arvot ovat suurempia kuin nolla, koska lähestyy nollaa kun tulee enemmän negatiivisia, eli kun lähestymistapoja, myös, jos niin. On selvää, siellä on riippuvuus, miten lähtötiedot normalisoitiin.

Määrittelemme absoluuttinen kertaluokkamuutos kuin kaksi arvoa. Huomaa, että.

On kaksi alustavia huomautuksia. Ensimmäinen oletus on, että kaksi ilmaisua arvot ilmentyvät differentiaalisesti, jos niiden absoluuttinen kertamuutos on suurempi kuin tietty kynnys. Toinen oletus on, että arvot, jotka absoluuttinen kertainen muutos on tietyllä alueella ovat samalla ilmaistaan, eli niiden absoluuttinen kertainen muutos on pienempi kuin tai yhtä suuri kuin kynnys.

Koska ja epätyhjä määrittää

B

missä on kardinaliteettia set

B

, määritellään absoluuttinen kertaluokkamuutos välillä

ja keskiarvo set

B

kuin, missä. Jälleen koska

B

on epätyhjä, ja jos ja vain jos.

Määrittelemme että joukko

on naapurustossa

jos ja vain jos missä.

Määrittelemme

edustajana joukko

jos ja vain jos

on naapurustossa

. Huomaa, että voi olla enemmän kuin yksi edustaja joukko

, eli kahden arvon jossa

on naapurustossa

ja

B

on naapurustossa

b,

jos, mutta myös jos ja.

Määrittelemme pisteytyksen toiminto kahden tekijän

ja

b

ja niiden lähiöissä

ja

B

seuraavasti:

Lisää rajoite määrittää lopputuloksen, jossa:

Perusteluksi pisteytys tehtävänä on löytää kaksi samalla ilmaissut arvoja, jotka kattavat suurimman osan tiedoista, siis myös jotka ovat päällekkäisiä vähän kuin mahdollista, eli tietojen kattavuus aikavälillä. Lisäksi lisää samankokoisen sarjat korkeampi teki eli kokojakauma aikavälillä. Muuten yhdet voisi olla yksittäinen jäsen ja toinen setti kaikille muille jäsenille. Koska data kattavuus olisi enemmän kuin lineaarisesti painotettu verrattuna kokojakauma sarjaa, otimme käyttöön toisen asteen suhteen tietoihin kattavuutta aikavälillä. Viimeinen tavallaan ehdot, eli asettaa edustaja rangaistuksen suhteen, rangaista asettaa edustajat, jotka ovat kaukana naapurustossa. Asetettu edustaja rangaistuksen suhteen pitäisi olla vähemmän valtaa kuin peittoalueella aikavälillä siten nämä termit syötetään vain toiseen kahdesta tietojen kattavuuden kannalta.

Yhteenvetona olennainen merkitys pisteytyksen toiminto, tunnistamme kaksi eri lähiöissä, eli arvot muu vastaava ilmaisu. Nämä lähiöissä eroavat ainakin määritelty absoluuttinen kertainen muutos, mutta absoluuttinen kertainen muutos voi olla mielivaltainen suuri. Pisteytysfunktiota arvioi, missä määrin nämä asuvat ovat hyödyllisiä edustamaan tietojen perusteella tietojen kattavuuden ole absoluuttisia arvoja.

Koska saadut kaksi sarjaa ja niitä vastaavat edustajat jotka tuottavat suurimman lopputuloksen, merkitään edustaja alemman arvon ja edustavan korkeamman arvon. Perustuen ja kaksi rajat ja lasketaan seuraavasti:

Perusteena tähän on seuraava. Rajoja on määritelty yläraja alemmasta, ja alaraja ylemmät; jos menevät päällekkäin, rajat kytkeytyvät.

Lisäksi jokaisen luokittelussa

v

määritellään:

Tämä luokitus kutsutaan tilassa seuraavat.

varsinainen luokitus ilmaisun arvojen taitteen kynnys ja naapuruston kynnys määritetään dynaamisesti listalta ennalta pariksi arvojen eli pari i: nnen alkion arvolla. Erikseen kunkin miRNA tai mRNA koetin, taitteen kynnys ja naapuruston kynnyksen, joka saadaan korkeimman kyseisen joukon ilmaisun arvoja. Tätä tutkimusta varten määrittelimme.

Suodatus ja vuorovaikutusta valtioiden.

Vain ne miRNA tai mRNA koettimet pidetään joka ylittää tiettyä pisteet korkeampi kuin kynnys, jossa

t

sanoen mielivaltainen todellinen arvo ja kardinaliteetti on näytteiden lukumäärä. Ottaen huomioon yhden näytteen, mRNA-koettimia, jotka on kartoitettu samaan EntrezGeneID luokitellaan suurin esiintyvä tila. On tie, mieltymykset luokittelussa ovat alhaiset (L), korkea (H) ja sitten väliaine (M). Ennen vuorovaikutukset luokitellaan, mRNA ja miRNA koettimet suodatetaan suhde M luokiteltujen näytteitä, joissa on vastaava kynnys. Jotta miRNA-mRNA vuorovaikutus ja kunkin näytteen luokittelu vuorovaikutuksen on näiden kahden yhdistelmä valtioiden miRNA ja mRNA tässä järjestyksessä, esim. jos miRNA luokitellaan L tietyn näytteen ja kohde-mRNA: luokitellaan H, silloin tila vuorovaikutus on LH. Siksi on yhdeksän mahdollista tilaa yhteisvaikutus:

S

= {LH, HL, LM, HM, MH, ML, HH, LL, MM}.

ryhmä näitä yhdistelmiä niiden biologinen merkitys:

alassäädetty States

S

compHL

= {HL, ML, HM}; sääteli miRNA aiheuttaa hypoteettinen alas-säätely mRNA.

Up-säännelty States

S

compLH

= {LH, MH, LM} ;. Alassäädetty miRNA aiheuttavat hypoteettinen ylössäätöä mRNA.

Undefined States

S

undef

= {HH, LL, MM} jotka eivät noudata biologinen tulkinta edellä.

vuorovaikutus taajuudella määrittelemätön valtioiden korkeampi kuin kynnys jätettiin joukko vuorovaikutusta. Tulemme edelleen viitataan joukko vuorovaikutusten joka täyttää suodatus edellä mainitut kriteerit, kun asetettu säänneltyjen vuorovaikutusten.

Koska kaksi ennalta määriteltyjä ryhmiä

ja

B

se määriteltiin, että vuorovaikutus säädellään eri tavalla ja

ja

B

, jos valtion kanssa suurinta taajuutta ryhmä

on osa ja valtion suurimmalla taajuus ryhmä

B

on osa tai vastavuoroisesti. Kaikille aineistoja tässä tutkimuksessa, asetamme, ja.

Jaccard-indeksi.

Kunkin vuorovaikutusta, joka on Jaccard-indeksi lasketaan arvioimaan välisen sopimuksen ennalta koeryhmään ja odotetaan ryhmiä perustuu oletukseen, että mRNA säätyy alas yhdelle ryhmälle ja ajan säännelty toisen ryhmän tietyn miRNA.

Siksi osio lasketaan johon näytteet ryhmitellään kolmeen ryhmään , ja. Missä on joukko näytteitä, jotka on vuorovaikutus tilan joko HL, HM, tai ML, on joukko näytteitä, jotka on vuorovaikutus tilan joko LH, LM, tai MH ja on näytesarja, joiden tila on joko HH, MM, tai LL.

Jaccard’in-indeksi on niin samankaltaisia ​​kaksi osiota ja ja saavuttaa arvon välillä 0 ja 1 [64], [65]. Kuvio 1 on yhteenveto vaiheet, jotka tehtiin tunnistamiseksi differentiaalisesti säänneltyä vuorovaikutukset tässä työssä.

Tulodataa kuvata oranssi suorakaide. Lähtötiedot osoitetaan punaisella suorakaiteen. Ellipsin viittaa joukko Johdettujen vuorovaikutusta. Tämä joukko on riippumaton lähtötietoja, mutta sitä voidaan muuttaa. Operations manipuloida tietoja kuvattu timantteja.

Yksinkertainen luokitusmalli.

arvioimiseksi soveltuvuutta meidän sijoitusta Jaccard-indeksit, jotka perustuvat joukko valitun differentiaalisesti säänneltyjen vuorovaikutusta yksinkertainen luokitus malli rakennetaan joka ennustaa ensimmäisen ryhmän kokonaisuus näytteitä, esim syöpä näytteitä kollektiivinen syövän ja syöpäsolujen näytettä.

Tällainen malli sisältää joukon valtioiden kullekin vuorovaikutuksen

i

asetetun valittujen vuorovaikutusten

I

, missä tai. Lisäksi joukko määrittelemättömän valtioiden on määritelty. Kunkin näytteen summa vuorovaikutusten luokiteltu ensimmäiseen ryhmään annetaan kaikille vuorovaikutusten

i

jos asia näytteen. viittaa summa vuorovaikutusten luokitellaan toisen ryhmän, eli kaikki vuorovaikutukset

i

jos asia näytteen ja. Toisin sanoen näytteen, voimme kasvattaa jos tila näytteeseen osoittaa asetus samaan suuntaan kuin määritelty malli spesifinen vuorovaikutus, me kasvattaa jos toimen otos vastaa vastakkaiseen sääntelyä ja mitään kasvatetaan jos valtion näytteen vastaa määrittelemätön vuorovaikutusta tilaan. Luokitus jälkeen näyte määritellään korkeintaan ja.

malli generoidaan korkein vuorovaikutukset sisällä kynnysarvo Jaccard-indeksi vuorovaikutuksen tai määritelty useita satunnaistettiin vuorovaikutusten sisällä erilaisia ​​Jaccard-indeksit. Valtiot määritellään tilan mukaan korkein taajuus ensimmäiseen ryhmään.

Bootstrapping analyysi.

normalisoidut lauseke arvot jaettiin satunnaisesti koulutusta ja testi sarjaa, jossa kukin koulutus setti sisältää puoli näytteiden kunkin ryhmän ilman vaihtoa. Jos näytteiden määrä oli outoa ryhmä, koulutukset sarjaa määrättiin yksi näyte yli testin sarjaa kyseiselle ryhmälle. Mitä tulee virtsarakon syövän datajoukon, kollektiivisen kaikista näytteistä, kukin koulutus ja jokaisen testin sarja sisältää kahdeksan näytettä joko ryhmä invasiivisen tai ei-invasiivisia virtsarakon syöpä näytteitä ja neljä normaalia kudosnäytteistä. Kollektiivisen virtsarakon syövän näytteitä, kukin koulutus ja jokaisen testin sarja sisältää neljä invasiivisia virtsarakon syövän näytteitä ja neljä ei-invasiivisia virtsarakon syöpä näytteitä. Kahden kollektiiveja, 100 erilaista aineistoja koulutus- ja testin sarjaa kertyi satunnaisesti jakamalla näytteet alle rajoitusten edellä. miRNA-mRNA vuorovaikutukset laskettiin ja luokiteltiin erikseen kunkin koulutukseen ja jokaisen testin sarja. Kunkin 100 datan asettaa malli laskettiin perustuen harjoitussarjassa ja sovellettu vastaavaan Koepakettia. Mean erityispiirteet, herkkyydet ja vääriä positiivisia hinnat laskettiin kaikkien 100 aineistoja.

Samalla tavalla kuin virtsarakon syövän datajoukon, paksusuolen syöpä ja eturauhasen kasvain datajoukon, jotka sisältävät pariksi miRNA /mRNA micro array ilmaisua tietoja käytettiin arvioida erityispiirteiden mukaisesti. Colon kudosnäytteitä ja eturauhasen kudosnäytteitä poimittiin datajoukon toimittamat Lu et al. [57] ja käsitellään kahtena erillisenä aineistoja. Yksityiskohtaisemmin, paksusuolen kasvain tietojoukko sisältää neljä tervettä näytettä ja seitsemän kasvaimen näytteitä. Eturauhasen kasvain datasarja sisältää kuusi tervettä ja kuusi kasvain näytettä. Sekä paksusuolensyöpä ja eturauhasen kasvain datajoukon erikseen, 50 satunnaistettu opetustiedostoiksi ja testi sarjaa luotiin sitten tarkoita erityispiirteiden mukaisesti laskettiin samalla tavalla kuin edellä on mainittu.

Lisäksi varten syöpäkudoksessa näyte kollektiivinen virtsarakon syöpään datajoukon, koko menettely suoritettiin Peränpitäjänä poistetaan ja sama harha uudelleen määritetty odotettavissa ryhmän tulosten mukaan meidän tarkastelun.

Prediction Analysis mikrosirujen R

Jos haluat vertailla tuloksia meidän luokittelijoiden toisen menetelmän, ennustaminen analyysi mikrosirujen R (PAMR) [58], suoritettiin käyttäen samaa koulutusta ja testi sarjat kuten edellä mainittiin. PAMR käsittää k lähimmän kutistunut Guldinin luokittelija. Raja-arvoa käytetään määrittämään laajentaa kutistuman malli, eli alemman kynnysarvon luo suurempi malli ja korkeampi kynnys pienempi malli. PAMR levitettiin jokaisen sarjan log-normalisoitu miRNA ja mRNA: n ilmentymisen tiedot erikseen. Ensin määritellään erilaisia ​​kynnyksiä erikseen miRNA ja mRNA tiedot kunkin datasarjan käyttämällä ”pamr.plotcv” varten Joissakin tapauksissa koulutusta sarjaa. Seuraavaksi käytimme että erilaisia ​​kynnysarvoja kerrata kaikkia satunnaistettiin opetustiedostoiksi vastaa miRNA tai mRNA datajoukon laskettuna mallien ja luokitteli vastaava testi sarjaa. ”Pamr.adaptthresh ’käytettiin skaalaama malliin ennen luokittelua vastaavan Koepakettia. Lukuun ottamatta kynnysarvoa oletusparametrejä käytettiin kaikkia toimintoja PAMR.

Mean erityispiirteiden mukaisesti laskettiin samalla tavalla kuin edellä on mainittu.

Korrelaatiokertoimet

Kunkin kolmen koeryhmän välillä, eli invasiivinen virtsarakon syövän näytteitä, ei-invasiivisia virtsarakon syövän näytteitä ja normaalin kudosnäytteiden, Spearman korrelaatiokertoimet, ρ, laskettiin välillä miRNA ja mRNA: n ilmentymisen. Tukin normalisoitu ilmaisua arvot käyttää lähtötietoina. Paria miRNA-mRNA: iden määriteltiin samoja vuorovaikutuksia, kuten edellä mainittiin. Ilmaisu arvot käsiteltiin erikseen kunkin kolmen koeryhmän välillä. Spearmanin korrelaatiokertoimet laskettiin kunkin parin miRNA-mRNA vuorovaikutuksia kullekin ryhmälle.

Jalostus virtsarakon syöpään datajoukon

sovellettu lähestymistapamme kaksi eri yhteisöjä, kollektiivinen kaikista näytteistä (8 ei-invasive- ja 8 invasiivisia kasvain näytteet sekä 8 ohjaus henkilöä) ja kollektiivisen kasvaimen näytteitä eri kasvaimen vaiheisiin (8 ei-invasiivisia ja 8 invasiivisia näytettä) ilman terveitä henkilöitä. Sekä kollektiiveja, vain miRNA ja mRNA: t ilmaisun arvot käsiteltiin osoittaa vähintään 20% käytetyn näytettä ”läsnä puhelu”, merkitty mikrosirulla normalisoituminen ohjelmiston GeneSpring GX. Seuraavaksi sovelletaan lähestymistapamme tunnistaa säädellään eri tavalla vuorovaikutusta. Seuraavassa vaiheessa, valitsimme vain vuorovaikutusta, joka on negatiivinen korrelaatio, eli ρ≤-0,4, välinen normalisoitu miRNA ja mRNA: n ilmentymisen arvot ainakin yhden koeryhmään. Kollektiivisen syövän kudosnäytteiden nämä ryhmät ovat invasiivisia virtsarakon syövän näytteitä ja ei-invasiivisia virtsarakon syöpä näytteitä. Kollektiivisen kaikista näytteistä ryhmien käsittävät sekä virtsarakon syöpä näyte ryhmiä ja ryhmä normaalin kudosnäytteiden, eli kolme erilaista ryhmää.

Clustering

vuorovaikutuksen perusteella todetaan pääasiallisena komponenttina ja klustereiden analyysi. Tätä tarkoitusta varten vuorovaikutukseen valtioita korvautuu todelliset arvot kuten edellä taulukossa 1. etäisyys matriisi laskettiin käyttäen korttelin etäisyyden metrisellä. Jälkeenpäin hierarkkinen klusterointi suoritettiin käyttäen Wardin menetelmää etäisyyden toimenpide [66]. Pääkomponentit etäisyyden matriisin laskettiin jossa etäisyys matriisi käsiteltiin joukko

NN

ulotteinen vektorit [67].

Functional merkintä klustereiden

geenit, jotka ovat mukana differentiaalisesti säännellyn vuorovaikutukset miRNA ja mRNA analysoitiin käyttämällä tietokannan huomautusta, visualisointi ja integroitu discovery (DAVID) [15] kanssa vakioluokitusta tiukkuuden parametrit.

Analyysi virtsarakon syöpä datajoukon käyttämällä Magia2 ja Talasso

vertaileva analyysi, haimme neljä ylimääräistä lähestymistapoja analysoida kahden kollektiiveille virtsarakon syöpä näytteitä, kollektiivinen terveen ja kasvain näytteet ja kollektiivinen invasiivisen ja ei-invasiivisia kasvain kudosnäytteistä. Talasso web-palvelin käytettiin tunnistamaan miRNA-mRNA vuorovaikutus Talasso menetelmällä ja GenMiR ++ algoritmi [55]. Välisen liiton Tarbase, miRecoreds 2010 risteyksessä miRandaXL, PicTar 4-tie ja Targetscan (miRGen) valittiin joukko oletettuja miRNA-mRNA vuorovaikutuksia.

Lisäksi Spearmanin korrelaatiota ja meta-analyysi lähestymistapaa käyttäen Magia2 web-palvelin käytettiin analysoimaan tietomääriä [46]. Analysoitavaksi Magia2, leikkauspisteessä ennustuksia TargetScan ja microRNA.org (Miranda) määriteltiin joukko otaksuttu vuorovaikutusta. Koskeva analyysi käyttäen Spearman korrelaatio, ainoastaan ​​vaikutukset otetaan huomioon, että näytteille negatiivinen korrelaatio, eli ρ 0.

Kaikille lähestymistavat ja molemmat kollektiiveja, vain miRNA ja mRNA: t ilmaisun arvot käsiteltiin osoittaa vähintään 20% käytetyn näytettä ”läsnä puhelu”, merkitty mikrosirulla normalisoituminen ohjelmiston GeneSpring GX. Log-normalisoitu ilmaisun arvoja käytettiin analyysiä varten, kuten edellä on mainittu.

Vastaa