PLoS ONE: Laskennallinen Surprisal Analysis Nopeudet-Up genomikartoitus of Cancer Processes

tiivistelmä

Surprisal analyysiä sovelletaan enenevässä tutkimiseksi transkription tasoa solun prosesseissa, kohti paljastaen sisäverkkoon rakenteita ja ennustavat vastaus. Mutta saavuttaa täyden potentiaalinsa, surprisal analyysi olisi sisällytettävä laajemmin laskennallisen työkalu. Tämän paperin ovat yhdistää surprisal analyysin muita tärkeitä laskenta menettelyjä, kuten helppo manipulointi analyysitulosten – esim. valita toivottava tulos sub-setit lisätarkastusten -, haku ja vertailu asiaan aineistoja julkisista tietokannoista, ja joustava graafisia näyttöjä varten heuristista ajattelua. Koko joukko laskennan menettelyt yhdistettiin yhdeksi käytännöllinen työkalu kutsumme

Computational Surprisal Analysis

. Tämä yhdistetty Tällainen analyysi pitäisi helpottaa merkittävästi määrällistä ymmärrystä eri solun toiminnot tutkijoille, mukaan lukien sovellukset proteomiikka ja metabolomiikka. Tämän lisäksi, visiomme on, että

Computational Surprisal Analysis

on mahdollisuus tavoittaa tilan rutiini analyysimenetelmän harjoittajille. Erotuskyky on

Computational Surprisal Analysis

on tässä osoittaa sen soveltaminen erilaisiin solun syövän prosessi transkriptio aineistoja, meidän ja kirjallisuudesta. Tulokset antavat kompakti biologinen kuva termodynaamisen merkitys johtavien geenien ilmentymisen fenotyyppejä kaikissa sairauden vaiheesta. Jokaista transkriptio me luonnehtia sekä sen luontainen vakaassa tilassa paino, sen korrelaatiota muiden selostukset ja sen vaihtelu johtuu taudin. Esitämme erityisen verkkosivuston helpottamiseksi analyysi tutkijoiden ja käytännön.

Citation: Kravchenko-Balasha N, Simon S, Levine RD, Remacle F, Exman I (2014) Computational Surprisal Analysis Nopeudet-Up genomin kartoitus on syöpä prosessit. PLoS ONE 9 (11): e108549. doi: 10,1371 /journal.pone.0108549

Toimittaja: Jose M. Sanchez-Ruiz, Universidad de Granada, Espanja

vastaanotettu: 18 helmikuu 2014; Hyväksytty: 31 elokuu 2014; Julkaistu: 18 marraskuu 2014

Copyright: © 2014 Kravchenko-Balasha et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat jota EMBO tutkijatohtorin kohteeseen NKB ja Euroopan komission FP7 Tulevat ja kehitteillä olevat teknologiat-Avaa projekti BAMBI 618024 (FR ja ETK). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Surprisal Analysis, yleisimmässä merkityksessä, on menettely luonnehtia todennäköisyyttä eri valtioiden järjestelmän, todetaan, että voi olla rikas sisäinen rakenne. Lisäksi järjestelmä voi olla vakaassa tilassa. Menettely alkaa olettamalla, että joukko suhteellisen pieni määrä rajoituksia on tiedossa. Nämä rajoitukset katsotaan riittävän kuvaamaan poikkeamat jakelun vakaan tilan vuoksi asettanut ehtoja järjestelmään. Jos oletetaan rajoitteet eivät riitä todella jäljentää todennäköisyysjakauma, yksi on

yllättynyt

ja siksi täytyy etsiä muuttaa ja /tai muita rajoituksia.

Surprisal Analyysi on sen perusteella, että fysiikan ja on sovellettu onnistuneesti lukuisia fyysisiä, kemiallisia ja tekniikan ongelmia ja vakuuttavasti osoitettu olevan tarpeellisia ja hyödyllisiä tuottaa todennettavia tuloksia [1] – [4].

Tämä työ kuuluu useita kirjoituksia [ ,,,0],5] – [9], jonka tarkoituksena on osoittaa, että Surprisal analyysi on merkitystä ja sovellettavissa biologisia ilmiöitä, erityisesti solujen syövän prosesseja. Tuore kommentaari lähestymistapa Biology on [10]. Käyttämällä surprisal analyysi tunnistamme vakain tasapainoinen mRNA jakaumia kussakin vaiheessa taudin kokeelliset tiedot ja myös vähemmän stabiileja mRNA verkoissa että solujen ylläpitämiseksi pois tasapainoiseen tilaan. Nämä verkot taustalla prosessi syövän kehitystä. Me vertailla solu järjestelmä /potilas verkkoihin osallistuvien syöpää muutosta ja liittyvät ne verkot, jotka edistävät lähinnä tasapainotilan.

Tämä kirja on kaksi ylimääräistä tiettyihin tarkoituksiin.

Ensimmäinen, yhdistää Surprisal analyysi muita tärkeitä laskenta menettelyjä, kuten helppo manipulointi analyysitulosten – esimerkiksi valita toivottava tulos sub-setit lisätarkastusten -, haku ja vertailu kyseisiä tiedostoja julkisista tietokannoista, ja joustava graafisia näyttöjä varten heuristista ajattelua. Koko joukko laskennan menettelyt yhdistettiin yhdeksi käytännöllinen työkalu kutsumme

Computational Surprisal Analysis

. Tämä yhdistetty tällainen analyysi olisi paljon nopeampi toimijoille ja tutkijoille, kuin ottaa itsenäinen mutta Mismatched työkaluja sisällytettävä looginen ja käytännön yhdenmukaisuutta.

Toiseksi pidemmällä aikataululla, visiomme on päästä tila, että

Computational Surprisal Analysis

tulee rutiinianalyyseihin syöpädiagnostiikkaan. Siten lisäksi, kuvantamismenetelmiä, vähän invasiivisia leikkaus, kemoterapia, ohjattu säteily hoitoja, on odotettavissa, että

Computational Surprisal Analysis

löytää paikkansa kliinisessä käytännössä, nopeuttaminen diagnostiikka.

Siksi tämä paperi pyrkii näyttämään:

merkitystä Surprisal Analyysi

ymmärtäminen

biologisten ilmiöiden, keskustelemalla uusia tuloksia alalla Cellular Cancer prosessit laboratoriossa ympäristössä;

että

Computational Surprisal Analyysi

todellakin kiihdyttää Surprisal Analysis, kuvaamalla ensin integroiva näkökohtia työkalun, ja sitten selittää nopeutus- voittoja laskenta ja heuristista ajattelua;

sovellettavuus on

Computational Surprisal Analyysi

diagnostisiin Cellular Cancer Processes, vertaamalla saatuja tuloksia sairaiden toisin kuin terveillä koehenkilöillä.

Cellular Syöpä prosessit

Syöpä on hyvin heterogeeninen tauti näyttää huomattavan fenotyyppinen vaihtelua potilaalla on sama syöpätyyppi. Siksi ymmärtämään taustalla onkogeenisten prosessien, mukana muutosprosessi vaatii järjestelmätason lähestymistapoja mahdollistaa ja luonnehdinta järjestelmä ainesosia.

Viimeaikaiset tekniikan kehityksen mukaan lukien cDNA mikrosiruja ja massasp analyysi solun proteomeja, mahdollistavat perustamaan maailmanlaajuisen ja määrällinen toiminnallinen profiilit syövän soluja ja kudoksia. Siksi on olemassa kasvava kysyntä teoreettiseen-laskennallisia työkaluja avustamalla varten syvempää ymmärrystä tietojen.

Käyttämällä teoreettinen-laskennallinen lähestymistapa analysoitiin useita geeniekspression aineistoja, kuten munuaisten syöpäpotilaat, HPV16 aiheuttama muuttaneet keratinosyyttien ja WI-38 transformoidut fibroblastit [7], [8]. Lisäksi analyysimenetelmä voidaan soveltaa paitsi RNA: iden, mRNA: t, kuten tässä on myös MikroRNA [9] ja sen jälkeen kaikki -omics aineistoja, kuten proteomiikka ja metabolomiikka.

Tässä tutkimuksessa keskustaan ​​huomiota analyysiin mRNA käyttäen samoja määrällisiä periaatteita kuin ei-tasapainossa multicomponent järjestelmien fysiikan ja kemian. Hyödyntämällä biologiset järjestelmät kehittyvät ajassa vastauksena häiriöitä pyrimme määrittelemään mRNA allekirjoituksia vakain, vakaassa tilassa järjestelmän ja ryhmien mRNA jotka poikkeavat vakaan tilan takia häiritseekin. Tätä varten käytämme surprisal analyysin tekniikka, jonka avulla voimme soveltaa termodynamiikan periaatteisiin, biologiassa [4], [6], [8], [14].

Tuotos surprisal analyysi sisältää useita ryhmiä mRNA: t, jotka edistävät lähinnä vakaan tilan ja muu ryhmä mRNA: iden edistävät merkittävästi poikkeamat vakaan tilan jokaisessa vaiheessa muutosta. Viimeinen ryhmä koostuu hyvin heterogeeninen epävakaa transkriptio fenotyypit [6] taustalla muutosprosessia. Tunnistamisen lisäksi syöpää geenistä /proteiini allekirjoitukset, surprisal analyysi mahdollistaa vertaamalla taudin mRNA fenotyypit on vakain ja kestävä häiriöihin vakaan tilan transkription kuviot jokaisessa vaiheessa tauti, luoda uusia siihen, että jokin vaihtelevien osien syöpä transcriptome.

Surprisal Analysis

Surprisal Analyysi perustuu periaatteeseen maksimaalisen entropian. Entropia on fyysinen suure, joka syntyi kuria termodynamiikan, sitten ilmestyi Statistical Mechanics ja myöhemmin Information Theory. Laadullisesti entropia on mitta häiriö tai tiedon puutteesta. Entropia lisääntyy, kun mahdollisuuden, että järjestelmä on tietyssä tilassa keskuudesta monet mahdolliset tilat on tasaisempi. Jos todennäköisyys, että järjestelmä on tietyssä tilassa on paljon suurempi kuin todennäköisyydet olla jossakin muussa, emme puuttuu tietoja järjestelmästä ja entropia on minimaalinen.

lähestymistapa perustuu periaatetta maksimaalisen entropian, sanoo, että meidän tietoa jakelun järjestelmän valtioiden saadaan maksimoimalla entropian tunnetuissa tiedot rajoitteet. Sen tietojen puuttuessa, häiriö on maksimaalinen ja tieto on minimaalinen.

asettaa rajoituksia käyttäen menetelmää käyttöön Lagrange (katso lisätietoja File S1). Se edellyttää maksimoida lausekkeen Lagrangen funktiona Lagrangen kertoimia: (1) B

Jokaisessa kerrotaan kertoimella Lagrangen kerroin, jonka lukuarvo kertoo suhteellinen merkitys kunkin rajoitteeksi tietyissä olosuhteissa . Kaikki painotetut rajoitukset lasketaan yhteen ja rajoittavat Entropy vähennetään sen absoluuttinen maksimaalinen arvo.

Meidän tätä menetelmää solujen syövän prosesseja, rajoitteet nähdään niin sanottu transkriptio /translaatio kuvioita /syöpä allekirjoitukset esim liittyvät tiettyihin solujen prosesseihin. Nämä biologiset mallit estävät syöpäsolujen päästä maksimaalisen entropian joka odotetaan olemassa tasapainotilan biologisen järjestelmän. Surprisal analyysi tunnistaa molemmat valtiot jokaisessa vaiheessa tauti: tasapainoinen valtion ja rajoitettu tila, jossa tietty syöpä kuviot ovat aktiivisimpia [6] – [8]. Millä tahansa ajankohtana tiettyjä malleja edistää enemmän kuin toiset. Siten voidaan päätellä siitä suhteellisesta merkityksestä tietyn solun prosesseja eri vaiheissa syövän puhkeamista. Tässä analyysissä joka transkriptin voivat osallistua useampaan kuin yhteen transkription kuvio, taustalla prosessi syövän kehittymisen.

Computational Surprisal Analysis

Osoittaakseen käsite ja saatujen nopeutumisen

Computational Surprisal Analysis

, integroitu työkalu on suunniteltu ja toteutettu, joilla yleistä ohjelmistoarkkitehtuurin kuvassa 1. sen ohjelmistomoduuleita (tästä lähtien kutsutaan softmodules) kuvataan yksityiskohtaisesti menetelmät osassa paperin (varten lisätietoja löytyy myös File S1).

Software Architecture integroidun työkalun.

jotta saat integroiva maku

Computational Surprisal Analysis

työkalu olemme nyt mainita neljä softmodules näkökantoja ja lopputuotoksesta analyysi:

Surprisal Analysis

– tulo on suuri suorakulmainen matriisi tietojen geeniekspressiotasot saatu mittauksista siru array. Yksi mitat data matriisi on paljon suurempi kuin toinen (esimerkiksi 4 aikaleimat noin 22000 geenejä). Tavoite on surprisal analyysi on vähentää datan matriisin hallittavissa mitat, so. saamiseksi neliömatriisi, jonka ulottuvuus on pienempi tai korkeintaan yhtä suuri kuin pienikokoiset tietojen matriisi;

Gene Profilointi

– tulo on pieni matriisi tietoja, joiden koko on asettamassa kuvioiden määrää merkitystä mitattu informaatio, sano 4 4 matriisi, merkityksellisiä 4 aikaleimojen soluprosesseihin;

DB Retrieval

– panos koostuu osa-sarjaa geenien saatujen geenin profilointia. Jokainen osa-sarja sisältää enemmän vaikutusvaltainen geenit vastaavissa kuvion;

heuristinen analyysi

– tulo on saadut tiedot edellisen softmodules. Laskenta suoritetaan analysoida, ja interaktiivisesti näyttää edelleen analysoida heuristisesti.

Näyte tuotos nähdään kaksi lämpöä karttoja, joissa kuvataan proteiini-yhteydet, kuvassa 2.

Ylempi lämpö kartta saadaan avulla Surprisal Analysis. Alempi lämpö kartta perustuu täysin riippumaton saatuja tietoja DB Retrieval. Akselit molemmissa lämpökarttoja ovat samat, eli. ne sisältävät samat transkriptio nimet samassa järjestyksessä. Kuten tavallista lämpökarttoja, värit seistä suhteelliset intensiteetit (numeerinen asteikot nähdään päällekkäin heatmap): punainen on korkea intensiteetti ja sininen on matalan intensiteetin. Alueet, joilla on sama väri molemmissa lämpökarttoja selvästi päällekkäin, eli niiden tulokset sopivat hyvin, mikä tarkoittaa, että

Computational Surprisal Analysis

– ylemmässä heatmap – voi tuottaa ennustavaa tietoa transkription ja proteiini verkostorakenteisiin – alemmassa lämpökartta. Valkoisia pisteitä alemmassa heatmap tarkoittavat tiedon puute on nimenomaisesti transkriptien.

Tulokset

Tässä osiossa esittelemme työmme tulokset katsottuna kolmesta näkökulmasta: a- genomista luonnehdinta syövän prosesseja: b- luonne

Computational Surprisal Analysis

; c- visio

Computational Surprisal Analyysi

käytännön syöpädiagnoosin työkalu.

A- genomikartoitus of Cancer Processes

genomin kartoitus syövän käsittelee asiaa kokeellinen tulo ovat transkription tasoja eri mRNA: iden. Rajoitteet on surprisal analyysissä etiketti fenotyyppien ja sopivaa terminologiaa annetaan hakemuksen ja erikoistuminen yhtälön (1) edellä, seuraavasti: (2) missä indeksit viittaavat geeni

i

ja fenotyypin . on kokeellinen ekspressiotason geenin

i

, on (ajasta riippumaton) laajuus osallistumisen tietyn transkriptin

i

transkription kuvio ja, Lagrangen kerroin yhtälön (1) on tässä paino vastaavien transkription kuvio. Tämä terminologia tullaan edelleen selkeytetään Menetelmät jaksossa viitaten erityisesti erityistä roolia termin.

lopputuotoksesta

Computational Surprisal Analysis

on lämpökarttoja osoittavat laajuuden osallistumisen selostukset erityisesti transkriptio kuvioita indeksoitu. Nämä teoreettiset lämpökarttoja verrataan kokeelliseen lämpökarttoja kuvaava toiminnallinen liitettävyys tutki selostukset, käyttämällä yhteyden pisteitä STRING tietokannasta (katso Methods jakso). Tällä tavoin liittyvät arvot toiminnalliset verkkoihin, joilla on suurin STRING connectivity tulokset, jotka tarkastettiin kokeellisesti.

Kertoimet, jos indeksi 0 viittaa nollannen fenotyyppi, ovat negatiivisia arvoja, mikä tarkoittaa, että selostukset useimmat edistää

vakaassa tilassa

on pienin arvo. arvot – ensimmäistä fenotyyppi – edustavat laajuutta yhdestä tietystä transkriptin tärkeimmissä transkriptio kuvio taustalla

prosessi solutransformaatioon

. arvot voivat olla sekä kielteisiä että myönteisiä, osoittaen korrelaatio tai käänteinen korrelaatio transkriptien sisällä transkription kuvio. Selostukset on merkitty mukaan Gene ontologia luokkiin.

HF1 solut – HPV16 Immortalisoidut keratinosyyteissä.

käyttäminen HPV-16 indusoi immortalisoidut keratinosyytit, olemme analysoineet geeniekspressioiden eri vaiheiden välillä HPV-16 indusoi muutoksen keratinosyyttejä [11]. Geeniekspressiotasot mitattiin

neljä erillistä ajankohtina

, kutsutaan vastaavasti:

K (normaalit solut transformoimattoman että papilloomavirus),

E (HPV16 transformoituja soluja peräisin

varhaisessa

vaiheessa transformaatio),

L (transformoituja soluja

myöhäisessä

vaiheessa transformaatio) B

BP (solujen erottamiseksi myöhäisessä vaiheessa, että käsiteltiin

bentso [a] pyreeni

) [11].

Käyttämällä surprisal analyysi tunnistimme suurimmista transkriptio kuvio osaltaan kaikkina ajankohtina (lisätietoja löytyy [8 ]). Tämä transkriptio kuvio sisältyi selostukset vastaava kutistuminen reittejä valvoa apoptoosin ja parannusta solusyklin verkkojen loppuvaiheissa muutosta. Kaikki nämä allekirjoitukset todensi biokemiallisilla keinoilla [11].

Surprisal analyysi tunnistaa myös toissijaisia ​​transkription kuviot, jotka eivät ole merkittäviä lainkaan vaiheissa HF1 transformaatio [8]. Tässä työssä tarkastellaan vakain selostukset edistää tasapainoista, invariantti tila HF1 järjestelmän ja verrata niitä suuria transkriptio kuvio mukana muutosprosessi. Käytämme

Computational Surprisal Analyysi

rakentaa symmetrinen matriisit – luodakseen lämpökarttoja -, esim. jonka

ij

elementti on.

Kuvassa 3 voidaan nähdä tulokset HF1 soluja (HPV16 Immortalized keratinosyyttejä) on

Computational Surprisal Analysis

viidessä eri muodoissa. Viranomaiset ovat:

(A) heatmap 100 vakain (nähdään (a) punaisella) ja 100 eniten vaikuttavat tärkeimmät transkriptio kuvio (korkein) ja säädelty selostukset (nähty (a) sinisellä) saatuna surprisal analyysi. Tässä kuviossa: PS – proteiinisynteesiä, SG – Merkinanto ja kasvu. (B) lämpökarttana saman transkriptin luettelo (A) käyttäen STRING DB tulokset. (C) Samaa selostukset lista käytettiin tuottamaan. (D) Connectivity Kartta 100 vakain selostukset kuin käyttämällä STRING DB; punainen väri ellipsin sulkee vakain ja liitettyjen selostukset mukana proteiinisynteesiä. Paksuus linjat heijastavat arvioitu todennäköisyys proteiini-proteiini toiminnallista yhteyttä varten sukuisia kopioita sen mukaan kuin String pisteet (katso Menetelmät kohdat lisätietoja). Esimerkiksi paksu linjat (kuten proteiinit korostettu punaisella tähdet sisällä ellipsin, String pisteet = 0,999) edustaa suuri todennäköisyys, että toiminnallinen yhteydet perustuvat biokemialliset todentaminen, kun taas ohuita viivoja (kuten proteiinit korostettu musta tähdet, että vasemmassa alakulmassa ulkopuolella ellipsin, String pisteet = 0,507) edustavat pienempi todennäköisyys toiminnallisen yhteyden. (E) Connectivity kartta 100 selostukset eniten vaikuttavat tärkeimmät transkriptio kuvio (sininen väri).

Ylä vasen – Heatmap edustavat arvoja;

Ylemmän – Heatmap saman selostukset luettelo (a) käyttäen STRING DB tulokset;

Yläoikea – Heatmap saman selostukset luettelo (a) arvot;

Alavasen – Connectivity Map of vakain transkriptien (a) käyttäen STRING DB;

Alaoikea – Connectivity Kartta korkeimman.

Kuviosta 3 voidaan havaita, että vakain selostukset (alin arvot kuuluvat lähinnä proteiinisynteesikoneiston luokka. on hyvä välinen kirjeenvaihto (kuva 3A) ja (3B) lämpökarttoja, mikä tarkoittaa, että vakain selostukset määrittelemän surprisal analyysi, ovat enemmän toiminnallisesti kytketty esitetyllä tavalla STRING DB lämpökartta . heatmap (Fig. 3B) on kvantitatiivinen edustus yhteyden karttojen (Fig. 3d ja 3E).

(Fig. 3C) heatmap saman geenin luettelo arvoista on korreloimattomia kanssa (Fig . 3A) ja (Fig. 3B), mikä tarkoittaa, että transkriptit suurimpien panos vakaa muuttumaton tila tuskin osallistuu muutosprosessi. Ne selostukset edistää lähinnä muutosprosessia tuottaa vähemmän liitetyn kartta (3B, 3E) verrattuna vakain selostukset (Fig. 3B ja 3D), jotka ovat hyvin pienet suhteelliset muutokset (alimpia).

WI-38-solut – WI-38 transformoidut fibroblasteissa.

kuvassa 4 voidaan nähdä tulokset Wi-38-solut (WI-38 transformoidut fibroblasteja) on

Computational Surprisal Analysis

vuonna samat viisi muotoja ja sopimuksia kuten kuvassa 3. Tämä matkapuhelinjärjestelmä sisältää 12 vaiheissa syövän muunnoksen, jossa eri geneettisiä muutoksia sovellettiin [12]. Tämä solu järjestelmä koki noin 12 molekyylien manipulointia kuten hTERT lisäys, solujen kahdentumista, tukahduttaminen p53-toiminto ja lisäämällä onkogeenisten H-Ras raportoitu [12], mikä kehittää normaalin WI-38 ikuisti ei-transformoitujen fibroblastien täysin transformoituja soluja. Tässä syöpä matkapuhelinjärjestelmä tasapainotilan oli vakaa aikana kaikki 12 ajankohtina muuttamalla, kun taas merkitys transkription kuviot mukana muutosprosessi vaihtelivat eri ajankohtina [7].

(A) heatmap 100 vakain (todettu (A) punaisella) ja 100 eniten vaikuttavat tärkeimmät transkriptio kuvio (korkein) ja ilmen- tymisen lisääntymisen selostukset (todettu (A) sinisellä) saatuna surprisal analyysi. (PS – proteiinisynteesiä, SMP – Signaling, muuttoliike, proliferaatio). (B) lämpökarttana saman transkriptin luettelo (A) käyttäen STRING DB tulokset. (C) Samaa selostukset lista käytettiin tuottamaan. (D) Connectivity Kartta 100 vakain selostukset kuin käyttämällä STRING DB; punainen väri ellipsin sulkee vakain ja liitettyjen selostukset mukana proteiinisynteesiä. (E) Connectivity kartta 100 selostukset eniten edistävät transkription kuvio (sininen väri).

Kuviosta 4 yksi tekee samat huomiot kuin edellä: on hyvä kunto välillä (Fig. 4A ) ja (Fig. 4B) lämpökarttoja; (C) arvot heatmap on korreloimattomia kanssa (Fig. 4A) ja (Fig. 4B). Heatmap (Fig. 4B) on kvantitatiivinen edustus yhteyden karttojen (Fig. 4D ja Fig. 4E). Puhtaaksikirjoituksia ja arvot ovat suurimmat ja suurin absoluuttinen tuottaa vähemmän liitetyn karttoja (Fig. 4E), jossa on useita biologisia moduuleja (ei pidä sekoittaa softmodules). Runkoverkosta moduuli kuvio 4E sisältää selostukset osallistuvien NFKB (Nuclear tekijä kappa B) signalointi. Mielenkiintoista tämä moduuli kuuluu lisäksi (vähäinen) transkription kuvio, joka on suuri painot loppuvaiheessa syövän kehittymisen [7]. Tämä moduuli on validoitu ja määritelty aiemmin nimellä ”kasvain muodostavien geneettinen allekirjoitus” in WI-38 syöpää malli [12].

Yksi yhteenveto genomikartoitus alaluokka seuraavat koordinaatit:

Stable verkot

(selostukset alin arvo) tuottaa vahvat toiminnalliset yhteydet mukaan STRING DB. Jokainen proteiini on napa proteiini, jolla on lukuisia yhteyksiä ja siltoja, jotka voidaan kvantitatiivisesti visualisoida surprisal ja STRING DB lämpökarttoja. Todennäköisyys, että tappava mutaatio, kuten deleetio, että napa-proteiini johtaisi solukuolemaa odotetaan olevan suurempi verrattuna vähemmän liitetyn proteiineja.

Transformation verkkojen ja liitettävyys

– selostukset kanssa korkeimmat arvot, edistää lähinnä muutosprosessia, tuottavat vähemmän kytketty ryhmä kaikissa aineistoja. Näin poistetaan yksi heistä tai korvaamista toisella proteiini ei saa vaikuttaa merkittävästi verkon. Sama tulos saatiin transkriptien, jolla on pienin arvo [6]. Kuten edellä on esitetty, kartta sisältää yleensä useita toisistaan ​​verkkojen moduulit (katso esimerkiksi kuvio. 4E). Nämä moduulit voidaan edelleen tutkitaan mahdollisina kohteina lääkehoitoa.

B- luonne Computational Surprisal Analysis

Ohessa kuvataan luonnetta

Computational Surprisal analyysi

. Se koostuu pääasiassa seuraavista kolmesta osa: a- synergistinen integrointi erilaisia ​​laskenta; B- kvantitatiivinen nopeutus; c- uudenlaiseen johtopäätöksiä perustuu yksinomaan surprisal analyysiin.

Synergistinen integrointi erityyppistä Laskennan.

jälkeen softmodules kuviossa 1, on kaksi toimintatilaa, että

Computational Surprisal Analyysi

järjestelmä:

1

Sequential

– ja liität softmodules täsmälleen, kuten on esitetty kuviossa 1, käyttämällä kutakin softmodule lähtö tulona seuraavan softmodule.

2-

sykliset

– tietyt softmodules valitaan olla syklisesti toistuvan, jossa mahdollisesti vaihtelevalla tuloa kunnes yksi poistuu silmukka, tyydyttävin tuloksin.

Kummassakin tehokas laskenta on olennaisesti rajoittavat ainoastaan ​​vuorovaikutus ihmisen käyttäjä. Nämä vuorovaikutukset voivat olla yhtä helppoa kuin valita /lukeminen input /output. Ne voivat olla kehittyneempiä, kuten esimerkiksi osoitetaan aika heuristisen ajattelua ja tehdä päätelmiä useita erilaisia.

Jotta syklinen toistoja, täytyy pystyä mielivaltaisesti aloittaa softmodule, riippumatta muista softmodules. Tämä on todellakin mahdollista, koska softmodules rakennetaan siten, että ne voivat joko suoraan saada tuotos edellisen softmodule ketjussa tavalla tai saada toinen ulkoiseen tuloon. Ei tarvitse tuhlata aikaa nimenomaisen tietojen käsittely, kuten muuntaa formaatit välillä softmodules. Tämä tapahtuu automaattisesti, joka luontainen piirre synergistinen integrointi.

Mitä 1

st softmodule – Surprisal Analysis – olemme jo nähneet, että sen tuotantoon kuuluu useita ryhmiä esim. mRNA: t: ne, jotka osallistuvat vakaassa tilassa ja toiset vaikuttaa merkittävästi poikkeamat vakaassa tilassa. Softmodules synergia on välttämätöntä ymmärtää biologisen merkityksen näiden ryhmien, eli. käytämme esim. STRING DB pääsy [15] vetää toiminnallisia verkostoja jokaiselle ryhmälle.

2

nd softmodule – Gene Profilointi – on tehokas integrointi sillan 1

s ja 3

rd softmodules . Se mahdollistaa valinnan merkittävien geenien surprisal analyysitulokset hakea tarvittavat tiedot julkisesti saatavilla olevista tietokannoista.

Mitä 3

rd softmodule, pääsy tietokantaan kuten STRING DB tapahtuu sopivan liitäntä – läpinäkyvä ihmisen käyttäjälle – mahdollistaa suoraviivaista valinta ja haku halutun datan osaksi softmodule, eteenpäin laskelmat. Järjestelmän modulaarisuus mahdollistaa yksinkertaisen tulevaisuuden käyttöliittymät lisätietokantoja kohteisiin.

Lopuksi 4

th softmodule mahdollistaa liittyvät kvantitatiivisesti ulostulon surprisal analyysi toiminnallisen yhteyden välillä mRNA: t. Kaksi erilaista lämpökarttoja ovat:

1- teoreettinen heatmap liitettävyys käyttäen asteita Osallistujien esim mRNA: t tasaisella /poikkeamat vakaan tilan laskemat Surprisal analyysi (alkaen 1

st softmodule) ja valinta tehdään Gene profilointi (2

nd softmodule);

2 – toiminnallinen heatmap lasketaan STRING DB yhdistettynä tulokset.

Nämä integroidut menettelyt mahdollistavat hyvin

tehokas ja määrällinen

ymmärrystä toiminnallisen yhteyden välillä mRNA: t vaikuttavat eri vaiheissa muutoksen.

Quantitative Nopeutuksen Evaluation.

Kuten edellä,

Computational Surprisal Analysis

käsittää erityyppistä laskenta menettelyjä. Nämä ovat kestoltaan kertaa hyvin erilainen suuruusluokka, jotka voidaan luokitella seuraavasti:

Automaattinen puhtaasti laskennallisia menettely

– esimerkiksi Surprisal suorittama analyysi 1

st softmodule. Kesto Tällaisen laskenta voi olla ja on tosiasiallisesti mitattu erittäin tarkasti. Tätä kestoa voidaan varmasti lyhentää tehokasta peräkkäisten laskenta tavanomaisessa merkityksessä tai sanottaisiinko parallelization. Toisaalta, tämä on niin paljon nopeampi kuin seuraavaksi menettelyjä, että kaikilla arviointia varten kovia yläraja suuruusluokkaa muutaman sekunnin on riittävän tyydyttävä.

Human interaktiivinen menettely –

esimerkiksi Gene profilointi on 2

nd softmodule tai hieman kauemmin lämpökarttoja vertailua. Nämä ovat korko määritetään vaiheet

Computational Surprisal Analysis

. Niiden kesto voi olla periaatteessa lyhenee avulla ihmisen ja tietokoneen vuorovaikutuksen analyysi tekniikoita. Toisaalta, se on kohtuullisen turvallista olettaa, että sen alaraja rajoittavat ihmisen valmiuksia, karkeasti arvioiden ottaa aikaa suuruusluokkaa minuuttia.

Jotta voitaisiin arvioida määrällisten nopeus- up saadaan moduulien

Computational Surprisal Analysis

edellä kestoajat tulisi verrata ei-synergistisiä suorituskyky:

Manuaalinen tietojen muuntaminen ja manipulointi

– esimerkiksi, manuaalisesti siirtämällä saadut tiedot tietokannoista, ja muuntamalla ne sopivaan muotoon lämpökarttana kuvaus menettelyä. Se voi kestää karkeasti arvioitu kesto vähintään suuruusluokkaa kymmeniä minuutteja jopa asiantuntija ohjelmistoinsinöörejä.

Yllä arvioiden yksi arvioi yleisille määrää nopeutus- saadaan

Computational Surprisal Analyysi

, olla suuruusluokkaa kymmenen. Tämä on suhde pisin mahdollinen, so.

manuaalinen tietojen manipulointi

lyhyemmän reaktionopeus, eli.

ihmisen interaktiivinen menettely

välittämä synergistisen automaattisen tietojen muuntaminen ja manipulointi.

Tämä nopeampi läpimenoaika mahdollistaa tutkijoiden ja käytännön käyttää saatuja aika kannattavan analyysiä. Tässä mielessä se nopeuttaa-up mahdollisuudet heuristista ajattelua. Heuristinen ajattelu on assosiatiivinen luonne, kuten vihjasi laittamalla side-by-side (esimerkiksi kuvioissa 3 ja 4 olevan paperin) monipuolinen tulos näyttöjen Surprisal Analysis syntyy lämpökarttoja ja liitettävyys karttoja.

tärkeää päättely: vakaus vakaassa tilassa.

lisäksi integroinnin monentyyppisiä laskennan kanssa surprisal analyysi, analyysi mahdollistaa uudenlaista johtopäätöksiä. Täällä puhumme päättely vakautta perus siivouspalveluita cellular prosessien kuten proteiinisynteesiä.

kvantitatiivinen argumentti käyttää ekv. (2), joka merkitsee, että kokeellinen ekspressiotasot selostukset merkittäviä (kielteisiä ) arvot ja pienet arvot hyvin toistetaan käyttäen vakaassa tilassa aikavälillä vain,.

Vastaa