PLoS ONE: ajallinen tilaaminen Cancer Microarray Data kautta vahvistusoppiminen Based Approach

tiivistelmä

Ajallinen mallintaminen ja analysointi ja erityisemmin ajallinen tilaaminen ovat erittäin tärkeitä ongelmia aloilla bioinformatiikan ja laskennallisen biologian, koska ajallista analyysi tapahtumista luonteenomaiset tietty biologinen prosessi voisi tarjota merkittäviä oivalluksia sen kehittymistä ja etenemistä. Erityisesti, kun kyseessä on syöpä, ymmärtää paremmin ja kehittyminen tämän taudin voisi johtaa parempia menetelmiä ennustaminen ja hoitoon. Tässä tutkimuksessa puuttua, mistä laskennallinen näkökulmasta,

ajallinen tilaus

ongelma, joka viittaa rakentaa lajitellut kokoelma moniulotteisen biologiset tiedot, kokoelma, joka kuvastaa tarkka ajallinen kehittyminen biologisten järjestelmien. Esittelemme uusi lähestymistapa, joka perustuu vahvistusoppiminen, tarkemmin, on

Q-oppimisen

, biologisten ajallisen tilaus ongelma. Kokeellinen arviointi suoritetaan käyttämällä useita DNA microarray aineistoja, joista kaksi sisältävät syöpää geeniekspressiota tietoja. Saadut liuokset korreloivat joko annettava oikea tilaus (tapauksissa, joissa tämä on säädetty validointi) tai yleiseen elinaika potilaista (kun kyseessä on syöpä aineistoja), mikä vahvistaa hyvän suorituskyvyn ehdotettu malli ja osoittaa potentiaalin ehdotuksen.

Citation: Czibula G, Bocicor IM, Czibula IG (2013) ajalliset tilaaminen Cancer Microarray Data kautta vahvistusoppiminen Based Approach. PLoS ONE 8 (4): e60883. doi: 10,1371 /journal.pone.0060883

Editor: Frank Emmert-Streib, Belfastin yliopisto, Iso-Britannia

vastaanotettu: 25 joulukuu 2012; Hyväksytty 4 maaliskuuta 2013. Julkaistu: 02 huhtikuu 2013

Copyright: © 2013 Czibula et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ oli osittain tukee alakohtaisen toimenpideohjelma Human Resources Development 2007-2013, osarahoittaa Euroopan sosiaalirahasto, hankkeen numero POSDRU /107 /1,5 /S /76841, jonka otsikko on ”Modern Tohtoriopinnot: Kansainvälistyminen ja Interdisciplinarity” . Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

etenee viime vuosikymmenten alalla biologian ovat johtaneet räjähdysmäisen kasvun määrä biologisia tietoja. Riippuen tyypistä ja tarkoituksesta biologisia kokeita, kerätyt tiedot voivat vaihdella nukleotidi- tai proteiinisekvenssien, rakenteiden tai toimintoja, molekyyli- vuorovaikutukset ja aineenvaihdunnan reittejä. Tietojen analyysissä paljastaa tärkeitä tietoja eri biologisten prosessien ja johtaa lopulta ymmärtämään paremmin elävien organismien.

Biologiset prosessit ovat enimmäkseen dynaamisia ja siksi, jotta tarkasti luonnehtia niitä tutkijat tarvitsevat dynaamista tietoa. Kuitenkin useimmat olemassa olevia tietoja on staattinen, koska se on usein vaikeaa ja haastavaa noudatettava tiettyä prosessia yli täyden kehitystä. Esimerkiksi, kun kyseessä on sairauden, tietyissä tilanteissa on mahdollista vain poimia dataa poolin potilaista, sen sijaan, että sen jälkeen, kun samat potilaat yli koko sairauden kulun. Siksi tarve purkaa dynaamisia tietoja staattiseen näyttöön ja mahdollinen tapa saavuttaa tämä tavoite olisi päätellä ajallinen orderings näihin tietoihin.

Tässä tutkimuksessa puuttua, mistä laskennallinen näkökulmasta, biologinen

ajallinen tilaus (TO) ongelma

, joka viittaa rakentaa lajitellut kokoelma moniulotteisen biologiset tiedot, kokoelma, joka kuvastaa tarkka ajallinen kehittyminen tietyn biologisen prosessin. Solunjakautumisen ja kasvua, kehitystä, solulinjaan, aineenvaihduntaa, tai tarkemmin erityisesti tietynlaiset sairauksien (kuten syövän) ovat vain muutamia esimerkkejä tällaisista dynaamisen biologisia prosesseja. Moniulotteista lähtötiedot saattavat olla seurausta erilaisten biologisten kokeiden:-proteiinin ekspression, DNA mikrosiruja, SNP taulukot, kromosomaalisen kopioluvun muutoksia, vertaileva genomin hybridisaatio. Tässä työssä me rajoittaa harkitsemaan aineistoja koostuu näytteistä peräisin microarray geenien ilmentyminen kokeiluja.

ajallinen tilaaminen ongelma

käsitellä tässä asiakirjassa määritellään seuraavassa, ja että on tärkeää ongelman korostuu. Olemme myös läsnä useita toisiinsa liittyviä lähestymistapoja ratkaista TO ongelma jo kirjallisuudessa.

Ongelma Statement ja osuma

Ajallinen mallintaminen ja analysointi ja erityisemmin ajallinen tilaaminen on tärkeä tutkimus suuntaan sisällä useita kenttiä. Vuodesta kone oppimiseen monissa tilanteissa, tilaaminen tietty data joukko tapauksia kertaa annetaan merkittävämpi tietoa kuin määrittämällä ne tiettyihin luokkiin. Siksi yleinen ongelma ajallisen tilaaminen on verrattavissa, koska merkitys, luokitusta ongelma [1].

Sisällä bioinformatiikan ja laskennallisen biologian puitteet, ajallinen tilaus ongelma voidaan ilmaista eri muodoissa. Yksi määritelmä tähän ongelmaan viitataan määrittämistä ja kuvaavat tapahtumasarjaa, jotka luonnehtivat biologinen prosessi. Jos prosessi kyseessä on syöpä, esimerkiksi tavoitteena on löytää ajallinen jotta geneettisten ja polku muutoksia, jotka tapahtuvat aikana synty ja kehittyminen tämän sairauden. On tunnettua, että useimmat kasvaimet kehittävät vuoksi toimintahäiriö on monimutkainen signalointi verkot, mikä on seurausta mutaatioista, jotka näkyvät tietyillä keskeisillä geenien (onkogeenien tai tuumorisuppressorigeeneille) [2]. Näin ollen, tutkimalla, missä järjestyksessä nämä mutaatiot tapahtua voisi johtaa parempaan ymmärtämiseen kehittymisen syöpä. Useat teokset olemassa kirjallisuudessa, jotka lähestyvät ajallinen tilaus ongelma kuin se oli kuvattu edellä, ja nämä esitellään seuraavassa momentissa.

Ajallinen tilaaminen Ongelma voidaan myös muotoilla ongelma rakentaa lajitellun kokoelma moniulotteisen biologiset tiedot, kokoelma, joka kuvastaa tarkka ajallinen kehittyminen tietyn biologisen prosessin. Lopullisena tavoitteena on löytää tiettyjä malleja lähtötietoja, jotka vaihtelevat ajan ja käyttää niitä tehokkaasti voidakseen tarjota asianmukainen luonnehdinta kyseisen prosessin. Mitä koskee tätä suuntaa tutkimuksen, on lähinnä kaksi teosta, jotka ovat lähestyneet tätä ongelmaa ja nämä käsitellään myös seuraavassa momentissa. Me mainita, että käsittelemme ajallinen tilaus ongelma, muotoiltu tässä toisessa tavalla.

Yksi merkittävimmistä sovelluksista tähän ongelmaan on alaan syöpätutkimuksessa. Suurin osa ihmisen syövän kokeissa saadaan tietoja ilman ajallisia tietoja, koska usein se on liian vaikeaa, tai jopa mahdotonta, noudattaa samaa potilasta yli koko taudin kehitystä. Sen sijaan, kokeellinen näytteitä kerätään altaita potilaiden, joiden sairaudet ovat eri vaiheissa eteneminen ja siten kunkin näytteen heijastaa eriasteisen syövän etenemisen. Rakentaminen oikean ajallisen sarjan näistä näytteistä voisi toisaalta, antaa mielekästä tietoa monimutkainen prosessi syövän kehittyminen. Toisaalta, ajallinen järjestys voitaisiin käyttää ennustamiseen selviytymisen kertaa vasta diagnosoiduista potilaista: olettaen, että potilaiden alkuperäisessä syöttödataryhmän eloonjäämisajasta myönnettäisiin, kun uusia potilaita, joilla tuntematon elossaoloaika lisätään tietojoukon, talteen ajallinen järjestys koko näytesarja (sisältäen juuri lisätty niistä) voisi tarjota tietoa koko elinajan uuden potilaista.

Literature Review

yleinen TO ongelma tiedetään olevan NP-täydellinen [1], mikä tarkoittaa, että täsmälleen ratkaisut ovat hyvin vaikea saada, ja näin ollen erilaisia ​​heuristisia menetelmiä on sovellettu sen ratkaisemiseksi. Yleinen ongelma on ollut lähinnä lähestynyt tutkijat tekoälyä yhteisö (koneoppimisen, data mining) [1], [3]. Sisällä data mining alalla, on olemassa monia tutkimuksia, jotka poimia ajallinen tietoja erityyppisiä tekstejä (yleensä lääketieteen, lehtiartikkelit) [4] – [7]. Muita käyttökohteita ovat lajittelu kuvia kaupunkia ja tarkkailla niiden kehitystä ajan mittaan [8] tai rakentaa arkeologinen chronologies eri esineitä [9].

Vuodesta näkökulmasta bioinformatiikan ja laskennallisen biologian, eri muodot TO ongelma on tutkittu ja huomattava määrä tutkimuksia keskittyy erilaisten syöpien. Johtuen siitä, että tämä tauti on kehitysprosessi, joka ohjaa mutaatioiden ja muutokset solun käyttäytymistä [10], yksi tärkeä linjan työtä käsittelee kehitetään malleja ja päättelemällä ajallinen tilaukset kuvaamaan muutoksia syöpäsolujen DNA sekä määrittää, missä järjestyksessä geenimutaatio tapahtumia ja koulutusjakson vaihtelut tapahtua kehitystä syöpä.

Useat todennäköisyyksiin malleja on esitetty, jotta hakea ajallisen ja rento järjestys, jossa mutaatiot tapahtua tasolla geenien ja reitit aikana syövän etenemisessä [10] – [12]. Työssä Hjelm

et al.

[11], tavoitteena on tutkia kromosomi evoluution syöpäsoluissa ottamalla käyttöön ja käyttämällä graafista generative todennäköisyyspohjaista malleja. Gerstung

et al.

[10] ehdottaa probabilistinen malli perustuu Bayes-verkot, täsmällisemmin luokan graafinen malleja Piilotetut konjunktiivisessa Bayes-verkot (H-CBNs), joka oli aiemmin ehdottanut tutkia kertyminen mutaatiot ja niiden riippuvuussuhteet syövän etenemisessä [12]. Testit tehtiin tietomääriä sisältävien poikkileikkaus mutaatio tiedot kuuluvat eri syöpätyyppien (peräsuolen, haiman ja ensisijainen glioblastoma) ja johtopäätökset ovat, että nämä H-CBNs tarjoavat intuitiivisen malli tumorigeneesin [10].

erilainen lähestymistapa tähän ongelmaan perustuu builduing puu malleja mahdollisten geenimutaation tapahtumat [13] – [17]. Desper

et al.

[13], [14] ehdottaa puu mallin onkogeneesiin ja käyttämällä vertailevaa genomista hybridisaatiota tietoja ne osoittavat, että eräiden oletusten, algoritmi päättelee oikean puun tapahtumista (jos tapahtuma nähdään menetys tai voitto tietyn kromosomin varsi). Niiden lähestymistapa perustuu ajatukseen enintään-paino haaroittumista kuvaajan. Tämä ehdotettu metodologia kehitettiin edelleen Beerenwinkel

et al.

, Jonka malli sisältää useita oncogenetic puita, jotka vastaavat useita ajallisten tapahtumien kulkuun, jotka voivat johtaa syöpään [15], [16]. Pathare

et al.

[17] analysoida suullinen syövän etenemisessä käyttäen molempia malleja: etäisyys puut käyttöön Desper

et al.

[14] ja seos oncogenetic puiden käyttöön Beerenwinkel

ym.

[15], [16].

Matemaattinen lähestymistapoja on ehdotettu ongelman ratkaisemiseksi tunnistaa Aikasarjavalokuva mutaatioiden johtavan syövän etenemisessä [18], [19]. Attolini

et al.

[18] käyttöön evoluution matemaattinen lähestymistapa nimeltään retracing evoluution portaille Cancer (RESIC), jotta voidaan tunnistaa ajallista järjestystä geenimutaatioita syövän kehitystä ja ne testata sitä useaan peräsuolen syöpä , glioblastooma ja leukemia aineistoja. Tämä menetelmä kehitettiin edelleen [19], jotta voidaan tehdä lisäksi geneettisiä muutoksia, muunnoksia molekyyli signalointi kanavat, joita syöpä etenee.

Toinen tärkeä tutkimus suuntaan keskittyy eri muotoilua TO ongelman. Tämän linjan työtä, ongelmana on rakentaa lajiteltu kokoelma moniulotteisen biologista tietoa, joka heijastaa tarkka ajallinen kehitys biologisen prosessin. Käsittelemme TO ongelman näkökulmasta tämän toisen määritelmän. Tietääksemme on lähinnä kaksi teoksia, jotka lähestyvät biologiocal TO ongelma edellä muotoiltu, molemmat geenien ilmentymisen saadut tiedot microarray kokeiluja. Nämä esitettävä lyhyesti seuraavassa.

ensimmäinen tekniikka, jossa käytetään syövän geeniekspressiota tietoja, on otettu käyttöön Gupta ja Bar-Joseph [20]. Kirjoittajat virallisesti todistaa, että tietyissä biologinen oletuksia syötedatajoukosta, ainutlaatuinen liuosta kauppamatkustajan ongelma (TSP) edustaa oikea ajallinen tilaus, suurella todennäköisyydellä. TSP on määritelty käyttäen näytteitä säveltää syöttödataryhmän, joille on ominaista moniulotteinen geenien ilmentyminen tietoja, kuten pisteet ja niiden väliset etäisyydet lasketaan käyttämällä Manhattan () metriikka. Menetelmää sovelletaan data- joukko 50 gliooma potilaiden ja tulokset osoittavat hyvää korrelaatiota selviytymisen kesto potilailla. Lisäksi luokittelija, joka käyttää saatua tilaus on määritetty, mikä osoittaa parempia muihin luokittimet kehitetty pidetään tehtävään ja keskeiset geenit, jotka liittyvät syöpään tunnistetaan.

Toinen tutkimus, joka lähestyy tätä muotoa biologisen TO ongelma on otettu käyttöön Magwene

et al.

[21] ja ehdotettu menetelmä perustuu pienin virittävä puita ja PQ-puita. Pienin virittävä puu algoritmi levitetään painotettuna, suuntaamaton verkko, jossa jokainen solmu edustaa yksi esiintymä datajoukon, jota edustaa moniulotteista microarray data. Tehokkuus tämä menetelmä on osoittautunut testaamalla algoritmien keinotekoiset aineistoja, sekä aika-sarjan geenin ilmentymisen aineistoja johdettu DNA-siru kokeita.

Suurin panos tämä paperi on, että se otetaan käyttöön uudella tavalla suunniteltu TO ongelman muotoilla ongelma rakentaa lajitellun kokoelma moniulotteisen biologisten näytteiden perusteella vahvistusoppiminen. Vahvistusoppiminen [22] on lähestymistapa koneen älykkyys, jossa agentti [23] voi oppia käyttäytymään tietyllä tavalla vastaanottamalla rangaistuksia tai palkintoja valitsemillaan toimista. Parhaan tietomme mukaan TO ongelmaa ei ole käsitelty kirjallisuudessa vahvistusoppiminen, toistaiseksi. Useita kokeita suoritettiin eri DNA-siru aineistoja osoittavat, että ehdotettu vahvistaminen oppimisen lähestymistapaa onnistuneesti tunnistaa tarkka ajallinen orderings annetuista biologisten näytteiden.

Methods

Tässä osiossa esittelemme vahvistaminen perustuvaa oppimista ehdotus tunnistaa ajallinen määrääminen biologisten näytteiden sarjaa. Vaikka tässä tutkimuksessa me Rajoita geenien ilmentyminen saatuja tietoja microarray kokeiluja, sovellettavuus menetelmämme on yleisempi ja sitä voidaan käyttää erilaisten moniulotteisen biologista tietoa.

Aloitamme esittämällä perusteet

vahvistusoppiminen

, niin me yksityiskohta lähestymistapaamme.

vahvistusoppiminen. Taustaa

Tavoitteena rakentamaan järjestelmiä, jotka voivat sopeutua ympäristöään ja oppia niiden kokemuksista on herättänyt tutkijoiden monilla aloilla, kuten tietokone, matematiikan, kognitiiviset tieteet [22].

vahvistusoppiminen

(RL) [24] on lähestymistapa koneen älykkyys, joka yhdistää kaksi tieteenalojen onnistuneesti ratkaisemaan ongelmia, jotka eivät kuria voi käsitellä erikseen:

Dynaaminen ohjelmointi

ja

Ohjattu oppiminen

. Vuonna koneoppimisen kirjallisuus, RL pidetään luotettavimpana tyyppi oppimista, koska se on kaikkein samankaltainen kuin ihmisen oppimiseen.

vahvistusoppiminen käsittelee ongelma, miten itsenäinen agentti, joka havaitsee ja toimii sen ympäristö voi oppia valitsemaan optimaalinen toimia asetettujen tavoitteiden saavuttamiseksi [25]. Alalla

hakuagenttien

[26] on tärkeä tutkimuksen ja kehityksen alueella tekoälyä alalla, agentit harkitaan uusia tärkeitä keinoja hahmottaminen ja toteutukseen ohjelmistoja. Agentti on laskennallinen yksikkö kuten ohjelmisto tai robotti, joka sijaitsee tietyllä environnment, joka pystyy havaitsemaan ja toimimaan sen ympäristö ja pystyy toimimaan autonoumously saavuttaakseen sen suunnittelutavoitteet. Agents toimivat käyttäjien puolesta, ovat

joustava

[27], mikä tarkoittaa, että ne ovat

reaktiivista

(pystyy vastaamaan tapahtuvat muutokset niiden ympäristössä),

ennakoivaa

(pystyy näytteille tavoite suunnattu käyttäytyminen) ja on myös

sosiaaliseen toimintakykyyn

(kykenevät toimimaan vuorovaikutuksessa muiden aineiden kanssa).

vahvistusoppiminen on käyttökelpoinen paljon käytännön ongelmia, kuten oppimaan hallitsemaan autonoumous robotteja [28], oppiminen optimoida operatons tehtaissa tai opettelee soittamaan lautapelejä. Kaikissa näissä ongelmat, keinotekoinen aine on opittava (by vahvistaminen) valitsemaan optimaalisen toimia saavuttaakseen tavoitteensa.

Kun vahvistusoppiminen skenaariossa oppimisen järjestelmä valitsee toimien suorittamiseen ympäristössä ja vastaanottaa

palkintoja

(tai

vahvistuksia

) muodossa numeeriset arvot, jotka edustavat arvio valittujen toimien [29]. Vuonna RL, tietokone on yksinkertaisesti annetaan tavoite saavuttaa. Sitten tietokone oppii tämän tavoitteen saavuttamiseksi kokeilemalla ja erehdyksen vuorovaikutusta ympäristönsä kanssa. Vahvistusoppiminen oppii, mitä tehdä – miten kartoittaa tilanteet toimiin – jotta maksimoidaan numeerinen palkita. Oppija ei kerrota, mitkä toiminnot toteuttaa, kuten useimmissa muodoissa koneoppimisen, vaan sen sijaan on löytää mitkä toimet saadaan korkein palkinto yrittämällä niitä. Vuonna vahvistusoppiminen ongelma, edustaja saa palkkion kuin palautetta ympäristöstä; palkkio vastaanotetaan lopussa, terminaalin tilassa, tai muussa tilassa, jossa aine on oikeat tiedot siitä, mitä hän teki hyvin tai huonosti. Agentti oppii valitsemaan toimia, jotka maksimoivat vastaanotetun palkkion.

toimielimen tavoitteen, joka RL tehtävä on maksimoida summa vahvistuksia saanut käynnistettäessä joitakin alustavia valtion ja siirrytään päätelaitteen tilaan.

vahvistusoppiminen ongelma on kolme perustavanlaatuista osaa [22].

ympäristö

edustaa ”toteaa”. By vuorovaikutus ympäristön kanssa, RL järjestelmä oppii, joka kartoittaa valtioiden toimia.

vahvistaminen funktio

. Tavoitteena vahvistusoppiminen järjestelmä on määritelty käsite vahvistaminen funktio, joka on funktio vahvistuksia agentti yrittää maksimoida. Tämä toiminto kartat valtion toimia pareittain vahvistuksia. Sen jälkeen kun toiminta suoritetaan tietyssä tilassa, agentti saavat arvion toiminnan muodossa skalaari palkita. Agentti oppii suorittamaan niitä toimia, jotka maksimoivat kokonaismäärä palkkio vastaanotettu polku alkutilasta lopulliseen tilaan [30].

arvo (apuohjelma) funktio

on kuvaus valtioiden tila-arvot. Arvo valtion osoittaa, että on suotavaa valtion ja määritellään summana palkkioita vastaanotettu polku, joka valtion lopulliseen tilaan. Agentti oppii valitsemaan toimia, jotka johtavat valtiot, joiden suurin hyödyllisyys [30].

Yleinen RL tehtävä on ominaista neljästä osasta:

tila tila

, joka määrittää kaikki mahdolliset konfiguraatiot järjestelmän

toimintatilaa

joka listaa kaikki käytettävissä toimet oppimisen agentti suorittaa;

siirtofunktio

, joka määrittää mahdollisesti stokastisen tuloksia ottaen kunkin toimen missään tilassa,

palkkio toiminto

joka määrittelee mahdollinen palkkio ottaen kunkin toimintamuodon.

joka hetkellä,, oppimisen järjestelmä vastaanottaa joitakin esitys ympäristön tilaan, se ryhtyy toimenpiteisiin ja yhden askeleen myöhemmin se saa skalaari palkkion ja ajautunut uuteen tilaan. Kaksi peruskäsitteet takana vahvistusoppiminen ovat ja erehdyksen, etsintä ja viivästynyt palkita [31]. Agentin tehtävänä on oppia kontrollia eli, joka maksimoi odotetun summan vastaanotetun palkintoja, tulevia palkintoja alennettuun eksponentiaalisesti niiden viive, jossa määritellään (on diskonttaustekijä tulevaisuuden palkintoja).

tärkeä näkökohta vahvistusoppiminen on

etsintä

. Edustajan täytyy pystyä tutkimaan ympäristöään, yrittämällä uudet toimet (ehkä ole paras mahdollinen niistä), joka voi johtaa parempaan tulevaa toimintaa valintoja [32].

On kaksi perus RL malleja harkita:

aine oppii

hyötyfunktio

(

U

) valtioita (tai todetaan historia) ja käyttää sitä valitsemaan toimia, jotka maksimoivat odotetun hyödyn niiden tuloksia.

aine oppii

toiminta-arvon funktio

(

Q

) antaa odotetun hyödyn ottaa tietty toimenpide tietyssä tilassa. Tätä kutsutaan

Q-learning

.

Aine, joka oppii hyödyllisyys toimia [33] on oltava malli ympäristön voidakseen tehdä päätöksiä, koska se on tiedettävä valtiot, joilla sen toiminta johtaa. Vuonna

Q-learning

skenaario, jossa edustaja oppii toiminnantäyteinen arvon funktio, ei tarvitse olla malli ympäristön.

Meidän lähestymistapamme. Menetelmät

Tarkastellaan, seuraavassa, joka on syötedatajoukosta, joka koostuu () moniulotteisen näytteet: jokainen näyte tunnistetaan joukon ominaisuuksia. Sillä pitää tietojen tyyppi, kunkin toiminnon edustaa yksi geeni, ja on sen arvo reaaliluku, ilmentymistason mittaamiseksi geenin osalta. Siksi jokainen näyte voidaan koodaa ulotteinen vektori, jossa on ilmentymistason geenin otokseen.

Meidän lähestymistapamme on kaksi vaihetta:

1. Tietojen esikäsittely-.

2.

RL

tehtävän suunnittelun.

Seuraavassa kuvaamme näitä vaiheita.

Data esikäsittelyä.

DNA mikrosiruja sallivat mittaus tuhansia geenin ekspressiotasoja kunkin näytteen ja siten dimensio lähtötietojen voi olla erittäin suuri. Sen lisäksi, että tämä saattaa johtaa tehottomuuteen laskennallisen aikaa ja tilaa, useimmissa tapauksissa, monet geenit voivat olla merkitystä tilaus- tehtävään ja voi jopa lisätä määrää datan häiriöt, mikä johtaa laskuun suorituskykyä ajallisen tilaus järjestelmä. Siksi tavoitteena esikäsittelyvaiheissa on poistaa geenien, jotka tarjoavat merkittäviä tietoja, tai vastaavasti, valinta näiden geenien, jotka ovat tärkeimpiä tarkkaa ajallista tilaus.

Koska lopullinen tavoite koostuu analysoinnissa ja ajallisesti tilaustiedot sarjaa, joka sisältää näytteitä uutettu syöpäpotilaita, seuraavassa, kuvaamme esikäsittelyä menetelmä kohdentamalla tietynlaisia ​​aineistoja. Tällaiset tiedot esitetään yleensä tarjoavat sarjan tiedot kunkin näytteen Varsinaisten ilmentämisvektoreita. Yksi näistä ylimääräisiä paloja tietoa, joka on säännöllisesti esiintyy syövän tietokokonaisuuksien on yleinen selviytymisen, eli elinaika potilailla, seuraavan hetken, jolloin näytteet on otettu. Lähtien intuitio, että yleisessä tapauksessa, kaksi potilasta, joilla on samanlaisia ​​eloonjäämisajan olisi myös suhteellisen lähellä sisällä ajallisesti tilaus, päätimme käyttää tätä tieto tunnistamiseksi osajoukon geenejä, jotka ovat merkityksellisiä tilaus tehtävään.

aikana esikäsittelyvaiheissa, tilastollinen analyysi suoritetaan datajoukon jotta löydettäisiin osajoukko toiminnot (geenejä), jotka ovat merkityksellisiä harkita tehtävää. Tilastollinen analyysi ominaisuuksista suoritetaan vähentämiseksi dimensionaalisuus lähtötiedot, poistamalla ominaisuuksia, joita ei korreloi valitun ylimääräistä biologisia tietoja annetulle keräämiseen. Tarkemmin pyrimme tunnistamaan geenejä, jotka eivät vaikuta merkittävästi ajallista tilaus tunnistamista.

Voit selvittää väliset riippuvuudet ominaisuuksia ja antaa lisää biologisia tietoja, Pearsonin korrelaatiokerrointa käytetään [34]. Pearsonin korrelaatio on tilastollinen mitta lineaarinen korrelaatio kaksi satunnaismuuttujaa ilmaisee kuinka korreloi muuttujat ovat. Pearsonin korrelaatiota kahden muuttujien ja osoittaa, että ei ole lineaarista suhdetta muuttujia. Pearsonin korrelaatio tai tuloksena kun kaksi muuttujaa vertailtavien lineaarisesti monotonisesti liittyvät. Pearsonin korrelaatio [35] ja viittaa siihen, että lineaarinen yhtälö kuvaa suhdetta ja, jossa kaikki datapisteet makaa linjan joka kasvaa kasvaa. Korrelaatio on edellyttää, että kaikki datapisteet ovat samalla suoralla, jolle pienenee kasvaessa.

Kuten edellä mainittiin, tavoitteena tämä vaihe on poistaa ominaisuuden vahvistaa nämä piirteet (geenejä), jotka ovat vain hieman korreloivat valitun täydentävän biologisia tietoja (joka on, kun kyseessä on syöpä aineistoja, elinaikaa). Näin ollen, laskemme Pearsonin korrelaatiokerroin kunkin geenin ja elinaika ja pidämme vain ne geenit, jotka ovat absoluuttinen arvo korrelaatio on suurempi kuin tietty kynnys (valitaan siten, että varmistetaan radikaali vähentäminen dimensionality).

ehdotettu

RL

tehtävä TO ongelma.

Kuten edellä todettiin, TO ongelma muodostuu määritetään tarkka ajallinen tilaaminen tulonäytteiden, joka heijastaisi ajallisen kehittymisen ja kehittäminen tietyn dynaamisen biologisen prosessin (esimerkiksi syöpä). Vuodesta laskennallisesta näkökulmasta, TO ongelma voidaan pitää ongelman tuottaa permutation joka maksimoi yleinen samankaltaisuus Sim sekvenssin näytteiden pidetään järjestyksessä: (). Yleinen samankaltaisuus Sim pidämme tässä asiakirjassa summaa yhtäläisyyksiä kaikkien viereisten näytteet ja se on maksimoitu.

yleinen samankaltaisuus Sim sekvenssille näytteiden määritellään yhtälössä (1) 🙁 1) jossa tarkoittaa samankaltaisuus ulotteinen vektoreita ja ja se määritellään. Täällä me kuvaamaan euklidinen metriikka ja on suuri vakio.

Määritellään RL liittyvän tehtävän TO ongelman seuraavasti:

tila tila (agentin ympäristö) koostuu valtioiden eli.

alkutila

aineen ympäristössä on. State saavutetaan aine tietyllä hetkellä, kun se on käynyt valtioiden ja on valinnut toimien on

pääte

(lopullinen tai tavoite) tilassa, jos tilojen lukumäärä vieraillut agentin nykyisen sekvenssi on (ts ) ja kaikki valitut toimet ovat erillisiä, ts.

toimintatilaa koostuu toimia käytettävissä ongelmanratkaisu aine ja vastaavat mahdolliset arvot käytetään edustamaan liuokseen (permutaation), eli missä.

siirtymäfunktio valtioiden välillä on määritelty kaavassa (2). (2) missä. Tämä tarkoittaa, että tietyllä hetkellä, mistä valtion agentti voi liikkua uusien valtioiden, suorittamalla yksi mahdollisista toimista. Sanotaan, että tila, johon pääsee valtion, eli on

naapuri

(

seuraaja

) tilasta.

Siirtymiset valtiot ovat equiprobable , siirtyminen todennäköisyyden tilaan

s

ja kunkin naapurin tila on yhtä suuri kuin kunkin valtion välillä on mahdollista uusien valtioiden (ks kaava (2)).

palkkio toiminto on määritelty alla (kaava (3)).

Tarkastellaan polun edellä määritellyn ympäristöä alkuperäisestä lopulliseen tilaan, missä ja valtion on

naapuri

valtion (). Ottaen huomioon RL tehtävä edellä määritelty, ympäristöä voidaan visualisoida kuin puu. Tässä puumaiseen ympäristössä, polku koostuu erillisten kärkipisteet (valtioiden), jossa jokaisen vierekkäisen parin kärkipisteet on sidoksissa kaaren (toiminta).

peräkkäisten toimenpiteiden jälkeen saatu väliset siirtymät peräkkäisten valtioiden polulta on merkitty, missä. Sekvenssi tullaan nimitystä

toiminta kokoonpano

liittyvät polku.

toiminta kokoonpano

liittyvät polulle antaa näytejono.

polku on nimeltään

voimassa

jos kaikki toimet sen

toiminta kokoonpano

ovat erillisiä ja kukin näyte sekvenssi on lähempänä näytteen että välittömästi seuraa se järjestetyssä sekvenssissä kuin mihinkään muuhun otokseen ja.

toiminta kokoonpano

assosioitunut

voimassa

polku voidaan pitää mahdollisena jotta tulonäytteiden, eli permutaatio, joka antaa ajallista järjestystä tarkasteltavan näytteen, jonka pitäisi olla, jonkin verran, korreloi elinaika, kun on kyse kun näytteet edustavat poimittuja syöpäpotilailla. Näin ollen emme voi liittää on

voimassa

polku arvo merkitään edustaa yleinen samankaltaisuus (yhtälö (1)) sekvenssin.

TO ongelma formuloida RL ongelma koostuvat koulutus agentti löytää polku alkuperäisestä lopulliseen tilaan, jolla on suurin liittyvä yleinen samankaltaisuus. Kun vahvistaminen oppimisprosessi, agentti oppii toteuttaa nämä siirtymät, jotka maksimoivat summa palkintoja sai tiellä alkuperäisestä lopulliseen tilaan.

Pyrimme saada

voimassa

polku, jolla on enimmäismäärä samankaltaisuutta sekvenssin vastaavien näytteiden vastaavan toiminnon kokoonpano, joten me määrittelemme vahvike funktio seuraavasti (kaava (3)) 🙁 3) missä jonka me ilmi palkkion saamat agentin tilassa, kun historiansa ympäristössä on.

edustaja saa kielteisen palkkion polkuja, jotka eivät ole voimassa, joten se oppii tutkimaan vain pätevä polkuja. Ottaen huomioon palkkio määritelty kaavassa (3), koska oppiminen tavoitteena on maksimoida kokonaismäärä palkintoja sai tiellä alkuperäisestä lopulliseen tilaan, voidaan osoittaa, että aine on koulutettu etsimään kelvollinen polku, joka maksimoi yleinen samankaltaisuus liittyy tilaus.

oppimisprosessia.

aikana harjoitusvaiheen oppimisprosessin, agentti määrittää sen

optimaalista politiikkaa

ympäristössä, eli kartoituksen välillä valtioiden toimista, joka maksimoi summa sai palkintoja.

koulutus

TO agentti

, ehdotamme Learning lähestymistapaa, jossa edustaja oppii kanteen arvo

Vastaa