PLoS ONE: arviointi FBA Based Gene olennaisuuden Analysis in Cancer kanssa Fast Context-Specific Network Reconstruction Method

tiivistelmä

Motivointi

Gene olennaisuuden Analyysi perustuu Flux Balance Analysis (FBA-pohjainen GEA) on lupaava työkalu tunnistamiseksi uusien metabolisen terapeuttisia kohteita syöpään. Jälleenrakentaminen syöpää aineenvaihduntarajoituksista verkkoja, tyypillisesti perustuu geenien ilmentyminen tietojen muodostaa järkevä askel tähän lähestymistapaan. Kuitenkin tietojemme mukaan ole laaja arviointi vaikutuksen jälleenrakennuksen prosessin saadut tulokset on suoritettu tähän mennessä.

Tulokset

Tässä artikkelissa pyrimme tutkimaan konteksti- erityisverkostojen ja niiden FBA-pohjainen GEA tulokset tunnistamiseen syöpä aineenvaihduntarajoituksista olennaisia ​​geenejä. Tätä varten käytimme geenien ilmentymisen aineistoja päässä Cancer Cell Line Encyclopedia (CCLE), arvioinnissa saatujen tulosten 174 syöpäsolun linjat. Jotta selvemmin tarkkailla vaikutus syövän ekspressiota tietoja, teimme sama analyysi käyttäen satunnaisesti ekspressiokuvioita. Meidän laskennallinen analyysi osoitti joitakin olennaisia ​​geenejä, jotka ovat melko yleisiä rekonstruktiot peräisin sekä geenien ilmentymisen ja satunnaisesti tietoja. Kuitenkin vaikka kooltaan rajallinen, löysimme myös alaryhmä olennaisia ​​geenejä, jotka ovat hyvin harvinaisia ​​satunnaisesti verkkoihin, kun taas toistuvat näytteessä peräisin verkot, ja siten oletettavasti muodostaa merkityksellisiä lääkekohteita tarkempaa analysointia varten. Lisäksi vertaamme

in-silico

tuloksia korkean suoritustehon geenien kokeiden Project Achilles kanssa ristiriitaisia ​​tuloksia, mikä johtaa meidät herättää useita kysymyksiä, erityisesti voimakas vaikutus valitun biomassan reaktio on saatu tuloksia. Tästä huolimatta edellisellä kirjallisuuden syöpätutkimuksessa, arvioimme tärkeimmät tavoitteistamme kolmella eri syöpäsolulinjoissa, kaksi johdettu Gliobastoma Multiforme ja yksi ei-pienisoluinen keuhkosyöpä, todetaan, että jotkin ennusteet ovat oikealla tiellä .

Citation: Tobalina L, Pey J, REZOLA A Planes FJ (2016) arvio FBA Based Gene olennaisuuden Analysis in Cancer kanssa Fast Context-Specific Network jälleenrakennus Method. PLoS ONE 11 (5): e0154583. doi: 10,1371 /journal.pone.0154583

Editor: Julio Vera, University of Erlangen-Nürnberg, Saksa

vastaanotettu: 15 elokuu 2015; Hyväksytty: 15 huhtikuu 2016; Julkaistu: 4. toukokuuta 2016

Copyright: © 2016 Tobalina et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Data Saatavuus: Kaikki asiaankuuluvat tiedot ovat paperi- ja sen tukeminen Information tiedostoja.

Rahoitus: Tätä työtä tukivat Baskimaan hallituksen [LT], Asociación de amigos de la Universidad de Navarra [AR] ja talousministeri ja kilpailukyky Espanja [BIO2013-48933]. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Viimeaikaiset havainnot osoittavat, että syöpäsolut sopeuttaa metabolisia prosesseja tehostaa lisääntymistä [1,2]. Tätä varten syöpäsolut kuluttaa ravinteita ja ohjata ne ravinteet makromolekyyliyhdisteiden synteesi reittejä. Lukuun ottamatta muutoksia glukoosin aineenvaihduntaa, ns Warburg vaikutus, enemmän on raportoitu nukleotidien synteesissä, aminohappoja ja lipidejä [3,4]. Lisäksi asiaan mutaatiot aineenvaihdunnan geenien ja kasaantuminen keskeisten metaboliitteja on havaittu syöpäsoluissa [5]. Valossa nämä todisteet, tutkimus solun aineenvaihduntaa syöpätutkimuksessa on aktiivisesti uudelleen heränneen. Kokonaisvaltainen systeemibiologian lähestymistapoja, jotka perustuvat genomin mittakaavassa metabolisen verkkojen ja suuren suorituskyvyn ”omiikka” data, avaa uusia mahdollisuuksia hyödyntää aineenvaihdunnan häiriöt kasvainsolujen, erityisesti huomioon eri täyttämättömät kliiniset tarpeet syövän.

Erilaisten olemassa analysoida genomin mittakaavassa metabolisen verkostoja ihmisen syöpäsoluja. Constraint-mallinnus (CBM) on muodostumassa alue systeemibiologiassa joka sisältää kasvava joukko menetelmiä [6,7]. Näkyvin menetelmä CBM on Flux Balance Analysis (FBA), joka olettaa, että vuot verkossa seurata biologisen Kohdefunktio voidaan optimoida, tyypillisesti solujen kasvuun [8]. Kasvu on mallinnettu tässä ylimääräisenä keinotekoinen reaktion, jossa aineenvaihdunnan vaatimuksiin, suhteen rakennuspalikat ja energiaa, tuottamiseksi grammaa kuivapaino (GDW) biomassan. FBA voimme tehdä geenin olennaisuuden analyysi (GEA) metaboliatasolla eli yksilöimällä geenejä, joiden yksittäiset poisto estää kasvun reaktio olemasta aktiivinen [9]. Synteettinen kuolleisuutta, mikä viittaa kahden (tai useamman) ei-välttämättömien geenien, joiden samanaikainen poisto tulee tappava tietyn fenotyypin, voidaan samalla tavoin toteuttaa. Tärkeää on, että ensimmäinen sovellus FBA-pohjainen GEA ihmisen aineenvaihdunnan ja syövän Tutkimus toteutettiin vuonna [10]. Ne paljastivat, että Häm oksygenaasi on synteettisesti tappava kasvain vaimennin fumaraatti hydrataasia. Tämä tulos oli myöhemmin kokeellisesti validoitu, joka osoittaa sen merkitys hoitoon leiomyoma- ja munuaisten syöpä, koska ituradan mutaatioista fumaraatin hydrataasia pohjautua syöpä [11]. Tämä onnistunut lopputulos osoitti, että FBA perustuva GEA on sopiva tapa valaista uusia lääkekohteita syövässä.

FBA-pohjainen GEA alkaa viittauksella genomin mittakaavassa aineenvaihduntaverkoston ihmisen aineenvaihduntaa, kuten Recon2 [12] . Saadakseen itselleen syöpää aineenvaihduntarajoituksista ominaisuuksia, tämä viittaus verkko on contextualized kanssa saatavilla kokeellista tietoa [13]. Manuaalista rakentamassa luotettavan asiayhteyskohtaisia ​​aineenvaihdunnan verkko on monimutkainen ja aikaa vievä [14]. Tästä syystä automaattinen verkon rekonstruktioalgoritmit on ehdotettu, perustuu yleensä geenin /proteiinin ilmentymiseen tietoja. Koska runsaasti transcriptomic tietojen mRNA ekspressiotietojen on yleisin tyyppi käytettävien tietojen eri rekonstruktiomenetelmät. Joka ei ole tyhjentävä luettelo tämäntyyppisiä menetelmiä sisältää: GIMME [13], IMAT [15], E-Flux [16], MBA [17], PROM [18], MADE [19], INIT [20], tai MIRAGE [21].

saadut tulokset FBA-pohjainen GEA ovat riippuvaisia ​​eri osatekijät tässä verkossa jälleenrakennusprosessiin eli viittaus verkko, määritelty kasvualusta, geenien ilmentyminen tietoja ja rekonstruointialgoritmi. Kuitenkin tietojemme mukaan ole laajan kartoituksen arvioidaan vaikutuksen metabolisen jälleenrakennusta ja ilme tietoja tuloksista geenin olennaisuuden analyysi on tehty tähän mennessä syöpään. Tätä varten tässä artikkelissa, teimme laajan tutkimuksen eri tyyppisten syöpien päässä Cancer Cell Line Encyclopedia (CCLE) [22], jotta voidaan selvittää vaikutus joidenkin näiden tekijöiden tuloksena luetteloon välttämättömien geenien. Jotta selvemmin tarkkailla vaikutus syövän ekspressiota tietoja, teimme sama analyysi käyttäen satunnaisesti ekspressiokuvioita. Lisäksi käytimme suurikapasiteettisten geenien data [23] laajasti testata ennusteet FBA-pohjainen GEA lähestymistapaa. Lopuksi vertasi kirjallisuudesta tietoa ennustettu välttämättömien geenien kolmella syöpäsolulinjoissa: kaksi johdettu Gliobastome Multiforme (GBM) ja yksi ei-pienisoluinen keuhkosyöpä (NSCLC).

kyettävä suorittamaan tämän laajan tutkimuksessa esittelemme nopea verkko rekonstruointialgoritmi perustuu geenien ilmentyminen tietoja, joita käsitellään käyttäen Gene Expression Viivakoodi [24], vankka tilastollinen menetelmä kehitettiin ennustaa ilmaistuna ja ei-ilmaistu geenien mikrosiruja.

Methods

Verkko jälleenrakennus malli

Verkko rekonstruktioalgoritmit ongelman alkaen joukko reaktioita, jotka pitäisi olla läsnä perustuu aikaisempien kokeellista näyttöä, tyypillisesti geenin /proteiinin ilmentymisen tasot. Nämä reaktiot eivät yleensä muodostavat yhtenäisen verkoston [25]. Itse asiassa ne eivät välttämättä liity toisiinsa, voivat muodostaa erillisiä klustereita tai jopa eristää muusta. Siten rekonstruktioalgoritmit täyttää aukot, kunnes yhtenäinen verkko saadaan. Hypoteesiarvo reaktiot tulevat tietokannan tunnetuista biokemiallisia reaktioita, yleensä liittyy tutkittavasta organismista. Huomaa lisäksi, että se on myös tyypillistä välttää joitakin reaktioita jälleenrakentamiseen koska kokeellista näyttöä niiden puuttuessa [15].

Nykyinen rekonstruktioalgoritmit tyypillisesti luottaa Mixed Integer Linear Programming (MILP). Me sen sijaan hyödyntää iteratiivisen strategiaa, joka perustuu lineaariseen ohjelmista (LP), koska MILP valmisteet eivät ole riittävän nopea aiottuun tutkimukseen. On myös totta, että jokainen rekonstruointialgoritmi on yleensä keskittynyt kohti integrointi erityyppisen yhden tai useamman tulon kokeellista tietoa. Tämän vuoksi useimmissa tapauksissa, saadut tulokset kukin niistä ei ole helppo verrata toisiinsa. Meidän tapauksessamme me keskitymme käytöstä mRNA transkriptin tason tietoja, koska tämä on kaikkein helposti tietolähteen syövässä. Kuten alla, käytimme Gene Expression Viivakoodi [24], tyylikäs tekniikka valita ilmaistuna ja ei-ilmaistuna geenejä, joka lopulta muodostaa lähde todisteiden kontekstualisoida aineenvaihduntaan.

Toinen piirre rekonstruointialgoritmi on se, että se toimittaa verkkoja suoraan kannekelpoisten FBA, kuten tulemme suorittaa Gene olennaisuuden Analyysi perustuu FBA tutkimuksessamme. Tämä tarkoittaa sitä, että rekonstruoidun verkon tulisi pystyä tuottamaan biomassaa, kun se täyttää vakaan tilan. Useimmat muut rekonstruktioalgoritmit on suunniteltu takaamaan myöhemmin, kuitenkin entinen.

algoritmi erottaa muista monella tavalla, lukuun ottamatta sitä, että suurin osa niistä riippuvaisia ​​MILP muotoiluja. GIMME [13] ja IMAT [15] myös käyttää mRNA transkriptin tason tietoa, mutta sen käsittely on vähemmän laadittu kuin yksi suoritettu Viivakoodi. MADE käyttää differentiaalikaavojen [19], jossa keskitytään aineenvaihdunnan sopeutumista vähintään kahden skenaariota. INIT on suunnattu käyttö useamman kuin yhden tyyppisiä tietoja [20]. MBA edellyttää määritelmä ydinjoukko reaktioita pakko sisällyttää jälleenrakentamiseen [17]; kuitenkin, samalla kun määritellään tämä aktiivinen ydin on mahdollista tunnettu kudoksia, tämä on kyseenalainen, kun saatavilla oleva näyttö rajoittuu geenien ilmentyminen tietoja, johon tavallisesti kuuluu ristiriidat ilmaistaan ​​ja ei-ilmentyvien geenien ja reaktiot johtuvat posttranskriptionaalisella sääntelyyn tapahtumat [15 , 26]. MIRAGE ulottuu upon MBA kirjanpito, muun muassa biomassan tuotantoon [21]. PROM [18] ja E-Flux [16] kuuluvat eri perheeseen menetelmiä, jossa suurin sallittu vuot säätyy geenien ilmentyminen tietoja. Erityisesti PROM integroituu aineenvaihduntaa säätelyverkkojen, jotka vaativat suuren geenin ilmentymisen aineisto geneettisen ja ympäristön häiriöt.

Käsitteellisesti meidän algoritmi vie lähestymistapaa, joka muistuttaa enemmän IMAT kuin muita algoritmeja. Molemmat luokitella reaktioita osaksi korkea (

H

), kohtalainen (

M

) ja matala (

L

) toiminta perustuu geenien ilmentyminen tietojen ja yrittää tasapainottaa sisällyttämistä

H

ja

L

reaktioita käyttämällä kohdefunktion. Toisin IMAT, myös minimoida

M

reaktiot jossain määrin, jotta saadaan minimaalisen verkko, joka täyttää joukko rajoituksia. Lisäksi algoritmimme lisää vaatimus biomassan tuotantoon, koska se on tarkoitettu saamisen verkkojen suoraan vastaanottavaisia ​​FBA. Kuten edellä todettiin, tärkein panos lähestymistapamme suhteen IMAT on merkittävä väheneminen laskenta-aikaa, kunnioittaen laatu ratkaisu.

vähentäminen laskenta-aika, meidän algoritmi menee samaan suuntaan kuin algoritmi äskettäin esitetty [27], kutsutaan FastCore. Tämä algoritmi käyttää monivaiheisessa lähestymistapaa, joka perustuu lineaarinen ohjelmointi, mutta se on käsitteellisesti samanlainen kuin MBA, koska se myös pakottaa sisällyttämistä ydinjoukko reaktioita. Sen lisäksi, miten se käsittelee sisällyttämistä reaktioita, joka perustuu kolmen tasoluokitusta geenien ilmentyminen tietoja, meidän algoritmi eroaa myös FastCore, että se käyttää käsitettä alentuneet kustannukset lineaarisesta ohjelmoinnin teorian ohjaamaan iteratiivisen ratkaisun ydin. Lisäksi otamme huomioon vaikutukset eri stoikiometrinen esityksiä [28] muotoilemalla ongelma suhteessa suurimpaan sallittuun vuon läpi jokaisen reaktion antama Flux vaihtelevuus Analysis (FVA) [29].

Kaiken lähestymistapamme on suunniteltu erityistarpeita tämän tutkimuksen mielessä. Yksinkertaistettu versio meidän algoritmin on esitetty alla. Full tekniset yksityiskohdat lähestymistapamme löytyy S1 teksti.

Katsaus meidän lineaarinen ohjelmointi-pohjainen algoritmi

Tarkastellaan yleistä metabolisen verkon

C

yhdisteitä ja

R

reaktioita edustaa sen stökiömetrinen matriisin

S

[30]. Merkitään

Irr

joukko peruuttamaton reaktioita. Mukavuussyistä, jokainen palautuva reaktio osallistuu kaksi eri peruuttamatonta reaktioita kokonaismäärä

R

. Nämä kaksi peruuttamatonta reaktioita merkitään

f

ja

b

, eteen- ja taaksepäin, vastaavasti, joista jokainen edustaa alkuperäistä palautuva reaktio yhteen eri suuntaan [31]. Joukko eteen- ja taaksepäin vaiheet, jotka syntyvät käänteisiä reaktioita merkitään

Rev

.

vuon kautta kussakin reaktiossa

i

(

i

= 1 , …,

R

) edustaa jatkuvana muuttujana

v

i

. Jakauduttua käänteisiä reaktioita, vuot voi vain ottaa ei-negatiivisia arvoja, joita rajoittaa enintään vuon arvo, (yhtälö 1). Voit myöhemmin hakea FBA-pohjainen GEA, myös valvoa vakaan tilan (Eq 2) ja vähintään vuon kautta biomassan reaktion (Eq 3). Niiden yhdisteiden otettu tai erittyy kasvualustaan, vaihtoreaktioissa lisättiin sopivasti.

(1) (2) (3)

Kunnolla määrittää kunkin reaktion, me suorittaa Flux vaihtelevuus Analysis (FVA) [29 ] nojalla rajoitteet (1) – (3). Otto reaktio rajasi kasvua keskipitkällä harkitaan sisältyvät Eq 1.

Myös määrittelyn jatkuvana muuttujana

z

i

kutakin reaktiota, jota rajoittavat välillä 0 ja 1 (Eq 4), joka voi pakottaa vähintään vuon kautta liittyvä reaktio,

v

i

(yhtälö 5). δ on ehdottomasti positiivinen vakio, jonka suurin arvo on 1, joka korjaa alarajan

v

i

suhteessa arvoon

z

i

suhteen. Sisällyttäminen yhtälössä 5 laskettuna FVA avulla voimme asettaa aktivointi kynnys riippumaton stoikiometrisiä edustus. Huomautamme, että tämä joukko muuttujia on jatkuva, kuten [27], eikä binary, kuten useat aikaisemmat työt [15,17].

(4) (5)

Meidän tavoite on minimoida määrä reaktioiden

L

maksimoi kuin

H

. Sillä, että tavoitteemme toiminto minimoi summan vuot kautta reaktiot kuuluvat

L

joiden paino

W

L

sekä vuon kautta reaktiot in

M

joiden paino

W

M

, ja maksimoi määrä reaktioiden

H

käyttämällä

z

muuttujia, joiden paino

W

H

(Eq 6). Termi δ⋅ yhtälössä 6 voimme välttää vuon vääristymä erityiseen stoikiometrinen edustus reaktioita. Eri kriteerien perustaa nämä painot keskustellaan Tulokset osiossa.

(6)

Kuten edellä todettiin, se on yhteinen asettaa

z

i

kuin binäärimuuttuja, mutta rentouttava että rajoitus, koska täällä tehnyt, saavutetaan sama ”flux monipuolistaminen” vaikutus haluttuun [27]. Minimointi summa vuot varten

L

ja

M

ei ole sama kuin määrän minimoimista reaktioiden

L

ja

M

, mutta se voimme lineaarinen muotoilu ongelman vaikuttamatta negatiivisesti lopullinen ratkaisu laadullisesti. Kaiken kaikkiaan näitä ominaisuuksia, voimme välttää sekoitettu binary muotoilua, vaikeampi ratkaista, koska täydellisyyttä rajoituksia joidenkin muuttujien [32].

Koska olemme jakaa palautuvia reaktiot kahteen peruuttamattomia vaiheita, mutta on lisätty mitään rajoitteita taataan, että vain yksi niistä on kerrallaan aktiivinen, tämän ongelman ratkaisemiseksi (Eq 6 edellyttää yhtälöiden 1-5) antavat meille ratkaisun, jossa kaikki eteen- ja taaksepäin askeleen päässä palautuvia reaktioita

H

ovat aktiivisia, vaikka niiden netto virtaus (

v

f

v

b

) on nolla. Huomaa, että tämä ei tapahdu palautuvia reaktioita

L

tai

M

, koska minimoimalla summa vuot jo toimeenpanee käyttö käänteisiä reaktioita tarvittaessa vain yhteen suuntaan.

Tämä ongelma on havainnollistettu kuviossa 1. Kuva 1A esittää esimerkkiä viittaus metabolisen verkkoon, mukaan lukien luokittelu reaktioita kuten

H

,

M

tai

L

. Kuvio 1B esittää tuloksena liuosta kerran lineaarisen määrittelemän yhtälön 6 kohteena yhtälöiden 1-5 ratkaistaan. Voidaan havaita, että ratkaisu varmasti tuottaa biomassasta kautta reaktiot 2 (

M

), 3 (

H

), 5 (

H

) ja 17 (

H

). Lisäksi se aktivoi kaksi jaksoa, joissa verkko vuon nolla, eli ensimmäinen liittyy reaktioita 4 (

H

) ja 14 (

H

) ja toinen liittyy reaktioita 9 (

H

) ja 15 (

H

). Läsnäolo Näiden häiritsevien syklien on seurausta ei-binary muotoilu ehdotti edellä, mikä menetelmä on iteratiivinen joka disentangles onko (vai ei) nämä palautuvia reaktioita

H

voidaan sisällyttää jälleenrakentamiseen yhdistettynä muita reaktioita.

) Esimerkki viite metabolisen verkkoon 3-tason luokittelu reaktioita. Siihen liittyy kymmenen reaktioita sekä biomassan reaktion. Käännettävä vuot jakautuvat kahteen ei-negatiivinen vaiheita. Taaksepäin reaktiot esitetään katkoviivalla. Reaktioita 3, 4, 5, 7 ja 9 on luokiteltu

H

; reaktiot 2, 8 ja 10, kuten

M

; ja reaktioiden 1 ja 6 kuten

L

. B) Ratkaisu saadaan kun ratkaisemalla lineaarinen määrittelemän yhtälön 6 edellyttää yhtälöiden 1-5. Paksumpi kaarella kuvastaa aktiivista reaktioiden jaksoa mukana eteenpäin ja taaksepäin vaiheet palautuva reaktio

H

ovat edustettuina ohuempi linjat ja aktiivinen reaktiot ovat värillisiä vaaleanharmaa.

Iteratiivinen menettely käytimme on kuvattu yksityiskohtaisesti S1 teksti. Se perustuu lineaarinen ohjelmointi ja se käyttää käsitettä alentuneet kustannukset (otettu lineaarisen ohjelmoinnin teoria) ohjata ja nopeuttaa iteratiivinen ratkaisu prosessi.

Reaktio luokitus

panos rekonstruointialgoritmi on reaktio luokittelun erittäin (

H

), keskipitkän (

M

) tai alhainen (

L

) ilmaistuna. Tämä tieto saadaan geenien ilmentyminen kokeiluja, meidän tapauksessamme kerätty GEO tietokannasta [33].

keskittyneet Affymetrix HGU133plus2 taulukot, joita voidaan käsitellä Viivakoodi [24]. Menetelmä on suunniteltu pystyä toimimaan vain yksi näyte ja tehdä se verrattavissa muiden sijasta tarvitsevat useita näytteitä samanaikaisesti. Me esikäsiteltyä tietoja käyttämällä Viivakoodi T käsikirjoitus, käyttäen yksi näyte kerrallaan. Me haetaan Z-score-arvoja tämä algoritmi, joka vastaa käsittelyn kunkin näytteen kanssa fRMA [34].

Koska Z-lukujen noudetaan Viivakoodi annettiin maadoituskoettimessa asetetun tason käyttämällä geeniä -probe suhteet selityksin in hgu133plus2.db R paketti, saimme geeni Z-score arvo mediaani vastaavan Z-tulokset siihen liittyvän koetin-sarjaa. Kukin geeni arvo muuttui läsnä (1) /poissa (0) puhelun Viivakoodi kriteerit. Esillä geenit luokitellaan korkea (+1) ja poissa geenien alhaiset (-1).

Lopuksi reaktiot luokitellaan erittäin, keskitason tai alhainen ilmaistuna geenien-proteiini-reaktion sääntöjä ja geenin ilmentyminen luokitus edellä mainittujen [35] (ks S1 teksti yksityiskohtaisempaa selitystä). Ne reaktiot, joille ei geeniekspressiota on saatavilla tai jotka eivät liity mihinkään geeni (esim spontaanit reaktiot) luokitellaan keskipitkän ilmaistu.

Gene olennaisuuden Analysis

Essential geenejä tarkoitetaan henkilöä, geenejä, joiden poistaminen tekevät solu pysty tuottamaan biomassaa. Käyttämällä Boolean geeni-proteiini-reaktio säännöt sisällytetään genomiin mittakaavan aineenvaihdunnan verkkojen kuten Recon2 [12], voimme arvioida mikä reaktiot lakkaavat toimimasta tietyn geenin poistetaan. Siten geeni knock-out simuloidaan asettamalla ylä- ja alarajojen vastaavien reaktioiden nollaan käytettäessä FBA laskentaan, ja tarkistetaan, onko (vai ei) jäljellä verkko pystyy edelleen tuottamaan biomassaa.

jotta vähentää FBA tarvittavat laskelmat tarkistaa olennaisuuden jokaisen geenin, ensin lasketaan suurimman biomassan mahdollista villityypin verkkoon ja etsinyt vuonjakauma pienellä summa virtaamista läpi reaktioita, joita varten geeni-to -reaction kartoitus on määritelty. Jos tietyn geenin knock-out ei vaikuta mitään reaktiota, että optimaalinen vuonjakauma, voimme olla varmoja siitä, että uusi FBA laskelma antaa meille sama ratkaisu kuin villin tyypin verkko, ja siksi voimme ohittaa tällaisen geenin tyrmäyksellä.

vertailu koetuloksiin

sen arvioimiseksi tarkkuutta lähestymistapamme ennustaa olennaisia ​​geenejä, käytimme suurikapasiteettisten hiljentäminen kokeita otettu projektin Achilles [23]. Me johdettu pisteet kullekin geenin kussakin solulinjassa seuraavaa menetelmää käyttöön [36]. Olemme kuitenkin kerrotaan saatu partituureja -1, niin että alempi pisteet, sitä enemmän olennaista geeni on tarkoitus olla, koska se tapahtuu kanssa shRNA kertaiseksi muutoksia suurikapasiteettisten hiljentäminen kokeita. Sitten verrataan jakelun tulokset on saatu olennaisen aineenvaihdunnan geenit vs. epäolennaiset metabolisen geenit käyttäen yksipuolinen kahden otoksen Kolmogorov-Smirnov testi, kuten ehdotetaan [10]. Tämä testi auttaa meitä näkemään, jos saadut olennaiset geenit painottuu alempi, olennaisempaa tulokset. Kuitenkin poikkeama voi olla merkittävä, mutta ei riittävän suuria niin, lisäksi mittasimme osuutta saatujen olennaisten geenien negatiivisella Aquilles-pohjainen pisteet jokaisessa tilanteessa, kohta, jossa todennäköisyys geenin keskeisinä on korkeampi kuin on ei -essential. Itse asiassa huomasimme, että vain murto-osa metabolisen geenien oli negatiivinen pistemäärä Achilles data, joten haluamme varmistaa, että lasketut olennaiset geenit rikastettu niihin.

Tulokset

lähestymistapa edellä esitetty levitetään ensin rekonstruoida metabolisen verkosto 174 syöpäsolun riviä käyttäen geenien ilmentyminen saatuja tietoja Cancer Cell Line Encyclopedia (CCLE) [22]. Valinta tämän alijoukon solulinjojen tehtiin ottaen huomioon käytettävissä suurikapasiteettisten geenien tietoja projektin Achilles [23] (S1 taulukko). Teknisen suorituskyvyn lähestymistapamme on arvioida ja verrata IMAT, eniten samanlainen lähestymistapa yhden käyttöön here (S1 Text). Seuraavaksi teemme FBA-pohjainen GEA näihin rekonstruoitu verkkojen ja arvioida usein kunkin välttämätön geeni näyttäisi verkossa rekonstruoitu satunnaisesta ekspressiotietojen. Lisäksi vertaamme saatuja tuloksia korkean suoritustehon geenien Koetulokset [23]. Lopuksi vertasi kirjallisuudesta tietoa ennustettu olennaisia ​​geenejä kaksi GBM-johdettuja ja yksi NSCLC solulinjat.

Tätä varten käytimme alkuperäistä ihmisen aineenvaihdunnan verkko Recon2 [12] referenssinä verkko (samanlaisen analyysi Recon1 löytyy S1 teksti). Tämä verkko tarjoaa biomassan reaktion, joka käytetään suoraan tämän tutkimuksen. Kasvualustaan ​​oli RPMI1640, määritellään kuten [10]. Lisäksi reaktiot luokiteltiin erittäin, keski tai alhainen ilmaista geenien-proteiini-reaktio säännöt ja geenien ilmentymisen luokitus kuvattu Menetelmät jaksossa.

Algoritmi toteutettiin Matlab käyttäen Cplex optimointiohjelmistot ratkaisemiseksi vastaava lineaarinen ohjelmia. Laskenta-aika ratkaisemiseksi tarvitaan yksi rekonstruktio ongelma käyttämällä edellä kuvatun on luokkaa sekunnin par suorituskykyä Fastcore [27]. On tapauksia meidän menetelmää on sovellettu, laskenta-aika on yleensä alle 10 sekuntia 64-bittinen Intel Xeon E5-1620 v2 klo 3.70 GHz (4 ydintä) ja 16 Gt RAM. Tämä asettaa meidän algoritmin huomattavasti nopeammin kuin IMAT, jossa mediaani aika, jotta saadaan liuos oli noin 57 sekuntia (pysäyttäminen kanssa 0,5% optimality rako).

Malli parametrit ja jälleenrakennus

esitämme rekonstruointialgoritmi meillä on useita parametreja, jotka vaativat ollessa määrätty. Merkittävimmät parametrit ovat painot

W

H

,

W

M

ja

W

L

, koska siellä on ristiriitainen kompromissi reaktioita

H

ja

L

. Erityisesti käyttää kaikkia reaktioita

H

voi liittyä huomattava määrä reaktioita

L

; Samoin, vähintään käyttö reaktioiden

L

saattavat merkitä rajoitettu käyttö reaktioiden

H

. Jotta tutkia tätä kompromissia reaktio

H

ja

L

ehdotamme skeemoista taulukossa 1, jossa α = 10

3. Schema 1 annetaan enemmän painoarvoa minimointia reaktioiden

L

yli maksimointia reaktioiden

H

; Skeema 2 antaa saman painoarvon, kun Schema 3 on vastakohta Schema 1. Tiedot ja herkkyysanalyysi α ja muiden parametrien kiinteitä meidän algoritmi löytyy S1 teksti. Keskeiset päätelmät saavutettu oli vankka muutoksiin näiden parametrien.

luokittelussa reaktioita geenien ilmentyminen tietoja välttäen sisällyttäminen reaktioiden

L

niin paljon kuin mahdollista saattaa olla mielekkäämpää kuin yrittää pakottaa läsnä kaikki reaktioiden

H

, koska korkean geeniekspressiota signaali ei välttämättä kääntää korkea entsyymiaktiivisuus. Kuitenkin tunnistaminen ei-ilmentyvien geenien muodostaa vaikeampi tehtävä [37]. Tästä syystä lähestymistapa lähemmäksi Schema 3 on tyypillisesti edullinen.

Vertasimme suorituskyky meidän jälleenrakennuksen lähestymistapaa käyttäen eri skeemojen kanssa IMAT. Kuten voidaan nähdä kuviosta 2, joka näyttää prosentteina reaktiot luokitellaan

H

ja

L

jotka sisältyivät käyttämällä kutakin rekonstruointialgoritmi, välttäminen

L

reaktiot in Schema 1 vaikuttaa määrästä reaktioiden

H

sisältyivät malliin, joka tarjoaa merkittävästi erilainen ratkaisu kuin Schema 3.

Boxplots kertoo prosentuaalisen H ja L reaktioita sisältyvät rekonstruoitu asiayhteyskohtaisia ​​verkostoja valittu syöpä solulinjoja käyttämällä algoritmia alle Schema 1, 2 ja 3 ja IMAT. Viittaus verkko käytettiin Recon2.

Kuten odotettua, Schema 2 on kaikkein samanlainen IMAT, koska molemmat tarjoavat saman painoarvon reaktioita

H

ja

L

. Voidaan havaita, että määrä L reaktioita olivat hyvin samankaltaisia ​​ja määrä

H

reaktioita olivat meidän algoritmi on hieman pienempi. Kaiken molemmat menetelmät saada samanlainen rekonstruktiot mitattuna määrä

H

ja

L

reaktioita ne sisältävät. Siten pidämme algoritmin oikea väline käsillä olevaan tehtävään. Huomaa, että suurin mahdollinen prosenttiosuus

H

reaktioita olivat jälleenrakentamisessa ei välttämättä saavuta 100%, koska tämä voi reaktioita, jotka eivät voi toimia vakaassa tilassa alle asetetut väliaineen olosuhteissa.

Gene olennaisuuden analyysi

kanssa nopea rekonstruointialgoritmi meidän käsissämme, voimme käsitellä kysymystä, missä määrin joukko välttämättömien geenien joka kärsii yhteydessä ilmentymistä tietoja. Tutkia tarkemmin tätä asiaa, me permutoidaan metabolinen geeniekspression luokittelu kunkin näytteen 10 kertaa ja rekonstruoitu vastaavien verkkojen seuraa laskettaessa niiden vastaavat olennaiset geenit, mikä on taustalla lähes 2000 sattumanvaraisia ​​tuloksia.

Kuva 3 esittää tulokset kokeilua Schema 3 (luettelo geenien ja arvot löytyvät S2 taulukko). Kuten osittain odotettua, on olemassa joitakin geenejä, jotka ovat melko yleisiä missään rekonstruoitu verkossa. Äärimmäisissä tapauksissa ovat geenejä, jotka näkyvät välttämättömiä riippumatta syöttölauseke on. Nämä ovat suora seuraus ohjearvon verkkoon, kiinteän kasvualustan olosuhteet ja valitun biomassan reaktion. Tämä analyysi vahvistaa, missä määrin nämä tekijät voivat vaikuttaa tuloksiin.

Essential geenin taajuus rekonstruoitu asiayhteyskohtaisia ​​verkostoja valittu syöpä solulinjoja käyttämällä algoritmia Schema 3 ja Recon2 kuin pohja verkkoon. Vaaka-akseli sisältää ENT- REZ symbolit saatujen välttämättömien geenien. Korkeus tankojen osoittaa osa näytteistä, joissa geeni näkyy välttämätöntä. Korkeus musta viiva osoittaa osa satunnaisesti rekonstruoitu verkko, jossa vastaava geeni esiintyy olennaista.

Huomaa, että on olemassa myös joitakin olennaisia ​​geenejä hyvin usein yksittäisissä näytteissä, mutta harvemmin satunnainen verkoissa. Nämä olisivat lähtökohtaisesti kaikkein kiinnostavimpia, koska ne vastaavat paremmin kuin muiden geenien kuin erityinen ilmaus näytteistä.

silmiinpistävin seikka on, että luettelo saadun välttämättömien geenien poissulkevia syöpä tyyppi on melko lyhyt. Vain 6 geenit ilmestyi vain yksi syövän tyyppi kun käyttämällä algoritmia Schema 3, 22 ja 21, jos käytimme Schema 1 ja 2, vastaavasti. Odotimme monipuolisempi joukko olennaisia ​​geenejä kullekin syöpätyypin.

Jotkut edellinen tutkimuksissa kartoitettiin olennaisuuden käsite olosuhteet ovat hyvin erilaiset kasvualusta olosuhteissa [38] joidenkin bakteerien metabolisen verkoissa. He päättelivät, että on olemassa joukko keskeisiä reaktioita tarvittavan biomassan tuotantoon riippumatta valitusta kasvualustan. Tutkimuksemme johtaa hyvin samanlaisia ​​oivalluksia tapauksessa verkon kontekstualisoinnin. Sama johtopäätös saavutettiin eri parametrien asetukset ja skenaarioita, mukaan lukien käyttö Recon1 ja yleisen kasvualustaa (katso taulukko B S1 teksti).

Vertailu korkean suoritustehon geenien kokeita

järjestelmällinen pyrkimys tunnistaa olennaisia ​​geenejä eri syöpäsolutyyppien parhaillaan toteutetaan niin sanotun hanke Achilles [23]. Kattavuus Tämän projektin on kasvanut viime vuosina [23,39,40].

Vastaa