PLoS ONE: Gene Set Based Integrated Data Analysis paljastaa Fenotyyppiset Erot on aivosyöpä Malli

tiivistelmä

Keskeinen haaste tietojen analysoinnin biologisten suurikapasiteettisten kokeissa on käsitellä usein pieni määrä näytteitä kokeissa verrattuna määrä biomolekyylien, jotka samanaikaisesti mitataan. Yhdistäminen kokeelliset tiedot käyttämällä riippumatonta teknologiaa valaisemaan sama biologinen trendejä sekä täydentävät toisiaan suurempi näkökulmasta, on yksi luonnollinen tapa tähän haasteeseen. Tässä työssä selvitettiin jos integroimalla proteomiikka ja transkriptomiikka dataa aivosyövän eläinmallissa käyttäen geeniperimä analyysi menetelmää, voisi lisätä biologista tietojen tulkintaa suhteessa perinteisempiin analyysi kahdesta aineistot yksittäin. Aivot syöpä mallia perustuu sarja siirrostamalla siirrettyjen ihmisen aivokasvain materiaali (glioblastooma – GBM) useiden sukupolvien rotilla. Nämä sarjanumerot transplantations johtavat ajan mittaan Genotyyppistä ja fenotyyppisiä muutoksia kasvaimia ja edustaa lääketieteellisesti relevantti malli harvinainen saatavien näytteiden ja joissa seurauksena analyysin yksittäisistä aineistojen ovat osoittaneet suhteellisen vähän merkittäviä havaintoja omasta. Huomasimme, että analysointia sekä toimivat paremmin kannalta merkitystä mitta havainnoistaan ​​verrattuna yksittäisiin analyyseihin sekä riippumattoman tarkastuksen yksittäinen tulos. Siten paremman yhteydessä yleisen biologisen tietojen tulkintaa voidaan saavuttaa.

Citation: Petersen K, Rajcevic U, Abdul Rahim SA, Jonassen I, Kalland K-H, Jimenez CR, et ai. (2013) Gene Set Based Integrated Data Analysis paljastaa Fenotyyppiset Erot on aivosyöpä Model. PLoS ONE 8 (7): e68288. doi: 10,1371 /journal.pone.0068288

Editor: Ying Xu, University of Georgia, Yhdysvallat

vastaanotettu: 28 helmikuu 2013; Hyväksytty: 28 toukokuu 2013; Julkaistu: 09 heinäkuu 2013

Copyright: © 2013 Petersen et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Norja Cancer seura, Norja Research Council, Innovestin AS, Helse-Vest, Haukeland University Hospital, Bergen Translational tutkimusohjelma, keskuksen Recherche de Public Sante Luxemburg, Euroopan komissio 6. puiteohjelman Sopimus 504743 ja Functional Genomics (FUGE) ohjelma Norjassa rahoittaa kansallisen bioinformatiikan alustalla. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Hyvä vauhti teknologian kehittämiseen arvioimiseksi tietoja useista näkökulmista noin geenien, proteiinien ja metaboliittien, on johtanut yhä odottaa paljon mahdollisuuksia uusia löytöjä ymmärrystä solujen molekyylitason toimintaa. Annostarkkailu teknologiat on markkinoitu paljastaa kokonaisvaltaisen kuvan syömällä tietoa useimmat yritykset tyyppiä, kuten esimerkiksi kaikille puhtaaksi geenit koodattu genomissa tai useita proteiineja läsnä valmistettu näyte. On selvää, luonnollinen jatke on yhdistelmä useita erilaisia ​​tietoja paljastaa lisätietoja biologisista prosesseista molekyylitasolla. Saamaan tämän odotetaan olevan potentiaalia löytöjä, useita perustavaa laatua olevia haasteita on edessä. Suurikapasiteettisten aineistot ovat luonteeltaan suuri epätasapainossa määrä näytteitä ja useita muuttujia mitataan, mikä haasteita tulkintaa ja luottamusta arvioihin analyysin tuloksia. Ja tulkinta useita aineistoja arvioitaessa näytteitä eri näkökulmista yhdistettynä edellyttää uutta teoreettinen malli, joka voidaan arvioida biologisen kysymyksiin ja merkityksestä ennusti vastauksia. Onnistunut integroitu malli olisi arvioitava tulevien biologisten kysymyksiä suurempi luottamus ennustaa vastauksia verrattuna menetelmiin yksittäisten aineisto tyyppejä, vaikka monimutkaistuminen mallin. Tässä työssä esittelemme yhdistetyn analyysin lähestymistapa tulkinnassa suurikapasiteettisten microarray ja proteomiikan aineistoja kahdella eri kasvaimen fenotyyppejä on saatu sarja transplantations ihmisen GBM CNS rottien [1], [2].

GBM edustaa heterogeeninen pahanlaatuisen aivokasvaimen [3], ja se on yksi kohtalokas muotoja syöpiä ihmisissä. Keskimääräinen elinaika sairaiden potilaiden on vain parantunut keskimäärin 12 kuukaudesta 14,5 kuukautta diagnoosin jälkeen viimeisten 5 vuoden aikana, koska parannuksia hoidon taso [4]. Käsitellä monimutkainen asia molekyylitasolla taustalla ihmisen GBM, ihmisen GBM kehitettiin immuunivajaissa rotilla [1], [2], [5], joka osittain erotetaan toisistaan ​​ammatillisiin kaksi suurta ilmiasun ja maamerkkejä tämän kasvain,

eli

invaasio ja angiogeneesi. Nämä kaksi ominaisuuksiltaan GBM vaikea hoitaa mukaan käytettävissä olevat hoidot. Malli perustuu sarja ksenotransplantaatio ihmisen GBM pallosia aivoihin immuunivajausta rotilla, missä he aloittaa kasvua ensisijainen GBM. Fenotyyppi ensimmäisen sukupolven kasvain esittää voimakkaasti invasiivisia luonteeltaan rotan aivoissa taas järjestysnumeroa johtamisella eläimet, kasvain kehittyy nopeammin kasvava angiogeenisten kasvain, jossa runsas verisuoniston, ja vähemmän hyökkäystä. Malli ja aivokudoksen fenotyypit on esitetty kuviossa 1.

Kaavamainen esitys kasvain malli ja fenotyyppien saatu transplantaation jälkeen nude rotilla. Ensimmäinen siirrettäväksi nude rotilla usein johtanut invasiivisen fenotyypin, kun taas sarja kasvainten siirrosta johti angiogeeninen fenotyyppi jälkeen useita sukupolvia.

Kuten jo mainittiin, tietojen analysointia ja biologinen tulkinta suuren suoritustehon teknologian luotu tietokokonaisuuksien klo mittakaavassa genomien ja proteiinien on yleensä haaste, koska suuri epätasapaino näytteiden määrä ja molekyylien lukumäärä testataan. Tunnistaa tilastollinen merkittävä muutos ilmentymistason yhden geenin tasolla muutos, joka on kiinnostava biologinen tulkinnan, monet riippumattomat rinnakkaisnäytteiden tarvitaan kokeen. Monimutkainen luonne GBM ksenotransplantaatio sarjareittien rottamallissa, ja luonnollisesti rajallinen saatavuus kasvain materiaalin luovuttajia ovat johtaneet vähäisempiä Hyväksytty näyte pareittain invasiivisen ja angiogeeninen fenotyyppi seuloo mikrosiruja ja proteomiikka. Lisäksi korkean tason yksittäisiä varianssi näytteiden välillä odotetaan ja on havaittu käsiteltäessä transkriptomiikka datasarjan aiemman työn [1], [6]. Molekulaarinen tausta fenotyypin kytkentä on osoitettu tasoilla differentiaalisen ekspression RNA [1] ja proteiinien [7] – [9], jossa laaja validointi, mukaan lukien suuri määrä GBM potilaiden ja toiminta-analyysejä johtanut uusien ehdokas biomarkkerit tietyn fenotyyppi [7] – [9]. Haasteena on kuitenkin edelleen paikantaa erityisesti molekyyli- reittejä heijastuu rikastuminen tietty geeni asetetaan, mikä johtaa parempaan biologiseen ymmärtämään taustalla oleva sairaus.

Kaksi yleistä strategioita torjumaan punnita dimensio haasteet suuren suoritustehon data analyysi ovat (i) analysoimaan sarjaa

a priori

määritelty biologisesti sukua olevien molekyylien aikaan sijaan yksittäisten molekyylien ja (ii) integroida tulokset useiden riippumattomien analysoi mahdollisesti eri korkean suoritustehon kokeissa, sekä löytää todisteita samat biologiset trendejä ja täydentämään toisiaan rikkaampi tulkinta. Yhteinen analyysi Gene ontologia termejä yliedustettuna lista differentiaalisesti ilmentyvien geenien verrattuna kaikkia tietoja ei varhainen esimerkki strategian (i), kun taas Gene Set Väkevöiminen Analysis – GSEA [10], ja suuri määrä variantteja rikastamiseen perustuvilla menetelmillä [11], [12] edustaa myöhemmin kehityksestä. Useita menetelmiä meta-analyysi itsenäisen kokeen samalla näytteistä olemassa, yksinkertaisista Rank Tuotelainsäädännön Yhdistämällä yksittäisten lista tulosta [13] monimutkaisempia usean variate analyysin menetelmiä tunnistaa samanlaisia ​​suuntauksia poikki aineistoja kuten Co-Inertia analyysi (CIA) [14], [15]. Multi-variate analyysimenetelmät vaativat vähimmäismäärä näytteitä on aineisto, ja CIA vaatii täsmälleen samat näytteet olla läsnä kaikkialla aineistoja, usein tehden niistä sopimattomia käytännössä kuten meidän GBM tapauksessa. Subramanian et al osoittivat joustavuutta GSEA välineenä yhteistyön analysointiin useiden riippumattomien micorarray kokeita biologisesti liittyvistä näytteistä. Täällä laajentaa tätä linjaa ajatellaan ylittämään esteen eri suurikapasiteettisten tekniikoiden.

Tässä työssä soveltanut Gene Set analyysi lähestymistapa yhteistyöhön tulkita kaksi aineistot yhteydessä toisiinsa. Merkinnästä tunnistettujen geenien ja proteiinien tulkitaan suhteessa invasiivisia ja angiogeeninen fenotyyppi, ja verrataan säännöllisesti Gene ontologia analyysitulokset yksittäisten aineistot. Tämä lähestymistapa korostaa, kuinka ne tukevat ja vahvistavat toisiaan yhdistettyä tulkinnassa, samoin kuin täydentävät toisiaan paremmin yksityiskohtaisen kuvan fenotyyppiset erot aivosyövän mallin invasiivisia ja angiogeenisen vaiheissa. Tulokset ovat osoitus suuresta tilastollista tukea välillä proteomiikan ja mikrosirujen tuloksia, mikä myös näkyy biologisen tietojen tulkintaa kautta korkean yhteensopivuutta yksittäisten analyysitulokset. Edelleen osoittaa pätevyyden ehdotettua lähestymistapaa, tulokset ovat vastakkain Rank Tuotteen meta-analyysi samat kaksi aineistot. Olemme myös menetelmää soveltaen aiempaan julkaistu riippumaton parin microarray ja proteomiikan aineistoja, onnistuneesti löytämässä keskeiset tulokset alkuperäisen julkaisun.

Materiaalit ja menetelmät

Experiment Suunnittelu

viisi paria vastaavan invasiivisen ja angiogeenisen näytteitä ksenograftimalleja, peräisin viideltä yksittäisten potilaiden, käytettiin yhteensä vuonna microarray ja proteomiikan kokeiluja. Neljä näytettä paria valmisteltiin mikrosiruanalyysi ja hybridisoitiin kahdeksan Applied Biosystems Human Genome Survey mikrosirut v.2.0 (Array Express liittymistä A-MEXP-503) yhdessä hybridisaatio aikavälillä, kuten on kuvattu [6]. Kaksi näytettä paria valmisteltiin proteomiikka- analyysiä ja käsitellä kolme iTRAQ kokeissa kuvatulla tavalla [9]. Yksi näyte pari päällekkäin välillä kaksi teknologiaa.

Esikäsittely ja normalisointi

microarray data tuotiin tietojen analysointi sarja J-Express 2012 [16] (http: //jexpress.bioinfo. ei), esikäsittely ja normalisointi. Raaka signaali intensiteetit poimittiin, valvonta suodatetaan pois, ja data kvantiili normalisoitu [17]. Lisäksi tiedot on log2 transformoitiin ja kukin näyte pari on yhdistetty yhdeksi log-suhde sarakkeessa. Proteomiikka Aineisto esikäsiteltyä raakadatasta määrällisesti peptidejä kuvatun [9], kuten merkintä on alkuperä peptidin joko isäntäsolut, kasvainsolujen tai alkuperältään tuntematonta, joka perustuu sekvenssihomologia rotan ja ihmisen tietokantoja. Tässä työssä käytämme koko proteomiikka aineisto on 3359 proteiiniprofiileja.

Differential Expression Tilastot

Rank Product (HE) tilastotiedot [13] käytettiin sekä varten transkriptomiikka ja proteomiikan tietojen televisiosta sijoitus geenejä ja proteiineja mukaan differentiaalikaavojen välillä invasiivisia ja angiogeenisen näytteitä. RP käytettiin myös alennetuista aineistot, jotka sisältävät vain ainutlaatuisen kartoitus selostukset ja proteiineja käytetään integroidussa analyysin tietojen kaksi teknologiaa. RP toteutettiin J-Express 2012 analyysi Suite.

Gene ontologia yliedustus Analysis

J-Express käyttää Fischerin eksakti testi arvioida tilastollisia yliedustus geenien selityksin tietyllä Gene ontologia (GO) termi (www.geneontology.org, [18]) pienemmässä luettelon kohteisiin verrattuna viitetiedot asetettu. Tässä työssä verrattiin huippulistoja RP differentiaalikaavojen analyysi tietyllä merkitsevyystasolla (q-arvo) vasten koko aineisto RP-analyysi suoritettiin. Listed p-arvot GO termejä tuloksen taulukossa ovat nimellisiä,

so.

Ei korjattu useita testejä, ja olisi arvioitava tätä silmällä pitäen. Gene ontologia OBO tiedostoa käytetään oli päivätty 2010 3 joulukuu, suodatetaan Homo sapiens Gene ontologia kartoitusta tiedosto, oli päivätty 2011 29 marraskuu. Vain GO termejä läsnä OBO tiedostoon sisältyvät analyysiin.

Gene Set rikastus Analysis

Vaihtoehtona GO yliedustettuina analyysi, Gene Set Enrichment Analysis (GSEA) [10] käytettiin myös arvioida ja listalla GO termejä merkitsemiseksi kaksi aineistot. Toisin kuin yliedustus analyysi, GSEA ja niihin liittyvät lähestymistavat eivät toimi kiinteällä rajoitettu listan kiinnostaa arvioida. Sen sijaan he arvioivat jakelua geenien selityksin tietyn GO termi poikki vertailutietojen asetettu. Vuonna GSEA jakaumaa käytetään määrittämään luonnollisen osajoukko selityksin geenien kutsutaan etureunan (LE), joka edistää pisteet geenin joukon (GO termi tässä tapauksessa), ja että voidaan seurata lähempää biologinen tulkinta . Analyysit tehtiin kanssa GSEA täytäntöönpanoa J-Express 2012. Koska Rank Tuote muuttuja on luonnostaan ​​ristiriidassa maksukyvyttömyyden painotettu pisteytys järjestelmän GSEA, me valinneet log-kertainen pisteytys metrinen arvioimiseksi geeni-sarjat meidän pariksi näytteistä. Tämä on kaikkein verrattavissa metrinen sille, jota Rank Product menetelmä kun lajittelu logratios parilliset näytteet ennen niiden yhdistämistä Rank tuote. Muut parametrejä käytettiin oletusasetuksilla: permutaatio menetelmää: geenit, min jäsenmäärä: 10, max jäsenmäärä: 500

Trend kuvaukset Perustuu Gene ontologia

Jokainen aineisto analysoitiin itsenäisesti Sijoitus Product, GO yliedustus analyysi ja GSEA. Samaa menettelyä kantaesitettiin keskittyen säätelyyn ylöspäin invasiivisia näytteissä yli angiogeenisten näytteitä, sitten keskittyen säätelyyn ylöspäin angiogeenisten näytteissä yli invasiivisia näytettä. GO Ehdot ja geeni merkinnät alkuun luetteloiden manuaalisesti seulottiin termejä toiminnallisesti liittyvät angiogeneesiin ja hyökkäyksen, ja top-listalla suuntauksia tiivistää tästä.

kartoitus Transcript ja Protein Tunnisteet välillä Tietoaineistot

ihmisen Entrez Gene tunnus kohdennettujen geenien ABI mikrosirulla käytettiin yhteisen tunnuksen välillä transkriptomiikka ja proteomiikan aineistoja. Käyttämällä online-ID-muunnin palvelua BioMart Central Portal (https://central.biomart.org), tunnistetut proteiini SwissProt tunnuksia päässä proteomiikan aineisto ensin kartoitettu niitä vastaavien ihmisen tai rotan Entrez Gene tunnukset. Rotan Entrez Gene tunnukset proteiineja tunnistettiin isännän alkuperää, oli edelleen kartoitettu ihmisen Entrez Gene tunnukset niiden homologiset geenit käyttämällä BioMart n geeniä haku palvelu, jossa Ensembl transkripti tunnukset kuin yhdistää tunniste.

Suoritettuaan kartoitus, oli sitten mahdollista analysoida selostukset vastaava alkuun ilmentyvät eri proteiinien geeni asetettu transkriptomiikka datan, kuten on esitetty kuviossa 2B. Sininen vaakapalkeilla edustavat proteiinin vastaava selostukset ja miten ne jakavat vuonna microarray data. Sama analyysi tehdään käänteisesti varten transkriptio vastaavien proteiinien proteomiikan tietojen.

V: aineistot analysoitiin ero ilmentymisen itsenäisesti käyttäen Rank tuote, Gene ontologia yliedustus (GO ORA) ja GSEA. Menetelmät arvioida erilaisia ​​jakeet aineistoja biologisesti merkityksellisiä lajiteltu ero ilmaisun, kuten on esitetty, että transkriptomiikka datajoukon (TR). RP ja GO ORA meidän tapauksessamme ainoastaan ​​tunnistettu alkuun ~ 1% koko lajitellun geeni lista merkityksellisinä, molemmat varten transkriptomiikka ja proteomiikka-analyysi. GSEA toisaalta tunnistaa Leading Edge (LE) osajoukkoja ulottuu -20% koko geenin luettelosta. B: GSEA perustuva toimintamalli osittain päällekkäisiä proteomiikka ja transkriptomiikka aineistoja. Top ilmentyvät eri yksiköt yhdestä aineisto on sijoitettava vastaaviin yksiköt muista aineisto ja arvioidaan geenin asetettu GSEA. PR: Proteomiikka aineisto, TR: transkriptomiikka aineisto.

Julkinen saatavuus Data

microarray tiedot ovat selityksin mukaan MIAME [19] ja laskeutuvat ArrayExpress (http: //www.ebi.ac.uk/arrayexpress), liittyminen ei E-MTAB-1185. Normalisoitu data matriisin määrällisten proteomiikan tieto on saatavilla File S2.

Rank Product Meta-analyysi

sovitus osajoukkoja proteiinien ja transkriptit microarray ja proteomiikan aineistot ensin tunnistettu. Sitten he rankattiin erikseen mukaan differentiaalikaavojen välillä invasiivisia ja angiogeenisen näytteitä käyttäen Rank Tuote (HE) tilastotiedot [13]. Tuloksena riveissä sitten käyttää tulo RP toisessa meta-analyysissä vaiheessa tunnistaa proteiini-transkripti paria korkealle rankattu molemmissa tarkkoja analyysejä.

Independent Microarray ja Proteomiikka Dataset Validation Analysis

CIA lähestymistapa [15] keskustelivat menetelmän suorituskykyä julkaistuista mixorarray ja proteomiikka tiedot käytettävissä elinkaaren

Plasmodium falciparum,

malaria parazyte [20]. Käytimme samaa julkaistut aineistoja, saatavana taulukot S1 ja S2 File S1 niiden julkaisemisesta, ja log2 muuttaneet lineaarinen lauseke arvot sekä aineistoja ennen kuin jatkat GSEA analyysiin. Aineistot sisältävät 4 peräkkäistä suvuton lifestages: Merotsoiittien, rengas, trofotsoiittivaihe ja schizout. Teimme karkea määritelmä ilmaistaan ​​transkriptien on elämänvaihe, koska selostukset jonka pienin ilmaus arvo on 1000, saadaan geeni setit kokoluokassa 97-203, ja proteiinien, vähintään ilmaus arvo on 50, saadaan geeni setit kokoalue 10-77 (geenin sarjat on lueteltu File S3). Otteen perustuva geeni sarjaa analysoitiin rikastamiseen kaikki 4 elämän vaiheissa proteomiikan tietoja käyttämällä GSEA in J-Express (single luokka, painotettu logfold pisteytys), ja proteiini perustuu geenin asettaa samalla tavalla microarray data.

tulokset

analyysituloksista yksittäiset tietojoukoiksi

Taulukko 1 tiivistelmät tulokset yksittäisten analyysin valaisemaan suuntauksia, jotka löytyvät aivoissa syöpä malli proteomiikka ja transkriptomiikka tietokokonaisuuksien yksitellen perinteisin analyysimenetelmiä yhdessä Gene ontologia (www.geneontology.org, [18]). Kuvio 2A havainnollistaa osuudet koko geenin luetteloita eri menetelmien raportoida havainnoista.

Vaikka on olemassa useita GO termejä /kehityssuunnat päällekkäisyyttä yksittäisten proteomiikan ja transkriptomiikka tuloksia, ne näyttävät olevan korostamalla joitakin yleisiä ehtoja angiogeenisten kasvaimia. Sillä invasiivisia fenotyyppi on enemmän johdonmukaisuutta GO kannalta päällekkäisyyksiä proteomiikka ja mikrosirujen tulokset ja korosti konsensusta trendejä taulukon 1, kuin angiogeenisen tyyppiä.

Gene Set Based Integrated Data Analysis Approach

Suosittelemme uusi integroitu analyysi lähestymistapaa yhteistyössä tietojen analysointi, joissa on vain osittainen joukko vastaavien yksiköiden. Kartoittamalla selostukset vastaavaan proteiinit (katso M M) voidaan arvioida, miten alkuun ilmentyvät eri selostukset jakaa joukoksi proteiinien proteomiikan tietojen ja kuinka alkuun ilmentyvät eri proteiineja jakaa joukoksi transkriptien microarray data. Katso kuva 2B. Ensin tunnistaa alkuun asti säädelty proteiinit käyttäen RP on joukko kartoitettu proteiinien tietyllä merkitys tasolla sekä yläreguloituja invasiivisia (I) ja angiogeeninen (A), ja näytön vastaava sarjaa selostukset käyttävät GSEA täydessä microarray data sarja. Samoin tunnistamme alkuun asti säädelty transkriptien käyttäen RP on joukko kartoitettu transkriptien tietyllä merkittävyystasolla sekä invasiivisia ja angiogeenisen näytteitä, ja näytön vastaava sarjaa proteiineja käyttäen GSEA täydessä proteomiikan datajoukon.

Microarray RP tulokset tukevat proteomiikka tiedot invasiivisia näytteissä.

Kuten nähdään kuviossa 3A, vasen paneeli, on merkittävä rikastumista proteomiikan tietojen proteiinien vastaava ilmentyvät eri transkriptien up-säännellään microarray data. Virikkeellistämisstrategioita in invasiivisia näytteistä on yhdenmukainen säätely ylöspäin transkriptien invasiivisia näytteet microarray data. Oikea paneeli näyttää vertailun, että ei ole olemassa merkittävää suuntausta proteiineja vastaavat selostukset säädellään ylöspäin angiogeenisen näytteissä.

V: vasen – transkriptio vastaavat proteiinit rikastettu invasiivisia näytteitä, oikealla – transkriptio vastaava proteiinit rikastettu angiogeenisten näytteissä. B: vasen – proteiini, joka vastaa selostukset rikastunut invasiivisia näytteitä, oikealla – proteiini vastaavat proteiinit rikastettu angiogeenisten näytteissä.

etureunan koostuu 47 transkriptio /proteiini-yhdistelmä tästä geenistä sarja on esitetty taulukossa 2 ja edustaa lähtökohta biologisen tulkinta tästä integroidun yhteistyön analyysi.

Proteomiikka RP tulokset tukevat microarray tiedot angiogeenisten näytteissä.

Kuva 3B, oikea paneeli, näyttää merkittävän rikastumista microarray data transkriptien vastaa ekspressoitua eri proteiineja proteomiikan tietojen. Virikkeellistämisstrategioita angiogeenisissä näytteistä on yhdenmukainen ylössäätöä proteiinien angiogeenisten näytteet proteomiikan tietojen. Vasemmassa paneelissa näkyy Vertailun ettei merkittävää suuntaus transkriptien vastaavat proteiineja säädellään ylöspäin invasiivisessa näytteissä.

etureunan koostuu 43 transkriptien tukena proteiini data, on lueteltu taulukossa 3, ja tavallinen tarkastus lista paljastaa monia geenejä aikaisemmin todettu liittyvän angiogeneesiä.

vertailu Standard Method ja Independent Data Validation

suoraviivainen meta-analyysi aivosyövän malli microarray ja proteomiikka aineistot eivät paljastaneet merkittävää vastaavaa transkriptio ja proteiini parissa on ilmennetty eri välillä invasiivisia ja angiogeenisen näytteitä. (Invasiivinen vs angiogeenisten top 20 paria,

q

= 83,9%, angiogeenisen vs invasiivisia top 20 paria,

q

= 78,1%, katso File S4).

GSEA tulokset arvioidaan ylhäältä ilmaissut proteiinit elinkaaren eri vaiheissa

Plasmodium falciparum

vastaan ​​transkriptomiikka aineistot samasta elinkaaren vaiheet kerätään ja esitetään File S3. Samoin ovat tulokset alkuun ilmaisi selostukset analysoi vastaan ​​proteomiikka aineistoja eri vaiheiden. Nämä verrata tuloksia taulukossa 2 alkuperäisen teoksen [20].

Keskustelu

Gene-set perustuvat menetelmät usein väistää enemmän kuin pelkkä geeni-by-geeni differentiaalikaavojen analyysi, ja ovat saaneet joitakin painopiste viime vuosina. Toinen vaihtoehto vahvistaa tilastollista sisällä kokeilu; sanoa microarray kokeilu, kautta lisäämällä näytettä (toistoa) varten tilastollinen testi laskea päässä, on yhdistää tuloksia useiden riippumattomien kokeiden että yhdessä näyttää suuntaus merkittäviksi. Joskus tämä kutsutaan meta-analyysin mukaan tasolla vedenotto alkuperäiset tiedot, ja joskus yhtenäinen lähestymistapa. Yhteisiä sekä on välttämätöntä kartoittaa yksiköt eri aineistoja toisiinsa ja käyttää sopivaa tilastollinen testi arvioida yhdistetyn mallin. Kuten on osoitettu, että aivosyövän malli aineistoja, säännöllinen Rank Tuotteen meta-analyysi ei tässä tapauksessa tunnistaa merkittävän tuen välillä aineistoja, ja vaihtoehtoisia tapoja liittyvien aineistojen yhtenäisen lähestymistavan on vaatinut.

taulukosta 1 nähdään, eri perinteisen analyysin lähestymistapoja on vaikeuksia löytää todella tilastollisesti merkittäviä tuloksia omasta. Suuntaukset löydetty ovat mielekkäitä kannalta yleisen ero invasiivisia ja angiogeeninen fenotyyppi, mutta eivät ole kovin erityinen eikä liittyy vakuuttavia luottamustasojen.

tulosten perusteella käsin analyysien (uudelleen taulukossa 1) me voi päätellä, että invasiivisia tyyppi kokeellisia kasvaimia liittyy Gene ontologia termejä osoittaa sarjaa geenien keskushermoston kehitystä, se prosesseja ja sääntelyä, arvioituna GO yliedustus analyysi transkriptomiikka tiedot ja jonka GSEA lähestymistapa sekä proteomiikka ja transkriptomiikka tiedot. Tämä on yhteisymmärryksessä fenotyyppiset ulkonäkö ja käyttäytyminen invasiivisia kasvaimia, jotka muistuttavat enemmän kehittymätön kantasolujen kaltaisia ​​solu, joka pystyy tunkeutumaan ympäröivien rakenteiden, aivan kuten hermo kantasoluja tehdä kehittyville aivoille. Angiogeenisen fenotyyppi kuitenkin liittyy liittyvistä geeneistä angiogeneesiin arvioimana RP-analyysi, GO yliedustettuina analyysi proteomiikan sekä GSEA vuonna transkriptomiikka johon sisältyi myös edustus ehdot liittyvät solusyklin, kasvua ja lisääntymistä.

toisin analyysit yksittäisten aineistojen, integroidun analyysi osoittaa kaksi tärkeää tilastollisesti merkittäviä suuntauksia: 1) säädelty transkriptien invasiivisia fenotyyppi arvioitiin yhdessä löydetään joukko proteiineja merkittävästi säädelty yhdessä invasiivisia fenotyyppi, 2) säädelty proteiinien angiogeeninen fenotyyppi arvioitiin yhdessä löydetään joukko transkriptien merkitsevästi säädelty yhdessä angiogeeninen fenotyyppi. Kuten kuviossa 3 on esitetty, etureuna nämä sarjat ovat kattavat noin 20% täydestä tausta luettelon. Siksi meidän co-analyysi lähestymistapa tunnistaa merkittävät geenin sarjaa samalla taustalla geeni luettelee kaikki yksittäiset analyysit taulukossa 1 arvioinnissa.

Vahva johdonmukaisuus integroidun analyysitulokset esitetään taulukossa 2 ja heikomman yksilön analyysitulokset Taulukko 1 on vahvistettu tavallinen tarkastus proteiinin nimien taulukossa 2 ja ylivoima hermosolujen kehitystä ja toimintaa koskevat kuvaukset. Lisäksi olemme listanneet tärkeimmät Gene ontologia ehdot 47 proteiinit taulukon 2 selvennettävä, ja nämä ovat selvästi vastaavia soveltamisalan todetuissa yksittäisten analyysien (erityisesti taulukossa S9 Tiedosto S1). Siinä tapauksessa, että invasiivisen fenotyypin tämän kokeellisen GBM mallin kasvainsolu (ihmisen) tunkeutumisen isännän (rotta) aivokudos on niin laaja, että se on käytännössä mahdotonta eristää tai kirurgisesti poistaa puhtaan kasvain kirurgisesti, mikä on myös yksi tärkeimmistä kysymyksistä huono menestys leikkaushoitoa yksin ihmisen GBM. Siksi kasvain kudosnäytteitä tämän fenotyypin ovat ”saastunut” suurelta osin isäntä (rotta) aivokudosta. Proteiinit tunnistetaan integroidun analyysin ilmentyvät eri sarjana, upregulated että invasiivisia fenotyypin sekä tulokset GSEA proteomiikka (taulukko S9 Tiedosto S1) ja manuaalinen rajat vertailut käyttäen kekseliäisyyttä Pathway Analysis and Human Protein Atlas vahvisti tämä tilanne tasolla proteiineja. Lähes puolet (17 36 proteiineja – taulukko 2) ovat itse asiassa proteiineja, jotka liittyvät aivojen solun lokalisaatio (solukomponenttiin) ja ovat joko hermo (Synapse, hermolihasliitoksissa, postsynaptisiin tiheys, synapsirakkulan, Presynaptisen vesikkelikalvoon, Presynaptisen aktiivinen alue , Hermosolujen runko jne.) tai glial alkuperä (myeliinituppea, Compact myeliinin jne) ja enimmäkseen isäntä proteiineja tai jakamalla proteiinisekvenssihomologiaan isännän.

lisäksi sekä GO yliedustus analyysi (taulukko S7 File S1) ja GSEA (taulukko S11 File S1) transkriptomiikka tietojen voimakkaasti hallitsevat aivojen liittyviä termejä osoittaa isäntä alkuperän sijasta syöpäsoluja.

taulukossa 3 luetellaan sääteli joukko transkriptien angiogeeninen näytteet, jotka tukevat proteomiikka tiedot, kaikkein hallitseva suuntaus päällekkäin yksittäisten analyysitulokset ovat kehitysprosessiin ja verisuonten muodostumista. Erityisesti läsnä betonin aikavälin angiogeneesi merkitsemiseksi kolme geeniä (vav3, anxa2 ja anxa2p2) taulukossa 3 on erittäin mielenkiintoinen. Tämä on ensimmäinen kerta, kun mukaan molekyylitasolla määrityksiä pystyivät osoittamaan termi kuvastaa

de facto

angiogeneesiä myöhään sukupolven kasvaimissa (kuvio 1), se on yksi tärkeimmistä ilmiasun myöhään sukupolven gliooma eläin mallia sekä yksi tunnusmerkeistä korkealuokkaisesta gliooma potilaan. Lisäksi ilmaus anxa2 perusteellisesti validoitu tasolla immunohistokemia ylimääräisiä kudosnäytteistä GBM ksenograftimalleja sekä suuri joukko yli 200 kliinistä gliooma näytteitä eri laatujen muodossa kudoksen microarray esitetyn edellisessä tutkimuksessa . Todellakin me vahvisti vahvan säätely ylöspäin Anxa2 angiogeenisissä ksenografteissa verrattuna invasiivisia niitä, samoin kuin merkittävä kasvu Anxa2 ilmaisun korkealaatuisesta glioomissa (luokka III ja IV) verrattuna alemman (laatu I ja II) [9] .

yliedustus kalvon paikallinen proteiineja (solukalvon, ER, GA ja joissakin tapauksissa Mt) nähdään taulukossa 3, voidaan selittää kokeellinen asennusohjelma proteomiikka kokeilun joka sisälsi rikastusvaiheen kalvoon proteiineja. Siksi analysointia myös on painottumista selostukset kanssa geenituotteiden näissä soluosastoihin. Tämä voi myös selittää sen, että emme näe tukea allekirjoitusta solusyklin, kasvua ja lisääntymistä, joka nähtiin merkittävä suuntaus yksittäisten analyysien (taulukko S12 File S1 erityisesti). Lähemmin tarkasteltuna matkapuhelinverkon lokalisoinnin taustalla selostukset suuntaus taulukossa S12 File S1, suurin osa näistä oli selityksin kuin tumassa, ja vastaavat proteiinit siten vähemmän todennäköistä noutaa kalvoon kohdistettu jaetta proteomiikka kokeilun.

Yksittäiset analyysit osoittavat kohti soluadheesiota suhteen (taulukko S11 File S1) tukevat integroitu lähestymistapa (taulukko 3, MSN) ja ovat mukaisia ​​invasiivisen fenotyypin jossa soluadheesiota näyttää voi olla

Vastaa