PLoS ONE: priorisointi of Cancer Marker Ehdokkaiden Perustuen immunohistokemia Värjäys Kuvat talletetaan Human Protein Atlas

tiivistelmä

Syöpä merkki löytö on syntymässä aihe korkean suoritustehon kvantitatiivinen proteomiikka. Kuitenkin omiikka teknologiat yleensä tuottaa pitkän listan merkki ehdokkaista joka vaatii työvoimavaltaista suodatus prosessi, jotta seuloa mahdollisesti käyttökelpoisia markkereita. Erityisesti eri muuttujia, kuten taso yli-ilmentymisen merkkiaineen syövän tyyppi kiinnostava, joka liittyy herkkyys ja spesifisyys merkkiaineen joukossa syöpä ryhmät, ovat kriittisiä näkökohtia. Proteiinin ilmentymisen profilointi perusteella immunohistokemian (IHC) värjäys kuvia on alalla yleisesti käytetty suodattaminen menettelyjä. Järjestelmällisesti tutkia proteiinin ilmentymistä eri syövän ja normaalissa kudosten ja solujen tyypeissä Human Protein Atlas on kattavin resurssi, koska se sisältää miljoonia korkean resoluution IHC kuvia asiantuntijoiden laatimiin merkinnät. Helpottaakseen suodatuksen mahdollisten biomarkkereiden hakijoiden suuren mittakaavan omiikka aineistoja, tässä tutkimuksessa olemme ehdottaneet pisteytys lähestymistapa kvantifioimiseksi IHC merkintään pariksi syöpä- /normaaleista kudoksista ja syöpä- /normaali solutyyppejä. Olemme kattavasti laskea tulokset kaikkien 17219 testattujen vasta talletetaan Human Protein Atlas perustuu kertyneet IHC kuvia ja saatu 457110 tulokset kattavat 20 eri syöpiä. Tilastolliset testit osoittavat kykyä ehdotetun pisteytyksen lähestymistapa etusijalle syöpään erityisiä proteiineja. Top 100 potentiaali merkki ehdokasta priorisoitiin varten 20 syöpätyyppeihin kanssa tilastollista merkittävyyttä. Lisäksi malli tutkimus toteutettiin 1482 kalvoproteiinien tunnistaa kvantitatiivisessa vertailussa pariksi syöpä- ja viereisten normaaleissa kudoksissa potilailta, joilla peräsuolen syöpä (CRC). Ehdotettu pisteytys lähestymistapa osoitti onnistuneen priorisointia ja määritti neljä CRC markkereita, mukaan lukien kaksi yleisimmin käytetty, nimittäin CEACAM5 ja CEACAM6. Nämä tulokset osoittavat mahdollisuuksia tämän pisteytys lähestymistavan suhteen syöpämarkkerien keksimiseen ja kehittämiseen. Kaikki lasketut tulokset ovat saatavilla https://bal.ym.edu.tw/hpa/.

Citation: Chiang SC, Han CL, Yu KH, Chen YJ, Wu KP (2013) priorisointi of Cancer Marker Ehdokkaat perusteella immunohistokemia Värjäys kuvat talletetaan Human Protein Atlas. PLoS ONE 8 (11): e81079. doi: 10,1371 /journal.pone.0081079

Editor: Chien-Sheng Chen, National Central University, Taiwan

vastaanotettu: 13 heinäkuu 2013; Hyväksytty: 08 lokakuu 2013; Julkaistu: 26 marraskuu 2013

Copyright: © 2013 Chiang et ai. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Yang-Ming yliopisto, Academia Sinica (Research Project Nanotieteen ja teknologia), ja National Science neuvoston Taiwanin. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Quantitative proteomiikka on käytetty laajalti syöpämarkkerina löytö jonkinasteinen menestys [1] – [7]. Tämän tyyppinen tutkimus yleensä tuottaa valtavasti tietoa, joka täytyy analysoida tarkemmin, jotta voidaan tunnistaa merkki ehdokkaita. Vaikka ei ole olemassa standardia tapa seuloa syövän markkereita massiivisista proteomic aineistot [8], nämä ponnistelut ovat antaneet useita mahdollisia syövän merkkiaineiden [9] – [11]. Vaikka erilaisia ​​lähestymistapoja on kehitetty, kaivos- biomerkkiaineissa suurikapasiteettisten proteomic data tukeutuu kertamuutoksia proteiiniekspressiossa normaalin ja syöpä ryhmät [12]. Hyvä syöpämarkkerina odotetaan olevan erittäin yliekspressoituvan sopiva syövän ryhmä, ja aste yli-ilmentyminen on tehtävä sekä merkittävä ja spesifinen syöpä kiinnostava.

Menetelmä, joka pystyy määrittelemään syöpä spesifisyys proteiinin syöpään kiinnostava on siis välttämätöntä. Luoda tällainen syöpää spesifisyys indeksin, meidän on ilmaisun tietoa erilaisten proteiinien terveillä henkilöillä ja potilailla, joilla on eri syöpätyyppien. Hankkii tällaisia ​​proteomic data on kuitenkin resurssien ja aikaa vievää pienimuotoiseen akateemisten tutkimusryhmien. Onneksi Human Protein Atlas (HPA) on käytettävissä; Tämän kattavasti lämpökuvien useita geenejä ja proteiineja ilmaistuna erilaisten normaalien ja syöpäkudosten [13] – [15]. HPA on vasta-pohjainen tietokanta. Soveltamalla kudos microarray ja immunohistokemia (IHC) värjäystekniikkaa HPA on kattavasti kertynyt miljoonia korkean resoluution kuvia asiantuntijoiden laatimiin merkinnät. IHC värjäys pidetään tehokkaana tekniikka proteomic tutkimuksen [16], [17]. Pohjalta näitä kuvia, erityisesti ne, jotka käyttävät IHC värjäystä, HPA on tosiasiallisesti käytetty useissa tutkimuksissa syövän merkki löytö [18] – [24]. Käytetty lähestymistapa kanssa HPA näissä tutkimuksissa on kuitenkin mukana manuaalinen kyselyitä. Koska merkinnästä IHC kuvien on järjestys- ja merkitään kaltevuus baareja, hankkimalla proteiinin ilmentymisen tasoja HPA on unintuitive ja työvoimavaltaista. Lisäksi tarkasteltaessa kaltevuus baareissa IHC merkinnät, subjektiivinen tulee pelata ja tämä voi tehdä tulkinnan ekspressiotaso tutkijat epäjohdonmukainen eri kuvia. Näin ollen systemaattinen tapa mitata proteiinin ilmentymisen tietoja HPA, mikä mahdollistaisi syövän spesifisyys proteiinien määriteltävä perusteella IHC merkinnät HPA, entistä tärkeämpää.

Tässä tutkimuksessa ehdotimme pisteytys lähestymistapa perustuu merkinnästä IHC kuvia HPA. Pisteytys lähestymistavassa otetaan huomioon proteiinin ekspressiotasot normaaleissa /syöpä kudoksia ja merkityksestä /erityisyys tahansa yli-ilmentymisen proteiinin syöpäkudoksessa. Pohjalta ehdotetun pisteytysmenetelmää, me kattavasti etusijalle kaikki testatut vasta-aineet HPA (17219-vasta-aineiden HPA versio 10.0) ja 20 eri syöpiä. Tilastollinen analyysi tuloksista suoritettiin yhden näytteen

t

-testin ja tämä osoitti, että ehdotettu pisteytys lähestymistapa pystyy tunnistamaan proteiineja, joita yli-ilmentynyt syövän kudoksissa, ja paikantaa kun tällainen yli-ilmentyminen on merkittävä ja nimenomaan syövän kiinnostava. Käytimme myös näyte kohortin 1482 proteiineista [25] tehokkuuden arvioimiseksi ehdotetun pisteytyksen lähestymistapa. Pisteytyksen lähestymistapa, yhdistettynä proteiinilaskoksen muutoksia, pystyi tunnistamaan neljä merkki ehdokasta ja peräsuolen syövän näytteestä kohortissa. Neljä valittua merkki hakijoiden CEACAM 5 ja CEACAM6, jotka ovat yleisimmin käytetty markkereita peräsuolen syövän tällä hetkellä; niitä käytetään pääasiassa ennustetekijöiden seurannassa [26]. Kaksi muuta valittu merkki ehdokasta, CAMP ja ANXA4, on myös raportoitu olevan mahdollisia merkkiaineita peräsuolen syöpä [27] – [29]. Arvioinnin tulokset osoittavat potentiaalia ehdotetun pisteytyksen lähestymistapa, kun sitä sovelletaan syöpämarkkerina löytö. Kaikki lasketut tulokset ovat saatavilla kyselyn kautta web-sivuston, ”HPA Scoring” at https://bal.ym.edu.tw/hpa/.

Materiaalit ja menetelmät

IHC kuvia HPA

tässä tutkimuksessa immunohistokemia (IHC) värjäys kuvia HPA versio 10.0 julkaistiin 12. syyskuuta 2012 mennessä (https://www.proteinatlas.org/) käytettiin priorisoimaan geenejä tai proteiineja edustettuina vasta-aineilla. Data merkinnät HPA on indeksoitu käyttävät geeniä nimiä. HPA-versio 10.0, on 14012 geenejä, proteiinin ilmentymisen profiilit, jotka mitataan käyttäen 17219-vasta-aineita 46 normaalin ihmisen kudostyypeissä, 20 syöpäkudoksessa tyyppejä, ja 47 ihmisen solulinjoja. HPA versio 10.0 on kattavasti kertynyt miljoonia korkean resoluution IHC kuvia asiantuntijoiden laatimiin merkinnät, joista 5.108.055 käytettiin tässä tutkimuksessa.

Validation aineisto

kohortti 1482 kalvoproteiinien ilmaistaan pariksi kasvain ja viereisten normaaleissa kudoksissa 28 potilaalla diagnosoitiin peräsuolen syöpä käytettiin meidän validointi aineisto [25] (taulukko S1). Kliiniset tiedot 28 potilasta on esitetty taulukossa S2. Tämä aineisto on alun perin luotu seulomiseksi mahdollisten markkereita paksusuolisyövän.

Mapping syöpä ja normaalit kudokset

Ehdotettu pisteytys lähestymistapa perustuu pääasiassa käyttämällä proteiinin ilmentymisen eroja syövän ja normaaleissa kudoksissa. Sen vuoksi oli tarpeen kartoittaa suhdetta eri syöpien ja niiden pariksi normaaleissa kudoksissa. Nämä kuvaukset, jotka on erotettu HPA, on lueteltu taulukossa 1. syöpätyypin voidaan määritellä useilla eri kuvaukset, jos se on joko yhdistetty useampi kuin yksi solutyyppi normaalista kudoksesta (esimerkiksi kohdunkaulan syöpä on yhdistetty rauhas solu ja squamous epiteelisolujen päässä kohdunkaula, kohdun) tai pariksi useamman kuin yhden normaalin kudoksen tyyppi (esim peräsuolen syöpä on yhdistetty kudosta paksusuolen ja peräsuolen). Eri kartoitukset analysoidaan riippumattomasti lähestymistapamme on sovellettu. Huomaa, että ei ole kartoitus määritelty munasarjasyöpä puutteen vuoksi IHC värjäyksen tuloksia HPA normaalin munasarjan kudoksessa. Lisäksi koska maksasyövän ja kolangiokarsinooma ovat täysin erilaisia ​​syöpiä, niitä pidettiin eri syöpätyyppejä meidän kuvaukset vaikka ne olivat kaikki luokiteltu maksasyöpää HPA. Lopulta, 27 kuvaukset määriteltiin 20 syövän tyypit käytetään HPA. Huomaa, että emme tutkia syövän alatyyppejä, kuten lobulaarinen karsinooma ja kanava karsinooma, jotka ovat rintasyöpiä, koska tällaisissa tapauksissa määrää kudosnäytteitä HPA on melko rajallinen. Meidän lähestymistapamme on vasta-aine-suuntautunut; Kunkin vasta-aineen HPA käytetään arvioimaan enintään 12 potilasta, joilla on tietyn tyyppinen syöpä. Jos me edelleen luokitella vastaaviin 12 IHC kuvaa eri syövän alatyyppeihin, olisi hyvin vaikeaa tehdä mitään johtopäätöksiä tilastollisista merkittävää näyttöä, joka perustuu yksinomaan 10 IHC kuvia. Haluamme korostaa, että tutkimme syöpä alatyyppeihin on erittäin tärkeä näkökohta syöpämarkkerina löytö. Teemme kun pyrimme tähän suuntaan, kun HPA tai toiseen tietokantaan pystyy tarjoamaan riittävän määrän IHC kuvia eri syövän alatyyppejä.

Expression eroja havaitaan vasta-aineella suhteessa kartoitettu syövän ja normaalit kudokset

tietyn kartoitus ja tietylle vasta-aineelle, tavoitteenamme oli määrittää ilmaisun erotus (

ED

) kohdeproteiinin välinen pariksi syövän ja normaalin kudoksen näytteissä. Expression proteiinin pitoisuuteen kudoksissa määräytyvät merkinnät tarjoamia HPA. Jokainen geeni HPA ole lisätty huomautusta; Tämä koostuu geenin ja proteiinin yhteenveto, vasta-aine ja antigeeni tietoa, ja useita erilaisia ​​ilmaisun profiileja. Tässä tutkimuksessa merkinnät

Intensity

ja

Määrä

IHC värjäystä käytetään määrittelemään ilmentymistason proteiinin kudoksissa. Merkintä

Intensity

edustaa tasoa vasta-värjäystä. Merkintä

Määrä

edustaa osa positiivisesti värjäytyneiden solujen. Koska proteiini voidaan tunnistaa useamman kuin yhden vasta-aineen takia useita sitoutumiskohtia, tiettyjen geenien HPA arvioidaan käyttämällä useampaa kuin yhtä vasta-ainetta. Koska vasta-aineita käytetään luomaan HPA eivät ole kaikki samaa laatua, arvioinnin tulosten näistä vasta-aineet voivat olla ristiriidassa. Ongelman ratkaisemiseksi, meidän ehdotettu lähestymistapa on suunniteltu vasta-suuntautunut, jotta voidaan voittaa epäjohdonmukaisuuksia laadun vasta-aineen. Eri vasta tietyn geenin tuotetta pidettävä erillisenä syötetyt tiedot ja käsitellään erikseen.

kohdeproteiiniin, ilmaisunsa kudoksissa on tunnusomaista merkinnät

Intensity

ja

Määrä

. Kaksi merkinnät ensin muuttunut järjestysluku lomakkeen numeromuodossa. Neljä arvot Strong, Kohtalainen, Heikko, ja negatiiviset, joita käytetään kuvaamaan

Intensity

muuttuvat 3, 2, 1, ja 0, tässä järjestyksessä. Transformoidut

Intensity

merkitään

I

. Samoin viidestä arvosta 75%, 75% -25%, 25%, Harvinainen ja negatiiviset, joita käytetään kuvaamaan

Määrä

muuttuvat 75, 50, 25, 5, ja 0 vastaavasti. Transformoidut

Määrä

merkitään

Q

. Perus tekijä määritellään proteiinin ekspressiota kudoksissa lasketaan sitten

I

x

Q

(kuvio 1A).

(A) Aluksi proteiinin ekspressiotasot ja ilmaisu ero (

ED

) välillä syövän kudoksen ja normaalin kudoksen kaikkien vasta-aineiden, jotka kattavat kaikki kuvaukset lasketaan. (B) merkitys kohde

ED

suhteen kartoitus kiinnostavaan määräytyy kumulatiivinen z jakelu. (C) spesifisyys kohde

ED

suhteen kartoitus kiinnostavaan määräytyy toisen kumulatiivisen z jakeluun. (D) päättyy lukemiin vasta suhteessa kartoitus korko määräytyy sen ekspressiotaso syöpäkudoksen ja merkityksen ja spesifisyys sen

ED

.

normaalin solun tyyppi, ei väliä kuinka monta kertaa vasta-ainetta käytetään suorittamaan IHC värjäys, HPA vain raportoi yhdet

Intensity

ja

Määrä

tulokset. Meillä on siis vain yksi pari

I

ja

Q

arvot normaalin solun tyyppi. Ilmaisu proteiinin normaali solutyyppi,

Ein

(ilmentyminen normaali), on näin ollen määritellään seuraavasti: Esimerkiksi, on olemassa vain yksi pari

intensiteetti

ja

määrä

(Kova, 75%), kun vasta-aine HPA034966 käytetään IHC värjäystä rauhasten solujen normaalissa rintakudoksessa, siksi meidän on

Ein

= 2 x 75 = 150. Kaiken arvot

Ein

tulee olemaan välillä 0 225.

toisin kuin normaalin kudoksen, tietyn syövän tyyppi, HPA raportoi pari

intensiteetti

ja

Määrä

joka kerta, kun vasta-ainetta käytetään suorittamaan IHC värjäystä. Näin ollen meillä on yleensä useita pareja

I

ja

Q

arvot tietyn syöpätyypin. Siten proteiinin ekspressiota tietyn syöpätyypin,

eic

(ilmentyminen syöpä), on määritelty keskimääräinen proteiinin ilmentymistä kudoksissa potilailla on diagnosoitu tämä syöpä: jossa

n

on määrä testattujen potilaiden diagnosoitu tämä syöpä. Esimerkiksi vasta-aine HPA034966 käytettiin suorittamaan IHC värjäys 12 potilailla, joilla on rintasyöpä ja sen seurauksena HPA tarjoaa 12 paria

Intensity

ja

Määrä

tulokset; nämä ovat: (Strong, 75%), (Kohtalainen, 75%), (Strong, 75%), (Strong, 75%), (Kohtalainen, 75%), (Kohtalainen , 75%), (Kohtalainen, 75%), (Kohtalainen, 75%), (Kohtalainen, 75%), (Kohtalainen, 75%), (Kohtalainen, 75% ), ja (Kohtalainen, 75%). Meillä on siis

EIC

= (3 x 75 + 2 x 75 + 3 x 75 + 3 x 75 + 2 x 75 + 2 x 75 + 2 x 75 + 2 x 75 + 2 x 75 + 2 x 75 + 2 x 75 + 2 x 75) /12 = 2025/12 = 168,75. Kaiken arvot

eic

on myös välillä 0 225.

Lopuksi ilmaisu ero,

ED

, tietyn vasta-aineen tietyn kartoitus määritellään

ED

=

EIC

Ein

(kuvio 1A).

Vasta tulokset suhteessa kudokseen kartoitus

tietylle vasta-aineen ja tietyn kartoitus, vasta-aineen odotetaan saada korkeat pisteet, jos (1) kohdeproteiinin yliekspressoituu syöpäkudoksessa, ja (2) aste yli-ilmentyminen on merkittävä ja spesifinen kartoitus. Lukemat vasta-aineen mapping siis määritetään seuraavilla vaiheet (kuva 1):

Määritä proteiinin ilmentymisen ja ED kaikkien vasta-aineita. Alkuvaiheessa, ensin määrittää proteiinin ekspressiotasot

euroneuvontakeskus

ja

Ein

kaikkien vasta-aineiden HPA kaikkien kuvaukset. Ilmaisu ero

ED

vasta määritetään käyttämällä

EIC

Ein

(kuvio 1A). Huomaa, että tämä ensimmäinen vaihe voidaan pitää ”järjestelmän alustuksen” ja tehdään vain kerran; laskennallinen

eic

n,

Ein

n, ja

ED

n pysyvän samana pisteytyksen kaikkien vasta-aineita.

Määritä merkitystä kohde ED. Haluaisimme tietää, jos

ED

kohde vasta-aine on merkittävä suhteessa kartoitus kiinnostava.

ED

arvot kaikkien vasta tämän kartoituksen normalisoidaan z-muunnos poistaa välisten kokeilu bias, missä μ

g

ja σ

g

ovat keskiarvo ja keskihajonta kaikkien näiden

ED

: n, vastaavasti.

merkitys

että

ED

kohde vasta kartoitus,

SG

, määritellään kumulatiivinen z jakelu

SG

=

P

(

Z

z

g

(

ED

)) (kuvio 1 B).

SG

voidaan pitää sijoitus kohde vasta-aineen kaikkien vasta suhteen kartoitus kiinnostava. Asetusten arvoa

SG

on alueella 0 1

Määritä spesifisyys kohde ED. Haluamme myös tietää, jos kohde

ED

on erityinen kartoitus kiinnostava.

ED

n kohde vasta-aineen kaikki kuvaukset normalisoidaan z-muunnos poistaa välisten kokeilu bias, missä μ

p

ja σ

p

ovat keskiarvo ja keskihajonta kaikkien näiden

ED

: n, vastaavasti.

spesifisyys

että

ED

kohde vasta kartoitus,

SP

, määritellään kumulatiivinen z jakelu

SP

=

P

(

Z

z

p

(

ED

)) (kuvio 1 C).

SP

voidaan pitää sijoitus kohde kartoituksen kaikista kuvaukset vastaaviin kohde vasta-aineeseen. Asetusten arvoa

SP

myös alueella 0 1

Määritä pisteet kohde vasta-aineen. Lukemat tietyn tavoitteen vasta-suhteessa tietyn kartoitus kiinnostava määritellään (kuva 1 D). Arvo

Pisteet

on alueella 0 225.

Tulokset ja keskustelu

Olemme kattavasti laskea pisteiden kaikkien käytetyt vasta-aineet HPA kunkin 27 kartoituksia ja tämä johti 457110 tulokset. Sen sijaan on tiivistelmä valtavaksi tasainen täydentävä tiedoston, kaikki lasketut tulokset ovat saatavilla www-sivusto, jonka avulla kyselyt tehdään (https://bal.ym.edu.tw/hpa/) (kuva 2). Sivusto, HPA Scoring, tarjoaa kaksi kysely tilaa: kyselyn mukaan geenin nimen ja kyselyn syöpä tyyppi. Tietyn geenin nimi, HPA Scoring luetellaan pisteet ja sijoitus vasta-aineiden käytetään kullekin kartoitus (kuvio 2A). Tietyn kartoitus syövän tyypin, HPA Scoring raportoi geeni luettelon merkinnät, jotka ovat järjestetty vasta-pisteet (kuvio 2B). Seuraavassa osassa tutkimuksessa olemme suorittaa tarkastuksen, onko ehdotettu pisteytys lähestymistapa pystyy tunnistamaan vasta-aineita, jotka täyttävät seuraavat kriteerit. Ensinnäkin, että jää proteiini yli-ilmentyy kohde syöpäkudoksessa, ja toiseksi, että aste yli-ilmentyminen on merkittävä ja spesifinen syöpä. Toisessa osassa tämän tarkastuksen, olemme myös käytetty peräsuolen syövän mallina tauti ja sovellettu menetelmä syövän merkkiaineita löytö nimenomaan käyttämällä ehdotti pisteytys lähestymistapa peräsuolen syöpä aineisto.

(A) tulos kyselyitä geenin nimi. (B) tulos istä kartoittamalla syövän tyyppiä.

Kyky pisteytyksen lähestymistapa tunnistaa runsaasti proteiineja syövän kudoksissa

Kunkin kartoitusta, valitsemme top 100-vasta-aineita niiden

Scores

, ja suorittaa yhden otoksen

t

-testi varmistaakseen, onko keskimääräistä

eic

näistä 100 vasta-aineiden tilastollisia korkeampi kuin kaikkien testattujen vasta-aineita. Yhden näytteen

t

-testi on usein käytetään mittaamaan keskimääräistä eroa näytteen ja tunnetun populaation keskiarvon. Käytämme yhden otoksen

t

-testi koska voimme määrittää keskimääräinen

eic

kaikista testatuista vasta, eli populaation keskiarvo. Tilastollinen merkitykset

eic

tarkoittaa eroja top100 vasta-aineiden ja kaikkien testattujen vasta-aineiden kunkin kartoitus on lueteltu taulukossa 2. mukaan

p

-arvot raportoitiin, että yhden otoksen

t

-testissä, kaikki 27

eic

tarkoittaa erot ovat tilastollisia merkittäviä. Tulokset näistä testeistä osoittaa kykynsä meidän pisteytys lähestymistapa tunnistaa runsaasti proteiineja syövän kudoksissa.

merkitys ja syöpää spesifisyys

ED

of kärkipään vasta

jotta että ehdotettu pisteytys lähestymistapa kykenee tunnistamaan proteiineja, jotka yliekspressoituvat merkittävästi syövän kudoksissa, teemme yhden näytteen

t

-testi tarkistaa onko keskimääräinen

ED

alkuun 100 vasta on tilastollinen suurempi kuin kaikkien testattujen vasta-aineita. Tilastollinen merkitykset on

ED

tarkoittaa eroja top 100 vasta-aineet ja kaikki testatut vasta-aineet on lueteltu taulukossa 3. Mukaan

p

-arvot raportoimat yhden otoksen

t

-testissä, kaikki 27

ED

tarkoittaa erot ovat tilastollisia merkittäviä. Testitulokset osoittavat kykyä meidän pisteytys lähestymistapa tunnistaa proteiineja, joita ilmentyy suuresti syövän kohteisiin. Huomaa, että top 100-vasta-aineiden säädelty suuntaus (positiivinen

ED

otoskeskiarvo) kaikista 27 kuvaukset. Tämä kontrasti tuloksiin useimpien testattujen vasta-aineiden, jotka osoittavat alassäädetty suuntaus syövän kudoksissa (22 ulos 27 kartoitukset on negatiivinen

ED

populaation keskiarvo).

Top100 vasta kunkin kartoituksen käytettiin myös tarkistaa, ovatko ehdotettu pisteytys lähestymistapa kykenee tunnistamaan proteiineja, joiden yli-ilmentyminen on spesifinen syöpää kiinnostava. 100: n eniten vasta tietyn kartoituksen, niiden keskimääräinen

ED

määritetään kunkin 27 kartoitukset. Saatu 27

ED

keinot sitten järjestetty lämpöä kartta suuret

ED

arvot värillinen tummansininen ja pieni

ED

arvot väritetty vaaleansininen (kuva 3) . Merkintä (

i

,

j

) lämpöä kartan edustaa keskimääräistä

ED

alkuun 100 vasta-aineita

j

nnen kartoitus lasketaan

i

: s kartoitus. Oikeanpuoleisin sarake, kaikki luetellaan keskimääräinen

ED

arvot kaikkien testattujen vasta lasketaan kunkin 27 kartoitukset; nimittäin merkinnät sijaitsevat tässä sarakkeessa ovat väestö

ED

keinoin. Kasan kartta siis on mitat 27 28. tummansininen merkinnät sijaitsevat pitkin lävistäjä paljastavat, että keskimääräinen

ED

vasta-aineiden valittu kartoitus ovat juuri kyseistä kartoitus. Sen sijaan suurin osa merkinnöistä kasaan kartta on keskimäärin

ED

varten vasta valitun of kartoitus, jotka ovat samankaltaisia ​​väestölle

ED

tarkoittaa jos ne testataan toinen kartoitus. Jokainen rivi kasaan kartan vahvistaa havainto, että tietyn kartoitus, keskimääräinen

ED

arvot vasta valittu tätä kartoitusta ovat korkeammat kuin vasta valittu muista kuvaukset. Jokainen sarake lämpökartassa myös sopii toisen havainnon, nimittäin että sen 100 vasta valittu tietylle kartoituksen, niiden keskimääräinen

ED

on vain merkittävä valituille kartoitus ja on samanlainen kuin populaation keskiarvon muille kuvaukset. Havainnot Tämän arvioinnin osoittavat, että

ED

of kärkipään vasta on spesifinen syöpää kiinnostava.

Lämpökartasta, iso

ED

arvot ovat värillisiä tummansininen ja pieni

ED

arvot ovat värillisiä vaaleansininen. Merkintä (

i

,

j

) lämpöä kartalla edustaa keskimääräistä

ED

alkuun 100 vasta-aineita

j

nnen kartoitus lasketaan

i

: s kartoitus. Oikeanpuoleisin sarake, kaikki luetellaan keskimääräinen

ED

kaikista testatuista vasta lasketaan kunkin 27 kartoitukset.

Yhteenvetona ehdotettu pisteytys lähestymistapa osoittaa suurta potentiaalia tunnistamistiedot runsas ja syöpää erityisiä proteiineja kudoksissa.

soveltaminen lähestymistavan syöpämarkkeri löytö

tässä jaksossa käytämme arvioinnin kohortin osoittamaan, miten ehdotettu pisteytys lähestymistapaa voidaan käyttää seuloa mahdollisten merkkiaineita syöpiä. Kohortti koostuu 1482 sääteli membraaniproteiineja 28 potilasta, jotka oli diagnosoitu kolorektaalisyöpä [25]. Käytämme seuraavat kolme suodatus sääntöjä, jotta voidaan valita mahdollisia syövän markkereita Kohortin. Säännöt samanlainen kaksi viimeistä alla on käytetty laajalti biomarkkereiden löytö.

Sääntö 1. Proteiini, vasta-pisteet 100 joko peräsuolen-paksusuolen kartoitus tai peräsuolen-peräsuoli kartoitus on valittuna.

sääntö 2. up säätelemä proteiini, jonka keskimääräinen kertaluokkamuutos 2 valitaan.

sääntö 3. säädelty proteiini kertamuutos 2 yli 14 potilaalla on valittu.

proteiinit valitaan näillä kriteereillä sitten analysoitiin edelleen käyttämällä

biomarkkereiden Filter

antamat IPA (Ingenuity Systems, https://www.ingenuity.com). Jokainen proteiini potentiaalisten biomarkkereiden tai sairauden hakemuksen selityksin IPA tämän prosessin aikana.

kahdeksan yhdistelmiä suodatus kriteerit arvioitiin. Kukin yhdistelmiä otetaan huomioon erilaisia ​​yhdistelmiä eri suodatus sääntöjä. Suodatus Tulokset esitetään kuviossa 4. Nämä säännöt, joita käytetään näytön geenejä on merkitty plus-merkki kuviossa 4A ja muuten ne on merkitty miinusmerkki. Kunkin yhdistelmän, numerot suodatetun geenien, geenien kanssa biomarkkereiden huomautus, ja geenien tautiin merkintä on myös lueteltu kuviossa 4A. Erityistä huomiota olisi kiinnitettävä Combination 1. Tässä yhdistelmässä me yksinkertaisesti vastaa kaikkia 1482 proteiineja vastaan ​​HPA version10.0 kuinka monet liittyvät geenit indeksoitu HPA; Erityisesti ole nimenomaista suodatus sääntöjä sovelletaan valitsemaan mahdollisia merkkiaineita. On 1114 indeksoitu geenejä, joista 244 geenit on biomarkkereiden huomautusta ja 914 geeneillä on sairaus huomautusta päässä IPA. Tulos Combination 1 muodostaa meidän otosryhmästä. Mittasuhteet selityksin biomarkkereita ja sairauteen liittyvät geenien suodatettu geeneistä kunkin yhdistelmän on esitetty kuvassa 4B. Osuus suodatuksen tulokset meidän otosryhmästä on esitetty kuviossa 4C. Nimittäin, mittasuhteet suodatetun geenien kaikille 1114 indeksoitu geenejä, suodatettu biomarkkerit on 244 selityksin markkereita, ja suodatettu sairauteen liittyvien geenien 914 selityksin sairauteen liittyvien geenien; nämä on lueteltu kuviossa 4C. Kuvio 4C on paneeli kaavio, jossa on kaksi paneelia; ylempi on akseli, joka kattaa laajan valikoiman tietoja, kun taas alempi on akseli, joka keskittyy tietojen välillä 0% -25%.

(A) säännöt, joita käytetään screen geenit on merkitty plusmerkillä ja muuten on miinusmerkki. Kunkin yhdistelmän, numerot suodatetun geenien, geenien kanssa biomarkkereiden huomautus, ja geenien tautiin merkintä on lueteltu. (B) osuudet selityksin biomarkkereita ja sairauteen liittyvät geenien suodatettu geenejä kunkin yhdistelmän näkyvät. (C) osuus suodatuksen tulokset meidän otosryhmästä näkyy. Tämä luku on paneeli kaavio, jossa on kaksi paneelia; ylempi on akseli, joka kattaa laajan valikoiman tietoja, kun taas alempi on akseli, joka keskittyy tietojen välillä 0% -25%.

sitten käytetty Yhdistelmät 2, 3 ja 4 arvioida vaikutuksia säännön 1, sääntö 2, ja 3 säännön, vastaavasti. Yhdistelmä 2, eli säännön 1 yksin, sallitaan tietty menestystä biomarkkereiden löytö; osuus selityksin biomarkkereiden suodatettua geenien nostetaan 21,9%: sta 29,8% (kuvio 4B). Lisäksi yhdistelmä 2 on kyky seuloa tautiin liittyvä geenien osuus selityksin sairauteen liittyvien geenien suodatettu geenien nostetaan 82,0%: sta 87,5% (kuvio 4B). Soveltamalla Yhdistelmä 2 kutistuu otoskokoa 15,1%, mutta säilyttää 20,5% selityksin varustetun biomarkkereita ja 16,1% selityksin varustetun sairauteen liittyvien geenien (kuvio 4C). Hakeminen Combination 3, nimittäin työjärjestyksen 2 yksin, tasaisesti kutistuu otoskoko, selityksin biomarkkereita ja selityksin sairauteen liittyvien geenien (4,3%, 4,1%, 4,2%, kuvio 4C). Osuus selityksin varustetun biomarkkereita ja sairauteen liittyvät geenejä suodatettu geenien pidetään myös samalla tasolla kuin näytteessä väestöstä (20,8%

vs

. 21,9%; 79,2

vs

. 82,0%, kuvio 4B). Soveltamisen vaikutus Yhdistelmä 3 on hieman kuin satunnaisotannalla. Yhdistelmä 4, eli 3 säännön yksin, on paras biomarkkereiden seulonta kyky joukossa kolme suodatus sääntöjä; osuus selityksin biomarkkereiden suodatettua geenien nostetaan 21,9%: sta 35,3% (kuvio 4B). Soveltamalla Combination 4 tasaisesti kutistuu otoskoko ja selityksin sairauteen liittyvien geenien (3,1% ja 3,0%), mutta pitää 4,9% selityksin varustetun biomarkkerit (kuvio 4C). Näyttää siltä, ​​että soveltamalla nimikkeistön 1 ja 3 ovat molemmat tehokkaita strategioita suoritettaessa biomarkkereiden löytö.

Arvioimme myös suorituskykyä yhdistelmiä, jotka käyttävät kahta suodatussäännöt yhdessä. Yhdistelmä 5 soveltajana 1 ja 2, yhdistelmä 6 soveltajana 1 ja 3, ja yhdistelmä 7 soveltajana 2 ja 3. Kaikki kolme yhdistelmät dramaattisesti kutistua otoksen koon asteikolla, joka soveltuu märkä-lab validointi; soveltamalla yhdistäminen 5, 6, ja 7 tuottaa 13, 8, ja 14 suodatetaan geenit, vastaavasti (kuvio 4A). Yhdistelmä 6 säilyttää suurimman osan biomarkkereita. Osuus selityksin biomarkkereiden suodatettua geenejä on kasvanut 21,9%: sta 75% (kuvio 4B). Yhdistelmät 5 ja 7 tuottaa samanlaisia ​​tuloksia tunnistamisessa selityksin biomarkkereiden, kun taas yhdistelmä 5 on parempi taudin aiheuttama geeniseulonta kyky. Osuus selityksin varustetun sairauteen liittyvien geenien suodatettu geenit on 92,3% haettaessa Yhdistelmä 5 mutta vain 64,3% haettaessa Combination 7 (kuva 4B). Arvioinnin tulokset samaa mieltä havaintomme että sääntö 1 yhdistettynä Sääntö 3 pystyy tehokkaasti seuloa mahdollisten biomarkkereita.

Vastaa