PLoS ONE: luokittelu Kymmenen tyypit Major Syövät Perustuu Reverse Phase Protein Array profiilit
tiivistelmä
Gathering valtava aineistoja syövän genomien vaatii tehokkaampia ja autonomiset menettelyt luokitella syöpätyyppeihin ja löytää muutamia keskeisiä geenejä erottaa eri syöpiä. Koska proteiinin ilmentyminen on vakaampi kuin geenin ilmentyminen, päätimme käänteisfaasi- proteiinijärjestelmäksi (RPPA) data, tehokas ja vankka vasta-aineisiin perustuva korkean suoritustehon lähestymistapa kohdennettua proteomiikka, suorittamaan tutkimuksemme. Tässä tutkimuksessa ehdotimme laskennallinen puitteet luokitella potilaan näytteitä kymmeneen suurta syöpätyyppeihin perustuu RPPA tietoja käyttämällä SMO (Sequential minimaalinen optimointi) menetelmällä. Huolellinen ominaisuus valintamenettely käytettiin valita 23 tärkeitä proteiineja yhteensä 187 proteiinien mRMR (minimi Redundancy Suurin merkitys Feature Selection) ja IFS (Incremental Feature Selection) koulutusta asetettu. Käyttämällä 23 proteiineja, onnistuneesti luokitteli kymmenen syöpätyyppeihin kanssa MCC (Matthews Korrelaatiokerroin) on 0,904 koulutusta asetettu, arvioitiin 10-kertaisesti ristivalidointi, ja MCC 0,936 riippumattomaan Koepakettia. Niiden tarkempi analyysi 23 proteiinien suoritettiin. Useimmat näistä proteiineista voi esittää tunnusmerkkejä syöpä; Chk2 esimerkiksi tärkeä rooli syöpäsolujen lisääntymistä. Analyysimme näistä 23 proteiinien antavat aihetta uskoa, että on tärkeää näiden geenien indikaattoreina syövän luokituksen. Uskomme myös meidän menetelmät ja päätelmät voidaan valaista löydöt erityinen biomarkkereita eri syöpien.
Citation: Zhang PW, Chen L, Huang T, Zhang N, Kong XY, Cai YD (2015) luokitteleminen Kymmenen Tyypit Major Syövät Perustuu Reverse Phase Protein Array Profiilit. PLoS ONE 10 (3): e0123147. doi: 10,1371 /journal.pone.0123147
Academic Editor: Lukasz Kurgan, University of Alberta, CANADA
vastaanotettu: 20 lokakuu 2014; Hyväksytty: 24 helmikuu 2015; Julkaistu: 30 maaliskuu 2015
Copyright: © 2015 Zhang et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään
Data Saatavuus: kaikki asiaankuuluvat tiedot kuuluvat paperin ja sen tukeminen Information tiedostoja.
Rahoitus: Tätä työtä tukivat avustuksia National Basic Research Program of China (2011CB510102, 2011CB510101), ja National Natural Science Foundation of China (31371335, 81171342, 81201148 , 61401302), Innovation Program Shanghai Municipal Education komissio (12ZZ087), myöntäminen ”The First-luokan Kuri yliopistojen Shanghaissa”, Tianjin tutkimusohjelma Application Foundation ja Advanced Technology (14JCQNJC09500), National Research Foundation varten Jatko ohjelma korkeakoulutusalueen of China (20130032120070, 20120032120073) ja Independent Innovation Foundation of Tianjin University (60302064, 60302069). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
tunnistaminen syöpä-geenit kasvaimien syntyyn liittyvien ja syövän eteneminen on yksi tärkeimmistä tavoista ymmärtää patofysiologisia mekanismeja syöpien ja löytää terapeuttisen lääkeaineen kohteita. Monet on pyritty tunnistamaan syövän biomarkkerit käyttämällä geenien ilmentyminen [1]. Kuitenkin luotettavuutta microarray johdettujen biomarkkerit on erittäin huono [2]; Tämä johtuu osittain siitä, luotettavuutta voidaan helposti vaikuttaa geeniekspressiotasot pienet ympäristön muutoksiin. Ilman arvioinnin proteiinin ilmentymisen tasot, ei olisi mitään keinoa havainnollistaa syitä kasvaimen proliferaatiota ja erilaistumista. Siksi ymmärtää paremmin translationaalisen valtioiden näiden genomien tuo meidät askeleen lähemmäs löytää mahdollisia huumeiden tavoitteet ja havainnollistaa off-tavoite vaikutuksia syövän lääketieteessä.
Käänteisfaasi proteiinijärjestelmäksi (RPPA) on tehokas ja vankka vasta-aine-pohjaisia korkean suoritustehon lähestymistapa kohdennettujen proteomiikan, jonka avulla voimme arvioida määrällisesti kohdeproteiinin ilmentyminen suurina näytejoukoille [3]. Tässä prosessissa näytteen analyyttien immobilisoidaan kiinteään faasiin, ja analyytti-spesifisiä vasta-aineita käytetään liuosfaasissa. Kautta käyttämällä toissijaisia koodaus ja signaalin vahvistus havaitsemaan sitoutuneiden vasta-aineiden, proteiinit voidaan mitata. Verrattuna perinteisiin proteiinin mitata menetelmillä, kuten western-blottauksella tai ELISA: lla, edut RPPA ovat: suurten määrän proteiinin, korkea herkkyys, ja pieni näyte tilavuus vaatimukset [4]. Vaikka massaspektrometria, käytetään yleensä määrällisesti numerot fosforylaatiopaikkaa tai fosfopeptidejä, vaatii vielä proteiinin digestio, peptidin fraktiointi ja fosfopeptidi rikastamiseen jälkeen proteiini uuttamalla, RPPA voi suoraan mitata uutettiin proteiini [5]. Soveltaminen RPPA on validoitu laajasti sekä solulinjoissa ja potilaan näytteitä [6], ja se havainnollistaa mekanistinen oivalluksia takana sairauksia.
Tällä hetkellä syöpätyyppeihin jaotellaan anatomiset asemaan, jossa he ovat löytäneet, kuten keuhko- syöpä, rintasyöpä, jne. Olipa nämä nimet voivat esitellä proteomic ominaisuutta ei ole määritetty tähän asti. Vaikka on ollut joitakin menetelmiä löytää biomarkkereiden allekirjoituksia tiettyjen syöpätyyppien, on vielä vähän tutkimusta tehdään joka huomioi eri syöpätyyppien kokonaisuutena, jotta voidaan tunnistaa niiden kaltaiset tai erillisiä proteomic ekspressiokuvioiden ja luokittelun ominaisuuksia.
tässä tutkimuksessa ehdotimme laskennallinen työnkulun menestyksellisesti käyttää 23 proteiineja luokitella potilaan näytteitä otetaan kymmenen tärkeintä syöpätyyppeihin. Ensin satunnaisesti jaettu 3467 näytteet kymmenestä syöpien osaksi koulutusta asetettu 2775 näytteitä ja riippumaton testi asetettu 692 näytettä. Osuudet kunkin syöpätyypin olivat samanlaisia harjoitussarjassa ja riippumaton Koepakettia. Sitten, training set kaikki ominaisuudet erottavat ryhmät olivat paremmuusjärjestykseen mRMR (minimi Redundancy Suurin merkitys Feature Selection) kriteerit. 10-kertainen ristivalidointi koulutusta asetettu, SMO (Sequential minimaalinen optimointi) ja IFS (Incremental Feature Selection) [7] menetelmiä käytettiin valitsemaan optimaalisen ominaisuuksia. Yhteensä 23 proteiineja valitaan opetusjoukolla. Heidän MCC (Matthews Korrelaatiokerroin) kouluttamiseksi asetettiin 0,904 arvioitiin 10-kertaiseksi rajat validointi ja niiden MCC riippumatonta Koepakettia oli 0,936. Menetelmämme voisi antaa lääkäreille tietoa keskeisten erillisiä biokemiallisia piirteitä syöpätyyppeihin ja toisivat noin uudessa valossa löydöt erityinen biomarkkereita eri syöpien.
Materiaalit ja menetelmät
Datasets
RPPA tiedot ladattiin TCPA (Cancer Proteome Atlas) tietokantaan [8] (https://app1.bioinformatics.mdanderson.org/tcpa/_design/basic/download.html alle Pan-Cancer 11 RBN ), joka sisälsi proteomiikka ilmentymistä 3467 syöpäpotilaiden 11 syöpätyypeissä (taulukko 1). Koska COAD (Colon adenokarsinooma) ja READ (peräsuoli adenokarsinooma) samanlaiset patologiat ja analysoitiin yhdessä TCGA (Cancer Genome Atlas) paksusuolen ja peräsuolen syövän tutkimus [9], yhdistimme COAD ja READ näytteitä yhdessä ”Colon adenokarsinooma ja peräsuoli adenokarsinooma näytteitä. Siksi kymmenen syöpätyyppeihin analysoitiin seuraavasti.
Koska meillä ei ollut erilainen kohortti tehdä monikeskustutkimus validointi, me satunnaisesti jaettu 3467 näytteet koulutus asetettu 2775 näytteitä ja riippumaton testi asetettu 692 näytettä. Suhde opetusnäytteitä yli testinäytteet oli noin 4: 1 ja pidimme osuus kunkin syövän tyypistä suunnilleen sama harjoitussarjassa ja riippumaton Koepakettia. Kuvauksen kymmenen syöpätyyppeihin ja niiden otoskoot on annettu taulukossa 1. koulutus ja koe aineistoja annetaan S1 File.
Kukin näyte sisälsi 187 proteiineja, joiden ekspressiotasoja mitattiin käänteisfaasi-proteiinin array (RPPA). RPPA on proteiini, matriisi, jolla voidaan mitata proteiinin ekspressiotasoja suuri määrä näytteitä samanaikaisesti määrällistä tavalla, kun korkealaatuisia vasta-aineita on saatavilla [4]. 187-proteiinin ekspressiotasoja pidettiin 187 ominaisuuksia voidaan käyttää syövän luokittelun tässä tutkimuksessa.
Feature valinta
ekspressiotasot 187 proteiinit voivat kaikki osallistua yhtä luokitusta . Suurin merkitys pienin redundanssia (mRMR) menetelmää [10-13] käytettiin sijoitus tärkeyttä 187 ominaisuuksia harjoitussarjassa. 187 ominaisuudet voi tilata tällä menetelmällä mukaan kunkin ominaisuuden merkitystä tavoite ja mukaan irtisanominen kesken ominaisuuksia itse.
Anna Ω merkitsee koko joukko 187 ominaisuuksia, kun taas Ω
s
merkitsee jo valitun ominaisuuksia, joka sisältää m ominaisuudet ja Ω
t
merkitsee to-be-valitaan ominaisuuksia, joka sisältää n ominaisuuksia. Merkitystä
D
ominaisuuden
f
in Ω
t
kanssa syöpä luokat
c
voidaan laskea:
(1)
ja irtisanominen
R
ominaisuuden
f
in Ω
t
kanssa jo valittujen ominaisuuksien Ω
s
voidaan laskea:
(2)
saamiseksi ominaisuus
f
j
in Ω
t
mahdollisimman merkitystä syövän luokat
c
ja pienin redundanssin kanssa jo valitut ominaisuudet Ω
s
, yhtälö (1) ja yhtälön (2) yhdistetään kuin mRMR toiminto:
(3)
ominaisuus arviointi jatkuu 187 kierrosta. Kun nämä arvioinnit, paremmuusjärjestykseen ominaisuus luettelo
S
by mRMR menetelmällä voidaan saada:
(4)
Ominaisuus indeksi h tarkoittaa, että on tärkeää ominaisuutta. Ominaisuus pienemmällä indeksi h osoitti, että sillä oli parempi kompromissi suurimman merkitystä ja pienin irtisanomisia, ja se voi osallistua enemmän luokituksessa.
perusteella paremmuusjärjestykseen ominaisuus alalta mRMR taulukossa otimme Inkrementaalinen Feature Selection (IFS) menetelmää [14, 15], joka määrittelee optimaalisen ominaisuuksia, tai joka saavutetaan parhaassa suorituskykyä. Tehdä tätä menetelmää, piirteitä mRMR taulukossa lisättiin yksitellen ylemmiltä alentaa listalla.
Kun toinen ominaisuus oli lisätty uusi ominaisuuksia luotiin. Ja saamme 187 ominaisuus asetetaan, ja i: nnen ominaisuuksia on:
(5)
perusteella kukin 187 ominaisuus asetetaan, luokittelijoiden rakennettiin ja testattiin koulutusta asetettu 10-kertainen cross validointi . Jossa Matthews Korrelaatiokerroin (MCC) 10-kertainen cross validointi lasketaan training set saadaan IFS pöydän useita ominaisuuksia ja suorituskykyä niitä.
S
optimaalinen on optimaalinen ominaisuuksia, jotka saavutetaan korkein MCC koulutusta asetettu. Vihdoin, malli oli rakentaa piirteitä
S
optimaalisen koulutukseen asettaa ja kohonnut testipakkauksesta.
Prediction menetelmiä
satunnaisesti jakautuneet koko data asettaa osaksi opetusjoukkoa ja riippumaton testi asetettu. Harjoitussarjassa jaettiin edelleen 10 yhtä suureen osioita. 10-kertainen ristivalidointi koulutusta asetettu sovellettiin valita ominaisuudet ja rakentaa ennustemalli. Rakennettu ennustemallin testattiin itsenäisissä Koepakettia. Puitteissa mallin rakentaminen ja arviointi kuvassa 1.
Ensinnäkin satunnaisesti jakautuneet koko datajoukon osaksi opetusjoukkoa ja riippumaton testi asetettu. Sitten opetusjoukolla jaettiin edelleen 10 yhtä suureen osiot suorittamaan 10-kertainen cross validointi. Perustuen training set piirteet valittiin ja ennustemalli rakennettiin. Vihdoin rakennettu ennustemalli testattiin itsenäisissä Koepakettia.
Yritimme seuraavat neljä koneoppimisen algoritmeja: SMO (Sequential minimaalinen optimointi), IB1 (Lähin naapuri Algorithm), Dagging, RandomForest (Random Forest), ja valitaan optimaaliseksi rakentaa luokitin. Lyhyt kuvaus näiden algoritmien oli alla.
SMO menetelmä on yksi suosituimmista algoritmeja koulutusta tukivektorikoneet (SVM) [16]. Se rikkoo optimointi ongelmana on SVM useisiin pienin mahdollinen osa-ongelmia, jotka sitten ratkaistaan analyyttisesti [16]. Puuttumiseksi multi-luokan ongelmia, pareittain kytkin [17] käytetään rakentaa multi-luokan luokittelija.
IB1 on lähimmän naapurin luokittelija, jossa normalisoitu euklidinen etäisyys mitataan etäisyys kahden näytteen . Jotta kysely Näyte, luokka koulutus näytteen minimietäisyys on määritetty testinäytteen kuin ennustettu tulos. Lisätietoja, katso Aha ja Kibler tutkimuksessa [18].
Dagging on meta luokittelija, joka yhdistää useita malleja peräisin yhdestä oppimisen algoritmi disjoint näytteitä koulutusta aineisto ja integroi tulokset mallien enemmistöpäätöksiä [19]. Oletetaan on koulutus aineisto, joka sisältää
n
näytteitä.
k
osajoukkoja rakennetaan satunnaisesti ottamalla näytteitä ilman vaihtoa siten, että kukin niistä sisältävät
n
näytteitä, joissa
kn
”≤
n
. Valittu perusoppimistavoitteet algoritmi on koulutettu seuraavilla
k
osajoukkoja, aiheuttaen siten
k
luokitus mallit
M
1,
M
2, …,
M
k
. Saat kyselyn näyte,
M
i
(1≤
i
≤
k
) tarjoaa ennustavat tulos ja lopullinen ennustetun tuloksen of Dagging on luokan eniten ääniä.
Random Forest algoritmin ehdotti ensimmäisenä Loe Breiman [20]. Se on kokonaisuus ennustaja koostuu moninkertaisesti päätös puita. Oletetaan on
n
näytteet harjoitussarjassa ja kukin näyte edusti
M
ominaisuuksia. Jokainen puu on rakennettu satunnaisesti valitsemalla
N
, jossa vaihto, koulutuksesta asetettu. Jokaisessa solmussa, satunnaisesti valitsemalla
m
ominaisuuksia ja valitse optimoitu split kasvaa puussa. Sen jälkeen rakentamalla moninkertaistuvat päätös puita, ennustettu tulos Tietyn näytteet on luokka, joka saa eniten ääniä näistä puista.
Matthews Korrelaatiokerroin (MCC) B
MCC [21], tasapainoinen mitata vaikka luokat ovat hyvin erikokoisia, käytetään usein arvioida suorituskykyä ennustaminen menetelmille kahden luokan luokittelun ongelma. Laskea MCC, täytyy laskea neljä arvoa: tosi positiivisia (TP), väärä positiivinen (FP), tosi negatiivinen (TN) ja vääriä negatiivisia (FN) [22, 23]. Sitten MCC voidaan laskea
(6)
Kuitenkin monet ongelmat osallistuu yli kaksi luokkaa, sano
N
luokat koodaama 1,2, …,
N
(
N
2). Tässä tapauksessa voimme laskea MCC luokan
i
osittain mitata suorituskykyä ennuste menetelmiä laskemalla TP, FP, TN ja FN kuten seuraavista tavoista:
TP
i
: näytteiden lukumäärä siten, että luokka
i
on niiden ennustettu luokka ja tosi luokka;
FP
i
: määrä näytteitä niin, että luokan
i
on niiden ennustettu luokka ja luokka
i
ei ole heidän paikkansa luokka;
TN
i
: numero näytteiden niin että luokka
i
ei ole niiden ennustettu luokan eivätkä niiden todellisen luokassa;
FN
i
: näytteiden lukumäärä siten, että luokka
i
ei niiden ennustetaan luokka ja luokka
i
on heidän todellinen luokka.
Näin MCC luokan
i
, merkitään MCC
i
, voidaan laskea
(7)
näitä arvoja ei täysin mitata suorituskykyä ennustus menetelmiä, yleistä MCC osuuslajeja tapauksessa on edelleen tarpeen. Onneksi Gorodkin [24] on raportoinut MCC osuuslajeja tapauksessa, jota käytettiin arvioitaessa suorituskykyä ennuste menetelmien jaksossa mainittu ”Prediction menetelmiä”. Samanaikaisesti MCC kullekin luokalle annetaan myös viitteinä. Täällä, annoimme lyhyt kuvaus yleisestä MCC osuuslajeja tapauksessa alla.
Oletetaan on luokitus ongelma
n
näytteitä, sano
s
1,
s
2, …,
s
n
, ja
N
luokat koodaama 1,2, …
N
. Määritä matriisin
Y
kanssa
n
rivit ja
N
saraketta, jossa
Y
ij
= 1, jos
i
nnen näytteen kuuluu luokkaan
j
ja
Y
ij
= 0 muutoin. Saat luokitusmalli, sen ennustettu tuloksia ongelma voidaan esittää kahden matriisin
X
ja
C
, jossa
X
on
n
riviä ja
N
saraketta, (8) ja
C
on
N
rivit ja
N
saraketta,
C
ij
on näytteiden lukumäärä luokassa
i
jotka on ennustettu olevan luokan
j
.
Matriisit
X
ja
Y
, niiden kovarianssifunktio voidaan laskea (9), jossa
X
k
ja
Y
k
ovat
k
nteen sarakkeeseen matriisien
X
ja
Y
vastaavasti ja ovat keskiarvoa numeroita
X
k
ja
Y
k
, vastaavasti. Sitten MCC osuuslajeja tapauksessa voidaan laskea seuraavan reseptin [25]:
(10)
Kuten MCC kahden luokan tapauksessa MCC osuuslajeja tapauksessa vaihtelee välillä -1 ja 1, jossa 1 ilmaisee täydellisen luokittelu, -1 äärimmäinen Luokitteluvirheillä.
tulokset ja keskustelu
Euroopan mRMR ja IFS tuloksia
käyttämällä suurinta merkityksellinen pienin redundanssia (mRMR) menetelmässä 187 ominaisuudet olivat paremmuusjärjestykseen merkitystä koulutuksessa asetettu. Tulos mRMR taulukon löytyy S2 File.
aikana IFS lähestymistapa, kukin proteiini ominaisuus lisättiin yksi kerrallaan. Luokittelu omat asiakaskeskukset joka saatiin neljä ennuste menetelmillä, koulutuksesta set arvioitiin 10-kertaisesti cross validointi on esitetty S3 tiedosto. Me kuvattu luokittelu omat asiakaskeskukset kuin kuvio 2 datasta S3 tiedosto. Voidaan havaita, että korkein omia asiakaskeskuksia varten SMO, IB1, Dagging ja RandomForest olivat 0,985, 0,937, 0,969 ja 0,925, mikä osoittaa SMO voidaan rakentaa optimaalisen luokitin. Huolellisesti tarkistaa ennustettu tulokset SMO, voidaan nähdä, että käyttämällä alkuun 23 proteiineja, MCC saavutti 0,904, joka oli ensimmäinen ulottuvilla edellä 0.900. Yhä proteiineja, MCC ei kasvanut paljon. Siksi tässä tutkimuksessa, me pidetään 23 proteiinit optimaaliset ominaisuudet ja nämä 23 proteiinit pidetty tärkeimpänä proteiineista luokituksessa nämä kymmenen syöpiä. Olemme arvioineet ennustaminen suorituskykyä riippumattoman Koepakettia ja MCC oli 0,936. MCC Kunkin syöpätyypin löytyy S3 File.
Plot näyttää MCC eri luokittelijoiden rakentama eri määrä proteiinin ominaisuuksia valittu mRMR taulukosta aikana IFS prosessin koulutusta asetettu. Kun ensimmäinen 23 proteiinit valittiin, MCC saavutti 0,904, joka oli ensimmäinen ulottuvilla edellä 0.900 ja enemmän proteiinia ominaisuuksia, MCC ei kasvanut paljon. Mietimme 23 proteiinit merkittävimpänä proteiineja luokitusta.
Valittu Top 23 proteiinien erottamiseen syöpätyyppeihin
Valittu Top 23 proteiinit on esitetty yhteenvetona taulukossa 2. Näitä proteiinit voivat tärkeitä rooleja luokittelussa kymmenessä eri syöpätyyppejä. Useimmat näistä proteiineista on raportoitu liittyvän tietyt kasvaimet. Esimerkiksi Claudin-7 on raportoitu olevan yli-ilmentynyt rinta- kasvaimissa [26] ja alassäädetty pään ja kaulan karsinoomat [27]. Tigar on säädellään ylöspäin koolontuumoreissa [28]. Geenimonistuminen ESR1 esiintyy usein rintasyövän [29]. PREX1 ilmentyy erittäin eturauhassyövän [30]. Siten meidän havaintoja tukee myös aiemmista tuloksista. Alla, tulemme keskustelemaan biologisesta merkityksestä 23 proteiinien yksityiskohtaisesti perustuu geenien toiminnan, solujen polkuja ja biologisia toimintoja, jotka voivat valottaa eroja eri syöpiä proteiiniekspressiossa tasoilla. Olemme pääasiassa keskustella näiden geenien osastot Robert A. Weinburg n [31]. Joillekin geenejä, jotka eivät koske syövän tunnusmerkit, yritämme laittaa nämä geenit samankaltaisia toimintoja yhdessä keskustelua (katso kuva 3).
23 valitut proteiinit katsoneet seitsemän jaksoa perustuu pääasiassa tunnusmerkkejä syövän . Niille, jotka eivät liity syöpään liittyvien reittien, laitamme geenit samankaltaisia toimintoja yhteen keskustelemaan.
ehkäiseminen solukuolema on ratkaisevan tärkeää syövän kehitystä, koska syöpäsolut ovat usein resistenttejä apoptoottista aiheuttama signalointi DNA-vaurioita ja muut tekijät. Meidän tuloksia, löydettiin yksi geeni, joka liittyy apoptoottisen koneiston ja niitä voidaan käyttää erottamaan eri syöpiä. Täällä keskustelemme NDRG1 sekä aiempia havaintoja osoittaa sen suhde syöpä. NDRG1 (N-myc alavirtaan säännelty geeni 1) on fosforyloitu proteiini [32], jotka voidaan aktivoida kasvaimen p53 ja tarvitaan induktioon p53-välitteisen apoptoosin koolonisyöpäsolulinja [33]. Koska NDRG1 proteiini on keskeinen rooli estämällä ensisijaisen kasvaimen kasvua, se on tunnettu aggressiivisuutta vähentävänä useissa syöpiä kuten paksusuoli-, eturauhas- ja rintasyöpiä [34].
replikoitu- kuolemattomuus on tärkeä tunnusmerkki syöpä, joka on yleisesti tunnustettu vapautettu solujen lisääntymistä. Meidän havainnot useita tärkeitä solukierron liittyvien geenien valittu proteiineista paitsi niiden merkityksen kehittämiseen syövän, mutta myös ensimmäinen indikaattoreina käytetään syövän luokituksen. Nämä solusyklin liittyviä geenejä käsitellään jäljempänä: sykliini B1 on rooli säätelyssä solusyklin: ennen mitoosia, solut käännä välillä G2 ja mitoosin kunnes on riittävä kertyminen sykliini B tukemaan CDK1 toimintaa [35]. Misexpressed sykliini B1 tumassa on havaittu valtava solujen osuus joidenkin kasvainten, ja sykliini B1 on pidetty tehokas prognostinen tekijä ihmisen rintasyövän ja okasolusyöpä [36]. Sykliini E1, koodaama CCNE1, on yksi jäsenistä sykliiniperheen, joka ohjaa solukierron prosesseja dramaattinen jaksotus runsautta. Äskettäin genomin laajuinen yhdistys tutkimuksessa todettiin, että rs8102137 sisällä CCNE1 geeni liittyy virtsarakon syöpä [37]. Meta-analyysi osoittaa myös, että on olemassa yli-ilmentyminen tämän proteiinin, joilla on rintasyöpä [38]. Chk2 (tarkistuspiste kinaasi 2), kuten seriini /treoniini proteiinikinaasi, voisi vastata DNA-vaurioita säilyttämiseksi genomista eheys [39]. On osoitettu, että Chk2 tärkeä rooli syöpäsolujen lisääntymistä [40], joka houkuttelee paljon huomiota muodostaakseen mahdolliset syöpälääkettä suunnittelutavoite [41].
On selvää, että hyökkäys on tunnusmerkki syöpä, vaikka sen taustalla mekanismit ovat edelleen arvoitus. Tähän asti voitto ja tappio solu-solu kiinnitys proteiinit ovat tärkeimmät syyt hyökkäyksen, erityisesti menetys E-kadheriinin [31]. Meidän tulokset, E-kadheriinin ja joitakin polariteetti-sukuiset proteiinit ovat havainneet, että voidaan käyttää erottamaan eri syöpätyyppejä. Nämä proteiinit käsitellään jäljempänä: E-kadheriinin, kuten tyypin 1 klassista kadheriinin, välittää soluinteraktiot. Kasvaimen eteneminen liittyy usein menetys E-kadheriinin toiminto, joka johtaa enemmän liikkuvia ja invasiivisia fenotyyppi [42]. PREX1 (fosfatidyyli-3,4,5-trisfosfaatti riippuvainen Rac vaihto-tekijä) on erittäin ilmaistaan eturauhasen syöpä, joka osoittaa suhdetta soluinvaasion ja sen ilmentymistä [30]. Melanoomissa, PREX1 yli-ilmentyminen on liitetty aktivointi ERK-MAPK signalointia ja tarvitaan tehokasta Melanoblastin etäpesäke sekä siirtoa varten [43]. Claudin-7, yhteinen transmembraaniproteiini, on tärkeä rooli muodostumista ja ylläpitoa läpäisevyyden polarisoitunut epiteelisolujen [44]. Poikkeava Claudin-7 mentymisprofiili on todettu erilaisissa kasvaimissa, kuten erittäin aiheuttama Claudin-7 ilmentymistä sekä ensimmäisen ja metastaattisen rintasyövän kasvaimia, [26] mutta se on alassäädetty pään ja kaulan karsinoomat [27]. Nämä aiemmat tutkimukset edelleen tuettava havaintomme että Claudin-7 voitaisiin käyttää biomarkkerina erilaistumista ja luokittelu eri kasvaimia. Rab-25, koska jäsen Rab perheen GTPaaseja, Rab-25 on konstitutiivisesti aktiivinen Rab GTPaasina että keskeinen rooli apikaalisella kierrätys- ja transsytoosissa reittejä polarisoitunut epiteelisolujen. Koska menetys solun polariteetti on olennainen tunnusmerkki syövän, Rab-25 liittyvän kaupan on tärkeä vaikutus epiteelisolujen polariteetin ohjelmaa syövän etenemisessä [45].
Anomalous syöpäsolun energia-aineenvaihduntaa havaittiin ensi Otto Warbugy vuonna 1930 ja on hyväksytty tuntomerkki syöpä. Epänormaali rasvahappojen synteesi kuin yhden tyyppinen energia-aineenvaihdunnan on monissa syöpäsoluja [46]. Täällä useita tärkeitä rasvahappojen ja glykolyyttiset aineenvaihduntaan liittyvien geenien löytyy valittu 23-proteiinit: FASN on keskeinen entsyymi, jota tarvitaan de novo synteesiä rasvahappoa. On havaittu, että FASN ilmentyminen ja toiminta ovat poikkeuksellisen kohonneet monenlaisia ihmisen syöpien, jotka voivat vaikuttaa solun resistenssin huumeisiin ja säteilyn indusoiman apoptoosin [46]. ACC1 on nopeutta rajoittava entsyymi de novo rasvahappojen synteesiä. Se näyttää olevan rajoittava entsyymi lisääntyvissä syöpäsoluissa. ACC1 on todettu olevan säädelty lisääntyvissä syöpäsolulinjoissa, kuten eturauhas-, rinta- ja maksassa. Itse asiassa on osoitettu, että knock-alas ACC1 siRNA edistää apoptoosin eturauhassyövän ja rintasyövän kasvainsoluihin mutta ei hallitse noncancerous soluissa, korostaa syöpäsolut ”suurempi turvautuminen tämän entsyymin normaalia kudosta [47]. AMPK (AMP-aktivoitu proteiinikinaasi, geenin koodaama PRKAA1 /2) on tärkeä merkitys tunnistava energiasisällön ja koordinointi ulkoisen kasvun signaaleja solun aineenvaihduntaan [48]. Pieneneminen AMPK signalointi, useimmiten aiheuttama toiminnan menetys geenin STK11, saattaa johtaa lisääntyneeseen aktivointi mTOR ja siirtyminen kohti glykolyyttistä aineenvaihdunta, jota esiintyy erilaisissa syövissä, mukaan lukien NSCLC [49] ja kohdunkaulan syöpä [50] .
Epänormaali ilmaus hormonireseptoreita usein esitetty sukupuoleen liittyviä syöpiä, kuten rinta- ja eturauhassyövän. Kolme hormonireseptorit raportoidaan myös valitussa proteiineja: progestiinireseptoriin (PR), Ydinvoimalaitoksen steroidireseptoriperheen, on suuri spesifisyys sitoutumisen progesteronin [51]. Se on esitetty kirjallisuudessa, että PR estää siirtymistä G1-S solusyklin ja edistää apoptoosia kohdun limakalvon syövän soluihin [52]. Vuonna GOG119 vaiheen II tutkimuksessa estrogeenia korvike nimeltään tamoksifeeni voi lisätä progestiiniaktiivisuuden jotta aiheuttaa PR ja parantaa kohdun potilaille [53]. Estrogeenireseptori (ER, aktivoidaan hormonia estrogeeni) on yksi tärkeimmistä terapeuttisia kohteita rintasyöpiä, kun otetaan huomioon, että korrelaatio ER ilmaisun ja soluvastetta estrogeenin [54]. On raportoitu, että geenin monistuminen ESR1 esiintyy usein, joilla on rintasyöpä [29]. Androgeenireseptorin (AR, NR3C4) uskotaan ainoastaan välittävät kaikki biologisten vaikutusten endogeenisen, toimivat lähinnä säätelemällä miespuolinen kehittämiseen. Vahvan yhteyden AR ja eturauhasen syöpä, androgeenin antagonisteja tai androgeenien puute hoito on sovellettu estämään syöpäsolujen lisääntymistä potilailla, joilla on androgeenista riippuvainen eturauhassyöpä kliinisen hoidon [55].
Yllättäen näistä 23 on valittu proteiineja, joita käytetään erottamaan eri syöpiin, α-tubuliinin ja GAPDH käytetään usein valvonnan western blot -analyysillä. Seuraavassa osassa, tulemme keskustelemaan tiedetään löydöksiä α-tubuliinin ja GAPDH joka antaa valtakirjan pätevyyden havainnoistamme heidän merkitys erottaa syövistä. Esimerkiksi sekä α- ja β- tubuliinin proteiinit ovat vastuussa kokoamiseen mikrotubuluksiin (MT, solun tukirangan polymeerisiä rakenteita), ja tiettyjä translaation jälkeisiä modifikaatioita. Asetylointi α-tubuliinin (Lys-40) [56] voisi muuttaa dynaaminen käyttäytyminen MTS, mikä saattaa johtaa muutoksiin biologisia toimintoja, jotka MT suorittavat solunjakautumisen aikana, muuttoliike, ja solunsisäiseen kuljetukseen. Ottaen dynaamiset parametrit huomioon, MT tarjoavat houkuttelevan kohteen kemoterapiaa vastaan nopeasti kasvavilla tuumorisoluja kuten lymfooma ja leukemia, metastaattinen syövät, ja hitaasti kasvava rinta-, munasarja-, ja keuhko [57, 58]. Viime vuosikymmenen aikana, GAPDH (glyseraldehydi-3-fosfaattidehydrogenaasi) pidettiin taloudenhoito geeni ja oli kontrollina yhtäläistä lastaus aikana kokeellisen prosessin. Kuitenkin on osoitettu, että GAPDH-ilmentyminen vaihtelee eri kudoksissa. Lisäksi GAPDH ilme vaihtelee johtuen hapen paineen [59], ja ekspressiotasot GAPDH vaihtelevat Munanjohdin syövät ja munasarjan syövät [60]. Perusteella GAPDH mieltymys AU-rikas elementtejä, on osoitettu, että GAPDH voi sitoutua CSF-1: n 3′-UTR, että mRNA: n stabiloimiseksi [60]. Yhteenvetona, jossa yhdistyvät kaikki todisteet, tubuliinia proteiineja ja GAPDH voi tuoda uutta näkökulmaa syövän tutkimuksiin, ja on ehdotettu, että niitä ei käytetä kontrolleina western blot-analyysi eri syöpätyyppien.
Muita valikoituja proteiineja ovat fosfataasit, transkription aktivaattorit, linkkerin proteiineja ja transferriini reseptoreihin: GATA3 on transkriptioaktivaattorina korkeat ekspressiotasot [61] ja kolmanneksi useimmin mutatoitunut geeni rintasyövän [62]. Näin ollen, GATA3 on osoittautunut hyödylliseksi immunohistokemiallista markkeri ennustaa kasvaimen uusiutumisen aikaisin etenemistä rintasyöpä. PEA15, kuten monitoiminen linkkeri proteiini ekspressoituu pääasiassa soluissa hermoston, kuten astrosyytit [63], ohjaa erilaisia soluprosesseja, kuten solujen selviytymistä, proliferaatiota, migraatiota ja tarttuvuus [64]. PEA15 toimintoja erilaisissa syövissä ja totesi glioblastooma, astrosytooma, ja maitorauhasen sekä ihosyöpiä. PEA15 voi olla sekä anti (in munasarjasyöpäpotilailla [65]) ja pro- (glioblastooma [66]) tuumorigeenisia toimintoja riippuen sen vuorovaikutusta. TFRC on transferriini-reseptori. Se on merkittävä rauta tuoja useimmissa nisäkässoluissa. On osoitettu, että TFRC proteiinit lisäävät rintasyövän, pahanlaatuinen haimasyöpä, ja muut syövät [67, 68]. PKC-a koodaa PRKCA geeni ja on seriiniä ja threonine- erityisiä kinaasi. Tämä geeni ilmentyy voimakkaasti useita syöpiä, ja korkea aktivointi PKC-a on tunnistettu edistämään Genesis rintasyövän [69].