PLoS ONE: kehittäminen ja alustava arviointi Monimuuttuja indeksi määritys Munasarjojen Cancer

tiivistelmä

Background

Useimmat naiset, joilla on kliininen esitys johdonmukainen munasarjasyöpä ovat lieviä sairauksia. Siksi menetelmiä erottamaan naisten munasarjasyövän niistä lieviä sairauksia sairastavien olisi hyödyllistä. Kuvaamme kehittämisen ja alustava arviointi seerumipohjaista monimuuttuja määritys munasarjasyöpä. Tämä hypoteesi perustuva tutkimus tutki informatiivinen tyyppi voidaan havaita I vaiheessa sairaus, joka jatkuu läpi myöhemmissä vaiheissa.

Menetelmät /Principal Havainnot

Sera, kerätään yhdenmukaisin protokollien useista laitokset, jotka edustavat 176 tapausta ja 187 valvontaa naisilta esittää leikkausta tutkittiin käyttäen suuren läpimenon, multipleksoitu immunomääritykset. Kaikki vaiheet ja yhteiset alatyypit epiteelin munasarjasyöpä, ja yleisin hyvänlaatuinen munasarjojen olosuhteet olivat edustettuina. Paneeli 104 antigeenejä, 44 autoimmuuni- ja 56 tartuntatautien merkkiaineiden tutkittiin ja informatiivinen yhdistelmiä tunnistettu. Käyttämällä koulutus joukko 91 vaiheen I aineistoja, jotka edustavat 61 yksittäiset näytteet, ja vastaava määrä tarkastuksia, 11-analyytin profiilin, joka koostuu CA-125, CA 19-9, EGF-R, C-reaktiivisen proteiinin, myoglobin , apolipoproteiini A1, apolipoproteiini CIII, MIP-1α, IL-6, IL-18 ja tenaskiini C tunnistettiin ja näyttää informatiivinen kaikissa vaiheissa ja yhteinen alatyyppejä munasarjasyöpä. Käyttämällä testaus joukko 245 näytettä, noin kaksi kertaa mallin koko rakennuksen asetettu, luokittelija oli 91,3% herkkyys ja 88,5% tarkkuus. Vaikka nämä alustavat tulokset ovat lupaavia, vielä hiottava ja laaja validointi luokittelija kliinisessä tutkimuksessa on tarpeen määrittää, jos koe on kliinistä arvoa.

Johtopäätökset /merkitys

Kuvaamme veren- määrityksessä käytetään 11 ​​analyyttejä voidaan erottaa naisten munasarjasyövän niistä hyvänlaatuisia olosuhteissa. Alustava arviointi lajittelijan viittaa sillä on mahdollisuudet tarjota noin 90% herkkyys ja 90% tarkkuus. Vaikka lupaavia, suorituskyky on arvioitava pidennetyn kliinisessä validointitutkimusta.

Citation: Amonkar SD, Bertenshavv GP, Chen T-H, Bergström KJ, Zhao J, Seshaiah P, et al. (2009) kehittäminen ja alustava arviointi Monimuuttuja indeksi määritys munasarjasyöpä. PLoS ONE 4 (2): E4599. doi: 10,1371 /journal.pone.0004599

Editor: Ewout W. Steyerberg, University Medical Center Rotterdam, Alankomaat

vastaanotettu: 21 marraskuu 2008; Hyväksytty: 14 tammikuu 2009; Julkaistu: 25 helmikuu 2009

Copyright: © 2009 Amonkar et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Kaikki kirjoittajat työskentelevät Correlogic Systems, Inc.

Kilpailevat edut: Kaikki kirjoittajat ovat kokopäiväistä työntekijöitä Correlogic Systems, Inc. ja on optio oikeuksia. Correlogic Systems, Inc. on patenttihakemuksia näkökohtia tämän työn.

Johdanto

Munasarjasyöpä on tappavin gynekologinen syöpä Yhdysvalloissa [1]. Vuonna 2008 arviolta 21650 uutta tapausta munasarjasyövän havaitaan. Varhainen diagnoosi on liitetty 92% 5 vuoden pysyvyys, mutta vain 19% munasarjojen syöpiä havaitaan aikaisessa vaiheessa [1], [2]. Suurin osa havaituista tapauksista ovat pitkälle sairaus, jossa 5-vuoden eloonjäämisluvut naisten alueellisten maligniteetin ja etäinen taudin ovat 71% ja 30% vastaavasti. Tämän seurauksena yli 15000 naisia ​​kuolee munasarjasyövän Yhdysvalloissa vuosittain [1].

varhainen oireet munasarjasyövän, jotka sisältävät lantion ja vatsakipu, virtsan kiireellisyyden ja taajuus, vatsan turvotus, ja vaikeus syöminen ovat epäspesifisiä, ja tyypillistä monille ei-syöpä ja hyvänlaatuinen edellytykset [3]. Siksi diagnoosi ei yleensä tapahdu ennen kehittämistä joko merkittävän määrän vatsaontelon nestettä, tai lantion massa, havaitaan lääkärintarkastus tai radiologisia arviointi [4]. Tuoreessa raportissa on esitetty, että ainutlaatuinen yhdistelmä oireita, jos täysin dokumentoituja kullekin potilaalle, voi olla enemmän informatiivinen kuin aiemmin tunnustettu, vaikka havaintoja on vielä validoitu [5]. Monet raportit osoittavat, että yleisimmin käytetyt kuvantamismenetelmät – transvaginal sonography (TVS), positroni-emissiotomografisen (PET), magneettikuvausta (MRI), Radioimmunoskintigrafia ja tietokonetomografia (CT) ei ole riittävää spesifisyyttä erottamaan hyvän- että pahanlaatuisia munasarjojen sairaus [6]. Eräät viimeaikaiset tutkimukset ovat osoittaneet, että ultraääni yksin tai yhdessä muiden ennustetekijöiden muuttujat voivat olla huomattavasti enemmän tietoa käsissä erikoistunut munasarjojen ultraäänitutkimus asiantuntija [7], [8], mutta monet potilaat eivät ole pääsyä taitoja tällaisia ​​asiantuntijoita. Lisäksi selkeä diagnoosi vaatii yleensä vähintään se, kirurgisen toimenpiteen muodossa laparotomy tai laparoscopy. Siksi tarkka, informatiivinen, mutta ei-invasiivisia, testi olisi kliinistä arvoa.

Ei ole FDA-hyväksyttyjä biomarkkereiden diagnosoimiseksi munasarjasyöpä, tai triage naisten epäillään olevan munasarjasyöpä . Huolimatta laajasta käytöstä, syöpäantigeenipep- 125 (CA-125) on ainoa FDA-hyväksytty valvontaan uusiutumisen ja hoitovaste [9] – [11]. Tutkimuksissa naisten, joilla tiedetään tai epäillään munasarjasyöpä, raportoitujen herkkyydet CA-125 havaitsemisessa vaiheen I ja II syöpiä vaihtelevat suuresti 29-75% ja 67-100%: lla. Kuitenkin CA-125 on koholla monenlaisia ​​normaali, hyvän- että pahanlaatuisia olosuhteet [12] – [14] ja 86% naisista, joilla oli epänormaali CA-125 testejä ratkaista 3-6 kuukaudessa [15]. Monia lähestymistapoja on pyritty parantamaan ennustearvo CA-125 sarjasiirrostuksilla mittaukset [16], [17] tai yhdistelmässä muiden merkkiaineiden [18] – [21]. Kuitenkin yksinkertainen ja kliinisesti käytännöllinen munasarjasyöpä-seulonta väline edelleen heikko.

Tuoreessa tutkimuksessa [22] on kuvattu paneeli kuusi merkkiaineiden – CA-125, prolaktiini, leptiini, makrofagin estävä tekijä (MIF), osteo- ja insuliinin kaltainen kasvutekijä II (IGF-II), joka, kun se yhdistetään oli erittäin suuri herkkyys (95,3%) ja spesifisyys (99,4%). Testi on tarkoitettu näyttö korkean riskin naisilla kuitenkin viimeinen suoritusarvot eivät arvioida korkean riskin naisilla ja mukana näytteitä myös tarkoitus rakentaa malleja, jotka voivat aiheuttaa yli-arvio lajittelijan suorituskykyä. Lisäksi ja poissulkukriteereitä osallistujille ei määritellä selkeästi, sekä syövän ja ohjaus näytteet kerättiin eri hoitopaikassa, mikä voi johtaa harhaanjohtava otanta asetettu. Prolaktiini ja IGF-II raportoitiin kumpaakin olevan erikseen informatiivisempi kuin CA-125, tässä tutkimuksessa, mutta tämä on ristiriidassa raportit muiden riippumattomien näytejoukoille [23], [24]. Toisessa tutkimuksessa, Moore ja työtovereiden käyttää logistinen regressio löytää merkki yhdistelmiä pystyy erottelemaan hyvän- ja pahanlaatuisten sairauksien naisten lantion massat [25]. Yhdistämällä HE-4 ja CA-125, 76,4% herkkyys ja 95% tarkkuus saavutettiin. Vaikka lupaavia, vain 67 233 näytettä olivat yksilöiden munasarjasyöpä ja vain 15 niistä naisilta vaiheen I ja II syöpiä. Lisäksi on raportoitu suorituskyky perustui ristivalidointi tuloksia josta puuttui itsenäinen holdout näytesarja.

Munasarjasyöpä on kokoelma erilaisia ​​yhteisöjä yli 30 alatyyppejä maligniteetteja, joista jokaisella on erottuva histologia, patologia ja kliininen käytös [26]. Monimuotoisuus ja alhainen ilmaantuvuus munasarjasyövän vaikeuttaa etsintää biomarkkerit. Erillisessä, post-hoc-analyysi, osajoukon näytteistä käytetään esillä olevassa tutkimuksessa, emme pystyneet tunnistamaan yhden merkki kykenee itse ennustaa tarkasti läsnäolon munasarjasyöpä [24]. Tässä Tässä tutkimuksessa kuvaamme kehitystä ja alustava arviointi usean analyytin profiilin, joka voi luokitella naisia ​​epäillään olevan munasarjasyövän, noihin ja ilman munasarjasyöpä.

Methods

Sample kohortti

Kaikki mutta 20 näytteet olivat peräisin kudoksesta-pankki varasto National Cancer Institute rahoittamassa Gynecologic Oncology Group (GOG, Columbus, OH, taulukko 1, taulukko S2). Kirjallinen suostumus saatiin Gujaratin kaikille osallistujille ja Gujaratin Institutional Review Board (IRB) hyväksytty käyttö näytteiden tutkimuksessamme. Nämä näytteet kerättiin useita sivustoja, pöytäkirjojen mukaisesti hyväksymien Gujaratin IRB. Sopivilla potilailla oli naisia ​​suunniteltu leikkaus epäluuloisesti ottaa gynekologinen syöpä tai suunniteltu ennaltaehkäisevään leikkauksen vuoksi lisääntynyt munasarjasyövän riski (1. tai 2. asteen sukulainen kanssa tauti). Kaikki näytteet, mukaan lukien ne luokitellaan normaalit, leikkauksen, kerättiin ennen mitään diagnostista tai terapeuttista väliintuloa. Seerumin alikvootteja välitti Correlogic Systems, Inc. ® (Rockville, MD) oli purettu tunnistettu ja koodattu ainutlaatuinen GOG tunniste. Kukin näyte mukana täydellinen clinicopathology raportin, potilaan ikä ja rotu, ja de-tunnistettu koodi ilmaiseva keräyspisteeseen. Patologia oli tarkastettu ja hyväksytty Ghanan patologit johdonmukaisuuden varmistamiseksi. Näytteet valitaan Ghanan kokoelma tasapainottaa potilaan ikäjakauman, jona seerumin keräys ja edustus tapauksissa ja valvontaan kaikkialla keräyspisteeseen. Loput sera koostui 20 näytteiden yksilöiden hyvänlaatuinen kunnosta joko Correlogic mahdollinen kokoelma, joka käyttää samanlaista seerumin kokoelma protokollaa. Kirjallinen suostumus saatiin kaikilta osapuolilta. Correlogic n ”mahdollinen” näytteet kerätään alle IRB hyväksynnän tukemaan kliinisen testin munasarjasyöpä. Tutkimusaineisto on naisia, joilla oli oireita munasarjasyövän ja suunniteltu leikkaus. Sinänsä tautinsa vahvistaa patologian leikkauksen jälkeen. 20 näytteitä otettiin mahdollinen kokoelma tavalla vältetään toteuta bias osaksi jäljellä keräämistä ja sinänsä ei tarkoituksella valittu edustamaan mitään tiettyä väestöä. Tutkimuksen hyväksyi Länsi IRB (Olympia, WA) ja IRB kunkin osallistuvan sivuston.

Serum Processing, varastointi, käsittely ja Lähetyksen

Verinäytteet (5- 20 ml) kerättiin punainen alkuun lasi Vacutainer putkilla (Becton-Dickinson, NJ), hyytynyt ja 30-180 minuutin ajan 4 ° C: ssa, ja sitten sentrifugoitiin 3500 g: ssä 10 minuutin ajan 4 ° C: ssa. Seerumi dekantoitiin kryoputkiin ja säilytettiin nopeasti -80 ° C: ssa. Alikvootteja varastosta oli lähetetty Correlogic kuivajäässä ja niitä säilytettiin välittömästi -80 ° C: ssa. Jäädytetyt näytteet lämmitettiin varovasti käsin, kunnes melkein sulanut, valmiiksi jäällä, vorteksoitiin, alikvootit 150 ul määriä ja pakastaa uudelleen -80 ° C: ssa. Lopuksi näytteet toimitetaan kuivajäässä työjärjestyksen-Based Medicine, Inc. (RBM, Austin, TX). Tähän liittyvää asiakirjaa koodatun näytteen tunnusnumero ja tietty järjestys analyysi. RBM analyyttinen sivusto oli täysin sokeita kaikki näytteen tiedot myös taudin tilasta.

Multiplex Immunoanalyysit

Multipleksattu immunomäärityksiä on kuvattu muualla [24]. Lyhyesti, kaksi kierrosta multipleksoidun immunomäärityksiä tehtiin mekanismien niiden Luminex-pohjaista CLIA-sertifioitu laboratorio. Analyyttejä kvantitoitiin viittaamalla 8 pisteen kalibrointikäyriä ja koneen suorituskykyä varmistettiin käyttämällä kolmea laadunvalvonta (QC) näytteet jokaista analyytti. Laadunvalvonnan näytteet jaettiin suhteellisen tasaisesti dynaaminen alue määrityksen matalaksi, keski- ja korkean tason ja oli yleensä kertoimet varianssi alle 15%. Kalibrointivaatimukset ja laadunvalvonnan näytteet olivat monimutkaisen plasma-pohjainen matriisi vastaamaan näytteen tausta ja analysoitiin kahtena kappaleena. Ensimmäisellä kierroksella, yhteensä 204 analyyttien edustavat 104 antigeenejä, 44 autoimmuuni- ja 56 tartuntatautien molekyylejä mitattiin 147 epiteelin munasarjasyöpä näytteitä (40 vaiheessa I, 23 vaihe II, 67 vaiheen III, 12 vaihe IV, viisi unstaged) ja 149 kontrollinäytteitä (104 hyvänlaatuinen olosuhteet, 29 terveillä, 14 muiden syöpien ja kaksi matalaa pahanlaatuistumisriskin) käyttäen omaa Multipleksoituja immunomäärityksiä (taulukko S1). Toinen kierros analyysi suoritettiin 86 päivää ensimmäisen jälkeen analyyttinen kierroksen, on 104 antigeenejä, käyttäen toista seerumia näyte, joka oli joutunut samanlaiseen jäädytys /sulatus historiaan käytettyjen näytteiden pyöreä. Johtuen näytetilavuus rajoituksia, 27 näytteitä ei analysoitiin uudelleen kierroksella kaksi. Siten kierroksella kaksi, 132 munasarjasyöpä näytteitä (30 vaiheessa I, 21 vaihe II, 65 vaiheen III, 11 vaihe IV ja viisi unstaged) ja 135 valvontaa (94 hyvänlaatuinen olosuhteet, 28 terveillä, 13 muut syövät) on analysoitiin uudelleen. Lisäksi vielä 69 näytettä, jotka eivät sisälly pyöreä, analysoitiin (21 vaiheessa I, kahdeksan vaiheen II, 36 hyvänlaatuinen, kolme normaalia tervettä ja yksi paksusuolen syöpä). Sekä kierrosta analyysin luokkaa analyysin perustettiin vältetään peräkkäinen bias sairauden esiintyminen tai puuttuminen, alatyyppi tai taudin vaiheeseen, potilaan iän tai ikä seeruminäytteessä. Yleensä näytteet vuorottelevat tapausten ja kontrollien välillä.

Data Handling

Koska seerumit analysoitiin aikaisemmin optimoitu laimennus, kaikki näytteet, jotka ylittävät suurimman pitoisuuden kalibrointikäyrä mielivaltaisesti pitoisuuden korkeimmalle, kun taas määritettiin alle minimitason pitoisuuden kalibrointikäyrän oli osoitettu arvo 0,0. Yksi määritys (IL-1α), joka osoitti ole vaihtelua ilmaisua kaikissa näytteissä pidettiin muuttumaton /epäinformatiivisia ja poistettava uutettu keräämiseen. Loput tiedot sitten skaalataan biweight mittakaavassa; vankka ja tehokas skaalaus mekanismi, joka selittää varianssi kunkin yksittäisen määritykset [27]. Yksi asteikosta kunkin määrityksen määritettiin populaatiossa painotettu tavalla. Jokainen määritys saadaan skaalauskerroin nolla poistettiin keräämiseen. Tuloksena data sitten viedä yksittäisiä tiedostoja missä jokainen tiedosto edusti tulokset kaikista päteviä määritysten yhden näytteen.

Modeling – ”Out-of-Bag” virhearviointi ja Bootstrap Validation

minimoida näytesarja bias ja tukea arvioinnissa väli- malleja, käytimme kolmasosa ”out-of-bag” (OOB) virhearviointi ja ulkoisen 100-kertainen bootstrap validointi 10% tunkeutumattomuuden kenkiin. Nämä bootstrap arvioiden perusteella voitiin voimme arvioida mahdollinen arvo monia malleja käytetään vain harjoitusdatasta. Näin pystyimme säilyttämään itsenäisyytensä ruuman-out testaus joukko näytteitä. Vasta kun tietty luokittelija oli lukittu jäljitettävissä asiakirjojen hallintajärjestelmä (DMS) olivat hold-out testaus joukko tietoja testata suorituskykyä valitun mallin.

Modeling – proof-of-periaate luokitin

Aluksi mallinnus suoritettiin tuotetut tiedot pyöreä (kuva 1) käyttämällä muunnelmaa Breiman Random Forest koodi [28]. Menetelmää parannettiin liittämällä erä automaatio, lisäämällä ulkoinen kerros bootstrap, joka tarjoaa mahdollisuuden hallita ajaa parametrit, ja räätälöintiä lähtö. Tuloksena puita tallennettu ja oma rutiini käytettiin pisteet näytteitä ja tuotanto näytteen tiedot, todennäköisyys tulokset, ja luokittelun tuloksena. Neljäkymmentä vaiheen I munasarjasyöpä ja 40 kontrollinäytteiden käytettiin mallin rakentamiseen. Kontrollit valittiin, jotta mallintaminen joukko edustaa samassa suhteessa normaalin hyvänlaatuisia ja muu syöpä olosuhteissa kuin koko säätösetti kuitenkin kussakin näistä ryhmistä, näytteet valittiin satunnaisesti. Mallinnus optimoida vaihtelemalla sekä puun määrä (50, 100, 500 ja 1000) metsässä, ja määrä biomarkkerit (5, 10, 15, 20, 25, 30, 35, 40, 45, 50) tutkitaan at kunkin haarautuvan piste, jolloin 40 malleissa. Näistä malleista, 20 eniten informatiivinen analyyttien tunnistettiin käyttämällä vaihtelevasti arvoa. Toisessa vaiheessa, sarja malleja rakennettiin jotka rajoittuivat tärkeimpiä analyytti (1-aineen malli), kaksi tärkeintä analyyttejä (2-aineen malli) ja niin edelleen 20 analysoitavan malli, yhteensä 20 malleja. OOB ja ulkoinen bootstrap virheitä, ja niiden keskihajonnat, esitettiin taulukkomuodossa kullekin näistä malleista. Näistä tuloksista määritettiin, että vähintään seitsemän analyyttien tarvittiin suurempia tarkin luokitusta. Lopullinen, yksittäinen, malli sitten rakennettiin näistä seitsemästä analyyttien ja talletetaan DMS kuin ”lukittu” malli.

Modeling – Final luokitin

Lopullinen mallinnus sisällytetty kaikki vaiheessa Olen syöpä tietoja kierroksilla yksi ja kaksi, mukaan lukien kaksoiskappaleet – yhteensä 91 vaiheen I aineistoja, jotka edustavat 61 ainutlaatuinen näytteet ja sama määrä tarkastuksia, Hyväksytty kuten ennenkin, ja tasapainoinen samalla kierroksella yksi pyöristää kahden suhde (kuva 1). Vain nämä tiedot asetetaan (eli koulutus set) käytettiin pienoismallit ja valinta. Kuvio analyysi tehtiin käyttämällä ainutlaatuista, patentoidun algoritmin, Knowledge Discovery Moottori-VS (KDE-VS ™). KDE-VS hyödyntää ryhmä äänestää rakenteiden samanlainen päätös puita ainutlaatuisen menetelmän rakennuksen ja määritellään raja-arvot kussakin äänioikeuksissa käyttäen paitsi mitattu arvo analyytin myös laboratorio-pohjainen liittyvä virhearvio että mittaus johdettu historiallinen QC mittaukset kullekin analyytille. Käyttäjä voi vaihdella murto arvo virhearvio sisällytetty luokittelija aikana mallinnus. Tuloksena on vankka luokittelija, joka kestää merkittävän häiriön kokeellisesti määritetty pisteen arvot analyytin pitoisuuksia. Aikana malli rakennus, kunkin päätelaitteen solmun äänioikeuksissa osoitetaan tiettyyn tilaan – joko munasarjasyöpä tai ei-munasarjasyöpä. Pisteet tuntematon, meidän ohjelmisto poimii arvot analyyttien mitkä solmuun näyte putoaa.

Kaksi erilaista mallinnus kulkee, jossa murto-arvo virhe toleranssit 1,0 ja 3,0, tehtiin käyttäen tietoja että 104 antigeenimäärityksillä. 20 vahvin analyytit määritettiin kussakin ajossa ja nämä sitten kootaan kattava joukko 7-merkki malleja. Kuitenkin kaikki mallit vaadittiin sisältää muuttumaton ydin kolmen vahvin ja informatiivinen analyytit, eli CA-125, C-reaktiivisen proteiinin ja EGF-R, joka vähensi haku tilaa 2380 yhdistelmiä. Sekä tasoilla virhetoleranssin tunnistimme kymmenen herkin ja kymmenen tarkinta malleja – eli yhteensä 40 mallia. Taajuus käyttää sekä yksittäisten analyyttien ja erilaisten analysoitavan yhdistelmiä kaikissa 40 malleissa johti tunnistamiseen 11 analyyttejä, jotka yhdessä näytti vahvalta ja informatiivinen. Lopuksi, yksi malli rakennettiin seuraavilla 11 analyyttien ja lukittu DMS. Vasta lukitsemisen jälkeen mallin olivat jäljellä olevat tiedot, ei käytetty koulutuksessa, sijoitettiin testata mallin (kuva 1).

Data Analysis

luottamusvälit laskettiin Newcombe menetelmää [29] .

tulokset

alustava arviointi Proof-of-periaate luokitin

ensimmäinen joukko tietoja, generated 147 munasarjasyöpä ja 149 ei-munasarjasyöpään kontrollinäytteitä oli käytetään tutkimaan mahdollisuuksia käyttää suurikapasiteettisten multiplex immunomääritys alustan löytö työkalu. Oletimme, että luokitus malli vaiheen I munasarjasyöpä jatkuisivat läpi kaikki myöhemmin sairauksia, joten vain vaihe I syöpä näytteitä käytettiin mallin kehittämiseen. Tämä lähestymistapa myös tasapainottavat keski-ikä on tapaus ja verrokeilla, poistamalla ikääntymiseen liittyvien bias aikana mallintaminen (taulukko 1). Kautta useita kierroksia rikastamiseen kaikkein informatiivinen biomarkkerit vetämänä arviointi bootstrap virheet mallin kehittämiseen vedostulostus, 7 analyytin malli kehittynyt, joka koostuu CA-125, EGF-R, C-reaktiivinen proteiini, apolipoproteiinit CIII ja A1, IL-18 ja tenaskiini C. Tämä vaihe I erityisprofiilin oli lukittuna DMS. Vasta kun malli lukittu DMS oli tiedot näytteiden testaamiseen (niitä ei käytetty mallinnus) käsiksi ja tekee mallin tulosten esittämisessä kuvattu alla (kuva 1).

Koska kaikki vaiheen I tuotetut tiedot ensimmäisellä kierroksella määrityksiä oli käytetty mallinnuksessa ei ollut riippumatonta tietoa testivaiheessa I herkkyyttä. Kuitenkin 100-kertainen bootstrap arvio vaiheen I herkkyys oli 87% (taulukko 2). Bootstrap arvio spesifisyyden perusteella tarkastuksia käytetty malli kehitys oli 82,3%. Luokitin arvioitiin sitten käyttäen pyöreä näytteiden testaamiseen, joukko riippumattomia näytteitä ei käytetä missään näkökohta mallin kehittämiseen. Luokitin oli 95,3% herkkyys ja 70,6% tarkkuus. Suorituskykyä hyvänlaatuinen näytteissä oli alempi (67,1%) kuin muita tarkastuksia. Ei ole olemassa yhtä alatyyppiä syöpä, joka teki merkittävästi erilainen kuin muut ja kun jaoteltuina vaiheessa herkkyys vaihteli hieman (94,0-100%), joka tukee oletusta, että vaiheen I malli voisi jatkua läpi kaikissa vaiheissa taudin. Sen jälkeen toinen kierros määrityksissä ympärillä kaksi data pisteytettiin tästä lukittu malliin. Näytteet yhteiset pyöreä osoitti toistettavan suorituskyvyn 97,1% herkkyys (95% CI, 91,0-99,2%) ja 74,5% spesifisyys (95% CI, 64,7-82,4%). Ylimääräinen 69 näytteitä, joita ei ole aiemmin analysoitu, edellyttäen toinen testaus asettaa ja tuotti 85,7% herkkyys portaalle I, 100% herkkyys II vaiheessa ja 67,5%: n spesifisyys.

alustava arviointi Final luokitin

proof-of-periaatteen luokittelija vahvisti hypoteesia, että käyttämällä vain vaiheen I tiedot sekä mallin kehittämiseen ja arviointiin voisimme tunnistaa informatiivinen kuvion, joka voi olla olemassa ja jatkuu läpi myöhemmissä vaiheissa syöpä. Siksi pyrimme kehittämään vaiheen I mallin edelleen käyttää kaikkia vaiheen I näytteet käytettävissä. Sama mallinnus strategia toistettiin kaksi tärkeää muutoksin. Ensin toinen, algoritmin toteutettiin, ja toiseksi, kaikki vaiheen I analysoidut näytteet poikki sekä kierrosta yksi ja kaksi käytettiin kasvattaa mallin kehittämisen datajoukon (kuvio 1). Mallinnus strategia kävi läpi useita iteratiivisia vaiheita rikastuttaa kaikkein informatiivinen biomarkkerit, perustuu arvioon ainoastaan ​​vaiheen I koulutuksen tiedot ennen huipentui lähes tyhjentävä haku biomarkkereiden yhdistelmiä, jotka tuotetaan 2380 malleja. Neljäkymmentä mallit valittiin perustuen niiden bootstrap herkkyys ja spesifisyys lavalla I vedostulostus. Vertaamalla biomarkkereiden yhdistelmät näissä top 40 mallit (taulukko 3), ja ottaen huomioon tasapaino he osoittivat bootstrap tarkkuus, herkkyys, spesifisyys, ja keskihajonnat, lopulliset 11 informatiivinen biomarkkereiden tunnistettiin. Tietyt aineen yhdistelmät olivat yleisiä monissa malleissa, ja oli selvästi ”korvausmalleja”, jossa toinen analyytti tai yhdistelmän analyyttien voisi tuottaa vastaavia malleja. 11 biomarkkerit – CA-125, C-reaktiivinen proteiini, EGF-R, CA 19-9, apolipoproteiinit A1 ja CIII, myoglobiinia, MIP-1α, IL-6, IL-18 ja tenaskiini C – koottiin lopulliseen malliin käyttäen KDE-VS algoritmi ja lukittu DMS kuin lopullinen malli (kuva 1).

Aluksi testi luokittimen suorituskykyä, kaikki data ei käytetä mallissa kehittämiseen pisteytettiin, jolloin saatiin 91,3 % herkkyys ja 88,5% spesifisyys (taulukko 4, kuvio 1). Erityisesti vaihe II herkkyys oli 83,9% ja suorituskykyä hyvänlaatuinen näytteistä parani 90,4%. Muita vaihe I näytteitä ei ollut saatavilla, tuolloin, testaukseen tämä esitys. Kuitenkin bootstrap arvio herkkyyden harjoitussarjassa oli 83,4% vaiheen I taudin ja 84,2% (± 12,5%) spesifisyys (taulukko 4). Erillisenä liikunta, kaikki päällekkäiset tiedot kierroksella kaksi ei käytetty mallissa kehittämiseen pisteytettiin. Kuten odotettiinkin edellisestä tuloksista, suorituskyky oli samanlainen 96,1% herkkyys (95% CI, 89,7-98,7%) ja 88,1% spesifisyys (95% CI, 80,8-93,0%) ja hyvänlaatuinen näytteiden teki 87,0% (95% CI, 76,2-93,5%). Tarjota viitekehyksen, vertasimme mallin tehokkuuden kuin kliininen päätös perustuu CA-125 ekspressiotasot. Koska raja-arvo on 35 IU /ml on jo perustettu, täydellinen datasarja käytettiin arvioitaessa ennustearvo CA-125. Tämän raja-arvon, CA-125 saatiin 94,9% herkkyys ja 58,6% spesifisyyttä (taulukko 5). Vaiheen I näytteitä yksin, herkkyys laski 88,5%.

toteutettu kahdella tavalla merkityksen arvioimiseksi eri analyyttien yleistä luokittelija. Ensin arvioidaan mallin tehokkuuden kun kaikki paitsi yksi analyytti pidettiin vakiona tiedostoihin, joiden arvo valitun analyytin satunnaistettu. Tämä toistettiin peräkkäin jokaista analyytti. Suhteellinen arvo kunkin aineen sitten paremmuusjärjestykseen mitkä analyyttiin aiheutti luokituksen suorituskykyä laskevan eniten kun satunnaistettu. Havaitsimme, että biomarkkereiden merkityksestä yleensä ryhmitellä. Erityisesti, CA-125 on tärkein biomerkkiaineen, minkä jälkeen ryhmästä, joka koostuu C-reaktiivisen proteiinin, CA 19-9 ja EGF-R, jota seurasi MIP-1α, jonka jälkeen myoglobiinin, apolipoproteiini CIII, apolipoproteiini A1, IL-18 ja IL-6 ja lopulta tenaskiini C. toisena estimointimenetelmä analyytin tärkeää, olemme analysoineet haarakohtiin äänestyksen rakenteita. Kaikissa haarakohtiin äänestyksen rakenteiden, CA-125 oli mukana eniten (15,8%) ja sen jälkeen CA 19-9 (12,1%), myoglobiinin (11,1%), C-reaktiivisen proteiinin (10,8%) ja EGF-R (9,9%). CA-125 hyödynnettiin 80% huipputason haarakohtiin, jotka edustavat ensimmäinen suuri näytteen ositus, jota seuraa C-reaktiivisen proteiinin (11,2%), EGF-R (5,0%) ja CA19-9 (1,8%). Tällä toisen tason, CA19-9 on käytetty useimmin (20,3%), jota seurasi EGF-R (18,8%), CA-125 (11,4%), myoglobiinin (9,8%), tenaskiini C (8,0%), IL-18 (7,2%), ja apolipoproteiini A1 (6,9%). Akuutin vaiheen markkereita MIP-1α ja IL-6 nähtiin vain 6,2% ja 1,3% vastaavasti tällä tasolla.

Keskustelu

Tässä tutkimuksessa tunnistettiin luokitus malli munasarjasyövän seerumin proteomiin potilailla, joilla on vaiheen I sairaus, joka näkyy edelleen läpi myöhemmin tauti. Sairastavien potilaiden seerumi patologi-vahvistettu ehdot – tai ilman epiteelin munasarjasyöpä – profiloitiin käyttäen helmi-pohjainen monen analyytin profiloinnin lähestymistapaa. Analyytit kuuluvat laaja valikoima biologisia rakenteita ja toimintoja, mukaan lukien syövän antigeenejä, hormoneja, hyytymistekijät, kudosmallinnus tekijät, lipoproteiini ainesosia, proteaasit ja proteaasi-inhibiittorit, markkereita sydän- ja verisuonitautien, kasvutekijät, sytokiini /kemokiinit, liukoiset muodot solu- signalointi reseptoreita, ja tulehdus- ja akuutin vaiheen sekä markkereita autoimmuniteetin ja infektio (taulukko S1). Kaksi erillistä määritystä näytteiden suoritettiin 86 päivää välein. Oli useita reagenssi paljon ja erän muutokset tänä aikana, joka tarjoaa todellisen maailman haaste luotettavuutta taustalla määritykset ja mallin.

neljä pääkomponentit olivat kriittinen onnistumisen tämän tutkimuksen. Ensinnäkin, se oli välttämätöntä tunnistaa erittäin tasainen, hyvin dokumentoituja ja kliinisesti edustava otos joukko vahvisti tapauksissa ja valvontaa. Munasarjasyöpä, vahvistus voi tulla vain patologinen tarkastelu kirurgisesti poistettu kudos. Valitsimme seeruminäytteistä hyvin tunnettu kokoelmia naisilta jo suunniteltu leikkaukseen. Valtaosaa valvonnan tässä potilasryhmässä oli patologian varmistettujen lieviä olosuhteita, jotka perustuvat yhden muuttujan analyysiin, pitäisi aiheuttaa suuremman haasteen luokitusta kuin seerumeista oireettomia naisilla (kuvio 2; [24]). Toiseksi, käytimme paneeli täysin pätevä, suurikapasiteettisten, immunomääritykset, jotka mittaavat monenlaisten molekyylejä kuten autoimmuuni- ja tartuntatautien markkereita, ja laaja valikoima hyvin tunnettu seerumin proteiineihin, kuten aiemmin osallisina munasarjasyöpä. Kolmanneksi käytimme uusi monimuuttujatestausta mallintamiseen lähestymistapa tunnistaa vankka malli molekyylien informatiivinen munasarjasyöpä. Proprietary algoritmi (KDE-VS) parani luokitus suorituskykyä verrattuna Random Forest ja muut luokittelu algoritmeja rakentamalla vankka päätösrajat osaksi ääni- rakenteisiin, joka sisältää reaalimaailman kokeellinen vaihtelu osaksi datan mallinnettu. Lopulta oli selkeä ero näytteiden käytetään kehittämään ja tunnistamaan yhden informatiivinen malli, ja näytteet käytetään arvioimaan, että mallien suorituskyky.

Kunkin analyytin, laatikko-viiksi tonttien osoittavat: alin havainto, alempi kvartiili, mediaani, yläkvartiili, ja korkein havainto. Kaikki analyysit, mukaan lukien kaksoiskappaleet näkyvät. CA-125 – yksi munasarjasyöpä, 11 hyvänlaatuisia ja viisi normaalia näytettä alle alimman kalibrointiarvo; CA 19-9 – 14 munasarjasyöpä, 18 hyvänlaatuinen, yhdeksän normaali ja neljä muuta syöpänäytteissä alle alimman kalibrointiarvo; C-reaktiivinen proteiini – 93 munasarjasyöpä, 21 hyvänlaatuinen, kaksi normaalia ja kaksi muuta syövän näytettä edellä korkeimman kalibrointiarvoon; IL-6-82 munasarjasyöpä, 161 hyvänlaatuinen, 28 normaali ja 14 muuta syöpää näytteiden alle alimman kalibrointitasolle; MIP-1α – 50 munasarjasyöpä, 53 hyvänlaatuinen, 10 normaali ja neljä muuta syöpänäytteissä alle alimman kalibrointitasolle; Tenaskiini C – kaksi munasarjasyöpä ja yksi hyvänlaatuisia näytteen yläpuolella korkeimman kalibrointitasolle. OvCa, munasarjasyöpä; Ca, syöpä; Apo, apolipoproteiini; CA-125, syöpäantigeeni 125; CA 19-9, syöpäantigeenipep- 19-9; EGF-R, epidermaalisen kasvutekijän reseptori (liukoinen muoto); IL, interleukiini; MIP-1a, makrofagi tulehduksellinen proteiini 1 alfa.

Tutkimuksemme keskittyi analyysiin alkuvaiheessa taudin 50% syövän näytteen sarja edustaa vaiheissa I ja II tauti (taulukko 1). Yhdenmukainen kirjallisuuden potilaiden keskimääräinen ikä diagnoosin korreloi taudin vaiheesta diagnoosin (taulukko 1; [22]). Alatyypin jakelu oli tyypillinen Yhdysvaltain väestöstä, jossa on suurempi osuus vakavien (42%) ja endomet- (26%) karsinooma (taulukko 1). Kontrollinäytteissä tapahtui pääasiassa yksilöitä, joilla on yhteisiä hyvänlaatuinen munasarjojen olosuhteissa (75%), samoin kuin muut gynekologiset ja ei-gynekologisten syöpien (8%), ja pieni määrä ei-sairaiden näytteiden (17%), vastaa tarvetta kliinistä testiä oireenmukaiseen naisten (taulukko 1).

perustelut keskittyä alkuvaiheessa tauti oli kaksijakoinen. Ensinnäkin varhaisessa vaiheessa munasarjasyöpään pidetään parannettavissa, mutta monissa tapauksissa oireet ovat hienovaraisia ​​ja vaikea havaita.

Vastaa