PLoS ONE: Automaattinen Kasvain-Stroma Separation in Fluoresenssi TMA Mahdollistaa Quantitative suuren tuotantotehon analyysi Multiple Cancer Biomarkers
tiivistelmä
Tuleva kvantifiointiin ja automaation biologisten merkkiaineiden perustuu histologiseen kasvain arviointi edellyttää laskentamenetelmien kykenevät automaattisesti tunnistaminen kasvaimen alueilla ja erottaa ne strooman. Koska mikään yksittäinen yleispätevän kasvain biomarkkereiden on saatavilla, patologia rutiininomaisesti käyttää morfologiset kriteerit tilallisena vertailujärjestelmä. Me täällä läsnä ja arvioida menetelmää, joka pystyy suorittamaan luokittelu immunofluoresenssi- histologisia objektilasien ainoastaan käyttämällä DAPI tausta tahra. Koska rajoitus yhden värin kanava tämä on luonnostaan haasteellista. Muodostimme solu kaavioita perustuu topologinen kudoksen solujen tumaan ja uutetaan vastaavan kuvaajan ominaisuuksia. Käyttämällä topologinen, morfologisia ja intensiteetti perustuvat ominaisuudet voisimme systemaattisesti määrällisesti ja verrata syrjintä kyky yksilön ominaisuuksia edistää yleistä algoritmia. Me täällä osoittaa, että luokittelussa fluoresenssi kudoksen diat DAPI kanavalla, morfologiset ja intensiteetti perustuvat ominaisuudet selvästi nopeampana topologinen ne, joita on käytetty yksinomaan siihen liittyvien edellisen lähestymistapoja. Kokoonnuimme 15 parhaat ominaisuudet kouluttaa tukivektoriluokitin perustuu Keratiini värjätään kasvain alueilla. On testi joukko TMA 210 ydintä triple negatiivisen rintasyövän meidän luokittelija kykeni erottamaan kasvain ja strooman kudos yhteensä kokonaistarkkuus 88%. Meidän menetelmä tuottaa ensimmäiset tulokset syrjinnästä valmiutta piirteitä ryhmiä, jotka on välttämätöntä automaattisen kasvaimen diagnostiikka. Lisäksi se tarjoaa objektiivisen sijaintiviite järjestelmä multiplex analyysiä biomarkkereiden fluoresenssin immunohistokemiaa.
Citation: Lahrmann B, Halama N, Sinn HP, Schirmacher P, Jaeger D, Grabe N (2011) Automaattinen kasvain- Stroma Separation in Fluoresenssi TMA Mahdollistaa Quantitative suuren tuotantotehon analyysi Multiple Cancer Biomarkers. PLoS ONE 6 (12): e28048. doi: 10,1371 /journal.pone.0028048
Editor: Pierre Busson, Institute of syöpäoppi Gustave Roussy, Ranska
vastaanotettu: 21 syyskuu 2011; Hyväksytty: 31 lokakuu 2011; Julkaistu: 02 joulukuu 2011
Copyright: © 2011 Lahrmann et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Rahoitus oli edellyttäen Saksan valtion tutkimus- ja koulutus (BMBF) niiden MEDSYS ja FORSYS rahoitusohjelmia. Grant Numbers: 0315401B (MEDSYS), 0315263 (FORSYS). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
Automation immunohistologisilla kuvankäsittely on tällä hetkellä keskeinen teknologisen kehityksen tapahtuvia kliinisiä metsästää tavoite biomarkkereita tutkimuksessa ja diagnostiikassa. Syöpätutkimuksessa yksi tärkeä, mutta on myös äärimmäisen haasteita on kehittää menetelmiä automaattisen erottelun kasvain ja strooman kudoksen [1], [2]. Onnistuminen tässä tulee olemaan valtava vaikutus sovellettavuutta biomarkkereita rutiini syövän diagnostiikassa ja hoidossa sekä laajamittainen sukupolven histologiset kudosta tietojen tutkimustarkoituksiin. Tärkeä menetelmä rutiininomaisesti käyttää tässä yhteydessä jota täällä käyttävät kuvaamaan ongelma on Tissue Microarray (TMA) -tekniikka, otettiin vuonna 1998 [3]. TMA mahdollistaa samanaikaisen immunohistokemiallinen analyysi useita satoja kudosten yhden dian [4] – [6]. Mutta kuten yleensä kaikilla aloilla patologian, manuaalinen visuaalista pisteytystä TMA rutiininomaisesti perustuu kvantitatiivisen analyysin proteiinin tasot patologit tai muiden asiantuntijoiden on subjektiivinen, työvoimavaltaisia, on aikaa vievää ja mikä tärkeintä kärsii sisäisestä ja välisestä tarkkailija vaihtelevuus [7]. Ratkaisuksi loisteputki kykenee mikroskooppinen koko-slide skannerit ovat tulleet viime aikoina, mutta yhä vain harvoin, vaikka heillä on keskeinen rooli muuttamassa histologiseen arviointiin osaksi objektiivisuutta. Fluoresenssi perustuu värjäytyminen tässä on tärkeää, sillä se ratkaisee keskeinen ongelma brightfield tahrat objektiivista ja automaattista sieppaamiseen erillisten biomarkkereiden signaaleja [8]. Vaikka fluoresenssi auttaa kvantifiointia yksittäisten solujen, se ei sinänsä apua erottaa kasvain ja strooman. Fluoresenssin kudoksen diat usein vastavärjätään DAPI (4 ’, 6-diamino-2-fenyyli) ottaa roolin tavanomaisen tausta tahra. Tämä tekee kasvaimeen strooman erottaminen monimutkaisempi ensisijaisena visuaalisen informaation kudoksen rakenne on paljon vaikeampi tunnistaa, että DAPI kanavalla kuin kromogeenisen histologia. Histologinen biomarkkereiden jotka yksinomaan tahrata kasvainkudoksessa ei ole käytettävissä. Sen sijaan heterogeenisyys paikkatietojen proteiinin ilmentymisen kuvioita on luontaista syöpään. Erinomainen esimerkki tästä ovat aggressiivisia kolminkertainen negatiivinen rintasyöpä kudoksiin, jotka eivät ilmennä geenit arvokkain ennustetekijöiden markkeri kuten estrogeenireseptori (ER), progesteroni merkki (PR) ja ihmisen epidermaalisen kasvutekijän reseptori tyyppi 2 (Her2) [9]. Puuttuminen ilmentymiskuviot näiden biomarkkereiden salli jollakin ikinen niistä apuna proteiinin biomarkkereiden ja tekee sen olennaista erottaa syöpä terveistä /sidekudoksen jonka avulla tavoite, standardoitujen äänenmuokkausalgoritmit perustuu morfologisiin kriteereihin. Siten patologinen arviointi rutiininomaisesti käyttää morfologiset kriteerit kuin sijaintiviite järjestelmä määrittää kasvain alueen syöpä histologia. Olemme päätellä, että edut yhdistyvät fluoresenssi automaattisella kuvan hankinta ja käsittely edellyttää, että kehitetään algoritmeja kasvaimeen stroomaa erottaminen pelkästään siitä DAPI tausta tahra on usein käytetty immunofluoresenssilla.
Siksi täällä lähti kehittämään tällaisen automaattisen algoritmin perustuu vain DAPI kanavalla (kuvio 1 B-D). Useita menetelmiä erottamiseen syöpäkudoksen muista kudostyypeistä morfologiset kriteerit ovat saatavilla kirjallisuudesta. Amaral et ai. [10], [11] esillä kahdella eri menetelmällä, jolloin väri ominaisuuksia käytetään luokittelun koko TMA-ydintä. In [12] textural ominaisuudet auttavat erottamaan eri kudosten alueilla on TMA ja [13] textural ominaisuuksia käytetään havaitsemiseen patologisten alueiden histologisia dioja. Mutta kaikki nämä menetelmät toimivat kromogeenisella värjätään kudosnäytteitä missä luokitusta varten eri kudosten tyyppejä tiedot kaikkien 3 RGB kanavaa oli saatavissa. Luokittelemalla kasvainkudoksen vain DAPI kanavan pakottaa meidät käsittelemään vähemmän tietoja saatavilla luokittelun vaiheessa edellisestä muita lähestymistapoja. Vain harvat julkaisut käsittelevät luokituksen fluoresoivasti värjätään kudoksiin. In [14] kirjoittajat käyttävät ydin- toimintoja saatu DAPI-kanava erottaa onko koko kudos on syöpä tai terve sijaan luokiteltaessa erityyppisiä läsnä kudosta. Useimmat julkaistut työn biomarkkereiden tutkimuskäyttöön kaksi biomarkkereita kolokalisaation tai manuaalisesti segmentti syöpäkudoksen sijasta automatisoidusti [15] – [18].
(a) edustus kaikista 3 kanavassa fluoresoivasti värjätty core RGB väriavaruuden. Kuvioita alkunsa johtuen TMA: n valmisteluun. Punainen edustaa strooman markkeri (vimentiinista), vihreä tuumorimarkkeri (CK19) ja sininen DAPI kanavan korostamalla solutumien; (B) DAPI kanava (a) kuin intensiteetti kuvat yleensä kasvaimen solut ovat tummempia ja tiukempi liitetyn kuin stroomasoluissa; (C) toinen DAPI kuva ytimen Tiheään soluja; (D) esimerkki ytimen, jolla on pienempi tiheys solujen osoittaa korkean heterogeenisuus ytimet.
Gunduz et al. [19] julkaisi uuden menetelmän luokittelu kromogeenisen värjätään aivojen kudosnäytteistä. Ne muodostivat solu kaavioita perustuu topologinen kudoksen solujen ja uutetaan vastaava kuvaaja mittareita kouluttaa luokittelija. Luokitin pystyi erottamaan syöpä- ja tervettä kudosta. Graafi tässä abstraktia kohteiden (solmut), jossa parit nämä esineet yhdistävät reunat. Menetelmä kehitettiin edelleen [20] ja [21]. Bilgin et ai. [22] – [23] osoittaa, että niitä menestyksekkäästi analysoida rintojen ja luukudoksen näytteiden avulla solun kuvaajia. He arvioivat niiden menetelmää käsinvalittu ja ei-biologisten merkkiaineiden tunnettu rintasyövän näytteitä.
Täällä kehittää edelleen tätä lähestymistapaa kehittämällä uudella menetelmällä, joka pystyy luokitella fluoresoivasti värjättyä kudossiruina. Meidän menetelmä käyttää soluun kaaviot perustuvat kolmeen eri ominaisuuksia heijastaa solujen ominaisuuksia sisältämän graafin (solmut) ja niiden samankaltaisuus (reunat). Vuodesta mahdollinen joukko ominaisuuksia toteamme, jotka ovat parhaiten kykenee erottamaan kasvain ja strooman kudosta. On selvää, suorittaa tarkka kasvain-strooman erottaminen on jo haastava tehtävä. Käyttämällä lisäksi vain DAPI-kanava tähän tehtävään edellytetään entistä paremman suorituskyvyn segmentointi ja luokittelu.
Koska ensimmäinen vaihe suoritimme valuma segmentointia ja sitten rakensimme solu kuvaajia yhdistää segmentoitu soluytimet allekkain. Linkitetään solujen perustuu uudet säännöt erityisesti järjestetty fluoresoivasti värjätään TMA joka voi koostua useista eri kudoksissa tyyppejä. Sen sijaan, että käytetään vain topologinen kuvaaja metriikan solu-kuvaajan luokittelu, myös määrittää morfologiset ja intensiteetin perusteella solu on kunkin kennon-kuvaaja. Yhdistämällä kaikki kolme ominaisuutta tyyppiä pystyimme saamaan onnistunut kudosta luokitin loisteputki histologista dioja.
osoitamme menetelmää 180 ydin kuvia TMA invasiivisen kolminkertainen negatiivinen rintasyöpä koepaloja sisältäviä syöpäkudoksen sekä strooman (sidekudos). Meidän menetelmä menetelmä pystyi erottamaan kasvain ja sidekudos, joka asentaa samaan aikaan kudoksen ydin yhteensä kokonaistarkkuus 88,80 (± 07,73)%.
Materiaalit ja menetelmät
kudosnäytteitä
Aineisto yhteensä on 210 kudos microarray ydin kuvia invasiivisen kolminkertainen negatiivinen rintasyöpä koepaloja saatiin 6 TMA. Kudos saatiin kudospankki National Center for tuumoritaudit (NCT) yliopistollisessa sairaalassa Heidelberg. Hankkiminen kudosnäytteiden hyväksyi eettinen komitea lääketieteellisen tiedekunnan Heidelberg. Mukaan viranomaismääräysten yliopiston Tissue Bank määräytyy mainittu eettinen komitea ole yksittäinen suostumus on hankittava yksittäisten potilaiden potilaan näytteitä yli 3 vuotta. Dokumentointi kaikki menettelyt käsitellään ISO-sertifioitu prosessi CNT kudospankille. Jokainen TMA sisältää kaksi ydintä 1 mm 42 eri potilasta (yhteensä 84 ydintä kohden TMA). Yksi ydin saadaan kehän kasvaimen ja toinen saadaan kasvaimen keskustasta. Me ulkopuolelle sydämiä meidän tietokokonaisuus, jos niiden alueella oli alle viisikymmentä prosenttia säännöllisin ytimen tai jos käyttökelvoton. Jokainen kuva on otettu 20-kertainen suurennos, ja sen keskimääräinen koko on 2800 x 2900 pikseliä. Kaikki TMA värjätään 3 fluoresoivia väriaineita. Jokainen TMA värjättiin DAPI korostamalla soluytimet vastavärinä Toinen käytetty vasta-aineita (vimentiinista, CK19 ja CK5 /6) konjugoitiin Alexa Fluor® 488 (FITC vaihtoehto, vihreä fluoresoiva väriaine) tai Alexa Fluor® 594 (punainen väriaine) . Kuvio 1A esittää kudoksen ydin värjättiin 2 eri biomarkkereita ja DAPI kuin vastavärinä. Kuva 1B-D havainnollistaa edelleen edustavia esimerkkejä DAPI kanavan kolmen eri kudoksen-ydintä.
Kuvan hankinta
Fluoresoivasti värjätään TMA oli automaattisesti kuvattiin käyttäen Nanozoomer HT Scan System (Hamamatsu Photonics, Hamamatsu Japani) voi skannata koko dioja. Lasiliuskat skannattiin 20-kertainen suurennus (resoluutio 0,46 um /pikseli). Sillä skannaus lasin liukuu luisti skanneri havaitsee automaattisesti kiinnostava alue, joka sisältää erilaisia hylsyjä ja määrittää myös automaattisesti pätevä polttotaso skannausta varten. Tuloksena virtuaalinen liukuu oli keskimäärin tiedostokoko 5 GB. Yhden ytimen Kuvien keskikoko 2800 × 2900 kuvapistettä olivat paikalla ja poimittu TMA käyttämällä mallia matching [24].
Yleinen kuva-analyysin työnkulun
Pääperiaate tässä käsikirjoitus on cell kaavio jota käytämme kaapata topologinen solun jakaantuminen kudoksissa sekä spatiaalisesti yhteen paikallisen solun ominaisuuksia luokitusta. Tärkeimmät vaiheet tässä lähestymistavassa ovat segmentointi solun ytimien DAPI kanavan vedenjakaja segmentointia, rakentamista solun kaavioita, uuttamalla topologinen ja paikallisen solun ominaisuuksia nämä kuvaajat ja käyttää niitä kouluttaa luokittelija. Kuvankäsittelyalgoritmit kehitettiin Matlab ™ (Mathworks, Natick, Mass., USA) kanssa kuvankäsittelyn työkalupakin.
kuva-analyysi putki sisältää seuraavat käsitteellistä vaiheet (kuten kuvassa 2):
saamisen jälkeen kuvia, esikäsittelyä vaiheet parantaa kuvan laatua ja vesistöjen segmentointi myöhemmin segmentointi on sovellettu. Niinpä solu kuvaajat luodaan ja ominaisuuksia tietokoneistettu. Viimeinen vaihe käyttää SVM luokittelemaan kuvaajat joko kasvain tai strooman.
2.1 Pre-processing: Ensin asennettiin useita kuvanparannusta menetelmiä valmistautumaan kuvan myöhempää segmentointia askel.
2.2 Cell segmentointi: vedenjakaja-Transformation haettiin solutumien segmentointia.
2.3 Cell diagrammi sukupolvi: Perustuu segmentoidun ydinten me muodostuneen solun kuvaajia, jotka edustavat topologinen jakautuminen ytimien kudoksesta ydintä. Laskimme useita ominaisuuksia jokaiselle (ala) kuvaaja ja myös laskea intensiteetti ja morfologiset pohjan ominaisuuksia jokaisesta ydin on ydin.
2.4 Luokittelu ja ominaisuuksien hallintaan: tukivektoriluokitin koulutettiin luokittelun vaiheessa ja F-Score laskettiin ominaisuuksien hallintaan.
2.1 Esikäsittely
tässä ensimmäisessä vaiheessa, haimme useita menetelmiä laadun parantamiseksi ytimen kuvan myöhempää luokittelua. Aloimme poistaa varjostuksen esineitä, jotka hahmottelevat johtaa eri optisia ilmiöitä, kuten linssi vinjetointia tai valokuva valkaisu. Varjostus esineistö fluoresenssikuvantamisella voi myös johtua johtuu autofluoresenssin näytteiden tai Kiinnitysväliaine. Varjostus korjaus (flat kenttä korvaus) käytettiin kompensoimaan linssin reunahäipymää sekä epähomogeenisuutta valaistuksen. Varjostus korjaus saavutettiin suorittamalla musta tasapaino kalibroinnin selkeä tausta-alueilla. Seuraava vaihe kuvankäsittely putki oli poistaminen melun ja muita pieniä partikkeleita, jotka eivät sovellu myöhempää analyysia varten. Jos haluat ohittaa epäselviä ja hajanaisia tausta värjäämällä kaikki pikselin intensiteetti tasot ovat alle 25 oli asetettu nollaan. Mediaani-suodatin, jossa on 3 x 3 ydintä käytettiin tasoittaa kuvan. Saatu kuva muutettiin binaarikuvan (käyttämällä Otsun menetelmä [25]), jossa objektit ala on pienempi kuin 150 pikseliä (pienempää kuin sidekudoksen ydin) poistetaan. Esineitä ulkopuolella säännöllisen ytimen muoto poistettiin käyttäen morfologisia toiminnot, kuten sulkeminen tai avaaminen yhdessä alueen suodatin. Lopulta, eristetty tumat havaittu sisällä ydin. Oletimme, että nämä eristettiin ytimet kuuluvat muiden tumerous soluihin ja näin ollen suljettu pois kasvainkudoksen. Tämän vuoksi päätimme pienin muokkausalueen esineiden ja laajeni sen 20px kumpaankin suuntaan. Tämän perusteella uudet koordinaatit, kuva oli rajattu alkuperäisestä binary kuvan ja nykyisen esineitä tässä kuvan laskettiin. Jos vain yksi objekti oli läsnä, esine poistettiin, kun läsnä on enemmän kuin yksi kohde merkitsee kontakti muihin soluihin ja objektin pysyi. Lisäksi useissa ydintä huomasimme suuri overstained alueita maksimi-intensiteetillä tasoilla. Nämä alueet, jotka voivat johtua yhteenpuristettu sidekudoksen soluytimet klo TMA valmiste tai korkeille valotusaika, eivät sovellu tarkempaa analysointia ja poistettiin. Kuvio 3B esittää tulokset esiprosessointivaihe.
(a) alkuperäisen kuvan DAPI-kanava; (B) kuvan, kun varjostus korjauksen ja melunpoisto; (C) tuloksena vedenjakaja segmentointi, segmentoidut solut korostettu vihreällä ympärys; (D) kuvaa poistamisen jälkeen yksittäisiä soluja; (E) osoittaa solut, jotka olivat kytketty kuvaajan sukupolvi askel samaa väriä (merkittyjen solujen samaa väriä kuuluvat samaan osa-kuvaaja); (F) cell kaavio edustus solujen. Punaiset pisteet ovat solmuja, jotka edustavat soluja, mustat viivat ovat reunojen väliin.
2.2 Cell segmentointi
Automatisoidut solun segmentointi fluoresoivasti värjättyä TMA voi olla ongelmallista syistä jotka sisältävät solu päällekkäisiä tai ryhmittyneet soluja, monimutkainen kudos rakenne, roskia ja epätasainen tausta intensiteetti johtuen autofluoresenssin. Toinen vaikeus on intensiteetti vaihtelu ytimien, jotka voivat johtaa yli-segmentointi solutumien. Johtuen nämä intensiteetin vaihtelut joukossa ytimet, ensin jaettu kuvan yhdeksi kuva edustaa vain esineitä kirkkaampi valaistus ja yksi edustaa tummempi esineitä. Sitten soveltanut segmentointi askel erikseen molemmilla näistä kuvista. Tämä erottelu tehtiin laskemalla kynnys perustuu Otsu menetelmällä [25] piittaamatta tausta pikseliä. Segmentointi algoritmi, joka on osoittautunut erittäin hyödyllinen ytimet tai solun segmentointi tapauksissa on vedenjakaja segmentointi [26] – [28]. Käytimme kylvetään vedenjakaja segmentointia segmentointia. Lisää valuma segmentointi tarkoittaa, että alkaa alueet, joita kutsutaan siemenet, annetaan tulona valuma-segmentointia. Asetamme siemenet automatisoidusti käyttämällä h-maksimit muunnos [29]. Tuloksena tästä segmentointi vaiheen on esitetty kuvassa 3C.
2.3 Cell kaavio Generation
kuvaajan merkitään joukko esineitä, joissa jotkut parit esineitä yhdistetty linkkejä. Yhdistetyn objektin edustaa matemaattisia abstraktioita kutsutaan solmuja (kutsutaan myös kärkipisteet), ja linkit, jotka yhdistävät jotkin parit solmuja kutsutaan reunat. Muodollisesti kuvaaja on järjestetty pari
G = (V, E) B jossa
V
on joukko solmuja ja
E
joukko reunoja yhdistää solmut
V
. Työmme kukin entisen segmentoidun solutumien käytettiin solmu. Kuvio 4 esittää kaaviomainen esitys solun kuvaajia.
(a) Keinotekoinen luonnos 3 eri 3 solutyyppi: tuumorisolujen sininen, lymfosyyttien valkoinen ja violetti fibroblastien. (B) Cell kuvaaja edustus (a). Solut kuvattu solmujen ja niiden väliset yhteydet ovat biologisia suhteita.
Erilaisia lähestymistapoja on esitetty kirjallisuudessa lisääntyvien solujen kaavioita, jotka edustavat topologinen käyttäytymistä kudosten tai solujen eri tieteellisiä kysymyksiä [19], [21] – [23], [30]. In [19] Gunduz et ai. hyödyntää Waxman mallin solun kuvaajan sukupolvi. Bilgin et ai. [22] ja Gunduz et ai. [21] käytä todennäköisyys toimintoa yhdistää solujen keskenään. Heidän lähestymistavat todennäköisyys yhdistää solujen hajoaa kasvava euklidinen etäisyys solujen centroids. In [23], [30] soluja yksinkertaisesti sidoksissa jos euklidinen etäisyys niiden centroids on alle tietyn matkan. Kasvain solut yleensä esiinny klustereita, näin ne voidaan odottaa marginaalinen etäisyydellä toisistaan tai appearingly ”koskettava” toisiaan. Siten, tämä ”koskettava” ydinten johtuu siitä, että kolmiulotteinen rakenne histologinen kohdissa. Käyttämällä ytimet centroids etäisyyden mittauksia vain on mahdollista, että solut saavat liittyy vaikka ne ovat enemmän erillään kuin tyypillinen kasvainsoluja. Meidän tapauksessamme me suorittavat ennalta luokittelu vain rakentamalla yhteyksiä soluytimet koskettavat toisiaan ja siten ilman yksinäinen soluja (sidekudoksen alkuperää) kaaviosta rakentamisen vaihe. Meidän menetelmä voimme testata, jos solut koskettavat toisiaan seuraavien vaiheiden. Me ensin muuntaa tulos valuma segmentointia binaarikuvan ja sitten laajentavat kunkin segmentoitua solutumien erikseen. Dilation olevan (solun tuma) -Image
I
kanssa sen tosiseikan
S
, merkitään
I⊕S
, määritellään joukko toiminta, jossa s merkitsee symmetrisen sen tosiseikan. Valitsimme kärjelleen sen tosiseikan kanssa etäisyyden alkuperästä 2. Sitten määrittelemme, jos solutumien olivat tiiviissä yhteydessä ( ”koskettava” ulkonäkö) ja aseta ne toisiinsa, jos niiden pikseli risteyksessä ei ollut tyhjä joukko jälkeen dilataatio vaiheen: (1) missä
I ja J
ovat erityisen kuvia kahden naapurisolun ytimeksi. Kudoksissa, kasvainsolut lopulta tiukasti ympäröi sidekudoksen soluja, jotka voisivat jälkeen soveltamalla edellä kuvattua etäisyys yleensä johtaa rakenteellisiin virheitä solun kuvaaja. Yleensä kasvaimen solut näkyvät alemman intensiteetin tasoja kuin sidekudoksen soluja. Siksi me linkkejä ainoastaan soluja, jos ero niiden intensiteetin taso on alhaisempi kuin tietty kynnys. Tämä kynnys on riippuvainen vaihtelut värjäyksessä ja fluoresenssin signaalin hankinta tehokkuutta. Me täällä empiirisesti määritetty ero 30 voimakkuuden arvojen kuin sovellettavasta raja meidän tietojoukon. Johtopäätökset, viereisen solutumissa intensiteetti ero alle tämän rajan liittyvät: (2) Jos on aritmeettinen keskiarvo solun kuvan intensiteetin taso, X rivien, Y sarakkeiden määrä ja S = X * Y. Yhteenvetona, asettaa yhteyden kahden soluytimet mallissamme riippuu todennäköisyydestä koskettavat toisiaan ja että ero niiden intensiteetin taso on alhaisempi kuin tietty kynnys. Kuvio 4D esittää esimerkkiä kuvan jossa yksittäiset solut poistetaan. Kuvio 4E korostaa solutumien, jotka liittyivät kautta kuvaaja sukupolvi askel samanvärisiä. Visuaalinen kaavio esitys tämän vaiheen on esitetty kuviossa 4F. Solut, joita ei ole liitetty aikana kuvaajan luomisprosessin käsiteltiin ylimääräinen vaihe on kuvattu kohdassa ”yhden solun luokittelu”.
Cell Graph Ominaisuudet
muodostamisen jälkeen solun kaavioita, laskettu useita ominaisuuksia kouluttamiseksi lajittelijan. Kaikkiaan lasketaan 22 piirteitä, jotka voidaan jakaa kolmeen eri luokkaan. Ensimmäiset 10 piirteet, kirjallisuudessa kutsutaan yleensä kuvaajan muuttujien [19], [23], vangita topologinen käyttäytymistä kuvaajat, kuten solujen määrä kuvaajan määrä välisiä yhteyksiä tai muita topologinen suhteiden joukossa soluja (ominaisuus luokka T). Loput 12 piirteet kaapata morfologiset ominaisuudet (ominaisuus luokka M) kuin alue, muoto sekä intensiteetti perustuu ominaisuuksiin (ominaisuus luokka I) yhden solun ytimien kuvaajan ja valittiin perustuu niiden odotettu soveltuvuudesta. Kahden viimeksi mainitun ominaisuuksia lasketaan ensin kunkin yksittäisen solun tumassa, ja sitten keskiarvo käytetään ominaisuus vastaavan kuvaajan. Muista, että useita näistä intensiteetin pohjaisia ominaisuuksia riippuvat kuvantamisen edellytykset, kuten valotusaikaa, pitoisuus biomarkkereiden, välistä viivettä värjäystä ja kuvantamisen ansiosta valokuvien valkaisu ja edelleen lisää. Se edellyttää, että nämä edellytykset pysyvät vakiona koko aineistot. Taulukossa 1 käytettyjä toimintoja ja kuvaaja tiedot on kuvattu yksityiskohtaisesti.
2.4 Luokittelu ja ominaisuuksien hallintaan
tukivektorikoneet (SVMs) [31] käytetään yleisesti valvotaan oppimismenetelmät luokittelun tietokoneavusteisen biologian ja kuvankäsittely tehtäviä [32] – [34]. Lähtökohta koulutusta on SVM on joukko koulutuksen tietojen osalta, jonka jäsenyys on tiedossa: (3), jossa ovat piirrevektorit ja niiden luokkanimiin (kasvainsoluja tai sidekudoksen soluissa). SVM kartoittaa nämä tulovektorit korkeampaan ulotteinen avaruus, ja rakentaa optimaalinen hyper taso erottaa datan kahteen ryhmään. Ratkaisemalla toisen asteen ohjelmoinnin optimoinnin ongelma, SVM laskee normaalia vektori ja bias b erottavan hyper tasoon, joka maksimoi välinen marginaali tukea vektorien eri luokkiin. Leveys marginaali on yhtä suuri, mikä laajin välinen marginaali vektorien löydetään minimoimalla alla rajoituksia, jotka vaativat erotettavissa tietojoukko. Hyper tasoa käytetään sitten merkkinä toiminnon luokittelu kunkin piirrevektorin testipakkauksesta. Luokittelu funktio palauttaa joko +1 jos testituloksia on luokan jäsen, tai -1 jos se ei ole. Kun täydellinen erottaminen ei ole mahdollista, löysällä muuttuja otetaan käyttöön kunkin vektorin. Rajoitteet laskemaan optimaalinen hypertaso sitten formuloidaan ja hypertaso löytyy minimoimalla: (4) missä
C
on kustannus parametri, joka määrittää vaikutuksen Outliners avautuvalla hyper kone. Kuvattu SVM pystyy erottamaan lineaarisen datan. Luominen luokittelija, joka osaa luokitella epälineaarinen datan ytimen temppu on sovellettu. Ideana on muuntua korkeamman ulottuvuuden tilaa löytää erottamalla hyper kone käytöstä ytimen. Tämä mahdollistaa algoritmin sopivaksi suurimman marginaalin hyper kone transformoidussa ominaisuus tilaa. Yhtälö 4 voidaan kirjoittaa (5) 🙁 5) (6), jossa arvot ovat Lagrangen kertoimet, joka voi olla positiivinen tai negatiivinen, koska tasa rajoitteet ja on ytimen toiminto. Tässä artikkelissa, käytimme Radial Basis ytimen (RBF), joka tunnetaan myös Gaussin ydin.
Feature Selection
Laskimme F-pisteet valintaan ominaisuuksia sisältyvät SVM. Ominaisuus valinta on tekniikka löytää osajoukko ominaisuuksia poistamalla kaikkein merkityksetön ja tarpeettomia piirteitä piirreavaruudesta. Tämä tekniikka yleensä auttaa parantamaan koko suorituskykyä luokituksen nopeuttaa oppimisprosessia, mahdollistaa paremman edustuksen tärkeitä ominaisuuksia ja johtaa jäljellä ominaisuus asetettu yllä erottelukykyä. F-pisteet mittaa syrjintä toisistaan kaksi ominaisuuksia [35]. Korkeampi F-pisteet osoittavat korkeammalle syrjiä ominaisuus kuin ominaisuus, jolla on pienempi F-pisteet. Laskimme F-pisteet kunkin toiminnon
i
kuvatun (7), jolla on annettu koulutus vektorit: (7) missä ovat keskiarvoja
i
nnen piirre kasvain , strooman ja koko keräämiseen. merkitään
i
nnen piirre kasvaimen oikeusasteessa ja
i
nnen piirre strooman esimerkiksi.
Yhden solun luokittelu
Perustuen kaksi kriteerit solun kuvaajan sukupolven (voimakkuus ja etäisyys), se voi tapahtua, että yksittäiset solut eivät liity mihinkään muuhun soluun. Näin ollen, nämä solut eivät sisälly luokitusta vaiheessa ja käsittelemme niitä ylimääräinen algoritmi erilliseen yhden solun luokituksen vaiheessa. Ensin yrittää tunnistaa tulehdussolujen (lymfosyytit esim) ja fibroblastit, jotka ovat osa strooman luokan. Yleensä, tulehdussolujen ytimiä näkyvät pieninä pyöreähkö solutumien erittäin korkea intensiteetti verrattuna muihin soluihin ydin. Soluytimet ovat siten luokiteltu tulehdussolujen kun: solun tumassa intensiteetti on suurempi kuin tietty taso, metrinen joka laskee pyöreys on korkeampi kuin kynnys ja alue on pienempi kuin 500 pikseliä: (8), jossa on aritmeettinen keskiarvo intensiteetin , S = X * Y alueen ja w kehä solun tuma. Fibroblastien yleensä elliptisen muodon ja tunnistettiin: (9), jossa on enemmis- ja pieni-akselin solutumien. Nämä arvot hyödynnetään laskea epäkeskisyyden ellipsin. Epäkeskisyys ympyrän on 0 ja ellipsi joka epäkeskisyys on 1 on jana. Jäljellä olevat solujen tumat luokiteltiin käyttämällä tukivektoriluokitin. Käytimme 12 morfologiset ja intensiteetti perustuvat piirteitä jo mainittu kohdassa ”Cell Graph ominaisuuksia” luokittelemaan kunkin yksittäisen solun tumassa. Koulutimme SVM kanssa yhden solun ytimet meidän opetusjoukolla ja arvioidaan algoritmin erikseen kuvattu seurauksena jaksossa.
Tulokset
yleisenä tavoitteena lähestymistapamme oli automaattisesti luokitella jokaisessa solussa TMA ydin, jonka avulla tuotetaan solun kuvaajia. Koulutuksen ja luokitus perustuu ainoastaan DAPI kanavalla ensisijaisesti värjäystä ytimet. Kuvio 5 esittää tulokset lähestymistapamme 4 eri TMA-ydintä.
(a-d) osoittaa alkuperäinen RGB-ydin kuvia; (E-h), jotka osoittavat vastaavan DAPI kanavan intensiteetti kuvan ytimet (a-d); (I-l) luokituksen tulosten vaiheen, vihreä = solut luokitellaan kasvainsoluja, sininen = solut luokitellaan stroomasoluilla.
Cell segmentointi vaiheessa
Soluytimien segmentointi oli arvioidaan 3 satunnaisesti valittu todellinen ydin kuvia saatu yhdeltä TMA. Kaikkiaan 5162 tumat käytetty ja maa totuus saatiin toinen asiantuntija merkitsi yli- ja segmentoida solutumien. Vedenjakaja algoritmi Tässä ehdotettu voi oikein segmentti 94,1% (± 3,75) ydinten. Taulukossa 2 esitetään yksityiskohtaiset segmentointi tuloksia ja kuvio 3C esittää esimerkkiä tämän vaiheen, jolloin segmentoidut ytimet ympäröi vihreä ympärys.
Ominaisuus valinta
Ominaisuus valinta yksinkertaistaa ja lyhentää koulutukseen on luokittelija, ja usein myös parantaa sen tarkkuutta. Ominaisuus valinta 30 ydin kuva ensin syntyy yhteensä 7888 topologisesti disjunct solu kuvaajia johtavat käyttää samaa kokonaismäärä piirrevektorit. Tämä yhteensä joukko ominaisuuksia koostuu 4065 piirrevektorit kasvaimen luokan ja 3823 varten strooman luokassa. Ominaisuus arvot tapahtuvat pääosin vaihtelevassa numeeristen alueet. Siksi normalisoitu ne välillä [0,1] parantaa oppimisen edistymistä.
Laskimme F-pisteet (erotteleva teho ominaisuus) kullekin 22 piirteitä taulukosta 1 määrittämiseksi parhaat ominaisuudet luokittelussa tehtävän. Tulosten perusteella taulukon 3 keräsimme 15 parhaan ominaisuudet kouluttamiseen tukivektorikone.