PLoS ONE: Hyvä tarkkuus Mutation Detection in Leukemia on Selected paneeli Cancer Genes
tiivistelmä
With koko-genomin ja koko-exome sekvensointi, laadukasta luetteloita toistuvasti mutatoitujen syövän geenit ovat tulossa saatavilla useille syöpätyyppeihin. Saatavuuden lisääminen sekvensointitekniikan, kuten penkki-top sekvenssereitä, tarjoavat mahdollisuuden uudelleen sekvenssin rajoitettu joukko syövän geenien poikki potilaan kohortin rajoitettu käsittelyaikaa. Täällä uudelleen sekvensoitiin joukko syövän geenien T-solujen akuutti lymfaattinen leukemia (T-ALL) käyttäen Nimblegen sekvenssin talteenotto yhdistettynä Roche /454 tekniikkaa. Ensin selvitettiin, miten maksimaalisen herkkyys ja spesifisyys mutaation havaitseminen voidaan saavuttaa vertailuesimerkkeinä. Testasimme yhdeksän yhdistelmiä eri kartoitus ja muunnos-kutsuvan menetelmiä, vaihtelivat variantti kutsuvan parametrit, ja verrataan ennustettua mutaatiot on suuri itsenäinen validointi joukko saadaan kapillaarisen uudelleen sekvensoinnilla. Huomasimme, että kahden kartoitus algoritmeja, eli
BWA-SW
ja
SSAHA2
yhdistettynä variantti kutsuvan algoritmin
Atlas-SNP2
antaa suurimman herkkyyden (95 %) ja korkein spesifisyys (93%). Seuraavaksi soveltanut tätä analyysiä kaasuputken mutaatioiden tunnistamiseksi joukko 58 syövän geenien, paneelissa 18 T-ALL solulinjojen ja 15 T-ALL potilaan näytteitä. Olemme vahvistaneet mutaatioita tunnetaan T-ALL kuljettajia, kuten PHF6, NF1, FBXW7, Notch1, KRAS, sääntelyviranomaisten, PIK3CA, ja PTEN. Kiinnostavaa kyllä, löysimme myös mutaatiot useissa syövän geenejä, joita ei ollut liitetty T-ALL ennen, mukaan lukien JAK3. Lopuksi uudelleen sekvensoitiin pieni joukko 39 kandidaattigeenejä ja tunnistettu toistuvia mutaatioita TET1, SPRY3 ja SPRY4. Lopuksi perustimme optimoitu analyysi kaasuputken Roche /454 tiedot, joita voidaan soveltaa tarkasti havaita geenimutaatioita syöpä, joka johti tunnistamiseen useita uusia ehdokas T-ALL kuljettajan mutaatioita.
Citation: Kalender Atak Z, De Keersmaecker K, Gianfelici V, Geerdens E, Vandepoel R, Pauwels D, et al. (2012) Suuri tarkkuus Mutaatio tunnistus in Leukemia on valittuja of Cancer Genes. PLoS ONE 7 (6): e38463. doi: 10,1371 /journal.pone.0038463
Editor: Jörg D. Hoheisel, Deutsches Krebsforschungszentrum, Saksa
vastaanotettu: 28 joulukuu 2011; Hyväksytty: 05 toukokuu 2012; Julkaistu 4. kesäkuuta 2012
Copyright: © 2012 Kalender Atak et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä työ tukivat Belgian liittohallitus (Cancer Plan – Translational Research), KU Leuven (myöntävät GOA /11/010 J. Cools ja PV; myöntävät PF /10/016 SymBioSys J. Cools ja SA), säätiö Against Cancer (avustus 2010-154 SA), The FWO-Vlaanderen (G.0287.07, J. Cools), ja Euroopan tutkimusneuvosto (ERC-Starting Grant J. Cools). KDK on tutkijatohtorina rahoittama FWO-Vlaanderen, PV on vanhempi kliininen tutkija tukee FWO-Vlaanderen, DP ja MP rahoitetaan Agentschap voor Innovatie ovi Wetenschap en Technologie. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kuuluminen of WDG ja HQ Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH ei muuta tekijöiden noudattaminen kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja.
Johdanto
Uuden sukupolven sekvensointi (NGS) tekniikat ovat parantaneet merkittävästi sekvensointialustamme kapasiteettia viimeisten viiden vuoden aikana. Ne ovat nyt laajalti käytössä tutkimustarkoituksiin ja alkavat löytää tiensä kliinisiin sovelluksiin. Vaikka koko genomin ja koko exome sekvensointi lähestymistapoja onnistuneesti kartoittamiseen genomisen maisemia monien ihmisten sairauksia, ne eivät ole rutiinia strategioita havaitsemiseksi molekyylien poikkeamia korkeiden kustannusten vuoksi, ja pitkät liikevaihdon ajat (juosta ja analyysi kertaa). Kohdennettu uudelleen sekvensointi, toisaalta, on houkutteleva hoitopaikassa, kun otetaan huomioon alempi sekvensointi kustannukset, lyhyempi sekvensointi aikaa ja yksinkertaisempaa data-analyysi. Lisäksi, kuten löytö uusien syövän geenien koko-exome sekvensointi vähitellen kyllästää ja lähentyvät osaksi joukko yhteisesti mutatoitujen geenien tiettyyn syöpään, tunnistaminen Näiden mutaatioiden voi tuottaa tärkeitä ja ennustavia tiedot.
huolimatta vaatimus useita päiviä kirjaston valmistelua ja tavoite rikastamiseen kaikille näille alustoille, Roche /454 tekniikka tarjoaa etuja lyhyellä aikavälillä kertaa ja tietojen analysointi aikaa. Lisäksi rajoitetumman data ulostulo on hyötyä myös läpimenoaika koska vähemmän potilaan näytteitä on kerättävä täyttämään koko sekvensointi aikavälillä. Näiden pohjalta edut 454 alustan sekventoimiseen suhteellisen pieni geenin sarjaa, olemme investoineet optimoimaan bioinformatiikan putkistot luku- kartoitus ja muunnos kutsumus 454 lukee, jonka tarkoituksena on soveltaa tätä niin tutkimusta sekä kliinisiin tarkoituksiin. Olemme keskittyneet T-solujen akuutti lymfaattinen leukemia (T-ALL), aggressiivinen verta muodostavan syövän aiheuttama pahanlaatuisiksi kehittää T-solujen [1]. Joukko 97 geenejä valittiin kohdennettu sekvensointia. Joukko koostui 58 syövän geenien [2] ja 39 kandidaattigeenit kuten tyrosiinikinaasin ja fosfataasin koodaus geenit, kromatiinin muuttamiseen ja useiden geenien heimoihin tunnettujen syövän kuljettajan geenejä, kuten TET1-tet3: ssa, tai PIK3CB-PIK3CD-PIK3CG.
tarkka variantti havaitsemista, tutkimme useita nykyisiä analyysi putkistojen ja verrattiin niiden suorituskykyä. Vaikka kumppani ohjelmisto gsMapper on laajalti käytetty analyysi 454 tietojen [3], [4], [5], erilaisia vaihtoehtoisia kartoitus ja muunnos vaatii algoritmeja on kehitetty, kuten BWA-SW [6] ja SSAHA2 [7] , BLAT [8] kartoittamiseen, ja SAMTools [9], VarScan [10], ja Atlas-SNP2 [11] muunnokseen calling. Li et ai [6] tarkistetaan pitkän luku- aligners, ja Shen et al [11] tarkastelivat variantti soittajat kuitenkin tietojemme mukaan mitään vertailua on suoritettu yhdistelmä kartoitus ja variantin soittamalla algoritmien yhteydessä mutaation löytö .
Täällä analysoitiin ja verrattiin yhdeksään eri yhdistelmiä kartoitus ja muunnos kutsuvan algoritmit ja erityisesti tutkinut, missä määrin alhainen kattavuus kannat voidaan sisällyttää vaihtelua kutsuvan prosessi lisätä herkkyyttä mutaation havaitsemiseen. Seuraavaksi käytämme optimoitu putki mutaatioiden tunnistamiseksi joukko 58 syövän geenien ja 39 kandidaattigeenit, yli 18 T-ALL solulinjojen ja 15 T-ALL potilaan näytteitä, ja tunnistaa toistuvat mutaatiot sekä tunnettuja ja uusia kuljettajia.
tulokset
vertailu kartoitus ja vaihtelu Calling menetelmät Roche /454 Data
Roche seuralainen ohjelmisto
gsMapper
käytetään enimmäkseen analysointiin Roche /454 data. Tämä ohjelmisto ensin saatetaan lukee vertailutasoon genomin ja sitten luetellaan kaikki asemat, jotka ovat erilaisia kuin viite genomista (variantti calling). Vaikka
gsMapper
menestynyt hyvin useissa tutkimuksissa [3], [4], [5], halusimme arvioida sen suorituskyky meidän tietoaineiston ja tutkimaan, voisimme saavuttaa parempia tarkkuuden ja käyttämään vaihtoehtoisia aligners ja variantti soittajat. Testasimme kahdeksan eri yhdistelmiä pitkä lukea aligner (BWA-SW, SSAHA2, BLAT) ja variantti soittaja (SAMTools, VarScan, Atlas-SNP2) ja verrattiin niiden suorituskyky
gsMapper
.
jokainen putki levitettiin lukee saatu seitsemästä T-ALL solulinjojen ja miten kukin putki arvioitiin Sangerin uudelleen sekvensointi 210 ehdokkaan variantteja, jotka satunnaistettiin otettu kaikista ennusti 8020 variantit (jotka sisältävät sekä SNP ja mutaatiot) alkaen kaikki putket. Mittana miten kukin putki, laskimme Matthews korrelaatiokerroin (MCC), joka on mitta ennusteen tarkkuutta, joka on laskettu perustuen määrästä onnistuneesti ennusti oikeilla positiivisilla ja tosi negatiivisia saapuvat Sangerin sekvensoinnilla (katso materiaalit ja menetelmät). Käytettäessä oletusparametriasetuksilla (taulukko S1), suorituskykyä useita putkistoja oli vertailukelpoinen, joiden keskimääräinen MCC 0,62, ilman vaihtoehtoisen putken toimivat paremmin kuin gsMapper (MCC 0,82) (taulukko S1).
vuonna NGS tutkimuksissa läsnäolo kahtena lukee (aiheuttama PCR-monistus askel aikana kirjasto valmiste) on mahdollinen lähde vääriä positiivisia yhden nukleotidin muunnos (SNV) ennustus [12]. Siksi lisäsimme Lisätoimena poistaa päällekkäisiä lukee käyttäen Picard, tuloksena on 2-24%: n nousu MCC riippuen putki, joiden keskimääräinen MCC 0,73 (taulukko S1). Tämä osoitti, että päällekkäisiä poistaminen on tärkeä askel saamiseksi oikea variantti puhelut.
Seuraavaksi edelleen optimoitu, miten kukin putki vaihtelemalla vähän tarvitaan määrä lukee (kattavuutta, DoC) ja tarvitaan mahdollisimman vähän muunnos lukee (variantti alleelifrekvensseiltään, VAF). Muutokset DoC kynnysarvot vaikuttavat lähinnä herkkyyttä, kun taas vaihteleva VAF kynnysarvot vaikutti ennusteita suhteen spesifisyys (kuvio 1 A, taulukko S2). Kaikki putkistot saavuttivat paras suorituskyky doc kynnys 3, ja vähintään VAF kynnys 0,20 (tarvittaessa) (taulukko S1-S2). Lopullisessa pyritään minimoimaan vääriä positiivisia ennusteita, yhdistimme kaksi parasta kartoitus algoritmeja yhdessä putki, mikä edelleen lisäsi herkkyyttä 95% ja spesifisyys 93%. Syy tähän tarkkuuden parantuminen on, että tietyt ennustettu variantit, jotka johtuvat virheellisestä kartoitus (kuvio S1) on nyt suodatetaan pois. Vaikka tämä viimeinen putki (SSAHA2 + BWA-SW + Atlas-SNP2) toimii paremmin kuin
gsMapper
(91,2% herkkyys ja 90,8% spesifisyys), ero ei ole suuri ja
gsMapper
voidaan pitää pätevänä (ja usein helppokäyttöinen) vaihtoehtoisia (Kuva 1 B).
(A) eri putkistot näyttää eri herkkyys ja spesifisyys. Vaihtelevat kauppaministeriön ja VAF kynnysarvot variantti kutsuvan prosessin on lisäksi vaikutusta ennusteita suhteen herkkyys ja spesifisyys, vastaavasti. Jokainen putki on edustettuna eri symboli ja miten kukin putki (mitattuna herkkyys ja spesifisyys) on piirretty vaihtelevissa kauppaministeriön ja VAF kynnysarvot. Huomaa, että X-akseli edustaa väärien positiivisten määrä (1-spesifisyys). Tässä ROC-käyrä, sitä lähempänä pisteen vasemmassa yläkulmassa pisteen kaavion, sitä parempi herkkyys ja spesifisyys. Eri värit symbolit osoittavat suorituskykyä putken muuttuvissa VAF kynnysarvot, ja kaksi tummennetut ruudut ilmaisevat vaihtuvissa DoC kynnysarvot. Juoni osoittaa, että (i) vähentämällä DoC kynnys herkkyys kasvaa kaikkien putkistojen kuten sinisellä pisteviivalla; (Ii) lisäämällä VAF kynnys kasvaa spesifisyyden kanssa lievää laskua herkkyyden kuten (esimerkissä BLAT + VarScan putkisto) punaisella pisteviivalla; (Iii) BWA-SW + SSAHA2 + Atlas-SNP2 putki on paras suorituskyky kaikkien putkistojen alle DoC = 3 VAF = 0.20 kynnysarvoja merkitty keltaisella nuolella. Roche putki on merkitty mustalla timantti muoto, koska muuta parametreja tehtiin sen, ja SSAHA2 + SAMTools ja BWA-SW + SAMTools putkilinjoja harmaana koska mitään VAF kynnystä muutoksia tehtiin niitä. (B) toinen Matthews korrelaatiokerroin jokaiselle putki näkyy kaikkein optimaalisen suorituskyvyn että putki (taulukko S1). On mielenkiintoista huomata, että optimaalisen suorituskyvyn kaikkien putkilinjojen paitsi Roche gsMapper, havaittiin doc kynnys 3.
Laaja Mutaatiot Cancer Geenit Across 18 T-ALL solulinjojen ja 15 T-ALL Potilasnäytteet
soveltaneet optimoitu putki määritelty yllä, joka koostuu SSAHA2 + BWA-SW yhdistelmä luku- kartoitus, ja Atlas-SNP2 vaihtelut vaativat, mutaatioiden tunnistamiseksi paneeli 58 ”syöpä geenit ”poikki 18 T-ALL solulinjojen ja 15 ensisijainen T-ALL potilaan näytteitä. Tämä joukko geenejä on 13 T-ALL ajurit (kuva 2.A.I) ja 45 muita geenejä osallistuvat erilaisiin syöpiä (kuva 2.A.II). Kaikki nämä geenit ovat läsnä laskenta [2] tietokanta syövän geenien paitsi äskettäin löydetty syövän geenien ATOH1 ja PHF6 [13], [14]. Koska PHF6 mutaatiot ovat mukana T-ALL lisäsimme PHF6 listalta T-ALL kuljettajia.
Coding mutaatioita tunnetuissa syöpää geenien (A) ja kandidaattigeenit (B) on merkitty eri värikoodit. Paneeli A on edelleen jaettu (I) geenejä, joiden tiedetään olevan kuljettajia T-ALL, ja (II), geenit, joilla on toistuvia somaattisista mutaatioista useissa erilaisissa ihmisen syövissä. Solulinjat sijaitsee vasemmalla taulukon, ja potilaan näytteet sijaitsee oikealla. Geenit ovat luokiteltu taajuuden proteiinin muuttaa mutaatioiden potilaan näytteissä.
Sequence lukee kartoitettiin koko viite genomiin ja ne lukee että kartan valittuun geenit olivat säilyneet. Tämä johti 36% lukee kyseisen kartan kohdesekvenssien keskimäärin joiden keskimääräinen kattavuus 24.2X ja 16.3X varten solulinjoja ja potilaan näytteitä, vastaavasti. Sekvenssin analyysi tietojen mukaan eksonit on hyvin pieni kattavuus oli merkitsevästi enemmän GC-pitoisuus verrattuna eksonien kanssa korkeammasta tasosta (p-arvo 2.2e-16), joka on löytää sopusoinnussa aiemmin julkaistu tutkimus [15] (Kuva S2 ). Niistä 1565 eksonien kohdennettu tässä tutkimuksessa, 18 eksonit ollut kattavuus solulinjoja tai potilaan näytteissä (vastaa 8710 bps); ja 15 eksonit ollut peittoa potilaan näytteissä vain (vastaten 5197 bps). Keskimäärin 94% ja 86%: n kohdennettujen eksonien saavuttaneet keskimääräisen kattavuuden yhtä suuri tai suurempi 3 solulinjojen ja potilaan näytteitä, vastaavasti.
Vaihtelu puheluita johti 836 erillinen yhden nukleotidin variantteja (SNVs) in tunnettu syövän geenien poikki 33 näytettä. Solulinjat oli merkitsevästi enemmän SNVs syövän geenien kuin potilaan näytettä (p-arvo 0,001); keskimäärin 153 SNVs havaittiin kohti solulinjaa ja 117 potilasta kohden näytettä. 56% ennustetuista SNVs ilmoitettiin dbSNP (https://www.ncbi.nlm.nih.gov/projects/SNP/) tai 1000 Genomes hanke (https://www.1000genomes.org/) ja olivat ulkopuolelle tarkempaa analysointia ja loput 368 SNVs (taulukko S3) vaikutti 55 58 sekvensoitujen syöpä geenit, pääasiassa eksonit (58.4%) ja transloimattomat alueet (23,9%). Lisäksi oli 8 SNVs vaikuttavat silmukointikohdista. Niistä eksoni SNVs, 14 tulos voitto lopetuskodonin (nimeltään ”stop saavat” SNVs), 140 ovat ei-synonyymejä ja loput 61 ovat synonyymejä koodausta muunnelmia.
validoimiseksi mutaatiot löytyy solussa linjat, vertasimme tuloksia mutaatioita määräytyy Cancer Cell Line hanke [16], joka sisältää yksitoista meidän 18 solulinjoissa. Niistä 35 kasvaimia synnyttävän pistemutaatiot löytyy Cancer Cell linjan projekti (kapillaarielektroforet- sekvensoimalla) geeneissä, jotka sisältyvät meidän paneelissa, 31 otettiin talteen automaattisen uudelleen sekvensoinnilla Roche /454 käyttäen SSAHA2 + BWA-SW + Atlas -SNP2 analyysi putki, joka vastaa hyötykäyttöaste oli 88,5% (taulukko S4). Huomaa, että gsMapper talteen 30 mutaatiot ulos 35, jolloin kierrätysaste 85,7%. Mutaatiot, jotka jäivät Roche /454 sekvensointi ovat joko alhaisen kattavuus näille paikoille (kahdessa neljästä jäi mutaatiot sekä Notch1) tai alhaisen variantti laatu (yhden TP53 mutaatio) tai sekvensointivirheitä (yksi Notch1 mutaatio kattaa 10 lukee, joista yksikään ei sisältää variantin alleelin raportoimat Cancer Cell linja projekti). Mitä tulee spesifisyys, molemmat putkilinjat toimi hyvin, esimerkiksi sen FBXW7 geeni, jolle löydämme proteiini muuttavaa pistemutaatio täsmälleen samat viisi solulinjat kuin Cancer Cell linjan projekti (pois yhdentoista yhteisen solulinjat). Lopuksi automatisoitu uudelleen sekvensointi käyttäen Roche /454, joko gsMapper putki tai SSAHA2 + BWA-SW + Atlas-SNP2 putki, on hyvin suurelta osin samaa mieltä mutaatioiden saapuvat kapillaarisen sekvensoimalla.
Kolmetoista 58 syöpä geenit on liitetty erityisesti T-ALL, ja tunnistimme proteiinin muuttamalla mutaatioita vähintään yksi näistä geeneistä kaikissa solulinjoissa ja 10 potilaan näytteissä (kuvio 2.AI). Muiden 45 syöpägeenit, 36-geenit mutatoitiin (kuvio 2.A.II), joista 25 mutatoitiin vähintään kaksi näytettä (solulinja tai potilas). Geenit useimmat mutaatiot T-ALL solulinjoja ovat Notch1 (ei synonyymi mutaatio 9/18 solulinjoissa), TP53 (10/18), FBXW7 (7/18), ja kansallisten sääntelyviranomaisten (5/18). Nämä on myös mutaatioita potilasnäytteistä, paitsi TP53, mikä viittaa siihen, että se voi olla helpompi saada solulinjoja näytteiden TP53 mutaatio tai TP53 mutaatioita aikana hankitut soluviljelmissä [17].
tunnistaminen Toistuva JAK3 mutaatioiden T-ALL
seuraava määritetty, jos mutaatiot syöpä geenit voivat tunnistaa, että aiemmin ei liity T-ALL. Löysimme useita tällaisia mutaatioita T-ALL solulinjoissa (kuvio 2.A.II), mutta niiden puuttuminen potilaan näytteissä pohtii niiden merkitys patogeneesissä T-ALL.
Havaitsimme useita mutaatioita JAK2 ja JAK3 molemmissa solulinjoissa ja potilaan näytteitä. Kaikki JAK-kinaasien, paitsi Tyk2 (katso alla), ovat tunnettuja onkogeenien leukemiassa ja aktivoimalla mutaatioita ja alueelta toiselle siirtäminen vaikuttaa JAK1, JAK2 ja JAK3 kuvattiin useita, lähinnä myeloidinen, hematologisia syöpiä [18]. Viime aikoihin asti, JAK1 oli ainoa JAK perheenjäsenen jossa pistemutaatioita on kuvattu T-ALL [19]. Kuitenkin äskettäin artikkelin JAK3 voitto-of-function mutaatiot kuvattu T-ALL Elliott et al. [20]. Tutkimuksessamme olemme tunnistaneet 3 ei-synonyymejä koodaus mutaatiot 2 potilailla JAK2 (potilas TLE37 oli kaksi mutaatiota) ja 4 ei-synonyymejä koodaus mutaatiot 1 potilaalla ja 2 solulinjoissa (SUPT1 solulinjassa oli kaksi mutaatiota) varten JAK3. (Taulukko S3). Sangerin sekvensoinnilla vahvisti yhden JAK2 ja kaikki JAK3 variaatiot (taulukko S5, Kuva 3 A-B). Täydentävä Sangerin sekvensoinnin kaikista eksonin JAK2 ja JAK3 geenien 31 ylimääräisiä T-ALL potilaat tunnistetaan 1 ylimääräinen JAK2 variantti ja 2 ylimääräistä JAK3 variantteja (taulukko S5, Kuva 3 A-B). Eli yhteensä tunnistimme JAK2 mutaatioita 2 46 (4%) T-ALL näytteistä ja 0 18 T-ALL solulinjojen ja JAK3 mutaatioiden 2 46 (4%) T-ALL näytteistä ja 2 18 T-ALL solulinjoja (taulukko S5, kuva 3.AB). Sillä JAK2 molemmat mutaatiot olivat läsnä myös vastaavassa remission näyte, kun taas kaikki JAK3 potilas mutaatioita somaattisesti hankittu. Mielenkiintoista on, että potilas TLE44 osoitti 2 somaattisten mutaatioiden JAK3, eli A572T ja M511I, joka havaittiin saman alleelin (tuloksia ei ole esitetty). Lisäksi M511I mutaatio on havaittu aikaisemmin AML ja yli-ilmentyminen tämän mutantin transformoitujen IL3 riippuvainen 32D-soluja ja indusoi T-ALL hiirissä [21]. Kun taas A572T-mutaatio ei ole kuvattu aiemmin, JAK3 aminohappo A572 havaittiin muuntuvat V (A572V mutaatio), T-solu-leukemia, T-solulymfooma, ja AML, ja tämä A572V mutantti transformoitiin sytokiinin riippuvainen hematopoieettisten solujen ja leukemia in hiirillä [21], [22], [23], [24].
(A) Sangerin sekvensoinnin kromatogrammit vastaava vahvistettu JAK2 /JAK3 variantteja. (B) Domain rakenne JAK2 ja JAK3 proteiinien osoitus uusien havaittujen variantteja. Non-somaattiset variantteja on merkitty tähdellä. (C) Sanger sekvenssit näkyy esimerkkejä Tyk2 varianttien havaitsemiseksi T-ALL solulinjoja tai leukemia potilaiden näytteistä. (D) Kaaviokuva Tyk2 proteiinin rakenteen mukaan kaikki uudet Tyk2 variantit havaittu tässä tutkimuksessa. Non-somaattiset variantteja on merkitty tähdellä.
tunnistaminen New Onkogeenit ja tuumorisuppressorigeeneille in T-ALL
etsiminen uusia T-ALL kuljettaja geenejä voidaan suorittaa koko -exome sekvensointi tai muu genominlaajuisten lähestymistapoja. Kuitenkin Roche /454 alustan yhdistettynä sekvenssin talteenotto voisi olla hyödyllinen kandidaattigeeni lähestymistapaa. Meidän kohdennettu uudelleenjärjestely-lähestymistapaa, 39 geenit olivat mukana, joita ei olekaan yhteydessä syöpään, mutta valittiin ehdokkaaksi onkogeenien tai tuumorisuppressorigeeneille, koska niiden toiminta (esim tyrosiinikinaasit ja tyrosiinifosfataasien) tai koska perheenjäsenet olivat olleet osallisina syövän (esim Tyk2 että JAK perhe, TET1 koska TET2 on tunnettu syövän geeni). Kuva 2.B osoittaa eksoni ja silmukointikohtamutaatio havaittu näiden geenien ja geenien rankattiin mukaan uusiutumisen proteiinin muuttavaa varianttien poikki potilaan näytteitä.
Mielenkiintoista, 4 15 sekvensoitu potilaan näytteet sisältävät muunnelma in TET1.
TET
geeniperheen (
TET1
,
TET2
,
tet3: ssa
) epigeneettiset sääntelyviranomaisten on tärkeää hematologian kentän takia havainto
TET2
mutaatioita 10-25% potilaista eri myelooista hematologic sairauksiin [25], [26], [27]. Paremmin arvioida mutaation taajuus
TET1
in T-ALL, suoritimme täydentävää Sangerin sekvensoinnilla
TET1
kaikissa solulinjoissa ja potilaiden näytteistä ja paneeli 22 ylimääräisiä T-ALL tapaukset . Kaiken kaikkiaan tämä johti tunnistamiseen
TET1
variantit 5/37 (13,5%) analysoiduista potilaiden ja 1/18 T-ALL solulinjoja (Karpasin-45) (taulukko S6 ja kuva 4). Somaattinen tila havaittu
TET1
variantteja vahvistettiin 1 tapaus (H1297Y) jos peruuttamista näyte oli saatavilla. Tutkimme myös variantit
TET2
ja
tet3: ssa
kyytiin 454 ja suorittaa ylimääräisiä Sanger sekvensointia varten näiden geenien.
TET2
variantit havaittiin 2 solulinjoissa (JURKAT ja KARPAS45) ja yksi
tet3: ssa
variantin havaittiin CCRF-CEM-solulinja, ei T-ALL potilaan näytettä (0/46) kanna hankittu TET2 tai tet3: ssa mutaatioita (taulukko S6).
(A) Sangerin sekvensoinnin kromatogrammit edustavat confimed TET1 variantteja. (B) Kaaviokuva TET1 proteiinin rakenteen mukaan kaikki uudet TET1 variantit havaittu tässä tutkimuksessa. Vaihtoehdot havaitut solulinjoissa on kuvattu yläpuolella TET1 proteiinin variantit havaittiin leukemia potilaiden näytteet ovat alle TET1 proteiinia. Non-somaattiset variantteja on merkitty tähdellä.
Mutaatiot tyrosiinifosfataasin geenejä, jotka toimivat alipaineensäätöventtiileillä tyrosiinia signalointi, havaittiin monissa T-ALL solulinjojen ja myös useita T-ALL potilailla. Muita mutaatioita SPRY geenien alipaineensäätöventtiileillä RAS /MAPK-reitin, myös havaittu. Olemme tunnistaneet homotsygoottinen vaihtelu
SPRY3
yhdessä T-ALL potilaan näytteestä, ja 3 mutaatiot
SPRY4
(2 mutaatiot solulinjoissa ja 1 somaattisesti hankittu mutaatio T-ALL potilaan näytteestä ). Sangerin sekvensoinnilla vahvisti Näiden mutaatioiden läsnäolo, mutta ei paljastanut muita mutaatioita SPRY3 /SPRY4 22 ylimääräisiä T-ALL tapauksissa, jolloin SPRY4 mutaatio taajuuden 1/37 T-ALL potilaiden ja 2/18 T-ALL solulinjoja (Taulukko S7, kuvio 5).
(A) Sanger-sekvensoinnilla kromatogrammit esittää vahvisti SPRY4 variantteja. (B) Domain rakenne SPRY4 proteiinin osoitus uusien havaittujen muunnelmia.
Lopuksi myös tunnistettu useita mutaatioita tyrosiinikinaaseja (IGF1 R, Tyk2, TNK1, ja MST1R) ja niihin liittyvät signalointi proteiineja ( IRS2, SOCS3), mutta suurin osa näistä mutaatioista löydettiin solulinjoissa, kun taas ensisijainen potilaan näytteet osoittivat paljon harvemmin näistä mutaatioista. Yleisimmin mutatoitunut geeni kaikissa solulinjoissa ja potilaan näytteitä oli insuliinin reseptori alustan 2 (IRS2) geeni, joka osoittaa ei-synonyymejä koodaus mutaatioita 6 solulinjoissa ja yhdellä potilaalla näytteessä. Myös usein mutatoitunut oli Tyk2, mutaatioita havaittiin 6 solulinjoissa; yksi stop-voitto variantti ja 5 ei-synonyymi koodausta variantteja. Vaikka yksikään 15 potilaan näytteet kuljettaa mutaatio Tyk2, se voisi olla läsnä matalilla taajuuksilla potilailla. Tämän testaamiseksi suoritimme täydentävä sekvensointi Tyk2 93 T-ALL, 54 AML ja 53 B-ALL potilaan näytteitä. Huolimatta tiheä Tyk2 vaihtelut T-ALL solulinjoissa, Tyk2 variantit havaittiin vasta 2 93 T-ALL ja 1 54 AML tapauksista (taulukko S5, kuva 3.CD).
Todisteet kertyminen mutaatioiden in vitro Culture T-ALL solulinjojen
mutaatiofrekvenssi on Tyk2 T-ALL solulinjojen verrattuna ensisijainen T-ALL näytteissä oli huomattavasti erilainen, joilla on korkea mutaationopeus Tyk2 solulinjoissa, mutta vain pieni mutaatio kurssi perusnäytteiksi. Sen määrittämiseksi, onko tämä voisi johtua kertyminen Tyk2 mutaatioiden viljelyn aikana solut, sekvensoimme Tyk2 eri kloonia saman T-ALL-solulinja (taulukko 1). Sillä CCRF-CEM-solulinja, saimme 5 eri alakloonit jotka kerättiin vuosien varrella. Mielenkiintoista, kun taas R1027H muunnos oli läsnä kaikissa tutkituissa näytteissä, The A35V variantti oli läsnä vain tiellämme ja yksi ylimääräinen CCRF-CEM klooni. In Karpasin-45-solulinjassa Q830 * vaihtelu oli läsnä 3 eri kloonia. Sitä vastoin, vain meidän JURKAT rivi sisälsi C192Y mutaatio, kun taas tämä oli poissa 2 muita klooneja, saatavilla DSMZ (www.dsmz.de) (taulukko 1). Nämä tiedot viittaavat siihen, että ainakin osa Tyk2 mutaatioita aikana hankittiin laajennettu solujen viljelyn, ja ovat siten todennäköisesti edustaa onkogeenisen tapahtuma tärkeää leukemian kehittymiseen
in vivo
. Lisäksi analyysi muuttamassa ominaisuuksia näiden mutanttien Ba /F3-soluja ei tunnistanut merkittäviä eroja villityypin Tyk2 ja muunnelmia Tyk2 havaittu solulinjoja tai potilaan näytteitä ja emme pystyneet osoittamaan mitään autofosforyloinnin Tyk2 T-ALL solu riviä joissa Tyk2 variantteja (tuloksia ei ole esitetty).
Nämä tiedot vahvistavat merkittäviä eroja solulinjojen ja ensisijainen potilaan näytteitä, jotka voivat heikentää mutaatioiden aikana
in vitro
soluviljelmässä.
keskustelu
osoitettu, että kohdennettu sekvensointi lähestymistapa optimoidulla analyysi asetusta voidaan käyttää tunnistamaan kasvaimia synnyttävän mutaatioita. Tämä lähestymistapa voisi olla erityisen kiinnostava havaitsemiseksi pistemutaatioiden joukko tärkeitä onkogeenien ja tuumorisuppressoreita tai muu sairaus, joka liittyy geenien diagnoosin, ennuste ennustaminen tai terapian valinta. Tällainen tieto voisi syntyä suhteellisen lyhyessä ajassa ja ennennäkemättömällä tarkkuudella. Yksi suurimmista eduista yli klassisen Sangerin sekvensoinnilla on suurempi läpäisykyky tämä menetelmä mahdollistaa, että kaikki eksonit geenin joukon tätä kokoa voidaan helposti sekvensoida. Sinänsä kaikki tiedot on säädetty ja harvinaisia muunnoksia tai jopa aiemmin tuntemattomien mutaatioiden tietyn geenin voidaan havaita. Itse asiassa 160 eksoni ja silmu- (poislukien 61 synonyymi vaihtelu) havaittiin solulinjoissa ja potilaan näytteitä koko meidän paneeli syövän geenien, vain 40 löytyy COSMIC tietokantaan [16], joista 24 liittyy nimenomaan T-ALL. Vaikka joidenkin geenien mutaatio kuormittajat olemassa (esim KRAS G12, G13, Q61 mutaatiot), toiminta eniten syöpä geenit voivat vaikuttaa mutaatiot eri kohtiin. Näin ollen, useimmissa syövän geenien koko koodaavan sekvenssin täytyy uudelleen sekvensoida, ja tämä Roche /454 tekniikka on erityisen sopiva.
mutaatioiden tunnistamiseksi käyttäen seuraavan sukupolven sekvensointi – joko korvata tai täydentää molekyyli- diagnoosi – standardoitu bioinformatiikka analyysin putkistojen hyvin suurella tarkkuudella tarvitaan. Tällainen putki koostuu mappausalgoritmi yhdenmukaistaa järjestyksessä lukee vertailutasoon genomiin, muunnelma jossa algoritmi tunnistaa eroja näytteen ja viite, ja vaihtelua suodatus algoritmia.
Vertasimme useita yhdistelmiä kartoitus ja vaihtelu kutsuvan algoritmeja, ja totesi, että yhdistämällä kaksi mappers, nimittäin SSAHA-2 ja BWA-SW, jota seuraa Atlas-SNP2 tuottaa tarkimmat vaihtelua havaitsemisen tuloksia. Lisäämällä kaksi kartoitus algoritmit suodattaa pois vääriä positiivisia variantti ennustukset takia erronous kartoitus, ja virhe malli Atlas-SNP2 mahdollistaa poistamista lukee että on useita parhaiten vastaavat vertailu- genomissa. Olemme myös havainneet, että lisätietoja suodattimia kattavuutta ja variantin alleelin frekvenssi entisestään sekä herkkyyttä ja Spesifisyyttä vaihtelun havaitsemista.
kohtasi useita teknisiä rajoituksia aikana tietojen analysointi. Ensin meidän piti poistaa päällekkäisiä lukee PCRilla monistusvaiheiden näytteen valmistuksen aikana, koska olemme huomanneet nämä aiheuttivat vääriä positiivisia SNV predicitons. Toiseksi, voimme vain ennustaa SNVs, kun taas indeleitä (pienet lisäykset ja poistot) oli huomiotta, koska työmme (tuloksia ei ole esitetty) ja aikaisemmat tutkimukset osoittavat, että 454 lukee eivät sovellu Indel havaitsemista, koska suuri määrä vääriä positiivisia tuloksia [4]. Diagnostisessa ympäristössä, jossa 100%: n spesifisyys on jatkettava, se on kriittinen tunnistaa geenien tai alueiden geenit, jotka ovat alttiita hankintaan indeleitä ja suunnitella vaihtoehtoisia määrityksiä tutkia niitä. Samoin genomista uudelleenjärjestelyt ovat tärkeitä syitä T-ALL mutta edellyttävät toisiaan täydentäviä havaitsemiseen teknologioita.
Uskomme, että käytetään pitkää lukea sekvensointitekniikan, kuten Roche /454 tai uudempi Tyynenmeren Bioscience, antaa erityisiä etuja suhteen sekä herkkyys ja spesifisyys vaihtelun havaitsemista. Ensiksi, pitkä lukea linjaus mahdollistaa paremman ero hyvin samankaltaisia geenejä genomissa. Esimerkiksi yksi geeneistä uudelleen sekvensoitiin oli Notch1 geeni, jossa on useita homologit (eli NOTCH2, NOTCH2Nl, NOTCH3 ja NOTCH4). Emme kuitenkaan havainneet lukee kartoitusta mihinkään näistä homologeista, vaikka meillä kartoittivat lukee koko genomin. Tämä osoittaa, että sekä sekvenssin talteenotto ja kartoitus olivat erityisiä. Toisaalta olemme myös kohdanneet esimerkki, jossa sekvenssin talteenotto ei ollut erityinen. Nimittäin PMS2-geeni on yksi kohdennettujen geenien tutkimuksessamme, mutta havaitsimme lukee kartoitus on PMS2 pseudogeeniä, PMS2CL, joka sisältää kuusi ensimmäistä eksonia PMS2-geeni. Ansiosta käytön pitkä lukee, tämä ei aiheuta ongelmia vaihtelun havaitsemiseksi, koska kunkin geenin vastaavan lukee kartoitettu
yksilöllisesti
oikean geenin, joko PMS2 tai PMS2CL. Huomaa, että talteenotto teknologia tarjoaa lisää vihjeitä saavuttaa suurempi spesifisyys koska paitsi eksonit käsitellään talteenottoa mutta myös reunustavien introni alueilla.