PLoS ONE: evoluutiohistoriasta Cancer Immunity antigeeni MAGE Gene Family
tiivistelmä
evoluution tila monen geenin perhe voi muuttua ajan myötä riippuen toiminnallinen eriyttäminen ja paikallinen genomista ympäristö perheenjäseniä. Tässä tutkimuksessa osoitamme tällaista muutosta melanooma-antigeeni (
MAGE
) geeniperheen on nisäkkäiden X-kromosomi.
MAGE
geeni perhe koostuu kymmenestä subfamilies, jotka voidaan luokitella kahteen tyyppiin. Tyyppi I geenit ovat suhteellisen uusia alkuperää, ja ne koodaavat epitoopit HLA (HLA) syöpäsoluissa. Tyyppi II geenit ovat suhteellisen vanha ja joidenkin tuotteiden tiedetään olevan osallisena apoptoosin tai solujen lisääntymisen. Evoluutiohistoriasta on
MAGE
geeniperheen voidaan jakaa neljään vaiheeseen. Vaiheessa I, yhden kopion tilaa, jossa esi-geenin ja evolutiivisesti säilytetty tila oli kesti syntymistä eutherian nisäkkäitä. Vaiheessa II, kahdeksan subfamily esivanhemmat, lukuun ottamatta varten
MAGE-C
ja
MAGE-D
subfamilies, muodostettiin kautta retrotranspositiossa itsenäisesti. Tämä vastaisi kanssa osaksi puhkeamisen
LINE
elementtejä klo eutherian säteilyä. Kuitenkin
MAGE-C
synnytettiin geenin päällekkäistä
MAGE-A
. Faasi III on ominaista laaja geenikahdennustapahtuman kussakin alaheimon ja erityisesti muodostumista palindromien
MAGE-A
alaperheessä joka tapahtui esi Catarrhini. Vaihe IV on tunnusomaista rappeutuminen palindromi useimmissa Catarrhini, lukuun ottamatta ihmisillä. Vaikka palindromi on katkaistu tiheään deleetioita apinoita ja vanhan maailman apinat, se säilyy ihmisellä. Täällä väittävät, että tämä ihmisen erityinen säilyttäminen perustuu negatiivisen valinnan toimivat
MAGE-A
geenit koodaavat epitooppeja syöpäsolujen, joka säilyttää niiden kyky sitoutua hyvin erilaisten HLA-molekyylejä. Nämä havainnot tulkitaan harkiten biologisten tekijöiden muotoiluun äskettäin ihmisen
MAGE-A
geenejä.
Citation: Katsura Y, Satta Y (2011) evoluutiohistoriasta Cancer Immunity antigeeni
MAGE
Gene Family. PLoS ONE 6 (6): e20365. doi: 10,1371 /journal.pone.0020365
Editor: Nikolas Nikolaidis, California State University Fullerton, Yhdysvallat
vastaanotettu: 14 helmikuu 2011; Hyväksytty: 18 huhtikuu 2011; Julkaistu: 10 kesäkuu 2011
Copyright: © 2011 Katsura, Satta. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.
Rahoitus: Tämä työ tukivat Grant-in tuki tieteellisen tutkimuksen Priority Areas (17018032). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.
Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.
Johdanto
evoluution tila geenin perhe, eli prosessi syntymästä ja kuolemasta geenien ja laajuudet sekvenssin eroavaisuuksia, riippuu toiminnallisen eroavuus monistaa geenejä sekä paikalliseen rakenteeseen genomin, jossa perhe asuu [1], [2]. Täällä, paikallinen rakenne genomin viittaa tandem tai ylösalaisin toistot (IR). Kehitys geeniperhettä IRS voi olla erityisen monimutkainen seurauksena homogenoinnin tiheällä geenikonversiota ja rakenteellinen epävakaus kuten johtuu usein lisäyksiä ja /tai poistoja.
Warburton et al. (2004) löysi voittopuolisesti suuri, IR, joilla on korkea samankaltaisuus toistojen X- ja Y-kromosomia (-30% IRS ihmisen perimässä ovat X- ja Y-kromosomia) [3]. Monet IR X ja Y sisältävät geenit ilmaistaan pääasiassa kiveksissä [3]. Warburton ja hänen kollegansa ehdotti, että nämä IR tärkeä rooli ihmisen genomin evoluutio. Kuitenkin tarkka rooli IR evoluutiossa on jäänyt epäselväksi. Siksi tässä tutkimuksessa, pyrimme tutkimaan tempo ja tila geeniperheen evoluution IR, joilla on erityinen painopiste on melanooma-antigeeni (
MAGE
) geeniperheen, jonka jäsenet sijaitsevat suuri ( -100 kb) palindromi ihmisen X-kromosomissa.
MAGE
tunnistettiin alun perin ”melanooma-antigeenin” ja myöhemmin
MAGE
ja sen homologeista, havaittiin muodostamiseksi multi-geeniperheen eutherian genomien [4] – [7].
MAGE
homologiset sekvenssit on todettu joitakin selkärankaisten (seeprakala ja kana) [8], [9] ja selkärangattomat (banaanikärpäsen) [10]. Ihmisen perimässä, tämä perhe koostuu 10 subfamilies ja kukin subfamily koostuu yhdestä 15 geeneihin [7]. Lisäksi luokittelu alaperheessä
MAGE
geenejä voidaan myös jakaa tyypin I tai tyypin II, joka perustuu niiden ilmaisun kuvioita ja toiminta. Tyypin I geenit koostuvat kolmesta alaperhettä (
MAGE-A
, että –
C
) ja tyypin II geenejä seitsemän alaperhettä (
MAGE-D
ja –
F
, –
H
, –
L2
,
NDN
,
NDNL2
). Tyypin I geenit ilmentyvät voimakkaasti lisääntyvien solujen kuten kasvaimia, istukka ja ituradan solujen [4]. Tyyppi II geenejä, sitä vastoin ovat läsnä kaikissa somaattisissa soluissa, ja jotkut tyypin II geenejä tiedetään olevan osallisena apoptoosin tai lisääntyminen [11].
Kaikki tyyppi I
MAGE
geenit sijaitsevat X-kromosomissa ja koodata kasvaimen antigeenejä, joilla on tärkeä rooli syövän koskemattomuus. Peptidit ihmisen MAGE-homologiadomeeni (MHD), joka on 160-170 aminohappoa pitkä, ovat epitoopit HLA (HLA) luokan I molekyylien [4]. Kun antigeeni (peptidin MHD) kasvainsolun sitoutuu reseptoriin on tappaja-T-solujen, T-solujen iskujen kasvainsolun [4], [12].
HLA
on poikkeuksellisen polymorfinen ihmisen perimän ja eri
HLA
alleelit voivat sitoutua eri epitooppeihin [13], [14].
MAGE
geenit voivat koodata monia epitooppeja niin, että se sitoutuu, tai reagoida sen kanssa, joka HLA-molekyylin. Siten on kiinnostavaa alkuperän jäljittämiseksi yhdistyksen välillä
HLA
ja
MAGE
sekä määrittää, miten geneettinen monimuotoisuus epitooppia koodaava alue on kehittynyt ja pysynyt.
Monet
MAGE
geenit arvellaan olevan nisäkkään-erityinen [7]. Lisäksi useimmat eutherian
MAGE
geenit on yksi eksoni koodata proteiinia ja siksi he ovat todennäköisesti peräisin retrotranspositiossa on
MAGE-D
[7], koska vain
MAGE-D
alaperheen jäsenten on 14 eksonia, jossa ORF on välissä koodattuja toinen 12 eksonit [15]. Silti suhde tyypin I ja tyypin II geenejä ei ole täysin tutkittu ja tila monipuolistaminen näiden geenien edelleen epäselvä.
Tässä tutkimuksessa tutkimme evoluutiohistoriasta
MAGE
geeniperheen. Ensin etsittiin eniten muinoin poikkesivat
MAGE
geenien selkärankaisten ja selkärangattomien genomien. Toiseksi tutkimme miten ja milloin esi kunkin kolmen tyypin I ja seitsemän tyypin II subfamilies kertyi erityisesti viitaten niiden tila vahvistusta. Kolmanneksi keskitymme
MAGE
–
subfamily (yksi tyypin I subfamilies) ja osoittavat, kuinka genomin järjestely on tapahtunut kädellisillä. Lopuksi osoitamme, että jotkut ihmisen
MAGE
–
geenit ovat läpikäyneet negatiivisen valinnan vastaan homogenointi geenin muuntaminen säilyttääkseen niiden geneettisen vaihtelut joukossa aminohapposekvenssejä. Ehdotamme, että tämä valinta liittyy ylläpitoon erilaisten HLA-epitooppien syöpäsoluissa.
Materiaalit ja menetelmät
Jaksot käytetään
Human (
Homo sapiens
) nukleotidisekvenssi datan ja vastaavan geenin tietoja saatiin NCBI-tietokannan (rakentaa 36,3, https://www.ncbi.nlm.nih.gov/). Syntenic tai homologinen geenisekvenssejä muista kädellisistä ja nisäkkäiden, mukaan lukien opossumeja (
Monodelphis domestica
) ja platypuses (
Ornithorhynchus anatinus
), haettiin NCBI ja Ensembl tietokantoja (http: //uswest .ensembl.org /index.html). Löytää konservoituneen synteny välillä ihmisen X-kromosomi ja kromosomia muissa eläimissä, BLAST-analyysien avulla ihmisen
MAGE
geenejä kyselyt tehtiin. Tunnistaa homologiset sekvenssit, käytämme 70% kuin cut-off-arvo BLAST hauissa.
tunnistaminen perimän rakenteita
tunnistaminen IR ja tandem-toistojen suoritettiin käyttäen matriisitulostimella lähestymistapa [ ,,,0],16]. GenomeMatcher [17] käytettiin sitten saada yksityiskohtaista tietoa nukleotidisekvenssin samankaltaisuuden päällekkäisiä yksikköä. Kaavio piirtämä ohjelman kuvaa laajuutta samankaltaisuuden sekvenssien avulla värikoodit, punaiset edustavat samankaltaisuutta yli 95%, oranssi, jotka edustavat noin 90% -95%, vihreä, jotka edustavat noin 85% -90%, ja sininen edustaa alempi kuin 85 %.
fylogeneettinen ja molekyylitason kehittyvä analyysit
tutkia fylogeneettiseen välisiä suhteita
MAGE
perheenjäsenet, 158 koodaavat sekvenssit (CDS) ihmisen, simpanssin (
Pan troglodytes
), makaki (
Macaca mulatta
), hiiri (
Mus musculus
), lehmä (
Bos taurus
), koira (
Canis lupus
), opossumi, Platypus, kana (
Gallus gallus
) ja seeprakalalla (
Danio rerio
) genomin haettiin NCBI tietokannasta (taulukko S1).
MAGE
homologeja myös haettavissa Ensembl tietokantaan Länsi Afrikkalainen kynsi sammakko (
Xenopus tropicalis
), nahkiais- (
Petromyzon marinus
), lancelets (
Branchiostoma floridae
), vaippaeläinten (
Ciona intestinalis
) ja merisiili (
Strongylocentrotus purpuratus
). Kullekin näistä lajeista, etsittiin
MAGE
homologit koko genomit. Vuonna etsii homologeja,
MAGE-D
alaperheen jäseniä käytettiin kyselyn, koska
MAGE-D
ajatellaan olevan esi
MAGE
subfamily [7] . Kun käytämme muita ihmisen
MAGE
sekvenssit kuin kyselyn, huomasimme, että sekvenssit havaittu sisältyivät jo saatu tulos
MAGE-D
.
Ihmisen genomin oli 37 selityksin
MAGE
geenejä X-kromosomissa 15
MAGE-a
s, 11
MAGE-B
s, kolme
MAGE-C
s, viisi
MAGE-D
s, kaksi
MAGE-E
s ja yksi
MAGE-H
. Lisäksi kaksi
MAGE-F
s sijaitsevat kromosomissa 3, ja
necdin kaltainen 2
(
NDNL2
tai
MAGE-G
)
MAGE kaltainen 2
(
MAGE-L2
) ja
necdin
(
NDN
) ovat kromosomissa 15. lisäksi selityksineen geenejä, eli homologinen sekvenssi (
psMAGEA-like: psMAGEAL
, NC_000023: 2765558 ‥ 2770471), joka vastaa ihmisen
MAGE
pseudogeeniä,
psMAGEA
(NC_000023: täydentävä 151952946 ‥ 151957859), tunnistettiin. Gene lyhenteitä käytetään tässä tutkimuksessa noudattavat standardeja käytetään ihmisten geenien.
Saadut sekvenssit rinnakkain käyttämällä ClustalW ohjelmistojen [18] käsin korjauksia. Sekvenssit ihmisen
MAGE-H
, –
A5
, ja hiiri –
A9
olivat lyhyitä. Nämä hylättiin, koska sisällyttäminen näiden sekvenssien teki mielekästä sekvenssikohdistuksen lyhyt. Lukumäärä nukleotidierot kohti päällä (
p
-Etäisyys) laskettiin sitten käyttäen MEGA4 [19], ja phylogeny rakennettiin käyttäen naapuri-liittymällä (NJ) [20] menetelmä saatavilla tämän ohjelmiston. Phylogenies myös rakennettu Satunnaistettu A (x) ccelerated Farrow (RAxML) [21] ja Bayes (Bayes) menetelmät. Ohjelma varten RAxML menetelmä tarjoaa https://phylobench.vital-it.ch/raxml-bb/ja että Bayes menetelmän MrBayes 3 [22]. Rinnastuksia käytetään tässä ovat saatavilla pyynnöstä. DnaSP V5 [23] on käytetty ikkunassa analyysi nukleotidin eroja. RepeatMasker [24], käytettiin seulomaan sekvenssejä välissä toistojen NCBI-tietokannasta. Ohjelma, GENECONV [25] havaitsemiseen käytettiin geenin muuntaminen.
Transkriptiotekijän sitoutumiskohdat
Transkriptiotekijän sitoutumiskohdat (TFBs) tutkittiin käyttäen Transfac R4.3 tietokannan [26], saatavilla TFBIND verkkosivuilla (http: //tfbind.ims.u-tokyo.acjp/) [27]. Löytää ehdokas TFB, sekvenssit ylävirtaan kohdegeenien yhtenäistettiin, ja hyvin säilyneitä sekvenssit valittiin. Sekvenssit tarkastettiin läsnäolo TFBs selityksin tietokantaan.
Tulokset
alkuperä selkärankaisten ja nisäkkäiden
MAGE
geeniperheen
Tunnistaa
MAGE
homologien nahkiais-, lancelets, vaippaeläimet, ja merisiilit, BLAST haku suoritettiin niiden genomin ja EST-sekvensseihin käyttäen
MAGE-D
geenejä kyselyitä. Vaikka ei ollut havaittavissa homologisia geenejä nahkiais- ja merisiilien, hypoteettinen geenejä sekä vaippaeläinten (XM_002119518) ja lancelets (XM_002613563) osoitti 37% sekvenssin samankaltaisuus ihmisen
MAGE-D1
. BLAST hakutulokset osoitti, että syntyminen
MAGE
geeni olisi voinut syntyä ennen eroavuus Protochordata peräisin Chrodata.
leualliset selkärankaisia, Seeprakala genomi hallussaan yhden
MAGE
geeni,
Necdin kaltainen 2
(
DareNDNL2
) [8].
NDNL2
geenejä löytyy myös ihmisillä, hiirillä ja lehmiä, mutta eutherian
NDNL2s
käsitellään geenejä ja on yksi eksoni, kun taas
DareNDNL2
hallussaan ~11 eksonit. Fylogeneettinen puu perustuva aminohapposekvenssien mukaan eutherian
NDNL2
s ovat paraphyletic on
DareNDNL2
(kuviot. 1 ja S1):
DareNDNL2
on ”ensisijainen” ortologisista of eutherian
MAGE
geenejä [28]. Tämä fylogeneettinen suhde (topologia puu) tukevat myös RAxML ja Bayes puita (tuloksia ei ole esitetty).
CDS 158
MAGE
-geenejä käytettiin (katso taulukko S1). CDS verrattuna on 204 emäsparia pitkä. Sen jälkeen kohdistus, kaikki aukot ei otettu puukonstruktion. Alaheimo klusterit esitetään. Numero kussakin solmussa on bootstrap arvo tukeva solmu. Kala
NDNL2
(
Dare NDNL2
) ja nisäkäs
NDNL2
näkyvät sinisellä. Laji nimi lyhenteet ovat seuraavat: Bota (
Bos taraus
), Capo (
Cavia porcellus
), Dare (
Danio rerio
), Gaga (
Gallus gallus
), Hosa (
Homo sapiens
), Mamu (
Macaca mulatta
), Modo (
Monodelphis domestica
), Mumu (
Mus musculus
), Orna (
Ornithorhynchus anatinus
), ja Patr (
Pan troglodytes
). Kuva S1 on suurennettu versio tämä luku ja on luettavissa teksti.
Jokainen sammakko ja kanan genomien hallussaan vain yksi
MAGE
geeni. Molemmissa tapauksissa, jotka koskevat syntenic suhde
DareNDNL2
, asema geenin kromosomissa ei voitu vahvistaa puutteellisen tehtävän geenien kromosomeissa näillä lajeilla. Koska kuitenkin vaiheet jokaisen eksonin ja intronin rajan CDS kaloja, sammakoita ja kanat olivat hyvin konservoituneita (taulukko 1), yksittäinen
MAGE
geenien sammakon ja kanan ovat todennäköisesti yksi- -oni ortologeja
DareNDNL2
.
Vaikka vain yksi
MAGE
löytyi kaloja, sammakoita ja kanoja, ihmisillä ja hiirillä on useita alaryhmää
MAGE
geenit [7]. Siten on mielenkiintoista tutkia
MAGE
homologien monotremes (platypus) ja marsupials (opossumi). Täyden genomin BLAST-haun ihmisen
MAGE-D1
kuin kyselyn havainnut yhden
MAGE
-kuten (
Magel
) sekvenssin vesinokkaeläin ja kaksi
Magel
s että opossumi. Nämä alustavasti nimetty
OrnaMAGEL
ja
ModoMAGEL1 Twitter /
L2
, vastaavasti. BLAST hakee muilla
MAGE
geenejä, kuten
DareNDNL2
kuin kyselyn tuloksena havaitseminen samat geenit.
opossumeja
ModoMAGEL1
ja
ModoMAGEL2
sijaitsevat kromosomeissa X ja 8, vastaavasti.
ModoMAGEL2
koodataan yhdellä eksoni, kun taas
ModoMAGEL1
koodataan 11 eksonia. Siten
ModoMAGEL2
on todennäköisesti käsitellään geeni on johdettu
ModoMAGEL1
. Todellakin,
ModoMAGEL1
ja
ModoMAGEL2
muodostavat monophyly puussa (Fig. 1, Fig. S1) ja puiden rakennettu kolmella eri menetelmällä (NJ, RAxML ja Bayes).
platypuses
OrnaMAGEL
geeni sijaitsee contig Ultra 403 ja koostuu 10 eksonista. Vaikka määrä eksonien eroaa
ModoMAGEL1
, vaiheet ja koot jaetun eksonien ovat hyvin konservoituneita (taulukko 1). Lisäksi Ultra 403 sisältää myös ubikitiinipromoottori ligaasi-geenin
HUWE1
(hect, UBA ja WWE domeenin, joka sisältää 1), joka sijaitsee ~600 kb ylävirtaan
OrnaMAGEL
.
in situ
-hybridisaatio tutkimus vahvisti, että vesinokkaeläin,
HUWE1
sijaitsee kromosomissa 6 [29]; Näin ollen, on todennäköistä, että tämä jatkumon on osa kromosomi 6. Vesinokkaeläin kromosomi 6 on homologinen autosomaalinen esi eutherian ja pussieläimet X-kromosomia [29]. Itse asiassa, ympäröivä alue
OrnaMAGEL
contig osoitti syntenic suhdetta ihmisen Xp11 alueella. Ihmisen perimässä, asentoon, joka vastaa
OrnaMAGEL
on käytössä
MAGE-D2
ja –
D3
(Fig. 2). Ihmisen
MAGE-D2
ja –
D3
hallussaan 13 eksonit, ja vaiheet ja koot jaetun eksonien säilytetään kanssa
OrnaMAGEL
, sekä
ModoMAGEL1
ja muut
MAGE
geenien kana, sammakko, ja seeprakala genomit (taulukko 1).
Red palkit osoittavat
MAGE-D
tai
Magel
geenien ihmisen tai platypus, vastaavasti. Mustat palkit sekä geeni nimet osoittavat syntenic geenejä ihmisen ja platypuses. Siniset palkit ja geeni nimet osoittavat geenejä, jotka eivät näytä synteny. Muut
MAGE-D
alaperheen jäsentä,
MAGE-D1
ja
MAGE-D4
sijaitsevat 51,6 M ja 51,9 M ihmisen X-kromosomi, vastaavasti.
Phylogeny nisäkkäiden
MAGE
geeniperheen
puu ihmisen
MAGE
geenit osoittavat, että kolme tyyppi I
MAGE
subfamilies (
MAGE-A
, –
B
ja –
C
) muodostavat monophyletic klusterin, joka eroaa seitsemästä tyypin II subfamilies (
MAGE- D
, –
E
, –
F
, –
H
, –
L2
,
NDN
ja
NDNL2
) (Fig. 3). Todisteet tukevat viisi fylogeneettisesti informatiivinen vaihdot (D16Y, K23T, I62V, A113E, ja R156Q käytettäessä linjaus MHD, Fig. S3). Lisäksi
MAGE-D
geenit muodostavat monophyletic klusteri. Vaikka määrä nukleotideja käytetään tässä analyysissä on pieni, on selvää, että tyypin I subfamilies erosivat myöhemmin kuin tyypin II alaperheisiin (Fig. 3 ja Fig. S2).
puu perustuu lukumäärän aminohappoeroavuuksien kohti päällä (
p
-distances). Geenit mutta
DareNDNL2
puussa ovat kaikki
MAGE
geenejä löydetty ihmisen genomin.
DareNDNL2 myynnissä maassa zebrafish käytetään määrittämään puun juureen. Sivustojen määrä verrattuna on 92 aminohappoa ilman aukkoja. Bootstrap-arvo on merkitty solmussa. Sekvenssit on lueteltu taulukossa S1.
MAGE-E
on kahdennettu MHD ja päällekkäisyys on tapahtunut aikaisemmin kuin syntyminen tyypin Ι geenejä.
MAGEE1_1
(
MAGEE2_1
) ja
MAGEE1_2
(
MAGEE2_2
) edustavat MHD N ja C-pään puolella
MAGE-E1
(
MAGE-E2
), tässä järjestyksessä. Eutherian
MAGE-D3
geeni koodaa trophinin (TRO), joka ilmentyy istukassa ja vaikuttaa alkion istutusta.
Lukuun ottamatta
MAGE-D
geenit, nisäkkään
MAGE
geenit on yksi eksoni varten CDS. Näin ollen nämä ovat todennäköisesti käsitellään jotka on johdettu selostukset
MAGE-D
tai muu
MAGE-D
käsitelty geenit [7], [30]. Emme kuitenkaan voi sulkea pois sitä mahdollisuutta, että esi kunkin subfamily johtui päällekkäistä jalostetun geenin.
tarkastella, kuinka esi kunkin geeniperheen nousi nukleotidisekvensseistä yhden edustajaa kustakin subfamily oli verrataan keskenään käyttäen matriisitulostimet analyysi [16]. Jos koko koodaavan alueen lukien vierusalueeseen on kahdennettu, The dotter analyysi osoittaa samankaltaisuutta yli CDS. Toisaalta, esi kunkin subfamily on tuotettu retrotranspositioon, analyysi osoittaa samankaltaisuutta ainoastaan CDS.
Suurimmaksi
MAGE
geenejä, dot-matriisi analyysi osoitti että sisällä ja välillä tyypin I ja II merkittäviä samankaltaisuuksia havaittiin vain CDS alueilla, mikä viittaa retrotranspostion. Vertailu
MAGE-A
ja
MAGE-C
, toisaalta, oli poikkeus. Vertailu paljastaa samankaltaisuuden yli CDS, mikä viittaa DNA-pohjainen geenikahdennustapahtuman. Saattaa kuitenkin olla mahdollista, että muut subfamilies myös syntyvät geenikahdennustapahtuman. Sekvenssin samankaltaisuus reunustavat alueet on kaksoiskappale oli mahdollisesti menetetty evoluution aikana, koska heikomman toiminnallinen rajoite. Itse asiassa, laajuus synonyymi sekvenssin eroja joukossa tyypin II gens ja näiden välillä tyypin I ja tyypin II geenejä vaihtelee 0,81-1,0, siten, että mitään merkittävää samankaltaisuutta alueella yli CDS havaittiin. Vaikka kladistiikka markkereita, kuten
Lines
ehkä ollut informatiivinen erottamiseksi retrotranspositiossa geenien päällekkäisyyksiä, ei tällaista informatiivinen löytynyt. Siksi puuttuessa tukevia todisteita, päättelimme, että
MAGE-C
oli monistaa
MAGE-A
ja että muut subfamilies kertyi retrotranspositiossa. Yhteensä kahdeksan insertioita retrotransposed
MAGE
on tapahtunut genomin esi Eutheria ja jalostettujen geenin tuli esi alaryhmä. Sen jälkeen retrotranspositioon, itsenäinen geenikahdennustapahtuman näyttää tapahtuneen kussakin subfamily.
Gene päällekkäisyyttä ja palindromi muodostumista
On huomionarvoista, että ryhmittely malli
MAGE-A
poikkeaa
MAGE-B
(Fig. 1, Fig. S1). Jokainen 11 ihmisen
MAGE-B
geenit muodostavat monophyletic klusterin ortologeihin muissa eutherians, kun taas 15
MAGE-A
geenit muodostavat laji- tai luokitusjärjestelmän mukaan eri ryhmiin (Fig. 1 kuvio. S1 ja S2). Lisäksi kolme
MAGE-C
geenit näyttävät olevan kädellisen erityinen. Sisällä kaksi tyypin II
MAGE
subfamilies, viisi
MAGE-D
ja kaksi
MAGE
–
E
geenit osoittavat myös niputtamisesta kuvio (yksi- kahdenkeskinen ortologiset suhde) samankaltainen kuin
MAGE-B
(kuviot. 1 ja 3).
yhteensä 16
MAGE-A
geenit sijaitsevat Xq28, alueella 148 Mb 153 Mb, ja on ryhmitelty kolmeen lohkojen A, B ja C (Fig. 4A). Lohkot A ja B sisältävät viisi (
MAGE
–
A11
, –
A9
, –
A9B
, –
A8
ja
psMAGEA7
) ja kymmenen (
MAGE
–
A4
, –
A5
, –
A10
, –
A6
, –
A2B
, –
A2
, –
A12
, –
A3
,
psMAGEA
ja
psMAGEAL
) geenit, vastaavasti, kun taas lohko C sisältää yhden geenin (
MAGE-A1
) (Fig. 4B ja C). Kukin kolmesta lohkojen hallussaan palindromi (Fig. 4C). Kuitenkin vain lohkossa B useimmat geenit (kuusi kymmenestä) sijaitsevat molemman palindromi (Fig. 4C). Kolme lähes identtisestä
MAGE
–
A2 Twitter /
A2B
, –
A3 Twitter /
A6
,
psMAGEA /psMAGEAL
sijaitsevat symmetrinen kannat aseiden (Fig. 4B ja 4C), kun taas
MAGE-A12
sijaitsee silmukka-alue. Olemme nimenneet parin päällekkäisiä geenien tai sekvenssien x ja y symmetrinen kannoista palindromi muodossa x /y. Fylogeneettiseen välisiä suhteita 16
MAGE-A
geenejä, mukaan lukien
psMAGEAL
(Fig. 4B, katso Materiaalit ja menetelmät) ja
MAGE-D
käyttää outgroup paljasti, että viisi geeniä lohkossa B ovat on monophyly, kun taas pari
psMAGEA Twitter /
psMAGEAL
geenit kaukaista sukua muille
MAGE-A
geenejä.
(
) vino viiva vedetään vasemmassa yläkulmassa oikeassa alakulmassa ilmaisee identiteetti alueella. Alue on jaettu kolmeen osa-alueilla, A, B, ja C, jotka sisältävät viisi, 10 ja yksi
MAGE-A
geenien, vastaavasti. (
B
) Puu rakennettiin käyttäen useita nukleotidin eroja (
p
-distances) keskuudessa CDS (1916 bp) 16
MAGE-A
geenejä. Numero kussakin solmussa edustaa bootstrap todennäköisyyttä tukeva että solmu. Bootstrap-arvot yli 50% on esitetty. Operatiivinen taksonominen yksikköä (OTU) magenta, vihreä ja sininen edustaa geenien seutukunnissa A, B ja C, vastaavasti. (
C
) Kolme ennustettu palindromien esitetty seutukunnissa A, B ja C. seutukunnassa B, useimmat geenit sijaitsevat otaksuttu palindromi aseita.
Ihmisen lohko B koostuu seitsemästä päällekkäisiä yksiköitä. Jokainen yksikkö on 10-20 kb pitkä ja sisältää
MAGE-A
ja kondrosarkoomaan liittyvä geeni (
CSAGE
) [31] (Fig. 5
). BLAST-analyysi nisäkkäiden genomien osoittaa myös puuttuminen
CSAGE
homologit ei-kädellisten nisäkkäiden. Palindromin lohkossa B ei havaittu ei-kädellisten genomeja, kuten hiiren, koiran ja hevosen genomit.
(
) diagonaaliosan linjat vasemmalta ylhäältä oikealle pohjaan ilmaisee identiteetin ihmisen (vasen paneeli) tai makaki (oikea paneeli) järjestyksessä. Aukkoja poikkiviiva on makaki osoittavat sekvensointi aukkoja. Värillinen alalaidassa kunkin paneelin osoittaa seitsemän päällekkäistä yksikköä. Sama värinen laatikot lajin sisällä osoittavat, että he ovat läheistä sukua toisilleen kuin toiset, kun taas lajien välillä osoittavat otaksuttu ortologeihin. (
B
) Palindromes ennustettu osa-B ihmisen (vasemmalla) tai makaki (oikealla) järjestyksessä. Numerot vieressä viivat osoittavat kukin kahdennettu yksikkö. (
C
) Lentotoiminnan NJ puu perustuu
p
-distances välillä kahdennettu yksikköä (2880 bp) on esitetty. Väri-koodi OTU on sama kuin (
) ja (
B
).
joukossa kädelliset, lohko B voidaan tunnistaa makakeilla (Fig. 5
). Tämä lohko sisältää myös seitsemän kahdennettu yksikköä, mutta muoto odotetun palindromi eroaa ihmisen ja makaki. Toisin kuin pitkä varsi ja lyhyt silmukka havaitaan ihmisen, että makaki, lyhyt varsi ja iso silmukka rakenne ennustetaan (Fig. 5
B
). Edelleen orthology yksiköiden välillä makakien ja ihmisten utelias annetaan asemiaan. Yksinkertaisuuden, me nimettiin seitsemän päällekkäisiä yksiköitä lohkossa B
h1
osoitteeseen
H7
ihmisillä ja
m1
osoitteeseen
m
7 makakeilla ( Fig. 5
) ja sitten tutkittiin niiden fylogeneettiseen suhteita (kuva 5
C
). Yksikköä
h1 Twitter /
h7
kätkeminen
psMAGEAL
ja
psMAGEA
geenit ortologiset osoitteeseen
m1 Twitter /
M7
. Yksikköä
h3 Twitter /
h5
kanssa
MAGE-A2 /A2B
geenit ortologiset osoitteeseen
m5
kanssa
MAGE-A2
: kuitenkin makakit,
m5
sijaitsee silmukan ja ei ole kumppani (erittäin samankaltainen sekvenssi)
m5
lohkossa. Yksikkö
h4
kanssa
MAGE-A12
on ortologiset että
m3
, mutta makakeilla tämä laite ei sisällä
MAGE
geenin (Fig . 5
). Lisäksi välisiä suhteita
h2 Twitter /
h6
,
m
2,
m4
ja
m
6 ovat hieman sekava, huolimatta siitä, että
MAEG-A3 /A6
on
h2 Twitter /
h6
ja kolme mahdollista homologit (
MAGE-A3
, –
3L
, ja –
A3L
) ovat
m
2,
m4
ja
m
6.
p
-Etäisyys välillä
h2
ja
h6
oli 0,7% (± 0,2), kun taas
p
-distances keskuudessa
m
2,
m4
ja
m
6 ovat paljon suurempia (12,1%) kuin edellinen. Pareittain etäisyydet yksiköiden välillä ihmisten ja makakit vaihtelivat 8,3% (± 0,5) 17,7% (± 0,7), joka on liian suuri varten ortologiset suhteen. Fylogenia myös ei tukenut ortologiset suhde joukossa kukin kolmesta yksiköiden makakeilla (
m
2,
m4
tai
m
6) ja
h2 Twitter /
h6
(Fig. 5
C
).
tutkia edelleen ortologiset suhteita näiden monistaa yksiköiden kladistiikka markkereita, kuten
SINE
s ja
LINE
s etsittiin käyttäen RepeatMasker ohjelmistojen [24] (Fig. 6). Yleensä järjestely
SINE
s,
LINE
s,
LTR
s, ja lyhyt toistoja lohkossa B esittää osittaista samankaltaisuutta ihmisen ja makaki genomin. Asema ja tyyppi toistuvat sekvenssit löytyi koko
m2 alue
ovat lähes samat kuin löytyy distaalisessa puoliskolla
h2
. Samanlainen jakautuminen toistuvat sekvenssit on havaittu alue
m5
ja
h5
, ja samankaltaisuus on myös havaittu osa
m4
ja että
h4
. Kuitenkin lajikohtaisia alueet näyttävät olevan läsnä kussakin genomissa. Ihmisillä alue on -40 kb pitkä ja ulottuu keskeltä
h2
osoitteeseen
h4
, kun taas makakit, laji-tietyllä alueella on -30 kb ja ulottuu keskeltä on
m2
osoitteeseen
m4
. Toisin tulokset fylogenia ja geneettinen etäisyys analyysejä (kuviot. 5
C
ja 6) kladistiikka markkereita osoitti, että
h2
ihmisen
MAGE-A6
ja
m2
kanssa makakit
MAGE3L
ovat todellakin ortologiset toisiinsa.
värilliset kolmiot osoittavat välissä elementtejä (
viivoja
tai
sines
)
LTR
, DNA transposoneja (
DNA-TP
) tai yksinkertaisia toistoa (
SR
) löydetty ihmisen tai makaki genomin, vastaavasti. Suluissa kunkin linjan osoittavat päällekkäisiä yksiköitä. Vaaleanpunainen nuolet osoittavat palindromi rakenne. Vaaleansininen nuoli osoittaa sekvensointi aukkoja makakeilla. Letters A-L ja ’i’ on kolmiot osoittavat ortologiset insertioelementeistä ihmisen ja makaki genomien. Valo Vihreä palkki tarkoittaa ihmisestä tai makaki-tietyllä alueella ja pisteviivat merkitsevät välistä rajaa lajispesifisiä ja ortologiset alueilla.
Ihmisen erityinen palindromi ja geenikonversiota
matrix-analyysi paljasti, että palindromi lohkossa B ilmenee vain ihmisillä. Vaikka sekvensointi puutteita tällä hetkellä olemassa simpanssi ja orangutan genomiin käytettävissä sekvenssit osoittivat, että palindromi lohkossa B on vähemmän ilmeinen näissä kahdessa apinoita kuin ihmisillä (Fig. 7). Olemme parsimoniously päätellä esi tilan palindromi käyttämällä sekvenssi-informaatiota genomin säilynyt kädellisten lajien.
ikkunan koko on 500 bp, jossa ei ole päällekkäisyyttä vierekkäisten ikkunoiden välissä. Värilliset suorakulmioita alareunassa luku osoittaa päällekkäisiä yksikön lukien
MAGE
geenejä (vaaleanpunainen nuolet). Ordinaatta edustaa nukleotidin eroavuus (
d
) ja abskissa edustaa sijainti (bp) suhteessa keskustaan silmukan (asento nolla, sininen nuoli). Ympäröivä alue on punainen katkoviiva osoittavat korkea poikkesivat alueella
MAGE-A3
ja
MAGE-A6
.
Geenit on palindromien saattavat kokea toistuvia geenikonversion .