PLoS ONE: Prediction of Cancer Drugs Chemical Chemical vuorovaikutukset

tiivistelmä

Syöpä, joka on johtava kuolinsyy maailmassa asettaa suuri taakka terveydenhuoltojärjestelmän. Tässä tutkimuksessa tilaus-ennustemalli rakennettiin ennustaa sarjan syöpälääkkeen merkintöjen perusteella kemikaalien-kemialliset vuorovaikutukset. Mukaan luottamus tulokset niiden vuorovaikutusta, tilauksen todennäköisimmin syöpä vähiten yksi saatiin jokaisessa haussa huume. 1

st järjestys ennustetarkkuus Koulutuksen aineisto oli 55.93%, arvioi Jackknife testissä, kun se oli 55,56% ja 59,09% enemmän validointitestiä aineisto ja riippumaton koe aineisto, vastaavasti. Ehdotettu menetelmä ylitti suosittu perustuva menetelmä molekyylien kuvaajien. Lisäksi varmistettiin, että jotkut lääkkeet olivat tehokkaita ”väärän” ennusti merkkejä, mikä osoittaa, että jotkut ”väärää” huume merkinnät olivat itse asiassa oikea merkkejä. Rohkaisemana lupaavia tuloksia, menetelmä voi tulla hyödyllinen väline ennustamiseen lääkkeiden merkinnöistä.

Citation: Lu J, Huang G, Li H-P, Feng K-Y, Chen L, Zheng M-Y, et al. (2014) Prediction of Cancer Drugs Chemical-kemialliset vuorovaikutukset. PLoS ONE 9 (2): e87791. doi: 10,1371 /journal.pone.0087791

Editor: Lukasz Kurgan, University of Alberta, Canada

vastaanotettu: 04 lokakuu 2013; Hyväksytty: 31 joulukuu 2013; Julkaistu: 03 helmikuu 2014

Copyright: © 2014 Lu et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus rahoittivat National Basic Research Program of China (2011CB510101, 2011CB510102), National Science Foundation of China (61202021, 31371335, 61373028), Innovation Program Shanghai Municipal Education komissio (12ZZ087, 12YZ120), myöntäminen ”The First luokan Kuri yliopistolakiluonnoksen Shanghai ”, Shanghai Educational Development Foundation (12CG55), tieteellinen tutkimus Fund Hunanin maakunnan tieteen ja teknologian osasto (2011FJ3197), Hunan National Science Foundation (Grand: 11JJ5001), ja tieteellinen Research Fund of Hunan Provincial opetusvirasto (Grant: 11C1125). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Syöpä on tärkein kuolinsyy sekä kehittyneissä että kehitysmaissa [1]. Pelkästään vuonna 2008 oli 12,7 miljoonaa uutta syöpätapausta ja 7,6 miljoonaa syöpäkuolemaan maailmanlaajuisesti [1]. Samaan aikaan määrä äskettäin hyväksyttyjä lääkkeitä vähentynyt jatkuvasti huolimatta kasvua R (2) ne, jotka elävät samanlaisissa rakenteita ja toimintaa, sekä (3), joilla on kirjallisuudessa yhdistysten, esimerkiksi sitovat samat tavoite [9]. Tässä tutkimuksessa yritimme rakentaa ennustemallin huumeisiin osoittamisesta määrällisesti kemikaaleja kemiallinen vuorovaikutus jokainen pari interaktiivisia yhdisteitä. Lyhyesti, lääkkeet ja niiden vastaavat merkkivalot (

eli

, 8 syöpien) uutettiin Kegg (Kioto Encyclopedia of Genes and Genomit, https://www.genome.jp/kegg/) [11], tunnettu tietokanta käsittelevät genomeja, entsymaattista reittejä, ja biologiset kemikaaleja, ja drugbank [12], toinen tietokanta, joka sisältää yksityiskohtaista tietoa huumeiden ja niiden tavoite tietoa. Sitten pisteet jokaisen osoitus kyselyn yhdiste saatiin luottamus tulokset vuorovaikutuksesta kyselyn yhdisteen ja sen interaktiivinen yhdisteet käyttäen merkkejä interaktiivisen yhdisteitä. Ja järjestyksessä eniten todennäköisen vähiten saatiin kunkin lääkkeen. Lopuksi ennustaminen laatu mallin arvioitiin Jackknife testi ja joitakin muita parametrejä.

lisäksi rakentaa tehokas ennustemalli, toinen Tutkimuksen tarkoituksena on selvittää lääkkeen repositioning kyky mallimme. Drug repositioning,

ts.

Löytää uusia käyttötapoja olemassa olevien lääkkeiden, on vaihtoehtoinen strategia lääkekehitykseen koska sillä on potentiaalia nopeuttaa prosessia huumeiden hyväksynnät. Useat lääkkeet, kuten talidomidi, sildenafiili, bupropioni ja fluoksetiini, on onnistuneesti repositioned uusia indikaatioita [13], [14]. Kokeellinen lähestymistapoja huumeiden repositioning käyttävät yleensä suuren suoritustehon seulonnan (HTS) testata kirjastojen lääkkeiden biologisia kiinnostuksen kohteita. Viime aikoina useat

in silico

kehitettiin vastaamaan kysymyksiin huumeiden repositioning. Iorio

et al.

Ennustettu ja validoitu uusi lääke toimintatapoja ja huumeiden asetella välillä transkription vastauksista [15]. Butte ryhmä raportoitu kaksi onnistunutta esimerkkiä huumeiden repositioning perustuu geenien ilmentyminen tietoja sairauksista ja lääkkeiden [16], [17]. Cheng

et al.

Yhdistettiin huumeisiin perustuvan samankaltaisuuden päättely (DBSI), kohde-pohjainen samankaltaisuuden päättely (TBSI) ja verkko-päättely (NBI) menetelmät huumeiden tavoite yhdistys ja huumeiden asetella [18]. Tutkimuksessamme mukaan oletukseen, että interaktiivinen huumeet ovat todennäköisesti kohdistaa sama ilmoitus, tutkimme asetella mahdollisuutta joidenkin ”väärää” ennustaa lääkkeiden hakemalla viittaukset ja yrittänyt ehdottaa vaihtoehtoisia merkkejä joidenkin lääkkeiden.

Materiaalit ja menetelmät

Materiaalit

tietoa 98 lääkkeitä, jotka voivat hoitaa syöpiä oli haetaan Kegg tautiin Kegg [11]. Nämä lääkkeet voivat hoitaa seuraavat 10 syöpien:

Syövät hermoston

Syövät ruoansulatuskanavan

Syövät hematopoeettisten ja imukudoksen

rinta- ja naisen sukuelimet

syövät pehmeiden kudosten ja luun

Ihosyöpiä

syövät virtsateiden ja miehen sukupuolielimet

syövät umpierityselinten

Pään ja kaulan syöpien

keuhko- ja keuhkopussin

Koska joidenkin lääkkeiden ei ole tietoa kemiallisten-kemialliset vuorovaikutukset, me hävittää nämä huumeet, johtaen 68 huumeita. Sen jälkeen, huomasimme, että ”Ihosyöpiä ’ja’ Pään ja kaulan syövät” sisälsi ainoastaan ​​3 ja 4 huumeet, vastaavasti. Ei riitä luoda tehokas ennustemalli vain muutamia näytteitä, joten näillä syöpien hylättiin. Tämän seurauksena 68 lääkkeet saatiin, joka käsittää benchmark aineisto S. Nämä 68 lääkkeet luokiteltiin 8 ryhmiin siten, että lääkkeitä, jotka voivat käsitellä yhdenlaisen syöpien koostuu yhteen luokkaan. Koodit on 68 huumeiden ja niiden viitteitä löytyy taulukosta S1. Määrä lääkkeitä kussakin luokassa on lueteltu sarakkeessa 5 Taulukko 1. Yksinkertaisuuden vuoksi käytimme tunnisteita edustamaan kukin laji syöpiä. Katso sarake 1 ja 2 taulukon 1 vastaaville tunnisteiden ja syöpiä. Se havaitaan taulukosta 1 että summa useita lääkkeitä kussakin luokassa on paljon suurempi kuin eri huumeiden S, mikä osoittaa, että jotkut lääkkeet kuulua useampaan kuin yhteen luokkaan,

eli

jotkut lääkkeet voivat hoitaa enemmän kuin yhdenlaisen syöpiä. Tarkemmin, 50 lääkkeet voivat käsitellä vain yhdenlainen syöpien, kun taas 18 lääkkeet voivat käsitellä vähintään kahta erilaista syöpiä. Katso kuva 1 käyrä useita lääkkeitä vastaan ​​määrän syöpiä he voivat hoitaa. Siten se on monen luokitusten ongelmia, jotka on määrittää kunkin lääkkeen edellä mainittuun 8 luokat alenevassa järjestyksessä. Luokitin vain tarjoamalla yksi ehdokas syöpä, joka kyselyn lääke voi hoitaa ei ole optimaalinen valinta. Samanlainen tilanne käsiteltäessä proteiinien ja yhdisteiden useita attribuutiot [7], [19], ehdotettu menetelmä on myös tarjota useita ehdokas syöpiä, jotka vaihtelevat todennäköisesti syöpä vähiten todennäköisesti yksi.

paremmin arvioida ehdotetun menetelmän, benchmark aineisto S jaettiin yhteen koulutukseen aineisto S

p ja yksi validointitestiä aineisto S

te,

eli

S = S

tr∪S

te ja S

tr∩S

te = Ø, jossa lääkkeitä, jotka voivat käsitellä vain tarkka yhdenlaista syövän ja puolet lääkkeitä, jotka voivat hoitaa ainakin kahdenlaisia ​​syöpien koostui S

p, kun taas S

te sisälsi loput huumeiden S. useita lääkkeitä kussakin luokassa S

p ja S

te on lueteltu sarakkeessa 3 ja 4 taulukon 1, vastaavasti.

lisäksi testata yleistys ehdotetun menetelmän, poimimamme 59 huumeiden yhdisteiden drugbank [12], jotka eivät ole benchmark aineisto

S

. Kun jätetään lääkeaineyhdisteitä ilman tietoa kemiallisia-kemiallisten vuorovaikutusten, 44 huumeet saatiin, joka käsittää riippumattoman kokeen aineisto S

ite. Määrä huumeiden kussakin S

ite on lueteltu sarakkeessa 6 Taulukko 1 ja yksityiskohtaiset tiedot näiden lääkeaineiden ja niiden tunnuksia ja viitteitä löytyy taulukosta S2.

Chemical-kemialliset vuorovaikutukset

viime vuosina tietoja kemiallisen-kemiallisten vuorovaikutusten tunkeutuu ennustaminen eri attribuutiot yhdisteiden [7], [8], [20]. Perusajatuksena on, että interaktiivinen yhdisteet ovat todennäköisesti yhteisiä toimintoja kuin ei-vuorovaikutteisia niistä. Verrattuna tiedot perustuvat kemiallinen rakenne, se sisältää muita keskeisiä ominaisuuksia yhdisteitä, kuten yhdisteitä toimintaa, reaktioita, ja niin edelleen.

tietoa vuorovaikutteisen yhdisteiden on ladattu ommel (chemical_chemical.links.detailed. v3.1.tsv.gz) [9]. Saadussa tiedosto, kukin vuorovaikutus koostuu kahdesta yhdisteistä ja viisi erilaista tulokset otsikko on ”Samankaltaisuus”, ”Experimental”, ”tietokanta”, ”Textmining” ja ”Combined_score”. Tarkemmin, ensimmäinen neljä erilaista tulokset on laskettu yhdisteen rakenteita, toimintaa, reaktioita, ja co-esiintymisestä kirjallisuudessa, vastaavasti, kun taas viimeinen sellainen tilanne ”Combined_score” yhdistää edellä mainitut neljä tulokset. Näin ollen, sitä käytetään tässä tutkimuksessa osoittaa vuorovaikutuksen kahden yhdisteen,

so.

Kaksi yhdistettä ovat vuorovaikutteisia yhdisteet, jos ja vain jos ”combined_score” ja niiden välinen vuorovaikutus on suurempi kuin nolla. Itse asiassa, arvo ”combined_score” osoittaa myös vuorovaikutuksen voimakkuuteen,

so.

Todennäköisyys vuorovaikutuksen n esiintyminen. Siten se kutsutaan kuin luottamus pisteet tässä tutkimuksessa. Yksinkertaisuuden, merkitään luottamus pisteet vuorovaikutuksen

c

1 ja

c

2. Erityisesti jos

c

1 ja

c

2 ovat ei-vuorovaikutteisia yhdisteitä, asetetaan nollaksi.

112 lääkeyhdisteille tutkittiin tässä tutkimuksessa kuten kuvattu kohdassa ”Materiaalit”, ja 1393 kemian-kemialliset vuorovaikutukset, joiden luottamus tulokset olivat suurempia kuin nolla saatiin. Niistä vuorovaikutuksia, jotka tulokset ovat suurempia kuin nolla, joista 50 kuului merkintä ”Samankaltaisuus”, 4 kuului ”Experiment”, 114 kuului ”Database”, ja 1352 kuului ”Textmining”. On tarpeen huomauttaa, että jotkut huumeiden vuorovaikutus oli kaksi tai useampia kuin kahdenlaisia ​​tulokset. Sikäli kuin määriä kemiallista-kemiallisten vuorovaikutusten osalta tag ”Textmining” vaikutti eniten rakentamisen ennusteen kuvatun menetelmän jaksossa ”menetelmä perustuu kemiallisiin-kemialliset vuorovaikutukset”.

Prediction Method

menetelmä perustuu kemiallisiin-kemialliset vuorovaikutukset.

Systeemibiologia on sovellettu laajasti ennustukset ominaisuuksien proteiineja ja yhdisteitä ja katsotaan tehokkaampi kuin jotkut perinteiset menetelmät [7], [20], [21], [22]. Tässä tutkimuksessa yritämme luokitella syöpälääkkeitä edellä mainittuun 8 luokat perustuvat kemialliset vuorovaikutukset.

Oletetaan on

n

huumeita training set sanovat. Syöpiä, jotka voivat hoitaa edustaa seuraavasti: (1) missä T on transpoosi operaattori ja

(2) kysely huume, joka syöpä voi hoitaa voidaan määrittää sen interaktiivinen yhdisteitä. Arvioida todennäköisyys, että voi hoitaa syöpää, laskimme pisteet seuraavasti: (3) B

Suurempi pisteet osoittavat, että on todennäköisempää kyselyn lääke voi syövän hoitoon. Ja ehdottaa, että todennäköisyys, että kyselyn lääke voi hoitaa syöpää on nolla, koska ei ole vuorovaikutteisia yhdisteitä, jotka voivat hoitaa syöpää.

Kuten kohdassa ”Materiaalit”, ennustettaessa, mistä syövät lääke voi hoitaa on multi-label luokittelun ongelma. Luotettava luokittelija tulisi tarjota paitsi todennäköisin syöpä mutta myös joukko ehdokas syöpiä, jotka vaihtelevat todennäköisesti yksi vähiten todennäköisesti yksi. Tulosten mukaan yhtälön. 3, se on helppo järjestää ehdokas syöpiä käyttäen alenevassa vastaavien tulokset. Esimerkiksi, jos tulokset Eq. 3 ovat: (4) B-

se tarkoittaa, että on olemassa kolme ehdokasta syövät, jossa todennäköisin syöpä se voi hoitaa on, ja sen jälkeen ja. Lisäksi kutsutaan 1

st järjestys ennustaminen, ja on 2

nd järjestyksessä ennustaminen, jne.

perustuvaa menetelmää Molecular Descriptors

Jos haluat vertailla menetelmämme muilla menetelmillä, perustuva menetelmä molekyylien kuvausten rakennettiin seuraavasti. Rakenteen optimointi kunkin lääkkeen yhdistettä suoritettiin käyttämällä AM1 puoliempiirisiä menetelmä toteutetaan AMPAC 8,16 [23]. 454 kuvaajia kuten perustuslain, topologinen, geometrinen, sähköstaattinen, ja kvantti-kemiallinen kuvaajia laskettiin Codessa 2.7.2 [24]. Koodauksessa lääkeyhdisteen tehokkaasti, kuvaajat jossa puuttuvat arvot hylättiin, jolloin 355 kuvaajia,

eli

kunkin lääkkeen yhdiste

d

voidaan edustaa 355-D (ulottuvuuden) vektori, joka voidaan formuloida seuraavasti: (5), jossa T on transpoosi operaattori. Näin ollen suhde kahden lääkkeen

d

1 ja

d

2, voidaan laskea seuraavalla kaavalla: (6), jossa on piste tuote ja, kun taas ja on kimmokerroin ja vastaavasti.

Samanlainen perustuva menetelmä kemiallis-kemialliset vuorovaikutukset, pisteet, joka kyselyn lääke voi hoitaa syöpää voidaan laskea seuraavalla kaavalla: (7) B

Loppuosa on sama kuin menetelmä, joka perustuu kemiallisiin-kemialliset vuorovaikutukset, joka tarjoaa myös useita ehdokas syöpiä, jotka voidaan hoitaa, jotka vaihtelevat todennäköisesti yksi on vähintään yksi.

Validation ja arviointi

Jackknife testi on yksi suosituimmista menetelmiä arvioida suorituskykyä luokittelijoiden. Testin aikana kukin näyte erikseen mainita yksi kerrallaan ja ennusti luokittelija kouluttama loput näytteet aineisto. Testimenettely on auki, jolloin vältetään mielivaltainen ongelma [7]. Siksi lopputulos saadaan Jackknife testi on aina uniikki tietylle aineisto. Ottaen huomioon tämän, monet tutkijat ovat ottaneet sen arvioimiseksi tarkkuutta niiden luokittelijoiden viime vuosina [25], [26], [27], [28], [29].

Kuten Kohta ”Prediction menetelmä”, menetelmiä tässä tutkimuksessa voi tarjota useita ehdokas syöpien tietyn kyselyn lääkettä.

j

nnen jotta ennustetarkkuus lasketaan seuraavan kaavan [7], [8] 🙁 8) jossa

N

on kokonaismäärä huumeiden aineisto ja on useita lääkkeitä siten, että niiden

j

nnen ennustukset ovat totta syöpiä, että he voivat hoitaa. On selvää, että mittaa laatu

j

: s järjestyksessä ennustuksen. Jos totta syöpiä, jotka kyselyn lääke voi hoitaa sijoitetaan pieni järjestyksessä, sen katsotaan optimaaliseksi ennusti tuloksen. Siten korkea alhainen järjestysnumero

j

ja alhainen korkea järjestysnumero

j

osoittavat hyvää suorituskykyä luokittimen. on tärkein indikaattori suorituskykyä lajittelijan.

Arvioidaan menetelmiä perusteellisemmin, laskimme ennustetarkkuus syöpään varten

i

nnen jotta ennustus seuraavasti: (9 ) jossa

N

j

on määrä lääkkeitä, jotka voivat hoitaa syöpää aineisto ja on joukko lääkkeitä niin, että sen

i

nnen jotta ennustus ennusti oikein hoitoon syöpä.

lisäksi toinen mittaus tehtiin, joka hyväksyttiin joissakin aiemmissa tutkimuksissa [6], [7], [8] ja voidaan laskea seuraavasti: (10) missä

m

on ensimmäinen

m

ennusteita, jotka otetaan huomioon, on numero oikea ennusteet

i-

th lääkeyhdisteen joukossa ensimmäiset

m

ennustukset

n

i

on määrä syöpiä, että

i-

th lääkeyhdisteen voi hoitaa. On helppo päätellä, että merkitsee osuus kaikista totta syövistä, että näytteet aineisto voidaan käsitellä kuulu ensimmäisen

m

ennusteet kunkin näytteen siinä. Se voidaan nähdä kuviosta 1, että eri lääkettä yhdisteillä voi olla eri määrä syöpien ne voidaan käsitellä. Ottaen huomioon tämän, parametri

m

yhtälössä. 10 yleensä arvosta pienimmän kuitenkin vähintään keskimäärin syöpiä, jotka lääkeaineyhdisteiden aineisto voi hoitaa. Se voidaan laskea

(11) Yleisesti ottaen, suurempi ehdottaa parempaa suorituskykyä menetelmän.

Tulokset ja keskustelu

Kuten Kohta ”Materiaalit”, benchmark aineisto S jaettiin koulutus aineisto S

tr ja validointitestiä aineisto S

te, jotka sisälsivät 59 ja 9 lääkkeet, vastaavasti. Lisäksi riippumaton testi aineisto S

ite sisältävä 44 huumeita rakennettiin testata yleistys menetelmän. Ennustettu menetelmä käyttöön jaksossa ”menetelmä perustuu kemiallisiin-kemialliset vuorovaikutukset” käytettiin tekemään ennustus. Yksityiskohtaiset ennustettu Tulokset esitetään seuraavasti.

Suorituskyky perustuva menetelmä Chemical-kemialliset vuorovaikutukset on Training Dataset

Mitä 59 huumeiden koulutukseen aineisto S

tr, ennustin suoritettiin ja arvioitiin Jackknife testi. 2 sarakkeessa mainittujen taulukon 2 ovat 8 ennusteen tarkkuutta laskettu Eq. 8, joista voimme nähdä, että 1

st jotta ennusteen tarkkuus oli 55.93%, kun taas 2

nd jotta ennusteen tarkkuus oli 22,73%. On myös havaittu sarakkeessa 2 taulukon 2 että ennusteen tarkkuus yleensä seurasi laskeva trendi lisäämisen kanssa tilausnumero, mikä osoittaa, että ehdotettu menetelmä järjestetty ehdokas syövät koulutukseen aineisto melko hyvin. Tarkemmin sanoen kunkin tilauksen ennustus, laskimme tarkkuudet kukin laji syöpä yhtälön. 9, jotka on lueteltu rivillä 2-9 taulukon 3. Voidaan nähdä, että suurin osa 0,00% tarkkuudella tapahtui, kun ennuste järjestys oli korkea, mikä osoittaa, että jokaista sellaista syöpää, se oli parempi ennustaa pienempi tilausnumero ennustukset. Keskimäärin syövät, jotka lääkkeiden S

p voi hoitaa oli 1,31 (77/59), lasketaan yhtälön. 11. Se tarkoittaa, että keskimääräinen onnistumisprosentti olisi vain 16,38%, jos ne tekevät ennustus satunnainen arvauksia,

eli

satunnaisesti määrittää syövän osoitus jokaiseen näytteeseen, joka on paljon pienempi kuin 1

st järjestyksessä ennustetarkkuus saatu meidän menetelmällä. Koska keskimäärin syövät lääke voi hoitaa on 1,31, ensimmäinen 2 jotta ennusteet kunkin näytteen S

p vietiin osuuksien laskemiseksi totta syöpiä, jotka näytteet S

p voidaan käsitellä kattaa nämä ennustukset yhtälön. 10, saadaan suhde 61.04%.

Suorituskyky perustuva menetelmä Chemical-kemialliset vuorovaikutukset on Validation Test Dataset

Mitä 9 huumeiden validointi testi aineisto S

te, ehdokkaakseen syöpiä ennustettiin kuvatulla menetelmällä kohdassa ”menetelmä perustuu kemiallisiin-kemialliset vuorovaikutukset”, joka perustuu tietoihin, että huumeiden S

p. 8 ennustus tarkkuudet lasketaan Eq. 8 lueteltiin sarakkeessa 3 taulukon 2 Voidaan nähdä, että 1

st jotta ennusteen tarkkuus oli 55.56%, kun taas 2

nd järjestyksessä toinen oli 66,67%. On myös havaittu taulukosta 2, että ennuste tarkkuudet tietoaineiston olivat yleensä korkeampia kuin koulutuksen aineisto, johtuu siitä, että lääkkeiden S

te voi hoitaa kaksi tai enemmän kuin kaksi syöpien, kun taas useimmat lääkkeet S

p voi käsitellä vain yhdenlaisen syöpiä. Samoin laskimme tarkkuudet kukin laji syövän että 1

st, 2

nd, …, 8

nnen kertaluvun ennustuksen yhtälön. 9. Rivi 10-17 taulukon 3 listattu niitä. Keskimäärin syöpiä, jotka lääkkeiden S

te voi hoitaa oli 3,78 (34/9), mikä osoittaa, että jos ne tekevät ennustus satunnaisesti arvauksia, keskimääräinen onnistumisprosentti olisi 47,22%, mikä on huomattavasti vähemmän kuin 1

st ja 2

nd järjestyksessä tarkkuudet 3 sarakkeessa luetelluista taulukon 2. Tämä viittaa siihen, että suorituskykyä menetelmää varmennuskokeen aineisto on melko hyvä. Koska keskimääräinen lukumäärä syöpiä, jotka lääkkeiden S

te voi hoitaa oli 3,78, ensimmäinen 4 järjestys ennusteet kunkin näytteen S

te katsottiin. Yhtälön. 10, 61,76% todellisesta syöpiä ennusti oikein ensimmäisellä 4 järjestys ennusteita.

Suorituskyky perustuva menetelmä Chemical-kemialliset vuorovaikutukset on Independent Test Dataset

Ehdokas syövät 44 huumeiden riippumattoman kokeen aineisto S

ite myös ennustamalla tavalla ennustajan lääkkeeseen perustuen tietojen S

p. 8 ennustus tarkkuudet saatiin ja sarakkeessa 4 lueteltujen taulukon 2, josta voimme nähdä, että 1

st jotta ennusteen tarkkuus oli 59.09%, kun taas 2

nd jotta ennusteen tarkkuus oli 29.55%. Paremmin arvioida menetelmällä, ennustus tarkkuudet jokainen sellainen syöpä varten 8 järjestyksessä ennusteita laskettiin yhtälöllä. 9 ja lueteltu rivillä 18-25 taulukossa 3. keskimäärin syöpiä, jotka lääkkeiden S

ite voi hoitaa oli 1,32 (58/44), mikä viittaa siihen, että jos ne tekevät ennustus satunnaisesti arvauksia, keskimääräinen onnistumisprosentti olisi 16,5%, mikä on paljon pienempi kuin 1

st jotta ennustetarkkuus saatu meidän menetelmällä. Koska keskimäärin huumeiden viitteitä oli 1,32, ensimmäinen 2 järjestys ennustamista kunkin näytteen S

ite pidettiin. Yhtälön. 10, 67.24% todellisesta syöpiä ennusti oikein ensimmäisellä 2 järjestyksessä ennusteita.

Vertailu muihin Methods

osoittaa tehokkuuden menetelmämme ennustamiseen huumeiden syöpäindikaatioissa, muulla menetelmiä rakennettiin tehdä vertailua.

menetelmä perustuu molekyylien kuvaajien kuvattu kohdassa ”menetelmä perustuu molekyylien kuvausten” suoritettiin S

p sen suorituskykyyn arvioitiin Jackknife testi. 8 ennuste tarkkuudet lasketaan Eq. 8 lueteltiin sarakkeessa 2 taulukon 4, joista voimme nähdä, että 1

st jotta ennusteen tarkkuus oli 41.38%. Se on paljon pienempi kuin 1

st järjestys ennustaminen tarkkuus 55.93% saatu menetelmällä, joka perustuu kemiallisiin-kemialliset vuorovaikutukset. Myös huumeiden S

te ja S

ite, niiden syöpäindikaatioissa ennustettiin molekyyli kuvaajia S

p. Ennustaminen tarkkuudet listattiin sarakkeessa 3 ja 4 taulukossa 4. yksityiskohtia, 1

st järjestys ennustuksen tarkkuuden S

te ja S

ite olivat 55,56% ja 44,19%, tässä järjestyksessä. Verrattuna ennusteen tarkkuutta 55.56% S

te ja 59.09% S

ite käyttäen kemiallisia vuorovaikutuksia, ne suoritetaan samalla tasolla S

te, ja kemialliset vuorovaikutukset ovat paljon parempia kuin kemialliset kuvaajia päälle S

ite. Lisäksi olemme pidetään ensimmäinen 2-tilaus, 4-järjestys ja 2-järjestys ennusteet S

p, S

te, ja S

ite johtuen keskimäärin syöpiä, jotka lääkkeet näissä aineistot voi hoitaa. Osuus totta syöpiä, jotka näytteet S

p, S

te, ja S

ite voi käsitellä kattaa nämä ennustukset olivat 51,39%, 58.82% ja 49.12%: lla, jotka olivat kaikki alhaisempia kuin vastaavat osuudet 61.04%, 61.76% ja 67.24%: lla, joka on saatu menetelmällä, joka perustuu kemiallisiin-kemialliset vuorovaikutukset. Siksi menetelmä, joka perustuu kemialliset vuorovaikutukset oli ylivoimainen menetelmä perustuu molekyylien kuvaukset.

Kuten on kuvattu edellä kolmeen osaan, suorituskyky meidän menetelmän oli paljon parempi kuin satunnainen arvauksia , joka satunnaistettiin syövän ilmaisun kyselyn huume. Tässä toinen satunnainen arvauksia menetelmää sovellettiin arvioimme menetelmän eri osa. Kyselyä huumeiden

d

q

, me satunnaisesti valittu lääkeyhdisteen koulutuksessa asetettu, sano

d

, ja osoitetaan totta syöpiä, että

d

voi hoitaa että

d

q

,

eli

ennustettu syöpien

d

q

olivat samat kuin todellinen syöpiä, että

d

voi kohdella. Koska ei ole tilaustiedot ennustetussa ehdokas syövät jokaisesta näytteestä, säädettyjä toimenpiteitä jaksossa ”validointi ja arviointi” ei voi arvioida suorituskykyä tällä menetelmällä. Siten saanti ja tarkkuus [30], [31] käytettiin arvioimaan sen suorituskykyä, jota voidaan laskea. (12) missä on useita oikeita ennusti syöpien varten

i

nnen lääkeyhdisteen edustaa numerot syöpien jossa

i

nnen huumeiden yhdiste voi hoitaa, edustaa numerot ennustettu syöpien varten

i

nnen huumeiden yhdiste, ja

N

on kokonaislukumäärä tutkituista näytteistä.

arvaus menetelmällä kuvattu edellä kohdassa suoritettiin S

p sen suorituskykyyn arvioitiin Jackknife testi. Precision ja Recall olivat 15,29% ja 16,88%, tässä järjestyksessä. Saat ennustettu tuloksia S

p kemiallisella-kemialliset vuorovaikutukset, 1

st järjestys ennustaminen kunkin näytteen poimittiin saaminen tarkkuus 55.93% ja vetäminen 42.86%, mikä oli paljon suurempi kuin satunnainen arvaus menetelmällä .

on helppo nähdä, että menetelmä riippuu syvästi luottamus tulokset kemiallisten-kemialliset vuorovaikutukset. Testaamiseksi tärkeitä nämä tulokset, me vaihdetaan satunnaisesti luottamus tulokset joidenkin vuorovaikutusta. Perustuen satunnainen permutaatio, tiedot arvioitiin Jackknife koe koulutusta aineisto S

p. 1

st jotta ennusteen tarkkuus oli 23,73%, kun taas toinen ennustaminen tarkkuudet 2

nd, 3

rd, …, 8

nnen kertaluvun ennustuksen olivat 18.64%, 11,86%, 18,64%, 20,34%, 15,25%, 13,56%, 8,47%, vastaavasti. On havaittu, että 1

st jotta ennustetarkkuus saatu satunnainen permutaatio oli paljon pienempi kuin 55.93% saadaan kemiallisella vuorovaikutukset. Lisäksi 8 ennuste tarkkuudet eivät seurasi laskeva trendi lisäämisen kanssa tilausnumero, mikä osoittaa, että ehdokas syöpiä ei järjestetty hyvin. Tämä syytöksiä että luottamus tulokset ovat erittäin tärkeitä ennusteita.

Keskustelu

26 1

st jotta ennustukset olivat ”väärää” koulutukseen aineisto, joka on ennustettu syöpä merkkejä näitä lääkkeitä ei kirjattu Kegg. Nämä 26 lääkkeet ja niiden 1

st jotta ennusteet olleet saatavilla taulukossa S3. Kuitenkin jotkut viittauksia raportoitu, että 23 näistä 26 lääkkeet olivat todella tehokas heidän ”väärää” merkkejä, ja se oli sama 3 4 huumeiden varmennuskokeen aineisto (Katso taulukko S3 yksityiskohtaista 4 huumausaineiden ja niiden 1

st järjestyksessä ennustaminen) ja 13 18 huumeiden itsenäisessä testissä aineisto (katso taulukko S3 yksityiskohtaiset 18 huumeiden ja niiden 1

st järjestyksessä ennustaminen). Niinpä toivomme, että ennustemalli voi tarjota joitakin tietoja huumausaineiden repositioning. Seuraavissa kappaleissa, me mainittu joitakin viittauksia tukemaan ennustaa tuloksia.

Kaksikymmentä kolme Väärä Ennustettu Paria Drug ja Merkintä Training Dataset

Cisplatin-Syövät hematopoeettisten ja imukudosten.

Sisplatiini (Kegg ID: D00275), ”penisilliiniä syöpälääkkeiden”, on laajalti määrätty monille syöpälääkkeitä, kuten kives-, munasarja-, virtsarakko-, keuhko-, mahasyöpä, ja lymfooma [32], [33 ], [34]. Prasad

et al.

Tutki sisplatiinin vaikutusta Dalton lymfooma, ja päätteli, että sisplatiini voi aiheuttaa täydellisen regression askitesta Dalton lymfoomaa hiirillä [35].

ifosfamidi-Syövät hematopoeettisten ja imukudoksissa.

ifosfamidi (D00343), voidaan käyttää hoitamaan sukusolujen kivessyöpä, kohdunkaulan syöpä, pienisoluinen keuhkosyöpä, ei-Hodgkinin lymfooma, ja niin edelleen [36]. Ekstranodaalinen luonnollinen tappaja /T-solu lymfooma, nenän tyyppi (ENKL) on Epstein-Barr-virus-associated imukudoksen pahanlaatuisten kasvainten, ja potilaille, joilla on vaihe IV, uusiutunut tai vaikeahoitoinen ENKL on synkkä ennusteet. Yamaguchi

et al.

Tutkitaan uudesta hoidosta SMILE, kuten deksametasoni-steroidia, metotreksaatti, ifosfamidi, L-asparaginaasi, ja etoposidi, ja päätteli, että hymy oli tehokas tällaista tautia [37], [38] .

Lomustine-Syövät hematopoeettisten ja imukudosten.

Lomustine (D00363) on osa yhdistelmän kemoterapia hoitoon ensisijainen ja metastaattinen aivokasvaimia, ja myös käytetty toissijaisena hoito tulenkestävien tai uusiutunut Hodgkinin tauti [39]. Lisäksi aiemmat tutkimukset raportoitu, että lomustiinista voidaan harkita hoidettaessa koirien lymfooman koirilla [40], [41], [42], [43], vaikka se aiheuttama yleinen muttei hengenvaarallinen myrkyllisyys [44].

mitotaani-Syövät virtsateiden ja miehen sukuelimet.

mitotaani (D00420) on ensilinjan lääke metastasoituneen lisämunuaiskuoren syöpä [45], [46], [47], ja myös käytetään adjuvanttihoitona poistamisen jälkeen primaarikasvaimen [48]. Kuitenkin mitotaanihoidon voi aiheuttaa joitakin haittavaikutuksia, kuten lisämunuaisen vajaatoiminta ja hypogonadismin [49].

prokarbatsiini-Syövät hematopoeettisten ja imukudosten.

prokarbatsiini (D00478) hoidetaan ihmisen leukemiat [50].

Vastaa