PLoS ONE: Prediction of Cancer Drugs Chemical Chemical Interactions

Abstract

Kreft, som er en ledende dødsårsaken i verden, legger en stor byrde på helsevesenet. I denne studien ble en ordre-prediksjon modell bygget for å forutsi en rekke kreft narkotika indikasjoner basert på kjemisk-kjemiske interaksjoner. Ifølge tillit score til deres interaksjoner, ble ordren fra den mest sannsynlige kreft til minst ett oppnådd for hver spørring narkotika. 1

st orden prediksjonsnøyaktigheten av opplæringen datasettet var 55,93%, evalueres av Jackknife test, mens den var 55,56% og 59,09% på en validering test datasett og et uavhengig testdatasettet, henholdsvis. Den foreslåtte metoden utkonkurrerte en populær metode basert på molekylære deskriptorer. Videre ble det bekreftet at noen stoffer var effektive til «feil» spådd indikasjoner, noe som indikerer at noen «feil» narkotika indikasjoner var faktisk korrekte indikasjoner. Oppmuntret av de lovende resultater, kan fremgangsmåten bli et nyttig verktøy for å prediksjon legemiddel indikasjoner

relasjon:. Lu J, Huang G, Li H-P, Feng K-Y, Chen L, Zheng M-Y, et al. (2014) Prediksjon av kreftlegemidler ved Kjemisk-kjemiske interaksjoner. PLoS ONE 9 (2): e87791. doi: 10,1371 /journal.pone.0087791

Redaktør: Lukasz Kurgan, University of Alberta, Canada

mottatt: 04.10.2013; Godkjent: 31 desember 2013; Publisert: 03.02.2014

Copyright: © 2014 Lu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble finansiert av National Basic Research Program of China (2011CB510101, 2011CB510102), Foundation of China (61202021, 31371335, 61373028) National Science, Innovation Program of Shanghai Municipal Education Commission (12ZZ087, 12YZ120), tildeling av «The First -klassen Disiplin av universiteter i Shanghai «, Shanghai Educational Development Foundation (12CG55), den Scientific Research Fund of Hunan Provincial Science and Technology (2011FJ3197), Hunan National Science Foundation (Grand: 11JJ5001), og Scientific Research Fund of Hunan Provincial Education Department (Grant: 11C1125). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft er den viktigste dødsårsaken i både industriland og utviklingsland [1]. I 2008 alene var det 12,7 millioner nye krefttilfeller og 7,6 millioner kreftdødsfall på verdensbasis [1]. I mellomtiden, mengde nylig godkjente legemidler redusert kontinuerlig til tross for en økning av R (2) de deler tilsvarende strukturer eller aktiviteter og (3) de med litteratur forbindelser, slik som binding av samme målet [9]. I denne studien forsøkte vi å bygge en forutsigelse modell av narkotika-indikasjon ved å tallfeste kjemisk-kjemisk interaksjon mellom hvert par av interaktive forbindelser. Kort, narkotika og deres tilsvarende indikasjoner (

dvs.

, 8 typer kreft) ble hentet fra KEGG (Kyoto Encyclopedia of gener og genomer, https://www.genome.jp/kegg/) [11], en velkjent database håndtere genomer, enzymsystemer, og biologiske kjemikalier, og Drugbank [12], en annen database som inneholder detaljert informasjon om rusmidler og deres mål informasjon. Deretter ble poengsummen for hver indikasjon på søket forbindelsen fra tillit score til interaksjoner mellom spørringen sammensatte og sine interaktive forbindelser ved hjelp av indikasjoner på den interaktive forbindelser. Og den rekkefølge fra mest sannsynlig indikasjonen til den minst ble oppnådd for hvert medikament. Til slutt ble forutsigelse kvaliteten av modellen evaluert ved Foldekniv test og en del andre parametre.

I tillegg til å bygge et effektivt anslagsmodell, en annen Målet med studien var å undersøke stoffet reposisjonering evne til vår modell. Drug reposisjonering,

dvs.

Å finne nye bruksområder for eksisterende legemidler, er en alternativ strategi mot narkotika utvikling fordi den har potensial til å fremskynde prosessen med narkotika godkjenninger. Flere legemidler som thalidomid, sildenafil, bupropion og fluoksetin, har blitt flyttet til nye indikasjoner [13], [14]. Eksperimentelle tilnærminger til narkotika reposisjonering vanligvis benytter high throughput screening (HTS) for å teste biblioteker av legemidler mot biologiske mål av interesse. Flere nylig, flere

i silikoaluminofosfater

modeller ble utviklet for å løse problemene av narkotika reposisjonering. Iorio

et al.

Spådd og validert nye legemiddelformer handling og narkotika reposisjonering fra transkripsjonell respons [15]. Butte gruppe rapporterte to vellykkede eksempler på narkotika reposisjonering basert på genuttrykk data fra sykdommer og legemidler [16], [17]. Cheng

mfl.

Fusjonert narkotika-baserte likheten slutning (DBSI), målbasert likheten slutning (TBSI) og nettverksbasert slutning (NBI) metoder for narkotika-target forening og narkotika reposisjonering [18]. I vår studie, ifølge antagelsen om at interaktive stoffer er mer sannsynlig å målrette den samme beskjeden, undersøkte vi reposisjonering mulighet for noen «feil» spådd narkotika ved å hente referanser, og forsøkte å foreslå alternative indikasjoner for enkelte legemidler.

Materialer og metoder

Material

Informasjons av 98 legemidler som kan behandle kreft ble hentet fra KEGG sYKDOM i KEGG [11]. Disse stoffene kan behandle følgende 10 typer kreft:

kreft i bryst og kvinnelige kjønnsorganer

kreft i bløtvev og bein

Hudkreft

kreft i urinveiene og mannlige kjønnsorganer

kreft i endokrine organer

hode og nakke kreft

kreft i lunge og pleura

Siden enkelte legemidler har ingen informasjon av kjemiske-kjemiske interaksjoner, vi forkastet disse medikamenter, noe som resulterer i 68 medikamenter. Etter det, fant vi ut at «hud kreft «og» Hode og nakke kreft» bare inneholdt 3 og 4 narkotika, henholdsvis. Det er ikke tilstrekkelig til å etablere en effektiv prediksjon modell med bare noen få eksempler, og dermed disse to typer kreft ble forlatt. Som et resultat ble 68 stoffer erholdt, bestående av referansesettet S. Disse 68 stoffene ble inndelt i 8 kategorier på en måte som medikamenter som kan behandle en type kreftformer omfattet en kategori. Kodene av de 68 stoffene og deres indikasjoner kan finnes i tabell S1. Antall narkotika i hver kategori er oppført i kolonne 5 i tabell 1. For enkelhets skyld har vi brukt koder for å representere hver type kreft. Vennligst se kolonne 1 og 2 i tabell 1 for den tilsvarende koder og kreft. Det er observert fra tabell 1 at summen av antall legemidler i hver kategori er mye større enn de forskjellige stoffene i S, noe som indikerer at noen stoffer tilhøre mer enn én kategori,

dvs.

enkelte legemidler kan behandle mer enn én type kreft. I detaljer, kan 50 narkotika behandle bare en type kreft, mens 18 narkotika kan behandle minst to typer kreft. Det henvises til figur 1 for en plott av antall medikamenter mot den rekke kreftformer kan de behandle. Således er det et multi-etikett klassifisering problem som må tilordne hvert medikament til de ovennevnte 8 kategorier i synkende rekkefølge. Klassifikator bare å gi en kandidat kreft som en spørring stoffet kan behandle er ikke et optimalt valg. I likhet med den situasjon når håndtere proteiner og forbindelser med flere egenskaper som er [7], [19], må den foreslåtte fremgangsmåte også for å tilveiebringe en serie av kandidat kreft, som strekker seg fra den mest sannsynlige kreft til den minst sannsynlige en.

For å bedre evaluere den foreslåtte metoden ble referansedatasettet S delt inn i en trening datasett S

tr og en validering test datasett S

te,

dvs.

S = S

tr∪S

te og S

tr∩S

te = Ø, hvor medikamenter som kan bare behandle eksakt én type kreft og halvparten av legemidler som kan behandle minst to typer kreft Består S

st, mens S

te inneholdt resten narkotika i S. antall narkotika i hver kategori for S

st og S

te er oppført i kolonne 3 og 4 i tabell 1, henholdsvis.

i tillegg til å teste generalisering av den foreslåtte metoden, ekstrahert vi 59 narkotika forbindelser fra Drugbank [12], som ikke er med i referansedatasettet

S

. Etter eksklusjon av narkotika forbindelser uten informasjon av kjemiske-kjemiske interaksjoner, ble 44 narkotika oppnådd, bestående av uavhengige testdatasettet S

ITE. Antall legemidler i hver kategori av S

ite er oppført i kolonne 6 i tabell 1 og detaljert informasjon om disse narkotika forbindelser inkludert deres koder og indikasjoner kan finnes i tabell S2.

Kjemisk-kjemisk interaksjoner

i de senere årene, er informasjonen av kjemiske-kjemiske interaksjoner trenge inn i prediksjon av ulike henvisninger av forbindelser [7], [8], [20]. Den grunnleggende ideen er at interaktive forbindelser er mer sannsynlig å dele felles funksjoner enn ikke-interaktive seg. Sammenlignet med informasjon basert på kjemisk struktur, omfatter det andre viktige egenskaper av forbindelser, så som forbindelser aktiviteter, reaksjoner, og så videre.

informasjon av interaktive forbindelser som er lastet ned fra tråden (chemical_chemical.links.detailed. v3.1.tsv.gz) [9]. I innhentet fil, hver interaksjon består av to forbindelser og fem typer score tittelen «Likhet», «Experimental», «Database», «Textmining» og «Combined_score». I detaljer, er de fire første typer score beregnes på grunnlag av det sammensatte strukturer, aktiviteter, reaksjoner, og co-forekomst i litteraturen, henholdsvis, mens den siste typen score «Combined_score «integrerer de nevnte fire poeng. Dermed er det brukt i denne studien å indikere interaktivitet av to forbindelser,

vil si.

To forbindelsene er interaktive forbindelser hvis og bare hvis «combined_score» av samspillet mellom dem er større enn null. Faktisk, verdien av «combined_score «indikerer også styrke samspillet,

vil si.

Sannsynligheten for samspillet sin forekomst. Dermed er det betegnet som tillit poengsum i denne studien. For enkelhets skyld, vi betegner tillit score på samspillet mellom

c

1 og

c

2 ved. Særlig hvis

c

1 og

c

2 er ikke-interaktive forbindelser, er satt til null.

112 narkotika forbindelser ble undersøkt i denne studien som beskrevet i avsnittet «Materials», og 1,393 kjemisk-kjemiske interaksjoner som tillit score var større enn null ble oppnådd. Blant de interaksjoner som score er større enn null, 50 av dem tilhørte etiketten «Likhet», fire tilhørte «Experiment», 114 tilhørte «Database», og 1352 tilhørte «Textmining». Det er nødvendig å påpeke at enkelte legemiddelinteraksjoner hadde to eller flere enn to typer score. Så langt som mengden av kjemiske-kjemiske interaksjoner er bekymret, tag «Textmining «bidro mest til bygging av prediksjon metoden beskrevet i kapittel» Metoden basert på kjemisk-kjemiske interaksjoner «.

Prediction Method

metoden basert på kjemisk-kjemiske interaksjoner.

Systembiologi biologi~~POS=HEADCOMP er påført omfattende i spådommer om egenskapene til proteiner og forbindelser, og anses for å være mer effektiv enn noen konvensjonelle metoder [7], [20], [21], [22]. I denne studien forsøker vi å klassifisere kreftlegemidler i de nevnte 8 kategorier basert på kjemiske interaksjoner.

Anta at det er

n

narkotika i treningssettet, si. Kreft som kan behandle er representert som følger: (1) hvor T er transponere operatør og Selge

(2) For en spørring narkotika, som kreft kan behandle kan bestemmes ved sine interaktive forbindelser i. For å vurdere sannsynligheten for at kan behandle kreft, vi beregnet en poengsum som følger: (3)

Større score indikerer at det er mer sannsynlig at spørsmålet stoffet kan behandle kreft. Og antyder at sannsynligheten for at søket stoffet kan behandle kreft er null, fordi det ikke er noen interaktive stoffer i som kan behandle kreft.

Som nevnt i avsnitt «Materials», å forutsi hvilke kreftformer et medikament kan behandle er en multi-label klassifisering problem. En pålitelig klassifikator skal tilveiebringe ikke bare den mest sannsynlige kreft, men også en rekke kandidat kreft, som strekker seg fra den mest sannsynlig en til den minst sannsynlige en. I henhold til resultatene av Eq. 3, er det lett å arrangere kandidatkreftformer ved hjelp av nedad av de tilsvarende poengsummer. For eksempel, dersom resultatene av Eq. 3 er: (4)

det vil si at det er tre kandidat kreft, hvor den mest sannsynlige kreft det kan behandle blir etterfulgt av og. Videre kalles en

st for prediksjon, og er det 2

nd for prediksjon, og så videre.

Den metode basert på molekylær Descriptors

Å sammenligne vår metode med andre metoder, er fremgangsmåten basert på molekylære deskriptorer konstruert som følger. Strukturen optimalisering av hvert legemiddel forbindelse ble utført ved hjelp av AM1 semi-empirisk metode implementert i AMPAC 8,16 [23]. 454 beskrivelser inkludert konstitusjonelle, topologiske, geometriske, elektro og kvante-kjemiske beskrivelsene ble beregnet ved Codessa 2.7.2 [24]. Å kode hver medikamentforbindelse effektivt, ble beskrivelsene med manglende verdier forkastes, noe som resulterer i 355 beskrivelsene,

dvs.

hver medikamentforbindelse

d

kan representeres ved en 355-D (dimensjon) vektor som kan formuleres som følger: (5) hvor T er den transponerte operatør. Følgelig er forholdet mellom to medikamenter

d

1 og

d

2 kan beregnes ved følgende formel: (6) der er skalarproduktet og, mens og er modulus av og henholdsvis

i likhet med den metode basert på kjemisk-kjemiske interaksjoner, at resultatet av at en spørring stoffet kan behandle kreft kan beregnes ved følgende formel:. (7)

resten fremgangs~~POS=TRUNC måten~~POS=HEADCOMP er den samme som den for fremgangsmåten basert på kjemisk-kjemiske interaksjoner, som også gir en rekke kandidatkreftformer som kan behandle, som strekker seg fra den mest sannsynlig en til den minst ene.

Validation og evaluering

Jackknife testen er en av de mest populære metoder for å vurdere resultatene av classifiers. Under testen blir hver prøve valgt ut en etter en, og forutsagt av sorter trent av resten prøvene i datasettet. Testprosedyren er åpen, for derved å unngå vilkårlig problem [7]. Derfor er oppnådd ved Foldekniv test resultatet er alltid enestående for et gitt datasett. I lys av dette har mange forskere vedtatt det å evaluere nøyaktighet på sine klassifiserere i de senere år [25], [26], [27], [28], [29].

Som beskrevet i Seksjon «Prediction metoden», metodene i denne studien kan gi en rekke kandidat kreft for et gitt søk stoffet.

j

-te for prediksjon nøyaktighet beregnes ved følgende formel [7], [8] 🙁 8) der

N

er det totale antall legemidler i datasettet og er antall medikamenter slik at deres

j

-te spådommer er sanne kreft som de kan behandle. Det er åpenbart at måler kvaliteten på

j

-te for prediksjon. Dersom den sanne kreft som en spørring medikament kan behandle er plassert i lav orden, blir det ansett som en optimal forutsagte resultat. Dermed høy med lav ordrenummeret

j Hotell og lavt med høy ordrenummeret

j

indikerer en god prestasjon av klassifikator. . Er den viktigste indikator på ytelsen klassifikator

For å evaluere metodene mer grundig, beregnet vi prediksjonsnøyaktigheten på kreft for

i

-te for prediksjon som følger: (9 ) der

N

j

er antall legemidler som kan behandle kreft i datasettet og er antall legemidler slik at dens

i

-te for prediksjon er riktig spådd å behandle . kreft

i tillegg er en annen måling ble tatt, som ble vedtatt i noen tidligere studier [6], [7], [8] og kan beregnes som følger: (10) der

m

representerer den første

m

spådommer som er tatt i betraktning, er antall riktige spådommer for

i-

th medikamentforbindelse blant de første

m

spådommer

n

i

er antall kreft at

i-

th medikamentforbindelse kan behandle. Det er lett å utlede det betyr at andelen av alle sanne kreft som prøvene i datasettet kan behandle omfattes av de første

m

spådommer om hver prøve i det. Det kan sees fra figur 1 at forskjellige medikament forbindelser kan ha forskjellige antall av kreft de kan behandle. I lys av dette, parameteren

m

i Eq. 10 tar vanligvis verdien av den minste, men ikke mindre enn det gjennomsnittlige antall kreftformer som legemiddelforbindelser i datasettet kan behandle. Det kan beregnes ved

(11) Generelt høyere antyder bedre ytelse av metoden.

Diskusjon

Resultater og

Som beskrevet i kapittel «Materials», referanse datasett S ble delt inn i en trening datasett S

tr og en valideringstest datasett S

te, som inneholdt 59 og 9 narkotika, henholdsvis. I tillegg ble et uavhengig testdatasettet S

ite inneholdende 44 midler konstruert for å teste generalisering av fremgangsmåten. Den spådde metoden introdusert i kapittel «Metoden basert på kjemisk-kjemiske interaksjoner» ble brukt til å lage anslag. De detaljerte predikerte Resultatene er gitt som følger.

Utførelse av metode basert på kjemisk kjemiske interaksjoner på trening datasett

Som for de 59 legemidlene i treningsdatasettet S

st, forutsiger ble utført og vurdert ved Foldekniv test. Oppført i kolonne 2 i tabell 2 er de 8 prediksjon nøyaktighet beregnet av Eq. 8, som vi kan se at en

st for prediksjonsnøyaktigheten var 55,93%, mens to

nd for prediksjonsnøyaktigheten var 22,73%. Det er også observert fra kolonne 2 i tabell 2 at prediksjonen nøyaktigheter generelt fulgt en nedadgående trend med økningen av ordrenummer, noe som indikerer at den foreslåtte fremgangsmåte ordnet kandidat kreft i treningsdatasettet ganske godt. I detaljer, for hver ordre prediksjon, vi beregnet nøyaktighet på hver type kreft ifølge Eq. 9, som var oppført i rad 2-9 i tabell 3. Det kan sees at de fleste av 0,00% nøyaktighet oppstod når prediksjon orden var høy, noe som indikerer at for hver type av kreft, ble det bedre forutsies med lavere orden antall spådommer. Gjennomsnittlig antall krefttilfeller som narkotika i S

tr kan behandle var 1,31 (77/59), beregnet av Eq. 11. Det betyr at den gjennomsnittlige suksessrate vil være bare 16,38% hvis de gjør forutsigelse av tilfeldige gjetninger,

ie

tilfeldig tilordne en kreft indikasjon til hver prøve, noe som er mye lavere enn 1

st orden prediksjonsnøyaktigheten innhentet av vår metode. Fordi gjennomsnittlig antall kreft et medikament kan behandle er 1.31, de 2 første ordens spådommer om hver prøve i S

tr ble tatt for å beregne hvor stor andel av sanne kreft som prøver i S

tr kan behandle omfattes av disse spådommene ifølge Eq. 10, få et forhold på 61,04%.

Utførelse av metode basert på kjemisk kjemiske interaksjoner på valideringstester Datasett

Som for 9 narkotika i valideringen test datasett S

te, deres kandidat kreft ble spådd av metoden beskrevet i kapittel «metoden basert på kjemisk-kjemiske interaksjoner», basert på informasjon om narkotika i S

tr. 8 prediksjon nøyaktighet beregnet av Eq. 8 ble oppført i kolonne 3 i tabell 2. Det kan sees at en

st for prediksjonsnøyaktigheten var 55,56%, mens to

nd for en var 66,67%. Det er også observert fra tabell 2 at prediksjonen nøyaktighet på dette datasettet var generelt høyere enn de som er av treningsdatasettet, på grunn av det faktum at stoffene i S

te kan behandle to eller flere enn to typer kreft, mens de fleste medikamenter i S

tr kan bare behandle én type kreft. Likeledes vi beregnet nøyaktighet på hver type kreft for en

st, 2

nd, …, 8

th for prediksjon av Eq. 9. Row 10-17 av tabell 3 listet dem. Gjennomsnittlig antall kreftformer som narkotika i S

te kan behandle var 3,78 (34/9), noe som indikerer at hvis de gjør prediksjon av tilfeldige gjetninger, ville den gjennomsnittlige suksessraten være 47,22%, noe som er betydelig lavere enn 1

st og 2

nd ordre nøyaktighet er oppført i kolonne 3 i tabell 2. Dette tyder på at resultatene av metoden på validering test datasettet er ganske bra. Siden gjennomsnittlig antall kreftformer som narkotika i S

te kan behandle var 3,78, de første 4 ordens spådommer om hver prøve i S

te ble vurdert. Ifølge Eq. 10, 61,76% av sanne kreft ble korrekt spådd av de 4 første ordens spådommer.

Utførelse av metode basert på kjemisk kjemiske interaksjoner på uavhengig test Datasett

Kandidaten kreft i 44 legemidler i den uavhengige testdatasettet S

ite ble også forutsagt av vår prediktor basert på narkotikainformasjon i S

tr. 8 prediksjon nøyaktighet ble oppnådd og oppført i kolonne 4 i tabell 2, som vi kan se at en

st for prediksjonsnøyaktigheten var 59,09%, mens to

nd for prediksjonsnøyaktigheten var 29,55%. For å bedre evaluere metoden, nøyaktighet prediksjon på hver type kreft for de 8 ordre spådommer ble beregnet av Eq. 9 og oppført i rad 18-25 i tabell 3. Gjennomsnittlig antall kreftformer som narkotika i S

ite kan behandle var 1,32 (58/44), noe som tyder på at hvis de gjør prediksjon av tilfeldige gjetninger, ville den gjennomsnittlige suksessraten være 16,5%, noe som er mye lavere enn en

st for prediksjon nøyaktighet oppnås ved vår metode. Fordi den gjennomsnittlige antallet narkotika indikasjoner var 1,32, den første 2 for prediksjon av hver prøve i S

ite ble vurdert. Ifølge Eq. 10, 67,24% av sanne kreft ble korrekt spådd av de 2 første ordens spådommer.

Sammenligning med andre metoder

For å vise effekten av vår metode for prediksjon av narkotika kreftindikasjoner, en annen metoder ble bygget for å gjøre sammenligning.

metode basert på molekylære deskriptorer beskrevet i kapittel «metoden basert på molekylære deskriptorer» ble gjennomført på S

st med sin ytelse evaluert av Jackknife test. De 8 prediksjon nøyaktighet beregnes ved Eq. 8 ble oppført i kolonne 2 i tabell 4, som vi kan se at en

st for prediksjonsnøyaktigheten var 41,38%. Det er mye lavere enn 1

st orden forutsigelse nøyaktighet på 55,93% oppnådd ved fremgangsmåten basert på kjemisk-kjemiske interaksjoner. Også for narkotika i S

te og S

ite, deres kreftindikasjoner ble spådd av molekylære deskriptorer på S

tr. Forslaget nøyaktighet ble oppført i kolonne 3 og 4 i tabell 4. I detaljer, en

st for prediksjon nøyaktighet på S

te og S

ite var 55,56% og 44,19%, henholdsvis. Sammenlignet med prediksjon nøyaktighet på 55,56% på S

te og 59,09% på S

ite med kjemiske interaksjoner, utførte de på samme nivå på S

te, og kjemiske interaksjoner er mye bedre enn kjemiske beskrivelsene på S

iTE. I tillegg har vi vurdert de første to-order, 4-order og to-order spådommer på S

st, s

te, og S

ITE på grunn av det gjennomsnittlige antallet kreftformer som narkotika i disse datasettene kan behandle. Andelen av sanne kreft som prøver i S

st, S

te, og S

ite kan behandle dekket av disse spådommene var 51,39%, 58,82% og 49,12%, henholdsvis, som var alt lavere enn tilsvarende andeler av 61,04%, 61,76% og 67,24%, henholdsvis, oppnådd ved fremgangsmåten basert på kjemisk-kjemiske interaksjoner. Derfor er fremgangsmåten basert på kjemiske interaksjoner var overlegen i forhold til den metode basert på molekylære deskriptorer.

Som beskrevet i de ovennevnte tre seksjoner, utførelsen av vår metode var mye bedre enn det for de tilfeldige gjetninger som tilfeldig tildelt en kreft indikasjon på en forespørsel narkotika. Her ble en annen tilfeldig gjetninger metode for å evaluere vår metode fra et annet aspekt. For eventuelle spørsmål narkotika

d

q

, vi tilfeldig valgt en medikamentforbindelse i treningssettet, sier

d

, og tildelte sanne kreft som

d

kan behandle til

d

q

,

dvs.

de anslåtte kreft

d

q

var samme som de sanne kreft som

d

kan behandle. Siden det er ingen ordreinformasjonen i de forutkandidat kreft for hver prøve, de tiltak som tilbys av Section «Validering og evaluering» kan ikke evaluere resultatene av denne metoden. Dermed Recall og Precision [30], [31] ble benyttet til å evaluere sin ytelse, som kan beregnes ved. (12) der er antall riktige spådd kreft for

i

-te medikamentforbindelsen representerer antallet krefttilfeller som

i

-te medikamentforbindelse kan behandle, representerer antall predikerte kreft for

i

-te medikamentforbindelsen og

N

er totalt antall testede prøver.

tilfeldig gjetning metode som er beskrevet i det foregående avsnitt ble utført på S

tr med ytelsen evaluert ved Foldekniv test. Presisjonen og Recall var 15,29% og 16,88%, henholdsvis. For de antatte resultatene på S

tr ved kjemisk-kjemiske interaksjoner, 1

st for prediksjon av hver prøve ble plukket, innhenting Presisjon på 55,93% og Tilbakekalling av 42,86%, som var mye høyere enn tilfeldig gjetning metode .

Det er lett å se at vår metode avhenger sterkt på tillit score til kjemisk-kjemiske interaksjoner. For å teste betydningen av disse score, vi tilfeldig utvekslet tillit score til noen interaksjoner. Basert på tilfeldige permutasjoner, ble dataene vurdert av Jackknife test på treningsdatasettet S

tr. 1

st for prediksjonsnøyaktigheten var 23,73%, mens de andre prediksjon nøyaktighet på 2

nd, 3

rd, …, 8

th for prediksjon var 18,64%, 11,86%, 18,64%, 20,34%, 15,25%, 13,56%, 8,47%, henholdsvis. Det er observert at det 1

st orden prediksjonsnøyaktigheten oppnådd ved tilfeldig permutasjon var mye lavere enn 55,93% oppnådd ved kjemiske interaksjoner. Videre 8 prediksjon nøyaktighet ble ikke fulgt en nedadgående trend med økning av ordrenummer, noe som indikerer at kandidat kreft ikke ble arrangert godt. Dette impliserer at tilliten score er svært viktig for spådommer.

Diskusjoner

26 1

st ordre spådommer var «feil» i treningsdatasettet, som er, de antatte kreftindikasjoner av disse stoffene ble ikke registrert i KEGG. Disse 26 stoffene og deres 1

st ordre spådommer var tilgjengelige i tabell S3. Men noen referanser rapportert at 23 av disse 26 stoffene var faktisk effektiv til sine «feil» indikasjoner, og det var det samme med 3 av de 4 narkotika i valideringstest datasettet (Se tabell S3 for de detaljerte 4 rusmidler og deres 1

st for prediksjon) og 13 av de 18 stoffene i den uavhengige testdatasettet (Se tabell S3 for detalj 18 narkotika og deres 1

st for prediksjon). Derfor håper vi at vår prediksjon modellen kan gi litt informasjon av narkotika reposisjonering. I de følgende avsnittene, sitert vi noen referanser å støtte våre anslåtte resultater.

Tjuetre Feil Forut Par av narkotika og Indikasjon i Training Datasett

Cisplatin-kreft av hematopoietiske og lymfoide vev.

Cisplatin (KEGG ID: D00275), «penicillin av kreft narkotika», er mye foreskrevet for mange kreft behandlinger, for eksempel testikkelkreft, eggstokkene, blære, lunge, magekreft, og lymfom [32], [33 ], [34]. Prasad

et al.

Undersøkte effekten av cisplatin på Dalton lymfom, og konkluderte med at cisplatin kan indusere komplett tilbakegang av ascites Dalton lymfom hos mus [35].

ifosfamid-Kreft i hematopoetisk lymfevev.

Ifosfamid (D00343) kan brukes til å behandle bakterie celle testikkelkreft, livmorhalskreft, småcellet lungekreft, non-Hodgkins lymfom, og så videre [36]. Ekstranodale natural killer /T-celle lymfom, nasal type (ENKL) er Epstein-Barr virus-assosiert lymfoid malignitet, og pasienter med stadium IV, residiverende eller refraktær ENKL har dystre prognoser. Yamaguchi

mfl.

Utforsket en ny diett SMILE, inkludert steroidet deksametason, metotreksat, ifosfamid, L-asparaginase, og etoposid, og konkluderte med at SMILE var effektive for denne typen sykdom [37], [38] .

lomustine-kreft av hematopoietiske og lymfoide vev.

Lomustine (D00363) er en del av kombinasjonskjemoterapi for behandling av primære og metastatisk hjernesvulster, og også brukes som en sekundær behandling for ildfaste eller residiverende Hodgkins sykdom [39]. Videre har tidligere studier har rapportert at lomustin kan bli vurdert for behandling av canine lymfom hos hunder [40], [41], [42], [43], selv om det indusert vanlig, men ikke livstruende toksisitet [44].

mitotane-Kreft i urinveiene og mannlige kjønnsorganer.

mitotane (D00420) er den første-linje narkotika for metastatisk adrenokortikal karsinom [45], [46], [47], og også brukes for adjuvant behandling etter fjerning av primærtumor [48]. Imidlertid kan behandling med mitotane forårsake noen bivirkninger, for eksempel binyreinsuffisiens og mannlig hypogonadisme [49].

prokarbazin-kreft av hematopoietiske og lymfoide vev.

prokarbazin (D00478) brukes til å behandle human leukemi [50].

Legg att eit svar