PLoS ONE: Funksjonell Modul Tilkobling Map (FMCM): Et rammeverk for søk Repurposed Drug Forbindelser for Systems behandling av kreft og et program til tykktarms Adenocarcinoma

Abstract

Drug gjenbruk har blitt et stadig mer attraktivt tilnærming til narkotika utvikling på grunn av den stadig økende kostnadene for nye medisiner og hyppig tilbaketrekning av vellykkede narkotika forårsaket av bivirkning problemer. Her utviklet vi Funksjonell Modul Tilkobling Map (FMCM) for oppdagelsen av ombygginger narkotika forbindelser for systemer behandling av komplekse sykdommer, og har brukt den til kolorektal adenokarsinom. FMCM brukes flere funksjonelle genet moduler for å søke i Connectivity Map (CMAP). De funksjonelle moduler ble bygget rundt hub gener identifisert, gjennom et gen utvalg av trend-of-sykdomsprogresjon (GSToP) prosedyre, fra tilstandsspesifikke gen-gen interaksjons nettverk konstruert av sett av kohorten genekspresjon mikromatriser. De legemiddelkandidat Forbindelsene ble begrenset til medikamenter som utviser minimalt forutsagte intracellulære skadelige bivirkninger. Vi testet FMCM mot vanlig praksis å velge medikamenter ved anvendelse av en genomisk signatur representert av et enkelt sett av individuelle gener til spørring CMAP (IGCM), og funnet FMCM å ha høyere robusthet, nøyaktighet, spesifisitet og reproduserbarhet i å identifisere kjente antikreftmidler . Blant de 46 legemiddelkandidater som er valgt av FMCM for kolorektal adenokarsinom behandling, 65% hadde litteratur støtte for forening med anti-kreft-aktivitet, og 60% av medikamenter forutsagt å ha blitt rapportert skadelige effekter på kreft å være assosiert med kreftfremkallende /immunundertrykkere . Forbindelser ble dannet fra de valgte legemiddelkandidater, hvor i hver forbindelse komponent stoffene samlet var fordelaktig for alle de funksjonelle moduler mens ingen enkelt komponent medikament var skadelig for noen av modulene. I celle levedyktighet tester identifiserte vi fire kandidat narkotika: GW-8510, etacrynic syre, ginkgolide A, og 6-azathymine, som har høye hemmende aktiviteter mot kreftceller. Gjennom microarray eksperimenter bekreftet vi de nye funksjonelle koblinger spådd for tre søker narkotika: fenoksyben (brede effekter), GW-8510 (cellesyklusen), og imipenem (immunsystemet). Vi tror FMCM kan med fordel brukes til ombygginger medisiner for systemer behandling av andre typer kreft og andre komplekse sykdommer

Citation. Chung FH, Chiang YR, Tseng AL, Sung YC, Lu J, Huang MC, et al. (2014) Funksjonell Modul Tilkobling Map (FMCM): Et rammeverk for Searching Repurposed Drug Forbindelser for Systems behandling av kreft og et program til tykktarms adenokarsinom. PLoS ONE 9 (1): e86299. doi: 10,1371 /journal.pone.0086299

Redaktør: Yu Xue, Huazhong University of Science and Technology, Kina

mottatt: 31 oktober 2013; Godkjent: 09.12.2013; Publisert: 27 januar 2014

Copyright: © 2014 Chung et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet er delvis finansiert med tilskudd fra de strever for Top Project, Kunnskapsdepartementet (gi no. 101G907-2), ROC, og National Central University-Cathay General Hospital forente Research Center (101CGH-NCU-A5). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Et viktig mål for biomedisinsk forskning er å forstå de underling genetiske mekanismene for menneskelige sykdommer og oppdage terapeutiske legemidler for sykdommer. Drug Discovery er dyrt; gjennomsnittlig forskning og utvikling (R D) kostnadene i de siste 15 årene for å utvikle et nytt legemiddel stiger 1 milliard amerikanske dollar [1]. Anti-kreft-midler er spesielt kostbar [2]. Standarden R D Prosedyren omfatter sammensatte identifikasjon, toksisitetstester i celle- og dyremodeller, sikkerhetsvurdering på tidlige kliniske studier, og effekt i sen fase studier. Den svært høy strykprosent har ført til en krise som kalles innovasjon gap i nye medisiner [3]. Krisen blir ytterligere forsterket av tilbaketrekking av mange tidligere trodde vellykkede narkotika, hovedsakelig gjennom problemstillinger knyttet til skadelige bivirkninger [4] – [6]. Slike problemer kan være en konsekvens av den rådende metoden for nye medisiner, som er å finne konkrete biomolekyler som mål, typisk membranreseptorer [7]. Imidlertid kan en biologisk target regulere mer enn en biologisk vei, bare en av dem kan være sykdomsrelatert. Hvis dette er tilfelle, kan du endre funksjonen til et biologisk mål av et medikament fører til utilsiktede resultatene av avbrudd av sunne trasé [8].

Strategien med å finne bestemte biologiske mål for medikamentell behandling kan ha også bidratt til skuffende fremskritt i de siste 40 årene for å redusere total dødelighet for de fleste typer kreft [9]. Dette er delvis fordi kreft er en sykdom som involverer dysfunksjon av flere parallelle veier å kontrollere mange fundamentale prosesser [10]. Kreftceller samle flere genetiske mutasjoner som utstyre den med en av myriade av overlevelse og død-unngå evner: for å indusere angiogenese; for å opprettholde proliferative signal; å unnslippe suicidale apoptotiske programmer; for å muliggjøre replicative udødelighet; og å aktivere invasjon og metastase [11]. Bevis dukker at patologien av kreft er mer en konsekvens av små uregelmessigheter i mange gener, enn et større avvik i et enkelt gen [12], [13], og at stoffet forbindelser som virker på flere mål kan være en mer effektiv behandlingsstrategi enn et enkelt medikament på et enkelt mål [14]. Kort sagt, er kreft en systemsykdom, og bør behandles av et system behandling [15].

Her presenterer vi en beregnings narkotika-screening prosedyre som løser problemene som nevnes ovenfor. Vårt program har to hovedformål: å overvinne innovasjonsgapet gjennom stoffet gjenbruk, og å finne narkotika forbindelser for et system behandling av kreft. Drug gjenbruk er jakten på nye indikasjoner for allerede godkjente legemidler [1], [16]. Fordi en godkjent gravd allerede er optimalisert for sikkerhet og effekt for sin opprinnelig utviklet indikasjon kan sin rute for godkjenning for en ny indikasjon være betydelig kortere og trolig langt mindre kostnadskrevende enn for et nytt legemiddel.

Nylig beregnings screening legemidler for gjenbruk har blitt mye lettere ved bruk av tilkoblings Map (CMAP), en omfattende og kontinuerlig oppdatert database med de genomiske profiler av mange eksisterende legemidler [17]. CMAP gir en plattform for å utnytte en mønstergjenkjenningsstrategi for å bestemme likheten, eller det motsatte, i genomisk signaturer blant sykdommer, funksjonelle genet sett, og narkotika. Det har blitt anvendt i mange studier for å oppdage repurposing medikamenter mot vanlige sykdommer, inkludert diabetes og Alzheimers sykdom [17], og for behandling av faste tumorer, inkludert de som er forbundet med kreft i tykktarmen [18], brystkreft [19], og lunge adenokarsinom [ ,,,0],20].

det grunnleggende konseptet med CMAP-baserte repurposing narkotika oppdagelse studier er identifisering av sykdom forbundet genomisk signaturer som omvendt korrelasjon med forstyrrelse i genomisk underskrift i forbindelse med administrasjon av molekyler eller medikamenter [17], [21 ], [22]. I disse studiene, essensen av protokollen – den enkelte-genet CMAP tilnærming (IGMP) – for å identifisere legemidler for behandling av en bestemt sykdom er grei: finne et sett med differensielt uttrykk gener (degs) innhentet av, si, sammenligne to sett – kontroller og pasienter – av genekspresjon mikromatriser, scorer kampen mellom ° sett og genomiske profiler av legemidler gitt av CMAP, og rangerer narkotika etter karakter. Kandidat medikamenter er de med de høyeste poengsummene. Fordi det trekker på hele genomisk informasjon av pasientene og av stoffet, kan man se denne tilnærmingen som et forsøk på systemer behandling. Imidlertid lider den fra å bli for grov tilnærming. Spesielt er det ingen spesifikk henvisning til en hvilken som helst av de mange endrede tilstander av biologiske funksjoner som er forbundet med sykdommen. Ved ikke å følge de enkelte biologiske funksjoner, kan en «beste» medikament meget vel være et kompromiss, er valgt for å ha sterke fordelaktige effekter på et delsett av funksjoner på bekostning av å være skadelig for noen andre funksjoner.

En annen studie som benytter variable gen signaturer for å screene repurposed narkotika har med hell identifisert mange heterogene Food and Drug Administration (FDA) godkjente legemiddelkandidater for bryst, myelogen leukemi, og prostata kreft [23]. Denne metoden gir vanligvis en lang liste av heterogene legemiddelkandidater uten opplysninger som kan hjelpe i å differensiere legemidler, detaljer som hvordan et medikament forskjellig innvirkning på multi-funksjonaliteten (en spesifikk) kreft. Andre mer sofistikerte metoder basert på beregningsnettverksmodeller er blitt utviklet for å identifisere nye terapeutiske mål for det formål å behandle reguleringsmobiltelefonnett [24], [25]. Effektiviteten av disse metodene, som tar sikte på å heve den relative aktiviteten av visse celle regulatoriske nettverk, og baserer sine spådommer på forseggjorte modeller optimalt innstilt til å passe eksisterende tidsmessige og romlige data, kan være begrenset av den begrensede eksisterende kunnskap om nettverk og parametere som beskriver protein aktiviteter.

Her presenterer vi en ny analytisk rammeverk som kalles funksjonell modul Tilkobling Map (FMCM), for oppdagelsen av narkotika forbindelser for systemer kreftbehandling. Vi konstruerte tilstand-spesifikk funksjon funksjons nettverk (FFNs) og påført et gen-utvalg-by-trend-of-progresjon prosedyre (GSToP) [26] for å identifisere complexly tilkoblet og sterkt uttrykt hub gener i FFNs. Vi brukte deretter funksjonelle moduler bygget rundt navet gener å spørre CMAP for oppdagelsen av ontologi spesifikke repurposing narkotika, og videre skjermet narkotika ved å kreve at de viser minimums intracellulære skadelige bivirkninger. I forhold til standard IGCM protokollen, FMCM var mer robust i sin narkotika utvalg, og det mer konsekvent spådd høyere treffrater (~65%) på effektive medikamenter mot tidlig tumorigenesis i tykk- og endetarmskreft. Når sjekkes mot kjente stoffet indikasjoner i Terapeutisk Target Database (TTD), FMCM viste signifikant høyere nøyaktighet og lavere falske positive på oppdagelsen av kreftlegemidler enn IGCM, med unntak av immunsystemet. Våre levedyktighet tester på åtte av kandidat narkotika viste tre, GW-8510, ginkgolide A, og 6-azathymine, representert høye hemmende aktiviteter mot overlevelse av kreft cellelinjer med bestemte konsentrasjoner og administrasjonsvarigheter. Oppfølgingsmicroarray eksperimenter bekreftet at både CMAP og våre datasett viste konsistente resultater på tre uavhengige narkotika – fenoksyben (brede effekter), GW-8510 (cellesyklusen), og imipenem (immunsystemet). Resultatene viste effektiviteten av FMCM, og foreslo dens potensial for å formulere repurposed legemiddelregimer med minimum skadelige bivirkninger hos kreftpasienter.

Materialer og Metoder

Datakilder

Gene uttrykk data for 32 pasienter med sporadiske kolorektale polypper (adenom) og tilsvarende ved normal slimhinne fra de samme personene ble hentet fra Gene Expression Omnibus (GEO) database (sjonsnummer: GSE8671) [27]. Vi hentet 30,047 protein oppføringer og 39,194 protein-protein interaksjoner (PPI) fra Human Protein Referanse Database (HPRD) [28] og brukes Gene ontologi (GO) [29] for funksjonell informasjon.

Ekstern database

Vi brukte Connectivity kart database (CMAP) bygge 02 [17], med 6100 behandlings uttrykk profiler som representerer 1,309 legemidler (og forbindelser), for å beregne berikelse score (ES) av genet satt mot narkotika.

For referanse på narkotika indikasjon vi brukte L01 klasse, antineoplastiske midler, Anatomisk terapeutisk kjemisk (ATC) Classification System, World Health Organization (WHO) (https://www.whocc.no/).

Vi hentet informasjon om kjente terapeutiske protein mål, relevante sykdommer eller kreft, og tilsvarende medikamenter (787 rusmidler, 60% av CMap datasett) fra Therapeutic Target Database (TTD: https://bidd.nus.edu.sg/group/ttd/) [30]. I tillegg spørres vi stikkord på å søke motorer for å definere relative terapeutiske legemidler på kreftbehandling

Vi har lastet ned de kommenterte 4,884 gen-sett fra Molecular Signaturer Database (MSigDB. https://www.broadinstitute.org /gsea/msigdb/index.jsp) [31]. Genet-sett er av fire typer: C2: kuratert gen-sett fra kjente stier, elektroniske databaser og kunnskap om domene eksperter; C3: motiv gen-sett basert på konservative cis-regulatoriske motiver fra menneske, mus, rotte og hund genomer; C4: beregnings gen-sett bestemmes av co-uttrykk nabolag sentrert på 380 kreftrelaterte gener; C5: gen-ontologi gen-sett samlet inn fra de samme GO merknader av gener. Gene symboler i hvert gen-set ble slått sammen og omdannet til HG-U133A Affymetrix ID i henhold til oppdatert merknadsfil på nettsiden https://www.affymetrix.com/estore/.

Gene utvalg av individuell genet analyse (IGA) og Individuell genet tilkobling kartet (IGCM)

Forskjellig uttrykte gener (degs) ble valgt ved hjelp av betydning analyse av Mikromatriser algoritme (SAM) [32]. Med mindre annet er angitt, terskelverdier for falsk funnrate (FDR) 0,05 og brett endring (FC) 2 ble brukt. Enrichment score (ES) matchende genet satt til stoffet var beregnet gjennom CMAP [17].

Fordelaktig og skadelige stoffer

Gitt et gen sett, et stoff ble utpekt gunstig eller skadelig hvis ES er -0,5 eller 0,3. For legemidler som skal utpekes gunstig en randomisering

p

-verdi. 0,005 var nødvendig, med mindre annet er angitt

Bygging av gen-gen interaksjon nettverk (GGIN) og funksjon-funksjon interaksjon nettverk (FFN )

For en gitt tilstand – kontroll (Nor) eller adenom pasient (Ade) – og en Pearson

p

-verdi (se nedenfor) terskel

p

0, vi inkludert et par av gener i GGIN dersom: (1)

p

-verdi for paret var ikke større enn

p

0; (2) proteinet paret kodet for av genet paret var koblet i PPI-data. For et gitt sett av

n

mikromatriser, ble en Pearsons korrelasjonskoeffisient (PCC) mellom et par av gener som beregnes ved hjelp av de to sett av

n

intensiteter av paret. Hver PPC er tildelt en Pearson

p

-verdi basert på permutasjon tester og

t

-statistics. Gener i hver type-spesifikke GGIN ble tildelt overrepresentert biologiske funksjoner, kalt funksjonelle moduler, gjennom Gene ontologi sikt forening [29]. Berikelse analyser basert på betinget hypergeometriske test [33] ble gjort ved hjelp av R pakken GOstats lastet ned fra Bioconductor nettstedet. Hver GGIN ble redusert til å fungere-funksjon nettverk (FFN) ved hjelp av funksjonelle moduler som noder.

GSToP og kart funksjonsmodul tilkobling (FMCM) rammeverk

FMCM rammeverk for valg av terapeutisk legemiddel sammensatte besto av to segmenter, utvalg av funksjonelle moduler av predikerte kreftgener basert på fremgangsmåten GSToP [26] (trinn 1-5 nedenfor), og flere spørringer, en for hver funksjonsmodul, av den CMAP for medikamentet identifikasjon (trinn 6-8) . Trinn i utvelgelsesprosessen (figur 1) var: (1) Konstruer Nor og Ade GGINs og FFNs bruker terskel Pearson

p

verdi = 0,001. (2) SAM. Identifisere degs for Ade vs. Nor bruker terskler FDR 0,01 og FC 2. (3) GSToP. Tildele et gen som en kreft genet dersom: (a) det vises i minst Ade eller Nor GGIN; (B) sine grader og clustering koeffisienter økning (reduksjon) langs sekvens. (4) Ta overlapping av SAM og GSToP lister. (5) kreftgener (inkludert oppregulert og ned-regulert gener) danner funksjonelle moduler som har GO begreper som brukes for FFNs. (6) Fordelaktig og skadelige legemiddellister. Bruk funksjonelle moduler separat for å spørre narkotika i CMAP [17] for å oppnå for hver funksjon henholdsvis to lister for spådd gunstig (ES -0,5) og skadelig (ES 0,3) legemidler (se ovenfor for kravet om randomisering

p

-verdi). (7) Funksjons legemiddel forening kartet (FDAM). Bruk legemiddellister for å konstruere et kart med to typer noder, funksjonsmodulen og narkotika, og to typer funksjons narkotika linker, nyttige og skadelige. Inkludere i FDAM bare stoffer som har i det minste en fordelaktig kobling. (8) Konstruer fra FDAM alle spådd narkotika forbindelser, hvor en forbindelse er minimum sett av rent gunstige stoffer som dekket alle funksjoner.

Nøyaktighet, spesifisitet og reproduserbarhet i ytelsestester

positive NB og negativer NA var narkotika spådd å være gunstig og skadelig, henholdsvis; TP sanne positive og falske negative FN ble kjente anti-tumormidler forutsagt å være gunstig og skadelig, henholdsvis; sanne negative er TN = NA-FN, og falske positive er FP = NB-TP. Nøyaktighet ble definert som (TP + TN) /(NB + NA) og spesifisitet som TN /(FP + TN).

For reproduserbarhet et stoff prediksjon prosedyre (FMCM eller IGCM) ble gjentatt 10 ganger, hver tid arbeidet med et sett av 40 tilfeldig valgte mikromatriser, 20 hver fra kontroller og pasienter, og reproduserbarhet ble målt over 10 × 9/2 = 45 par av resultatene. For hvert par reproduserbarhet var (størrelsen) i skjæringspunktet mellom de to sett av utvalgte legemidler dividert med det geometriske gjennomsnittet av de to settene.

Cellekulturer og reagenser

Menneskelig tykktarm kreft cellelinjer (HCT116, RKO, SW403, SW620 og), og brystkreftcellelinjer (MCF7) ble oppnådd fra ATCC (American Type Culture Collection, Manassas, VA) og opprettholdt som foreslått av ATCC. Dyrkningsmediet for alle cellelinjer ble supplert med 10% føtalt bovint serum (FBS), 50 enheter /ml penicillin og streptomycin, og inkubert ved 37 ° C med 5% karbondioksid. I eksperimenter ble celler behandlet med etanol, vann eller DMSO som tilsvarende bærerkontroll. Fenoksyben, GW-8510, etacrynic syre, ginkgolide A, triflusal, imipenem, 6-azathymine ble kjøpt fra Santa Cruz (CA). Phthalylsulfathiazole ble kjøpt fra Sigma (St. Louis, MO). Fenoksybenzamin, phthalylsulfathiazole, etacrynic syre, ginkgolide ble oppløst i etanol. Imipenem ble oppløst i vann. De resterende legemidler ble oppløst i Dimetylsulfoksid (DMSO)

Cell Proliferation analysen

Formerinasanalyse aktiviteter fem cellelinjer -. Tykktarmskreft, HCT116, RKO, SW403, og SW620, og brystkreft, MCF7 – ble overvåket ved Alamar blå (Molecular Probes, Invitrogen Corporation), en oksydasjon-reduksjon-reagens, og bestemmes ved å måle reduksjonen av resazurin (blå, ikke-fluorescerende) til resorufin (rød, sterkt fluorescerende). Celler ble sådd ut i 96-brønners kulturplater og, etter studiedesign av CMAP [17], behandles med enkle midler med konsentrasjon på 0, 0,1, 1,10, 30 uM i 5 dager, og deretter undersøkt med hensyn til spredningsvirksomhet. En tiendedel volum av Alamar blue-reagens ble tilsatt, og platene ble inkubert ved 37 ° C i 2-3 timer. Celleviabilitet ble bestemt ved å måle fluorescens med eksitasjon ved 550 nm og emisjon ved 590 nm på Synergy HT (BioTek Instruments, Winooski, VT). Celle overlevelse ble beregnet som forholdet mellom verdien av forskjellen mellom reduksjon av Alamar Blue in behandlet versus kontroller.

RNA ekstraksjon og microarrays

Celler ble sådd i 100 mm skåler og behandles med legemidler. Etter behandling i 6 timer, ble totalt cellulært RNA isolert ved hjelp av Mirvana miRNA Isolation Kit (Ambion, Austin, TX) i henhold til produsentens instruksjoner. 250 ng av total RNA ble benyttet for microarray eksperimenter. Trukket ut RNA ble merket med GeneChip® 3 «IVT Express Kit (Affymetrix, Santa Clara, CA, USA) og hybridisert til Affymetrix GeneChip® Prime Vis Menneskelig Gene Expression Array. Denne rekken inneholdt ca 530 000 sonder som dekker mer enn 36.000 utskrifter og varianter. RAW-bilder ble analysert ved Affymetrix GeneChip® kjøreprogramvare. Vi utførte microarray analyse av effekten av imipenem og fenoksybenzamin (PB) (behandlet og ikke-behandlet) på HCT116 og MCF7, og GW-8510 på HCT116 under U219 (primeview) plattform, alt i duplikater. Behandling doser og varighet ganger var de samme som i [17].

microarray eksperimenter og analyser av IGA og gen-set tilnærming (GSA)

Genome-wide genuttrykk profiler fra narkotika Bondevik tumorceller evaluert av Affymetrix GeneChip® Prime Vis plattformen ble analysert i R miljø (versjon 2.15.1). To cellelinjer, HCT116 og MCF7, ble behandlet med tre medikamenter, GW-8510, fenoksybenzamin (PB), og imipenem, med de samme doser (10 um, 11,8 um, 13,4 um, henholdsvis) og tid (6 timer etter dyrking over natten ) som i [17]. Microarray-profiler ble sammenlignet med ti profiler fra CMAP for MCF7- behandlet med tre medikamenter. Genuttrykk intensiteter ble normalisert ved Robust Multi-matrise Average (RMA) [34]. I IGA tilnærmingen degs ble identifisert ved en-veis ANOVA med eBayes funksjonen i limma pakken [35]. I et gen-set tilnærming (GSA), gitt en liste over rangert differensial genekspresjon, vi brukte GSEA [31] for å konvertere 4,884 kommenterte gensettene i MSigDB [31] til en liste over 4884 rangert ESS, deretter brukt enveis ANOVA å finne differensial gensettene. I IGA (eller GSA) et gen (eller et gen-sett) med falske funnrate (FDR) mindre enn 0,01 ble betraktet som signifikant og valgt for to-veis hierarkisk clustering av microarray sett. GO vilkår for høy- est over genet (eller genet-sett) klynger i IGA (eller GSA) heatmap ble bestemt med DAVID [36].

Resultater

Funksjon-funksjon nettverk

Høy kvalitet på microarray data ble indikert av ren separasjon av kontroll (fra 32 normale vev) og prøve (32 pasienter) i Principle Component Analysis (Figur S1 A). De 2,164 degs valgt av SAM (med terskler FDR 0,01 og FC 2) riktig klassifisert kontrollene og prøve i hierarkisk clustering (figur S1B). Clustering Resultatene var ikke er følsom for moderate variasjoner i terskelverdier (ikke vist). Gene-genet interaksjons nettverk (GGINs) ble konstruert med en terskel på Pearson

p

0,001 fra kontroll og adenom kohort microarray data (figur S2). Den adenom GGIN har 6,4% flere gener (1792 vs 1684) og 32% flere linker (2656 vs 2017) enn kontrollgruppen GGIN. Forskjellen mellom de to sakene ble tydelig da de GGINs ble redusert til funksjon funksjons nettverk (FFNs) har funksjonelle moduler som noder (figur 2, Tabell S1). Cellesyklus, DNA replikering, og DNA-reparasjon funksjonelle moduler var mye større i adenom FFN og utstilt mye høye nivåer av intra-funksjon aktivitet. Det var også flere intermodulvirksomheten i adenom enn i kontroll. I en kjent unntak, inter-modulen aktivitet mellom immunsystemet prosessen og celleproliferasjon var svakere i adenom enn i kontroll.

Stand spesifikk funksjon funksjons nettverk (FFNs) ble samlet inn via gen-gen-nettverk (GGINs) , vist i figur S2, ved reduksjon. Noder i en FFN er funksjonelle moduler (FMS), som er gensettene i den tilsvarende GGIN danner over-representert Gene Ontologi vilkår. FMS som inneholder mindre enn 70 gener blir ikke vist. Diameteren til en node skalerer med logaritmen av antall gener i noden. Fargen skyggen av en node angir antall intra-node gen-gen-interaksjoner per genet. Tykkelsen på kanten angir antall inter-node-gen-gen-interaksjoner.

ombygginger terapeutiske legemidler valgt av IGCM

CMAP gir berikelse score (ES) til genet listene ikke lenger enn 1.000 oppføringer. Vi holdt denne begrensningen (dvs. begrense størrelsen på degs) ved å kreve FDR 0,01. Fem DEG lister med FC terskler på 3,0 til 5,0 med 0,5 intervallene ble generert og deres ES er for 1308 legemidler (eller små forbindelser) ble oppnådd ved å spørre CMAP. Listen av gunstige (dvs. anti-adenom) legemidler var følsom for (den terskelverdi) FC, med størrelsen på listen avtagende med økende FC (figur 3A). Antallet gunstige godkjente medikamenter avtok med økende FC (fig S3). Ifølge TTD, mange kjente terapeutiske anti-kreft narkotika, for eksempel chrysin (rosa, TTD id: DNC004715), GW-8510 (rød, TTD id: DNC004631), daunorubicin (cyan, TTD id: DAP000788), Apigenin (lys lilla , TTD id: DNC004714), resveratrol (gul grønn, TTD id: DNC001205), tilfeldigvis endret fra gunstig ved FC = 3 til skadelig på FC = 3,5 (figur 3A). At FC = 5.0, den strengeste terskel som vi brukte for det meste, AG-012559 var det bare gunstig narkotika etter permutasjon

p

. 0,005 (Figur S3)

Enrichment score (ES) ble oppnådd ved å spørre på CMAP med genet sett (størrelse indikert med loddrett strek) bestemmes ved hjelp av varierende fold-endring (FC) terskel. Et stoff regnes som gunstig for behandling for kolorektal adenom hvis ES -0,5, skadelig hvis ES 0,3, og nøytral ellers. (A) Undersøkelse av IGCM prosedyre. Spørre genet settet ble komplett sett av differensielt uttrykte gener (degs) identifiserte fra genuttrykk matriser av kolorektal adenom kohort (versus kontroll) ved hjelp av SAM-algoritmen med fast FDR 0,01. (B) Screening av FMCM prosedyre. Spørring gensettene funksjonelle moduler som oppnås ved deling av over-representert Gene Ontologi vilkår i GSToP filtrerte degs.

ombygginger terapeutiske legemidler valgt av FMCM

I FMCM program, gener som er valgt i hver funksjonell modul (tabell S2) ble brukt hver for seg til å spørre CMAP, noe som gir separate funksjonelle spesifikke legemiddellister. Hver funksjonell modul var foreningen av kontroll- og adenom funksjonelle moduler som er gitt av de respektive FFNs, filtrert av GSToP prosedyre (se Methods). I FMCM genet størrelsen av modulen hadde en mye sterkere avhengighet av verdien av FC enn IGCM (figur 3). I IGCM, størrelse ° falt fra like over 600 til 200 når verdien av FC terskel ble hevet fra 3 til 5. I FMCM modulen gen størrelse falt fra omkring 600 til omkring 30 as (terskelen) FC ble hevet fra 1 til 3 , og ble for liten for CMAP programmet når FC ble hevet over 3. Likevel, innenfor de respektive utvalg av FC brukt, FMCM gitt en mye mer stabil og robust miljø for narkotika screening av CMAP enn IGCM; i FMCM tegnet av utvalgte legemidler (dvs. gunstig eller skadelig) endret seg lite (21 av 256, figur 3B) mens i IGCM endret skjedd for 54,5% av utvalgte legemidler (12 av 22, figur 3A).

Funksjon-stoff forening kartet (FDAM) og terapeutiske legemiddel forbindelser

Rent nyttige og skadelige stoffer (se Materiale og Metoder) som var gunstig for minst en FM ble identifisert i FMCM program (FC 2) og anvendt for å konstruere FDAM. De 46 legemidler i FDAM (tabell 1) var mye mer tallrike enn tilsvarende liste finnes i tradisjonell IGCM tilnærming (som hadde 22 medisiner). Tretti av 46, eller 65%, har enten blitt studert hver for seg som antitumormidler eller har blitt sertifisert til å ha forebyggende effekt mot et bredt spekter av kreftformer (tabell 1 og tabell S3). De fem stoffer, thapsigargin, pyrvinium, trifluoperazin, ellipiticin, og 0297417-0002B, som i vårt FDAM var skadelig for i det minste en modul, har blitt rapportert å vise tegn til karsinogenisitetsstudier /immunsuppresjon aktiviteter (figur 4, Tabell 1 og Tabell S3 ). Vi ser på de 41 stoffene på FDAM uten skadelige lenker som kandidat terapeutiske legemidler. Antallet moduler, eller grad (tabell 1), til hvilken en legemiddelkandidat var fordelaktig variert fra 1 til 7. Det var to graders-7-medikamenter, fenoksybenzamin og GW-8510, og tre graders-5 medikamenter, thapsigargin, phthalylsulfathiazole, og medrysone (se tabell 1 for detaljer om grader og narkotika-modulen forhold). En terapeutisk medikamentforbindelse er et minimum sett av narkotika hentet fra listen over kandidat terapeutiske legemidler som dekket alle modulene. Mange forbindelser som kan være konstruert av medikamentet listen kandidaten. Det var to 2-griper direkte forbindelser, fenoksybenzamin + ISP og GW-8510 + ISP, og 20 forbindelser med opptil seks legemiddelkomponentene (tabell 2). Sperring legemiddelinteraksjons, spår vi disse forbindelsene til å være fri for skadelige bivirkninger på intracellulære nivå

noder i kartet er funksjonelle moduler (FMS; gen sett). Og narkotika innhentet ved å spørre CMAP med separate FMS . Drug-funksjon lenker indikere gunstig (grønn) eller skadelig (rød). Bare narkotika gunstig til i det minste en FM er inkludert.

Sammenligning mellom IGCM og FMCM

stabilitet.

Som nevnt tidligere, karakterisering av et stoff, nemlig gunstig eller skadelig, var mye mer stabil FMCM enn i IGCM (figur 3).

Nøyaktighet og spesifisitet.

Vi brukte antitumormidler i Therapeutic Target Database (TTD) for å evaluere nøyaktigheten og spesifisitet (Material og metoder) av FMCM og IGCM spådommer. Den «ekte» narkotika satt i testen var krysset av TTD og CMAP liste, som omfattet ca 40% av TTD. For enkelhets skyld betegner vi ved IG3 den IGCM søket på FC = 3 og resten (søk med FC 3) ved IGL. Vi fant at FMCM hadde samlet nøyaktighet (figur 5A) og spesifisitet (fig S4) tilsvarende IG3 og høyere enn IGL, med unntak av immunsystemet prosessmodul, hvor FMCM var verre enn IGL.

(A) Nøyaktighet er summen av sanne positive (forutsagt fordelaktig og kjente anti-tumormiddel) og sann negativ (forutsagt skadelig og kjent kreftfremkallende middel) i løpet av summen av forutsagte nyttige og skadelige stoffer. IGCM resultatene er i svart, og FMCM, i rødt og cyan. Spesifisitet er gitt i Figur S5. (B) Reproduserbarhet er et mål på avtalen mellom de valgte narkotika i to omganger ved hjelp av ulike undergrupper av microarray data (Materialer og metoder). Resultatene som vises er midlet over 45 parvise sammenligninger av utvalgte legemidler. De fem tårnene på venstre er IGCM resultater for gitt terskel FC verdi. De åtte tårn til høyre er FMCM resultater (FC 2) for de 8 funksjonelle moduler. Størrelse på spørring gen sett er gitt for linje i rødt.

reproduserbarhet.

Vi testet reproduserbarhet (Materiale og metode) av stoffet spådommer ved å gjenta 10 ganger FMCM og IGCM prosedyrer, hver gang arbeider på et sett av 40 tilfeldig valgte mikromatriser, 20 hver fra kontroller og pasienter. I FMCM prosedyre ble GGINs konstruert ved hjelp av degs valgt av SAM ved FDR 0,01 og FC 2, og det valgte medikament settet var summen av nyttige og skadelige stoffer.

Legg att eit svar