PLoS ONE: TARGETgene: Et verktøy for å identifisere potensielle terapeutiske mål i Cancer

Abstract

Det store utvalget av i silikoaluminofosfater ressurser og data av høy gjennomstrømming profilering øyeblikket i livet vitenskapelig forskning gir mulighet til å hjelpe kreft genet og drug discovery prosessen. Her foreslår vi å dra nytte av disse ressursene for å utvikle et verktøy, TARGETgene, for effektivt å identifisere mutasjons drivere, mulige terapeutiske mål, og legemiddelkandidater i kreft. Den enkle grafiske brukergrensesnitt muliggjør rask, intuitiv kartlegging og analyse på systemer nivå. Brukere kan finne, velge og utforske identifiserte mål gener og forbindelser av interesse (f.eks nye kreftgener og deres beriket biologiske prosesser), og validere spådommer ved hjelp av brukerdefinerte referanse gener (f.eks målgener oppdaget i RNAi skjermer) og kuratert kreft gener via TARGETgene. De høye kompetanse av TARGETgene er også vist gjennom to programmer i denne artikkelen. Spådommer i disse to programmene ble så tilfredsstillende validert av flere måter, blant annet kjente kreftgener, resultatene av RNAi skjermer, genet funksjon merknader, og målgener av legemidler som har vært brukt eller i klinisk utprøving i kreftbehandling. TARGETgene er fritt tilgjengelig fra Biomedisinsk Simuleringer Resource nettsiden (https://bmsr.usc.edu/Software/TARGET/TARGET.html)

Citation. Wu CC, D’Argenio D, Asgharzadeh S, Triche T (2012) TARGETgene: Et verktøy for å identifisere potensielle terapeutiske mål i kreft. PLoS ONE 7 (8): e43305. doi: 10,1371 /journal.pone.0043305

Redaktør: Ying Xu, University of Georgia, USA

mottatt: 19 april 2012; Godkjent: 18 juli 2012; Publisert: 31 august 2012

Copyright: © Wu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av National Institutes of Health (NIH) tilskudd P41-EB001978 (DD), US Department of Defence tilskuddet W81XWH-07-1-0580 (til TT), og NIH Child Health Research Career Development Award Program K12-CA60104 (til SA). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Intensiv bruk av cytostatika i multimodale behandlinger har forbedret femårig sykdomsfri overlevelse og selv førte kur for noen kreftpasienter. Denne suksess kan være assosiert med alvorlig toksisitet og økt forekomst av sekundære kreftformer. Fremveksten av målrettet terapi rettet mot feilregulert eller muterte gener /proteiner i ondartede celler representerer et paradigmeskifte i kreftbehandling, med mindre avhengighet av medikamenter som dreper normale celler samt tumorceller. Eksempler på dette er behandling mot HER2 overuttrykt brystkreft (som Trastuzumab og Lapatinib), c-Kit-rettet behandling i BCR-ABL defekte leukemi (Glivec) og VEGF /VEGF-R-målrettet forbindelser for å hemme kreft angiogenese (som Bevacizumab) . Mens høy gjennomstrømning teknologier som microarray og neste generasjon sekvensering kan nå brukes til å identifisere hundrevis eller tusenvis av kandidat gener som er differensielt uttrykt eller mutert i kreft sammenlignet med normale vev, er det vanskelig å prioritere potensielle kreft terapeutiske mål fra et slikt stort antall kandidatgener.

En systematisk studere de komplekse regulatoriske veier er nødvendig for å forstå mekanismene for oncognesis å oppdage mutasjon drivere eller utvikle effektive behandlinger. Flere veier er blitt funnet å bli deregulert i kreftceller på grunn av over-ekspresjon eller undertrykkelse av enkelte styreelementer [1]. Men, har resultatene av veier hittil vært svært begrenset. Det store utvalget av high-throughput teknikker og dataressurser public domain mer nylig tilgjengelig, tilbyr muligheten for å forstå cellulære mekanismer på et system nivå og dermed hjelpe til legemiddelforskning [2] – [5]. Flere strenge statistiske tilnærminger er blitt utviklet for å antyde cellulære og molekylære nettverk via en integrert analyse av disse ressursene [6] – [10]. Vi har også tidligere innført en Relevans Vector Machine (RVM) -baserte ensemble tilnærming, designet for store lærevansker, og brukte den til å integrere flere heterogene datakilder for å konstruere et menneskelig gen nettverk som kan avsløre gen-gen funksjonelle relasjoner [11 ]. RVM-basert ensemble modell gir bedre ytelse på store lærevansker med massive manglende verdier i forhold til Naive Bayes, den mest populære metoden som brukes til å forutsi protein-protein interaksjoner og genetiske interaksjoner [6] -. [10] Hotell

Flere konsepter har også ført til utvikling av nettverksbaserte tilnærminger for å forutsi nye sykdomsgener i molekylære nettverk [12], [13], [14]. Gener assosiert med liknende sykdom fenotyper tendens til å være gruppere sammen i et molekylært nettverk. Således gener som er funnet å være assosiert med kjente sykdomsrelaterte gener i nettverkene i seg selv er mer sannsynlig å være involvert i den samme sykdomsprosessen [12]. I tillegg, i lys av kompleksiteten i kreftformer, kan potensielle terapeutiske mål være de gener /proteiner som har en viktig rolle i regulering av flere reaksjonsveier eller å opprettholde de ondartete fenotyper [15]. Det har nylig blitt rapportert at kreftassosierte gener er mer sannsynlig å være signaliserer proteiner som fungerer som nav, aktivt sender eller mottar signaler gjennom flere veier [16], [17]. Bredere bruk av disse begrepene og konstruerte molekylære nettverk vil bli fremmet av tilgjengeligheten av verktøy som tillater enkel identifisering av potensielle terapeutiske mål for spesifikke kreftformer.

bredere bruk av slike konstruerte molekylære nettverk og nettverksbaserte tilnærminger ville bli forfremmet av tilgjengeligheten av verktøy som tillater enkel identifisering av potensielle terapeutiske mål for spesifikke kreftformer. Denne rapporten presenterer dermed verktøy TARGETgene som utnytter et konstruert gen nettverk som integrerer flere genomisk og proteomikk data ved hjelp av RVM-basert modell [11] for å tillate brukere å enkelt identifisere potensielle terapeutiske mål for en bestemt kreft. Nettverket inneholder ikke bare direkte molekylær interaksjon informasjon, men også bredere gen-gen funksjonelle relasjoner. I tillegg, ved å integrere narkotika-target informasjon samlet fra nylig tilgjengelige offentlige databaser, for eksempel DrugBank [18], PharmGKB [19] og Therapeutic Target Database [20], kan TARGETgene identifisering av mulige narkotika kandidater til kreftbehandling. Brukere kan finne, velge og lagre identifiserte målgener legemidler av interesse (f.eks velge nye kreftgener) via TARGETgene. Gjennom å integrere ressurser fra flere offentlige databaser, TARGETgene gir også brukerne mulighet til å utforske molekylære funksjoner, relatert litteratur, og beriket biologiske prosesser i sine utvalgte mål gener. Videre TARGETgene gir også en måte for brukerne å validere sine spådommer ved hjelp av brukerdefinerte referansegener (f.eks målgener oppdaget i RNAi skjermer) og kuratert kreftgener. I denne rapporten er de høye kompetanse av TARGETgene demonstrert gjennom to programmer i denne artikkelen: identifisering av potensielle terapeutiske mål fra forskjellig uttrykt gener og identifisering av mutasjons drivere. Spådommer i disse to søknader ble tilfredsstillende validert på flere måter, blant annet kjente kreftgener, resultatene av RNAi sreens, genet funksjon merknader, og målgener av legemidler som har vært brukt eller i kliniske studier.

Metoder

Bygging av Gene-Gene funksjonelle sammenhengen Network

Sytten heterogene genomisk og proteomikk data ble integrert med RVM-basert ensemble modellen rapportert i [11] for å konstruere et gen funksjonelt nettverk (som beskrevet i seksjonen 1 av tekst S1). Nodene i nettverket representere alle gener av det humane genom, og den funksjonelle sammenheng mellom hvilke som helst to av dem er kvantifisert ved en gen-par ledd sannsynlighet som kan avsløre tendensen av gener for å operere i samme eller lignende veier. Dermed inneholder dette nettverket ikke bare direkte molekylær interaksjon informasjon, men også bredere funksjonelle genetiske forhold i trasé. Dette nettverk kan brukes til å undersøke forskjellige biologiske spørsmål i helse og sykdom, inkludert utforsking genfunksjoner, forstå komplekse cellulære mekanismene, og å identifisere mulige terapeutiske mål. TARGETgene bruker dette genet nettverk for å kartlegge og analysere potensielle terapeutiske mål på system nivå.

Identifisering av potensielle mål ved hjelp av nettverksbaserte tilnærminger

Basert på den konstruerte genet nettverk, identifiserer TARGETgene potensielle terapeutiske mål ved hjelp av en av to nettverksbaserte beregninger: 1) nav rille eller 2) frø genet forening (poeng som beskrevet i § 2 Tekst S1). To sentralitetsnivåer målinger, veid grad sentralitet og veid egenvektorsentralitetsindeks, levert i TARGETgene kan kvantifisere tendensen av et gen til å være et knutepunkt i den tumor-spesifikke nettverk som er generert ved kartlegging av kandidatgener i en tumor til det konstruerte genet nettverket. TARGETgene lar også brukere til å identifisere viktige kreftgener eller potensielle terapeutiske mål ved å assosiere dem med brukerdefinerte frø gener (for eksempel kjente kreftgener) i genet nettverk. Mer spesifikt, er betydningen av hver kandidat-gen beregnet som en summering av dens funksjonelle direkte tilknytning til disse frø gener. Alle kandidat gener rangeres basert på deres hub scorer eller deres avkom genet forening poengsum. Disse høyt rangert gener i prediksjon er identifisert som mulige viktig kreftgener og dermed potensielle terapeutiske mål. Drug-target informasjonen blir så tilordnet kandidat gener. Legemidler som mål gener er høyt rangert i prediksjonen kan også betraktes som potensielle behandlinger.

Oversikt over TARGETgene

Det grafiske brukergrensesnittet til TARGETgene består av fire hovedarbeids paneler, inkludert Input, Gjennomføring , Gene, og Legemiddelpaneler (figur 1A og 1B). Inndatapanel gjør det mulig å definere kreft type (for tiden: brystkreft, tykktarmskreft, Ewings sarkom, glioblastom, lungekreft, kreft i eggstokkene, og prostatakreft) og kandidatgener, samt ønsket vurdering metriske (hub poengsum eller frø gen krets score) som illustrert i figur 1A. Gjennomføring Panel tillater brukeren å generere nye spådommer, lagre resultatene og laste eksisterende resultater. Den Gene-panelet viser informasjon om alle kandidatgener inkludert deres rang i spådommer, samt kreft litteratur sitat nummer. Kreft litteratur sitat informasjon om gener ble samlet fra Entrez Gene (ftp://ftp.ncbi.nih.gov/gene/). Gjennom dette panelet, kan brukeren også kan finne, velge identifiserte mål gener (f.eks velge nye kreftgener), og utforske sine funksjoner, sitert litteratur samt beriket biologiske prosesser. I tillegg TARGETgene gjør det mulig å validere sine spådommer ved hjelp av brukerdefinerte referansegener (f.eks målgener oppdaget i RNAi skjermer) og kuratert kreftgener via dette panelet. Til slutt, narkotika og deres mål informasjon samlet fra flere offentlige databaser, for eksempel DrugBank [18], PharmGKB [19] og Therapeutic Target Database [20], er også integrert i TARGETgene for rapportering av disse stoffene /forbindelser som kan ha virkning på målene identifisert av TARGETgene. The Drug Panel viser generiske navn, narkotika typer (godkjent eller eksperimentelle), antall kandidat gener som er kjent for å være målrettet av de identifiserte narkotika, høyest rangerte målet genet navn, og relaterte sykdommer i de identifiserte narkotika. Listen over legemidler er bestilt av sine høyest rangerte mål genet. TARGETgene er også tilpasses og kan generere en liste over utvalgte legemidler basert på rekkene av sine mål eller type narkotika. I tillegg kan brukerne utforske mer generell informasjon om identifiserte narkotika av interesse gjennom flere eksterne lenker.

A. Arkitekturen design. B. Den viktigste grafiske brukergrensesnittet

Resultater

For å illustrere bruken av TARGETgene, har vi brukt den til to eksempler:. 1) identifisering av potensielle terapeutiske mål fra tusenvis av forskjellig uttrykte gener identifisert av ekson matrise; 2) identifikasjon av driver muterte gener fra sekvensering og kopiere talldata

Eksempel 1:. Identifisering av potensielle terapeutiske mål fra forskjellig uttrykt Gener

I dette eksemplet ble TARGETgene anvendt i sin tur til hver av tre krefttyper: HER2 positiv brystkreft, tykktarmskreft, og Lung adenokarsinom. Menneske ekson datasett i Affymetrix plattform for de tre krefttyper ble hentet fra National Center for Biotechnology Information Gene Expression Omnibus (GEO) [21]. Senere undersøkelser analyser ble gjort ved hjelp av Partek Genomisk Suite 6.3 (nærmere i kapittel 3.1 Tekst S1). Til slutt ble 5203, 5153 og 6203 differensielt uttrykte gener identifisert i studier av tykktarmen, bryst og lunge cancer, respektivt. Differensielt uttrykte gener i hver krefttype var alle rangert basert sin hub poengsum (vektet grad av sentralitet) i en tumor-spesifikke nettverk, som ble generert ved å kartlegge de differensielt uttrykte gener i hver krefttype til den konstruerte genet funksjonelt nettverk. Den komplette rankingliste av gener for hver av de tre krefttypene kan oppnås ved å kjøre TARGETgene hjelp av kandidatgener listen som er lagret i eksemplene filer (inkludert i TARGETgene pakke) og velge den vektede grad sentralitet vurdering alternativ (pkt 3.1 i tekst S1 lister de 10 høyest rangerte gener for hver av de tre krefttypene som vist i genet paneler TARGETgene). Resultatene viser at en rekke viktige kreftgener for hver krefttype er rangert høyt av TARGETgene, slik som akt1 (rang 1 #), SRC (rank # 10), og ErbB2 (rank # 25) i brystkreft. I tillegg TARGETgene rangerer også flere gener høyt (i topp 10%) som nylig ble identifisert som kreftrelaterte gener i hver krefttype. For eksempel i brystkreft ADAM12 (rank # 153) og MAP3K6 (rank # 205) ble nylig rapportert å være assosiert med brystkreft onkogenese [22], [23]. Dessuten er mange gener som aldri har blitt identifisert i disse krefttypene også rangert høyt. Disse genene kan være gjenstand for videre

in vitro Hotell og

in vivo

studie for å evaluere deres betydning disse krefttypene. Flere av disse har også blitt identifisert av RNAi skjermer (som beskrevet i neste avsnitt).

Tips Evalueringer.

De resulterende rangert gener fra TARGETgene er også validert ved hjelp av genet funksjonelle merknader og flere referanse gen, blant annet sett av kuraterte kreftgener, settet av gener sitert i kreft litteratur, og sett av målgener oppdages av RNAi skjermer. Receiver Operating Characteristic (ROC) Kurver og AUC er brukt for disse referanse evalueringer. I hver evaluering, er de toneangivende gensettene behandlet som positive tilfeller, mens andre gener behandles som negativ eksempel.

kuratert kreftgener lastet ned fra CancerGenes databasen [24] blir først brukt til å vurdere om de er høyt rangert av TARGETgene. Figur 2A viser TARGETgene spådommer ytelse for hver krefttype. De høye AUC verdier av TARGETgene spådommer i hver krefttype (alle AUC 0,85) indikerer at de fleste av de kjente kreftgener tendens til å bli rangert høyt. I tillegg er gener som er sitert i litteraturen for hver krefttypen også anvendes for evaluering. Benchmark gener i hver krefttype kan bestemmes på grunnlag av forskjellig antall henvisningen cutoff. Som referanse cutoff nummer brukt øker så gjør de resulterende TARGETgene AUC-verdiene (figur 2B viser resultatet av brystkreft, og resultatene av de to andre tilfellene er vist i avsnitt 3.2.1 i Text S1), noe som indikerer at gener med flere henvisninger har også en høyere TARGETgene rangering. Resultatene av Spearmans rang korrelasjon i de tre krefttypene viser også signifikant korrelasjon mellom rekkene generert av TARGETgene og litteratur sitat nummer (kapittel 3.2.1 av tekst S1). Dette gir ytterligere bevis på at gener høyt rangert etter TARGETgene er også sitert mer i kreft litteratur; det vil si, de sannsynligvis spiller flere viktige roller i disse kreftformene, i forhold til lavere rangert gener.

Sann positiv rate betegnes TPR og falsk positiv rate betegnes FPR i figuren. A. Evaluering med kuratert kreftgener. B. Evaluering med gener som er anført av sitert av kreft litteratur med forskjellige sitat tall cutoff-verdier på 1, 5 og 10 (bare tilfelle for brystkreft er vist). C. Evaluering med målgener oppdages av celle levedyktighet RNAi skjermer.

høy gjennomstrømming RNAi skjermer har nylig vist seg å være et lovende verktøy for å oppdage nye mål for behandling av flere kreftformer [25]. Derfor er effektive mål av hver type kreft oppdages ved celleviabilitet RNAi som ble lastet ned fra GenomeRNAi [26] også brukes for å evaluere ytelsen til spådommer fra TARGETgene. Datakildene av RNAi skjermer som brukes i dette arbeidet er oppsummert i i kapittel 3.2.3 av tekst S1. Resultatet er vist i figur 2C. Den høye AUC i hver krefttype indikerer at de mest berørt mål identifisert i genom-wide RNAi skjermer har en tendens til å bli rangert høyt av TARGETgene. Noen RNAi målgener som er høyt rangert etter TARGETgene har vist seg å spille en viktig rolle i onkogenese i hver av de tre krefttyper, for eksempel akt1 (# 1) i brystkreft. Nærmere bestemt, noen av disse målgener er bare nylig blitt funnet å være assosiert med disse tre typer kreft. For eksempel i brystkreft, PIK3R2 (phosphoinositide-3-kinase, regulatoriske subenhet 2 beta) og ECT2 (epitelcelledifferensiering trans sekvens 2 onkogen) har en TARGETgene rangering av 37 og 272, og med en 3,31 og 4,94 ganger endring i genekspresjon av brystkreft vev, henholdsvis. PIK3R2 har vist seg å være funksjonelt forbundet med ufosforylerte PTEN og PTEN-assosiert kompleks i enkelte HER2-amplifisert brystcancercellelinjer [27]. ECT2 har nylig blitt rapportert å være involvert med mekanismer for å aktivere RHOB etter genotoksiske stress, for derved å lette celledød etter behandling med DNA-ødeleggende midler i brystkreft [28]. Mest interessant, fant vi også at flere nye mål (dvs. ingen sitat knyttet til den spesifikke krefttypen basert på PubMed i desember 2010) oppdaget av RNAi skjermer er også rangert høyt av TARGETgene. For eksempler på brystkreft, CASK (kalsium /kalmodulin-avhengig serin protein kinase) og CIT (rho-veksel, serin /treonin kinase 21) rangeres 161 og 115, og med en 2,88 og 3,06 ganger endring i gen-ekspresjon av brystkreft vev, henholdsvis. CASK har blitt funnet å være assosiert med tumorgenese i spiserør [29]. CIT koder for en serin /treonin-proteinkinase som fungerer i celledeling. [30]. Slike resultater gir støtte på cellelinje-modeller for evnen av TARGETgene for å identifisere nye terapeutiske mål i kreft. Dette antyder også muligheten for kombinasjon av RNAi og nettverksbaserte skjermer vedtatt av TARGTgene for terapeutisk mål identifikasjon (mer diskusjon i diskusjonskapittelet).

Gorilla [31], et gen ontologi berikelse analyseverktøy, ble brukt å identifisere beriket GO betingelser som finnes tett på toppen av TARGETgene er rangert genet lister for hver av de tre krefttypene. Mange av identifiserte GO prosessbetingelser er kjent kreft-relaterte biologiske prosesser, slik som regulering av celledød, regulering av celleproliferasjon, regulering av cellemigrering. Interessant, flere biologiske prosesser knyttet til nye kjennetegnene til kreft [32] er også identifisert, som for eksempel DNA-skader, oksidativt stress, unndra immune overvåking, metabolsk stress, mitotisk stress, og proteotoxic stress. Disse resultatene indikerer at genene høyt rangert etter TARGETgene er involvert i flere kreftrelaterte biologiske prosesser og veier. I tillegg er flere typer molekyler, slik som signalerings kinaser, reseptor-tyrosin-kinaser, og transkripsjonsfaktorer ofte foreslått som mulige molekylære mål i kreft [33] – [36]. For eksempel har proteinfosforylering vist seg å være en viktig drivkraft i cellulære signal [37]. Vi finner også at mange kinase, reseptor, og transkripsjonsfaktorer relatert Go-funksjon vilkår er beriket i høyt rangert gener i TARGETgene (avsnitt 3.2.2 av tekst S1). Flere detaljer om disse funksjonelle kommentarer kan bli funnet i File S1.

Integrering av Target Spådommer og Legemiddel Target Information.

Etter å kartlegge informasjon om narkotika /forbindelser og deres mål til rangert genet lister fra TARGETgene, Drug Panel bidrar til å identifisere forbindelser som enten er godkjent eller er for tiden i kliniske studier for behandling av hver av de tre kreftformer. Andre stoffer og forbindelser identifisert ved TARGETgene som har ennå ikke blitt brukt i kliniske studier har også vist anti-kreft effekt og kan dermed betraktes som potensiell ny medisin for disse kreftformene. Tabell 1 viser noen av disse stoffene og forbindelser som målrettede gener er overuttrykt og høyt rangert etter TARGETgene i Breast Cancer (resultatene av lunge og tykktarmskreft kan finnes i kapittel 3.3 av tekst S1). Trastuzumab og Lapatinib er godkjent for HER2-positiv brystkreft, og deres viktigste mål ERRB2 er veldig høyt rangert etter TARGETgene (og oppregulert). Flere andre legemidler som mål er høyt rangert etter TARGETgene som Dasatinib, UCN-01, Celecoxib, Flavopiridol, og Vorinostat, har allerede vært i kliniske studier for behandling av brystkreft. Videre har andre legemiddel /forbindelser som er vist å ha antitumoreffekter og kan betraktes som potensielle nye legemidler for behandling av brystkreft, slik som Alsterpaullone og olomoucin. I tillegg er to naturlig forekommende forbindelser, melatonin og vitamin D (Calcidiol), er også identifisert ved TARGETgene. Melatonin, et naturlig forekommende stoff som finnes i organismer, kan regulere døgnrytmen i flere biologiske funksjoner. Nylig ble en klinisk studie med totalt 643 kreftpasienter som bruker melatonin funnet en redusert mortalitet [38]. En studie viste også at kvinner med lav melatonin nivåer har en økt risiko for brystkreft [39]. Vitamin D-reseptorer har blitt funnet i opptil 80% av brystkreft, og vitamin D reseptor polymorfismer har blitt assosiert med forskjeller i overlevelse [40], [41], [42]. Aktive vitamin D-forbindelser (calcidiol; Calcitriol) også har blitt identifisert for sine antiproliferative effekter i brystkreftceller [43], [44], selv om detalj mekanismene er fortsatt uklart. Oppsummert disse resultatene gi noen ytterligere bevis på at gener som er høyt rangert etter TARGETgene kan være potensielle terapeutiske mål

Eksempel 2:. Identifisering av Driver muterte gener i Cancer

Et stort antall av genet mutasjoner har blitt oppdaget fra neste generasjon sekvensering [65]. En stor utfordring er imidlertid å skille driver muterte gener som fremmer veksten av kreft fra passasjer mutasjons gener som ikke spiller en rolle i kreft progresjon. Flere forsøk har blitt gjort for å identifiserte recurrently muterte gener som drivere [66], [67], [68], men så langt dette arbeidet har vært i stand til å oppdage mange sjåfører med mindre de er mutert til betydelig høye frekvenser. For eksempel, grupper av gener i en sti som er gjensidig utelukkende mutert. Ulike kombinasjoner av mutasjoner i samme viktige signal eller reguleringsveien kan alle generere en betydelig forstyrrelse og forårsake kreft utvikling, men disse kombinasjonene vil utelukkende vises i en gitt prøve.

Mutasjoner av hub gener i molekylære nettverk er i stand til å dyregulating de vanlige funksjoner av mange gener og deres veier, på grunn av evnen til hub gener til direkte eller indirekte å endre andre komponenter i cellen i løpet av deres omfattende interaksjoner. Følgelig kan muterte hub gener være driverne av kreft progresjon. I dette eksemplet har vi brukt TARGETgene å identifisere mulige driver muterte gener fra de ca 500 muterte gener i genomet til glioblastoma multiforme (GBM) [69]. For å identifisere de gener som mutasjoner vil ha de mest betydelige virkninger på andre genet, velger vi alle gener i genomet som frø gener og deretter TARGETgene rangert alle muterte gener basert på deres tilknytning til alle gener i genomet. Ett sett med gener i de identifiserte kjerne veier av GBM [68] ble brukt til validering. Vi har funnet at disse gener i de validering kjerne pathways tendens til å bli rangert høyt av TARGETgene (AUC = 0,94; figur 3). Flere av disse identifiserte gener kjernespredningsveier er velkjente GBM-gener, slik som EGFR (# 1), TP53 (# 22), og PTEN (# 27). Det er bemerkelsesverdig at to av gener identifisert av TARGETgene er romanen GBM gener (dvs. ble ingen GBM litteratur sitater funnet), inkludert, CCND2 (# 66) og SPRY2 (# 68). Dette indikerer høyt rangert gener i TARGETgene prediksjon kan være onkogene drivere eller potensielle terapeutiske mål. I Drug Panel, TARGETgene viser også noen godkjente legemidler som er rettet på de høyt rangert gener identifisert ved TARGETgene, noen som har vært brukt til behandling av GBM eller nå er i GBM kliniske studier (resultater ikke vist). Alle resultatene kan regenereres ved hjelp av Eksempel 2 kandidat gener fil på TARGETgene pakken og velge samarbeid med alle gener i genomet.

TARGETgene prediksjon ytelse vurderes av gener i de identifiserte kjerne veier.

diskusjon

Identifisering av potensielle terapeutiske mål

Basert på resultatene i de to eksemplene presenteres, mest studerte kreftgener, inkludert de som har vist klinisk nytte (f.eks erbB2 og TOP2 i tabell 1), er høyt rangert i TARGETgene spådommer i hver av de tre krefttypene. Mest spesielt TARGETgene også identifisert flere høyt rangert gener som er romanen i hver av de tre krefttypene. Mens de fleste nye godkjenning av legemidler for mål-kreft terapier er rettet mot noen få eksisterende mål, slik som EGFR, ABL1, bare et lite antall forbindelser er i utvikling mot nye mål [25]. Dette tyder på at mange potensielle mål forbli uoppdaget eller undrugged. Tidligere metoder som brukes til å identifisere og validere nye mål i sykdommer er begrenset på grunn av høye kostnader, lav gjennomstrømning og tiden involvert [25]. Genet nettverksbasert tilnærming som implanteres i TARGETgene er i stand til å effektivt og grundig identifisere viktige kreft terapeutiske mål. Viktigst, de biologiske datasett som brukes til å konstruere genet nettverk er alle i den offentlige domener. I tillegg, selv om noen studier har anslått størrelsen på «druggable» menneskelige genom å være rundt 10~20% av menneskelig proteom- (dvs. antall mulige protein mål for små-molekyl drug design i medisinsk kjemi) [70], [71], utvikle RNAi-baserte terapier kan gi rom for målrettet behandling av praktisk talt alle gen [72]. Dermed målene (oppregulert eller muterte) identifisert av genet nettverksbasert tilnærming i TARGETgene, kan alle være potensielle terapeutiske mål ved hjelp av RNAi-basert terapi. Men de fleste av målene spådd av TARGETgene fortsatt trenger å bli godkjent i prekliniske modeller og til slutt hos pasienter.

I de to eksemplene presentert, er hub gener identifisert som viktige kreftrelaterte gener eller potensielle terapeutiske mål med en vektet grad sentralitet tiltak. Selv om forutsigelser i de tre krefttyper ble en tilfredsstillende validert på flere måter, er forutsigelser basert på denne fremgangsmåte antas å være forutinntatt mot gode forbindelser gener i nettverket. For eksempel kan noen flaskehals hub gener [73] med bare noen få direkte forbindelser til andre noder, men som fungerer som viktige kontakter i nettverket, ikke bli identifisert ved bruk av vektet grad sentrale mål. Vektet egenvektor sentralitet tiltak som kan forklare den globale betydningen av et gen i den konstruerte nettverket er en tilnærming for å ta opp dette problemet. Det konstruerte gen nettverk brukt i denne studien, men inneholder ikke bare direkte molekylær interaksjon informasjon, men også bredere (undirected) gen-genet funksjonelle relasjoner, og dermed redusere den tidligere nevnte utvalgsbias problem ved bruk av den vektede grad sentralitet. Vi merker oss at sammenlign prediksjon ytelse mellom vektet grad sentralitet og vektet egenvektoren sentralitet mål, støtter dette punktet (resultater ikke vist). Men gener som ikke har vært godt studert til dags dato, men kan være viktige i kreft progresjon vil ikke bli identifisert med TARGETgene, fordi lite er kjent om deres funksjon. Dette er en gjeldende begrensning av TARGETgene for målet identifikasjon, som kan bedres etter hvert som flere genomisk og proteomikk data genereres og integrert for å konstruere en mer komplett gen nettverk for å bli inkludert i fremtidige versjoner av TARGETgene.

Kombinasjon av Spådommer av TARGETgene og RNAi skjermer

RNAi skjermer har evnen til å identifisere kritiske gener som styrer kreftrelatert (eller sykdomsrelatert) fenotyper uten å bruke noen forutgående biologisk informasjon. RNAi skjermer kan således forventes å være et kraftig verktøy for å identifisere og validering av nye mål i drug discovery prosessen [25]. Genet nettverksbasert tilnærming vedtatt av TARGETgene, men rangerer ikke noen av målene identifisert av RNAi skjermer høyt. Det er flere årsaker til forskjellen mellom den forutsagte målet ved hjelp RNAi og genet nettverksbasert tilnærming i TARGETgene. Bruken av RNAi skjermer har flere betydelige begrensninger. For det første kan RNAi skjermer bare bli utført i cellelinjer, således betydningen av målene må videre validert i kliniske forsøk. For det andre, RNAi reagensene off-target-effekter, noe som resulterer i hemming av gener som ikke er de tiltenkte mål å resultere i spesifikk fenotype [25]. Selv om det er mulig å redusere virkningen av slike effekter ved hjelp av omfattende valideringer, bare noen få mål er ferdigstilt og dermed generere mange falske negative (dvs. mange gener som skal være mål, men ikke oppdages). I motsetning til dette, kan genet nett-basert screening i TARGETgene bli brukt til å identifisere potensielle terapeutiske mål direkte ved hjelp av pasientdata. 3).

Legg att eit svar