PLoS ONE: Kreft Exome generert av Alternative mRNA skjøting utvanner Forut HLA klasse I epitop Density

Abstract

Flere studier har vist at kreft aktivt regulere alternativ spleising. Endrede skjøting mekanismer i kreft føre til kreft-spesifikke transkripsjoner forskjellige fra bassenget av vitnemål som forekommer bare i friskt vev. Samtidig blir endret presentasjon av HLA-klasse I-epitoper som ofte observeres i forskjellige typer av kreft. Nedregulering av gener relatert til HLA-klasse I antigenprosessering er blitt observert i en rekke krefttyper, som fører til færre HLA klasse I-antigener på celleoverflaten. Her bruker vi en peptidome bred analyse av forventet alternative spleise former, basert på en offentlig tilgjengelig database, for å vise at peptider overrepresentert i kreftspleisevarianter omfatte betydelig færre spådd HLA klasse I epitoper i forhold til peptider fra normale transkripsjoner. Peptider over-representert i kreft transkripter er i tilfellet av de tre mest vanlige HLA klasse I super representanter konsekvent funnet å inneholde færre forutsagt epitoper sammenlignet med normalt vev. Vi har observert en signifikant forskjell i aminosyresammensetning mellom proteinsekvenser knyttet til normalt vev sammenlignet med kreft, som transkriptene ble funnet i cancer er beriket med hydrofile aminosyrer. Denne variasjonen bidrar til den observerte signifikant lavere sannsynlighet for kreft-spesifikke peptider å bli spådd epitoper i forhold til peptider som finnes i normalt vev

Citation. Stranzl T, Larsen MV, Lund O, Nielsen M, Brunak S (2012 ) Kreft Exome generert av Alternative mRNA skjøting utvanner Forut HLA klasse I epitop Tetthet. PLoS ONE 7 (9): e38670. doi: 10,1371 /journal.pone.0038670

Redaktør: Kjetil Tasken, Universitetet i Oslo, Norge

mottatt: 28 desember 2011; Godkjent: 09.05.2012; Publisert: 25.09.2012

Dette er en åpen-tilgang artikkelen, fri for all opphavsrett, og kan bli fritt reproduseres, distribueres, overføres, endres, bygd på, eller brukes av alle for ethvert lovlig formål. Arbeidet er gjort tilgjengelig under Creative Commons CC0 public domain engasjement

Finansiering:. Dette arbeidet ble støttet av et stipend fra det danske Forskningsrådet for teknologi og produksjon Sciences (Project «Sykdom Gene Finne, somatiske mutasjoner, og Vaccine design «, rektor finansiering mottaker, Søren Brunak) og ble støttet av National Institutes of Health (kontrakt HHSN26620040006C). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

kreftspesifikke spleisevarianter er av betydelig interesse, da de kan være involvert i patogenesen, og kan videre eventuelt anvendes som biomarkører og generere nye mål for kreft [1], [2]. Det humane immunsystem er i stand til å svare på noen av disse kreftspesifikke antigener, som først vist med et melanom-spesifikt antigen, MAGE-1, i stand til å stimulere humane T-celler [3], [4]. Mer generelt er personer med høy eller medium cytotoksisk aktivitet av perifert blod-lymfocytter videre forbundet med en betydelig lavere risiko for kreft, noe som tyder på en rolle for natur immunologiske vert forsvarsmekanismer i kreft [5].

Alternativ spleising kan endre strukturen av mRNA ved inkludering eller hopper av eksoner, og dette kan endre funksjonen, stabilitet eller bindingsegenskapene til kodede proteiner og dermed bidra til menneskelige sykdommer som kreft [6]. I en studie som undersøkte alternative spleise hendelser i eggstokkene og brystvev berørt av svulster ble det funnet at omtrent halvparten av alle spleise hendelser i disse vev er endret i tumorer, mange av dem på grunn av ekson hoppe [7]. Lignende trender har blitt observert i andre typer kreft, for eksempel, i tykktarmskreft og testikkeltumor [8], [9], samt i magekreft, der gener som viser differensial uttrykk mellom kreft cellelinjer og tilsvarende normale vev ble funnet [ ,,,0],10]. I tillegg til kreft være involvert i dysregulating veier og derved bidrar til endringene i alternativ spleising og gen-ekspresjon kontrolleres av disse proteiner [11], human leukocytt antigen (HLA) klasse I antigenprosessering komponenter og HLA-ekspresjon er også blitt vist å bli nedregulert i forbindelse med kreft [12], [13]. En studie undersøker endringer av HLA klasse I uttrykket i 12 kreftpasienter på eggstokkene rapporterte lave nivåer av HLA klasse I antigener i tumorceller fra alle pasienter. En pasient-avledet tumor cellelinjen viste en fullstendig haplotype tap, inkludert HLA-A2 locus [14].

Disse observasjonene er tolket som mekanismer vedtatt av svulster å unnslippe immun overvåking og for å unngå svulst celle anerkjennelse og ødeleggelse [15], [16]. Det har blitt foreslått at eliminering av voksende tumorer av immunsystemet kan føre til valg av tumor varianter som er effektive til å unngå immunsystemet gjenkjennelse [17]. Det ser dermed ut til å være akkumulert bevis for kreft er koplet til alternativ spleising, så vel som til en effekt i å unndra fra immunsystemet ved å nedregulering og endring HLA uttrykk. Mesteparten av de studier relatert kreft-spesifikke alternativ spleising til endret immunsystemovervåking er imidlertid av begrenset størrelse, og i de fleste tilfeller anekdotiske. Her ønsket vi å undersøke, i en storstilt studie, dersom alternativ kreft exome allerede på trinnet av mRNA spleising inneholder en skjevhet i forhold til vanlige utskrifter i settet av mulige HLA klasse I epitoper.

Resultater

Avskrifter overrepresentert i kreft inneholde færre spådd epitoper begrenset av de tre mest vanlige HLA klasse i overtyper

Formålet med denne studien var å undersøke, ved hjelp av en storstilt datasettet, hvis peptidomes spesifikke for kreft versus normalt vev har ulike egenskaper knyttet til endret grad av immunsystemet overvåking. For å gjøre dette, bygget vi to sett med peptider, en over-representert ved kreft vev og en over-representert ved normalt vev. Globalt permutert versjoner av disse settene ble produsert som beskrevet i Materiale og metode. Den globale permutasjon ødelegger strukturelle egenskaper innenfor HLA-bindende 9-merer, bare opprettholde global kompositoriske egenskaper. Til sammenligning, konstruerte vi lokalt permutert normale og kreft sett av permutating hvert peptid for seg, og dermed bevare den lokale aminosyresammensetningen av hvert peptid. For å undersøke immunrelaterte egenskaper, potensielle epitoper som dekker hele 12 HLA klasse I overtyper ble beregnet med NetMHCpan. For hver super, vi beregnet prosentandelen av predikerte epitoper for de seks peptid datasettene: normal, normal globalt og normal lokalt permutert, kreft og kreft globalt og kreft lokalt permutert

Det er velkjent at noen HLA-klasse. jeg super~~POS=TRUNC representanter er mer vanlig enn andre. Det forventes derfor at for de mindre hyppige HLA-alleler, resultatene er mer sannsynlig å inkludere støy. Kilden av datasettet, den ASTD database, er i stor grad stammer fra EST-data uten HLA-spesifikk informasjon. EST data er hovedsakelig basert på kaukasiske europeere [18]; derfor kan vi trygt anta at de mer vanlige HLA-typer i den europeiske befolkningen er også mer vanlig i vårt datasett. HLA allel frekvenser som ble oppnådd fra den dbMHC databasen [19]. Omtrentlige tall for forventet fenotype per super i den europeiske befolkningen er gitt i tabell 1.

De tre vanligste super representanter i den europeiske befolkningen er HLA-A * 02:01, HLA-A * 01 :01 og HLA-A * 03:01. For disse tre super representanter transkripsjoner forbundet med normalt vev har en betydelig høyere andel av forventet epitoper enn transkripsjoner overrepresentert i kreft. Figur 1 viser de observerte tallene, i prosenter av predikerte epitoper per 9-merer, for de ulike datasett for disse tre vanligste super representanter. Alle observerte forskjellene mellom normale og kreft vev som er vist i figur 1 er signifikant (p 0,006, to-sample test for likestilling av proporsjoner).

Data vises for de tre vanligste HLA-I alleler i det europeiske befolkning. Hver søyle viser prosentandelen av predikerte epitoper per 9-mer i den aktuelle settet. Hvert sett består av peptider som enten er over-representert i normal eller kreft vev. Globalt permutert eller lokalt permutert versjon av peptidet settene ble konstruert som beskrevet i Materialer og Metoder. Alle observerte forskjeller mellom kreft og normalt vev er signifikant (p 0,006, to-sample test for likestilling av proporsjoner).

For de fleste HLA klasse I overtyper, kreft transkripsjoner inneholder færre spådd epitoper

Videre er prosentandelen av forutsagte epitoper for permutert og ikke-permutert sekvenser for alle 12 super representanter er vist i tabell 2. Her observerte vi en lignende tendens i forhold til vår observasjon for de tre mest vanlige overtyper i den europeiske populasjon . For ikke-permutert sekvenser, sju av de tolv super representanter (HLA-A * 01:01, HLA-A * 02:01, HLA-A * 03:01, HLA-A * 24:02, HLA-A * 26:01, HLA-B * 15:01 og HLA-B * 58:01) hadde en betydelig lavere andel av forventet epitoper i sekvenser tilordnet kreft patologi. En statistisk signifikant forskjell, hvor cancerassosierte peptider som inneholdt mer predikerte epitoper ble, på den annen side, bare observert for en super representative, nemlig HLA-B * 27:05.

Ved analyse permutert sekvenser , lignende resultater ble observert. Bare en super representant (HLA-B * 40:01, lokalt permutert) hadde betydelig mer spådd epitoper i permutert kreft sekvenser enn i permutert normale sekvenser. På den annen side, permutert, normal sekvenser hadde gjennomgående for både de lokale og globale permutert sett mer anslåtte epitoper i syv super representanter (HLA-A * 01:01, HLA-A * 02:01, HLA-A * 03:01 , HLA-A * 24:02, HLA-A * 26:01, HLA-B * 15:01, HLA-B * 58:01). For disse syv super representantene, er forskjellen mellom normale og kreft datasett betydning i permutert så vel de ikke-permutert datasett. Observasjonen at kreft transkripsjoner inneholder færre spådd epitoper for de fleste HLA klasse I super representanter, er stabil, når forskjellige terskler for prediksjon av potensielle epitoper brukes (data ikke vist).

HLA motiv og aminosyre skjevheter sammensetning

Den relative forskjellen i spådd epitop tetthet mellom normal og kreft er, for våre tidligere definerte vanligste HLA-alleler, relativt stabil. Dessuten er det forskjell i epitop tetthet størst når man sammenligner ikke-permutert til globalt permutert peptid sett. For HLA-A * 02:01, er en merkbar nedgang på spådd epitoper observert når man sammenligner normale og kreft ikke-permutert peptider til normale og kreft permutert peptider. Som det fremgår fra tabell 2 og figur 1, er forskjellen i prosent av epitoper størst når man sammenligner de ikke-permutert sekvensene til globalt permutert sekvenser (normal: 0,83 vs 0,73, cancer: 0,77 vs 0,69). For HLA-A * 01:01, ikke-permutert versus permutert sekvensene vises prosentandelen av epitoper i å være relativt stabilt (normal: 0,82 vs 0,80, kreft: 0,77 vs 0,76), mens permutert HLA-A * 03:01 sekvenser har mer spådd epitoper enn de tilsvarende ikke-permutert sekvenser (normale: 0,94 vs 1,01, kreft: 0,91 vs 0,96). For disse tre super representanter andelen spådd epitoper i lokalt permutert peptider alltid faller mellom de respektive prosenter for ikke-permutert og globalt permutert sekvenser. Lokalt permutert peptider bevare eneste lokale aminosyresammensetning, og globalt permutert peptider har sine lokale strukturelle egenskaper ødelagt og bevare eneste globale aminosyresammensetning. Disse observasjonene tyder på at både globale og lokale strukturelle aminosyre egenskaper er faktorer som definerer de observerte forskjellene i epitop tettheter mellom normal og kreft peptidome.

En analyse av forhold aminosyresammensetning ble utført for alle overrepresentert 9-merer forbundet med normal og kreft. Vi har funnet at hydrofile rester er mer vanlig hos polypeptider fra kreft transkripter enn fra de normale polypeptider. De forbindelser av N /C-forhold sammenlignet med hydrofiliteten omfanget av aminosyrer av Hopp-Woods, hydrofobisitet skala ved Wimley-White, så vel som den midlere rangeringen av aminosyrer i henhold til frekvensen av deres forekomst i 38 publiserte hydrofobisitet skalaer er vist i figur 2. i figur 2, rester er mer vanlig i kreft hvis N /C er mindre enn 1. Hydrofile rester er merket med sort.

N /C-forhold i forhold til Hopp-Woods hydrofilitet skala (A) , Wimley-White hydrofobisitet skala (B) og til den gjennomsnittlige rangering av aminosyrer basert på 38 hydrofobisitet skalaer (C). N /C-forholdet er forholdet mellom observerte frekvenser for de respektive aminosyrene i polypeptidene ifølge en overrepresentasjon av transkriptene fra normale og kreftvev. Dersom N /C-verdi 1, er aminosyren mer vanlig i normalt vev; Dersom N /C-verdi mindre enn 1, er aminosyren mer vanlig i kreft. Grønne barer henvise til mer hydrofobe aminosyrer, mens svarte striper referere til mer hydrofile aminosyrer. Alle N /C-forhold større eller mindre enn en er betydelig. (P 0,001, beregnet ved hjelp av Wilson scorer [45] og Bonferroni korrigert)

Hopp-Woods og Wimley-hvite skjell korrelerer sterkt med N /C-forhold med en Spearman rang korrelasjonskoeffisient på -0,72 og 0,78, henholdsvis. Det gjennomsnittlige rangering aminosyre skala er korrelert med en korrelasjonskoeffisient på -0,65. Alle tre korrelasjonskoeffisientene er signifikant (P-verdi 0.003, presis permutasjon test). Ingen korrelasjon ble funnet for andre aminosyre egenskaper som masse, overflateareal eller volum (data ikke vist).

Det er påfallende å observere at alle sterke hydrofile aminosyrer (KPRQ, Hopp-Woods skala) blir anriket i sekvenser assosiert med kreft. En lignende observasjon er gjort for Wimley-White skala: Vi identifiserte syv aminosyrer betydelig mer vanlig i kreft (APERKDQ). Seks av disse (alle unntatt A) er innen de syv mest hydrofile aminosyrer basert på den Wimley-White skala. En reversert trend er funnet for hydrofobe aminosyrer. Den øverste vesentlige aminosyrer klassifisert av både Hopp-Woods og Wimley-Scott som hydrofobe (WFICM) er alle mer vanlig i sekvenser assosiert med transkripsjoner fra normalt vev.

Basert på disse funnene, kunne man foreslå en forklaring på forskjellen i densitet mellom epitopen den normale og kreft peptidome. Bindingsmotiver for de 3 mest vanlige super representanter er vist i figur 3. Ut fra de fire mest foretrukne aminosyrer ved de HLA-A * 02:01 ankerstillinger, er tre aminosyrer (VMI) anriket på normale transkripter, mens bare en (L) er som vanlig i normal som i kreft. Dette fører til den konklusjon at i det minste en del av de observerte forskjellene i prosent av den forutsagte epitoper i normal versus kreft transkripsjoner skyldes aminosyresammensetning. Den samme tendensen finner vi for HLA-A * 01:01. De to mest vanlige aminosyrer i motiv (YT) er også mer ofte finnes i normalt vev, mens S er nøytral, og den neste felles aminosyre, D, er mer vanlig i kreft. Den hyppigste aminosyre for HLA-A * 03:01 (K) er litt mer vanlig i kreft, mens den nest neste hyppig (Y) er, på grunn av en sterkere preferanse for å passe peptider fra normalt vev, skiftende bias mot aminosyrer mer vanlige i spleisevarianter i forbindelse med normalt vev. For alle tre motivene, vi videre beregnet gjennomsnittlig vektet skjevheter, basert på N /C-forhold og aminosyre frekvenser (se materialer og metoder). De veide forspenner ble beregnet for begge de respektive 5 mest vanlige aminosyrer pr motiv så vel som alle 20 aminosyrer. For alle tre motivene observerte vi en samlet preferanse for aminosyrer som finnes i vår normalt vev sett.

De tre vanligste HLA typer i den europeiske befolkningen. Høyden på en kolonne av bokstaver er lik informasjonsinnholdet ved denne posisjon, mens høyden på hver bokstav i en kolonne er proporsjonal med frekvensen av den tilsvarende aminosyren ved denne posisjon [44].

diskusjon

Alternativ spleising av mRNA-transkripter er en viktig mekanisme for generering av genomisk kompleksitet og har vist seg å variere mellom kreft og de tilsvarende normale vev [1], [8], [9]. I tillegg kreft i noen tilfeller downregulate HLA klasse I antigen-prosessering komponenter og HLA klasse I uttrykket for å unngå å bli oppdaget av immunsystemet. Disse observasjonene førte oss til å undersøke om transkripsjoner funnet i kreftvev aksje egenskaper som vil redusere immunsystemets gjenkjennelse. Her har vi gjennomført en storstilt analyse med sikte på å identifisere immunrelaterte avtrykk som kan differensiere kreft fra normale transkripsjoner. Basert på ASTD database, en database som gir spådd spleise former, identifiserte vi to peptid datasett; ett assosiert med transkripsjoner over-representert i kreft og en assosiert med transkripsjoner overrepresentert i normalt vev. Ved hjelp av state-of-the-art immunoinformatics prediksjon verktøy, vi neste analyserte de to datasettene for forskjeller når det gjelder sannsynligheten for å bli presentert på utbredt HLA klasse I molekyler, og dermed potensielle for aktivering av immunsystemet.

Vi har funnet at peptider, som på grunn av alternativ spleising er uttrykt i kreftvev, inneholder færre predikerte epitoper som er begrenset av de tre mest vanlige HLA klasse i alleler enn peptider uttrykt i normalt vev. Ved hjelp av globalt permut datasett vi konsekvent, for de tre vanligste HLA klasse I alleler, fant at den observerte tap i epitop tettheten i kreft peptidome opprettholdes også for permut datasett. Dette indikerer sterkt at forskjeller i aminosyresammensetningen mellom peptider fra alternativt spleiset normale og kreft transkripter er den drivende kraft av den reduserte forutsagte epitop tetthet.

Årsaken til den observerte endring i frekvensen av spesifikke aminosyrer i proteinene forbundet med kreft i forhold til normalt vev er ukjent, men det fenomen er tidligere blitt observert i studier med sikte på identifisering av biomarkører for tidlig oppdagelse av kreft: i et nylig studie, ble nivåene av alanin, isoleucin, leucin og valanine funnet økt i pancreases av rotter med kreft i bukspyttkjertelen, sammenlignet med prøver fra rotter med kronisk pankreatitt og friske rotter [20]. I en annen studie ble nivåene av N-metylalanin og lysin funnet å være signifikant økt i plasma fra bukspyttkjertelcancerpasienter, mens nivået av glutamin og fenylalanin ble funnet å bli redusert [21]. Disse studiene vist forskjeller i aminosyresammensetningen i en enkelt krefttype basert på blodplasma og vevsprøver. Vi, i motsetning, analysere over representert cancer peptider generelt. Som må forventes, funnene om aminosyre konsentrasjonen rapportert i denne studien er ikke sammenfallende med de av de enkelte krefttype studier.

En mulig forklaring på hvorfor vi har observert færre spådd epitoper i peptider, som på grunn av alternativ spleising er uttrykt i kreft, kan være at vertens immunsystem begrenser kreft exome. I så fall trykket fra immunsystemet disfavors kreftceller som presenterer nye epitoper på celleoverflaten. En alternativ forklaring – noe som ikke utelukker den tidligere forklaring – tar utgangspunkt i den observerte endring i aminosyren frekvens, særlig økningen i hydrofile aminosyrer i cancerproteiner

Det har tidligere blitt vist at missense mutasjoner i. den BRCA domenet av høyrisiko bryst- og eggstokk-kreftpasienter ofte målrette sterkt hydrofobe aminosyrer [22]. Videre har det vært foreslått at stabilisering av en proteinstruktur er for en stor del på grunn av den hydrofobe effekten [23]. Følgelig er økningen i hydrofile aminosyrer som har en destabiliserende effekt på proteinstruktur, som er i overensstemmelse med den proteintap-av-funksjon som er korrelert med progresjon av kreft. Dette er eksemplifisert ved en undersøkelse om arvet missense mutasjoner av tumor suppressor genet,

BRCA-1

, som kan disponere for brystkreft eller eggstokkreft [24]. I denne studie ble det funnet at mutasjoner hovedsakelig rettet mot konserverte hydrofobe aminosyrer som er ansvarlig for folding og stabilitet. Siden, i særdeleshet, den mest vanlige HLA klasse I alleler, A * 02:01, foretrekker hydrofobe aminosyrer ved forankringsposisjoner, vil en økning i hydrofile aminosyrer uunngåelig føre til færre forutsagte epitoper. Reduksjonen i epitop tetthet i peptider assosiert med cancer kan derfor være en iboende egenskap av proteiner som er stabile overfor en reduksjon av hydrofobe aminosyrer som en del av progresjon av kreft. Vi er imidlertid ikke kjent med studier som viser en generell økning av hydrofobe aminosyrer gjennom ulike former for kreft.

En skjevhet av færre potensielle epitoper på grunn av kreft ble tidligere vist av Wiedenfeld et al [25]. Peptider forårsaket av missense mutasjoner av p53 ble vist å ha en redusert tilpasning til HLA-A * 02:01 motiv. Alle forutsagte varianter av peptidene var enten fra pasienter med andre alleler eller allelet ble tapt under tumorigenesis. Den reduserte skikket til HLA motivet på grunn av mutasjoner er i sammenheng med vår studie undersøker forskjeller i epitop tetthet på grunn av alternativ spleising. Så vidt vi vet, er dette den første studien som viser at alternativt spleisede kreft transkripsjoner tendens til å uttrykke færre potensielle epitoper enn alternativt skjøtes transkripsjoner som finnes i normalt vev. Den identifiserte forskjell i aminosyresammensetning mot hydrofile aminosyrer i den alternative skjøtes kreft exome er en mulig forklaring for forspenningen i potensiell HLA klasse I-epitoper. Preferansen for hydrofile aminosyrer ved trinnet med alternative mRNA-spleising kan understøtte utvikling av kreft ved å tilveiebringe den med mulighet for å unndra vertens immunsystem. I dette tilfellet ved å lede til færre potensielle HLA klasse I epitoper presentert på celleoverflaten.

Materialer og metoder

Datauttrekk fra ASTD databasen

alternativ spleising og transkripsjon mangfold database (ASTD) gir tilgang til en samling av alternative spleise hendelser og transkripsjoner av gener fra mennesker, mus og rotter [26]. Formålet med databasen er å analysere mekanismene for alternativ spleising i et genom-bred skala. Den integrerer en beregnings rørledning for påvisning og karakterisering av isoform spleise mønstre samt alternative introner og eksoner. Databasen inneholder spådd transkripsjoner, generert av kartlegging uttrykt sekvens tags (samle såkalte) til genomsekvenser. Vår studie er basert på ASTD versjon v1.1 build 9 (tilgjengelig på ftp://ftp.ebi.ac.uk/pub/databases/astd/). Databasen dekker 14,194 menneskelige gener og lister 50,581 unike karakterutskrifter som ikke omfattes av Ensembl gener. Basert på beslektede bevis fra cDNA-bibliotek, er mange av disse transkripsjonene tagget med patologi informasjon. Den patologi informasjon er gitt som EVOC ontologier, som er et kontrollert vokabular for samlende genuttrykk data [27]. Som et alternativ til ASTD databasen, ville vi ha likt å bruke RNA sekvens data, men kunne ikke identifisere noen brukbare database, og gir genome-wide dekning av eventuelle vitnemål, sammen med patologi informasjon.

To datasett var generert basert på kommenterte patologi informasjon. Alle vitnemål merket med informasjonen til å bli uttrykt i normalt vev ble tildelt undergruppe N. Dette undergruppe besto av 30,739 transkripsjoner avledet fra 11,980 gener. En annen undergruppe, C, med utskrifter knyttet til kreft, besto av 27,967 transkripsjoner avledet fra 10,730 gener

kreft undergruppe består av alle vitnemål merket med EVOC vilkår knyttet til kreft.; det er å være en undergruppe av svulst i EVOC ontologi hierarkiet (tabell 3). Flere EVOC vilkår kan knyttes til samme karakterutskriften.

For vår analyse, var vi interessert i transkripsjoner entydig knyttet til normalt vev eller til en eller flere av de kreft EVOC vilkår. To nye undergrupper bestående av vitnemål bare knyttet til enten normale eller kreft EVOC vilkårene ble opprettet. Ut fra 30,739 transkripsjoner knyttet til det normale, ble 16566 entydig forbundet med normalt vev, på grunn av ASTD database, og ikke med kreft (unik N sett). Undergruppe av vitnemål unikt assosiert med kreft (unikt C sett) består av 13,794 transkripsjoner (se tabell 4). Transkripter som dekkes av hvert datasett er unike for enten normalt vev eller kreft som definert av ASTD databasen. Den ASTD database gir ikke patologi informasjon for alle utskrifter eller lister opp alle mulige vevstyper eller patologier. Derfor henviser vi til våre sett av vitnemål entydig knyttet til enten normal eller kreft som overrepresentert i enten normal eller kreft vev.

Oversettelse til proteiner

Alle transkripsjoner tildelt til enten normal eller kreft patologi ble oversatt til sine respektive proteinsekvens ved hjelp av Virtual ribosom [28]. Den lengste ORF blant alle tre leserammer ble valgt som oversatte proteinsekvens. Proteinsekvensen og tilhørende transkript ble forkastet dersom det ikke ORF ble funnet eller dersom det resulterende proteinsekvensen var kortere enn 9 aminosyrer. Terskelen for 9 aminosyrer ble valgt som vi senere bruke epitop prediksjon på 9-numeriske peptider, selv om vi er klar over at proteiner dette små ikke kan være funksjonelle. Bruk av dette filteret resulterte i en normal sett av 16,490 transkripsjoner og kreft sett av 13,721 transkripsjoner.

Generering av unike 9-merer

Alle proteiner er tildelt enten normale eller kreft patologi landene ble delt inn i overlappende 9-numeriske peptidsekvenser. Peptidsekvenser som ble funnet i begge grupper ble fjernet, noe som fører til dannelsen av to sett med unike 9-mer peptider. Det er 1,856,231 unike 9-merer i normalgruppen (N-peptidome) og 1,684,028 unike 9-merer i kreft gruppe (C-peptidome). Legg merke til at normale og kreft sett ikke består av komplette proteiner; de bare består av unike 9-numeriske peptider som ikke finnes i det annet sett. Permutert sett av både den unike N og unikt C sett ble opprettet. For hvert sett, ett lokalt permutert og ett globalt permutert satt av 9-numeriske peptider ble generert. De lokale permutert settene ble konstruert ved permutasjon hver 9-mer, og dermed holde aminosyresammensetning innenfor hver 9-mer fast. De globale permutert settene ble gjort ved tilfeldig bygging av nye 9-merer ut av alle aminosyrer i hvert sett. Dette bevarer den totale aminosyresammensetning innenfor de unike N og C sett, lokale eiendommer innenfor hver 9-mer er imidlertid ødelagt.

Tippe potensial HLA klasse I epitoper

prediksjonsmetode NetMHCpan-2.4 [29], [30] ble anvendt for å forutsi potensielle epitoper på 12 HLA klasse i overtyper [31]. Den NetMHCpan-2,4-metoden ble trent på et eksperimentelt validerte data sett av mer enn 100.000 kvantitativ peptid – HLA klasse I samspill som dekker mer enn 100 HLA-molekyler og har blitt vurdert som den beste pan-spesifikke metoden for HLA-peptid binding i et stort benchmark studie [32]. En generell akseptert terskel for binding er en rang score på 1% [33], [34] (bindingsstyrke som faller innenfor topp 1% i forhold til et stort sett av tilfeldige naturlige peptider), som også er terskelen, brukt i denne studien .

De prosenter av potensielle epitoper per 9-mer for alle 6 sett (normale 9-merer, normal globalt permutert 9-merer, normal lokalt permutert 9-merer, kreft 9-merer, kreft globalt permutert 9- mers og kreft lokalt permutert 9-merer) ble beregnet. P-verdier for forskjellen i prosent av forventet epitoper mellom normal og kreft 9-merer for ikke-permutert og permutert undergrupper ble beregnet ved en to-sample test for likestilling av proporsjoner og justert for multippel testing (Bonferroni korreksjon).

aminosyre skalerer

aminosyren overflod for normalt vev i forhold til kreftvevet ble fastsatt basert på alle unike 9-merer i de to datasettene. De relative frekvensene for alle aminosyrer i både de normale og kreft settene ble beregnet. Observerte forholdet av frekvenser (N /C) av aminosyrer mellom normale og kreft vev ble korrelert med Hopp-Woods hydrophilicity [35] og Wimley-White hydrofobisitet skala [36] verdier. Forholdet ble videre korrelert med en gjennomsnittlig rangering skala pr aminosyre som er publisert av Simpso]. Ifølge Simpson [37], er skalaen basert på den gjennomsnittlige rangeringen av aminosyrer i henhold til frekvensen av forekomster i hver sekvens rang for 38 publiserte hydrofobisitet skalaer [38]. Andre undersøkte skalaer er gjennomsnittlig volum av nedgravde rester [39], [40], van der Waals volum [41] og totalt tilgjengelig areal [42].

Bootstrapping ble brukt for å teste om en aminosyre eiendom skala er korrelert med anriket ekspresjon av rester i enten unike normale eller cancer 9-merer. For hver skala ble Spearman rank korrelasjonskoeffisienten beregnet og betydningen av sammenhengen ble beregnet ved hjelp av nøyaktige permutasjon test.

HLA motiv skjevhet

HLA bindende motiver ble samlet inn NetMHCpan-2,4 treningsdata . Posisjons spesifikke vekt-matriser ble beregnet ved hjelp av sekvens vekting og korrigering for lave teller [43]. Sekvens logoer ble visualisert som beskrevet av Schneider og Stephens [44], hvor hver bokstav betegner dens proporsjonal frekvens av den tilsvarende aminosyren ved denne posisjon. Basert på aminosyre frekvenser og observerte forholdet mellom frekvensene (N /C) av aminosyrer hos normale og cancervev, beregnet vi for HLA-A * A02:01, HLA-A * A01:01 og HLA-A * A03: 01 motiver deres respektive generelle fordommer mot enten vår definert normal eller kreft peptid innstilt. Dette ble gjort for alle 20 aminosyrer og for de 5 hyppigst aminosyrer forekomster pr motiv. Per posisjon, tendensen til å passe fortrinnsvis til enten normale eller kreft peptidome ble beregnet ved summering av de respektive aminosyre frekvenser multiplisert med tilhørende N /C-verdier for alle 20 aminosyrer.

Legg att eit svar