PLoS ONE: A Novel Approach for å karakterisere mikro Ustabilitet i kreftceller

Abstract

mikro ustabilitet (MSI) er preget av utvidelse eller sammentrekning av DNA gjenta traktater som en konsekvens av DNA mismatch reparasjon mangel (MMRD). Nøyaktig detektering av MSI i kreftceller er viktig ettersom MSI er forbundet med flere kreft subtyper og kan bidra til å informere terapeutiske avgjørelser. Selv om det eksperimentelle forsøk har blitt utviklet for å detektere MSI, de vanligvis avhengig av et lite antall kjente mikro loci eller mismatch-reparasjonsgener, og har begrenset pålitelighet. Her rapporterer vi en roman genom-wide tilnærming for MSI deteksjon basert på den globale påvisning av innsettinger og slettinger (indels) i mikro funnet i uttrykte gener. Vår store analyser av 20 kreftcellelinjer og 123 normale individer avslørte slående Indel funksjoner knyttet til MSI: det er en betydelig økning av korte mikrodelesjoner i MSI prøver i forhold til mikro stabil (MSS) seg, noe som tyder på en mekanistisk skjevhet reparasjon effektivitet mellom innsettinger og slettinger i normale humane celler. Ved å innlemme denne observasjonen inn i vårt MSI utføre beregning, viser vi at vår tilnærming kan korrekt skille mellom MSI og MSS kreftcellelinjer. Dessuten, når vi brukt denne tilnærmingen til primal tumorprøver, er vår beregning også godt forenlig med diagnosen MSI status. Dermed vår studie gir ny innsikt i DNA misparringssystemet, og gir en ny MSI diagnose metode for klinisk onkologi med bedre pålitelighet også

Citation. Lu Y, Soong TD, Elemento O (2013) A Novel Approach for å karakterisere mikro Ustabilitet i kreftceller. PLoS ONE 8 (5): e63056. doi: 10,1371 /journal.pone.0063056

Redaktør: Yousin Suh, Albert Einstein College of medicne, USA

mottatt: 05.09.2012; Godkjent: 01.04.2013; Publisert: 06.05.2013

Copyright: © 2013 Lu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. OE ville liker å bekrefte mottak av National Science Foundation (NSF) Karriere Grant 1054964. de bevilgende myndighet hadde noen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser. forfatterne har erklært at ingen konkurrerende interesser eksisterer.

Innledning

i normale celler, gir mismatch reparasjon (MMR) systemet en svært effektiv mekanisme for å korrigere feil som oppstår under DNA replikasjon. Når svekket, f.eks gjennom inaktivering av humane mismatch-reparasjonsgener slik som MLH1, MSH2 og MSH3, fører mismatch reparasjon mangel på ikke-korrigerte innsett /delesjoner (indels), spesielt i mikro hvor en kort sekvens enhet (ett til seks nukleotider lang) blir gjentatt flere ganger, [1] .

mikro ustabilitet (MSI) refererer til genetisk avvikende tilstand der mikro alleler i genomet gevinst eller mister gjenta enheter på mye høyere frekvens enn i normale celler. Den normale tilstanden er ofte referert til som mikro stabil, eller MSS. Utbredt MSI betyr vanligvis mismatch reparasjon mangel (MMRD), noe som kan føre til opphopning av mutasjoner i kreftrelaterte gener og føre til kreftutvikling og tumorprogresjon. Følgelig er MSI hyppig observert i flere typer kreft, spesielt i tykktarm kreft [2] og prostatakreft [3]. Tilstedeværelsen av MSI kan brukes som en markør for spesifikke tumor-subtyper og kan forutsi følsomheten overfor kjemoterapi [1]. Videre genererer MSI signifikant genetisk heterogeniteten og kan bli brukt til andre formål slik som isolering av medikamentresistente kloner og den påfølgende karakterisering av medikamentresistensmekanismer [4].

For tiden er en rekke analyser finnes for påvisning av MSI , inkludert de som leter etter mutasjoner i MMR gener, måle deres uttrykk, eller leter etter enhet nummer endringer i et sett av mikro ofte rammet av MSI [5], [6]. Men disse analysene er ikke alltid pålitelige. For eksempel, to studier med forskjellige analyser tilgjengelig motsatte resultater om MSI statusen til PC3 prostatakreft-cellelinje [3], [7]. Videre brukte MSI markører er celletype bestemt. For eksempel har det blitt rapportert at brukte markører i tykktarmskreft har lav sensitivitet ved akutt myelogen leukemi [8].

Mange andre faktorer kan ha negativ innvirkning på nøyaktigheten av tilgjengelige MSI deteksjonsteknikker. Metoder som bruker tap av ekspresjon eller mutasjon av kjente MMR gener kan bli hemmet av kompleksiteten av MMR-systemet, som består av flere gener og eventuelt andre uncharacterized seg. Den lave følsomheten av enhetstallbaserte tilnærminger kan forklares ved den tilfeldige natur av MSI: MMRD kan påvirke forskjellige sett av mikrosatellitter i forskjellige individer. Det kan forklare hvorfor de begrensede sett med markører som brukes i dagens MSI deteksjons analysene noen ganger gi falske negative.

For å overvinne slike begrensninger, har vi utviklet en ny metode som forbedrer følsomheten MSI deteksjon ved å innlemme alle detekterbare mikro over genomet preget av neste generasjons sekvensering. Vi valgte å basere vår analyse på RNA-Seq, som det er en relativt moden neste generasjons sekvensering teknikk og har allerede blitt mye utført for ulike bruksområder. Selv kort lese sekvenser skaper utfordringer for kartlegging og karakteriserer mikro, har vi overvinne disse problemene og demonstrerte påliteligheten av vårt genom-wide skanning tilnærming for MSI deteksjon. I tillegg til å basere deteksjon på en vesentlig økt antall mikro indels i MSI celler, utnytter vår tilnærming et fenomen så langt bare rapportert i gjær, men det vi har observert i humane celler i denne studien: Indel lengde utdelinger i MSI og MSS prøver er signifikant forskjellig [9]. Genome-wide påvisning av mikro indels unngår svakhetene i begrenset markør sett og gir høyere følsomhet for MSI deteksjon. Foruten å være sensitive, ikke vår tilnærming krever ikke en matchet germline kontroll fra samme individ, og kan derfor brukes på kreftcellelinjer.

Materialer og metoder

datasett

i denne studien brukte vi RNA-seq datasett for 20 ulike kreftcellelinjer for å undersøke MSI frekvenser i ulike krefttyper. Alle kreft cellelinje datasett ble oppnådd fra publiserte studier, og MSI status av mange av disse cellelinjene allerede er blitt rapportert (selv om det for noen cellelinjer resultatene fra forskjellige undersøkelser konflikt). Tabell 1 viser MSI statusinformasjon og kilder til RNA-seq datasett. Vi har også brukt to publiserte RNA-seq studier av HapMap lymfoblastoide prøver samlet inn fra 69 nigerianske [10] og 54 europeiske individer [11] som kontroller for å definere MSI status i normale humane celler, som MSI ikke ventes i disse prøvene. Vi har også analysert sammen tykktarm kreft svulst og normale RNA-Seq prøver fra 14 pasienter diagnostisert med MSI svulster og 14 pasienter diagnostisert med MSS svulster [12].

Oppdage mikro Indels

først hentet mikrosatellitter i alle menneskelige RefSeq transkripsjoner bruker Tandem Gjentar Finder (TRF) [13]. I denne studien ble definert som mikro tandemrepetisjoner med repeterende enheter med 1 til 6 basepar. For hver RNA-seq datasettet, deretter justert vi kort leser til RefSeq transkripsjoner bruker BWA [14], som lar gapped-justering. Vi brukte en maksimal gap størrelse på 20 bp for alle analysene som presenteres her. Vi har også testet større gap størrelser, men de gjorde ikke øke antall oppdagede indels i analysene som følger. For resten av parametrene vi brukte BWA standard parametere. Vi deretter brukt DINDEL [15] for å ringe indels fra justert leser. Fra utgangen av dindel, filtrerer vi ut vanlige indels oppført i enkeltnukleotidpolymorfi database (dbSNP; Build 132) [16]. Til slutt sammenlignet vi koordinatene indels til koordinatene for mikro funnet av TRF og identifiserte indels innenfor mikrosatellitter (Figur 1a).

PI refererer seg til andelen av innsetninger i mikro enn alle innsettinger, og PD refererer til andelen strykninger i mikro over all slettinger.

Kvantifisering MSI Bruke MSI-seq Index

Vi vurderte flere MSI tiltak basert på antall indels og mikro bestemmes av vår analyse rørledning . Disse tiltakene er inkludert andelen av mikroinnsettinger i løpet av alle innsettinger (betegnet som PI), og andelen av mikrodelesjoner enn alle slettinger (betegnet som PD, figur 1b). Vi vurderte også PI /PD, siden våre resultater, i samsvar med en tidligere studie i gjær [9], antydet at MMRD kan endre de relative priser av innsettinger og slettinger. PI /PD er også omtalt som MSI-seq indeksen i denne studien.

Expression Profilering av MMR relaterte gener

For å sammenligne vår tilnærming med metoder som bruker uttrykket nivå og mutasjonsstatus av MMR systemkomponenter , bestemt vi uttrykket nivået av MMR-genene (inkludert MLH1, MLH3, MSH2, MSH3, MSH4, MSH5, MSH6, PMS1 og PMS2) i kreftcellelinjer fra RNA-seq data. Vi brukte Mansjettknapper [17] for å beregne normalisert uttrykk nivåer målt i fragmenter per kilobase av transkripsjon per million leser (FPKM). Vi har også sett på indels i MMR gener ved hjelp av resultatene de DINDEL (ikke begrenset til mikro). Til slutt, så vi for single nucleotide varianter i de samme MMR genene hjelp SNVseeqer [4], [18], [19]. Som vi gjorde for Indel ringer, vi bare beholdt SNVs ikke er nevnt i dbSNP for videre analyse.

Resultater

Indel Detection i RNA-seq Data om MSI /MSS Prøver

Vi først søkt å identifisere indels innen RNA-seq utvalget som ble brukt i denne studien (MSI, MSS, HapMap). Etter kort-leser justering ved hjelp BWA, brukte vi DINDEL å kalle indels i våre 20 kreftcellelinjer og 123 HapMap RNA-seq datasett. Fra DINDEL utganger, vi filtrert ut indels oppført i enkeltnukleotidpolymorfi database (dbSNP, bygge 132) [16]. Etter filtrering absolutte Indel teller varierer fra rundt 200 til mer enn 2000 (figur 2).

(a) HapMap prøver (b) kreftcellelinjer.

Ulike Utdeling av mikro Indel Endringer i MSI /MSS Prøver

Deretter søkte vi å finne ut hvor ofte mikro sekvenser er endret av indels i hvert RNA-seq prøven. Totalt 505,657 mikro ble funnet i 32,199 Refseq transkripsjon sekvenser bruker TRF. Vi så bestemt antall mikro endret med minst en Indel i hvert RNA-seq prøven. Denne mengden varierer 54-482 i HapMap prøver, og 77-1454 i kreftcellelinjer. I alle disse analysene, vi bare studere indels innenfor mikro. I hver prøve, så bestemt vi hvor stor andel av mikro endret av indels ligger i 5 «UTR, kodende sekvens, 3» UTR eller ikke-kodende RNA, og fastslått om disse andelene er signifikant forskjellig mellom MSI og HapMap prøver og mellom MSS og HapMap prøver. Vi har observert en betydelig økning i andelen av indels i MSI samples «kodende sekvenser (p = 1e-5, t-test, figur 3a) sammenlignet med HapMap prøver, mens andelen tilsvarende i MSS prøver (p = 0,15, t-test). Tilsvarende til denne økningen, andelen av mikro indels i andre regioner var lavere i MSI prøver i forhold til HapMap (5 «UTR: p = 0,0149; 3» UTR: p = 0,0108), mens det ikke er noen forskjell mellom MSS prøver og HapMap (p 0,05; Figur 3d). Forekomsten av mikro indels i kodende regioner av MSI (og til en viss grad i MSS) kreftceller tyder på at disse indels kan føre til en selektiv fordel til kreftceller, i samsvar med funn i andre organismer [20].

(a) kodende sekvenser (b) 3’UTR (c) 5’UTR (d) Ikke-kodende RNA.

i en tidligere studie i gjær, ble det funnet at etter å mutere DNA mismatch reparasjon proteiner, var det en signifikant økning i antall korte delesjoner i mikro, mens antallet av innsettinger i mikro ikke endrer seg vesentlig [9]. Inspirert av disse resultatene, vi også studert fordelingen av påviste mikro Indel lengder i MSI /MSS prøver. Vi la merke til at korte sletting av en bp er hyppigere MSI cellelinjer enn de er i HapMap prøver (Figur 4a). For ytterligere å undersøke denne observasjonen, sammenlignet vi distribusjoner av innsetting og sletting innhentet fra hver av de 7 MSI kreftcellelinjer og 5 MSS cellelinjer til de overordnede distribusjoner av innsetting og sletting fra alle 123 HapMap kontroller. Kolmogorov-Smirnov test viste at lengdefordelinger av mikrodelesjoner i MSI prøver var signifikant forskjellig fra HapMap prøver (p 0,05). I motsetning til alle unntatt ett MSS prøvene viser ingen signifikant forskjell i delesjonslengder (p 0,05). Fordelingen av innsettings lengder, på den annen side, var ikke signifikant forskjellig mellom de 3 gruppene (figur 4b). Disse observasjonene tyder på at mangel med mismatch reparasjon av veier som er forbundet med mikro ustabilitet fortrinnsvis gi opphav til korte slettinger.

(a) mikrodelesjoner (b) mikroinnsett.

The MSI-seq Index riktig Spår MMRD cellelinjer

Vårt opprinnelige mål var å identifisere et genom-wide indeks eller tiltak som skiller pålitelig MSI prøver fra MSS prøver. Vi først undersøkt to mulige tiltak: Andelen av mikroinnsett over all innsett (betegnet som PI), og andelen av mikroslettinger over alt slettinger (betegnet som PD, Figur 1b). Analysen i forrige avsnitt viste at sammenlignet med normale menneskelige celler, antall korte strykninger betydelig økt i MSI cellelinjer, men ikke i mikro stabil (MSS) kreft cellelinjer. På grunn av denne forskjellen, PD diskriminert mellom MSI og MSS prøver, om enn ikke helt (data ikke vist). I motsetning til dette, selv om PI er ute av stand til å skille mellom de to typer celler, reflekterer det likevel det absolutte antall mikro indels. Som et resultat, kan normalisere PD med PI lage MSI statusene til forskjellige prøver mer sammenlignbare. Vi undersøkte derfor forholdet mellom to proporsjoner som et alternativ indeks for å diskriminere mellom MSI og MSS cellelinjer. Når vi beregnet PI /PD for MSI og MSS kreft-cellelinjer, ble det observert signifikante forskjeller mellom de to gruppene (p = 2.4E-5, t-test), med MSI som viser lavere PI /PD (figur 5a). Som forventet, PI /PD-verdiene var også signifikant forskjellig mellom MSI og HapMap (p = 1.5e-10, t-test). Det faktum at MSI og MSS prøvene har statistisk forskjellige PI /PD-verdiene betyr ikke at PI /PD er svært pålitelig ved å diskriminere MSI og MSS. Men vi videre observert at PI /PD tydelig skiller MSI og MSS-cellelinjer i to grupper (figur 5a). Faktisk alle cellelinjene som har blitt identifisert som MSI (tabell 1) viser PI /PD-forhold lavere enn 1. I motsetning til dette, MSS cellelinjer som alle har forhold større enn 1, i likhet med HapMap prøver (figur 5a). Disse resultatene viser at PI /PD-forhold, som vi refererer til som MSI-seq indeksen, kan forutsi nøyaktig MSI status i kreftcellelinjer, selv spenner over flere krefttyper.

(a) Sammenligning mellom PI /PD prosenter av HapMap prøver, MSI kreftcellelinjer og MSS kreft cellelinjer (b) PI /PD forhold for alle HapMap prøver og kreft cellelinjer. HapMap samples «PI /PD-forhold er representert ved den empiriske fordelingstetthet kurve. Med forholdene for kjente cellelinjer er plottet i røde vertikale linjer. Kjente MSS cellelinjer er plottet i blått, og alle de andre cellelinjene er plottet i lilla.

Resultatene ovenfor viser at MSI-seq indeks kan sikkert forutsi MSI status. Vi søkte derfor vår analyse til cellelinjer som MSI status ikke hadde blitt karakterisert. I vår studie, alle slike cellelinjer falt i størrelsesorden HapMap prøver (figur 5b). Derfor, ved våre kriterier, er de sannsynligvis til å være MSS cellelinjer. Spådommer for noen cellelinjer ble støttet av ytterligere bevis. For eksempel er alle tre MSI-uncharacterized brystkreft cellelinjer kategorisert som MSS. Dette resultatet er i tråd med tidligere studier som tyder på at MSI kan bare spille en mindre rolle i onkogenese av brystsvulster i forhold til andre krefttyper [21].

Expression eller Mutasjon kjente MMR Gener unnlater å sikkert forutsi MSI Status

Vi ønsket å finne ut om andre enklere metoder basert på uttrykk eller mutasjon av kjente MMR gener kan forutsi MSI status. Tidligere funn har faktisk foreslått at inaktivering av MMR gener kan føre MMRD [1]. Derfor, i prinsippet ekspresjonsprofilen av MMR-relaterte gener kan også forutse MMRD og MSI. Vi så på 7 MSI cellelinjer og 5 MSS cellelinjer med MSI statusene validert av tidligere studier

uttrykk nivåer av kjente MMR gener ikke korrelerer med MSI status (Figur 6,. FPKM verdiene normalisert etter middelverdien av hver kolonne). For eksempel er ekspresjon MLH1 trykt på to cellelinjer, HCT116 og DU145. Et slikt tap er ledsaget av tapet av MLH3 ekspresjon i DU145 og tap av MSH3 ekspresjon i HCT116, som tidligere rapportert [22]. I en annen MSI LNCaP-cellelinje, men er alle disse gener uttrykkes i normale nivåer, mens den fortrengte ekspresjonen av MSH2 kan være ansvarlig for MSI [3], [23]. Analyse av punktmutasjoner og indels viste også mangelen på korrelasjon med MSI status, med MSS prøvene viser missense varianter i MMR-gener mens mange MSI-celler ikke har noen varianter (tabell 2). Derfor, i motsetning til MSI-seq indeks, hverken MMR genekspresjon nivåer eller mutasjoner er virkelig pålitelig for MSI deteksjon.

Verdier er normalisert med middelverdien av hver kolonne.

Søknad til kliniske prøver

Vi testet om vår tilnærming kan forutsi MSI status i primære svulster. Vi analyserte paret tykktarmskreft svulsten og normale RNA-Seq prøver fra 14 pasienter diagnostisert med MSI svulster og 14 pasienter diagnostisert med MSS svulster [12]. Forholdene for MSI tumorprøver varierer 0,630 til 0,814, mens forholdstall for MSS tumorprøver varierer 0,986 til 1,573. Derfor en terskel rundt 0,9 vil være i stand til å produsere nøyaktige MSI status spådommer, som er likt det vi har observert i kreftcellelinjer. Videre er forholdene for MSI tumorprøver viste en signifikant forskjell sammenlignet med sammenkoblede normale prøver (p = 5.57e-11, T-test), mens det ikke er noen forskjell mellom MSS tumor og normale prøver (p = 0,6438; t-test) (figur 7). Dette resultatet indikerer at vår metode ikke bare fungerer i kreftcellelinjer, men er også effektive til å oppdage MSI status i primærsvulster.

14 er diagnostisert som MSI og 14 er diagnostisert som MSS.

Diskusjoner

i denne studien har vi innført en ny og pålitelig indeks (MSI-seq) for å påvise mikro ustabilitet bruker transkriptomet sekvense data. I motsetning til andre metoder som er begrenset til å spørre et lite antall gener eller mikro regioner, integrerer vår metode Indel data fra et stort antall mikro uttrykt. Vår fremgangsmåte er ikke avhengig av kimlinje DNA og er derfor like anvendelig for cancercellelinjer og primære prøver. Vi har vist at vår tilnærming er mer nøyaktig enn metoder basert på detektering av punktmutasjon eller uttrykk endringer i mismatch reparasjonsgener. En annen fordel med vår tilnærming er at MSI-seq indeksen gir en kontinuerlig måling av MSI. I tidligere studier, ble MSI ofte behandlet som en alt-eller-ingenting hendelsen. Tradisjonelle analyser kan bare fortelle om en prøve er MSI eller MSS. Men i biologisk relevante tilfeller MSI status av prøver er sannsynlig å strekke seg over et kontinuerlig spektrum, og omfanget av MSI kan ha terapeutiske implikasjoner. Derfor kan MSI-seq indeks (PI /PD-forhold) som brukes i denne studien være en lovende kandidat for å kvantifisere den relative MSI grad av en prøve.

I løpet av våre undersøkelser vedrørende indels i kreftcellelinjer vi har gjort en rekke interessante observasjoner. Det er funnet at korte delesjoner i mikro regioner, spesielt 1 bp strykninger, er konsekvent høyt over-representert i MSI kreftcellelinjer sammenlignet med MSS cancercellelinjer og udødeliggjort men ikke-maligne HapMap prøver. På den annen side, fant vi ikke noen konsistent økning i lengre slettinger eller innsettinger i MSI prøver. En lignende observasjon er gjort i gjær [9], men til vår beste kunnskap om at det er første gang dette fenomenet er rapportert i humane celler. Denne observasjonen bekrefter at flere DNA-reparasjonsmekanismer er på spill i normale celler og at innen mikro, er utilsiktet sletting og innsetting av ulike lengder reparert gjennom forskjellige mekanismer.

En annen observasjon er at at det er flere mikro indels i koding regioner i kreftceller og spesielt i MSI-positive cancerceller. Denne oppdagelsen er overraskende fordi en vesentlig fraksjon av disse indels er forventet å forårsake indre frameshifts, non-sense-mediert nedbrytning og derfor geninaktivering. Våre resultater på den annen side antyder at kreftceller med økt kodende mikro indels kan være positivt valgt, og derfor at kodende mikro indels kunne bidra til tumor fenotyper. Alternativt kan disse indels generere funksjonell diversitet som tillater hurtig tilpasning av tumorcellene til skiftende miljøer, kanskje i likhet med det som er blitt observert i gjær [20].

Metoden er basert på transkriptomet sekvensering, som har noen begrensninger når det brukes for MSI karakterisering. For eksempel vil det gå glipp av endrede mikro ligger i regulatoriske sekvenser, som også kan spille viktige roller i onkogenese. Videre, som Indel deteksjon krever tilstrekkelig lese dekning, kan det være vanskelig å oppdage mikro indels i transkripsjoner med lave hopetall. Til tross for ovennevnte ulemper, inspeksjon av uttrykte transkripsjoner gir likevel vesentlig informasjon om MMRD. Som RNA-seq eksperimenter er vidt utføres og prisen for sekvensering kreftprøvene hurtig avtagende, i fremtiden RNA-seq basert diagnose metode blir kostnadseffektivt for kliniske anvendelser. Videre er en enkelt RNA-Seq assay i stand til å gi nøyaktig MSI diagnose sammen med fyldig informasjon om de mange andre aspekter av tumor, inkludert funksjonelle mutasjoner, genekspresjonsprofiler, aktive trasé og genfusjoner, etc, noe som gjør spesielle PCR-analyser for MSI unødvendig .

i konklusjonen, er vår metode den første til å aktivere genom-wide karakterisering av MMRD status i menneskecelle gjennom integrering av high-throughput sekvensering av data. I samsvar med tidligere funn, har vi sett en betydelig økning av korte slettinger i MSI celler sammenlignet med MSS seg. Basert på denne observasjon viste vi at PI /PD-forhold (som vi også definerer som MSI-seq) kan brukes til å kvantifisere MSI status i begge cancercellelinjer og Primal tumorprøver fra pasienter, og har flere fordeler sammenlignet med tradisjonelle analyser. Derfor har vår metode potensial for å tjene som en ny diagnoseverktøy av genomisk instabilitet for ulike kreftprøvene.

Legg att eit svar