PLoS ONE: Integrert analyse av Whole Genome og transkriptom Sekvense avslører Diverse Transcriptomic Avvik drevet av Somatiske Genomisk Endringer i Liver Kreft

Abstract

Nyere studier som gjelder high-throughput sekvensering teknologi har identifisert flere recurrently muterte gener og stier i flere kreft genomer. Men transkripsjons konsekvenser fra disse genomiske forandringer i kreftgenomet fortsatt uklare. I denne studien utførte vi integrerte og komparative analyser av hele genomer og transcriptomes av 22 hepatitt B-virus (HBV) -relaterte hepatocellulært karsinom (HCCs) og deres matchede kontroller. Sammenligning av hele genomet sekvens (WGS) og RNA-Seq viste mye som tyder på at forskjellige typer av genomiske mutasjoner utløst diverse transkripsjonelle endringer. Ikke bare spleise-sete-mutasjoner, men også stille mutasjoner i kodende områder, dype intronic mutasjoner og strukturelle endringer forårsaket spleise avvik. HBV-integrasjoner generert ulike mønstre av virus-menneske fusion transkripsjoner avhengig berørte genet, for eksempel

TERT

,

CDK15

,

FN1 Hotell og

MLL4

. Strukturelle variasjoner kunne kjøre over-uttrykket av gener som Wnt ligander, med /uten å skape Genfusjonene. Videre, ved å ta hensyn til genomisk mutasjoner forårsaker transkripsjons avvik, kan vi forbedre følsomheten skadelige mutasjonsdeteksjon i kjente kreft driver gener (

TP53, AXIN1, ARID2, RPS6KA3

), og identifiserte gjentatte forstyrrelser i antatte kreft driver gener som

HNF4A

,

CPS1

,

TSC1 Hotell og

THRAP3

i HCCs. Disse funnene indikerer genomisk endringer i kreftgenomet har forskjellige transcriptomic effekter, og integrert analyse av WGS og RNA-Seq kan lette tolkingen av et stort antall genomiske forandringer påvist i kreftgenomet

Citation. Shiraishi Y, Fujimoto A, Furuta M, Tanaka H, ​​Chiba Ki, Boroevich KA, et al. (2014) Integrert analyse av Whole Genome og transkriptom Sekvense avslører Diverse Transcriptomic Avvik drevet av Somatiske Genomisk Endringer i Liver Kreft. PLoS ONE 9 (12): e114263. doi: 10,1371 /journal.pone.0114263

Redaktør: Chad Creighton, Baylor College of Medicine, USA

mottatt: 28. mai 2014; Godkjent: 05.11.2014; Publisert: 19.12.2014

Copyright: © 2014 Shiraishi et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet:. Den forfatterne bekrefter at alle data som underbygger funnene er fullt tilgjengelig uten restriksjoner. Somatisk mutasjon data ble avsatt til ICGC database (https://dcc.icgc.org/), som er fritt tilgjengelig. Sekvens rådatafiler av WGS og RNA-Seq har blitt deponert i Europa Genome-Phenome Arkiv under tilgangskode EGAD00001001035, og deres tilgang styres av ICGC DACO

Finansiering:. Midler til dette arbeidet kom fra Riken President fond 2011, prinsessen Takamatsu Cancer Research Fund, Takeda Science Foundation, i Grand-in Aid for Scientific Research på innovative områder (Integrative Systems Forståelse av kreft for avanserte diagnose, behandling og forebygging), og Grant-i-Aid for Unge Forskere ( B) 24700272. de bevilgende myndighet hadde noen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Hvert år, mer enn en halv million mennesker over hele verden er diagnostisert med leverkreft (HCC), den femte og syvende vanligste kreftformen hos menn og kvinner, henholdsvis [1]. I de fleste tilfeller HCCs utvikle følgende hepatitt eller cirrhose forårsaket av hepatitt B-virus (HBV) infeksjon, hepatitt C-infeksjon, alkoholisme, eller metabolske sykdommer, hvorav HBV er den mest viktig faktor, spesielt i Sør-Øst Asia og sør for Sahara Afrika [1]. Selv om ulike genetiske alter er påvist i HCCs, for eksempel mutasjoner av

TP53 Hotell og

CTNNB1

koding β-catenin [2], ytterligere detaljert karakterisering av leverkreft genom er nødvendig for å kunne identifisere biomarkører for personlig medisin og mer effektiv terapeutisk legemiddelutvikling.

Nylige fremskritt innen high-throughput sekvensering teknologi gjør oss omfattende påvisning av somatiske mutasjoner i kreft genomer [3] og high-throughput sekvensering av HCC genomer har avdekket flere roman kreft driver gener som kromatin regulatorer [4], [5] og tilbakevendende virusintegrasjoner på

TERT Hotell og

MLL4

loci [4], [6] – [8]. Nåværende genomiske studier i hovedsak fokusere på mutasjoner i kodende regioner, og andre typer mutasjoner som base erstatninger eller indels i ikke-kodende områder og strukturelle variasjoner (SVS) blir ignorert, siden deres innvirkning på kreftutvikling er vanskelig å evaluere og tolke så langt. En tilnærming for å vurdere deleteriousness av disse mutasjonene er å sjekke transkripsjons konsekvensene av disse genomiske forandringer. For dette formålet, bredere forståelse av forholdet mellom genomiske mutasjoner og transkripsjons avvik i kreftgenomet er nødvendig. Flere eksempler på spleise avvik [9], [10] og Genfusjonene [11] forårsaket av genomiske mutasjoner er kjent, og studier med siste high-throughput sekvense data identifiserte kreftspesifikke transkripsjons avvik i flere krefttyper [12], [13 ]. Men det er fremdeles få studier som systematisk sammenligne genomiske mutasjoner og transkripsjons avvik fra hele genomsekvensering (WGS) og transkriptom sekvensering (RNA-Seq) data. Som sådan, vi har fortsatt lite kunnskap på landskapet av kreft transkriptom og dets relasjoner med somatiske mutasjoner.

Tidligere har vi sekvensert og analysert WGS av 27 ulike typer leverkreft [4], men effektene av stor del av ulike somatiske mutasjoner, inkludert ikke-koding mutasjoner og SVs, var neppe å tolke kun ved hjelp av WGS data. Derfor, i denne studien, har vi lagt til flere WGS og tilhørende RNA-Seq data, helt fra 22 HBV-relatert HCC prøver, for å fastslå den genetiske forandringer sammen med sin transkripsjonen konsekvens. og vi utførte komparative og integrerte analyser av sine WGS og RNA-Seq data (se Fig. 1A for oversikt over studien). Først identifiserte vi en rekke somatiske genomisk hendelser, inkludert punktmutasjoner, korte indels, SVs og HBV-integrasjoner fra WGS data. Så, etter systematisk karakterisere kreftspesifikke transcriptomic avvik, for eksempel ulike typer spleise endringer (ekson hopper, spleise-site slips, pseudo-ekson inneslutninger og intron retentions, se Fig. 1B), Genfusjonene inkludert de som involverer HBV-sekvenser, over ekspresjon arrangementer og nukleotid endringer på RNA-nivå, undersøkte vi forholdet mellom oppdaget genomisk og transcriptomic endringer. Til slutt, som gir en profil av genomisk mutasjoner og transkripsjons avvik, diskuterer vi fordelene med integrert analyse av WGS og WTS for sensitiv påvisning av kreft driver gener.

(A) Først, vi har oppdaget ulike typer genomisk og transcriptomic endringer fra RNA-Seq data for 22 HCCs. De kjennetegnes endringer oppdages av hver analyse ble sammenlignet for å avdekke effektene av somatiske genomisk endringer på transcriptomic avvik. (B) De fire typer skjøte avvik som er definert i denne studien. Grønne linjer og piler indikerer normal transkripsjon mens røde linjer og piler indikerer avvik transkripsjoner.

Resultater

Somatiske hendelser oppdages av WGS

Vi hentet DNA fra 22 frosne HBV -relaterte HCC vev og deres matchet normale lymfocytter, og sekvensert hele sitt genom av massiv parallell sekvensering. Klinisk og patologisk informasjon er vist i tabell S1 i S1 fil. Gjennomsnittlige sekvense dypet av kreft og kontroll (lymfocytter) genomer var 36,8 x og 29.9x, henholdsvis, etter fjerning av PCR duplikasjoner (Tabell S2 S1 fil). Totalt ble 209,055 (3,597-19,063) somatiske erstatninger oppdaget (tabell S4 i S1 File). Blant dem, til 1096 missense, 32 sludder og 35 spleise-sete-mutasjoner i proteinkodende regioner, ble identifisert, hvor spleise-sete-mutasjoner ble definert å være de som påvirker spleiseakseptoren og donor områder som ligger på de to første og siste baser av et intron sekvens (essensielle spleise-sider). Av de 5,725 indels identifisert i hele genomer, 105 ble plassert i proteinkodende regioner og seks påvirket essensielle spleise-sider. De anslåtte driver genene i orden av statistisk signifikans for tilbakefall var

TP53

,

ARID2

,

BRD7

,

HNF4A Hotell og

RPS6KA3

(

P

-verdi 0,001, Tabell S5 i S1 File). I tillegg ble 2.254 SVs (15-577 per tumor) oppdaget, 1168 av som rammet kommenterte proteinkodende gener. Videre ble 86 (0-12 per tumor) HBV integrasjoner identifisert med 2 og 5 vendende integrasjoner på

TERT Hotell og

MLL4

loci, henholdsvis, som er konsistent med tidligere studier [4] [6], [7], [8].

Skjøte avvik relatert med genomisk mutasjoner

Totalt RNA hentet fra de frosne 22 HCCs og deres tilstøtende ikke-kreft leveren vev var underlagt RNA-Seq, og dens oppsummering er vist i tabell S3 i S1 File.

Først vi undersøkt status for transkripsjoner rundt viktige spleise-sete-mutasjoner ved manuelt å sjekke justeringer av sekvens leser. Etter eksklusjon utskrifter med ingen uttrykk, observerte vi en eller flere spleise avvik for 19 av de resterende 24 essensielle spleise-sete-mutasjoner (3 spleise-site slips, 6 ekson hopper, og 13 intron retentions, Figur S1 i S2 Fil, Table S6 i S1 File), noe som indikerer at de somatiske mutasjoner i viktige spleise-sider viste sterke effekter på spleise avvik som forventet. Berørte gener inkludert recurrently muterte gener fra WGS analyse (

TP53, ARID2, HNF4A Hotell og

RPS6KA3

) samt

AXIN1

.

For å få en omfattende liste av kreftspesifikke skjøting avvik, vi systematisk oppdaget fire typer spleise avvik (spleise-site slip, exon lift, pseudo-ekson inkludering og intron oppbevaring, fig. 1B) ved hjelp av internt utviklede algoritmer (se Materialer og Metoder ). Samlet, 292 spleising avvik hendelser (26 spleise-site slips, 41 ekson hopper, 77 pseudo-ekson inneslutninger og 148 intron retentions) ble påvist (tabell S7 i S1 File). Siden vi utførte ikke-retningsbestemt RNA-Seq, diskriminere mellom intron retensjon og cancer-spesifikk antisense-transkripsjon var vanskelig, og dermed resultater av intron retentions bør være nøye tolkes. Denne listen inkluderte aberrasjon hendelser som tilsvarer de 10 essensielle spleise-sider undersøkt ovenfor. PCR og Sanger-sekvensering validert 154 sterkt kreftspesifikke spleisehendelser ut av 239 detektert. For 72 hendelser, bekreftet vi målet spleise avvik for både kreft og ikke-kreft leveren vev.

I tillegg til grunnlegg spleise-sete-mutasjoner, vi identifisert ulike typer mutasjoner og korte indels som synes å være de direkte årsakene av de observerte spleise avvik, gjennom å endre redigerings avstander spleising donor eller akseptor motiver. Tre mutasjoner i nærheten exon-intron veikryss ( 10 bp), men ikke i den essensielle spleise-site forårsaket skjøting avvik (Fig 2A, B og C).. Tre mutasjoner i kodende områder, som trolig generert nye spleise-site donor motiver, forårsaket spleise-site slips (Fig. 2D, E og F). En mutasjon som påvirker

LAMB2

genet var synonymt. To pseudo-ekson inkludering hendelse påvirker

THRAP3 Hotell og

TSC1

syntes å være utløst av somatiske mutasjoner dypt i introner proksimalt for den nye spleising knutepunkt (Fig. 2G, og H). Videre syv ekson hopper, hvis berørte gener inkluderte flere tumorsuppressorgener som

IQGAP2

,

ST7 Hotell og

TP53

, hadde lange slettinger mellom koblingspunkter (Fig. 2I, J og K). I tillegg åtte intron retentions hadde rearrangements innenfor de tilsvarende introner, for eksempel

RB1 ​​plakater (Fig. 2L). De viser at ulike typer skjøte avvik blir ofte drevet av ikke bare viktige spleise-sete-mutasjoner, men også mutasjoner i kodende regioner, inkludert synonymt tause mutasjoner, dype intronic mutasjoner, og SVs. På den annen side, har en stor del av spleiseforstyrrelser (239/292 = 81,8%) ikke har nære mutasjoner (innenfor 1 kb) eller SVS (i løpet av 500 kb). Noen av disse er sannsynligvis syntes å være forårsaket av epigenetiske endringer [14], eller uttrykks endringer i anti-sense-transkripter som er nevnt ovenfor.

Exonic og intronic sekvenser er betegnet med store og små bokstaver, respektivt. Røde sekvenser er somatiske mutasjoner i HCCs. Blå og grønne tallene på siden av sekvenser er redigerings avstander fra spleising donor motiv (AG

Legg att eit svar