PLoS ONE: ChIP-seq Definert Genome-Wide Kart over TGFB /SMAD4 Targets: Konsekvenser med klinisk utfall av Ovarian Cancer

Abstract

Deregulering av transformerende vekstfaktor-β (TGFB) signalveien i epitelovarialcancer kreft har blitt rapportert, men den nøyaktige mekanismen bak forstyrret TGFB signalisering i sykdommen er fortsatt uklart. Vi utførte kromatin immunpresipitering fulgt av sekvensering (Chip-seq) for å undersøke genome-wide screening av TGFB-indusert SMAD4 bindende i epitelial eggstokkreft. Etter TGFB stimulering av A2780 ovarialcancer cellelinje, identifiseres vi 2,362 SMAD4 bindende loci og 318 forskjellig uttrykt SMAD4 målgener. Omfattende undersøkelse av SMAD4-bundet loci, avslørte fire distinkte bindende mønstre: 1) Basal; 2) Shift; 3) Stimulert bare; 4) Bare unstimulated. TGFB stimulert SMAD4-bundet loci ble hovedsakelig klassifisert som enten bare stimulert (74%) eller Shift (25%), noe som indikerer at TGFfi-stimulering endrer SMAD4 bindende mønstre i epitelceller eggstokkreft celler. Videre basert på gennettverk analyse, fant vi ut at det TGFfi-indusert, SMAD4 avhengig regulatoriske nettverk var påfallende forskjellig i eggstokkreft sammenlignet med normale celler. Viktigst, TGFfi /SMAD4 målgener identifisert i A2780 ovarialcancer cellelinje var prediktiv av pasientens overlevelse, basert på i silico gruvedrift av offentlig tilgjengelige pasientdatabaser. I konklusjonen, våre data fremheve nytten av neste generasjons sekvenseringsteknologi til å identifisere genom SMAD4 målgener i epitelial eggstokkreft og knytte avvik TGFB /SMAD aliserte til eggstokkene tumorigenesis. Videre identifiserte SMAD4 bindende loci, kombinert med genekspresjon profilering og i silico data mining av pasient kohorter, kan gi en kraftig tilnærming for å bestemme mulige gen signaturer med biologisk og fremtid translasjonsforskning i eggstokkene og andre kreftformer.

Citation: Kennedy BA, Deatherage DE, Gu F, Tang B, Chan MWY, Nephew KP, et al. (2011) ChIP-seq Definert Genome-Wide Kart over TGFB /SMAD4 Targets: Konsekvenser med klinisk utfall av eggstokkreft. PLoS ONE 6 (7): e22606. doi: 10,1371 /journal.pone.0022606

Redaktør: Patrick Tan, Duke-National University of Singapore Graduate Medical School, Singapore

mottatt: 22 februar 2011; Godkjent: 26 juni 2011; Publisert: 25.07.2011

Copyright: © 2011 Kennedy et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet med tilskudd fra National Institutes of Health U54CA113001, R01CA069065 og National Cancer Institute CA85289 og med midler fra Ohio State University Comprehensive Cancer Center og Ohio State University Biomedisinsk informatikk. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

transformerende vekstfaktor-β (TGFp) signalveien spiller en viktig rolle i å kontrollere proliferasjon, differensiering og andre cellulære prosesser, inkludert vekst av ovarial overflate epitelceller (OSE) [1], [2]. Feilregulering av TGFB signale hyppig observert i ovarialcancer (EOC), og kan være avgjørende for EOC utvikling [3], [4]. Effektene av TGFB formidles av tre TGFB ligander – TGFβ1, TGFβ2 og TGFβ3, virker gjennom TGFB type 1 og type 2-reseptorer [5] – [7]. TGFBR2 er den spesifikke reseptoren for TGFp ligander. Den funksjonelle reseptor-komplekset regulerer aktiveringen av nedstrøms Smad og uten Smad trasé [8]. De fosforylerte type 1 reseptor rekrutter og fosforylerer reseptor-regulert Smads R-Smads). Av de fem R-Smads hos pattedyr, aktiverer TGFBR2-ALK5 kompleks SMAD2 og SMAD3, mens TGFBR2-alk 1-komplekset aktiverer SMAD1, SMAD5 og SMAD8 [9]. Aktiverte R-Smads danner heteromere komplekser med den felles partner Smad (ko-Smad; SMAD4 i pattedyr) og translocate inn i kjernen [6]. Som affiniteten av den aktiverte Smad kompleks for den Smad-bindende element er utilstrekkelig til å understøtte assosiasjon med endogene promotere til målgener, må Smad komplekser assosiere med andre DNA-bindende transkripsjonsfaktorer for å regulere ekspresjonen [7]. Tallrike studier har vist at ulike familier av transkripsjonsfaktorer, som for eksempel gaffelhode, homeobox, sink finger, LEF1, Ets, og grunnleggende helix-loop-helix (bHLH) familier, kan tjene som SMAD4 partner proteiner for å oppnå høy affinitet og selektivitet for target promotorer med de nødvendige bindende elementer [10] -. [14]

A2780 humant ovarialcancer cellelinje som er følsom for cis-diamminedichloroplatinum (II) (cisplatin), en av de platina-type midler ( carbolatin eller cisplatin) som brukes i behandling av eggstokkreft. I tillegg til å tjene som en nyttig modell for å studere medikamentsensitiv sykdom, A2780-celler viser delvis TGFfi feilregulering, angitt med bare en beskjeden økning i SMAD4 ekspresjon og transduksjon av eksisterende SMAD4 fra cytoplasma til kjernen følgende TGFp stimulering [15]. Dermed er denne cellelinjen også en passende modellsystem for gjennomføring av genom-wide kartlegging av SMAD4 målgener og identifisere de deregulerte TGFB /SMAD4 målgener og trasé innblandet i eggstokkene kreftpasienter.

Nye sammenligninger av ChIP- seq (kromatin immunoprecipitation-sekvensering) for å arraybaserte tilnærminger tydelig demonstrert at chip seq teknologi ga høyere oppløsning, større dybde og bedre kartlegging nøyaktigheten av transkripsjon faktor bindende og histonmodifikasjonene på et genom-wide skala [16] – [18]. I denne studien har vi brukt chip seq teknologi for å studere TGFB /SMAD4 regulering i platina-sensitive A2780 eggstokkreft cellelinje. Vi profilert SMAD4 bindende loci følgende med TGFB stimulering. Ved hjelp av beregnings nærmer seg, har vi undersøkt SMAD4 bindende mønster og sammenlignet den med SMAD4 bindende mønster av både en vanlig foreviget eggstokkene overflaten epitheilial celle (IOSE) fra vår tidligere studie [12] og humane keratinocytter (HaCaT) fra Koinuma et al [11 ]. Videre genererte vi TGFfi /SMAD4 regulerte genet signaturer og utnyttet en

i silico

gruvedrift tilnærming for å korrelere de identifiserte signaturer med klinisk utfall data fra to offentlig tilgjengelige ovarian kreft pasient kohorter. Vår integrerende tilnærming viste signifikante assosiasjoner TGFB /SMAD4 regulatoriske nettverk med både progresjon og total overlevelse i eggstokkreft pasienter. Ved å identifisere tusenvis av SMAD4 bindende loci samt regulerte gener, våre data gir både en ny ressurs for å studere mekanismen bak feilregulert TGFB signalering i eggstokkreft celler samt potensielle prognostiske biomarkører for fremtidig eggstokkreft translasjonell forskning.

Resultater

Genome-Wide SMAD4 belegg definert av Chip-seq teknologi

Våre tidligere studier [12], [15], [19], [20] og andre [2], [ ,,,0],4], [21] – [23] har prøvd å etablere og karakterisere de molekylære mekanismene for feilregulert TGFB-mediert signalisering i eggstokkreft celler og ervervet cisplatin-resistent eggstokkreft celler. For ytterligere å belyse detaljer om de underliggende mekanismene, brukte vi ChIP-seq teknologi for å identifisere de genomiske steder bundet av SMAD4 i A2780 celler før og etter TGFB stimulering.

Ved hjelp av chip seq, alle prøvene var opprinnelig sekvensert for å generere et sett av rå leser (hver lese- har en lengde på 36 bp) fra Illumina /Solexa GAII system (tabell S1) som strekker seg fra ~43 millioner til ~51 million leser per prøve. Etter tilordning til UCSC Humant HG18 sammenstilling, et sett av ~26 millioner og millioner ~32 kartlagt leser med unike genomiske steder ble oppnådd for ikke-stimulerte A2780 og TGFp-stimulert A2780 respektivt. Vi deretter brukt vår topp-ringer deteksjon program, belte, [24], [25] (se Materialer og metoder) for å identifisere bindingen loci av SMAD4 i disse to forholdene. I korthet benytter beltet program en persentil scoring metode for å bestemme den anrikning terskelverdi for hver av de beste prosentiler fra alle bindende regioner, etterfulgt av identifisering av antall bindings loci på hvert nivå persentil. For å bestemme betydningen av hvert persentil, et sett av tilfeldig simulert lesninger benyttes som en bakgrunn for å estimere den falske funnraten (FDR). Våre Chip-seq data bekreftet flere SMAD4 bindende loci tidligere identifiserte i ulike vev og celletyper, inkludert Gadd45A, CTGF, JAG1, LEMD3 [14], MYC [26], EDN1, RYBP, DST, og BCAT1 [11].

basal belegg.

Vi identifiserte 2009 SMAD4 bindende loci i basal (unstimulated) tilstand i A2780 cellelinje (tabell S1). Vi fant ut at 1499 (74,6%) loci ble plassert innenfor +/- 100 kb av en kjent RefSeq genet [27]. Overraskende nok bare liten del (267 av 1499, 13,3%), var innenfor promoter-regionen (+/- 8 kb), av et gen, mens de fleste av binde loci var enten 10 kb oppstrøms for 5’TSS eller 10 kb nedstrøms 3 «TSS (figur 1A – rød linje). Dette objektiv hele genomet bredt plassering analyse antydet at mange andre tidligere genom-wide studier basert på arrangøren ChIP-chip-teknologi, [12], [28] kan kun identifisere undergrupper av SMAD4 målgener.

A [11] ) fordelingen av plasseringen av SMAD4 binding loci i et histogram plott basert på deres relative til en nærmeste kjente RefGene 5’TSS. B) Klassifisering av SMAD4 bindende loci i fire bindende mønstre. Stimulert bare bindende loci er de som er knyttet RefGene har bindende loci bare i stimulert sett, likeledes for unstimulated bare. Skift binding loci har en bindende loci som vises på det samme genet i begge betingelsene og de er større enn 1000 nt fra hverandre. Basal binding loci vises på samme genet i begge forhold, men de er mindre enn 1000 nt fra hverandre. C) En skjermdump som viser LRRC17 bindende mønster, der SMAD4 binder seg til 5’TSS av LRRC17 etter TGFfi stimulering, er kategorisert til stimulert bare bindende. D) Overflod av DNA etter SMAD4 ChIP trekker ned i forhold til DNA stede følgende trekke ned med ikke-spesifikt IgG antistoff som bestemmes av kvantitativ syber grønt PCR. U og S brukes til å representere unstimulated og stimulert bindende regioner i SLC40A1 hhv. * Representerer en t-test p-verdi på mindre enn 0,05 og betegner betydelig berikelse i forhold til IgG kontroll.

TGFB stimulert binding.

Ved stimulering med TGFfi, 2362 SMAD4 bindende loci ble identifisert (tabell S1). Samlet, fordeling av plasseringen av SMAD4 bindende loci etter TGFB stimulering er svært lik den før stimulering (Figur 1A – svart linje for stimulert og rød linje for unstimulated). Imidlertid bindingsmønsteret mellom to tilstander (før og etter stimulering TGFp) er dramatisk forskjellig (figur 1B). Vi først fjernet disse bindings loci ligger langt borte fra alle kjente RefSeq gener (+/- 100 kb) og deretter klassifisert dem (1723 loci for stimulert og 1499 loci for unstimulated) i fire ulike bindingsmønstre: 1) Basal Binding – to bindende loci er forbundet med samme gen og innenfor en kb avstand fra hverandre (dvs. uforandret binding); 2) Skift Binding – to bindings loci er forbundet med samme genet i begge forhold, men de er mer enn 1 kb fra hverandre; 3) Stimulert bare bindende – en bindende loci forbundet med et gen bare i stimulert tilstand; 4) ustimulert bare Binding – en binding loci forbundet med et gen bare i den ikke-stimulert tilstand. Basert på ovennevnte klassifisering, fant vi ut at 74,2% (1279 av 1723) og 73,5% (1102 av 1499) av bindings loci var i stimulert henholdsvis bare bindende og Ustimulerte bare bindende kategorier. Mens 24,8% (429 av 1723) og 25,5 (382 av 1499) bindende loci ble klassifisert i den Shift Binding kategori for stimulert og unstimulated tilstand henholdsvis bare 15 binding loci i hver tilstand (0,9% og 1,0% henholdsvis) falt i Basal Binding kategorien. Våre genomiske kartlegging Resultatene viste at TGFB stimulering av eggstokkreft celler kan endre landskapet av SMAD4 bindende mønstre. En komplett liste over klassifiserte bindingsmønstre er vist i Tabell S2.

Videre, for å verifisere at TGFB stimulering resulterte i bindende endringer vi observert i chip-seq data, valgte vi tilfeldig et sett med 22 mål identifisert ved vår analyse og utført chip qPCR ved hjelp av DNA isolert fra en immunoutfelling som var forskjellig fra det DNA som anvendes til spon-seq. Våre chip qPCR valideringer ikke bare bekreftet målene identifisert i chip-seq data, men også videre vist at det aktiverte eksogene TGFB signalering er i stand til å produsere drastiske endringer i SMAD4 bindende mønstre (figur 1C, 1D og figurene S1A, B).

Regulering av TGFB stimulert SMAD4 mål genuttrykk i A2780

Deretter utførte vi genekspresjon mikromatriser å bestemme uttrykket status for SMAD4 målgener etter TGFB stimulering. A2780 mRNA fra tre uavhengige biologiske replikater av både før og etter 3 timer med TGFB stimulering ble utarbeidet og analysert på Affymetrix U133 Plus 2 Platform. Total, 3,191 gener ble identifisert til å være vesentlig opp- eller ned-reguleres etter TGFp stimulering med minst 0,5 log2-gangers forandring i ekspresjon og p-verdi på mindre enn 0,1 (figur 2A). Etter å ha undersøkt sammenhengen med 1,443 TGFB stimulert SMAD4 målgener (tilsvarende 1723 SMAD4 bindende loci i stimulert tilstand), et flertall (2873 av 3191) av gener med differensial uttrykk i A2780 raskende manglet SMAD4 bindende loci, hvor 318 gener hadde på minst en SMAD4 binding loci og viste i det minste en 0,5 log2 gangers uttrykk forandring etter 3 timer med TGFp stimulering (figur 2B). Detaljer om 3,191 vesentlig forskjellig uttrykt gener finnes i tabell S4 og 318 gener i tabell S5.

A) En heatmap av uttrykket fold endringer for gener mellom unstimulated og TGFfi stimulert tilstand, viser tre gruppe av gener , oppregulert, ingen endring, og nedregulert. Opp og ned regulerte gener er definert som å ha en log2 ganger endring som er større enn 0,5 eller mindre enn -0,5 respektivt. B) En sammenligning mellom gener med SMAD4 bindende loci (1443) i TGFB stimulert tilstand med alle genene som viser differensial uttrykk (3193), som viser tre ulike grupper, de med differensial uttrykk og ingen SMAD4 bindende loci, de uten differensial uttrykk og en SMAD4 bindende loci og de med begge deler. C) GÅ merknader for de tre ulike gruppe gener som viser i Venn-diagram (B). D) RNA-ekspresjon nivå som bestemmes av QRT-PCR i forhold til GAPDH-ekspresjonsnivåer. Forsøk ble utført i biologisk triplo. * Representerer en t-test p-verdi på mindre enn 0,05 og betegner betydelig forskjell i uttrykk mellom ustimulerte og stimulerte forhold.

Gene ontologi analyse viste at differensielt uttrykte gener med SMAD4 bindende loci ble betydelig beriket for gener som er involvert med celle del morphogenesis og utviklings proteiner (Figur 2C-Gene Loci), i tråd med tidligere studier i ulike celletyper [12], [36]. Vi fant også at SMAD4 bindende tilhørende genene mangler differensial uttrykk ble beriket for gener med EGF-lignende domene og polymorfisme som tyder på at ulike signalveier kan megle SMAD4 funksjoner andre enn TGFB signalering (bare figur 2C-Loci), mens den stort sett med forskjellig uttrykt gener som mangler SMAD4 bindende loci var involvert i immunforsvaret og protein ekstracellulære matrise. Etter å ha gransket en mer begrensning p-verdi på 0,05 og brett endring på 0,5 for TGFB stimulerte forskjellig uttrykt gener, fikk vi et sett av 1763 gener. Av disse genene, har vi funnet 184 (10,4%) gener for å ha minst en TGFp stimulert SMAD4 bindingssete (Tabell S6). Denne prosentandelen er svært lik den av datasettet som 318 (10%) av 3191 differensielt uttrykte gener har minst en TGFp stimulert SMAD4 bindingssete (Tabell S5). GO funksjonsanalyse var også svært like i øverste kategoriene (Figur S2). For ytterligere å bekrefte differensial uttrykt SMAD4 målrettede gener som følge av TGFfi stimulering, vi tilfeldig valgte et sett med 18 mål identifisert ved vår analyse og utført en RT-qPCR. Mer enn 70% (13 av 18) gener ble bekreftet ved RT-qPCR som vist i Figur 2D og fig S3. En liste over utformet primere er vist i tabell S7.

SMAD4 avhengig gennettverk i TGFB-indusert eggstokkreft celler

Vår tidligere studie [12] og en studie fra Koinuma et al [ ,,,0],11] har identifisert et sett med 150 TGFp stimulert SMAD4 målgener i IOSE (en udødeliggjort ovarie overflate epitelisk cellelinje) og et sett av 92 TGFp stimulert SMAD4 målgener i HaCaT (en udødeliggjort keratinocytt-cellelinje). Det var ikke overraskende å finne begrenset overlapping av bare seks av 150 i IOSE, 6 av 92 i HaCaT, og en for alle tre studier i likhet med de 318 SMAD4 målgener i denne undersøkelsen (figur 3A) som bare en, A2780, er en kreftcellelinje og de to andre er normale cellelinjer. En annen mulighet for slike lave overlapp prisene er at det kan være på grunn av den begrensede mål identifisert ved hjelp av arrangøren utvalg (Chip-promoter-chip). GÅ analyse [29] viste også målgener i HaCaT og IOSE var primært involvert i regulering av celleproliferasjon (eller anti-apoptose) og utviklingsprosess (muskel utvikling), som var forskjellig fra målgener i A2780 (figur 3B).

A) En Venn-diagram viser sammenligning av TGFB /SMAD4 målgener i tre forskjellige celletyper. B) GÅ merknader for de unike gener for hver celletype.

For ytterligere å sammenligne forskjellen på TGFB stimulert SMAD4 avhengig genet forskrifter mellom disse tre celletyper, søkte vi en beregnings analytisk tilnærming vi tidligere utviklet [30] for å bygge SMAD4-avhengige regulerte nettverk i HaCaT, IOSE, og A2780, henholdsvis (figur 4). Kort, vår beregnings analytisk tilnærming i gang med chip baserte datasett og genuttrykk data. Hver SMAD4 bindende loci wa tilpasset kjent en RefSeq genet ID som ble deretter undersøkes for differensial genuttrykk. Et sett av differensielt uttrykte SMAD4 målgener etter TGFp stimulering ble videre brukt for å finne den mest signifikante transkripsjonsfaktor (TF) bindingspartnere ved ChIPMotifs [31] eller ChIPModudles [32], som ble brukt som Hub TFS. Hub TF-genet forbindelse ble bestemt ved å skanne Hub TFS «PWMs i alle bindings loci og en permutasjon test ble anvendt for å teste påliteligheten av hver forbindelse av nettverket. Det resulterte regulatoriske nettverk ble visualisert ved Cytoscape [33].

Vi identifiserte seks Hub TFS, GFI1, NR3C1, SOX17, STAT4, ZNF354C, og TCF8 fra 318 SMAD4 avhengige målgener i A2780 celler, mens fire Hub TFS, LEF1 (TCF), ELK1, COUPTF (NR2F5), og E2F, ble identifisert i IOSE celler ved vår tidligere studie ved hjelp av en lignende tilnærming (CART-modell) [12]. Vår beregnings analytisk tilnærming også identifisert tre Hub TFS, E2F1, SP1, og USF, for 92 SMAD4 avhengige målgener i HaCaT celler, som var svært lik den TF motivene identifisert fra Koinuma et al. studie [11]. Den øverste motiv rapporterte i sin studie, AP1, var savnet i våre resultater på grunn av bruk av en avansert klassifisering algoritme i våre ChIPModules [32] og være i stand til å eliminere disse TF motiver som også beriket i tilfeldige sett. Interessant, fant vi også en Hub TF E2F (E2F1) var felles mellom de to normale celler, men som ikke er felles med A2780 celler. Sammen med GO funksjonsanalyse, resultatene indikerte at E2F kan fungere som en stor SMAD4 co-transkripsjonsfaktor partner i formidling celleproliferasjon i normale celler, men tapte i carcinoma celler. De resulterende gennettverk (GRN) for alle tre cellene er vist i figur 4. Samlet sterkt indikerer vår gennettverk analyse som TGFB stimulerer en annen SMAD4 avhengig reguleringsmekanisme i eggstokkreft celler i forhold til normale celler, dvs. den SMAD4 regulering nettverk har blitt «rewired» i eggstokkreft celler.

Gene signaturer av utvalg og klinisk utfall

En av de lovende potensielle anvendelser av genom-wide «omics studier med cellelinjesystemer er identifikasjon av genet signaturer som kan gi bedre prognostisk informasjon sammenlignet med standard kliniske og patologiske parametere [34], [35]. For å løse forholdet mellom TGFB stimulert SMAD4 avhengig målgener og kliniske resultatet av eggstokkreft kreftpasienter, undersøkte vi de 307 målgener identifisert i A2780 celler i denne studien, som ikke ble identifisert i tidligere studier av normale celler, i to forskjellige kliniske eggstokkreft kreft kohortstudier som hadde rapportert overlevelsesdata [36], [37]. Vi først klassifisert pasientene inn i ulike undergrupper, basert på deres gen signaturer, og deretter korrelert dataene med pasienten overlevelse informasjon. I gruvedrift 153 pasientmateriale fra Bild et al [36], var vi i stand til å bruke 187 av 307 gener identifisert i genuttrykk datasettet for å bruke den hierarkiske clustering metoden med distansebaserte tiltak fra en prøve-og-feile-perspektiv og klassifisere genene inn i fire genet grupper (figur 5A). For hver av de fire gruppene genet, vi gruppert videre de 153 prøvene i fire pasientgrupper (s, figur 5B), og korrelert til PG-er med deres overlevelse informasjon. Av 153 pasienter, bare 124 har full overlevelse informasjon, og dermed ble videre brukt for å overleve kurve plott. Vi fant ut at en signatur av en undergruppe av 49 gener (G2 gen gruppe) som var i stand til å forutsi en betydelig overlevelse korrelasjon for 62 av pasientene med en p-verdi på 0,0471 (figur 5C, D). Spesifikt PG: 4 (25 pasienter) viste dårlig median overlevelse på 31 måneder sammenlignet med PG: 3 (37 pasienter), med en median overlevelse på 63 måneder. En overlevelseskurve tomt for to pasientgrupper, PG: 3 og PG: 4 ved hjelp av en tilfeldig valgt 49 gener (der de ikke er innen 49 G2 gener) viste en log-rank test p-verdi på 0,1558 (figur 5E). På grunn av begrenset patologisk informasjon tilgjengelig for denne pasient årsklasse, var vi ikke i stand til å betydelig relatere våre gen signaturer med andre kliniske utfall. Men en særlig høy andel av trinn IV pasienter gruppert i Pg3 mens alle scene IC og to scene IIC pasienter gruppert i PG4, til tross for et tilsvarende antall av trinn IIIC pasienter i hver (tabell S8), kanskje indikerer at TGFp /SMAD4 regulerte gener kunne være potensielt brukes til å klassifisere en subtype av ovarian kreftpasienter.

A) Den hierarkiske clustering resultat av de 187 gener i fire genet grupper, nemlig G1, G2, G3 og G4. Den vertikale aksen representerer de gensamlingene (187 gener) og den horisontale aksen står for ulike sampler (153 pasienter). B) Den hierarkiske clustering resultat av de 153 pasientene i fire pasientgrupper, nemlig PG: 1, PG: 2, PG: 3 og PG: 4 ved hjelp av G2-gruppen av 49 gener. C) Survival kurve tomt for G2 genet gruppen. Den horisontale aksen representerer overlevelses måneder og den vertikale til den prosentvise overlevelse (%) i den tilsvarende pasientgruppen. Totalt fire pasientgrupper, dvs. PG: 1, PG: 2, PG: 3 og PG: 4 analyseres for G2-genet gruppe. D) En detaljert overlevelse kurve tomt for to pasientgrupper, PG: 3 og PG: 4, som viser en betydelig log-rank test p-verdi på 0.0471.E) En overlevelseskurve tomt for to pasientgrupper, PG: 3 og PG: 4 ved hjelp av en tilfeldig utvalgte 49 gener (der de ikke er innen 49 G2 gener) som viser log-rank test p-verdi er 0,1558.

Når vi brukt den samme

i silico

gruvedrift tilnærming til andre pasientmateriale fra Lu et al [37], (som består av 42 pasienter og 5 normale mennesker), viste resultatene at et gen signaturen til 19 av de 307 genene spådd bedre overlevelse for PG4 og Normals enn andre PG med en p-verdi på 0,0078 (figur S4).

Diskusjoner

Vi har for første gang brukt chip seq teknologi til hel-genom-wide kartlegging av TGFfi stimulert, SMAD4- uselvstendige regulerte gener i en ovarial cancer cellelinje (A2780). Våre data viser at i forhold til basal tilstand (uten TGFfi stimulering), et flertall av SMAD4 binding loci er enten nylig bundet til kromatin (74,2%) eller forskjøvet bundet (24,8%) ved TGFfi stimulering, noe som tyder på TGFp stimulerte kreftceller kan endre landskapet SMAD4 bindende mønstre. Videre vår GO analyse viste slående likheter mellom de 10 beste GO kategorier for 1,443 og 1,316 SMAD4 målgener i stimulert og Ustimulerte forhold (data ikke vist). Imidlertid 318 differensielt uttrykte gener, som inneholder minst en stimulert SMAD4 binding loci, var signifikant anriket til mer spesifikke GO betingelser, for eksempel celle del morfogenese og utviklings proteiner. Dette resultatet indikerer at SMAD4 kan regulere en meget bestemt sett av målgener i respons til TGFfi signalering, for å lette spesifikke funksjoner i den celletypen gjennom denne spesifikke signalveien. Faktisk, GO analyse for SMAD4 målgener uten genuttrykk nivå endringer etter TGFB stimulering funnet en av de beriket genet kategoriene er «EGF som signaliserer «, som gir ytterligere bevis for at andre signalveier kan modulere SMAD4 avhengige regulerte gener i eggstokkreft. Et slikt eksempel kan være benmorfogene proteiner (BMPs), som også er oppstrøms for SMAD4 og kan således være i stand til å regulere noen av disse SMAD4 målgener. BMP har vist seg å være viktige regulatorer av ovarial fysiologi og er involvert i eggstokkreft utvikling og andre kreftformer [38] – [40]. I fremtidige studier bidraget fra hver signalveier regulering av de identifiserte SMAD4 målgener vil forsøke å bli disambiguated

I likhet med andre funn for transkripsjonsfaktorer, inkludert østrogen reseptor alfa (ERα) [41] -. [43 ], androgenreseptoren (AR) [44], og peroksisom proliferator-aktivert reseptor (PPAR) [45], ble det observert at et flertall (mer enn 70%) av SMAD4 binding geometriske steder som ligger mer enn 8 kb bort fra 5’TSS av en kjent RefSeq genet. Dette kan tyde på at TGFB bindende loci komme i umiddelbar nærhet til arrangøren gjennom kromosomet looping på TGFB stimulering. Interessant, vår

de novo

motiv analyse identifiserte også en SMAD lignende motiv i et sett av 5-distal binding loci, men ikke i et sett med 5′-promoteren loci (data ikke vist). Vår genom-wide plassering analyse peikt også viktigheten av hele-genom-wide sekvensering teknologier, som vi viste mange bindende loci er langt borte fra 5’TSS av en kjent gen og derfor en promoter-array-teknologi kan gå glipp av mange mål bindende loci av en transkripsjonsfaktor. Våre fremtidige studier vil fokusere på å gjennomføre ChIP-3C-qPCR for å bekrefte om disse distal bindende loci er faktisk knyttet til disse genene, potensielt avdekke den underliggende mekanismen for TGFB /SMAD4 mediert genregulering.

En viktig del av denne studien er bruken av

i silico

gruvedrift av offentlig tilgjengelige pasientgruppedata for å identifisere en undergruppe av TGFB /SMAD4 målgener som et gen signatur for å forutsi klinisk (overlevelse) utfall. Så vidt vi vet, er dette den første studien som forsøker å bruke TGFB signale responsive SMAD4 regulerte gener for å klassifisere eggstokkreft pasienter i ulike sub-typer pasientgrupper, samt forutsi dårlig overlevelse fra gode overlevelses populasjoner med statistisk signifikans (Figur 5). Dermed kombinerer ChIP-seq identifisert bindende loci, genekspresjon profilering, og en

i silico

gruvedrift av pasient kohorter kan gi en kraftig tilnærming for å identifisere potensielle gen signaturer med biologisk og klinisk betydning.

som konklusjon, vår studie gir den første omfattende genom-wide kart over tusener av TGFp /SMAD4 mål i en ovarial cancer cellelinje, som videre kan brukes til å studere SMAD4 funksjoner i tumorgenese. Så vidt vi vet, er dette den første studien for å koble TGFB /SMAD4 regulerte gener til klinisk informasjon om eggstokkreft pasient overlevelse og identifisere potensielle gen signaturer for prognosen i eggstokkreft. I våre fremtidige studier, vil vi gjennomføre ChIP-seq analyse av TGFB /SMAD4 bindingssteder ved hjelp av et panel av eggstokkreft cellelinjer som representerer ulike histologiske subtyper og eggstokkreft initiere celler.

Materialer og metoder

Cellekultur kultur~~POS=HEADCOMP og TGFp stimulering

A2780-celler [15] ble dyrket i RPMI 1640 (Invitrogen, Carlsbad, CA) tilsatt 10% føtalt bovint serum i en 37 ° 5% CO

2 inkubator. Før TGFfi stimulering ble cellene splittet ved ~70% konfluens og inspisert daglig. For chip, ble 80% konfluente celler optimalt stimulert med 10 ng /ml rekombinant TGFβ1 (Sigma, St. Louis, MO) i 1 time før formaldehyd tverrbinding mens ekspresjon analyse ble utført etter 3 timers stimulering med 10 ng /ml TGFβ1.

Chromatin immunoprecipitation og massiv parallell sekvense

Chromatin immunoprecipitation (chip) ble utført som tidligere beskrevet [46], [47] med noen kommentarer verdige endringer. I korthet ble cellene renset med PBS romtemperatur før den ble tverrbundet i en 1% formaldehyd-oppløsning. Cellene ble deretter høstet og homogenisert i nærvær av proteaseinhibitorer før DNA ble sonikert. Magnetiske Dynal perler (Invitrogen) kombinert med en blanding av antistoffer (20% SMAD4 # 9515 (Cell Signaling Technology, Danvers, MA) og 80% SMAD4 DCS-46 (Santa Cruz Biotechnology, Santa Cruz, CA) ble brukt til å trekke ned SMAD4 over natten. Renset DNA ble brukt til å oppdage fold berikelse av Syber Grønn QRT-PCR se tabell S3 for en liste over primere.

sekvense~~POS=TRUNC bibliotekene ble generert for massiv parallell sekvensering ved hjelp av standard metoder. Kort, 500 ng av nedtrekk DNA ble underkastet ende reparasjon, terminal adenylation, og adapterligering før fragmenter som strekker seg fra ~175-250 ble isolert fra en 2% E-gel (Invitrogen). Etter en standardisert 12 syklus PCR, ble DNA-kvalitet bedømt på en DNA-1000 Bioanalyzer . chip (Agilent Technologies, Santa Clara, CA) før de blir presentert for sekvensering på en Illumina GAII All chIP-seq data avsettes i Gene Expression Omnibus (GEO) database ved National Center for Biotechnology Information (http: //www.ncbi .nlm.nih.gov /geo) og er tiltredelse antall GSE27526.

Gene expression profilering

Total RNA ble ekstrahert fra celler ved hjelp Trizol (Invitrogen) for microrarray analyse på Affymetrix HGU133 Plus 2

Legg att eit svar