PLoS ONE: Genetisk variasjon og Antioxidant Response Gene Expression i bronkial luftveisepitelet av Røykere i fare for Lung Cancer

Abstract

Tidligere microarray studier av røykere med høy risiko for lungekreft har vist at heterogenitet i bronkial luftveis epitelcelledifferensiering genuttrykk respons til røyking kan tjene som en tidlig diagnostisk biomarkør for lungekreft. Som et første skritt i å anvende funksjonell genomikk analyse til befolkningsstudier, har vi undersøkt sammenhengen mellom genuttrykk variasjon og genetisk variasjon i en sentral molekylær sti (NRF2-mediert antioksidant respons) forbundet med røyking eksponering og lungekreft. Vi vurderte global genekspresjon i histologisk normale luftveis-epitelceller oppnådd ved bronkoskopi fra røykere som utviklet lungekreft (SC, n = 20), røykere uten lungekreft (SNC, n = 24), og aldri røykere (NS, n = 8) . Funksjonell anrikning analyse viste at NRF2-mediert, antioksydant responselement (ER) -regulated gener, var signifikant lavere i SC, sammenlignet med ekspresjonsnivåene i SNC. Viktigere, fant vi at uttrykket av MAFG (en bindende partner av NRF2) ble korrelert med uttrykk for er gener, noe som tyder MAFG nivåer kan begrense målgenet induksjon. Bioinformatically vi identifiserte enkeltnukleotidpolymorfi (SNPs) i antatte ER gener og å teste virkningen av genetisk variasjon, vi genotypet disse mulige regulatoriske SNPs og andre tag SNPs i utvalgte NRF2 sti gener. Sekvense MAFG locus, identifiserte vi 30 nye SNPs og to ble assosiert med enten genekspresjon eller lungekreft status blant røykere. Dette arbeidet viser en analyse tilnærming som integrerer bioinformatikk bane og transkripsjonsfaktor bindingssete analyse med genotype, genekspresjon og sykdomsstatus for å identifisere SNP’er som kan være forbundet med individuelle forskjeller i genekspresjon og /eller kreft status hos røykere. Disse polymorfismer kan til slutt bidra til lungekreft via sin effekt på luftveis genuttrykk respons på tobakksrøyk eksponering

Citation. Wang X, Chorley BN, Pittman GS, Kleeberger SR, Brothers J II, Liu G , et al. (2010) genetisk variasjon og Antioxidant Response Gene Expression i bronkial luftveisepitelet av Røykere i fare for lungekreft. PLoS ONE 5 (8): e11934. doi: 10,1371 /journal.pone.0011934

Redaktør: Oliver Eickelberg, Helmholtz Zentrum München /Ludwig-Maximilians-universitetet München, Tyskland

mottatt: 23 februar 2010; Godkjent: 06.05.2010; Publisert: 03.08.2010

Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Public Domain erklæring som fastslår at en gang plassert i det offentlige rom, dette arbeidet kan fritt kopieres, distribueres, overføres, endres, bygd på, eller brukes av alle for ethvert lovlig formål

Finansiering:. de bevilgende myndighet hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet. Dette arbeidet ble finansiert av egenutført Research Program av National Institute of Environmental Health Sciences, National Institutes of Health (Z01 ES100475) og tilskudd til Avrum Spira fra National Institute of Health (U01ES016035, R01CA124640).

Konkurrerer interesser: forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Om lag 1,3 milliarder mennesker røyker sigaretter på verdensbasis, noe som bidrar til nesten 5 millioner forebygges dødsfall per år [1].. Røyking er en betydelig risikofaktor for lungekreft, den ledende årsak til kreft-relaterte dødsfall i USA, og kronisk obstruktiv lungesykdom, den fjerde største dødsårsaken samlet [2]. Selv med den høye tilskrives risiko på grunn av sigarettrøyk påvirkning bare 10-15% av alle røykere utvikle lungekreft [3], kan antyder genetisk variasjon spille en rolle i mottakelighet for lungekreft. Mangel på kunnskap om genetiske grunnlaget for lungekreft hindrer nøyaktig anslag av røykere med høyest risiko. Men raske fremskritt innen high-throughput genomikk teknikker, spesielt genuttrykk profilering og enkeltnukleotidpolymorfi (SNP) genotyping, lovende for å karakterisere risiko. Forstå hvordan genetisk variasjon påvirker røyking-indusert genekspresjon i lungene og luftveiene kunne avsløre resistensfaktorer.

Tidligere studier har vist at sigarettrøyk eksponering skaper en «felt av skade» i luftveis epitelceller (anmeldt i [4 ]). Spira

et al product: [5] har målt hel-genom genuttrykk profiler i epiteliale celle brushings samlet på bronkoskopi fra mainstem bronkie av friske røykere og aldri-røykere ,. Smoking-indusert genekspresjon ble observert for gener som er involvert i reguleringen av oksidant stress, xenobiotisk metabolisme, og onkogenese, mens gener som er involvert i betennelse og tumor undertrykkelse trasé ble nedregulert. Nylig, ved hjelp av en lignende tilnærming, ble en 80-genet biomarkør utviklet for å hjelpe diagnostisere personer med lungekreft blant en gruppe av røykere har en bronchoscopy grunn av mistanke om lungekreft [6], [7]. Profiler av histologisk normale store luftveis epitelceller oppnådd ved bronkoskopi ble effektivt brukt som en tidlig diagnose av lungekreft biomarkør, med en nøyaktighet på 83%. Disse observasjonene viser luftveis gen-uttrykk forskjeller mellom individer i respons til røyking, men ikke peke på de molekylære mekanismene som bidrar til heterogenitet i dette genet utfoldelse respons.

Menneskelig genetisk variasjon i responsen på miljøeksponering er generelt akseptert som en viktig determinant i mottakelighet for kreft [8]. Imidlertid er et utfordrende problem i assosiasjonsstudier tolke hvis statistisk bevis for genotype-fenotype /sykdom sammenheng er biologisk plausibel. Ofte forholdet mellom spesifikke enkeltnukleotidpolymorfi (SNPs) og gen-ekspresjon eller aktivitet har vært vanskelig å studere

in vivo

. Undersøke SNPs i transkripsjonsfaktor stier og spesielt, i transkripsjonsfaktorbindingsseter, i forhold til genekspresjon er en tilnærming som kan gi funksjonell informasjon [9]. Nylig,

cis

-acting regulatoriske SNPs ha blitt oppdaget ved hjelp av en regional forening tilnærming [10], [11]. For bedre å forstå disse funksjonelle relasjoner som bidrar til

in vivo

forskjeller i genuttrykk og muligens til kreft mottakelighet lunge, har vi brukt en tredelt tilnærming for å teste sammenhengen mellom: (1) genekspresjon og lungekreft status (2) SNP genotype og genuttrykk, og (3) SNP genotype og lungekreft status.

Bruke tilnærming beskrevet av Spira

et al product: [7], vi vurdert global genekspresjon i cytologisk normale luftveier epitelceller oppnådd ved bronkoskopi fra røykere med mistanke om lungekreft og fra en kontroll gruppe som aldri har røykt. Vi identifiserte at antioksidant respons veien reguleres av transkripsjonsfaktoren NRF2 (nukleær faktor erytropoide-avledet to lignende to, eller NFE2L2) skilte seg blant disse grupper av fag. Vi fant at uttrykket av MAFG (en bindende partner av NRF2) ble korrelert med uttrykk for NRF2 sti gener. Vi brukte bioinformatikk strategier for å identifisere mulige regulatoriske SNPs i NRF2 bindingsseter [9], [12], [13] og for å velge tag SNPs for NRF2-mediert gener. I tillegg sekvensert vi MAFG locus i våre forsøkspersonene. Genuttrykk, genotype og lungekreft status ble integrert og sammenlignet, og vi identifisert SNPs som var knyttet til individuelle forskjeller i genuttrykk og /eller kreft status.

Resultater

Sigarettrøyking, lungekreft og bronkial luftveis transkriptomet

med sikte på å identifisere mulige funksjonelle SNPs og /eller haplotyper i antioksidant respons pathways forbundet med røyking-indusert lungekreft, brukte vi en tredelt tilnærming for å analysere sammenhenger mellom: 1) genekspresjon og lungekreft status; 2) genekspresjon og genotype av SNP er valgt av flere bioinformatikkdataene strategier, og 3) SNP genotyper og lungekreft status. Den totale arbeidsflyten i vår tilnærming er skissert i figur 1.

(A) Vi vurderte microarray genuttrykk profiler av histologisk normale luftveier epitelceller oppnådd ved bronkoskopi fra røykere med mistanke om lungekreft og fra en kontrollgruppe på aldri røykere. (B) Vi identifiserte at antioksidant respons veien reguleres av transkripsjonsfaktoren NRF2 skilte seg blant disse grupper av fag. Vi fant at uttrykket av MAFG (en bindende partner av NRF2) ble korrelert med uttrykk for NRF2 sti gener. (C) Bioinformatikk strategier ble brukt til å identifisere mulige regulatoriske SNPs i NRF2 bindingsseter og for å velge merking SNPs for NRF2-mediert gener. (D) MAFG locus ble sekvensert i våre forsøkspersonene. Vi identifiserte SNPs som var knyttet til individuelle forskjeller i: (E) genekspresjon og /eller (F) kreft status ved å integrere genekspresjon, genotype og lungekreft status

bronkial luftveis epitelceller ble innhentet. av fleksibel bronkoskopi fra 8 friske aldri-røykere (NS) og fra røykere som deltok i en diagnostisk undersøkelse for klinisk mistanke om lungekreft inkludert 20 røykere med lungekreft (SC), og 24 røykere uten lungekreft (SNC) (tabell 1). Disse fagene var en undergruppe to større genuttrykk prosjekter [5], [7] for hvem vi kan hente tilstrekkelig genomisk DNA for genotyping. Expression data for 31 emner fra disse prosjektene [5], [7] og data for ytterligere 21 nyrekrutterte pasienter ble brukt. Bruke Affymetrix HG-U133A mikromatriser, fant vi 11285 probe-sett uttrykt ved målbare nivåer (deteksjon p-verdi = 0,05 i minst 20% av individer i en av SC, SNC, eller NS), som tilsvarte 8159 protein- koding RefSeq gener basert på Affymetrix merknad (HG-U133A.na28.annot.csv, mars 2009).

for å undersøke differensial svar på effekten av røyking på bronkial luftveis transkriptomet, brukte vi profiler fra aldri-røykere som baseline og sammenlignet den gjennomsnittlige log2-uttrykk verdier av SC eller SNC med at av NS av t-test, etterfulgt av flere tester korreksjon (Benjamini-Hochberg falske funnrate, FDR [14]). Sammenlignet med aldri-røykere, fant vi dette uttrykket (FDR 0,1) for 846 probe-sett (774 gener) hos røykere uten kreft, og 919 probe-sett (834 gener) hos røykere med kreft. Vi neste klassifisert røyking avhengig gener i over-uttrykt (endring 1.2) og under-uttrykt (endring 0,8) gener. Hos røykere uten kreft, var det 210 probe-sett over-uttrykt og 628 probe-sett under-uttrykk; hos røykere med kreft, var det 263 probe-sett over-uttrykt og 644 probe-sett under-uttrykt, sammenlignet med de som aldri-røykere. Listen over probe-settene, gjennomsnittlig log

2-uttrykk verdier, og statistiske verdier er inkludert i saksdokumenter S1.

Funksjonell berikelse analyse av røyking påvirket genekspresjonssignaturer

Å identifisere sett med relaterte gener med felles biologisk funksjon, analyserte vi uttrykk profiler ved hjelp av Gene Set Enrichment Analysis (GSEA) [15], Oppfinnsomhet pathway analyse (IPA), og Gene Ontologi berikelse analyse (GOEA). GSEA testet om noen

a priori

definerte kanoniske trasé ble beriket blant differensielt uttrykte gener i gruppene. Vi var spesielt interessert i forskjeller mellom kreft og noen kreftgrupper. Vi fant ut at to gensettene beriket i SNC versus NS, på FDR 0,1 nivå. Det første settet genet var «antioksydant responselement gener» (utvalgt og publisert tidligere [9]), med en normalisert anrikning poengsum (NES) på 2,04 og en FDR q-verdi på 0,021; det andre genet sett var «aktin Y bane» (NES = 1,87, q-verdi = 0,077). To gensettene beriket i NS, blant annet «Histidin stoffskifte» (NES = 1,93, q-verdi = 0,082) og «RAR /RXR bane» (NES = 1.84, q-verdi = 0,093). Ingen genet settet ble beriket på FDR 0,1 eller 0,25 nivå i SC i forhold til NS. Vi har også observert noen beriket genet satt i å sammenligne SNC versus SC på FDR 0,1 nivå, men vi fant 4 gensettene beriket på FDR 0,25 nivå, den viktigste genet sett var «antioksidant respons element gener» (NES = 1,86, q- verdi = 0,120). Disse resultatene antydet at sett med «antioksidant respons element gener» ble betydelig anriket i SNC, men ikke i SC.

Vi har også brukt IPA å teste for beriket kanoniske trasé ved hjelp av lister over over-uttrykt eller under uttrykt probe -sets og avgjøre den relative vekten av identifiserte trasé i de forskjellige fenotype grupper. For de 210 over-uttrykt probe-sett mellom SNC og NS, seks trasé var signifikant (figur 2A), inkludert «NRF2-mediert oksidativ stressrespons», «hypoksi signalisering i kardiovaskulære systemet», «TR /RXR aktivering», «aryl hydrokarbon-reseptorsignalisering «,» integrin signalering «, og» eicosanoid signalering «. GSEA og IPA representerer to forskjellige funksjonelle berikelse metoder som er basert på uavhengige kunnskapsdatabaser og ulike statistiske tester. Både identifisert NRF2 sti som den mest beriket vei, demonstrere samsvar mellom disse metodene. Viktigst, ved hjelp av IPA, for over-uttrykte gener vi har observert en meget markert forskjell i betydningen nivået av «NRF2-mediert oksidativt stress bane» mellom SNC og SC (figur 2A). Videre Gene ontologi analyse støttes også rollen som oksidativt stressgener blant over-uttrykte gener i SNC. Det var 15 GO vilkår beriket fra over-uttrykte gener på FDR 0,1 nivå i SNC og alle av dem ble molekylære funksjon vilkår for antioksidantresponsgener (saksdokumenter S1); Det ble imidlertid ikke GO vilkår beriket blant over-uttrykte gener i SC. Således kan tre bioinformatiske analyser støtter en rolle for NRF2 pathway gener i gruppen uten kreft, men ikke i den lungekreft gruppen.

(A) oppfinnsomhet hovedbane Analyse viste differensielle effekter av sigarettrøyking hos røykere uten kreft (SNC) og røykere med lungekreft (SC) i forhold til røykere (NS). Seks kanoniske trasé var betydelig anriket i de 210 over-uttrykt probe-sett når man sammenligner SNC med NS (blå søyler). Tre veier ble betydelig anriket i de 263 over-uttrykt probe-sett når man sammenligner SC versus NS (røde søyler). Vi observerte en svært markant forskjell i betydningen nivået av «NRF2-mediert oksidativt stress bane» mellom SNC og SC. (B) Et mRNA-nivåene i samspill, regulatoriske komponenter av NRF2 reaksjonsveien vist som boksplott. En boxplot viser et datasett gjennom fem-nummer sammendrag: den minste observasjon, nedre kvartil, median, øvre kvartil, og største observasjon. Sammenlignet med NS, master regulator NRF2 viste ingen forskjell mellom SNC og SC. Men den bindende partner MAFG var betydelig lavere i SC, og konkurrenten NRF1 var betydelig høyere i SC. NRF3, KEAP1, og bach1 mRNA viste ingen signifikante endringer. (C) Vi observerte at 22 gener med kjente NRF2 bindingssteder viste signifikante forskjeller mellom gruppene på FDR 0,1 nivå. Konsekvent, ekspresjonen av disse genene i SNC var høyere enn i NS; og de fleste av disse genene har lavere ekspresjon i SC enn den i SNC. Dette mønsteret var lik MAFG uttrykk mønster.

Korrelasjon av MAFG med uttrykk for antioksidantresponsgener

Funksjonell berikelse metoder sterkt innblandet betydningen av NRF2 pathway (definert av gener som inneholder antioksidanten responselementer (Ares) i oppstrøms regioner). Som et resultat av dette undersøkte vi denne gruppen av gener nærmere. Under oksidativt eller elektrofil stress, er NRF2 frigjøres fra dets interaksjon med KEAP1 og translocates til kjernen, hvor det heterodimerizes med små MAF proteiner som MAFG, og deretter bindes til ER-sekvenser oppstrøms av NRF2 målgener [16]. NRF1, NRF3, og bach1 kan konkurrere med NRF2 å binde med MAFG på ER områder, som potensielt kan føre til redusert ARE-mediert genuttrykk [17], [18], [19]. Figur 2B viser mRNA-nivåene av de samvirkende regulatoriske proteinkomponenter i den NRF2 pathway. Sammenlignet med NS, fant vi ingen signifikant forskjell i master regulator NRF2 mellom enten SNC eller SC. Imidlertid har vi funnet signifikant forskjell i den konkurrenten NRF1 og bindingspartneren MAFG som er i overensstemmelse med en rolle i regulering av nedstrøms målgener (figur 2B). NRF1 var signifikant høyere (endring = 1,23, p = 0,0115 for SC versus SNC, og fold change = 1,54, p = 0,0084 for SC vers NS, med t-test). Endringen i NRF1 uttrykk i denne prosessen støtter rolle for NRF1 foreslått av Wang

et al product: [20] og Ohtsuji

et al product: [16], som viste at NRF1 binding til Ares

in vivo

trykt ARE-avhengig genekspresjon og modulert respons på oksidativt stress. Det vil si, NRF1 ble observert å være anti-korrelert med ekspresjonen av NRF2 spredningsveier gener. MAFG var lavere i SC i forhold til NS eller SNC (endring = 0,55, p = 0,0022 for SC versus SNC, og fold change = 0,60, p = 0,0076 for SC versus NS, med t-test). Ingen signifikante endringer ble funnet i NRF3, KEAP1, og bach1 mRNA (figur 2B). Som forventet basert på IPA og GSEA resultater, fant vi at 22 ER-regulerte gener var forskjellig mellom gruppene, og korrelert med MAFG nivåer (lavere i SC, men høyere i SNC, figur 2C). NRF2 målgener som er vist i figur 2C (AKR1C1, AKR1C2, ALDH3A1, CBR1, FTH1, FTL, GCLM, GCLC, GPX2, NQO1, PIR, PRDX1, PSMA3, SAT1, SLC7A11, SOD1, SQSTM1, TALDO1, TKT, TXN, TXNRD1, og UGT1A6) ble indusert blant SNC men var gjennomgående lavere i SC pasienter. Denne romanen observasjon tyder på at reduserte nivåer av MAFG og høyere nivåer av NRF1 (negativ regulator) kan være å undertrykke transkripsjon av disse er regulerte gener blant røykere som går på å utvikle lungekreft.

Vi re-undersøkt en større, tidligere publisert datasett [7] og også funnet betydelig lavere MAFG nivåer hos røykere med lungekreft (n = 90) sammenlignet med den hos røykere uten kreft (n = 97) (Hjelpemiddel Informasjon S1). Ytterligere bevis for en regulerende rolle for MAFG i luftveis epitelceller dukker opp. I et lignende prosjekt, har sigarettrøyk-indusert luftveis uttrykk for MAFG blitt observert å være regulert av mikroRNA MIR-218 [21]. Vi utforsket virkningen av MAFG uttrykk nivå på nedstrøms NRF2-sti gener. Figur 3A viser MAFG siRNA knockdown i A549-cellelinjen. Figur 3B viser at MAFG lyddemping fører til svekket uttrykk for GCLC, NQO1, SLC7A11, TXNRD1 (alle er gener). Vi hypotese at reduserte MAFG nivåer og den påfølgende reduksjon i den beskyttende oksidativt stress reaksjon kan representere en genekspresjon kjennetegn i bronkial epitelceller av røykere som utvikler lungekreft. Men mønsteret av genuttrykk over tid (varighet av røyking) kan være viktig og siste røyking blant de som røyker, kan påvirke noen av mønstrene som vi observerer i bronchial epitelceller.

Etter transient transfeksjon med MAFG siRNA i luftveiene A549-cellelinjen, ble genekspresjon målt ved anvendelse av sanntids qPCR. Transfeksjon med egge kontroll siRNA produsert en generell økning i NRF2 pathway gener (svarte striper) i forhold til nontransfected celler (satt til 100%). (A) MAFG genekspresjon var signifikant redusert (55%) sammenlignet med uspesifikk kontroll siRNA. (B) GCLC, NQO1, SLC7A11, og TXNRD1 genekspresjon var signifikant redusert med MAFG stanse sammenlignet med ikke-spesifikke siRNA kontroller. * (P≤0.05, t-test). Alle data presenteres som gjennomsnitt ± SEM (n = 3).

SNP utvalg, genotyping og MAFG sekvense

For å undersøke om genetisk variasjon er å bidra til luftveis genuttrykk forskjeller, vi brukte en bioinformatikk strategi for å identifisere SNPs i potensielle NRF2 bindingsseter [9], [13] og også identifisere merking SNPs for flere gener involvert i NRF2-mediert antioksidant respons veien. Genet og SNP liste er inkludert i støtteinformasjon S1. Etter genotyping, ca 77% (348 SNPs) av de identifiserte SNPs passert de første kvalitetskontroll kriterier (genotyping rate = 90%, MAF terskel = 0,01 og Hardy-Weinberg likevekt p-verdi terskel = 0,001, GenTrain scorer 0,25), men bare vi undersøkte 312 SNPs med allelfrekvenser ≥0.05 i 52 fag.

Expression analyse antydet at MAFG nivåer kan potensielt være hastighetsbegrensende i uttrykket av antioksidantresponsgener. For bedre å vurdere om sekvens variasjon i MAFG genet påvirket genekspresjon, vi sekvensert en 16,5-kb genomisk region (chr17: 77,467,438-77,483,879) i våre forsøkspersonene. Denne regionen var fra 5000-nt oppstrøms for transkripsjon start stedet til 2000-nt nedstrøms MAFG sin transkripsjon slutten område, dekker introner, eksoner og uoversatt regioner. Vi oppdaget 33 SNPs i denne regionen, inkludert en koding SNP, 16 SNPs i 3 «UTR og 3 SNPs i introner, og 13 SNPs i oppstrøms. Plasseringen, allelfrekvenser og koblingsulikevekt (LD) er inkludert i saksdokumenter S1. Sammenligning av denne informasjonen med den NCBI dbSNP bygge 130 (mai 2009), fant vi at bare tre av disse SNPs hadde tidligere blitt rapportert.

Association analyse av SNP genotype og genuttrykk

Vi utførte lineær regresjon mellom normalisert log

2-transform genekspresjon verdier og genotyper av SNP’er som var i nærheten av hvert gen (SNP stilling innen 10 kb av et gen oppstrøms, koding og nedstrøms områder). Statistisk signifikans ble evaluert ved bruk av 10000 permutasjoner av ekspresjon verdier i forhold til genotypene som tidligere beskrevet av fremmed

et al product: [22] med en korrigert

p

verdi terskel på 0,05. I 44 røykere, blant 338 påvisbare probe-sett (213 gener) nærliggende våre utvalgte 312 SNPs, fant vi signifikant sammenheng mellom 26 SNPs og 29 probe-sett (25 gener, oppført i tabell 2). Blant disse er 21 antatte ER SNPs og seks kjente er gener, inkludert AKR1C1, AKR1C2, AKR1C3, EPHX1, FTL, og HMOX1. Vi har funnet en gruppe av SNP’er assosiert med ekspresjon av 3 tilstøtende NRF2-regulert gener, AKR1C1, AKR1C2 og AKR1C3 (figur 4). Vi genotypede 25 tag SNPs i dette genomiske regionen. SNP rs12414884 ligger -3792-nt oppstrøms AKR1C2 og var forbundet med uttrykket av alle 3 genene. To SNPs, rs17134158 og rs10904392, som er 1768-nt og 4715-nt bort fra rs12414884 henholdsvis var assosiert med uttrykk for AKR1C1 og AKR1C2. Videre koblingsulikevekt analyser indikerte disse 3 SNPs var i lenke (r

2 0,8). Vi testet også sammenhengen mellom nylig identifiserte SNPs i MAFG og MAFG genuttrykk. Arrangøren SNP på chr17: 77482956 (-4077, A /C, mindre allel freq = 0,09) var assosiert med MAFG uttrykk (p_corrected = 0,0038)

Vi genotypede 25 SNPs i genomisk region som inneholder AKR1C1, AKR1C2. og AKR1C3. I hver tomt uttrykk vers genetype, sirkler var log2 uttrykk, og linjene var lineær regresjon trendlinjer. De genotyper av SNP rs1241488 forbundet med uttrykket nivåer av alle 3 genene. De genotyper av SNP rs1090439 forbundet med uttrykket nivåer av AKR1C1 og AKR1C2. Merk: SNP rs17134158 bare hadde 2 genotyper AG og GG hos røykere, men hadde AA genotype i NS og dens samlede mindre allelfrekvens 0,05. Koblingsulikevekt analyser indikerte disse 3 SNPs var i lenke (r

2 0,88).

Selv om vårt fokus var sammenhengen mellom genotype og uttrykk i alle røykere i studien, har vi også undersøkt forskjellen i assosiasjoner mellom SC og SNC grupper. Denne type utforskende analyse kan avsløre SNP effekter, som kan være relatert til differensial mottakelighet hos røykere. En forening ble funnet mellom uttrykk og en antatt ER SNP rs3753660 på -199-nt av epoksid hydrolase 1 (EPHX1) genet (figur 5A). Sammenhengen var sterkest blant SNC og effekten av SNP synes å være ganske forskjellig mellom de to gruppene (figur 5A og tabell 2). Menneskelig EPHX1 har to antatte Ares (inkludert polymorfe ER), men EPHX1 uttrykk ikke følger mønsteret som vises av mange andre er gener i figur 2C. Den C-allelet av rs3753660 ble spådd å ha lavere NRF2 bindende og vi observerte det var forbundet med lavere uttrykk i SNC. Dette antyder en mulig interaksjon mellom genetisk variant, uttrykk og gruppen fenotype. DUSP1 hadde også en antatt ER SNP rs17658295 forbundet med uttrykket (figur 5B). Den mindre allel var signifikant assosiert med høyere uttrykk og signifikansnivået var mer uttalt hos kreftgruppen.

I hver tomt, er SC, SNC og NS farget med rødt, blått og svart, henholdsvis. (A) Foreningen av en antatt ER SNP rs3753660 i formidler av EPHX1 genet viser tydelige trender i SC og SNC; (B) DUSP1 antatte ARE SNP rs17658295 forbundet med sitt uttrykk. Den mindre allel var signifikant assosiert med høyere uttrykk og signifikansnivået var mer uttalt i kreft gruppe; C) GCLC intronic SNP rs670548 mindre allelet assosiert med lavere uttrykk blant alle fag; (D) GCLC 3 «nedstrøms SNP rs2397146 mindre allelet assosiert med høyere uttrykk blant alle fag.

Noen SNPs var assosiert med uttrykk av kjente er gener blant alle 52 fag, men ikke innenfor alle røykere. For eksempel, to SNP’er (rs670548 og rs2397146) i den glutamat-cystein ligase katalytisk subenhet (GCLC) genet som ikke var i LD (R «> 2 = 0,28), ble uavhengig av hverandre forbundet med uttrykket (figur 5C). Interessant nok var det mindre allel av rs670548 (i intron) er forbundet med lav ekspresjon mens den mindre allel av rs2397146 i 5 «oppstrøms region var assosiert med høy ekspresjon (figur 5D), noe som tyder på muligheten for to forskjellige alleliske fenotyper. Variasjon i GCLC har tidligere vært forbundet med lavt nivå av lungefunksjon i to uavhengige populasjoner [23].

SNPs som kan bidra til kreft status via genuttrykk

For å identifisere SNPs som kan påvirke lunge kreft via genuttrykk vi først brukt logistisk regresjon for å teste sammenhengen mellom kreft eller ikke-kreft status og log2-transformert genuttrykk nivåer. Dette identifisert 34 probe-sett (31 gener) i antioksidant respons bane som var assosiert med kreft status for røykere på en korrigert p-verdi = 0,05. Spesielt ble den MAFG probe-sett 204970_s_at assosiert med «uten cancer» status (p = 0,0014) (figur 6A). Som skissert på figur 6, begrunnet vi at en SNP som påvirkes genekspresjon kan avvike i frekvens mellom grupper. Mens statistisk styrke for en slik sammenligning er lav, vi observere en slik effekt for MAFG 3’UTR SNP nevnt tidligere (chr17: 77469864; p = 0,058) (Figur 6B-C). Som vist i figur 6, ble den GG genotype forbundet med «uten cancer» status av røykere (p = 0,0199), og også marginalt med den høyeste ekspresjonsnivået av MAFG. Hvis disse frekvensforskjeller kan være begrunnet i større grupper av pasienter, kan de indikere beskyttelses eller risiko alleler og kan være nyttig for å forutsi risikoen

MAFG 3’UTR SNP på chr17. 77469864 potensielt kan bidra til fenotype ( lungekreft status) via genekspresjon, på grunnlag av: (A) ekspresjon av MAFG var høyere hos røykere uten kreft enn det hos røykere med kreft; (B) Genotype GG viser en trend mot høyere uttrykk nivåer av MAFG (#, svart linje); bakken av genotype av uttrykks tomter varierer mellom gruppene (* rød stiplet linje vs blå stiplet linje); (C) Genotype GG, assosiert med høyere uttrykk, var mer vanlig hos røykere uten kreft; (D) Hypotese. Personer med genotype GG skjerm høyere MAFG uttrykk i bronkiene epitelceller; MAFG uttrykk høyere hos røykere uten kreft tyder på det er beskyttende mot lungekreft; GG genotype er sjeldnere blant kreft gruppe, i samsvar med en beskyttende effekt.

Diskusjoner

Det er en viktig arvelig komponent til lungekreft [24] og forståelse for hvordan genetisk variasjon forandrer røyking indusert genekspresjon kunne gi genetiske biomarkører for diagnostisering og avdekke genetisk disposisjon alleler. Tallrike studier av menneskets luftveier [5], [7], [25], [26] muselunge [27] eller

in vitro

cellekultur [28] har rapportert på genekspresjonssignaturer relatert til røyking. Spira

et al

identifisert genuttrykk profiler i cytologisk normale store-airway epitelceller som kan tjene som en diagnostisk biomarkør for lungekreft [7]. Den nåværende arbeid identifiserer molekylære og genetiske trekk ved NRF2-regulert vei som står sentralt i denne luftveis genuttrykk respons. Ved hjelp av verktøy pathway analyse, identifiserte vi forskjeller i NRF2-mediert transkripsjon profiler fra bronkial luftveis epitelceller hentet fra ikke-røykere, sigarett-røykerne med mistanke om lungekreft, og de med en påfølgende diagnostisering av lungekreft. Vi avdekket også en potensiell rolle for MAFG (en NRF2-bindende partner) i moduler røyke-indusert genekspresjon.

NRF2 aktiveres av oksidativt stress og translocates til kjernen hvor det heterodimerizes med små MAF proteiner for å danne en trans kompleks som binder seg til spesifikke DNA-regioner kalles antioksidanter responselementer (ER) [29] og opp-regulerer antioksidant og fase II avgiftning enzymer. Vi undersøkte uttrykk for NRF2 og dets samspill partnere (f.eks MAFG, NRF1, NRF3, og bach1) og laget en ny observasjon at MAFG uttrykk var sterkt korrelert med uttrykk av nedstrøms NRF2 målgener. I dag finnes det 42 NRF2 målgener oppdaget i forskjellige humane vev, og vi har funnet 22 av dem korrelert med MAFG genekspresjon nivå i humane luftveier epitelceller. I tillegg NRF1, en negativ og konkurranse regulerende faktor, ble anti-korrelert med nedstrøms antioksydant genekspresjon. Muligheten for at MAFG uttrykk kan begrense nedstrøms antioksidant genekspresjon ble utforsket videre. Dempe MAFG med siRNA i A549 celler dempet uttrykket av kjente er gener (Figur 3B), og dette var i samsvar med publiserte eksperimenter i MafG knockout mus [29]. Et lignende mønster for MAFG uttrykk i forhold til andre antioksidanter gener ble funnet når vi gjennomført en retrospektiv analyse av uttrykk data fra en relatert, tidligere publisert, større stilt studie [7].

Legg att eit svar