PLoS ONE: Innsikt i Bukspyttkjertelkreft Etiologi fra Pathway Analyse av Genome-Wide Association Study Data

Abstract

Bakgrunn

Kreft i bukspyttkjertelen er den fjerde største årsaken til kreftdød i USA og Årsakene til dette svært dødelig sykdom er ikke blitt godt definert. Å identifisere genetisk mottakelighet faktorer for kreft i bukspyttkjertelen, gjennomførte vi pathway analyse av genom-wide forening studie (GWAS) data i 3,141 bukspyttkjertelen kreftpasienter og 3,367 kontroller med europeisk opphav.

Metoder

Bruke genet satt ridge regresjon i forbindelse studier (gress) -metoden, analyserte vi 197 trasé identifisert fra Kyoto Encyclopedia of gener og genomer database. Vi brukte den logistiske kjernen maskin (LKM) test for å identifisere viktige medvirkende gener hver vei. Vi gjennomførte funksjonelle berikelse analyse av de mest betydningsfulle gener (

P

0,01). Bruke Database for kommentering, visualisering, og integrert Discovery (DAVID)

Resultater

to veier var signifikant assosiert med risiko for kreft i bukspyttkjertelen, justert for multiple sammenligninger (

P

0,00025) og i replikering testing: neuroaktive ligand-reseptor interaksjon, (

Ps

0,00002) og lukte transduksjon pathway (

P

= 0,0001). LKM test identifisert fire gener som var signifikant assosiert med risiko for kreft i bukspyttkjertelen etter Bonferroni korreksjon (

P

1 x 10

-5):

ABO, HNF1A, OR13C4, etter og

SHH.

Funksjonelle anrikning analyse ved hjelp av DAVID konsekvent funnet på G-protein-koblet reseptor signalveien (inkludert både neuroaktive ligand-reseptor-interaksjon og olfaktoriske overføringsveier) for å være den mest betydningsfulle veien for kreft i bukspyttkjertelen risiko i denne studiepopulasjonen .

Konklusjon

Disse nye funnene gi nye perspektiver på genetisk disposisjon til og molekylære mekanismer for kreft i bukspyttkjertelen

Citation. Wei P, Tang H, Li D (2012) innsikt i bukspyttkjertelkreft Etiologi fra Pathway Analyse av Genome-Wide Association Study data. PLoS ONE 7 (10): e46887. doi: 10,1371 /journal.pone.0046887

Redaktør: Zhongming Zhao, Vanderbilt University Medical Center, USA

mottatt: 22 juni 2012; Godkjent: 06.09.2012; Publisert: 04.10.2012

Copyright: © Wei et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av National Institutes of Health gjennom en supplerende tilskudd til RO1 CA98380-05 (til DL) og gjennom MD Anderson Cancer Center Support Grant (CA016672). P.W. ble delvis støttet av NIH R01HL106034-01. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

kreft i bukspyttkjertelen er den fjerde største årsaken til kreft-relaterte dødsfall i USA, og står for mer enn 37,660 dødsfall per år [1]. Fordi ingen effektiv screening test finnes for kreft i bukspyttkjertelen, er det viktig å identifisere genetiske faktorer som bidrar til utviklingen av denne kreft. Nye genom-wide assosiasjonsstudier (GWAS) og post-GWAS analyser har identifisert kromosom områder som inneholder

ABO

,

NR5A2, etter og

CLPTM1L-tert

gener [2] [3], samt

HNF1A

gen [4], som mottakelighet loci for kreft i bukspyttkjertelen. Imidlertid har enkelt-markør foreningen tester begrenset makt til å identifisere gener som er genuint knyttet til sykdomsstatus, men kan ikke treffe en streng genom-wide betydning terskel i GWAS. Således kan mange viktige sykdomsgener fortsatt uidentifiserte med denne tilnærmingen. Videre utvikling av kreft innebærer vanligvis dysfunksjon av flere funksjonelt relaterte gener som virker concordantly i et nettverk eller veier [5]. Således pathway analyse av GWAS data, noe som i fellesskap anser flere varianter i samspill gener og flere gener i en biologisk vei, som en komplementær tilnærming til enkelt-markør forening tester [6], kan ha potensial til å avsløre polygenic basis av sykdom følsomhet . Pathway-baserte GWAS analyser har gitt ny innsikt i etiologien av kreft, for eksempel tykktarmskreft [7], lungekreft [8], og føflekkreft [9], og andre komplekse sykdommer, inkludert schizofreni [10], bipolar lidelse [11 ], og reumatoid artritt [12]. En fersk studie analyserte GWAS data med fokus på 23 utvalgte veier eller grupper av gener og identifisert bukspyttkjertelen utviklings sti gener som resistensfaktorer for kreft i bukspyttkjertelen [13]. Mens disse dataene støtter kandidaten pathway analyse som en nyttig tilnærming i genetisk sammenheng studien, er det begrenset med antall pathways /gener undersøkt, noe som tyder på at en mer omfattende agnostisk analyse av alle kjente veier kan ha potensial til å avdekke nye gener som var tidligere ikke vurdert i bukspyttkjertelkreft.

Gene satt ridge regresjon i assosiasjonsstudier (gress) er en av de nyutviklede pathway baserte tilnærminger [7]. I GRASS er Hovedkomponentene analyse (PCA) brukes til å fange den genetiske variasjonen innen et gen for å redusere dimensjonalitet enkeltnukleotidpolymorfi (SNP) data og regularisert logistisk regresjon er utført for å vurdere sammenslutning av trasé med sykdom. I denne studien har vi først brukt gress på GWAS data for å vurdere sammenslutning av trasé med kreft i bukspyttkjertelen. Deretter søkte vi den logistiske kjernen maskin (LKM) metode for å skjerme de store bidrar genene til hver vei [14]. Til slutt har vi gjennomført funksjonelle berikelse analyse av de mest betydningsfulle gener ved hjelp av Database for kommentering, visualisering, og integrert Discovery (DAVID) metoden [15], [16]. I denne studien, den første omfattende analyse av GWAS data i bukspyttkjertelkreft ved hjelp av en agnostiker tilnærming, har vi identifisert nye stier og gener som er vesentlig knyttet til sykdomsrisiko. Disse funnene kan åpne nye muligheter for forskning på molekylære mekanismen av og årsak til kreft i bukspyttkjertelen.

Metoder

Studiepopulasjon og datakilde

Studiepopulasjonen inkluderte en totalt 7,019 personer: 1,871 tilfeller og 2026 fra PanScan1 inkludert 12 nestet case-control studier og en sykehusbasert kasus-kontrollstudie og 1,528 saker og 1.594 kontroller fra PanScan2 inkludert 6 case-control studier på kreft i bukspyttkjertelen [2], [3] . Tilfeller ble definert som primær adenokarsinom i eksokrin pankreas. Controls, som var fri for kreft i bukspyttkjertelen ved rekruttering, ble matchet i saker etter fødselsår, kjønn og selvrapportert rase /etnisitet. GWAS hadde blitt utført ved National Cancer Institute Core Genotyping Facility bruker HumanHap550, HumanHap550-Duo, og Menneskelig 610-Quad arrays (alt fra Illumina, San Diego, California) [2], [3]. De opprinnelige GWAS data ble lastet ned fra Database for genotyper og fenotyper (dbGaP) [17]. På grunnlag av internasjonale HapMap Prosjekt genotype data (fase 3 utgivelse # 3, NCBI bygge 36, dbSNP B126, 2010-05-28) i tre populasjoner (CEU, JPT /KHB, og Yri) [18] og mindre allel frekvens ( MAF) 5%, valgte vi 10,155 SNPs med

r

2 0,004 bruke i populasjonsstruktur analyse [19]. Totalt 6,508 personer (3,141 tilfeller og 3,367 kontroller) med europeisk opphav (dvs. 0,75 til 1 likheten til CEU) ble valgt ut fra startstudiepopulasjonen av 7,019 personer i strømbanen analyse.

Kvalitetskontroll

De opprinnelige GWAS data som sendes kvalitetskontrollen før lagt ut på dbGaP. Vi beskjæres genotypen data ved videre unntatt 13,822 SNPs med takst 98%, 45,653 SNPs med MAF 5% og 38,857 SNPs avviker fra Hardy-Weinberg likevekt (

P

0,001), som samt SNPs i genet ørkenen regioner, noe som resulterer i 82,881 SNPs i den endelige analysen fra et startnummer fra 468,111 SNPs.

for å evaluere effekten av befolkningsstruktur, vi gjorde quantile-quantile (QQ) plottet og beregnet inflasjonsfaktor () hos personer med europeisk opphav bare. Inflasjons faktoren ble beregnet i henhold til fremgangsmåten ved de Bakker et al. [20], justert for en utvalgsstørrelse på 1000 tilfeller og 1000 kontroller ved hjelp av formelen: Hvor, og er faktisk nummer som brukes til å beregne; 1000 er utvalgsstørrelsen for å bli korrigert. QQ plott viser liten inflasjon teststatistikken sammenlignet med forventet fordeling (λ = 1,03), unntatt muligheten for potensiell befolkningsstruktur mellom saker og kontroller.

Gener med -log10 (

P

) en ikke ble inkludert i tomter. For klarhet, ikke alle genene er merket. For detaljer, se tabell S1 og S3.

Pathways og Genes

I alt 214 mennesker biologiske mekanismer er oppført i Kyoto Encyclopedia of gener og genomer (KEGG) [ ,,,0],21]. Etter eksklusjon trasé med 10 eller 500 gener, analyserte vi 197 trasé ved hjelp av GRASS tilnærming [22]. Vi identifiserte 19,058 Reference Sequence (RefSeq) gener i GWAS data fra det menneskelige genom 18 (hg18) database med University of California Santa Cruz (UCSC) Tabell Browser innhenting av data verktøy [23]. Vi testet 5,127 gener i de 197 trasé for tilknytning til kreft i bukspyttkjertelen. For hvert gen regionen, inkludert vi SNPs innenfor 20 kb oppstrøms eller nedstrøms av genet i denne studien.

Den heltrukne linjen og stiplet linje, henholdsvis, viser de direkte og indirekte samspill mellom gener.

statistiske metoder

Vi brukte GRASS å teste sammenslutning av hver vei med kreft i bukspyttkjertelen. Genotype data ble kodet på en additiv modell ved hjelp plink versjon 1.07 [24] med 0 for homozygot felles allelet, en for heterozygote, og to for homozygot mutant allel. Gresset tester nullhypotesen at ingen av SNPs i en gitt bane var forbundet med sykdommen [6]. For å unngå utilbørlig påvirkning av varierende genet og sti størrelser, bruker GRASS normalisert gen-nivå statistikk og prøve (emne) permutasjoner. Detaljene i GRASS har tidligere blitt beskrevet [7]. I korthet er fremgangsmåten består av tre trinn. Først blir PCA brukes til å oppsummere SNPs i hvert gen som ukorrelerte (ortogonale) lineære kombinasjoner av de opprinnelige SNPs, kalt eigenSNPs, sto for ≥95% av den genetiske variasjonen. Antallet resulterende eigenSNPs er vanligvis mye mindre enn for de originale genotypede SNP’er, og tjener som prediktor i regularized logistisk regresjonsmodell. En straffet sannsynlighet funksjonen brukes til å estimere regresjonskoeffisientene av eigenSNPs. For det andre er et standardisert gen-nivå statistikken beregnes i henhold til regresjonskoeffisientene av eigenSNPs. Den statistikken, analog til z-statistikken, er definert aswhere

er kvadratroten av summering av squared regresjonskoeffisienten for hver eigenSNP anslått under optimal tuning parameter; og, beregnet fra permutasjoner, er middelverdi og standardavvik til under null hypotesen om at genet er ikke forbundet med sykdommen. Således hvert gen, uavhengig av sin størrelse, bidrar like mye til genet settet krets statistikk, som beskrevet nedenfor. Det tredje trinnet innebærer å beregne gen set (sti) forening statistikk () og p-verdi. er kvadratroten av summering av kvadrat standardiserte gen-nivå statistikk;

P

verdi er beregnet med, hvor beregnes fra permutert data og B er antall permutasjoner. På grunn av det store antall gener og trasé analysert, påført vi Bonferroni korreksjon for å justere for multiple sammenligninger. Betydningen terskelen var

P

0,00025 (0,05 /197). På grunn av den intense utregningen følger av gress, vedtok vi en to-trinns permutasjon testprosedyre, lik som gjennomføres i plink [24]: vi først gjennomført 5000 permutasjoner til hvert gen satt i denne studien, og for de gensettene med p- verdi mindre enn 0,00025 økte vi antall permutasjoner til 50.000.

Vi anvendt lkm test for å vurdere sammenslutning av hvert gen med kreft i bukspyttkjertelen som tidligere beskrevet [14]. Kort fortalt består denne metoden to trinn: forming SNP sett for hvert gen og testing foreningen av SNP sett med sykdomsstatus. Genet database, genet region definisjon, og genotype koding brukt her var de samme som i gress. Den lkm Modellen integrerer en vanlig logistisk modell med en semi-klar kernel-funksjon (en lineær kjerne ble brukt her) som er spesielt utviklet for genetiske data. Variansen-komponenter scorer test av Zhang Lin [25] ble brukt til å teste gen-sykdom forening. I denne analysen har vi testet de sammenslutninger av 5,127 gener (i de 197 pathways) med kreft i bukspyttkjertelen, justert for alder (i 10-års-grupper), sex, studie (kategorisk), og fem hovedkomponenter (kvantitative) fange befolkningsstrukturen oppnås fra en PCA analyse ved hjelp EIGENSTRAT [26]. P-verdier fra KLM analysen ble justert for multiple sammenligninger ved hjelp av Bonferroni korreksjon. Betydningen terskelen var

P

. 9,75 × 10

-6 (0.05 /5127)

Til slutt, som en komplementær tilnærming til GRASS pathway analyse undersøkte vi den funksjonelle berikelse av de mest betydningsfulle gener i gen-baserte foreningen tester (

P

≤0.01 i lKM) ved hjelp av web-tilgjengelige bioinformatikk verktøy DAVID [15], [16]. Den DAVID består av en integrert biologiske kunnskaps og analytiske verktøy som tar sikte på systematisk utpakking biologisk betydning og over-representert biologiske funksjoner fra store genet eller protein lister basert på den hypergeometriske (Fishers eksakte) test. Vi brukte KEGG, GO og Interpro [27] databaser for å definere gensettene. I tillegg DAVID grupper funksjonelt tilsvar gensettene i klynger for å redusere overflødig natur genet funksjonell merknads systemer, for eksempel, er hierarkisk organisert GO.

Som en replikering innsats, vi analyserte data fra PanScan1 (1,796 tilfeller og 1,880 kontroller) og PanScan2 (1,345 tilfeller og 1.487 kontroller) separat. Vi har også tilfeldig delt på hele datasettet i to grupper og utført separat analyse i hver gruppe. Vi utførte meta-analyse av

P

verdier fra enkelte kohort /gruppe med Stouffer z-poeng metoden, som har vist seg å være effektiv i meta-analyse av GWAS [28]. Teststatistikken for kombinering av p-verdier fra to enkeltgrupper for en gitt bane er beregnet som, der er inverse av den standard kumulative normale funksjon. Den samlede meta-analyse

P

verdi er beregnet som. Til slutt, søkte vi GRASS metode for å teste de to største betydelige veier (som beskrevet i resultater) ved hjelp av Wellcome Trust sak Kontroll Consortium (WTCCC) GWAS data [29] for å empirisk evaluere virkningen av veien størrelse og demonstrere spesifisitet av våre resultater .

Resultater

pathways Associated med kreft i bukspyttkjertelen

Vi analyserte 197 trasé med 5,127 gener ved hjelp av GRASS tilnærming og funnet ut at seks banene var signifikant assosiert med kreft i bukspyttkjertelen etter Bonferroni korreksjon (

P

2,5 × 10

-4) (tabell 1). Tre veier var signifikant på

P

verdier 0,0001: neuroaktive ligand-reseptor interaksjon, langvarige depresjoner, og aldersdiabetes av de unge (MODY) veier. Tre veier hadde en mindre vesentlig

P

verdi av ≥0.0001 men 0,00025: lukte transduksjon, Fc Epsilon RI signalering, og vaskulær glatt muskulatur sammentrekning veier. I tillegg til ovennevnte seks baner, den glycerophospholipid metabolisme, bukspyttkjertelen sekresjon og vaskulær endotelial vekstfaktor (VEGF) signalveier ble assosiert med kreft i bukspyttkjertelen på

P =

0,0004 (Tabell S1, som er tilgjengelig på nettet).

pathway Replication Resultater

To av de seks store veier, dvs. lukte transduksjon sti og neuroaktive ligand-reseptor interaksjon veien viste konsistent liten

P

verdier på de PanScan1 og PanScan2 kohorter, skjønt ikke begge

P

verdier var signifikant etter flere test korreksjoner sannsynlig på grunn av mye mindre prøvestørrelsen i hvert enkelt kohort og den resulterende nedre statistisk effekt (tabell 2). Den meta-analyse

P

verdier for disse to baner (1 × 10

-5 og 1 x 10

-5, henholdsvis) var betydelig etter Bonferroni korreksjon. Den MODY veien forble signifikant i PanScan1 (

P

= 0,00006), men ikke i PanScan2 (

P

= 0,91), og meta-analyse

P

verdi var 0,0589. Alle tre gjenværende viktige veier i den kombinerte GRASS analyse hadde

P

verdier 0,1 i PanScan1 og PanScan2 kohort (tabell 2). Når vi tilfeldig delt i datasettet i to grupper, alle seks baner hadde en

P

verdi 0,05 i ett av de to grupper, men ikke i begge; og ingen av meta-analyse

P

verdier var signifikant etter justering for multiple sammenligninger (tabell S2). For å undersøke om betydningen av lukte transduksjon pathway (353 gener og 1,122 eigenSNPs) og neuroaktive ligand reseptor interaksjon pathway (263 gener og 1,374 eigenSNPs) var rett og slett på grunn av sin store størrelse, testet vi disse banene ved å bruke gresset til WTCCC GWAS data og fått en

P

verdi på 0,5652 og 0,2332 for bipolar lidelse og 0,246 og 0,0062 for Crohns sykdom, henholdsvis (hver sykdom hadde 2.000 tilfeller og 3000 kontroller). Disse resultatene, sammen med den konsekvente liten

P

verdier på tvers PanScan1 og PanScan2, tyder på at den betydelige

P

verdien av disse to baner i GRASS analysen er usannsynlig på grunn av veien størrelse. I tillegg til å undersøke om veien resultatene ble hovedsakelig drevet av GWAS toppen treff rapportert i PanScan1 og Panscan to, vi fjernet genet

NR5A2

fra MODY sti og re-utført GRASS analyse med 50.000 permutasjoner. P verdi for den kombinerte datasettet, PanScan1 og PanScan2 undergruppe var 0,4 × 10

-4, 0,6 × 10

-4, og 0,88 hhv. De respektive

P

verdiene var 0,6 × 10

-4, 0,6 × 10

-4 og 0,91 fra analysen inkludert

NR5A2

genet, noe som tyder på at vår sti analyse avslørt signaler uavhengig fra de som er av enkelt-SNP analyse. Legg merke til at andre GWAS toppen treffer slik som

ABO Hotell og

TERT1

ble ikke inkludert i noen av de 197 trasé.

Major Bidra Gener til Pathways

Anvendelse av lKM metoden identifiserte vi 365 gener med nominell betydning (

P

0,05) og 118 gener med

P

0,01 for de 197 trasé (tabell S3, tilgjengelig på nettet). De store bidrar gener til hver av de seks signifikante veier er identifisert ved GRASS er angitt i tabell 1. De store genene som bidrar til de 197 trasé og til de seks signifikante veier er presentert i figur 1 og 2, respektivt. Etter at vi justert for multiple sammenligninger, fire gener forble signifikant (

P

9,75 × 10

-6):

ABO

,

HNF1A

,

OR13C4

, og

SHH

gener (tabell 3). I tillegg til disse fire genene,

ABL1

,

MYC, HNF4G

,

NR5A2 plakater (en GWAS topp hit) og

ADPGK

hadde fram

P

verdier 0,0001

funksjonell Enrichment analyse av Vesentlige gener

til slutt gjennomførte vi funksjonelle berikelse analyse, med DAVID, på settet til 118 gener med

P

0,01 fra lKM analyse. Førti-fire klynger ble identifisert på grunnlag av KEGG, GO og Interpro kategorier. De klynger av gener med

P

0,01 fra DAVID er oppført i tabell 4 (se tabell S4 for detaljert liste over genene i hver klynge). Den superfamilien av Rhodopsin lignende G-protein-koblede reseptorer (GPCR), oppfattelse av lukt og lukte transduksjon var den viktigste gruppen av gener på grunnlag av Interpro (

P

= 1,61 x 10

– 13), GO (

P

= 1,30 × 10

-7) og KEGG (2,38 × 10

-3) databaser, henholdsvis ekko våre funn fra gress. Gener opprettholde homeostase prosessen ble også overrepresentert i bukspyttkjertelkreft (tabell 4). Den biologiske forhold kartet for de beste 81 gener (

P

0,05 i LKM). Av de seks store trasé er vist i figur 3, som ble opprettet med Oppfinnsomhet Pathway og analyse programvare [30]

Diskusjoner

i denne GWAS pathway analyse, identifiserte vi to nye baner, dvs. neuroaktive ligand reseptor interaksjon og lukteoverføringsveier som er signifikant assosiert med kreft i bukspyttkjertelen risiko justert for multiple sammenligninger og replikering testing. Disse funnene ble også støttet av funksjonelle berikelse analyse. Vi har også identifisert fire gener som er betydelig assosiert med kreft i bukspyttkjertelen risiko, inkludert tre tidligere impliserte gener

ABO

,

HNF1A

, og

SHH product: [2] – [4] samt en roman gen

OR13C4

. Disse funnene gi nye provoserende innsikt i polygenic grunnlaget for kreft i bukspyttkjertelen mottakelighet og etiologi

GPCR protein super av transmembrane reseptorer står for ~4% av hele menneskets genom og . 50% av moderne terapeutiske mål [ ,,,0],31]. Gener av den neuroaktive ligand-reseptor-interaksjon og olfaktoriske overføringsreaksjonsveier er viktige komponenter av GPCR (tabell S4). Den neuroaktive ligand-reseptor interaksjon veien forble signifikant etter justering for multippel testing i PanScan1 (

P

= 0,0006), men ikke i PanScan2 (

P

= 0,002). Men P-verdi fra meta-analysen var svært signifikant (

P

1 x 10

-5). De bidrar gener til denne veien, f.eks

CCKBR, CHRM5, EDNRA, LPAR1

,

SSTR2 /3

, og

SCTR

, har forskjellige funksjoner i regulere endokrine og eksokrine funksjoner i bukspyttkjertelen, som er svært relevant for bukspyttkjertelkreft [32], [33], [34], [35]

mennesker har . 700 olfactory reseptor (OR) gener (hvorav ≥50% er funksjonelle) [36]. Genetiske varianter av SV gener og dysfunksjoner av SV signale har tidligere vært forbundet med schizofreni [37], føtalt hemoglobin i sigdcelleanemi [38], og spredning av prostatacancerceller [39]. Selv om sammenhengen mellom lukte transduksjon og kreft i bukspyttkjertelen er fortsatt ikke klarlagt, en tidligere sekvense analyse av menneskelige pankreastumorer fant mange somatiske mutasjoner av gener, inkludert syv gener identifisert i dagens analyse:

OR13C3

,

OR13C5

,

OR10P1

,

OR1J2

,

OR4A16

,

OR51F2

, og

OR5D13 product: [40] . Uttrykk for minst to eller gener har blitt rapportert i menneskelige bukspyttkjertelen vev [41]. De to øverste bidra gener til lukte transduksjon vei,

OR13C4 Hotell og

OR13C3

, rangert som den tredje og femte mest betydningsfulle gener blant 5,127 gener analysert i denne studien. I replikering studien, forble lukte transduksjon vei som en av de beste banene med konsekvente små

P

verdier i PanScan1 og PanScan2 kohort med betydelig meta-analyse

P

verdi justert for multiple testing. På den annen side, fant vi ikke noen tilknytning av denne veien med bipolar eller Crohns sykdom i WTCCC GWAS dataanalyse. Alle disse data tyder på at foreningen av lukte transduksjon sti og kreft i bukspyttkjertelen er usannsynlig å være på grunn av tilfeldigheter. Videre replikering av denne foreningen i andre datasett og funksjonelle studier av biologiske og molekylære forbindelser mellom lukte transduksjon signalering og kreft i bukspyttkjertelen er garantert. GPCR er den første port gjennom hvilken utvendige signaler sendes inn i cellen. Høy aktivitet av GPCR kan bidra til transduksjon av utenfor skadelige signaler, slik som insulin, glukose, eller kreftfremkallende, inn i en celle og induserer en kaskade av reaksjoner relatert til kreftutvikling.

I tillegg til disse to veier, fire ekstra trasé også bestått Bonferroni korreksjon for multiple sammenligninger, dvs. MODY, Fc epsilon RI, langvarige depresjoner og vaskulær glatt muskulatur sammentrekning veier. Men MODY veien var svært viktig i PanScan1 men var ikke signifikant i PanScan2. Den reduserte eller svakere gen utsatte krets i PanScan2 er tidligere blitt observert for andre gener [3], [4]. Denne forskjellen kan være relatert til det faktum at PanScan1 ble samlet fra 12 kohortstudier og en kasus-kontrollstudie mens PanScan2 ble trukket fra åtte case control studier. På grunn av den raske dødsfall av kreft i bukspyttkjertelen, kan kasus-kontrollstudie gjenstand for en overlevelsesskjevhet dersom testing genene er assosiert med overlevelse. Selv om meta-analyse viste ikke en signifikant

P

verdi, og denne veien blitt identifisert som den mest betydningsfulle veien i forbindelse med kreft i bukspyttkjertelen i en separat analyse av Panscan data ved hjelp av to forskjellige statistiske metoder [13]. Mody gener er en viktig del av transkripsjons nettverk som regulerer bukspyttkjertelen utvikling og differensiering tidlig i livet og opprettholder bukspyttkjertelen homeostase i voksen alder [42], [43], [44]. Tre MODY gener (

HNF1A

,

HNF4G

, og

NR5A2

) var blant de 10 beste gener med

P

verdier 0,0001 i LKM analyse . Spesielt, en annen to av de 10 beste genene,

SHH Hotell og

MYC

, er også kjent for å spille en viktig rolle i bukspyttkjertelen utvikling [45]. Gener som er involvert i organutvikling og differensiering kan bidra til muligheten for tumorceller til å proliferere og overleve, samt alter celle plastisitet, således omprogrammere celler til en tilstand som kan gi opphav til en svulst. MODY gener kan også bidra til kreft i bukspyttkjertelen ved å modifisere risikoen for diabetes [46] og fedme [47], [48], eller ved å regulere epithelial cellevekst og differensiering, lipidmetabolisme [49], protein fucosylation [50], og betennelse [51].

Fc epsilon RI er en høy affinitet reseptor for IgE, og mastcelleaktivering mediert av Fc epsilon RI er en viktig hendelse i den allergiske betennelsesreaksjon. Økende bevis indikerer at betennelse rundt svulsten, inkludert infiltrasjon av mastceller, fasiliteter tumorvekst og angiogenese i bukspyttkjertelkreft [52], [53]. Men denne vei sammen med den langsiktige depresjon og vaskulære glattmuskelsammentrekking trasé ikke har konsistente resultater i replikasjonsstudier. Dermed disse dataene må behandles med forsiktighet.

Sammenlignet med resultatene fra tidligere rapporterte kandidat sti /genet analyse [13], våre funn på veier som var inkludert i begge studiene var ganske konsekvent, det vil si en positiv finne på bukspyttkjertelen utvikling (aka MODY) sti /gener og negative funn på DNA-reparasjon, apoptose, insulinsignalering, wnt, hakk og pinnsvin trasé /gener.

Dette er uten tvil den største undersøkelsen i bukspyttkjertelen kreft med den mest omfattende analyse av alle biologiske pathways identifisert fra KEGG ved hjelp av en agnostisk tilnærming. Ved hjelp av PCA i GRASS sterkt redusert dimensjonalitet av GWAS data og økt sannsynligheten for peke ut nyttig informasjon. Bruke LKM metode vant påvirkning av positive og negative effekter av SNPs og gjort oss i stand til å identifisere nye gener i tillegg til å kopiere de genområder oppdaget av tidligere marginal-assosiasjonsstudier [54]. Ved å utføre den GRASS analyse i to uavhengige kohorter, har vi vist konsistente funn på noen av de viktige veier. Videre replikering av disse funnene i fremtiden ytterligere kreft i bukspyttkjertelen GWAS data er berettiget. Samlet er pathway analyse tilnærming med intensiv kontroll for falske positive funn har et stort potensial for å avdekke genet egenskaper som er forbundet med sykdommen uten a priori. Riktig bruk av dette verktøyet kan åpne opp nye muligheter for forskning på de molekylære mekanismene for kreft i bukspyttkjertelen og potensielle mål for forebygging og behandling av denne sykdommen.

Hjelpemiddel Informasjon

Tabell S1.

Liste over 197 biologiske pathways analysert i denne studien

doi:. 10,1371 /journal.pone.0046887.s001 plakater (XLS)

Tabell S2. .

Resultater av GRASS analyse i undergrupper og i WTCCC GWAS datasett

doi: 10,1371 /journal.pone.0046887.s002 plakater (XLS)

tabell S3.

Liste over 5,127 gener analysert i denne studien

doi:. 10,1371 /journal.pone.0046887.s003 plakater (XLS)

Tabell S4.

Liste over gener i hver klynge identifisert i DAVID analyse

doi:. 10,1371 /journal.pone.0046887.s004 plakater (XLS)

Takk

Vi takker alle bidragsytere til Panscan GWAS. Vi takker Dr. Yu Xin Fu for hans råd om befolkningsstrukturen analyse og Mr. Jin Yu for hans hjelp med intensive beregninger ved hjelp av CLUSTER system ved University of Texas, School of Public Health i Houston.

Legg att eit svar