PLoS ONE: Linkage Analysis i Familiær Non-Lynch syndrom Colorectal Cancer familier fra Sverige

Abstract

Familiehistorie er en viktig risikofaktor for tykktarmskreft og mange familier skille sykdommen som en tilsynelatende monogen egenskap. Et mindretall av familiær tykktarmskreft kunne forklares ved hjelp av kjente monogene gener og genetiske loci. Familiær polypose og Lynch syndrom er to syndromene hvor de disponerende gener er kjent, men mange familier har blitt testet uten å finne den disponerende gen. Vi utførte et genom bred leddanalyse i 121 kolorektal familier med en økt risiko for tykktarmskreft. Familiene ble konstatert fra Institutt for klinisk genetikk ved Karolinska Universitetssjukhuset i Stockholm, Sverige og ble ansett som negativt for familiær polypose og Lynch syndrom. Totalt 600 pasienter ble genotypet ved hjelp enkeltnukleotidpolymorfi array-chips. Parametric- og ikke-parametriske Heise analyser ble beregnet ved hjelp MERLIN i alle og undergrupper av familier. Ingen statistisk signifikant resultat ble sett, var det imidlertid tankevekkende positive HLODs over to i para kobling analyse. Dette ble observert i en recessiv modell for høyrisikofamilier, på locus 9q31.1 (HLOD = 2,2, rs1338121) og for moderat risiko familier, på locus Xp22.33 (LOD = 2,2 og HLOD = 2,5, rs2306737). Bruk av familier med tidlig debut, recessive analyse foreslått en locus på 4p16.3 (LOD = 2,2, rs920683) og en på 17p13.2 (LOD /HLOD = 2,0, rs884250). Ingen NPL score over to ble sett for noen av familiene. Vår kobling studie gitt ekstra støtte til tidligere antydet regionen på kromosom 9 og foreslo flere loci å være involvert i kolorektal kreftrisiko. Sekvensering av gener i regionene vil bli gjort i fremtidige studier

Citation. Kontham V, von Holst S, Lindblom A (2013) Kobling Analyse i Familiær Non-Lynch syndrom Colorectal Cancer familier fra Sverige. PLoS ONE 8 (12): e83936. doi: 10,1371 /journal.pone.0083936

Redaktør: Nathan A. Ellis, University of Illinois i Chicago, USA

mottatt: 8 oktober 2013; Godkjent: 18 november 2013; Publisert: 11.12.2013

Copyright: © 2013 Kontham et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Økonomisk støtte ble gitt gjennom regional avtale om medisinsk opplæring og klinisk forskning (ALF) mellom Stockholm fylkeskommune og Karolinska Institutet (20110483), den svenske Cancer Society (110439), Vetenskapsrådet (20103543), The Stockholm Cancer Foundation (111 232) og Nilsson-Ehle Foundation. SNP teknologiplattform i Uppsala er støttet av Knut Alice Wallenberg-stiftelsen via Wallenberg Consortium og Uppsala Universitet. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP (CRC) øker i forekomst og er rangert som den nest og tredje vanligste krefttypen i den vestlige verden og Sverige henholdsvis. CRC har en levetid risiko for 5% og rammer menn og kvinner likt. En viktig risikofaktor er en familie historie av sykdommen og 20-25% av alle CRC tilfeller har en nær slektning med samme sykdom [1]. Kjente syndromer som familiær adenomatøs polypose (FAP) og Lynch syndrom er ansvarlig for mindre enn 5% av kolorektal kreft tilfeller [2], som etterlater et flertall av de familiære kolorektal kreft tilfeller uforklarlige. Arven antyder ofte en dominerende overføring av sykdommen, men recessiv arv og til og med en kompleks arv er blitt foreslått [3]. Et syndrom, familiær CRC typen X, er blitt foreslått for familier som oppfyller kriteriene for Lynch syndrom men uten kimlinje-mutasjoner [4]. Men familiene negative etter Lynch syndrom diagnose bare sjelden oppfyller disse strenge kriteriene, mest fordi en senere debut eller redusert penetrans. Nylig Genome Wide Association Studies (GWAS) har blitt brukt til å finne genetiske loci forbundet med en viss risiko for å utvikle CRC. Disse loci; 6p21, 8q23.3, 8q24.21, 9p24, 10p14, 11q13.4, 11q23.1, 14q22.2, 15q13.3, 16q22.1, 18q21.1, 19q13.1 og 20p12.3, 1q41, 3q26. 2, 12q13.13, 20q13.33, Xp22.2 [5-14] kunne til en viss grad støtte forklaringen på CRC som en kompleks sykdom. Historisk har sammenhengen analyse vært et vellykket verktøy finne monogen sykdom som forårsaker kolorektal kreft gener som APC [15], MSH2 [16] og MLH1 [17]. Også nye kandidatområder for ytterligere eksistensen av moderat til høy-penetrant CRC loci har blitt rapportert fra linkage studier, men ingen tilfeldig mutasjon er ennå ikke funnet. Den loci på kromosom 9q [18-20], 3Q [21,22] og 14q [23,24] har blitt rapportert mer enn én gang. En tidligere kobling studie i familiær taggete neoplasi foreslo et locus på kromosom 2q [25]. Nylig har fire forskjellige loci med en betydelig HLOD over 3; på kromosomer 12q24 i alle CRC familier, 4q21 tidlig onset-, 15q22.31 i høy risiko- og 8q13.2 i moderat risikofamilier ble foreslått [26]. Den nåværende studie utført et genom bred lenke (GWL) skanning ved hjelp av 600 personer fra 121 svenske CRC familier og analysert alle familier, tidlig onset- høy risiko og moderat risikofamilier separat.

Materialer og metoder

Etikk uttalelse

Undersøkelsen ble foretatt i samsvar med svensk lov etisk tillatelse og i henhold til vedtak i Stockholm regional etisk komité (2008 /125 til 31,2). Alle deltakerne ga skriftlig informert samtykke til å delta i studien.

Pasienter

Familiene ble konstatert gjennom klinisk genetikk avdeling ved Karolinska Universitetssjukhuset i Stockholm, Sverige mellom 1990 og 2005. FAP ble utelukket å bruke medisinske poster fra berørte enkeltpersoner og Lynch syndrom ble utelukket ved hjelp av vår nåværende kliniske protokollen [27]. Familier ble inkludert i studien hvis det var minst to berørte slektninger informative for kobling analyse, altså minst en SiB-pair. Detaljer om familiene er vist i tabell 1. tidlig debut familier ble definert som familier med en gjennomsnittlig alder av diagnose mindre enn 50, ble høyrisikofamilier definert som familier med tre eller flere berørte enkeltpersoner i nære slektninger. Moderat risiko familier ble definert som familier med to eller flere søsken berørt. Åtte familier oppfylte kriteriene for CRC typen X [4] (to overlappende med tidlig debut familier), men ble ikke analysert separat

Total

. 3 CRC

betyr 50

Sibs bare

No. families12127849Mean age64624866No. Familier med noen 5027886No. Familier med noen. 607221822Table 1. Beskrivelse av familier i sammenhengen analyse

CSV ned CSV

Genotyping

Genomisk DNA ble ekstrahert fra perifert blod ved hjelp av standard prosedyrer. Genotyping ble utført separat i to forskjellige sett av familien materiale. Genotyping av 548 pasienter med 6090 markører ble utført av Illumina infinium analyse [28,29] med Illumina HumanLinkage-12 DNA-analyse perle chip. Den samlede reproduserbarhet i genotype data var 99,996% basert på 6,25% av dupliseres genotypings. Gjennomsnittlig takst per SNP var 99,57%. I tillegg ble 52 forsøks genotypede hjelp av Illumina Golden Gate-analyse [30] og Illumina Heis Panel IVb (6008 markører). Den generelle reproduserbarhet i genotypen data var 100% basert på 2,2% av dupliseres genotypings. Gjennomsnittlig takst per SNP var 97,27%. Arrays ble behandlet i henhold til produserer protokollen på SNP Technology Platform i Uppsala og tilgjengelig på forespørsel.

Kobling analyse

Pedcheck [31] ble brukt for å se etter den innledende Mendels arvelover analyse blant familier. Familien basert genetiske modellen ble brukt for parametrisk kobling analyse for alle kromosomene, inkludert kromosom X. Som et supplement ikke-parametrisk analyse ved hjelp Whittemore og Halpern NPL statistikk ble laget [32]. LOD score samt heterogenitet LOD score ble beregnet ved å bruke MERLIN (versjon 1.1.2) [33] og ble gitt for alle genotypet stillinger. Analysene ble gjort under forutsetning både dominante og recessive egenskaper. For autosomal dominant og recessiv arve sykdommen allelfrekvens ble satt til 0,0001. De penetrans priser for dominerende og recessive arve for homozygot normal, heterozygot og homozygot påvirket ble satt til 0,05, 0,80, henholdsvis 0,80 og 0,001, 0,001, 1,0.

Personer med kolorektal kreft eller en polypp med høy grad dysplasi ble kodet som påvirket. Familiemedlemmer med uklar status ble kodet som ukjent. Familier ble konstatert forutsatt en dominant egenskap og ektefeller ble derfor kodet som upåvirket. Fire forskjellige analyser ble utført ved å bruke forskjellige sett av familier og pasienter; alle familier, alle familier med minst tre tilfeller (høy risiko), alle familier med CRC blant søsken (moderat risiko) og familier med en gjennomsnittsalder på under 50 (tidlig-debut) for å være sammenlignbare med resultatene fra den siste sammenhengen studie av Cicek et al.

alle 121 familier, inkludert alle fag fra begge genotyping økter, ble brukt for kobling analyse. Således ble to markør filer sammen og 7256 markører ble anvendt i analysen. Merlin som standard tillater maksimalt 24 bits for hver familie, hvorfor fire store familier måtte deles. Familiene ble delt slik at hver sub-familie brukes en felles stamfar og montert inn grensen som definert mens du kjører programmet. Den opprinnelige 121 familier ble analysert som 126 (en familie måtte deles i tre).

Siden nærvær av koblingsulikevekt (LD) kan blåses flerpunkts linkage statistikk, en terskel på r

2 = 0,1 har blitt brukt for å unngå at falske positive resultater blåse statistikken [34]. LD blant SNPs med r

2 0.1 ble redegjort for, ved MERLIN organisere markørene i klynger. MERLIN gjør bruk av befolkningen haplotype frekvenser å anta LD innenfor hver klynge. For å opprettholde jevnheten i studien undergrupper ble de samme klyngene kontinuerlig brukt i alle analyser.

Resultater

Totalt 600 personer fra 121 familier ble vellykket genotypede. Analysene ble utført for hver og en av tre forskjellige undergrupper; høy risiko, moderat risiko og tidlig debut av familier (tabell 1). Det var ingen statistisk signifikant individuell (over tre) LOD-poengsum eller HLOD i en hvilken som helst av analysen (figur 1). Men det var positive HLODs over to (tabell 2).

a) Plot av HLODs for alle familier i studien, dominerende (i rødt) og recessive (i blått) modeller (n = 121).

b) LOD /HLOD tomt på studie gruppe med mer enn 3 berørte enkeltpersoner (n = 27)

c) LOD /HLOD tomt på kollokviegruppe med gjennomsnittsalder på diagnose 50 (n = 8).

d) LOD /HLOD tomt på kollokviegruppe med berørte sibs (n = 49).

* -negative verdier av score er ikke plottet vist.

For b, c, d – Lods er representert i Rødt, er HLODs representert i Cyan

Study Group

nr. Av familier

Disse omegn cm, SNP

Modell

HLOD (α)

Alle families121 —- Mer enn tre affected279q31.1102.68, RS1338121Recessive2.212 (0,66) Mean alder Diagnose 5084p16.37.17, RS920683Recessive2.184 (1.00) 17p13.211.51, RS884250Recessive2.086 (1.00) Familier med berørte Sibs49Xp22.337.42, RS2306737Recessive2.486 (0.79) Tabell 2. Sammendrag av tykktarmskreft Heise resultater med maksimale observerte HLODs større enn to.

CSV Last ned CSV

for høyrisikofamilier (totalt 27 familier) en locus på kromosom 9q31.1, viste en HLOD over to forutsatt recessiv arv og anslagsvis 66% av familiene med lenke (tabell 2). Maksimal var for markøren rs1338121 med HLOD på 2,2. LOD på samme locus i recessive modellen var 0,7. For dominant sykdom dette locus viste en LOD score på 1,4 og en HLOD på 1,6.

For moderat risikofamilier (totalt 49 familier, analysert som 50) en locus på spissen på kromosom Xp hadde LOD og HLOD over to med maksimal 2,2 og 2,5 henholdsvis for markøren rs2306737 i recessive analyse ( tabell 2). LOD score og HLOD for dominerende analyse var begge 1,8.

Til slutt, for den gruppe av familier med tidlig debut (bare 8 familier) to loci viste positive LOD score og HLODs over to i recessive analyse (tabell 2). En var distal på kromosom 4p med en maksimal LOD og HLOD på 2,2 for rs920683 og den andre var på kromosom 17p13.2 med en maksimal LOD og HLOD på 2,0 for rs884250. LOD og HLOD for dominerende analyse var 0,976 på kromosom 4p og 1,25 på kromosom 17p13.2. De Lods var lik i parametrisk og ikke-parametrisk analyse og 100% knyttet familier ble antatt for begge loci.

Ingen NPL score over to ble sett for noen av familiene. HLODs over 2 er presentert i tabell 2. Alle loci med en HLOD 1.0 i parametrisk analyse er vist i tabell 3.

Study Group

No. Av familier

Linked omegn cm, SNP

Modell

HLOD (α)

All Families1211q32.1204.36, RS2032018Dominant1.191 (0,46) 5p15.233.99, RS879253Dominant1.258 (0,48) 9q22. 3197,96, RS4534181Dominant1.602 (0,59) 94,37, RS7037744Recessive1.632 (0,32) Xp11.2179.25, RS2015312Dominant1.414 (0,72) 4p16.32.97, RS736455Recessive1.653 (0,38) 6p21.164.36, RS722269Recessive1.892 (0,28) 8p2233.01, RS334206Recessive1.479 (0,26) 18p11.2140.13, RS1043925Recessive1.351 (0,27) Mer enn 3 affected271q32.2211.46, RS1507765Dominant1.414 (0,61) 2p16.277.83, RS1483869Dominant1.438 (0,60) 4q28.3134.94, RS426029Dominant1.045 (0,54) 5p15 .134.80, RS1505034Dominant1.678 (0,71) 9q31.1102.68, RS1338121Dominant1.672 (0,79) 12q13.1263.98, RS7532Dominant1.086 (0,51) 16q12.265.68, RS1990637Dominant1.556 (0,77) Xp11.2179.24, RS1560514Dominant1.788 (1.00) 1q25 .2178.47, RS227530Recessive1.554 (0,55) 4p16.32.97, RS736455Recessive1.903 (0,68) 18p11.2140.13, RS1043925Recessive1.605 (0,48) Xp11.367.42, RS1137070Recessive1.267 (0,56) Mean alder ved diagnose 5082p16.374.90, RS1394207Dominant1.145 (1.00) 9p21.345.61, RS10757309Dominant1.614 (1.00) 10q22.186.06, RS1227938Dominant1.200 (1.00) 16q2180.78, RS17822576Dominant1.181 (1.00) 17p13.124.87, RS1391766Dominant1.258 (1.00) 1p3372.10, RS1934405Recessive1.244 (1.00) 6p21.167.58, RS4714772Recessive1.335 (1.00) 9p21.345.61, RS10757309Recessive1.501 (1.00) 10q26.3166.39, RS7072831Recessive1.239 (0,90) 18q11.242.92, RS12959039Recessive1.279 (1.00) familier med berørte Sibs494p15.238.72, RS216113Dominant1.112 (0,96) 6q23.3136.59, RS975676Dominant1.848 (1.00) Xp22.3311.69, RS749706Dominant1.860 (1.00) 6q14.191.67, RS885582Recessive1.241 (0,33) 12q23.1107.90, RS17290272Recessive1.034 (0,26) 14q24.378.12, RS888412Recessive1.032 (0,29) 20q13.3193.25, RS186659Recessive1.410 (0.37) Tabell 3. oppsummering av tykktarmskreft Heise resultater med maksimale observerte HLODs mellom 1 og 2.

CSV ned CSV

diskusjon

Vi brukte SNP genotyping for å utføre en kobling analyse i 121 CRC familier, og fant ikke noen samlet statistisk signifikante resultater med en LOD eller HLOD løpet 3. et par store familier ble splittet for å kunne bruke MERLIN, og mistet en bit av sin makt i analysen. Effekten av dette var av liten betydning.

Men vi fant Lods og HLODs over 2, kan tyde på kobling. En tidligere kobling studien brukte 356 familier og viste en locus med HLOD 3 (12q) og 4 med HLOD 2 (på kromosomer 4Q, 15Q, VED BETJENING 17Q og 12Q), alle i dominerende analyse [26]. Vi fant ingen støtte for noen av disse områdene i vår analyse.

I vår delstudie av store, høyrisikofamilier (mer enn tre affecteds), et locus på kromosom 9q31 ble funnet. Den samme region har blitt foreslått før, men i dominerende modellene, og ble her igjen identifisert av oss ved hjelp av kobling analyse i en recessiv modell. Dette locus ble tidligere foreslått av en søskenparet studie og en studie ved hjelp av båndet i mange slekter og også tidligere av oss i en stor familie med endetarmskreft og adenomer [18-20]. De tre studiene brukt mikro for genotyping mens tidligere linkage studier med SNPs ikke var i stand til å gjenskape locus [18,26,35]. En studie har også vist støtte for regionen ved hjelp av en fem-SNP haplotype i regionen [36]. To gener har hittil blitt foreslått som den som disponerer genene i denne regionen. Først ble det foreslått at kimlinje allel-spesifikk ekspresjon resulterte i redusert ekspresjon av genet endre SMAD-mediert TGF-beta-signalisering [37]. For det andre, en studie av GALNT12 genet demonstrert avkorting somatiske og germline mutasjoner i CRC pasienter, men ingen i kontroller og genetiske defekter i O-glykosylering veien delvis ligger til grunn avvik glykosylering, og dermed bidra til utvikling i en undergruppe av CRC [38] . Regionen foreslått av vår nåværende studie lapper godt med regionen foreslått av en familie før [19]. Regionen strekker seg over nesten 9 Mb og inkluderer de ovenfor nevnte gener og mange andre. Fire familier bidrar mest til den positive, dominant og recessiv HLOD poengsum. Bare én familie hadde tidlig debut av sykdommen. Den Cicek undersøkelsen definert for en lignende gruppe på 67 familier en locus med HLOD 3 (15Q) og 4 med HLOD 2 (kromosomer 12Q, 14q, VED BETJENING 17Q og XP) noen bruker dominant eller recessiv (kromosom 14) modell. Vi fant ingen støtte for noen av disse områdene i vår studie. Men vi hadde en HLOD en nær kromosom X regionen.

For moderat risikofamilier, med berørte sibs bare, en region på tuppen på kromosom X ble foreslått i recessive modell (maks HLOD = 2,2) og ligner på kromosom 9 locus det var også en positiv, men lavere LOD ved hjelp av en dominerende modellen (0.7). Denne regionen er nesten 6 Mb, har ikke vært foreslått før, og inneholder mange kandidatgener. Den Cicek Studien inkluderte 200 moderat risikofamilier og også ved hjelp av recessive modellen de identifiserte ett locus med en HLOD 3 (8Q) og fire loci med en HLOD 2 (kromosomer 1Q, 6p, 8Q og 22q). Vi kunne ikke finne støtte for noen av disse loci.

Til slutt har vi observert ved hjelp av en recessiv modell to loci med høye HLODs (4p og 17p) for tidlig innsettende familier. Men denne gruppe besto av bare 8 familier. Familie 8 var også blant de med høy risiko familier knyttet til kromosom 9 locus og for denne størrelsen på familien er det forventet at en hel genom studie skal generere kobling til mange regioner, og dermed de fleste vil være falske positiver. Vi kunne ikke gjenskape noe av loci fra Cicek et al. bruker dominant eller recessiv modell (kromosomer 4Q, 14q, 15Q og 22q).

En tidligere studie med fokus på adenom og kolorektal adenom og karsinom funnet kobling til kromosomregioner på kromosomene 18q21 og 2p22 i 69 familier mens en sub- analyse av 55 familier med kreft viste bare kobling til kromosom 3q21-24 [21]. Ingen av disse regionene ble bekreftet av Cicek studien eller etter denne studien. Det er overraskende at 4 linkage studier inkludert denne, alt ved hjelp av SNP-markører ikke genererer noen overlapping loci [21,26,35]. Det er flere forskjeller mellom studiene skjønt, som er mulige forklaringer på dette avviket. Den etnisitet av fagene i studiene er forskjellig, en studie er fra USA, en er fra Netherland, en fra Storbritannia og vår studie er basert på den svenske befolkningen. Utvalgsstørrelsene er også forskjellige, den amerikanske studien har totalt 356 familier, den nederlandske bare syv store familier, den britiske studien 69 og våre studie 121 familier. Rekrutteringsprosessen også skilte mellom alle fire studiene, men generelt de fleste av de ulike resultatene kan forklares også av biologi og ulike predisponerende elementer i hver prøvesettene. Fremtidige eksperimenter må vurdere dette heterogenitet i sin design.

Litt til vår overraskelse vi kunne se også positive para LOD-score i denne studien sammenlignet med våre tidligere de [22,23] der bare HLODs ble oppnådd. Dette kan være relatert til det faktum at vi brukte SNP’er istedenfor mikro i denne studien. Mikro er mye mer informativ og dermed ofte svært lave negative Lods er sett når en familie ikke er knyttet til. I denne SNP orientert eksperiment få familier hadde Lods under -2 og dermed makt til å ekskludere kobling i vårt eksperiment ble lav. Men makt for å oppdage sammenhengen ble beholdt (som vi testet ved hjelp av vår familie 24 med en LOD av tre for kromosom 9 locus) [19]. Resultatet kan også forholde seg til det faktum at familier i denne studien ble mindre i forhold til våre tidligere studier ved hjelp av 20 og 30 store stamtavler [22,23]. Her har vi brukt en annen strategi med 121 mindre familier og i motsetning til våre tidligere linkage studier kan vi finne støtte til kandidaten regionen på kromosom 9. Vi har tidligere brukt SimWalk2 for kobling analyse med mikro markører, men det var ikke til rette for analyse av SNP data . For å rettferdiggjøre å bruke MERLIN, analyserte vi familie 24 og kromosom 9 bruker SimWalk2 (data ikke vist), som tok tre uker å fullføre men fått identiske resultater.

I konklusjonen, vår kobling studie gitt ekstra støtte for regionen på kromosom 9, noe bevis for nye loci å være involvert i kolorektal kreftrisiko og ingen støtte for andre tidligere rapportert loci. Dette antydet heterogenitet hvis familiær CRC skal påvirke utformingen av fremtidige foreningen og linkage studier.

Takk

Genotyping ble utført av SNP Technology Platform i Uppsala, (www.genotyping.se). Støtte ved Bioinformatikk Infrastruktur for miljø- og biovitenskap (Bils) er takknemlig anerkjent.

Legg att eit svar