PLoS ONE: Identitet av Descent Kartlegging av Grunnlegger mutasjoner i kreft ved hjelp av høy oppløsning Tumor SNP Data

Abstract

Tette genotype data kan brukes til å oppdage kromosomfragmenter arvet fra en felles stamfar i tilsynelatende ubeslektede individer. En sykdomsfremkallende mutasjon arvet fra en felles grunnlegger kan således påvises ved å søke etter en felles haplotype signatur i en prøve populasjon av pasienter. Vi presenterer her FounderTracker, en beregningsmetoden for genom-wide påvisning av grunnlegger mutasjoner i kreft ved hjelp av tett kreft SNP profiler. Vår metode er basert på to forutsetninger. Først, villtype-allelet gjennomgår ofte tap av heterozygositet (LOH) på svulster i kimlinje-mutasjoner bærere. For det andre vil det overlapp mellom forfedrenes kromosomfragmenter arvet fra en felles grunnlegger definere en minimal haplotype bevart i hver pasient bærer grunnleggeren mutasjon. Vår tilnærming bygger dermed på påvisning av haplotyper med betydelig identitet ved nedstigning (IBD) deling innenfor tilbakevendende regioner av LOH å markere genomisk loci sannsynlig til båtplass grunnlegger mutasjon. Vi validert denne tilnærmingen ved å analysere to ekte kreft datasett der vi lykkes identifiserte grunnleggeren mutasjoner av godt karakterisert tumorsuppressorgener. Vi så brukt simulerte data for å evaluere evnen til vår metode for å påvise IBD traktene som en funksjon av deres størrelse og frekvens. Vi viser at FounderTracker kan oppdage haplotyper av lav prevalens med høy effekt og spesifisitet, betydelig bedre resultat enn eksisterende metoder. FounderTracker er dermed et kraftig verktøy for å oppdage ukjente grunnlegger mutasjoner som kan forklare en del av «manglende» arvbarhet i kreft. Denne metoden er fritt tilgjengelig og kan brukes online på FounderTracker nettstedet

Citation. Letouzé E, Sow A, Petel F, Rosati R, Figueiredo BC, Burnichon N et al. (2012) Identity av Descent Kartlegging av Grunnlegger mutasjoner i kreft ved hjelp av høy oppløsning Tumor SNP data. PLoS ONE 7 (5): e35897. doi: 10,1371 /journal.pone.0035897

Redaktør: Thomas Mailund, Aarhus Universitet, Danmark

mottatt: 22 februar 2012; Akseptert: 23. mars 2012; Publisert: 02.05.2012

Copyright: © 2012 Letouzé et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet er en del av CIT program fra den franske Ligue Nationale Contre le Cancer (https://cit.ligue-cancer.net/index.php/en). Dette arbeidet ble støttet med tilskudd fra Institut National du Kreft og CNRS (LIA NEOGENEX) til Enzo Lalli; CNPq og kapper tilskudd til Bonald C. Figueiredo. Dette arbeidet ble støttet av programmet Hospitalier de Recherche Clinique tilskuddet COMETE 3 (AOM 06 179). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

med bruk av SNP arrays og neste generasjons sekvensering, er det nå mulig å genotype millioner av SNPs i et enkelt eksperiment, til lave kostnader. Dette har gjort det mulig å påvise DNA-områder arvet fra en felles stamfar i to tilsynelatende ubeslektede individer. To strekninger av DNA er sagt identisk med nedstigning hvis de er identiske på grunn av felles opphav. Påvisning av identitet ved nedstigning (IBD) i populasjoner regnes som en svært lovende tilnærming til sammenhengen kartlegging av sykdomsgener. Faktisk er ledd analyser utføres vanligvis i små stamtavler inneholdende nært beslektede individer. Følgelig IBD segmentene identifisert en tendens til å være for lang til å avgrense fokale områder av interesse med et begrenset antall kandidat gener. I motsetning områder av IBD i ubeslektede individer sjelden strekker seg mer enn noen få centimorgans (CM). Populasjonsbaserte linkage studier er derfor svært nyttig for den fine avgrensning av kandidaten loci [1]. Flere kraftige fremgangsmåter er blitt beskrevet for å påvise områder med IBD mellom par av individer, basert på tett faset [2], [3] eller unphased [4], [5] genotyping data. Disse metodene er nyttige for parvise IBD deteksjon, men populasjonsbasert binding kartlegging krever påvisning av genomiske regioner med et betydelig overskudd av IBD i tilfeller av sykdommen i forhold til kontrollene. To metoder ble nylig foreslått for påvisning av IBD mellom flere individer: en Markov Chain Monte Carlo-metode (MCMC) [6], og DASH (DASH Associates Shared haplotyper) [7], en graf basert algoritme som bygger på parvise IBD segmenter å antyde klynger av IBD individer. En vesentlig begrensning av MCMC er at det medfører intens beregning og er derfor ikke egnet for analyse av store datasett bestående av høy tetthet SNP profiler. DASH er mye raskere, men bare returnerer en liste over haplotyper som er identiske ved nedstigning i flere prøver. Betydelig berikelse i sykdomstilfeller kan deretter bli vurdert gjennom en statistisk sammenheng test. Imidlertid tar denne tilnærmingen bare hensyn til hyppigheten av konserverte haplotyper, og ikke deres lengde. Likevel, en lang haplotype, selv påtreffes i noen få tilfeller, er egnet til å indikere nærværet av en grunnlegger mutasjon.

Vårt fremgangsmåte er spesielt dedikert til kartlegging av kreftgener. Et sentralt trekk ved kreftformer er at tumorceller akkumulerer kromosomforstyrrelser som gir en vekstfordel i løpet av kreft progresjon, slik at tumoren genomet blir til slutt en meget omorganisert versjon av den konstitutive genomet av pasienten. Dessuten er plasseringen av somatiske endringer delvis drevet av tilstedeværelse av risiko alleler i kimlinje-genomet [8]. Spesielt pasienter arve en germline mutasjon i et tumor suppressor gen ofte mister sin normale motstykke i kreftceller, avslører mutant fenotype, som i Knudson to-hit modell [9]. Dermed er kimlinje-mutasjoner ofte er lokalisert i områder med tap av heterozygositet (LOH). Denne funksjonen er spesielt nyttig for binding kartlegging av kreftgener. For det første kan regioner i LOH brukes til å prioritere jakten på tilbakevendende IBD. For det andre, når en genomisk region gjennomgår LOH, gjenstår bare en av de to sperre kromosomer i tumor-DNA, slik at haplotype av denne kromosom er gitt direkte av svulsten SNP profilen, uten behov for en haplotype-fase trinn. Minimal regioner av LOH er dermed et ideelt utgangspunkt for påvisning av tilbakevendende IBD i en befolkning prøve av svulster.

Vår metode er utviklet for å oppdage kreft mutasjoner arvet fra en felles grunnlegger, ved hjelp av tilbakevendende IBD i minimal regioner av LOH (figur 1). Bygge på germline algoritmen [3] for parvise IBD deteksjon i faset haplotyper, beskriver vi en scoring tilnærming som tar hensyn til både hyppighet og lengde på IBD segmenter for karakterisering av betydelig konservert haplotyper i et sett av tumorprøver. Vi validere denne tilnærmingen på to virkelige kreft datasett. I det første datasettet, som består av 13 barne binyrebark svulster fra sørlige Brasil, avgrense vi en konservert haplotype som strekker seg over 520 kb rundt tidligere rapportert p.R337H

TP53

grunnleggeren mutasjon. I det andre datasettet, som består av 30 feokromocytomer og paragangliomas, oppdager vi en ny grunnlegger mutasjon av

SDHD

genet, til stede i bare to prøver. Til slutt viser vi med simulert data som FounderTracker oppdager konserverte haplotyper av lav prevalens med høy effekt og spesifisitet, betydelig bedre resultat enn eksisterende metoder.

Resultater

Oppdage bevart haplotyper i tilbakevendende regioner av LOH

Vår strategi for populasjonsbasert kobling kartlegging av grunnlegger mutasjoner i kreft er illustrert i Figur 1. en mutasjon sprer seg gjennom en populasjon blir overført innenfor en kromosom-fragment fra den felles stamfar, som blir mindre fra generasjon til generasjon på grunn av genetisk rekombinasjon ved meiose. Alle mutasjonsbærere er dermed identisk med nedstigningen til deres felles stamfar for kromosom region husing germline mutasjon. I tillegg, er villtype-motstykke av den muterte genet ofte tapt ved LOH i tumorer som opptrer i kimlinje-mutasjonsbærere. Vår tilnærming til kartlegging av grunnlegger mutasjoner ved hjelp av SNP array-data og dermed innebærer (i) identifisere tilbakevendende regioner av LOH, (ii) gjenreise kreft haplotyper i disse regionene, og (iii) å lete etter tilbakevendende IBD i tumor haplotyper.

Dette diagrammet illustrerer prinsippene vår metode. En av grunnleggerne mutasjon (rød stjerne på prinsippskisse av kromosomer) spres gjennom en befolkning innenfor et kromosom fragment (i rødt) arvet fra forfedrenes grunnleggeren (A). På grunn av kryssende-overs (stiplede linjer) mellom homologe kromosomer i meiose, er dette kromosomet fragment forkortet over generasjoner, slik at mutasjonsbærere (angitt i rødt) til slutt havna bare et kort identisk ved nedstigning (IBD) haplotype rundt muterte genet (B ). I tillegg er villtype motstykke av kimlinje-mutasjoner ofte tapt ved LOH i tumorer, slik at legger mutasjonen typisk ligger innenfor et minimalt område av LOH (C). Som et resultat, er legger mutasjon lokalisert innenfor en haplotype konservert i hver mutasjon bæreren (peak IBD score), i den minimale region av LOH (D).

Med en sonde rettet mot hver av de to alleler fra hver SNP, SNP matriser er et utmerket verktøy for genom-wide deteksjon av LOH, og flere algoritmer har blitt beskrevet for dette formål [10], [11]. I denne studien, bruker vi Genome Endring Trykkemetode [12] for å påvise LOH, som definerer et sett av tilbakevendende regioner av LOH på grunnlag av deres frekvens i tumoren datasettet.

Vi deretter rekonstruere haplotype av tilbakeholdt allel i hver tumor (figur 2). Som bare ett av de to kromosomer forblir i tumoren på grunn av LOH, genotypene oppnådd for tumor-DNA direkte gi den haplotype av kromosomet holdes tilbake i tumorceller. Forresten, hvis konstitutive DNA er også tilgjengelig, en sammenligning av unphased genotyper av konstitutive DNA med tumor haplotype kan utføres for å utlede haplotype av den tapte kromosomet. For å estimere feilfrekvensen i forbindelse med denne metoden, sammenlignet vi haplotypene rekonstruert i to svulster fra den samme pasient i hvilken det samme kromosom ble tapt ved LOH [13], og vi oppnådd en meget lav feilrate (mindre enn 5 x 10

-5)

genotyper kan utledes fra SNP array-data, med B-allel frekvens (BAF), som karakteriserer den fluorescens-forholdet mellom A- og B-allelene i hver locus:.

BAF = B /product: (

A + B

). I konstitutive DNA, er hver SNP til stede som to alleler. Genotypen til hvert SNP (AA, AB, eller BB) kan således bestemmes fra BAF (0, 0,5 eller 1, henholdsvis), men ikke den haplotype av hvert kromosom. I motsetning til dette, dersom en av de to kopiene har gått tapt ved LOH i tumor, tumor SNP profilen reflekterer direkte haplotype av kromosomet som holdes tilbake i tumoren. Hvis sammenkoblede konstitutive og kreft DNA-prøver er tilgjengelig, kan haplotype av den tapte kromosom rekonstrueres ved å sammenligne de to profilene.

Til slutt, søker vi etter betydelig tilbakevendende IBD i settet av rekonstruerte kreft haplotyper. Den analytiske rørledning for dette trinnet er vist i figur 3. Deler av parvise IBD blir først identifisert med kimlinje-algoritmen [3]. Vi deretter tildele en poengsum til hver parvise IBD segment, tar hensyn til både antall og allele frekvenser av SNPs innen hvert segment (se Materialer og metoder). En IBD poengsum blir så beregnet for hver SNP markør, ved å summere resultatet av alle de parvise IBD segmenter som inneholder dette SNP. Koblingsulikevekt (LD) må også tas i betraktning, fordi genomiske regioner med sterk LD vil systematisk ha høye IBD score (Figur S1). Vi vil derfor sammenligne, for hver SNP, IBD scorer oppnådd for svulster med en null distribusjon av IBD score etablert ved hjelp av et referanse sett haplotyper fra friske kontrollpersoner (f.eks faset haplotyper fra 1000 genomer prosjekter).

FounderTracker rørledning for tilbakevendende IBD deteksjon er delt opp i to trinn. En IBD score er først beregnet for hver SNP markør i svulsten satt av haplotyper. IBD poengsum er avledet fra den parvise IBD segmentene identifiseres med germline algoritmen. Det tar hensyn til deres lengde og allele frekvenser av SNPs innen hvert segment. Den IBD poengsum for svulster blir så sammenlignet med en null distribusjon etablert fra en referansedatasettet, for å identifisere SNPs med IBD skårer betydelig høyere enn forventet ved en tilfeldighet.

Søknad til tilfelle av barndommen binyrebark svulster i det sørlige Brasil

Som en proof-of-concept, vi først brukt vår metodikk til eksemplet med barndoms binyrebark svulster (ACT). Disse sjeldne kreftformer (0,3-0,4 tilfeller per år per million barn under 15 år) er svært utbredt i det sørlige Brasil (3.4-4.2 tilfeller per million) [14], hvor de er nesten alltid knyttet til en bestemt germline mutasjon av

TP53 plakater (c.1010G A, p.R337H) [15], [16], identifisert som en av grunnleggerne mutasjon [17]. Vi analyserte 13 brasilianske tilfeller av ACT og seks matchet blodprøver på Illumina 370K SNP arrays. Alle svulster ble funnet å bære p.R337H

TP53

mutasjon. Vi brukte Genome Endring Skriv ut metoden for å oppdage LOH. Denne metoden identifiserte to regionene viser LOH i alle prøver: en 4,4 Mb region på 11p15, og hele kromosom 17. Vi deretter anvendt FounderTracker for å detektere tilbakevendende vesentlig IBD i disse to regionene. Ingen signifikant region av IBD ble detektert i 11p15-regionen (figur S1), men meget signifikante IBD skår ble oppnådd for 17p13 region (q-verdi 2,2 x 10

-16). Spesielt peak IBD poengsum definert en 520 kb regionen rundt

TP53

genet (figur 4a). Detaljert haplotype-analyse avslørte at mutert kopier beholdes i de 13 svulstene vises en identisk haplotype for denne regionen, mens villtype kopier rekonstruert for de seks pasientene med passet blodprøver vist forskjellige haplotyper (figur 4b). Dette tilbakevendende IBD segmentet tilsvarer dermed kromosomet fragment bærer p.R337H

TP53

mutasjonen arves av alle pasientene fra den felles grunnlegger, som ikke har blitt avbrutt av crossover i avstamning.

den IBD poengsum beregnes langs kromosom 17 for settet av 13 barndoms binyrebark tumorer (ACT) viser en betydelig topp på 17p13.1 (A). De skarpe økninger i IBD stillingen kurve svarer til grensene for IBD segmenter i hvert par av tumorer. Toppen regionen er representert i detalj i panel B, med haplotyper av de 13 kromosom kopier beholdes i svulstene (husing mutant

TP53

allel), og haplotyper av kromosom kopier tapt ved LOH (skjuler en villtype

TP53

allel) rekonstruert for de seks pasientene med matchet normale blodprøver. De haplotypene av villtype-alleler er alle forskjellige, noe som viser at det finnes forskjellige haplotyper for dette genomiske region i befolkningen analysert. Derimot, en haplotype felles for alle mutante alleler spenner 470 kb oppstrøms og 32 kb nedstrøms fra

TP53 plakater (representert ved en tykk rød linje). Dette konservert haplotype tilsvarer kromosomet fragment skjuler den R337H

TP53

mutasjon arvet fra forfedrenes grunnleggeren.

Det gjennomsnittlige lengden på parvise IBD traktene rundt

TP53

var 5,4 cm (varierer fra 0,88 cm til 19 cm, Figur S2). Som parvise IBD segmentene er anslått å ha en lengde på

1 /product: (

2n

) Morgans etter

n

generasjoner (derav

2n

meiose) [ ,,,0],2], tyder dette på at p.R337H

TP53

mutasjonen oppsto rundt ni generasjoner siden.

Søknad til tilfelle av feokromocytomer og paragangliomas

feokromocytomer og paragangliomas er nevroendokrine svulster som oppstår fra binyremargen og fra sympatiske eller parasympatiske paraganglia vev hhv. Disse tumorene forekommer i sammenheng med nedarvede kreftsyndromer i ~ 30% av tilfellene [18]. Germline mutasjoner assosiert med familiær feokromocytom inkluderer mutasjoner av

RET

,

NF1

,

VHL

,

TMEM127

,

MAX

, og gener som koder for proteiner fra succinatdehydrogenase komplekset (

SDHA

,

SDHB

,

SDHC

,

SDHD Hotell og

SDHAF2

). Her har vi brukt vår metodikk for grunnlegger mutasjon funn til et sett av 30 feokromocytomer /paragangliomas fra ubeslektede pasienter. Prøvene ble fullstendig karakterisert i form av germline mutasjoner, og analysert på Illumina 610K SNP arrays. LOH Analysen avdekket ti regioner med LOH frekvens over 20%, på 1 p, 3p, 3Q, 6Q, 11p, 11q, 17p, VED BETJENING 17Q, 21q og 22q (figur 5A, øverst). For disse regionene, ble svulst haplotyper rekonstruert fra B allelfrekvens profiler, og analysert med FounderTracker å oppdage bevarte kromosomsegmenter. Denne analysen avslørte en 2,34 CM region med betydelig IBD ved 11q23.1 (figur 5A, nederst). Interessant, inneholder dette kromosom segmentet 32 ​​gener inkludert

SDHD

, og er identisk ved nedstigningen i to prøver (HS_048 og HS_158, figur 5B), som er nøyaktig de to prøvene i vårt kohort for hvilken en c.64C T (p.Arg22X) kimcellelinje

SDHD

mutasjon ble identifisert (tabell S1). Dette funnet viser at p.Arg22X

SDHD

mutasjoner i disse to tilsynelatende urelaterte pasienter stammer fra en enkelt grunnlegger, og ytterligere validere relevansen av vår metode for påvisning av grunnlegger mutasjoner i kreft.

( A) LOH analysen avslørte 10 kromosomarmer med LOH frekvens 20% i vår sett 30 feokromocytomer og paragangliomas (øverst). Disse områdene ble analysert ved hjelp FounderTracker å oppdage bevarte haplotyper, avslører en eneste betydelig region på kromosom arm 11q (nederst). (B) Visualisering av den betydelige regionen identifisert på kromosom 11 med Genomics Viewer [44]. IBD poengsum er representert som en blå linje over kreft haplotyper. Haplotyper er representert som serie av blå og gule vertikale linjer, svarende til SNP’er med henholdsvis «A» og «B» genotype, ifølge Illumina nomenklatur. Den betydelige region påvises ved FounderTracker svarer til den lange haplotype som er identisk i tumorer HS_048 og HS_158, og resulterer i en høy IBD score for dette segmentet. Denne regionen inneholder 32 gener, inkludert

SDHD plakater (angitt i rødt).

Evaluering av kraften av metoden med simulerte data

Barndom ACT er en ideell case study for populasjonsbasert kobling kartlegging. Som denne sykdommen er svært sjelden i fravær av p.R337H

TP53

grunnleggeren mutasjon, alle de utvalgte gjennom et tilfeldig utvalg av svulster prøver bære denne mutasjonen. I de fleste sammenhenger, svulster som kan henføres til en gitt grunnlegger mutasjon utgjør bare et delsett av kreft i en populasjon. Vi har vist med feokromocytom /paragangliom datasett som FounderTracker var i stand til å oppdage en av grunnleggerne mutasjon stede i bare to av 30 prøver (7%). For ytterligere å evaluere resultatene av vår metode, genererte vi simulerte data der vi kunstig innført konserverte haplotyper av forskjellige lengder og frekvenser. Vi testet FounderTracker ved å analysere de samme simulerte data med DASH-algoritmen, nylig utviklet for å oppdage klynger av individer dele en identisk haplotype [7], som vi tilpasset vårt formål (se Materiale og metode). Denne tilnærmingen ga gode resultater med de barndommen ACT datasettet (Figur S3), validere sin relevans som en målestokk metode.

Alle haplotyper bevart i ≥50% prøvene ble vellykket oppdaget av noen av metodene (tabell 1). Både FounderTracker og DASH var i stand til å oppdage haplotyper bevart i ≥15% prøver med god effekt ( 0,9), men FounderTracker betydelig bedre enn DASH i den lave frekvensområdet (≤10%) (tabell 1, figur 6). De ROC-kurver viser at FounderTracker detekterer tilbakevendende IBD segmenter med høy sensitivitet og spesifisitet ned til et minimum frekvens som avhenger av lengden av IBD segmenter. IBD områder med 5 cm blir detektert med god effekt ( 0,9) fra en frekvens på 5%, mens det korte segmenter på 1 cm blir detektert med de samme effekt bare ved frekvenser ≥15%. Den falske funnrate, beregnet på tvers av alle simuleringer, var ubetydelig for begge metoder (henholdsvis 8,6 × 10

-3 og 5,4 × 10

-4 for FounderTracker, og DASH).

utførelsen av FounderTracker ble vurdert under forskjellige betingelser, ved sammenligning med DASH metode. Evnen til hver metode for å detektere bevarte haplotyper ble etablert som en funksjon av haplotype lengde (1 til 5 cm) og prevalens (2 til 10% av prøvene). For hver tilstand, ble den gjennomsnittlige ROC kurven etablert ved å bruke hver metode til 100 simulerte datasett.

De simulerte data som presenteres her tilsvare SNP innholdet i Illumina 1M-Duov3 beadchip (1,199,187 markører). For å vurdere virkningen av SNP tetthet på resultatene av metoden, analyserte vi de samme simulerte data, begrenset til den eneste 373,397 SNPs av Illumina HumanCNV370-Quad chip. Selv om det var en liten degradering i deteksjon av korte haplotyper (0,5 cm) med Illumina CNV370 array, fikk vi et tilsvarende nivå av ytelse med begge markør tettheter (figur S4). Det har blitt anslått at 85% av det menneskelige genom er spredt av haplotype blokker av 10 kb eller større i europeiske prøver [19] slik at flertallet av vanlige SNPs er godt fanget av hel-genom genotyping matriser som inneholder 100.000 markører eller mer, enten direkte eller via koblingsulikevekt [20]. Våre resultater er konsistente med dette tallet og gir viktig informasjon om omfanget av anvendeligheten av vår metode, noe som tyder på at strøm oppnåelig med dagens generasjon av arrays er nær maksimal kraft IBD kartlegging.

Kjøretiden av FounderTracker er lineært knyttet til antall prøver og SNP markører analysert. For eksempel behandlingen av barndommen ACT datasettet (13 prøver, 9,762 SNPs) tok 4 min 07 sekunder, og den lengste løp i våre simuleringer, for et datasett på 100 kromosom 1 haplotyper (80,158 SNPs), tok 2 timer og 48 minutter på en enkelt kjerne av en Intel Xeon X5470 Quad-Core-prosessor på 3,33 GHz. Imidlertid, som nevnt ovenfor, liten økning i kraft ville være forventet fra analysen av tettere SNP data, slik at mengden av dataanalysen kan være begrenset, i form av markører til den aktuelle SNP innholdet av HD-matriser.

Diskusjoner

de fleste av grunnleggereffekten oppdaget hittil ble avslørt av målrettede studier av polymorfe markører rundt kjente kreftrelaterte mutasjoner. Vi introduserer her den første systematisk tilnærming for å avdekke grunnlegger mutasjoner på et genom basis, fra tette SNP profiler av tumorprøver

SNP arrays er mye brukt i kreftforskning for to hovedformål. Oppdagelsen av germline risiko varianter i linkage eller assosiasjonsstudier, og identifiseringen av tilbakevendende kromosom rearrangements. Forskere typisk studere utelukkende kimlinje genomet til forenings studier, eller tumoren genomet for analyse av kromosom rearrangementer, men en kombinert analyse av risiko alleler og kromosomforstyrrelser har vist seg å være fruktbar [21]. I denne studien brukte vi LOH å prioritere områder av interesse for IBD kartlegging. En av begrensningene ved denne tilnærmingen er at andre mekanismer, så som mutasjon eller promoter hypermethylation, kan inaktivere vill-type motstykke av en mutantgenet i fravær av LOH. Imidlertid har tidligere undersøkelser vist LOH å være et felles «andre hit» i kimlinje-mutasjonsbærere [22], [23]. Vår tilnærming er således sannsynlig å være relevant i en stor del av tilfellene. I tillegg kan høy grad av tillit haplotyper utledes fra tumor SNP profiler i regioner av LOH. IBD deteksjon kan således utføres med strenge parametre, noe som gjør fremgangsmåten svært spesifikk. Endelig er LOH på en kreft genet locus sannsynlig å være hyppigere i mutasjonsbærere enn hos ikke-bærere, som allerede vist for

BRCA

gener [24]. Ved å vurdere bare prøver med en LOH for hver kandidat region, kan vi dermed kunne oppdage bevarte lavfrekvente haplotyper som ikke ville ha blitt oppdaget som betydelig ved å vurdere hele svulsten satt.

Ingen eksisterende tilnærming var akkurat designet for systematisk registrering av grunnlegger mutasjoner i kreft, men DASH metode for påvisning av klynger av haplotyper deler identitet-by-nedstigning kan lett tilpasses vårt formål. Forskjellen mellom FounderTracker og DASH ligger i karakterisering av betydelig tilbakevendende IBD fra parvise IBD kamper. DASH identifiserer klynger av haplotyper bevart i flere prøver. Man kan teste hvorvidt en av disse haplotyper er betydelig overrepresentasjon i tumorer, sammenlignet med normale kontroller. En begrensning ved denne metoden er at når klynger er identifisert, ikke krets testen ikke ta hensyn til lengden av konserverte haplotyper. I motsetning til FounderTracker tilnærming evaluerer en IBD poengsum som tar hensyn til både frekvensen og lengden på konserverte haplotyper. Som et resultat, FounderTracker betydelig bedre enn DASH for påvisning av haplotyper bevart i eller under 10% prøver. Dette gjør en viktig forskjell i forhold til søknader, siden grunnlegger mutasjoner er sannsynlig å være relativt sjelden i de fleste tilfeller. For eksempel vil en gründer mutasjon stede i bare 5% av svulster, som ligger innenfor en konservert haplotype av gjennomsnittlig lengde 5 cm, (som p.R337H

TP53

mutasjon i brasiliansk ACT) kan oppdages med en effekt på 0.92 med FounderTracker versus 0 med DASH (tabell 1). Dessuten haplotype rundt

SDHD

, bevart i to paragangliomas, ikke blir oppdaget av DASH (figur S5). En annen eksisterende metode for påvisning av IBD i flere enkeltpersoner er det Markov Chain Monte Carlo (MCMC) tilnærming [6]. Imidlertid er denne metoden meget beregningskrevende og forfatterne beskrevne dens anvendelse i små datasettene bare (maksimalt 15 prøver og 1278 SNPs). Da vi prøvde å bruke denne tilnærmingen til vår sett med data for barndommen binyrebark svulster, metoden ikke klarte å konvergere etter flere dager. I motsetning til dette FounderTracker var i stand til å behandle det samme datasettet i noen få minutter. Vi konkluderer med at MCMC er lite egnet for analyse av HD-SNP array-data.

Vi viser, med simulerte data, at vår metode kan oppdage konserverte haplotyper på minst 0,5 cm i lengde (figur S4) . Chapman

et al.

Viste at etter 100 generasjoner av tilfeldig parring i en voksende befolkning, ville IBD traktater har en gjennomsnittlig lengde på 0,6 cm [25]. Vår fremgangsmåte er derfor egnet for påvisning av kreft-relaterte mutasjoner som ble vist mindre enn 100 generasjoner siden. Siden FounderTracker avhengig av null distribusjon av IBD score for å identifisere betydelig bevart haplotyper, anbefaler vi sterkt at FounderTracker brukere å bruke referanseprøver av samme opphav som tumorprøver for å beregne null distribusjoner. I fravær av en brasiliansk referansedata sett, brukte vi CEU data for 1000 genomer prosjektet som en referanse for analyse av binyrebark svulster, fordi befolkningen i Parana tilstand er hovedsakelig av europeisk opprinnelse [26].

Når det gjelder frekvens, kan FounderTracker detektere, med høy effekt, haplotyper konservert i mer enn 5% av prøvene, avhengig av lengden på IBD segmentene. Andelen av svulster skjuler et grunnlegger mutasjon i en tilfeldig populasjon prøve avhenger hovedsakelig på det genetiske mangfoldet i befolkningen og forekomsten av sykdommen. Sjeldne kreftformer, som for eksempel barndom ACT, med en høyere forekomst i et bestemt geografisk område er ideelle for IBD kartlegging, fordi nesten alle tilfellene skyldes grunnleggeren mutasjon. I vanlige sykdommer, som for eksempel brystkreft, ble høyfrekvente grunnlegger mutasjoner i utgangspunktet beskrevet i geografisk eller kulturelt isolerte bestander. For eksempel

BRCA1 Hotell og

BRCA2

grunnlegger mutasjoner ble først oppdaget i den jødiske befolkningen [27], [28] Ashkenazi og i Finland [29], henholdsvis. Imidlertid har omfattende analyse av disse to genene i mange geografiske områder siden avslørte eksistensen av mer enn 20 forskjellige grunnlegger mutasjoner i forskjellige regioner [30]. Disse funnene tyder på at grunnlegger mutasjoner kan være mer vanlig enn i dag trodde. FounderTracker kan brukes online gjennom en web-applikasjon, og kildekoden kan lastes ned fra vår nettside (https://cit2.ligue-cancer.net/FounderTracker).

Materialer og metoder

pasienter og etikk uttalelse

Tretten ACT pasienter fra en brasiliansk kohort [31] ble inkludert i denne studien. Etisk godkjenning for studien ble innhentet fra Pequeno Príncipe Hospital etiske komité (Curitiba, Brasil) og CONEP (Federal etiske komité i Brasilia, Brasil) i 2009. I alle tilfeller, en av foreldrene eller juridiske representanter undertegnet et informert samtykkeskjema godkjent av lokale etikkomité. DNA ble ekstrahert fra tumoren og perifert blod, som tidligere beskrevet [31].

TP53

mutasjonsanalyse ble utført som tidligere beskrevet [32].

tumorprøver fra tretti pasienter med feokromocytom eller paragangliom fra den franske COMETE nettverk, samlet inn av Georges Pompidou europeiske Hospital, ble inkludert i denne studien. Etisk godkjenning for studien ble innhentet fra Institutional Review Board (CPP Paris-Cochin, januar 2007). Alle pasienter gitt skriftlig informert samtykke for innsamling av prøver og påfølgende analyser. Svulst-DNA ble ekstrahert som tidligere beskrevet [33]. Klinisk

NF1

diagnose og genetisk testing for

RET

,

SDHA

,

SDHB

,

SDHC

,

SDHD

og

VHL

ble utført som tidligere beskrevet [33].

SNP rekke hybridisering og preprosessering

De 13 binyrebark tumorprøver ble analysert med Illumina HumanCNV370-Duo v1. 0 chips, som inneholder 370,404 sonder, og de seks matchet normalprøver ble analysert med Illumina HumanCNV370-Quad v3.0 chips, som inneholder 373,397 sonder. De 30 feokromocytomer /paragangliomas ble analysert med Illumina Human610-Quad v1.0 chips, som inneholder 620,901 sonder. Hybridisering ble utført av IntegraGen (Evry, Frankrike), i henhold til instruksjonene fra matrisen produsenten. Rå fluorescente signalene ble importert til Illumina BeadStudio programvare og normalisert, som tidligere beskrevet [34], for å oppnå den log R-forholdet (LRR) og B allel frekvens (BAF) for hver SNP. page:

https://mathgen.stats.ox.ac.uk/impute/impute_v2.html#download_reference_data.

Assessing

Legg att eit svar