PLoS ONE: Epidemiology of Doublet /plett Mutasjoner i lungekrefttilfellene: Bevis for at et delsett Oppstår ved Chronocoordinate Events

Abstract

Bakgrunn

Bevis tyder på at spontane doublet mutasjoner i normale mus vev generelt oppstå fra chronocoordinate hendelser. Disse chronocoordinate mutasjoner iblant reflektere «mutasjon dusjer», som er flere chronocoordinate mutasjoner som spenner over mange kilobaser. Imidlertid er lite kjent om mutagenese av dublett og multiplett mutasjoner (domuplets) i kreft hos mennesker. Lungekreft står for ca 25% av alle kreftdødsfall. Heri, analyserer vi epidemiologi av domuplets i

EGFR Hotell og

TP53

gener i lungekreft.

EGFR

genet er et onkogen som dubletter er generelt driver pluss driver mutasjoner, mens

TP53

genet er en tumor suppressor gen med et mer typisk situasjon hvor dubletter stammer fra en sjåfør og passasjer mutasjon.

metodikk /hovedfunnene

EGFR

identifiserte mutasjoner ved sekvensering ble samlet inn fra 66 publiserte artikler og vår oppdaterte

EGFR

mutasjon database (www .egfr.org).

TP53

mutasjoner ble samlet inn fra IARC versjon 12 (www-p53.iarc.fr). For

EGFR Hotell og

TP53

dubletter, ingen klart signifikante forskjeller i rase, ble observert etnisitet, kjønn og røykestatus. Dubletter i

EGFR Hotell og

TP53

gener i menneske lungekreft er forhøyet om åtte- og tre ganger, henholdsvis i forhold til spontane dubletter i mus (6% og 2,3% mot 0,7% ).

Konklusjon /Betydning

Selv om ingen karakteristiske er definitive, de samlede egenskapene til dublett og multiplett mutasjoner i lungekreft er konsistent med en undergruppe avledet fra chronocoordinate hendelser i

EGFR

genet: i) de åtte rammeskifte dubletter (tilstede i 0,5% av alle pasienter med

EGFR

mutasjoner) er gruppert og produsere en netto i-frame endring; ii) ca. 32% av dubletter er svært nær hverandre (≤30 nt); og iii) multipletter inneholde to eller flere tett plasserte mutasjoner.

TP53

mutasjoner i lungekreft er svært nær hverandre (≤30 nt) i 33% av dubletter, og multi inneholder vanligvis to eller flere svært tett linjeavstand mutasjoner. Arbeid i modellsystemer er nødvendig for å bekrefte betydningen av chronocoordinate hendelser i lunge og andre kreftformer

Citation. Chen Z, Feng J, Buzin CH, Sommer SS (2008) Epidemiology of Doublet /plett Mutasjoner i lungekrefttilfellene : Bevis for at et delsett Oppstår ved Chronocoordinate Events. PLoS ONE 3 (11): e3714. doi: 10,1371 /journal.pone.0003714

Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA

mottatt: 04.08.2008; Akseptert: 10. oktober 2008, Publisert: 13.11.2008

Copyright: © 2008 Sommer et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Institution.

konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft er en heterogen, multi-trinn, kompleks genetisk sykdom som følge av akkumulerte mutasjoner. Kreft generelt ble ansett å oppstå ved akkumulering av anslagsvis 5-7 forårsakende mutasjoner [1], [2]. Nylig har imidlertid Vogelstein og andre har vist i bryst og kolorektal kreft som individuelle tumorer akkumuleres ~90 somatisk muterte gener [3]. Imidlertid, et mye mindre antall (anslått til å være ~11) er sannsynlig å være involvert i tumordannelse i en gitt tumor. Oppbyggingen av så mange medvirkende mutasjoner er vanskelig å forklare utelukkende av frekvensen av flere uavhengige mutasjonshendelser. Opphopning av mutasjoner i visse kreftformer kan gjenspeile en mutator fenotype med globalt tilfeldige mutasjoner [4] – [6]. Sekvensiell utvalg tilbyr en annen forklaring [7], [8]. En mutasjon som forårsaker over-replikasjon, noe som gir opphav til en klon, som videre over-replikerer på grunn av en andre mutasjon, etc. Nylig eksistensen av mutasjons dusjer ble rapportert, øke muligheten for «kreft i et øyeblikk» hvis spredt mutasjon dusjer forekomme . Mutasjons dusjer ble funnet etter analyser av intragenic doublet mutasjoner avslørte at de var gruppert og chronocoordinate [9].

Vi viste at flertallet av dubletter i

EGFR

genet har en annen mutasjon mønster relative til singlets og bestå av driver pluss driver mutasjoner, på grunn av sekvensielle eller chronocoordinate mutasjoner, putatively etterfulgt av funksjonell utvalg av to individuelt suboptimale mutasjoner [10]. I tillegg kjøpte andre mutasjoner (f.eks T790M) i fire

EGFR

dubletter har vært rapportert etter behandling med gefitinib og erlotinib og forbundet med stoffet motstand og sykdom tilbakefall [11], [12]. I motsetning til de fleste

TP53 Hotell og

Laci

dubletter vise driver pluss passasjer mutasjoner i lungekreft og i normal Big Blue mus vev, henholdsvis. Men epidemiologi og mekanismene bak mutagenese av dubletter og flere mutasjoner er uklare.

For å belyse hyppigheten av dubletter og tydelig mutasjon mønster og spektrum i

EGFR

genet, epidemiologi dublett mutasjoner i lungekreft er analysert og sammenlignet med dubletter i

TP53

genet. Heri, finner vi at røykestatus, rase, etnisitet, kjønn og alder ikke er risikofaktorer for dublett forekomst i

EGFR Hotell og

TP53

gener. Den relative hyppigheten av dubletter er høyere i human lungekreft enn i normalt vev mus. Eksistensen av OMIDI par (se Terminologi og Forkortelser i Materialer og Metoder) i

EGFR

, den høye frekvensen av allelisk versus forbindelse heterozygote dubletter, den høye frekvensen av tett adskilte dubletter, og gruppering i multipletter er i overensstemmelse med chronocoordinate mutasjoner som bidrar til minst en undergruppe av

EGFR Hotell og

TP53

dublett og multiplett mutasjoner funnet i menneskelig lungekreft.

Resultater

Epidemiologi av dublett mutasjoner i EGFR og TP53 gener i lungekreft

Analyse av røykestatus, kjønn og etnisitet ikke avsløre en betydelig forskjell i dublett frekvens i

EGFR

gen (tabell 1, tabell S1). Gjennomsnittsalderen for pasienter med singleter og dubletter er lik (61,4 ± 11,3

vs

65,8 ± 10,3).

Resultatene for

TP53

genet i lunge kreft er lik med ett unntak. Hyppigheten av

TP53

dubletter er vesentlig høyere i asiater enn i kaukasiere (3,2%

vs

1,8%, P = 0,03) (Tabell 1, Tabell S2), men dette er ikke signifikant når korrigert for multippel sammenligning (seks Fishers eksakte tester utført for

EGFR

og

TP53

gener). Ytterligere data er nødvendig for å vurdere dette punktet.

Totalt 98/1627 (6,0%) av EGFR mutasjoner og 54/2387 (2,3%) av TP53 mutasjoner i humane lungekrefttilfellene er dubletter, en mye høyere frekvens enn som ble observert i

lacl

genet i Big Blue mus (8 ganger og tre ganger henholdsvis) (tabell 2).

Dubletter tendens til å klynge i EGFR og TP53 gener i lungekreft: «half-life of mutasjon avstand» er 9 bp og 15 bp, henholdsvis

Spontan

Laci

dubletter (0,7% av totalt antall mutasjoner) er gruppert med en avstand montering en eksponensiell fordeling og viser en lignende mutasjon mønster for å singletter, noe som indikerer en chronocoordinate aktivitet [13], [14]. Basert på den dublett avstanden mellom to mutasjoner,

EGFR

dubletter kan deles inn i to grupper: den proksimale gruppe ( 100 bp, gjennomsnittlig avstand mellom 22,8 ± 24,4-bp) og den distale gruppen (mer enn 809 bp , gjennomsnittlig avstand 12,3 ± 5,1 kb) (tabell S1). Analogt til

Laci

dubletter, en undergruppe [40% (39/98)] for

EGFR

dubletter oppstår i samme ekson med proksimale mellomrom viser en eksponensiell (R

2 = 0,9979 ) i stedet for en kvasi-uniform fordeling (fig S1). Halvparten av dubletter har mutasjoner adskilt av 9 bp eller mindre (det «halveringstid på mutasjon mellomrom»; se Terminologi i materialer og metoder).

Avstanden distribusjon for

TP53

dubletter i lunge kreft oppstår i samme ekson (43%, 23/54) viser også proksimale mellomrom ( 86 bp, gjennomsnittlig 20,2 ± 20,9 bp) og passer til en eksponentiell fordeling (R

2 = 0,979) (tabell S2, figur S1) med en halveringstid på mutasjon avstand på 15 bp. Dubletter forekommer i forskjellige eksoner ha distal avstands (131-4504 bp, gjennomsnittlig 1317,9 ± 1000 bp) adskilt av et intron. En tilsvarende avstanden som den i lungekreft ble funnet for

TP53

dubletter innen samme ekson i bryst og kolorektal kreft, med en halveringstid på mutasjon avstand mellom 24 og 16 bp respektivt (tabellene S4 og S5) .

Dermed om lag en tredjedel av

EGFR Hotell og

TP53

dubletter er høyt gruppert (≤ 30 bp) og alle dubletter oppstår innen en enkelt ekson har et internasjonalt mutasjon avstanden som er eksponentielt fordelt i stedet for den forventede kvasi-uniform fordeling, i samsvar med chronocoordinate hendelser i

lacl

i normal mus vev.

de OMIDI parene er sterke bevis for klynge chronocoordinate mutasjoner

Det store flertallet av spontan menneskelig germlime eller somatiske muse MIDI er OMIDIs (

FIX

, Big Blue); ja, om lag halvparten er enkle basisslettinger [15] – [18]. I motsetning til dette, er det en svært lav andel av OMIDIs (0,26%, 4/1526) og nonsense-mutasjoner (0,13%, 2/1526) i

EGFR

singletter, i samsvar med en sterk seleksjon for mutasjoner som endrer, stedet for å slette, funksjon. Åtte av 98 (6%)

EGFR

dubletter inneholde et par rammeskifte mutasjoner (OMIDI parene, se forkortelser i Materialer og metoder). Alle åtte av de OMIDI parene er nær hverandre (tabell 3, figur S2), med det netto resultat at en i-ramme mutasjon. Gitt en OMIDI mutasjon, en andre tilfeldig mutasjon 3 «for den første (enten IMIDI eller OMIDI) vil gjenopprette leseramme bare 1/3 av tiden, og en sub-fraksjon av det tredje fortsatt protein avkutting fordi en nonsense-mutasjon inntreffer før til den andre mutasjon. Totalt 0,49% av rapporterte

EGFR

mutasjoner (8/1627) er gruppert OMIDI par uten avkorting mutasjon som skjer før den andre OMIDI. Disse åtte OMIDI parene er forventet å ligge på samme allel; ellers vil sammensatte heterozygote OMIDI dubletter føre til to allele trunkeringer, eliminere alle

EGFR

gen-funksjon. I mellomtiden, både av de grupperte OMIDIs bør også skje i rask rekkefølge (chronocoordinate mutasjoner) i det samme cellesyklusen, fordi frekvensen av sekundære mutasjoner som forekommer tilfeldig i en spredning-manglende celle som følge av et enkelt OMIDI er sjeldne. De resterende 14 slettinger (i eksoner), 9 indels og 3 dubletter er alle i-ramme (IMIDI) mutasjoner (tabell 2, Tabell S1).

mutasjoner i enkelt OMIDI pair rapportert i

TP53

genet er 2309 bp fra hverandre, i forskjellige eksoner (tabell S2, ID # 14373), og, i motsetning til OMIDI par i

EGFR

genet, ikke sammen gjenopprette leserammen.

EGFR multi er konsistent med en singlet og en svært gruppert chronocoordinate andre mutasjon

Fire trillinger og en firling i

EGFR

ble funnet med en frekvens på 0,3% (5 /1627) av lungekreft med mutasjoner før behandling med tyrosinkinaseinhibitor (TKI) (tabell 4). Det er av interesse at par av mutasjoner i hver av de trillinger og tre mutasjoner innenfor quadruplet er tett gruppert med proksimale mellomrom (3-60 bp), i likhet med dubletter i

lacl

i normale mus vev. Den tredje mutasjon er plassert i et annet ekson med distal mellomrom. Dataene er konsistente med sekvensiell utvalg av to mutasjoner der en av mutasjonene er en chronocoordinate dublett eller trilling.

TP53

multi (6 trillinger og en firling) også står for 0,3% ( 7/2387) av totale mutasjoner (tabell S3). Fem multi (71%, 5/7) bor i samme ekson eller to eksoner, i samsvar med en mutasjon og en chronocoordinate dublett. Syv multi hadde mutasjoner adskilt av 15 avstands regioner. Av disse ble seks svært gruppert (≤30 nt) og ni var innenfor 100 nukleotider eller mindre. Åtti prosent (16/20) av flere mutasjoner i brystkreft og 76% (25/33) i tykktarmskreft også oppholde seg i ett eller to eksoner (Bord S6, S7).

En sammenligning av OMIDI parene og tett linjeavstand dublett og multiplett mutasjoner i

EGFR

og

TP53

gener er vist i tabell 5. hyppigheten av OMIDI par i

EGFR

genet er ca. 10 ganger større enn i

TP53

genet (og en OMIDI par i

TP53

genet ikke resulterer i en netto i-frame mutasjon), reflekterer hyppigere utvalg av mutasjoner som endrer, fremfor å slette, EGFR protein funksjon. Hyppigheten av tett linjeavstand mutasjoner i dubletter og multi i begge gener ligner

Alle preget EGFR dubletter er allel. En betydelig undergruppe av chronocoordinate mutasjoner gir en alternativ forklaring

På forsiden verdi, foreslår allelism data som sjåfør /driver mutasjoner i

EGFR

må være på det samme molekylet [10]. Men eksistensen av en vesentlig delmengde av chronocoordinate mutasjoner gir en alternativ forklaring. Seksten heterozygot

EGFR

dubletter fra tre forskjellige studier har blitt analysert ved kloning eller allel-spesifikk amplifikasjon (tabell S1) [10], [19], [20]. Påfølgende sekvensering av produktene viste at alle disse lene var enten dobbelt mutert eller vill-type, som indikerer at i hvert tilfelle ble begge mutasjoner plassert på samme allel. Dersom doublet parene resultat av uavhengige hendelser, kan halvparten forventes å være sammensatte heterozygoter. Observasjonen av 100% allelism (16/16) vs. null sammensatte heterozygoter (p = 0,002) kan gjenspeile det, funksjonelt, er føreren /driver mutasjoner som kreves for å være på samme molekylet selv om EGFR protein danner dimer [10] . Men dataene er også i overensstemmelse med 50% chronocoordinate hendelser, putatively under tråd replikasjon eller lapp reparasjon, og 50% uavhengige sekvens mutasjoner uten et krav om at begge mutasjoner være på det samme molekyl (8 av 8 alleliske mutasjoner observert når 4 av 8 viser forventet tilfeldig;.. p≤0.08)

Dessverre, til vår kunnskap, er ikke utført allel analyse på heterozygote

TP53

dubletter

Diskusjoner

Vi presenterer den første analysen av epidemiologien av dubletter i lungekreft. Røyking status, rase, etnisitet, kjønn og alder er ikke risikofaktorer for dublett forekomst i lungekreft. Den høye frekvensen av grupperte dubletter, eksponentialfordelingen av avstand, forekomst av i-frame grupperte OMIDI parene, den alleliske natur dubletter, og gruppering av multipletter i

EGFR Hotell og

TP53

er forenlig med et betydelig mindretall av chronocoordinate mutasjoner i kreft hos mennesker. Men det er begrensninger for hver av de ovennevnte observasjoner (se nedenfor).

Vi viser at dubletter er hyppigere i

EGFR Hotell og

TP53

gener i menneske kreft enn i spontane somatiske mutasjoner i normal mus vev. Innenfor rammen av utvalgsstørrelse, betyr dublett frekvens ikke åpenbart avhenge av røykestatus, kjønn, etnisitet eller alder.

TP53

genet er mutert i omtrent halvparten av alle tumorer og kan benyttes som en «mutagen test», det vil si de relative frekvensene av de forskjellige typer av mutasjonen kan brukes som et epidemiologisk verktøy for å utforske bidrag av eksogene mutagens vs. endogene prosesser i bryst kreft [21], [22]. Vi antok at høyere mutasjon priser som forventes på røykerne ville oftere produsere doublet mutasjoner. Men det er ingen signifikant forskjell mellom røykere og ikke-røykere, i samsvar med dubletter og multi som følge av endogene prosesser.

Data er i samsvar med chronocoordinate mutasjoner (med begrensninger)

Flere aspekter av data er konsistente med en undergruppe av

EGFR Hotell og

TP53

dubletter oppstår fra choronocoordinate hendelser snarere enn fra hypermutability (tilfeldig fordelt mellomrom) eller sekvensiell utvalg. Om 32-35% av dubletter funnet i

TP53 plakater (35%, 19/54) og

EGFR plakater (32%, 31/98) gener er enten OMIDI par eller svært gruppert dubletter atskilt med ≤30 nt. Det er imidlertid begrensninger for hver slutning som må utelukkes i det videre arbeidet.

Den viktigste verdien av den foreliggende analysen er å generere data som begrenser våre hypoteser, og ved Occam

«

s barberhøvel, generere en enkel hypotese (undergruppe av chronocoordinate hendelser) i samsvar med flere data.

(1) de OMIDI parene er det beste beviset for chronocoordinate mutasjoner. For de fleste gener, de fleste av spontane MIDI er OMIDIs, men i

EGFR

genet, OMIDIs er sjeldne, i samsvar med den generelle utvalg for endret funksjon snarere enn mangel på funksjon. Det er bemerkelsesverdig at de åtte

EGFR

dubletter innehold OMIDI parene alle er tett adskilte mutasjoner som resulterer i en netto i leseramme mutasjon, og dermed produsere en EGFR-protein med potensielt forandres, snarere enn fraværende, funksjon. Imidlertid har ingen eksperimentelle bevis for et protein som inneholder en av disse doublet mutasjoner blitt demonstrert. Det mest fornuftige forklaringen på denne forekomsten er gjennom chronocoordinate mutasjoner som er valgt sammen for endret protein funksjon. En alternativ forklaring er at OMIDI parene kan liksom være sekvensielle, selv om tilfeldige mutasjoner innen noen få nukleotider i genomet må være ekstremt usannsynlig.

(2) Den relativt høy frekvens av grupperte doublet mutasjoner i

EGFR

gen er i samsvar med chronocoordinate mutasjoner. Eksponentialfordelingen av avstanden mellom de to mutasjoner i

EGFR Hotell og

TP53

dubletter i samme eksoner (R

2 = 0,98). Er svært lite sannsynlig ved en tilfeldighet

En simulering ble utført tidligere for hvert av

TP53

eksoner 5-9 for å teste nullhypotesen om at mutasjoner i

TP53

dubletter er uavhengige hendelser, og at fordelingen av avstanden mellom de to mutasjonene er kun avhengig av spekteret av mutasjoner i

TP53

gen og størrelsen av mutasjonen target [13]. Den første mutasjon av hvert simulerte dublett ble trukket tilfeldig basert på den observerte fordeling av singlet mutasjoner i en gitt ekson. Bruke sing utdeling fra TP53 IARC database (release 8) står for skjevhet som kan skyldes tett linjeavstand hot spots. Den andre mutasjon i doublet ble trukket tilfeldig basert på en jevn fordeling over hele TP53 kodende sekvensen for det ekson, ettersom det er sannsynlig å være en «hitchhiker» (passasjer) mutasjon, i stedet for en sjåfør mutasjon for svulsten.

mutasjonen mellomrom i de simulerte dubletter ble sammenlignet med 402 faktiske

TP53

dubletter i IARC database fra alle typer kreft. Resultatene viste at to mutasjoner i dubletter ikke er uavhengige arrangement med statistisk sammenligning av de observerte og forventede fordelinger, og indikerte at flere dubletter forekom med en mutasjon avstand på mindre enn 30 nukleotider enn ventet ved en tilfeldighet (P = 0,03, 0,02, 0,0006, og 0.01 for eksoner 5-8). Disse resultatene er i overensstemmelse med forekomsten av chronocoordinate mutasjoner i det menneskelige

TP53

genet. En alternativ forklaring på den gruppering av dubletter er at de kan representere noen som ennå unappreciated funksjonelle begrensninger.

(3) allel natur dubletter er konsistent med chronocoordinate mutasjoner. Blant 98 doublet parene som er rapportert i litteraturen, bare noen få har blitt analysert for å bestemme hvorvidt de er tilstede på samme eller forskjellige alleler. Blant 16 doublet par testet etter kloning eller allel-spesifikk amplifikasjon, ble alle 16 par funnet å være til stede på den samme allel. Men for de resterende doublet par, hvor kloning eller allel-spesifikk forsterkning ikke ble utført, muligheten for at mutasjonene var til stede på ulike alleler kan ikke utelukkes.

(4) Den relativt høy frekvens av multipletter med to eller flere grupperte mutasjoner og en ekstra mutasjon på en fjerntliggende sted argumenterer også for en chronocoordinate mutasjons hendelse pluss en uavhengig enkelt mutasjons hendelse. Igjen, kan en alternativ forklaring bære funksjonelle begrensninger på de gruppert mutasjoner.

I samlet, disse dataene er konsistent med et bidrag på grupperte chronocoordinate mutasjoner til kreft hos mennesker. Et overskudd av dubletter eller multipletter med et delsett av gruppert fordeling skjer oftere enn forutsagt ved en tilfeldighet i en rekke organismer, inkludert riboviruses, DNA-virus, prokaryoter, gjær og eukaryote cellelinjer og vev [23], [24].

data~~POS=TRUNC støtte driver pluss passasjer TP53 dubletter i lungekreft

Om 22% av de andre mutasjoner i dubletter er forventet å være stille om de er «passasjer» mutasjoner, snarere enn «driver» mutasjoner [25]. I

TP53

dubletter, er det fem taus og to intronic nucleotide endringer (13%, 7/54), ikke signifikant forskjellig fra 23,5% lydløs nucleotide endringer som forventes å oppstå med tilfeldige passasjer mutasjoner (p = 0,46 ) [26], [27]. Silent nucleotide endringer (18%, 4/22) i

TP53

multi er også nær 23,5%. Sammen utgjør disse dataene antyder at

TP53

dubletter og multi består av en sjåfør pluss passasjer mutasjon mønster, i motsetning til sjåføren /sjåfør mønster funnet i

EGFR

dubletter [10].

Doublet mutasjoner er assosiert med mutasjon dusjer i mus [9]. Ankomsten av massivt parallell sekvensering kan lette analysen av tilstrekkelige mengder prøver å definere eventuelle dubletter og deretter avgjøre om disse dubletter er assosiert med mutasjoner dusjer i kreft. De ikke-vilkårlige clustering mutasjoner i mutasjons dusjer bør gi mer definitive data for forekomsten av chronocoordinate mutasjoner i kreft hos mennesker. Bidraget av mutasjons dusjer til kreft gjenstår å fastslå.

Materialer og metoder

Terminologi og forkortelser

Mutasjon spekteret.

De relative frekvensene av mutasjoner på bestemte steder.

Mutasjon mønster.

De relative frekvenser av ulike typer mutasjoner, f.eks C til T overganger kontra T til C overganger.

Singlet.

en enkelt mutasjon identifisert innen et gen [13].

Tandem-basemutasjon (TBM).

en mutasjon som resulterer i baseforandringer på tilstøtende nukleotider [28], [29].

Doublet.

To mutasjoner identifisert innen et gen, inkludert en blanding av TBM og ikke-TBM mutasjoner.

plett.

Tre eller flere mutasjoner identifisert innen et gen, med unntak av situasjonen der alle mutasjoner er tilstøtende. Multi kan omfatte en blanding av TBM og ikke-TBM mutasjoner.

Domuplets.

En mutant som enten er en dublett eller en multiplett. Omtrent 1% av

Laci

mutante plakk er domuplets [9]

MIDI

Microinsertion, sletting, eller Indel..; en innsetting, sletting eller Indel som resulterer i en gevinst eller tap på 1 til 50 nukleotider [10].

IMIDI.

I-frame MIDI

OMIDI.

Out-of-frame MIDI

Half-life av mutasjon avstand.

fra eksponensiell tilpasning til dataene, intervallet av mutasjonen avstand som tilsvarer intervallet omfatter halvparten av resterende mutasjoner i prøven. Dette er analogt med den halveringstiden til en radioisotop.

Chronocoordinate mutasjon.

Multiple mutasjoner som forekommer i den samme cellesyklus og i hurtig rekkefølge, typisk i løpet av sekunder til minutter [13].

mutasjon dusj.

Chronocoordinate flere mutasjoner som går over flere kilobaser [9].

Silent mutasjon.

En nøytral mutasjon som ikke endrer proteinstruktur, inkludert synonymt kodende region endringer. Det erkjennes at sporadiske mutasjonstyper overlapper hverandre, for eksempel, kan en stille mutasjon aktivere en kryptisk spleisesetet eller kan inaktivere normal spleisesetet hvis den forstyrrer spleisedonorkonsensussekvensen [30]. I praksis svært få slike overlappinger ble funnet.

Prøver og mutasjonsanalyse

For å undersøke mekanismen og karakteristikker av dubletter og multipletter,

EGFR

mutasjoner identifisert ved sekvensering var samlet inn fra 66 publiserte artikler og vår oppdaterte

EGFR

mutasjon database [10], [31] (www.egfr.org).

TP53

mutasjoner ble samlet inn fra IARC versjon 12 (www-p53.iarc.fr) og ekskludert mutasjoner i lungefibrose og i lungekreft hos pasienter eksponert for røykfylt kull utslipp, radon, sennepsgass, asbest, tungmetaller og atombombe stråling (gammastråler). Vi har også utelatt to artikler der flere mutasjoner omfattet 50% av de totale mutasjoner, mest sannsynlig på grunn av PCR-artefakter, siden flere mutasjoner generelt utgjør bare ~3% av totalt antall mutasjoner.

TP53

mutasjoner i bryst og kolorektal kreft også ble hentet og avstanden fordeling av dubletter /multi ble analysert.

Statistical Analysis

Mutasjons mønstre og andre kategoriske count distribusjoner ble testet for signifikante forskjeller ved Fishers eksakte test eller sorterte R × C beredskaps tabeller ved hjelp av «Fisher-Freeman-Halton» test gjennomført av StatXact statistisk analyse programvarepakke (CYTEL Software Corporation, Cambridge, MA).

Hjelpemiddel informasjon

Figur S1.

En undergruppe av dubletter viser proksimale avstand og passer til eksponentiell fordeling i EGFR og p53-gener i lungekreft. Panel A viser separasjon (i basepar) mellom de to mutasjoner i EGFR proksimale dubletter (n = 37). De separasjonsavstander ble delt i tre grupper, med mellomrom på 1-41 bp, 42-82 bp, og 83 til 123 bp, og plottet ved midtpunktet av hver gruppe (20, 60, og 100, henholdsvis). Separasjon er her definert som antallet nukleotider mellom, men ikke inkludert, de to mutasjoner i en dublett. For MIDI, blir separasjons definert som antallet nukleotider mellom, men ikke inkludert, starten av den første og andre MIDI. Panel B viser avstanden (i basepar) mellom de to mutasjoner i p53-nære dubletter (n = 23). De separasjonsavstander ble delt i tre grupper, med mellomrom på 1-31 bp, 32-62 bp, og 63-93 bp, og plottet ved midtpunktet av hver gruppe (15, 30, og 45, henholdsvis).

doi: 10,1371 /journal.pone.0003714.s001 plakater (0,62 MB PPT)

Figur S2.

Dubletter i EGFR-genet som danner OMIDI parene Den villtype (wt) EGFR sekvens i ekson 19 fra nukleotider 2227 til 2280 er vist. De åtte OMIDI parene i lungekreft er diagrammed å vise slettinger (i magenta), innsettinger (i grønt) og en region som er duplisert (i gult). Legg merke til at to av dubletter består av to delesjoner hver, fem dubletter bestå av en delesjon pluss en Indel, og en dublett har en duplisering (innsetting) pluss en Indel. I hvert fall er det leserammen gjenopprettet (se netto sletting)

doi:. 10,1371 /journal.pone.0003714.s002 plakater (0,03 MB DOC)

Tabell S1.

Supplerende Tabell 1

doi: 10,1371 /journal.pone.0003714.s003 plakater (0,07 MB XLS)

Tabell S2.

Supplerende Tabell 2

doi: 10,1371 /journal.pone.0003714.s004 plakater (0,07 MB XLS)

tabell S3.

Supplemenatary Tabell 3

doi: 10,1371 /journal.pone.0003714.s005 plakater (0,03 MB XLS)

Tabell S4.

Supplerende Tabell 4

doi: 10,1371 /journal.pone.0003714.s006 plakater (0,08 MB XLS)

Tabell S5.

Supplerende Tabell 5

doi: 10,1371 /journal.pone.0003714.s007 plakater (0,11 MB XLS)

Tabell S6.

Supplerende Tabell 6

doi: 10,1371 /journal.pone.0003714.s008 plakater (0,04 MB XLS)

Tabell S7.

Supplerende Tabell 7

doi: 10,1371 /journal.pone.0003714.s009 plakater (0,06 MB XLS)

Takk

Vi takker Wenyan Li og Jiesheng Chen for DNA sekvensering.

Legg att eit svar