PLoS ONE: Et informasjonsteoretisk analyse av genetikk, kjønn og alder i Cancer Patients

Abstract

kimcellelinje genetikk, kjønn og hormonelle-signalveier er godt beskrevet modifikatorer av kreftrisiko og progresjon. Selv om en forbedret forståelse av hvordan kimcellelinje genetiske varianter samhandle med andre kreft risikofaktorer kan gi bedre forebygging og behandling av kreft hos mennesker, måle og kvantifisere disse interaksjonene er utfordrende. I andre områder av forskning, har Information Theory blitt brukt til å kvantitativt beskrive lignende multivariate interaksjoner. Vi har gjennomført en ny informasjons teoretisk analyse for å måle den felles virkning av en høy frekvens kimlinje genetisk variant av p53 tumor suppressor-reaksjonsveien (MDM2 SNP309 T /G) og kjønn på kliniske kreft fenotyper. Denne analysen beskriver kvantitativt synergis samspill mellom kjønn, det MDM2 SNP309 locus, og i en alder av utbruddet av tumordannelse i p53 mutasjonsbærere. Disse resultatene gir en molekylær og genetisk grunnlag for den observerte kjønnsdimorfisme av kreftrisiko i p53 mutasjonsbærere og en modell foreslås som antyder en ny kreftforebygging strategi for p53 mutasjonsbærere

Citation. Atwal GS, Rabadan R , Lozano G, Strong LC, Ruijs MWG, Schmidt MK, et al. (2008) Eit informasjonssamfunn teoretisk analyse av genetikk, kjønn og alder hos kreftpasienter. PLoS ONE 3 (4): e1951. doi: 10,1371 /journal.pone.0001951

Redaktør: Juha Klefstrom, Universitetet i Helsinki, Finland

mottatt: 03.10.2007; Godkjent: 26 februar 2008; Publisert: 09.04.2008

Copyright: © 2008 Bond et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Støtte for dette arbeidet kommer fra Breast Cancer Research Foundation, The Simons Foundation, Leon Levy Foundation og den franske National Cancer Institute. Ytterligere støtte for dette arbeidet kommer fra en Cancer Center Support Grant, CA16672 og NIH Grant til Louise Strong, P01 CA034936

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

p53 stressrespons pathway fungerer som en kritisk tumor suppressor reaksjonsvei, som demonstrert ved den observasjon at p53-genet er en av de hyppigst muterte gener i humane tumorer [1]. Videre er både mus og mennesker skjuler en bakterie-linje inaktiverende mutasjon i bare ett allel av p53-genet utvikler svulster tidlig i livet og ved meget høye frekvenser [2] – [5]. Mennesker skjuler en bakterie-line inaktivere p53 mutasjon utgjør 50% av medlemmene av Li-Fraumeni kreft predisposisjon syndrom. Alderen på begynnende svulstdannelse i humane p53 mutasjonsbærere har vist seg å være endret i fire uavhengige studier ved en høy frekvens enkelt-nukleotid polymorfisme i promoteren til MDM2 onkogenet (MDM2 SNP309, T /G) [6] – [9 ]. G-allel av SNP309 øker DNA-bindende affinitet av den transkripsjonelle aktivator Sp1, noe som resulterer i høyere nivåer av MDM2 mRNA og protein i humane celler og vev, [6], [10] – [12]. Høyere nivåer av MDM2 føre til dempningen av p53-reaksjonsveien, i overensstemmelse med en rolle av MDM2 som en nøkkel negativ regulator av p53 [13]. I p53 mutasjonsbærere, det ble vist i tre uavhengige rapporter som personer med G-allelet av SNP309 er diagnostisert med kreft i gjennomsnitt syv til femten år tidligere enn de p53 mutasjonsbærere homozygote for T-allelet (tabell 1) [6] – [8]. Det ble foreslått at de høye nivåene av MDM2 følge av G-allelet av SNP309, sammen med mutant p53 allel, produsere en sterkt svekket p53 tumor suppressor sti og resultere i en høyere mutasjonsraten, dårligere DNA reparasjonsprosesser, og redusert apoptose, fører til raskere og hyppigere tumordannelse [14].

Nylig, studier med sporadiske kreft (162 askenasiske jødiske lymfom pasienter, 969 finske og 164 italienske pasienter med kolorektal kreft, 105 tyske sarkom pasienter, 341 norske ikke-småcellet lungecancerpasienter og 658 askenasiske Jewish brystkreftpasienter) har vist at effekten av den G-allelet fra MDM2 SNP309 locus på tumorigenesis kan modifiseres ved to ytterligere variabler; nemlig kjønn og fremst kvinnelige spesifikke kjønnshormonet østrogen [15] – [19]. Spesielt ble G-allelet av MDM2 SNP309 vist seg å akselerere tumorigenesis og øke kreftrisiko hos kvinner og ikke menn for tykktarmskreft, diffuse store B-celle lymfom, lungekreft og for høyt østrogen reseptor positiv ( 50% av tumor celler), men ikke for østrogen reseptor negative, krenkende ductal carcinoma av brystkreft [16], [18], [19]. Dette ble vist å resultere i anriking av personer med G-allelet i pre-menopausale kvinner med disse kreftformene, sammenlignet med enten postmenopausale kvinner eller menn med de samme kreftformer. Nylig, Hu et al. gitt bevis for en mulig molekylær mekanisme for hvordan G-allelet fra SNP309 kunne akselerere tumordannelse i denne kjønnsspesifikke og østrogenavhengig måte, ved å vise at den først og fremst hunn-spesifikke hormonet østrogen, fortrinnsvis stimulert transkripsjon av MDM2-genet med den G-allelet av SNP309 [20].

Interessant, har to uavhengige studier også definert kjønn til å være en modifiserende faktor av kreftrisiko i p53 mutasjonsbærere [21], [22]. Spesielt ble kvinnelige p53 mutasjonsbærere vist seg å ha større risiko for å utvikle kreft enn sine mannlige kolleger. For eksempel, ved 20, 30, 40 og 50 år, de kvinnelige bærere viste respektive kumulative risiko for 18%, 49%, 77% og 93% for å utvikle en første kreft, mens de mannlige bærere viste risiko for 10% , 21%, 33% og 68% [22]. Den økte risikoen for kvinnelige bærere kan ikke forklares ved den høye forekomsten av kjønnsspesifikke kreftformer, som forskjellene var tilbake etter at utelukkelse av tilfeller av brystkreft, eggstokk, og prostata cancer. Selv om mulig involvering av østrogen i økende kreftrisiko hos kvinnelige bærere ble diskutert, forblir denne hypotesen uprøvd.

Det er spennende å hypotese at SNP309 locus kan bidra til økt kreftrisiko hos kvinnelige bærere om fortrinnsrett østrogenavhengig stimulering av MDM2 transkripsjon fra G-allelet av SNP309. Hvis det stemmer, kan østrogen manipulasjon innarbeides i forebyggingsstrategier for p53-mutasjonsbærere med G-allelet av MDM2 SNP309. Slike pasienter har begrenset kreftforebyggende strategier. I denne rapporten er hypotesen om at det først og fremst kvinnelige bestemt kjønnshormonet østrogen, kan påvirke tumorigenesis i p53-mutasjonsbærere testet om å utforske mulige interaksjoner mellom MDM2 SNP309 locus og kjønn på aldersavhengig svulst forekomst.

Det har vært økende interesse for utvikling av statistiske verktøy for å avdekke slike interaksjoner, som mellom genotype og kjønn, og deres effekt på komplekse fenotyper, som for eksempel aldersavhengig svulst forekomst. Nye metoder, både parametriske og ikke-parametriske, inkluderer nevrale nettverk [23], rekursive partisjone metoder [24], kombinatoriske partisjone metoder [25], multifaktor-dimensjonalitet reduksjon [26] og multi-locus regresjon [27], [28] . Disse metodene er skreddersydd for å løse spesifikke spørsmål om innholdet av fler locus interaksjoner og påkalle ulike forutsetninger om den underliggende modellen genererer disse dataene. Her benytter vi en ny informasjons teoretisk rammeverk for å løse de spesifikke spørsmålet om kjønn og MDM2 SNP309 locus samhandle synergi eller redundant med hensyn til alder av svulst forekomst i p53 mutasjonsbærere. De optimale egenskaper for informasjonsteoretiske begreper i vurderingen av variasjon og sammenheng mellom flere variabler er kjent til de maskinlæring og statistikk samfunn, men kanskje ikke godt kjent i områdene epidemiologi og medisinsk statistikk. En ytterligere fordel i forbindelse med denne studien er at prinsippene for informasjonsteori tillate oss å studere komplekse fenotyper uttrykt som reelle tall (dvs. alder av utbruddet av kreft, i motsetning til det binære case /kontroll scenario) ved å definere den optimale partisjonering, eller binning, av de kontinuerlige fenotype data.

Metoder

p53 mutasjonsbærere (MD Anderson Cancer Center)

88 personer som er medlemmer av Li-Fraumeni syndrom (AKU) familier (34 totalt) med kjente germline mutasjoner i ett allel av p53 ble tidligere genotypet for MDM2 SNP309 [6]. 66 av disse har blitt diagnostisert med minst ett kreft. Av de AKU familier som inngår i denne studien, 12 ble konstatert gjennom systematiske studier av sekvensiell barndom bløtvevssarkom (7 familier) og osteosarkom (5 familier) pasienter. De resterende familiene besto av pasienter henvist til M. D. Anderson for forskning eller kliniske studier med en personlig eller familie historie av kreft av den typen som finnes i AKU. Den største familien bidrar 14 prøver denne studien; 16 familier bidra med en eneste individ.

p53 mutasjonsbærere (fransk AKU Network)

Sixty-one berørte eller upåvirket bakterie-line p53 mutasjonsbærere, fra 41 ubeslektede AKU familier ble tidligere genotypet for MDM2 SNP309 [7]. Kliniske kjennetegn for familier og beskrivelse av mutasjonene var tilgjengelig på forespørsel. Førti-en rammede bakterie linjer p53 mutasjonsbærere ble innlemmet i denne studien. Den største familien bidrar 3 berørte enkeltpersoner til denne studien; 27 familier bidra med en eneste berørte individ.

p53 mutasjonsbærere (nederlandsk /finsk Study)

Ett hundre og åtte pasienter fra 87 LFS eller AKU-lignende familier ble tidligere screenet for p53 mutasjoner og genotypet for MDM2 SNP309 [8]. Ninety-sju ble vist på Family Cancer Clinic of the Netherlands Cancer Institute og 11 ved Helsinki University Central Hospital. Tretti-seks berørte personer fra 19 familier gjennomført kjente germline mutasjoner i p53-genet og ble innlemmet i denne studien.

Informasjon teoretisk analyse

Gitt en variabel, sier

X

, som kan eksistere i en av

K

X

stater, og dets sett av sannsynlighet {

p (X = x

1), p (X = x

2) … P (x = x

K)

}, da Shannon entropi gir en generell ikke-parametrisk mål på variasjon, eller informasjonsinnhold, fra

X

. Dette målet på informasjonsinnhold er den eneste kvantum som tilfredsstiller visse fornuftige kriterier som

H [X]

burde være en økende funksjon av

K

X

hvis alle sannsynligheter er lik . Den felles entropi for to variabler målt sammen, sier

X Hotell og

Y

, kan også være hensiktsmessig definert, der

p product: (

x

i

,

y

j

) er sannsynligheten for de to hendelsene

X = x

i

og

Y = y

j

co -occurring. Det kan vises at følgende ulikhet for felles entropi må alltid gjelde,

H product: [

X

,

Y

] ≤

H product: [

X

] +

H product: [

Y

], med likhet hvis og bare hvis

X Hotell og

Y

er uavhengige variabler

p product: (

x

i

,

y

j

) =

p product: (

x

i

)

p plakater (

y

j

), dvs. at entropien skjøten vil alltid være mindre enn summen av de individuelle entropies hvis det er noen avhengighet eller korrelasjonen mellom de to variabler. Tiltaket statistisk avhengighet mellom to variabler,

X Hotell og

Y

, så bare fanget av reduksjonen i totale entropi når de to variablene er målt sammen, dvs. Shannon gjensidig informasjon. Merk at dette ikke påberope seg noen av lineære (Gaussisk) forutsetninger som kreves av andre tiltak som for eksempel Pearsons korrelasjon. Denne definisjonen kan også ekvivalent skrives som

Jeg product: [

X

;

Y

] =

H product: [

X

] –

H product: [

X

Y

] =

H product: [

Y

] –

H product: [ ,,,0],

Y

X

], hvor den betingede entropi

H product: [

X

Y

] er definert som, noe som gjør det åpenbart at

jeg. [X, Y]

kan tolkes som reduksjon av variasjon av

X

grunn av kjennskap til

Y

, og vice versa

data~~POS=TRUNC analyse~~POS=HEADCOMP ved hjelp av diskrete versjoner av informasjonsteoretisk uttrykk, som definert i forrige avsnitt, krever å lage hyller som diskretiserer kontinuerlige verdier. For eksempel, har den reelle tall som representerer en alder av diagnose av kreft til binned inn i ett av flere grupper, i det vesentlige en oppgave i datakomprimering. Vi kan trekke på informasjonsteori og merk at minst partisk partisjonering av noen datasettet er gitt ved prinsippet om maksimal entropi, dvs. partisjone inn like befolkede binger eller quantiles. I dette tilfelle noen informasjon-teoretiske uttrykk beregnet fra binned data har den viktige og ønskelige egenskap at det er invariant å inverteres koordinere transformasjoner, f.eks multiplisere alle aldre med en konstant faktor bør ikke påvirke gjensidig informasjon med SNP variabel. Et vanlig problem med å kvantisere reelle tall i binger er å avgjøre hvor mange binger å bruke, og for dette formål vi igjen appellere til informasjonsteori. En fornuftig kriterium kan merkes fra den observasjon at hvis vi prøver å måle gjensidig informasjon mellom to finitely-samplet uavhengige distribusjoner deretter ansette for mange binger vil over passe dataene, gir opphav til en annen verdi enn null for gjensidig informasjon, selv når ekstrapolert til uendelig utvalg grenseverdi [29]. På den annen side, å komprimere data i binger for få over jevner dataene, og potensielt viktig taper struktur i disse dataene. Dermed bør det være en optimal avveining mellom over-montering og informasjon komprimering. Vi fastslått at det optimale antallet hyller i vår datasettet var tre, og til å etablere denne ble gjensidig informasjonen verdier først beregnet med tilfeldig stokket data, for å ødelegge enhver sammenheng, og det ble observert at når antall binger ble økt fra tre til fire og høyere, de ekstrapolerte gjensidig informasjonen verdier ikke lenger var null innenfor feilfelt. Dermed ved å begrense antall binger vi implisitt innlemme en sample-størrelse avhengig straff for over-montering av dataene. Videre eksplisitte detaljer om dette og andre mulige metoder for å estimere gjensidig informasjon er gitt i [29], [30]

Synergistic Informasjon

Disse informasjonsteoretiske begreper kan utvides til naturlig sondere spørsmål statistiske avhengigheter blant mer enn to variabler. Spesielt kan nivået av synergi og redundans blant tre variablene bli kvantifisert i en prinsipiell måte, og har nylig blitt formulert i sammenheng med analyse av korrelasjoner mellom nerveceller [29], [30]. Hvis vi bruker definisjonen av synergi mellom to variabler

X, Y

med hensyn til en tredje variabel

Z

, så hvor mye ekstra informasjon

X Hotell og

Y

sammen gir om

Z

enn ved å

X Hotell og

Y

separat, så vi umiddelbart føre til den naturlige utformingen av synergistisk informasjon som

S ( X, Y, Z) = I (X, Y, Z) -I (X, Z) -I (Y, Z)

hvor. Den synergis informasjon avslører dermed hvor mye av variasjonen av

Z

reduseres ved å kjenne både

X Hotell og

Y

sammen enn å kjenne dem separat og dermed strengt kvantifiserer ikke- uavhengige effektene av både

X Hotell og

Y

Z

. Denne matematiske formulering av synergi kan generaliseres naturlig til mer enn tre variabler.

Statistical Analysis

Det er kanskje ikke klart hvordan man skal tolke informasjonsteoretisk verdier bestemt fra empiriske fordelinger, særlig ettersom statistisk svingninger vokse med synkende utvalgsstørrelsen. Videre, på grunn av den konkave formen av Shannon entropi, induserer endelig samplings en negativ forspenning i den empiriske entropi og en positiv forspenning i den empiriske gjensidig informasjon [29]. Disse problemene nødvendig generasjon av p-verdier for de beregnede informasjonsteoretisk verdier mot en spesifisert nullhypotese. I tilfelle av gjensidig informasjon, nullhypotesen var det ingen statistisk avhengighet eksisterte mellom en enkelt variabel (enten SNP eller kjønn) og alder av diagnose, dvs. den kombinerte sannsynlighets bare et produkt av marginalene,

p (variabel , alder) = p (variabel) p (alder)

. I tilfelle av synergistisk informasjon, nullhypotesen var det ingen korrelasjon eksisterer mellom to variable og alder av diagnose og samtidig bevare korrelasjonen mellom de to variable, dvs.

p (SNP, kjønn, alder) = p (SNP, kjønn) p (alder)

,

p (SNP, alder) = p (SNP) p (alder) Hotell og

p (kjønn, alder) = p (kjønn) p (alder)

. P-verdiene ble bestemt av en Monte Carlo permutasjon test. Et minimum av 10

6 permutasjoner var nødvendig for å generere et konfidensintervall avstand på mindre enn 0,005 ved p-verdi 0,05.

En to-sidig Mann-Whitney-test ble anvendt for å bestemme den statistiske signifikans av forskjellen i median alder av svulst diagnose mellom gruppene med og uten G-allelet av SNP309. Strengt tatt er det Mann-Whitney-test en ikke-parametrisk vurdering av om to sett av data er hentet fra den samme fordeling, men dersom de to sett av data har omtrent samme form så det er berettiget å tolke resultatene av testen som en uttalelse om hvorvidt medianen i de to gruppene er statistisk ikke annerledes. En permutasjon test ble benyttet for å bestemme betydningen av forskjellen i gjennomsnittsalderen for svulst diagnose mellom de to gruppene [6]. Både en Kolmogorov-Smirnov test og en Cramer-Smirnov-Von Mises-testen ble benyttet for å bestemme betydningen av forskjell i fordelingen av alder diagnose mellom gruppene med og uten G-allelet av SNP309. Ved å bruke alle disse testene for betydning, er mange av de forutsetningene som ligger i ett test eliminert.

Resultater

For å teste effekten av, og samspillet mellom kjønn og lene på den MDM2 SNP309 locus genet på tumorigenesis i p53 mutasjonsbærere, alle 144 p53 mutasjonsbærere, som ble genotypet på MDM2 SNP309 locus tidligere [6] – [8], ble undersøkt (tabell 1). Kollektivt, da 144 personer ble delt inn i de ulike genotyper av SNP309 locus, enkeltpersoner som bar G-allelet i enten heterozygot eller homozygot tilstand (n = 81), viste en meget betydelig 11-år tidligere gjennomsnittsalderen for første svulst utbruddet i forhold til enkeltpersoner T /T (n = 63) i genotype (T /T personer, er gjennomsnittlig 33 år versus 22 år i G /G og T /G individer, p = 0,0006, Mann Whitney Test). En betydelig tidligere gjennomsnittsalderen for første svulst utbruddet blant G-allelet bærere ble også sett i både kvinner og menn. Hanner som bar G-allelet i enten heterozygot eller homozygot tilstand (n = 35), viste en signifikant 12-år tidligere gjennomsnittsalderen for første svulst utbruddet i forhold til menn T /T (n = 23) i genotype (p = 0,0436 , Mann Whitney Test). Kvinner som bar G-allelet i enten heterozygot eller homozygot tilstand (n = 46), viste en signifikant 10-år tidligere gjennomsnittsalderen for første svulst utbruddet forhold til kvinner T /T (n = 40) i genotype (p = 0,0223 , Mann Whitney Test).

for å direkte sammenligne aldersavhengig forekomst av kreft hos kvinner og menn, personer som utviklet primært kjønnsspesifikke kreftformer (bryst og prostata kreft) ble ekskludert fra denne analysen, forlater STS , osteosarcomer og leukemi som de store krefttyper analysert hos begge kjønn (figur 1A og B). Av de resterende 101 personer, 57 personer var menn og 44 var kvinner (tabell 1). Den gjensidige informasjon deles mellom kjønn, ble G og T-alleler fra MDM2 SNP309 og i en alder av første tumor diagnostikk beregnet, og resultatene er presentert i figur 1C. Som forventet fra de tidligere publiserte analyser av disse populasjonene [6] – [8], påvirker MDM2 SNP309 locus i en alder av tumor diagnose på en betydelig måte som vist ved en signifikant grad av gjensidig informasjon (0,10 biter, p = 0,007, permutasjon Test). I motsetning til hva som ble forventet fra tidligere vurderinger av samlede kreftrisiko i p53 mutasjonsbærere [21], [22], kjønn alene ikke viser en betydelig grad av gjensidig informasjon med en alder av første tumor diagnose (0.002 biter, p = 0,9, permutasjon Test). Faktisk, når 101 personer ble delt inn i de ulike genotyper av SNP309 locus, enkeltpersoner som bar G-allelet i enten heterozygot eller homozygot tilstand, viste en meget betydelig 12-år tidligere gjennomsnittsalder, og 17-års median alder første svulst utbruddet i forhold til personer T /T i genotype (T /T personer, er gjennomsnittlig 30 år, som strekker seg fra 1 til 71 år, mot 18 år i G /G og T /G individer, alt 1-59 år, figur 1D og tabell 2). Statistisk signifikans av denne 12-år tidligere gjennomsnittsalder, og 17-år tidligere median alder av begynnende svulstdannelse ble målt ved anvendelse av en permutasjon test og en Mann-Whitney-test (se Materialer og Metoder, p = 0,0008 og p = 0,0015, tabell 2) . Videre er betydningen av forskjell i fordelingen av tidene for tumordiagnose mellom G-allel bærere og individer T /T i genotype, som vist i figur 1D, ble målt ved bruk av to metoder: den Kolmogorv-Smirnov Test og Cramer- Smirnov-Von Mises Test. Begge testene støttet betydningen av disse forskjellene ved å gi p-verdier 0,0091 og 0,0046, henholdsvis (Tabell 2). I kontrast, når 101 personer ble separert basert på kjønn alene, ingen signifikante forskjeller i gjennomsnittsalderen for svulst utbruddet ble sett. Spesielt ble kvinnelige p53-mutasjonsbærere diagnostisert i gjennomsnitt på 23 år (fra 1 til 71 år) sammenlignet med de mannlige bærere som ble diagnostisert i gjennomsnitt på 24 år (fra 1 til 59 år Figur 1E og tabell 2).

for å kunne sammenligne aldersavhengig forekomst av kreft hos kvinner og menn, personer som utviklet primært kjønnsspesifikke kreft ble ekskludert fra denne analysen, forlater STS, osteosarcomer og leukemmias som de store tumortyper analysert som avbildet i sektordiagrammer for både menn (A) og kvinner (B). (C) Søylediagrammet viser biter av gjensidig informasjon mellom MDM2 SNP309 locus og en alder av svulsten utbruddet, kjønn og alder av svulsten utbruddet og til slutt mellom alle tre variabler. De tilhørende p-verdier er angitt nedenfor. (D) Den samlede forekomsten av tumordiagnose for begge individer T /T i genotype (sorte firkanter) og T /G eller G /G (SNP309) i genotypen (grå diamanter) er plottet som en funksjon av alder. En firkantet eller en diamant betyr minst et individ. (E) Den samlede forekomsten av tumor diagnose for både menn (svarte firkanter) og kvinner (grå ruter) er plottet som en funksjon av alder.

Som nevnt ovenfor, en fordel av en informasjon teoretisk analyse av interaksjoner er at ikke-additive interaksjoner kan detekteres og kvantifiseres. Interessant, denne analyse viste at den MDM2 SNP309 locus og kjønn tatt sammen samhandler for å påvirke en alder av tumor diagnose i en ikke-additiv, synergistisk måte, som vist ved de målte 0,06 biter av signifikant synergistisk informasjon (p = 0,05, permutasjon Test) . Dette tyder på at veldefinerte modifisere effekten av MDM2 SNP309 locus på en alder av første tumor utbruddet i p53-mutasjonsbærere (tabell 1) kan være vesentlig forskjellig mellom kjønnene. For å teste dette, var samspillet av allelene av MDM2 SNP309 med en alder av svulst diagnose målt for begge kjønn ved å beregne deres respektive gjensidig informasjon. Interessant, av dette tiltaket, den MDM2 SNP309 locus samhandler bare signifikant med en alder av svulst diagnose i kvinnelige bærere og ikke i mannlige bærere. Nærmere bestemt i kvinnelige bærere, den MDM2 SNP309 locus og i en alder av svulsten diagnose aksje betydelige 0,2 biter av gjensidig informasjon (p = 0,014, figur 2A). Men i mannlige bærere, de 0,114 biter av gjensidig informasjon målt når ikke betydning med en p-verdi på 0,06.

(A) Søylediagrammet viser biter av gjensidig informasjon mellom MDM2 SNP309 locus og alder av begynnende svulstdannelse hos kvinner og hos menn. De tilhørende p-verdier er angitt nedenfor. Den MDM2 SNP309 locus og i en alder av svulsten diagnose aksjen betydelig gjensidig informasjon hos kvinner og ikke hos menn. Statistisk signifikans er representert ved den svarte merking av søylediagrammet og p-verdiene som er vist nedenfor. Den samlede forekomsten av alle ikke-kjønnsspesifikke krefttyper for både enkeltpersoner T /T i genotype (svarte firkantene) og T /G eller G /G i genotype (grå ruter) er plottet som en funksjon av alder for hunner (B) og hanner (C). En firkantet eller en diamant betyr minst et individ.

Når separeres i de forskjellige genotyper av SNP309 locus, de 23 kvinner som bar G-allelet i enten heterozygot eller homozygot tilstand, viser signifikant 16-år tidligere gjennomsnittsalder, og 23-års median alder av svulsten utbruddet i forhold til de 21 hunnene T /T i genotype (T /T kvinner, 31 år, alt fra 2 til 71 år, kontra 15 år i G /G og T /G hunner, som strekker seg fra 1 til 54 år, p = 0,007 og p = 0,0037, figur 2B og tabell 2). Deres respektive fordelinger av alderen svulst diagnose også signifikant forskjellig, målt ved Kolmogorov-Smirnov test og Cramer-Smirnov-Von Mises Test (p = 0,0275 og 0,0077, tabell 2). Som forutsagt av informasjons teoretisk analyse av forskjellene mellom den mannlige G-allel bærere og hannene T /T i genotype er mye svakere. Når delt inn i de ulike genotyper av SNP309 locus, menn som bar G-allelet i enten heterozygot eller homozygot tilstand, viste en signifikant 10-år tidligere gjennomsnittsalder på svulst utbruddet i forhold til menn T /T i genotype (T /T menn, 30 år, som strekker seg fra 1 til 55 år, mot 20 år i G /G og T /G kvinner, som strekker seg fra 1 til 54 år, p = 0,0285, figur 2C og tabell 2). Men den målte betydningen av forskjeller i median og fordelinger hos menn var bare boarder linje signifikant med p-verdier på henholdsvis 0,0672, 0,0478 og 0,0469 (tabell 2). Dermed p-verdiene beregnet på flere forskjellige måter var 5-10 ganger svakere for virkningen av G-allelet på en alder av utbruddet av første svulster hos menn enn hos kvinner.

Diskusjoner

i denne rapporten ble de statistiske avhengig av MDM2 SNP309 locus og kjønn på en alder av første tumor utbruddet i p53 mutasjonsbærere basert på en roman kvantitativ informasjon-teoretisk tilnærming. De tre pasientpopulasjoner som opprinnelig ble brukt til å definere MDM2 SNP309 som modifikator av tumordannelse i p53 mutasjonsbærere ble analysert (tabell 1). Analysen avdekket en betydelig grad av gjensidig informasjon mellom MDM2 SNP309 locus og i en alder av første tumor utbruddet, men ikke mellom kjønn og alder av svulsten debut (figur 1). Informasjonen teoretisk tilnærming tillatt for sondering av statistiske avhengigheter mellom alle tre variabler (allelene av MDM2 SNP309, kjønn og alder av første tumor debut). Interessant, MDM2 SNP309 locus og kjønn til sammen ble vist å interagere og påvirker en alder av ikke-kjønnsspesifikke tumor-diagnose i et ikke-additiv, synergistisk måte (Synergistic Informasjon = 0,06 biter; p = 0,05). Hos kvinner, den MDM2 SNP309 locus og i en alder av svulsten diagnose aksjen betydelig gjensidig informasjon mens i hanner, nivået av gjensidig informasjon målt nådde ikke helt betydning (figur 2). Med andre ord, analysen av de tre variable i denne studien viste at kjønn betyr i faktisk spiller en rolle i aldersavhengig insidens men bare når informasjonen er også anordnet om den alleliske form av MDM2 SNP309 locus. Dette er sannsynligvis på grunn av den observasjon at bare den G-allelet til MDM2 SNP309 stimuleres til å produsere mer MDM2 mRNA og protein i nærvær av østrogen [20]. Standard statistiske tester som måler betydningen av forskjellene både i gjennomsnitt og median alder av første tumor utbruddet og i fordelingen av alderen svulst diagnose mellom G-allel bærere og enkeltpersoner T /T i genotype validerte disse observasjonene (tabell 2).

Som nevnt ovenfor, kan de opplysninger teoretisk tilnærming sondere spørsmål statistiske avhengigheter mellom flere enn to variabler og kan kvantifisere nivåer av synergi og redundans. Storskala genetiske og epidemiologiske studier i økende grad har erkjent at variabler samvirke i en ikke-additiv måte med hensyn til risiko for sykdom, dvs. variablene ikke opptre uavhengig av hverandre. Opplyser disse avhengigheter er avgjørende for å forstå hvordan sykdomsrisiko kan endres subtilt med en skjult variabel og kan forklare hvorfor ulike epidemiologiske studier kan rapportere forskjellige konklusjoner basert på visning av en enkelt variabel [17]. Videre identifisering og kvantifisering av synergistiske interaksjoner også kan belyse nye biologiske mekanismer, som for eksempel krysstale mellom to signalveier. Imidlertid, som ennå, har det ikke vært noen streng definisjon og således ikke kvantifisering av slike synergistiske interaksjoner. Informasjon teori og metodene beskrevet her danner en naturlig ramme for å løse disse problemene statistiske avhengigheter mellom variabler samtidig påberope ingen para forutsetninger.

I konklusjonen, informasjonsteoretisk analyse av statistiske avhengig av MDM2 SNP309 locus og kjønn ved en alder av begynnende svulstdannelse i p53-mutasjonsbærere antyder at G-allelet fra SNP309 fungerer primært i hunn p53 mutasjonsbærere for å akselerere tumordannelse, for derved å tilveiebringe et potensial genetisk basis for observert kjønnsdimorfisme i kreftrisiko [21], [22 ]. Disse observasjoner i forbindelse med de observasjoner som både pre-pubescent og post-pubescent hunner har høyere nivåer av østrogen [33], [34], og at østrogen er blitt vist å preferensielt stimulere transkripsjon av

MDM2

fra G-allelet [20], gi en rimelig hypotese; G-allel av MDM2 SNP309 locus vil kunne bidra til økt risiko for kreft hos kvinnelige p53 mutasjonsbærere gjennom den preferensielle østrogenavhengig stimulering av transkripsjon av MDM2-genet.

Legg att eit svar