PLoS ONE: Space-Time Analyse av testikkelkreft Clusters Bruke Residential Histories: En case-control studie i Denmark

Abstract

Selv om etiologien er i stor grad ukjent, testikkelkreft forekomsten har sett de siste betydelige økninger i Nord-Europa og gjennom mange vestlige regioner. Den vanligste kreftformen hos menn under 40 år, har alder periode kohort modeller hevdet eksponeringer i

i utero

miljøet eller i tidlig barndom som mulige årsaker til økt risiko for testikkelkreft. Noen av disse faktorene kan være knyttet til geografi gjennom å bli assosiert med atferds, kulturelle, sosiodemografiske eller bygde miljø egenskaper. I så fall kan dette føre til påviselige geografiske klynger av saker som kan føre til hypoteser om miljømål for intervensjon. Gitt en latenstid mellom eksponering for miljøkreftfremkallende og testikkelkreft diagnose, mobilitet historier er gunstig for romlig cluster-analyser. Nærmeste nabo-baserte Q-statistikken gir mulighet for inkorporering av endringer i bosted i romlig sykdom klynge gjenkjenning. Ved hjelp av disse metodene, ble en space-time cluster analyse utført på en befolkning spennende case-control befolkning valgt fra den danske Kreftregisteret med mobilitet historier siden 1971 hentet fra den danske borger registreringssystem. Tilfeller (N = 3297) ble diagnostisert mellom 1991 og 2003, og to sett med kontroller (N = 3297 for hvert sett) matchet på kjønn og fødselsdato ble inkludert i studien. Vi har også undersøkt romlige mønstre i morens bolig historie for de tilfeller og kontroller født i 1971 eller senere (N = 589 kasus-kontroll par). Flere små klynger ble oppdaget da samkjøre individer av år før diagnose, alder ved diagnose og kalenderår for diagnosen. Men den største av disse klyngene inneholdt bare to statistisk signifikante personer på sitt senter, og ble ikke kopiert i SATSCAN romlig-bare analyser som er mindre utsatt for multippel testing bias. Vi fant lite bevis for lokale klynger i bolig historier av testikkelkreft tilfellene i denne danske befolkningen

Citation. Sloan CD, Nordsborg RB, Jacquez GM, Raaschou-Nielsen O, Meliker JR (2015) Space-Time Analysis av testikkelkreft Clusters Bruke Residential Histories: En case-control studie i Danmark. PLoS ONE 10 (3): e0120285. doi: 10,1371 /journal.pone.0120285

Academic Redaktør: Masaru Katoh, National Cancer Center, JAPAN

mottatt: 05.09.2014; Godkjent: 02.02.2015; Publisert: 10 mars 2015

Copyright: © 2015 Sloan et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: Vi innhentet data for dette manuskriptet fra en tredjepart. Den inneholder beskyttet helseinformasjon som fødselsdato og bostedsadresse som ikke lovlig eller etisk offentliggjøres. Imidlertid kan dataene oppnås med en dataavtale som inkluderer IRB gjennomgang og godkjennelse av det danske Datatilsynet. Kontaktpersonen er Ole Raaschou-Nielsen, MSc, PhD. Referansenummeret for tillatelse er 2007-41-0437

Finansiering:. Denne forskningen ble finansiert av det amerikanske National Institute of Environmental Health Sciences (https://www.niehs.nih.gov), R21 ES015501, National Cancer Institute (https://www.cancer.gov) R03 CA125827, 5R44CA135818-03, og 5R44CA112743-03 * JM), den danske Kreftforeningen (tilskudd nummer DP08090) og den danske Agency for Science, Technology and Innovation ( https://ufm.dk en) (referansenummer 08-032484) (RBN /ORN). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser. Jaymie Meliker, PhD, er en PLoS ONE redaksjonsmedlem. Geoff Jacquez er president i BioMedware, selskapet som utviklet SpaceStat programvaren som ble brukt for beregning av Q-statistikken. Dette endrer ikke forfatterne etterle- til PLoS ONE redaksjonelle retningslinjer og kriterier. De øvrige forfatterne har ingen konkurrerende interesser å avsløre.

Innledning

Testikkelkreft forekomst i vestlige land dramatisk økning fra 1940-tallet til 1990-tallet, og har blitt nummer én årsak til kreft hos gutter under 40 år [1]. De eksakte årsakene er fortsatt uklart, men en fødselskohort effekt har vist seg å være en viktig faktor [2-4]. Økningen i prisene var spesielt tung i Nord-Europa. Fra 1943 til 2003 insidensen i Danmark økte fra 3,4 til 10 tilfeller per 100.000 personår; dets priser er blant de høyeste i verden [3,5]. I de senere årene, disse prisene ser ut til å stabilisere [6].

Biologisk mest testikkelkreft kan kategoriseres som enten nomas (bakterie celle) eller Nonseminomas. Nomas oppstår vanligvis senere enn Nonseminomas (slutten av 30-tallet til begynnelsen av 50-tallet kontra yngre enn 30), noe som indikerer at det kan være årsaks forskjeller mellom de to gruppene. Til tross for mange potensielle risikofaktorer som har blitt undersøkt, det eneste faste determinants av testikkelkreft risiko forbli alder, familiehistorie med testikkelkreft, nasjonal opprinnelse, fødselsår, etnisitet og cryptochoridism (retinerte testikler) som er funnet i 10% av alle tilfeller [4,7-11]. Ytterligere bevis tyder på at mors faktorer, tidlig oppvekstmiljø, og

i utero

miljø kan spille en rolle ettersom testikkelkreft vanligvis oppstår i relativt unge, men spesifikke risikofaktorer er foreløpig uidentifisert [12-14]. Riktignok er det en latenstid mellom eksponering for kreftfremkallende og sykdom manifestasjon, som bør tas i betraktning når de gjennomfører en epidemiologisk analyse av testikkelkreft.

En romlig analyse i Storbritannia ble gjennomført, men uten å finne tegn på ansvarlige faktorer som ble geografisk differensiert [15]. Selv om denne studien så på testikkelkreft rater over flere år, var de ikke i stand til å gjøre rede for menneskelig mobilitet og brukte aggregerte data (valg avdelinger) snarere enn individuelle nivå data. Eksponeringer som fører til testikkelkreft kan oppstå mange år før diagnose, derfor klynge deteksjon basert på bosted ved diagnose kan ikke nøyaktig gjenspeile livet historie knyttet til etiologi.

Latency er en vanskelig barriere i å undersøke romlige kreft klynger, som individer er ofte svært mobile og flytter boliger mer enn en gang i løpet av livet [16-18]. Flere metoder har nylig blitt utviklet som bidra til å løse denne vanskelige statistisk oppgave, med to av de mest lovende være generaliserte additive modeller (Gams) med en løss jevnere [19] og Q-statistikk [20-22]. Hver av disse fremgangsmåter gjør det mulig for kovariat justering og omfatter bruk av tidsbestemte geografiske koordinater. Q-statistikk har nylig vist seg å være effektiv på å finne simulerte klynger [23], og er her brukt på en stor testikkelkreft datasett fra Danmark.

Ved systematisk å undersøke bolighistorier, geografiske klynger av testikkelkreft kan vises som kan gi ledetråder til hva som har drevet den siste økningen i forekomsten. Her testet vi denne hypotesen ved å gjennomføre en space-time analyse av bolig historier om danske testikkelkreft tilfeller og 2 sett med matchede kontroller. Denne analysen er den første i sitt slag, ved at den bruker en omfattende, landsdekkende lengde database inkludert alle bolighistorier i Danmark for å undersøke lokale klynger av testikkelkreft over en lang tidsperiode. Vi har også valgt to uavhengige kontrollgrupper, noe sjelden gjort i romlig epidemiologi, men nylig vist å påvirke resultatene av romlig cluster-analyser [22].

Materialer og Metoder

Study Befolkning

Den danske kreft~~POS=TRUNC er en omfattende landsomfattende kreft~~POS=TRUNC startet i 1943. i forbindelse med denne studien har vi valgt testikkelkreft tilfeller diagnostisert mellom 1 januar

st, 1991 og 31 desember

st, 2003 (n = 3297) (tabell 1). Alle individer hadde testikkelkreft som sitt primære kreftdiagnose med ICD-O morfologi oppførsel kode 3 (ondartet, primære område); imidlertid foregående diagnose av ikke-melanom hudkreft ble tillatt. Seminoma testikkelkreft ble definert som ICD-O morfologi koder: 9060/3, 9061/3, 9062/3 og 9063/3. De resterende tilfellene ble klassifisert som ikke-seminom. Det var 1871 seminom og 1426 ikke-seminom tilfeller. To uavhengige kontrollgrupper ble tilfeldig trukket fra den danske borger Registrering System (CRS) og matchet med saker i henhold til alder i et 1: 1-forhold. Mer spesifikt, hver kontrollgruppe inneholdt 3,297 menn født i Danmark på samme dato som en kreft sak (eller samme måned hvis det ikke var noen i live kontroller født på samme dag) som var kreftfrie (med unntak av ikke-melanom hud kreft) og bor i Danmark samtidig med samsvarende tilfeller «diagnose. Anvendelse av to uavhengige kontrollgrupper er understøttet av nyere arbeider som tyder på klynge resultatene var ikke konsistent over to kontrollgrupper, som fører til den konklusjon at den romlige fordelingen av kontrollgruppene kan påvirke resultatene av klynger [22]. Residential historier av saker og kontroller ble spores ved hjelp av data fra CRS fra 1971 til dato for diagnose. Geokoding suksess og nøyaktighet var veldig høy, med geografiske koordinater tildelt 98% av adresser (67244 /68,578). For de som passer til hjemmeadressen (88% av boligene) er definert adressepunkt innenfor en meter fra inngangsdøren til huset, og presisjonen av geokoding ligger noen få meter. En annen 4% ble matchet på naboens bolig, 1% på gatenivå, og 5% på kommunenivå. Den danske Datatilsynet godkjent studiet. I henhold til dansk lov skriftlig samtykke ble ikke innhentet som studiet ble helt registerbaserte og ikke involverer biologiske prøver fra, eller ta kontakt med deltagerne. IRB godkjennelse av arbeidet med geografiske koordinatene boliger ble innhentet gjennom Western Institutional Review Board. Saker og kontroller ble avidentifisert og tildelt et tilfeldig ID før analyse. Noen beskyttet helseinformasjon (sted og dato for sykdom) var nødvendig for å fullføre studiet, men var ikke forbundet med pasientopplysninger under analysen.

testikkelkreft tilfeller diagnostisert 1991-2003, og alderstilpassede kontroller.

Vi samlet også bostedsadresse til mødrene saker og kontroller fra 1971 til fødselsdato av saken eller kontroll. Denne informasjonen var tilgjengelig for den yngste 18% av kasus-kontroll par. Disse dataene ble brukt til å undersøke rom-tid lokale klynger av mødrene til saker og kontroller i løpet av svangerskapet. Hvis en av personene i en case-control paret hadde manglende informasjon om morens adresse, ble paret ekskludert fra analysene. Informasjon om mødres adresser eksisterte for 589 kasus-kontroll par i det første tilfellet-kontrollgruppen, og 591 kasus-kontrollparene i den andre gruppen, som resulterer i 3862 og 3913 boliger adresser hhv. Av disse 99% var geo-refererte.

Betinget Logistic Regression

En undersøkelse ble gjennomført for å se etter potensielt viktige kovariater bruker betinget logistisk regresjonsanalyse på saker og hver kontrollgruppe. Kovariatene ble valgt basert på data tilgjengelighet i eksisterende registre og eksisterende kunnskap om potensielle risikofaktorer for testikkelkreft og inkluderte: fødselsvekt (kg) og fødselslengde (cm), alder på mor ved fødselen, alder på far ved fødselen, mors ekteskapelig status (gift, aldri gift, skilt) fra den danske fødselsregister for de som er født etter 1972, tidsvektet gjennomsnittlig sosioøkonomisk status (SES) bruker årlig inntekt for 271 kommuner i Danmark, og familiehistorie med testikkelkreft og om eventuelle kreft blant første grad slektninger med en rapportert primær kreftdiagnose i kreft~~POS=TRUNC. Resultater fra logistisk regresjonsanalyse ble brukt til justering av sentrale kovariater i den romlige klyngeanalyse, som beskrevet i de neste avsnittene.

Q-statistikk bakgrunn

En fullstendig diskusjon om inkorporering av bolig historier til sykdom klynge deteksjon i form av Q-statistikken kan finnes andre steder [20,23], og kan bli henvist til en mer omfattende forklaring av disse metodene. Her vil vi kort gjennomgå statistikken brukes på denne studien.

Q-statistikk beregnes etter en nærmeste nabo metode. I løpet av studieperioden, blir antall geografisk nærmeste naboer som omgir hver person som er et eksempel (ikke en kontroll) beregnes. Et nytt sett med Q-statistikker beregnes ved hvert tidstrinn, definert som hvilket som helst tidspunkt ved hvilket i det minste en person forandret hjemme boliger. For eksempel, hvis alle holdt samme adresse 2000-2002 og deretter noen flyttet i 2003, ville den gang steget mellom beregninger av statistikken være 3 år. Hver statistikken er en sum over en matrise av nærmeste-nabo relasjoner. Statistisk signifikans bestemmes av permutasjon testing. Brukeren angir antall nærmeste naboer (

k)

før du kjører beregningene. Hver statistikken er varighet vektet slik at tyngre vekt personer som har bodd i området lenger. Den grunnleggende formelen for Q-statistikken er som følger: Ligning 1

Dette er tellingen, på tidspunktet

t

, av antall

k

nærmeste naboer av saken

i

som også er en sak. De case-control identifikatorer,

c

i

og

c

j

,

, for individuell

i

og

j

er binære (1 hvis en sak, 0 hvis en kontroll). Når

i

er en kontroll, = 0. Uttrykket er en binær romlig nærhet matrise av nærmeste naboer som er en når deltaker

j

er en av de

k

nærmeste naboer av deltaker

i

på tidspunktet

t

; og 0 ellers. Siden er en sum av saken statusen til

k

unike nærmeste naboer av individuell

i

, er statistikken i området 0.

k

. Når

i

er en sak, lave verdier av indikerer klynge unngåelse (for eksempel en sak omgitt av kontroller), og store verdier indikerer en klynge av tilfellene.

Videre Q-statistikken bygger på denne grunnleggende ligning for å identifisere klynger som skjer etter bestemte tid og rom mønstre: ligning 2Equation 3Equation 4

ligning 2 (sum over alle tidspunkter av ligning 1) brukes for å identifisere saker som konsekvent sentre for romlige klynger gjennom tid . Ligning 3 representerer den globale statistikken som indikerer om gruppering forekommer gjennom hele området på et bestemt tidspunkt. Den beregnes ved å summere likning 1 over alle tilfeller på det tidspunkt. Ligning 4 oppsummerer videre denne statistikken, og er den globale tilfelle clustering av bolig historier gjennom hele studieområdet for hele perioden. Den beregnes ved å summere ligning 2 over alle tilfeller. Denne statistikken vurderer alle bolig historier samtidig for hele studieperioden, og er et mål på utholdenhet av global clustering. Det er stor når saken clustering vedvarer over tid.

I denne utredningen, Ligning 2 er mest brukt for å avgjøre om en person er midt i en klynge. Dette er basert på resultatene av Q-statistikken som tidligere er vist ved hjelp av simuleringer basert blant annet på disse dataene [23]. Ligning 1 () blir benyttet for å identifisere når og hvor en person er i sentrum av en lokal klynge. Simuleringen analyse [18] ble foretatt for å hjelpe konto for flere tester skjevhet som følge av det store antallet av statistiske tester utført i

Q

-statistics kjørt over bolighistorier. I simuleringen analyse opprettet vi klynger og evaluert prediktiv evne til ulike versjoner av de lokale og globale Q-statistikk. Type 1-feil ble minimert og evnen til å oppdage ekte klynger ble maksimert når vi benyttet følgende kriterier. Først ble kandidat klase bestanddeler identifisert ved hjelp av

p

≤0.001 for og

p

≤0.05 for. Her har vi brukt informasjon fra statistikken definert av ligninger 1 og 2 samtidig for å identifisere mulige klyngemedlemmer. For det andre kreves vi minst fire av disse klase medlemmer til å være nærmeste naboer av hverandre for å erklære en klynge statistisk signifikant. Ligninger 3 og 4 var ikke nyttig i kresne de simulerte klynger.

Statistisk signifikans er bestemt av randomisering case-control identifikatorer over bolig historier under nullhypotesen lende sammenheng mellom bosted og case-control status . Bare case-control status er randomisert, opprettholde integriteten til den enkelte bolig historier, som deretter brukes til å beregne Q statistikk. Den randomisering Prosedyren gjentas over mange iterasjoner for å bygge opp de fordelinger av Q-statistikken under nullhypotesen. For justering av nøkkel kovariater kan nullhypotesen rede for dem ved å bruke de justerte sannsynligheten for å være en sak som beregnet fra regresjon [21]. Ligningen for å forutsi sannsynligheten for å være en sak gitt vektor av kovariater og risikofaktorer for

i

th person er: Ligning 5

Her er logit funksjon er den naturlige logaritmen av oddsen, og β er vektoren av regresjon (helling) koeffisienter. Ved å bruke resultatene fra den betingede logistisk regresjon ligning, er koeffisientene for hver variabel sammen med verdier for hver enkelt brukes til å tilordne de enkelte sannsynligheter for å være en sak i den innstilte analysen. Legg merke til at omfanget av mulige

p

-verdier bestemmes av antall randomizations av nullhypotesen brukt. Gitt regnekraft og tid som kreves for disse analysene, 999 randomizations var maksimalt rimelig antall gjentakelser, genererer et minimum

p

-verdi på 0,001. Gitt problemet med multippel testing i disse og mange andre romlige analyser, analyser av vår siste simulering [23] foreslått en guide for å undersøke case-control bolig historier som vi implementere og beskriver nedenfor.

Spatial klyngeanalyse

Spatial klase analysene ble utført ved bruk av Q-statistikk i SpaceStat (BioMedware, Inc., Ann Arbor, MI). Datasettet ble delt inn i 3 grupper: alle tilfeller, nomas, og mødre saker og deres matchede kontroller, og hver gruppe ble analysert ved hjelp av ulike tiltak av gangen (alder, kalenderåret, året før diagnose for alle tilfeller og nomas, og kalender år og måneder før fødselen for mødrene til tilfeller). De ulike mål på tiden ble brukt i tilfelle at ulike miljøeffekter kan være ansvarlig for lokale klynger, dvs. hvis alle ble plassert enkeltpersoner i samme region på samme tidspunkt, eller om de ble mer justert av år før diagnose (som indikerer lignende latenstid fra eksponering til sykdom manifestasjon). Q-statistikk undersøke hvert tilfelle ved hvert tidstrinn som et mulig senter av klyngen, som er en grundig måte, men det introduserer muligheten for multippel testing. Vår simulering studie delvis basert på disse dataene produsert en guide for å hjelpe konto for flere testing [23] av enkeltsaker over tid, og antydet at en mulig klynge kan vurderes nærmere hvis 4 eller flere betydelige tilfeller ble oppdaget i samme område med en Q

i

(k),

p

= 0,001 og Q

det

(k),

p

≤0.05 bruker

k

= 15 nærmeste naboer. Vi brukte denne guiden for analysene utført i denne studien. Største klynger ble revurdert på den tiden skive foreslått av Q-statistikken bruker Kulldorf Scan statistikk i SATSCAN (v 9.0.1) å sammenligne med resultater fra en etablert klynge gjenkjenning metoden [22-25]. Men denne metode ikke hensyn til human bevegelighet, således analyser ble utført på undersett av den opprinnelige space-time data, som omfattet bare ett sted per individ. Disse tids skiver ble valgt for å matche statistisk signifikante tidsperioder identifisert av Q-statistikk, metode foreslått i simuleringen studie [23]. Vi brukte en Bernoulli modell i SATSCAN, og

p

-verdi for test av betydning ble hentet fra Monte Carlo-simuleringer (999 replications). Vi analyserte sirkulære klynger med en maksimal cluster størrelse på 50% av den totale befolkningen.

Resultater

Det var 3297 tilfeller av testikkelkreft, 1871 av disse var nomas, og to uavhengige sett med 3297 kontrollene i dette danske befolkningen spennende case-control studie. I den betingede logistiske regresjonsanalyser, den eneste variabelen som var en statistisk signifikant prediktor for både nomas og alle tilfeller ved hjelp av begge kontrollgruppene var som å ha en familiehistorie med testikkelkreft [23]. Det var 69 tilfeller med testikkelkreft i førstegradsslektninger, og 39 av disse var nomas; 26 kontroller over begge kontrollgrupper med testikkelkreft i første grad slektninger, og 13 blant kontrollene nomas [9]. For alle tilfeller, parameterestimatet var 1,72 ved bruk av kontrollgruppe 1 (

p

verdi = 0,001, Hazard Ratio = 5,58) og 1,75 ved bruk av kontrollgruppe 2 (

p

verdi = 0,001, Hazard Ratio = 5,75). Gitt at denne familiehistorie variabelen kan gjenspeile en felles underliggende eksponering, er det mulighet for over-justering. Ujusterte romlige klase analyser presenteres, sammen med justerte analyser som inkluderer sannsynligheten for å være et tilfelle gitt en familiehistorie med testikkelkreft.

Resultatene fra den ujusterte Cancer Cluster undersøkelse er vist i tabell 2. Tabellen viser hver test, med antall signifikante personer funnet og antall personer i største klyngen for både kontrollgruppe 1 og kontrollgruppe 2. også oppført er mange av de samme personene som var betydelig hjelp både kontrollgruppe 1 og kontrollgruppe 2, og den generelle plassering av hver gruppe av betydelige individer. Det var ingen overlapping i individer identifisert som sentre for klynger på tvers av de to kontrollgruppene i noen av analysene, inkludert alle kreft, nomas, og mødre saker. Den største klyngen identifisert inkludert 2 store saker i midten av klyngen i Aarhus, 6-8 år før diagnose, ved hjelp av alle saker og kontrollgruppen 1. En annen klynge ble også identifisert i Aarhus inneholder boligen til mødre til 2 tilfeller i 1971, igjen ved hjelp kontrollgruppe 1. Alle andre klynger inngår ikke mer enn en vesentlig tilfellet ved midten av hver klynge og vedvarte i mange år. Gitt tilbøyelighet for å avdekke falske positive i denne space-time cluster analyse, fikk disse resultatene ikke nå vårt terskel på 4 eller flere vesentlige saker, som var en av anbefalingene fra vår simulering studie [23].

resultatene fra analysene justert for familiehistorie med testikkelkreft er vist i tabell 3 og er svært lik den ujusterte analysene. Igjen var det ingen overlapping i individer som er identifisert som sentrene av klynger på tvers av de to kontrollgruppene i noen av analysene. Det var en viss likhet med de ujusterte analysene i steder av betydelige individer, med flere av dem er fra enten København eller Århus. Ingen klynge inneholdt mer enn en betydelig fall i midten.

Lokaliseringen av betydelige klynger noen ganger overlappes over de ulike analysene. Dette gjaldt særlig i København og Århus regioner. Men Kulldorf Scan statistikk unnlatt å bekrefte de to største klynger i Århus som inneholdt 2 store saker på sitt senter. Ved hjelp av kontrollgruppe en 7 år før diagnosen ble ingen signifikante klynger funnet. Den største klyngen oppdages ved hjelp SATSCAN inneholdt 19 tilfeller, og ble plassert i København (RR = 2,0,

p

= 0,055); Q-statistikken også funnet en mulig klynge i denne regionen i København på

p

= 0,003 for Q

i

(k), som ikke klarte å møte

p

= 0,001 som var nødvendig etter vår simulering studie for å hjelpe konto for flere testing [23]. Ved hjelp av mors bolig historier og kontrollgruppen en i 1971, ble den største klyngen oppdaget av SATSCAN igjen ligger i København, og ikke statistisk signifikant (RR = 2,02,

p

= 0,51).

Diskusjoner

Denne studien benyttet en fullstendig oversikt over alle bolighistorier i Danmark for å undersøke lokale klynger av testikkelkreft blant innbyggere fra 1971 til diagnose i 1991-2003. Mens noen små klynger ble oppdaget, ingen drue inneholdt mer enn to vesentlige saker på sitt sentrum, kort av de fire viktige saker som kreves for å overvinne multippel testing skjevhet som anbefalt av vår simulering studie [23]. Videre valg av en annen kontrollgruppe også vist seg nyttig for å dempe multippel testing skjevhet ved å tillate oss å undersøke om tilstedeværelsen av en klynge vært konsekvent. Mens noen klynger ble funnet i forskjellige regioner i København ved å bruke begge kontrollgruppene, de klynger aldri dekket de samme stedene, eller inneholdt de samme individene, noe som tyder på en sannsynlighet for å være tilfeldige funn.

Resultatene fra denne analysen er i tråd med en annen lite område clustering studie av testikkelkreft priser i England [15] som også foreslått en mangel på bevis av geografisk gruppering av testikkelkreft. Vår analyse går lenger enn dette tidligere studie ved å vise lite bevis for lokale klynger selv når innlemme individ-nivå data med endringer i bosted. Vår metode fant ikke bevis for lokale klynger i mødres bolighistorier som tyder på

i utero

eksponeringer.

Det er ingen etablert protokoll for påvisning av rom-tid klynger i mobile populasjoner. Når du vurderer mobilitet må man vurdere at saker kan bruke ulike varigheter av tid flytte inn og ut av en klynge regionen. Nærmeste nabo-Q-statistikk tillate oss å undersøke lokale og globale clustering hele bolighistorier i kasus-kontrollstudier, men er gjenstand for tilfeldige funn som følge av multippel testing. I vår simulering analyser [23] delvis basert på følgende testikkelkreft data, skapte vi mange forskjellige typer av klynger og kom på en tommelfingerregel for å skille sant klynger fra falske positiver. Den tommelfingerregel, en klynge av 4 eller flere personer (Q

i

(k), p = 0,001 og Q

det

(k) p≤0.05) ved hjelp av

k

= 15, var vellykket for å skille større klynger, som ble bekreftet av skanningen statistikken i SATSCAN. Vi fulgte denne tilnærmingen i analysene som presenteres her, og fant ikke bevis for klynger. Viktigere, på grunn av de store datasettet av boliger historier, en enkelt analyse tok opp til 12 timer. Derfor kunne vi ikke utforske et bredt spekter av ulike nivåer av

k

for analysene, men måtte stole på resultatene fra simuleringen studiet når du velger

k

= 15; selv om noen sensitivitetsanalyser ved hjelp av

k

= 10, 20 og 100, og kombinere de to kontrollgruppene sammen ikke endre vår konklusjon.

Så vidt vi vet, er dette den første undersøkelsen av romlige klynger av testikkelkreft hjelp bolighistorier. Tilfeller ble identifisert i nesten komplett høy kvalitet populasjonsbasert danske Kreftregisteret [26,27], og dermed studien hadde svært pålitelig tilfelle konstatering. Videre den danske borger Registrering System gitt en ideell ramme for kontroll utvalg og samling av boligadresser tilbake til 1971 [28]. Vi justert for familiehistorie med testikkelkreft som dette ble assosiert med testikkelkreft og kan variere romlig; men justeringen ikke endre våre konklusjoner.

Det primære målet med dette arbeidet var å generere innsikter om etiologien av testikkelkreft, en sykdom som viste rask økning i forekomsten gjennom mange vestlige regioner i andre halvdel av 20

århundre og har få etablerte risikofaktorer. Denne studien utforming tillot oss å overvinne mange av de begrensninger som vanligvis finnes i romlige analyser. Vi brukte individ-nivå data fra det danske Kreftregisteret for å undersøke potensielle klynger ved hjelp av alle tilfeller av testikkelkreft diagnostisert over en 13 års periode. Selv om det er vanskelig å vurdere kraften i disse analysene, hadde vi stor utvalgsstørrelse for å se etter klynger bare blant nomas, en mer histologisk lignende undergruppe av testikkelkreft med en større sannsynlighet for felles etiologiske faktorer. Vi har også undersøkt potensielle klynger i boligloggdata for mødre med 589 kasus-kontrollparene og for et par år før graviditet. Vi undersøkte romlige mønstre ved hjelp av flere tiltak av gangen inkludert steder på ulike alderstrinn, kalender år, og år før diagnose, sammen med månedene før fødselen for mødrene.

Vi presenterte analyser både ujustert og justert for familiehistorie av testikkelkreft. Muligheten til å justere vår analyse basert på relevante kovariater er en styrke for Q-statistikkmetoden. Det er viktig å forstå om noen oppdaget klynger skyldes variasjoner i kjente kovariater, eller en ukjent variabel forbundet med å leve i et bestemt sted. I denne analysen, verken ujusterte heller ikke justert resultatene gitt overbevisende bevis for klynger. I de justerte resultatene, antall tilfeller per potensial klynge redusert tyder = ing som familiehistorie med testikkelkreft kan ha blitt delvis kjører resultatene av den ujusterte analyser.

Vi valgte to uavhengige kontrollgrupper som var nyttig for tolke funnene. Til slutt brukte vi Q-statistikk, en av de få tilnærminger tilgjengelig for å undersøke klynger gjennom case-control bolighistorier, en tilnærming som har vist seg å ha effektiv ytelse i en simulering studie i denne regionen [23]. Studien kunne ha blitt forbedret ved å inkludere flere år med oppfølging av bolig historier om tilfeller, kontroller, og blant mødre; Civil Registrering System begynte innspillingen bolig data i 1971, så det er ikke mulig å inkludere tidligere år. Likevel, studiedesign tillatt oss å vurdere mulige geografiske klynger av testikkelkreft å bruke 20 års bolighistorier.

Utvikling og anvendelse av space-time cluster statistikk som gjør det mulig for flere adresser og mobilitet er fortsatt i sin barndom . Videre ytelse evaluering av Q-statistikken ville bidra til å demonstrere sin nytte, sammen med ytelse evalueringer av andre nyutviklede metoder, inkludert multippel adresse funksjonen tilgjengelig i SATSCAN v. 9.3 (20 mars 2014).

Legg att eit svar