PLoS ONE: Modellering Natural History og Påvisning av Lung Cancer Basert på røyke Behavior

Abstract

I denne studien har vi utviklet en metode for modellering av progresjon og påvisning av lungekreft basert på røykeatferd på en individnivå. Modellen gir skaffe egenskapene til lungekreft i en befolkning på diagnosetidspunktet. Lungekreft data fra Surveillance, Epidemiology og sluttresultatet (SEER) database samlet mellom 2004 og 2008 ble brukt til å passe lungekreft progresjon og deteksjon modell. Den tilpassede modellen kombinert med en rykende basert kreft modellen ble brukt til å forutsi fordelingen av alder, kjønn, tumorstørrelse, sykdom scenen og røykestatus ved diagnose og resultatene ble validert mot uavhengige data fra seer database samlet inn fra 1988 til 1999. modellen nøyaktig spådde kjønnsfordeling og median alder av LC pasienter med diagnose, og rimelig spådde felles tumorstørrelse og sykdomsstadiet distribusjon

Citation. Chen X, Foy M, Kimmel M, Gorlova OY (2014) modellering Natural History og Påvisning av Lung Cancer Basert på røykeatferd. PLoS ONE 9 (4): e93430. doi: 10,1371 /journal.pone.0093430

Redaktør: Dominik Wodarz, University of California Irvine, USA

mottatt: 12. desember 2013, Godkjent: 04.03.2014; Publisert: 04.04.2014

Copyright: © 2014 Chen et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble finansiert av følgende tilskudd: CISNET fem U01 CA097431 til MK og OG, FAMRI Unge Kliniske Scientist Award og forebygge kreft Foundation tilskudd til OG, National Institutes of Health (NIH) gir R01 CA149462 til OYG, R03CA1338885 og R03128025 til IG, CA55769 til MRS, National Natural Science Foundation of China No. 81201166 til XC , forskningsfond for doktorgradsutdanning av Kunnskapsdepartementet i Kina No. 20120101120165 til XC, Zhejiang Key Science and Technology Innovation teamet 2011R50018 til XC, og CA016672 til MD Anderson. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Lungekreft er en av de mest dødelige sykdommer over hele verden, hovedsakelig fordi de fleste pasientene stede med avansert stadium sykdommen ved diagnosetidspunktet [1], [2]. De fleste pasienter har klinisk stadium III eller IV sykdom når de først merke symptomer og søke legehjelp, noe som resulterer i en dårlig prognose. Alder, kjønn, røykestatus, tumorstørrelse og sykdom scenen på diagnosetidspunktet er sterkt knyttet til prognosen for pasienter med lungekreft [3], [4], [5]. I denne artikkelen bruker vi matematiske metoder for å skille de tumorigenesis og deteksjonsprosesser. Målet med denne modellen er å spore tidslinjen av en person fra hans /hennes fødsel til den tiden av lungekreft initiering, progresjon, deteksjon og død. Dermed har vi kombinert modeller av kreftutvikling (kreftutvikling til første ondartet celle), tumorprogresjon (vekst og metastase), og deteksjon, å konstruere et rammeverk for modellering lungekreft på individnivå. Ved hjelp av denne rammen, kan vi antyde egenskaper som ikke kan observeres i klinisk praksis, herunder pasientens alder når den primære svulsten og nodal og fjernmetastaser er dannet. Vi var også i stand til å evaluere egenskaper som bare delvis kan observeres, slik som tumorveksthastighet, og tett rekonstruere egenskaper som kan observeres klinisk, spesielt, tumorstørrelse og sykdom scenen på diagnosetidspunktet. Denne fremgangsmåten kan være nyttig for å bedre forstå dannelsen av den nåværende lungekreft pasientpopulasjon og karakterisering av de fremtidige lungekreft trender med endringer i røykeatferd og deteksjonsmetoder.

Materialer og metoder

1 . Lungekreftpasienter identifisert i Surveillance, Epidemiology og sluttresultatet (seer) database

Age, sex, sykdom scenen, og tumorstørrelse for lungekreftpasienter som ble diagnostisert mellom 1973 og 2008 er tilgjengelig i SEER database [ ,,,0],6]. For pasienter diagnostisert 1988-1999 brukte vi informasjon om tumor størrelse, med iscenesettelsen fastsatt i henhold til seer grad av sykdomskoder, som kategoriserer svulster som lokalisert, regionalt, og fjernt. For pasienter diagnostisert 2004-2008, ble iscenesettelsen system utviklet av det amerikanske Joint Committee on Cancer brukes for å oppnå tumorstørrelse og tumor metastaser (TNM) sykdom stadium informasjon. Tumorstørrelse ble målt som den maksimale diameter, og vi beregnes volumet i henhold til en antagelse om at en svulst vokser som en sfære. Vi re-kategorisert tumorene i grupper fra 0 til 20 cm (med intervaller på 1 cm) i henhold til deres maksimale diameter.

2. Karsinogenese modellering

For carcinogenesen modell, vi brukte to-trinns klonal ekspansjon (TSCE) modell utviklet av Moolgavkar og Venzon [7] for å beregne alderen på pasienten ved startfasen. Denne modellen fører til en eksplisitt formel for fordeling av den totale varighet,

T

, av de to første trinnene i prosessen carcinogenesen (overgangene fra normal til initiert celle og initiert til malign celle), som omfatter tiden fra fødselen av en person til utbruddet av kreft [8]. En tobakksbasert modifikasjon av TSCE modell relatert røykeintensitet målt i pakker pr dag (PPD) til parametrene av modellen TSCE gjennom responsfunksjoner (med parametrene

ν

0,

α

0,

γ

0,

en

1 og

en

2, som er oppført i File S1 ) ble valgt. Røyking varighet ble tatt med for å produsere en mer spesifikk overlevelse funksjon av alder ved startfasen for individuell aldri, nåværende og tidligere røykere. [9], [10], [11].

The smoking historie generator (SHG versjon 5.2.1) [12] fra Kreft Intervention og overvåkning Modeling Network (CISNET), som produserte røyking varighet og intensitet data for enkeltpersoner, ble innlemmet i smoking-baserte TSCE modell ved hjelp av parametre oppført i tabell S1. Parametere for menn og kvinner ble estimert ved hjelp av data fra Cancer Prevention Study I (CPS-I) og fra Nurses «Health Study (NHS), henholdsvis. Den SHG ble også brukt til å generere en alder av dødsfall som skyldes andre enn lungekreft årsaker.

3. Tumorvekst og metastase modellering

For tumorvekst og metastasemodeller, antok vi at fare for tumorprogresjon er basert på aktiviteten av tumorceller og tumorceller løsner fra den primære tumor og overføring til en annen del av kroppen, noe som fører til metastase [13]

3,1. Forutsetninger

Følgende forutsetninger ble gjort i modellering tumorvekst og metastasering.

Den primære svulsten vokser fra en enkelt celle, med en antatt volum på 1 × 10

-9 cm

3 [14]. Veksttakten λ, som er relatert til svulsten dobling tid i uttrykket, er fastsatt på tidspunktet startfasen og antas å være den samme over tid.

Veksttakten følger en gammafordeling, med form og skalaparametre θ og K.

Alle metastaser er avledet fra den primære tumor, noe som betyr at cellene løsner fra den primære tumor på frekvensen ξ og overføres og avsettes på frekvensen μ ved en ny metastase nettstedet [ ,,,0],1. 3]. Vi anser ikke sekundær metastaser fra eksisterende metastaser.

Aktiviteten av svulsten cellen er knyttet til hvor raskt svulsten vokser og hvor lett cellene løsner. Nærmere bestemt, jo raskere den primære svulsten vokser, jo lettere er det for cellene å løsne. Vi definerer tumorcelle største aktivitet α, til hvilken veksthastigheten λ er proporsjonal, λ = ε1 x α (hvor ε1 er en konstant). Den celle-løsgjøring hastighet, β, er også proporsjonal med a, β = ε2 x α (hvor ε2 er en konstant). Således, der er en parameter som representerer forholdet mellom β og λ. Dersom svulsten med volum S vokser eksponentielt, det totale antall frittliggende celler før tiden

τ

0 er; vi anta, tolkningen av dem er at cellene alltid koble fra den primære svulsten, men ikke alle kreftceller vil løsne.

De frittliggende cellene vil bli overført og deponert på nye steder. Den samlede hastighet på overføring og deponering er μ. μ kan være en konstant parameter eller en funksjonell parameter bestemmes av en biologisk prosess, slik som graden av syntese av proteiner som bidrar til å overføre tumorcellene over karveggen [13].

metastaser er definert som enten nodal eller fjernt. Vi antar en annen pris μ (μ

n og μ

m) for hver type metastaser, μ

n for nodal og μ

m for fjernmetastaser. Vi antar også at frittliggende cellene kan flytte til lymfeknuter i minst like enkelt som å fjerne områder (u

n≥μ

m).

fare funksjon for metastaser (nodal eller fjernt) er relatert til antallet tumorceller som har løsrevet fra den primære tumor og har blitt overført og deponert ved node eller fjerne steder. Forutsatt eksponentiell vekst, fare funksjoner for nodal og fjernmetastaser er og, henholdsvis. De kumulative fordelingsfunksjoner (c.d.f.) er definert nedenfor:

med halen funksjoner (eller overlevelse funksjoner),. Hvis vi forutsetter ingen celler løsner fra den primære svulsten, og.

Assumption μ

n≥μ

m innebærer at der F

n (r) og F

m (e) tilsvarende kumulativ fordelingsfunksjon som er definert ovenfor. Primærtumor størrelser på tidspunktet for start av nodal og fjernmetastaser, henholdsvis betegnes og.

Vi antar at cellens aktivitet endringer etter løsrivelse fra svulsten, overføring og deponering ved metastatisk stedet. Cell på nodal og fjerne metastaser vokse tre (3λ) eller fire (4λ) ganger raskere enn den primære svulsten [13], [15], [16], tilsvarende.

Den primære svulst størrelse beregnes ved hjelp av tumorvekst modellen ved å gi den voksende tid

t

, med en konstant vekstrate λ. Dermed omskrive vi til og hvor og er funksjoner sannsynlighetstettheten (p.d.f.) tid som nodal og fjernmetastaser skjedde i en gruppe pasienter med samme tumor vekst λ. Så, hvor og er p.d.f. tid som nodal og fjernmetastaser forekom hos pasienter med tumorvekst med en Gamma fordeling, og er Gamma-fordelingsfunksjonen med parametere og. Så, hvor er den p.d.f. tid for pasienter som hadde bare nodemetastaser (uten fjernmetastaser) i hele tidsperioden.

4. Kreft gjenkjenning modellering

For å modellere kreft gjenkjenning, innførte vi en konkurrerende prosessen med å oppdage sykdommen gjennom primærtumor eller nodal eller fjernmetastaser, tilpasse rammeverket utviklet av Kimmel og Flehinger. [17]

4,1. Forutsetninger

Følgende forutsetninger ble gjort i modellering kreft deteksjon:.

påvisning av kreft er basert på påvisning metode som brukes. Faren for deteksjon har en lineær sammenheng med tumorstørrelse. Det avhenger også av grunnene (for eksempel symptomer eller resultatene av en screening test) som førte til at pasienten til å søke legehjelp. For detaljer, se likningene (*) for, og videre på.

påvisning av kreft er ansett som en konkurrerende prosessen med å oppdage den primære svulst eller nodal eller fjernmetastaser. De spesifikke, modusavhengig fare funksjoner for deteksjon gjennom primærtumor og nodale og fjernmetastaser er betegnet som, henholdsvis, og (*). Da c.d.f. for påvisning av primære tumorer og nodale og fjernmetastaser er betegnet som D

p (s), D

n (r), og D

m (s), (**) med halen funksjoner ,, henholdsvis (for detaljer se likningene (**)).

Vi har også definere primærtumorstørrelse avhengige fare funksjoner for påvisning (uavhengig av modus for deteksjon, enten gjennom primærtumor, nodemetastaser, eller fjernmetastaser), z

00 (s), z

10 (s), z

01 (e), og z

11 (s), hvor z

00 (e) er det fare funksjonen for registrering, på størrelse s, en kreft uten påvisbare metastaser; z

10 (e) er det fare for å påvise, gjennom uansett på hvilken måte, en kreft med den primære svulst størrelse s og med påvisbare nodal men ikke fjernmetastaser; likeså, z

01 (e) er fare funksjonen for registrering, på størrelse s, en kreft med påvisbare fjernt men ikke nodemetastaser; og z

11 (e) er fare funksjonen for registrering, på størrelse s, en kreft med påvisbare nodal og fjernmetastaser. Assosiert med disse fare funksjonene er de c.d.f. Z

nm (e) før de når størrelse S, med haler, hvor n, m = 0,1.

De observerbare variabler i studiet av størrelse avhengig metastaser er størrelsene S av primærtumor ved deteksjon og indikatorene N og M, hvor N, M = 1/0 hvis nodal eller fjernmetastaser er tilstede /fraværende.

forholdet mellom forutsetninger (2) og (3) for påvisning modellen er vist i de følgende funksjoner.

Å gi eksplisitte uttrykk for, de detaljerte uttrykk for og er pålagt. Ifølge forutsetningene metastaser modell, vet vi at:

Hvor 0 S

0≤S, er størrelsen på den primære svulst som var ikke observert og Δ er ansett som en forutsetning om at. representerer sannsynligheten for at en primærtumor med (1) eller uten (0) nodal (N) eller fjernt (M) metastasering.

Den felles tetthet /sannsynlighetsfunksjoner av tilfeldige variable S, N og M er presentert nedenfor .

Hvor er tetthets~~POS=TRUNC for deteksjon.

tumorstørrelse avhengig sannsynlighet for at nodal og fjernmetastaser er til stede på diagnose, og henholdsvis hvor

Erstatt med ,, og vi får:

5. Estimering

Metoder som tilbys av Kimmel og Flehinger [17] kan brukes til å anslå, og ikke-parametrisk. Vi kan også beregne ,,,, og parametrisk når para tumor-vekst og deteksjons modeller er bestemt. Nedenfor gir vi et eksempel.

Forutsatt at en svulst vokser eksponentielt med en vekstrate λ, og metastaser modell som er beskrevet ovenfor, har vi

Forutsatt at faren for tumordeteksjon avhenger lineært på størrelsen av tumoren, som angir effektiviteten av påvisning ved tumorstørrelse som α og scene-avhengig offsetparametere som w

0, w

1 og w

2, får vi

Tilsvar (**)

(**)

(**) er cdf deteksjons etter størrelse eller eller av primærtumor og nodal og fjernmetastaser. Den primære svulst størrelse når nodal og fjernmetastaser oppstår betegnes som. Vi kan da skrive, som

der er fordelt med c.d.f. Henholdsvis og.

5,1. Simuleringsbasert estimering.

tumorvekst og metastase modellen inkluderer ni parametere (ξ,,,, α, W

0, W

1, W

2). Den felles sannsynlighetsfunksjonen er vanskelig å maksimere direkte. Imidlertid kan den tumorvekst, metastase, og deteksjons modell beregnes hver for seg, når flere datapunkter for tumorstørrelse og sykdomsstadiet er tilgjengelig. En annen metode er å utlede minste kvadraters funksjon: hvor er den simulerte felles fordeling av tumorstørrelse og scene og er den observerte felles distribusjon, basert på disse parametrene, og bruke Nelder-Mead metoden [18], [19], [20] for å oppnå de beste montert parametrene i modellen. Vi brukte den andre tilnærmingen fordi vi ikke har flere tumorstørrelse målinger for enkeltpersoner å estimere modellene separat.

er minst firkantet funksjon der

i

er scenen status definert som lokalt (

i

= 0, ingen nodal eller fjernmetastaser N0M0), nodal (

i

= 1, nodemetastaser men ingen fjernmetastaser, N1M0), eller fjernt (

i

= 2, M1),

j

er antallet tumorstørrelsen gruppe; er den simulerte prosentandelen av lungekreft med tumor i størrelsesområdet

j

gruppe og

i

trinn blant alle detektert lungekreft; er den observerte prosentandel av lungekreft med tumor i størrelsesområdet j gruppe og i scenen blant alle detektert lungekreft. Detaljert simulering prosedyre var i File S1.

Vi beregnet de ni parametere (

ξ

,,,, η,

W

0,

W

1,

W

2) ved hjelp av TNM staging data i seer database 2004-2008 for modell montering. Siden SHG bruker 2000 som en cut-off point for den vitale status observasjon, ble felles utdeling av tumorstørrelse og sykdom scenen fra 1995 til 1999 valgt som resultatet av simuleringen. Resultatene ble validert mot uavhengige data fra seer database samlet inn fra 1988 til 1999. Disse årene ble valgt som nærmest mulig til 2004-2008 perioder.

For å simulere LC befolkningen, vi først brukte røyking historie generator ( SHG) for å danne den underliggende populasjonen. Vi antok at antall personer før år 1890 var null og i år 1890 var det 2877000 nyfødte babyer (antall levendefødte i hvert år ble vist i figur S1). Vi ga fødselsår (si 1890) og kjønn (halvt om halvt) til SHG som innganger og gjentok SHG for 287700 ganger. Da vi fikk disse personers grunnleggende informasjon, inkludert dødsår (konvertert fra en alder av døden, A

d, generert av SHG) og deres røyking historie informasjon. Deretter påføres vårt simulering strategi (beskrevet i Fil S1 i avsnitt 2.1 simuleringsprosessen) for å få LC kandidater og informasjonen om deres tumorprogresjon. For neste år (si 1891), la vi nye født babyer til den underliggende befolkningen og fjernet de folk som var døde året før (si 1890) fra befolkningen, når hun eller han var LCS eller «normale» personer. Dermed hadde vi underliggende befolkningen, noe som ville være nærmer det virkelige USA befolkningen (figur S2), og LC kandidat befolkningen, som ble ansett som en uaffisert (eksisterende før deteksjon) LC befolkningen. Forutsatt at ingen LC-relaterte dødsfall skjedde før deteksjon, ville den årlige LC befolkningen oppnås ved å påføre påvisning modell til uaffisert LC befolkningen.

Resultater

Figur 1 viser sannsynligheten for nodemetastaser og fjernmetastaser av tiden fra svulsten utbruddet. De estimerte parametrene ξ,,,

k

og i tabell 1, som gir anslag på modellparametere, ble brukt til å tegne, og. Disse Tetthetsfunksjon viste at sannsynligheten for nodal og fjernmetastaser begynte å hurtig økning på 2,5 år (ca. 900 dager) og 3 år (ca 1100 dager) fra tidspunktet for svulst utbruddet, henholdsvis. Den nådde det høyeste på 6,4 år (ca 2350 dager) og 6,8 år (ca 2500 dager) fra tidspunktet for svulst utbruddet.

= 8,05 × 10

-9, = 2,78 × 10

-9, K = 3,80 og = 1,15.

1. Modell Fitting

Figur 2 sammen karakteristikk av befolkningen for årene 1995-1999 generert av tilpassede modellen til seeren data (2004-2008). For svulster mindre enn 10 cm i diameter, andelen N0M0 stadium sykdommen (ingen nodal eller fjernmetastaser) nærmere reproduserer seeren data (2004-2008). Andelene av NxM0- og M1-trinns sykdommen er ikke gjengis så nøyaktig som andelene av N0M0 stadium sykdommen, spesielt når tumorene er større enn 5 cm i diameter. For svulster mindre enn 1 cm, spådde den modellen som ca 50% og 35% ville bli avholdt som henholdsvis N0M0 og M1,, mens selve prosenter var 42% og 42% henholdsvis.

(a) scenen fordeling betinget av tumorstørrelse og (b) tumor-størrelsesfordeling; (C) Sammenligning av prediktiv modell 1988-1999 og seer 1988-1999, hvor dataene er oppsummert som scene distribusjon betinget av tumorstørrelse.

2. Forutsi Klinisk Observer Kjennetegn

Den tilpassede modellen ble også validert ved å forutsi egenskapene til lungekreft pasientpopulasjonen i USA mellom 1988 og 1999. Modellen predikerer både kjønnsfordeling blant LC pasienter og median alder som er ganske nær til 1988-1999 seer data (tabell 2).

Sammenligning av modell prediksjon og data, ble en mindre andel av pasienter diagnostisert med lokalisert sykdom enn det var spådd (figur 2c). En av årsakene kan være de forskjellige stillas definisjonene brukt. De predikerte svulst størrelsesfordelingen var nærmere 2004-2008 seer enn til 1988-1999 Seer data (figur 3 (a-c)).

3. Forutsi klinisk observerbare kjennetegn

Tabell 3 oppsummerer spådd, men ikke direkte klinisk observerbare kjennetegn ved de oppdagede svulster. Den midlere tid fra begynnende svulstdannelse (når den første maligne cellen ser ut) for å nodale og fjernmetastaser (når de er bare dannes og ennå ikke observert) og diagnose er omtrent 4,77, 5,05, og 6,27 år, respektivt. Den gjennomsnittlige størrelsen av de primære tumorer når nodal og fjerne metastaser formen var 0,09 cm

3 og 0,24 cm

3, henholdsvis. Median alder på tidspunktet for svulst utbruddet er 63 og den gjennomsnittlige vekstraten tilsvarer tumorvolumet dobles på ca 60 dager.

Tabell S2 viser fordelingen av dobling tid ved tumorstørrelse og scene. I klinisk praksis, er mer sannsynlig å bli funnet med en mindre størrelse enn en primær uten eller bare nodemetastaser en primærtumor med fjernmetastaser. Dette fører til en observasjon at en primærtumor med fjernmetastaser vokser langsommere og blir mindre. Denne tabellen viser også at raskere voksende svulster har en tendens til å bli oppdaget i større størrelser.

Diskusjoner

De parametrene estimert fra felles fordeling av tumorstørrelse og scene i seeren database 2004-2008 ( Tabell 1) ble brukt til å generere en lungekreft pasientgruppen fra 1988 til 1999 og validert ved sammenligning av resultatene til data fra seer databasen fra 1988 til 1999. modellen predikerer nøyaktig kjønnsfordeling og median alder av lungekreftpasienter og tilnærmet felles tumorstørrelse og sykdom scenen distribusjon. Den nøyaktige prediksjon av kjønnsfordeling og alder ved diagnose for 1988-1999 er i stor grad på grunn av nøyaktigheten av røyking baserte TSCE modell og SHG. Fordi røykevaner har endret seg betydelig i løpet av de siste tiårene, er utgangs følsom for året på gjenkjenning, som er grunnen til at vi ikke er i stand til å rekonstruere kjønn og alder ved diagnose i seeren data 2004-2008 så nøyaktig. Denne modellen overvurderer andelen pasienter med svulster som er større enn 10 cm i diameter og undervurderer hvor stor andel av pasienter med svulster mellom 4 og 9 cm. Disse avvikene er mer opplagt for fordelingen av primærtumor størrelse på stadier NxM0 og M1 enn på N0M0. Årsaken kan være at deteksjonsintervallet er fastsatt til 1 år i vår modell, mens pasienter kan gå til en lege oftere når symptomene vises. For svulster mindre enn 1 cm, modellen undervurdert hvor stor andel av pasienter med fjernmetastaser.

Vi har også brukt utstyrt modell for å forutsi sykdomskarakteristika som er vanskelig eller umulig å observere i klinisk praksis. I henhold til estimater av k og θ i tabell 1, er den gjennomsnittlige tumorveksthastighet, er omtrent 4,4, hvilket tilsvarer en tumor-volum doblingstid på omtrent 55 til 65 dager gitt den eksponentielle tumorvekst modell. Denne vekstraten er høyere enn det som er blitt rapportert fra screening studier [21], [22], [23], og således forskjellen er ikke helt uventet [24]. Dessuten, å innføre en tidsavhengig eller størrelse-avhengig vekst av tumorvekst modellen kan forbedre tilpasning av modellen til dataene.

farer for detektering når node eller fjernmetastaser er til stede er mye større enn farene for deteksjon når bare den primære svulsten er til stede (W

1, W

2 W

0), noe som gjenspeiler realiteten av sykdommen deteksjon i klinisk praksis. Gjennomsnittlig varighet fra tumor utbruddet til deteksjon var ca 6 år i vår modell, som er konsistent med andre sykdomsprogresjon modeller [25]. Blant de detekterte tumorer, den gjennomsnittlige primær tumorstørrelsen ved metastase (nodal eller fjernt) var mindre enn 1 cm i diameter, noe som er betydelig mindre enn det underforstått av andre forutsigelser som stammer fra screeningsdata [17], [26], [27], [28]. Forutsetninger for deteksjon brukes i modellene førte til denne forskjellen. I vår modell, er sjansene for å detektere økningen lungekreft etter nodale og fjernmetastaser forekommer, og den konkurrerende deteksjons modellen gir mulighet for påvisning av metastasert tumoren. Denne oppdagelse modellen krever ikke noen av de to ekstreme forutsetninger som er benyttet i de tidligere studiene [8], [9], [17]: (1) at sannsynligheten for å oppdage kreft er uendret når metastaser er tilstede, eller (2) kreftformer oppdages umiddelbart når metastatisk spredning oppstår. For å redusere kompleksiteten av sykdommen scenen progresjon modell, kan vi ikke vurdere muligheten for en sekundær spredning av sykdom fra nodemetastaser. Dette kan være grunnen til at modellen ikke så nøyaktig gjengir andelen av nodal og fjernmetastaser som det gjorde andelen av lokaliserte tumorer for tumorstørrelser som er større enn 5 cm.

rammeverk kombinerer en karsinogenese modell med en modell av naturhistorie av tumorvekst og progresjon, og en deteksjons modell, for å forutsi egenskapene til en lungekreft pasientpopulasjon. Denne modulære strukturen tillater testing av ulike deteksjons strategier. En begrensning av denne modellen er at vi ikke var i stand til å konstruere den generelle sannsynlighetsfunksjonen for modellen i analytisk form, og Nelder-Mead estimering prosedyre som brukes til å optimalisere minst firkantet form er tidkrevende. En annen begrensning er at rammeverket avhenger i stor grad av røyking informasjonen generert av SHG, som må oppdateres før den kan brukes til å forutsi egenskaper av fremtidige lungekreftpasientgrupper. Vi gjorde ikke utføre simulering av histologi, som er en annen begrensning. Dessuten var produktet ikke vurdere forskjellen mellom de lunge kreftrisiko i CPSI /NHS og seer, mens den tidligere estimering av parametere i carcinogenese-modellen ble anvendt direkte. Vi kan ikke kalibrere kreft modellen siden røykeforbud informasjon ble registrert i seer.

Konklusjon

Vi foreslo en modell for å forutse naturlig sykdomsutvikling og påvisning av lungekreft som er avhengig av følgende biologisk og klinisk gunstige forutsetninger: den fare funksjon av tumorprogresjon er basert på aktiviteten av tumorcellene, som løsner fra den primære tumor og overføring til en annen del av kroppen, noe som fører til metastase [13]. Således er metastaseprosessen i forbindelse med størrelsen av den primære tumor og tumorveksthastigheten (som også er relatert til aktiviteten av tumorceller). Påvisningen av lungekreft hos pasienter som oppstår som et resultat av konkurrerende deteksjon av primærtumor eller knute eller fjern metastase. Vi brukte en TSCE modell kombinert med røyking historie generator for å reprodusere befolkningen med begynnende svulster i henhold til årlig levende fødsel nummer i USA (figur S1). Vi deretter brukt våre modeller av svulsten naturlig progresjon og dens gjenkjenning for å gjenskape lungekreft pasientpopulasjonen ved diagnosetidspunktet. Lungekreft data fra seer database samlet mellom 2004 og 2008 ble brukt til å passe lungekreft progresjon og deteksjon modell. Den tilpassede modellen kombinert med en karsinogenese modellen ble brukt til å rekonstruere fordelingen av alder, kjønn, tumorstørrelsen og sykdomsstadiet ved diagnose, og resultatene viste at modellen nøyaktig forut kjønn og median alder, og rimelige predikerte tumorstørrelsen og sykdoms stadium distribusjon mot uavhengige data fra seeren database samlet inn fra 1988 til 1999. Denne modellen rammeverket gir en plattform for å anslå utfallet av en strategi for sekundær forebygging av lungekreft før den legges i klinikken.

Støtte Informasjon

Figur S1.

Årlig levende fødsel nummer i USA brukt i simuleringen. For årene som manglet antall levendefødte (mellom 1890 og 1908) har vi brukt gjennomsnittlig antall levendefødte mellom 1909 og 1928 (2877000)

doi:. 10,1371 /journal.pone.0093430.s001

(TIF)

Figur S2. Host Sammenligning av US befolkningen mellom simulerte data og Census Bureau data; den simulerte populasjonen avviker fra virkeligheten befolkningen etter år 1984, siden SHG ikke kunne generere nye babyer etter 1984. Vi forventer imidlertid bare mindre hvis noen effekt av det på LC befolkningen, som lungekreft er svært sjelden hos unge individer.

doi: 10,1371 /journal.pone.0093430.s002 plakater (TIF)

Tabell S1.

Parametere av responsen funksjoner som brukes i TSCE modell [10]

doi:. 10,1371 /journal.pone.0093430.s003 plakater (docx)

Tabell S2.

Dobling tid ved etapper og tumorstørrelse for den simulerte LC befolkningen

doi:. 10,1371 /journal.pone.0093430.s004 plakater (docx)

File S1.

Støtte tekst

doi:. 10,1371 /journal.pone.0093430.s005 plakater (docx)

Takk

Vi takker Institutt for vitenskapelige publikasjoner ved MD Anderson for redaksjonell bistand.

Legg att eit svar