PLoS ONE: Pasienter & amp; Helsepersonell Verdier Angå sant-& amp; False-positiv diagnose når Colorectal Cancer Screening av CT colonography: Diskret valg Experiment

Abstract

Formål

For å etablere den relative vekting gitt av pasienter og helsepersonell til gevinster i diagnostisk sensitivitet mot tap av spesifisitet ved bruk av CT colonography (CTC) for tykktarmskreft screening.

Materialer og metoder

Etter etisk godkjenning og informert samtykke, 75 pasienter og 50 helsepersonell foretok en diskret valg eksperiment der de valgte mellom «standard» CTC og «utvidet» CTC som hevet diagnostisk sensitivitet 10% for enten kreft eller polypper i bytte for varierende grad av spesifisitet. Vi etablerte den relative økningen i falske positive diagnoser deltakerne handlet for en økning i sann-positive diagnoser.

Resultater

Data fra 122 deltakerne ble analysert. Det var 30 (25%) ikke-tradere for kreft scenario og 20 (16%) for polyppen scenario. For kreft, ble gevinsten i sensitivitet 10% handlet opp til en median 45% (IQR 25 til 85) slippe inn spesifisitet, noe som tilsvarer 2250 (IQR 1250 til 4250) flere falske positiver per ekstra sant-positive kreft , på 0,2% prevalens. For polypper, var tallet 15% (IQR 7,5 til 55), tilsvarende 6 (IQR 3 til 22) flere falske positiver per ekstra sant-positive polypp, ved 25% prevalens. Tipping poeng var betydelig høyere for pasienter enn fagfolk for både kreft (85 vs 25, p 0,001) og polypper (55 vs 15, p 0,001). Pasientene var villige til å betale betydelig mer for økt følsomhet for kreft (p = 0,021).

Konklusjon

Når screening for kolorektal kreft, pasienter og fagfolk mener gevinster i sann-positive diagnoser er verdt mye mer enn de negative konsekvensene av en tilsvarende økning i falske positiver. Evaluering av screeningtester skal forklare denne

Citation. Boone D, Mallett S, Zhu S, Yao GL, Bell N, Ghanouni A, et al. (2013) Pasienter « Helsepersonell «Verdier Angå sant- False-positiv diagnose når Colorectal Cancer Screening av CT colonography: Discrete valgeksperimentet. PLoS ONE 8 (12): e80767. doi: 10,1371 /journal.pone.0080767

Redaktør: Jeroen Hendrikse, University Medical Center (UMC) Utrecht, Nederland

mottatt: 10. august 2013; Akseptert: 13. oktober 2013, Publisert: 09.12.2013

Copyright: © 2013 Boone et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne artikkelen presenterer uavhengig forskning finansiert av det britiske National Institute for Health Research (NIHR) under sine Program Tilskudd til Applied Research støtteordning (RP-PG-0407-10338). Synspunktene er de av forfatterne, og ikke nødvendigvis de av den britiske NHS, den NIHR, eller Department of Health. En del av dette arbeidet ble utført ved UCL og UCLH, som mottar en andel av midler fra NIHR Biomedical Research Centre støtteordning

Konkurrerende interesser:. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Forstå diagnostisk test resultatene er avgjørende for kunnskapsbasert praksis [1], [2], spesielt for screening hvor risiko og fordeler er balansert fint. Ingen screening test er 100% sensitiv og konsekvensen er lett å forstå; falske negative tester vil forsinke eller forhindre kur. Spesifisitet er viktig for screening fordi folk flest er sykdomsfrie. En falsk-positiv test betyr friske personer kan gjennomgå invasive prosedyrer forårsaker angst, sykelighet, og selv dødelighet [3]. Tester som øker andelen personer med sykdom som tester sann-positive (øke følsomheten) vanligvis samtidig øke andelen mennesker uten sykdom som teste falskt positivt (redusere spesifisitet). For eksempel, dataassistert-deteksjon (CAD) [4], digital bildebehandling [5], og kortere screeningintervaller [6] all økning mammografisk følsomhet for brystkreft, men redusere spesifisitet.

Når man sammenligner to diagnostiske tester , er tolkning av og til vanskelig hvis man har høy følsomhet og den andre høy spesifisitet. En kombinert mål på sensitivitet og spesifisitet muliggjør tolkning; eksempler inkluderer netto nytte eller arealet under mottaker-operator karakteristiske kurven (AUC ROC) [7] – [11]. En fordel med netto baserte tiltak er at de kan innlemme relative verdier for gevinster i sann-positive diagnoser versus kostnadene ved falske negative diagnoser, mens ROC AUC ikke kan. Imidlertid har få studier kvantifisert disse kostnadene og de som har tyder på at de er verdsatt svært ulikt av pasienter; En studie fant kvinner ville godta 500 falske positive mammografi for å unngå en enkelt savnet kreft [12]. Mens kvalitativ forskning tyder på at deltakerne verds følsomhet med spesifisitet når screening for tykktarmskreft [13], [14] dette er ikke kartlagt. Ignorerer disse preferansene kan undervurdere test fordel. For eksempel, gjorde Medicaid /Medicare beslutning om å ikke dekke CT colonography (CTC) ikke anser at screenees kan fortsatt verdi gevinster i følsomheten til tross for redusert spesifisitet [15]. For å avklare dette spørsmålet vi etablerte den relative vekting gitt av pasienter og helsepersonell til tilleggs sann-positive diagnoser i forhold til flere falske positive diagnoser (dvs. gevinster i følsomhet mot tap av spesifisitet) ved bruk av CTC for tykktarmskreft screening.

Metoder

Etikk erklæringen

Etikk komité godkjenning ble gitt av den lokale institusjonelle etisk styret i Høgskolen Sykehus London; alle deltakerne ga skriftlig informert samtykke

Design

Vi har utformet og gjennomført en diskret valgeksperimentet (DCE) [16] -. [18], i henhold til nyere retningslinjer [18]. Spesielt kan pasienten setter følsomhet så høyt at selv små endringer kan maskere påvirkning av andre egenskaper [18]. Dessuten er spesifisitet konseptuelt utfordrende, med pasienter ofte uvitende om at falske positive diagnoser kan skje [13]. Derfor, for å forenkle beslutnings vi brukte en «sannsynlighet ekvivalens» design for å etablere holdninger til sensitivitet og spesifisitet alene, uten påvirkning av andre egenskaper. Vi presenterte sensitivitet og spesifisitet i form av ulike antall sanne positive og falske positive diagnoser ved bildebehandling. En hypotetisk «utvidet» CTC screening test ble presentert mot «standard» CTC og deltakerne bemerket deres preferanse mellom de to. Sensitivitet og spesifisitet for cancer for «standard» CTC var 85% og 95% henholdsvis, og 80% og 85% for polypper ≥6 mm. «Forbedret» CTC hevet følsomhet for kreft til 95%, tilsvarende å oppdage en ekstra kreft per 5000 screenees (prevalens kreft 0,2%) [19], [20]. «Forbedret» CTC hevet følsomhet for polypper til 90%, tilsvarende å oppdage 125 flere personer med polypper per 5000 (polypp prevalens 25%) [21]. Vi forsøkte å heve følsomhet med 10% samtidig unngå en perfekt test, som er urealistisk. Spesifisitet av «utvidet» CTC ble droppet i trinn på 10% for kreft og 20% ​​for polypper (tabell 1) på tvers av scenariene. Slike ekstremt lav spesifisitet er usannsynlig i det virkelige praksis, men nødvendig å beregne «tipping points», dvs. det nivået der en person er villig til å «trade» en attributt for den andre. I den foreliggende sak, tipping point var maksimal reduksjon i spesifisitet at deltakerne var forberedt på å handle for en absolutt (vs relative) økning i sensitivitet 10%.

Fordi DCEs er vanskelig å forstå, spesielt via spørre [22], vi brukte en intervju-ledede design for pasienter, som klargjør forståelse og tillater kvalitativ undersøkelse etterpå, spesielt med ikke-tradere [23] (en «non-trader» er en deltaker som ikke vil handle sine foretrukne attributt for enhver pris. med hensyn til denne studien, vil dette vanligvis representere en person som ville akseptere noen verdi av redusert spesifisitet for å oppnå 10% økt følsomhet). En multimedie laptop presentasjon av tykktarmskreft screening ved koloskopi og CTC ble gitt, inkludert informasjon om overlevelse fordel, at tidlig påvisning var ikke alltid kurativ [24], og at det falske positive CTC forårsaket unødvendig koloskopi. For tydelighets skyld er bare den mest alvorlige komplikasjon colonoscopic presentert, perforering i 1:500 [25], [26]. Fordi inkonsekvent framing kan introdusere skjevheter [27], både absolutt og relativ risiko ble vist ordrett og grafisk. Deltakerne ble bedt om å anta at de var gjennomsnittlig risiko for kreft /polypper og at polypectomy vil redusere levetiden sykdomsspesifikke dødeligheten med 25% [28].

En tilfeldig scenario ble gjentatt for å teste konsistensen. Et scenario med en opsjon utvilsomt overlegen for både sensitivitet og spesifisitet identifisert «irrasjonelle» respondere. Til slutt, vi innlemmet «vilje til betaling» (WTP) vurdering: Standard CTC ble reist mot CTC med følsomhet hevet med 10%, men med identisk spesifisitet. Deltakerne ble spurt om hvor mye, om noe, ville de betale for dette.

Pilot

10 frivillige ble loset å bekrefte lesbar og informere utvalgsstørrelse [29]. Mens forstå attributter og nivåer, gjorde noen ikke handle (dvs. de dømt den laveste spesifisitet akseptabelt). Vi omprogrammeres derfor ekstra «stress-lysbilder» (automatisk utløst av svarene akseptere den laveste spesifisitet for økt CTC), armerings potensielle skader, for å vurdere om heuristisk skjevhet forankret sin avgjørelse. Tilsynelatende irrasjonelle reaksjoner falt på repeat pilotering av de samme frivillige. Også deltakerne hadde blitt forvirret ved å vurdere kreft og polypper samtidig, så den endelige undersøkelsen presenteres separat kreft og polypp DCEs sekvensielt, som hver består av 10 scenarier.

Rekruttering

Vi rekrutterte påfølgende samtykkende pasienter screening alder ( 55 år), som er planlagt for ikke-kreft poliklinisk ultralyd /vanlig røntgen undersøkelser ved et universitetssykehus, identifisert via bookingsystemer. Informasjon /samtykkeerklæringer ble sendt og respondere intervjuet om deres avtale dag. For å unngå skjevhet vi utelukket respondenter med en personlig historie, eller under etterforskning for, tarmkreft [30]. Alle deltakerne ble tilbudt en £ 10 gavekort.

For å undersøke eventuelle holdnings forskjell mellom pasienter og helsepersonell, rekrutterte vi radiologer, mage- og tarmspesialister, kirurger, sykepleier-spesialister, og radiografer som etterspør, utførte, eller tolket colorectal bildebehandling . For å lette rekrutteringen, kan helsepersonell fullføre DCE online siden vi regnet de var kjent med konseptene som presenteres. Ellers en radiolog eller klinisk psykolog gjennomført DCEs, med scenarier presentert i tilfeldig rekkefølge innenfor de to DCEs. Alle deltakerne ble bedt om deres alder, etnisitet, utdannelse og inntekt brakett.

Analyse

Vårt primære resultatet var reduksjonen i spesifisitet deltakerne var villig til å «trade» for 10% absolutt (vs relativ) økning i følsomhet. Vi definerte «tipping-point» som den høyeste økningen i falskt positive (FPR, 1-spesifisitet) over baseline der deltakerne oppfattet fordelene av økt følsomhet ble oppveies av mulige skader. I pilot dette var 45% for kreft (dvs. deltakere lov spesifisitet til å falle fra 95% til 50% i gjennomsnitt). For å bestemme median tipping point ± 5% ved tosidig alpha 0,05 og 90% effekt kreves 96 deltakere (

N

= 4σ

2

z

crit

2 /

D

2 der

D

= 0,10,

p

= 0,45,

z

crit = 1,960, σ = 0,25) [31]. Vi pre-spesifisert et sekundært resultat sammenlikne pasienter og fagfolk, for som 88 deltakere var nødvendig for 90% styrke til å påvise 15% forskjell. Fordi vår pilot foreslo ikke-normalitet rekrutterte vi ytterligere 15% [31]. Stress-sklier ble utløst av deltakerne foretrakk «utvidet» CTC tross for økende FPR med 85% for kreft og 65% for polypper. Den høyeste tipping-point ble tatt hvis de handlet senere; andre ble ansett som vedvarende ikke-tradere. Fordi deltakerne ble presentert samtidig med sensitivitet, spesifisitet, billed beskrivelser av endringer og numerisk informasjon om den absolutte økningen i falske-positive i forhold til å øke i sann-positive (figur 1), innrammet vi våre resultater i form av falske positive vs sant- positive diagnoser, da dette er lettest forstås

Hver tally mark representerer en av 5000 mulige utfall for en pasient som gjennomgår screening:. sann positive (blå), falsk negativ (gul), sanne negative (hvit), eller falsk positiv (rød). Deltakerne ble informert om at hvis de skulle gjennomføre testen i spørsmålet, deres sjanser for å motta noen av resultatene ble representert av sjansen til å plukke noen av disse Heart merkene tilfeldig «som rulett». Data er også representert numerisk ved hjelp av både relative og absolutte prosenter. Dette scenariet tilsvarer den «tipping point» for pasienter og profesjonelle respondenter. I gjennomsnitt deltakerne favoriserte forbedret test (test B) i lys av sin ekstra følsomhet opp til, men ikke utover, dette nivået av flere falske positiver

median tipping-point ble beregnet for kreft og polypper, for pasienter /helsepersonell kombinert og separat. Fordi pasienten og profesjonelle tall skilte vi brukte verdier fra 1999 bootstrap estimater for median og IQRs, hvor prøvene tatt like mange (n = 50) i hver gruppe, derfor vekte pasienter og fagfolk like. Ved vippepunkt, ble endringen i spesifisitet ekvivalent med en 10% endring i følsomhet omdannes til en endring i de absolutte relative antall av falske-positive og sann-positive diagnoser ved hjelp av ligningen for netto nytte [11], [32]:

netto nytte =

Hvor Æ sens = 10%, og Δspec = median vippepunkt, og W er den relative vekting (maksimalt antall ekstra falske-positive omsatt per ekstra kreft eller polypp oppdaget). Utbredelse ble tildelt 0,2% for kreft, 25% for polypper [19] – [21]

Tipping punkter ble sammenlignet mellom pasientene intervjuet av den enkelte forsker.. Tipping poeng var svært ikke-normale så ble oppsummert av medianer og interkvartilt områder (IQR 25% til 50%); median kan tolkes som svarende til en gjennomsnittlig deltaker. For vippepunkter og relative vekting av falske positive til sann-positive, ble alle ikke-tradere behandlet som krever høyere FP verdier enn tilbudt (Figur 2: grå verdier). Mann-Whitney U test statistikk og Wilcoxon signert rank sum test ble brukt for uparet og paret sammenligning henholdsvis (Stata v11.0, Stata Corporation, College Station, Texas).

Hver gul prikk viser en enkelte deltakers handel punktet. Grey symboler angir verdiene tilordnet for deltakere som nektet å handle. Brun prikk viser medianverdien som representerer «en gjennomsnittlig deltaker». Oransje prikker viser 25 og 75 prosentpoeng. Grafer vises separat som følger: A; Pasienter, kreft scenario (n = 72). B; Fagfolk, kreft scenario (n = 50). C; Pasienter, polypp scanario (n = 72). D; Fagfolk, polypp scanario (n = 50).

Resultater

112 påfølgende pasienter og 62 fagfolk var invitert. 75 pasienter og 50 helsepersonell deltok, en reaksjon på henholdsvis 67% og 81% (tabell 2). Tre pasienter kunne ikke fullføre DCE forlater 122 for analyse (to medisinske fagfolk ga partielle responser). DB intervjuet 53, NB intervjuet 48; 21 svarene var online. Sammenlignet med fagfolk, pasienter var eldre, avviklet utdannelse tidligere, og hadde lavere husholdningsinntekt (tabell 2)

Ikke-tradere

For kreft påvisning 30 (25%;. 27 pasienter , 3 fagfolk) deltakerne var ikke-tradere, 20 (16%; 18 pasienter, 2 fagfolk) av som også var ikke-tradere for polypper. Ikke-tradere var signifikant mer sannsynlig å være pasienter (27 [38%] vs 3 [6%]); p 0,001), var signifikant eldre (median alder 64,5 vs 44,5; p 0,001), og var mindre utdannet enn tradere (15% vs 2% uten formelle kvalifikasjoner; p 0,001). Det var ingen signifikant forskjell i kjønn (59% vs. 61% kvinner; p = 0,56) eller etnisitet (30% vs. 33% ikke-hvite; p = 0,57). Vurderer pasienter alene, ikke-tradere (n = 27) var eldre (median alder 66,8 vs 60,1; p = 0,001), mindre velstående (median husholdningsinntekt GBP10001-20000 vs. GBP20001- £ 30 000 per år,. P = 0,03 GBP = great British Pound, = 1,2 euro og $ 1,6 på dagens valutakurser) og mindre kvalifiserte (median skole forlater alder 16 vs. 18 år, p = 0,02) enn tradere (n = 45). For kreft og polypper henholdsvis 34% (16/47) og 35% (11/31) deltakere som var i utgangspunktet uvillig, deretter handlet etter stress-lysbilder.

Kreft

Totalt median-vippepunkt for diagnose av kreft forekom ved 45% nedgang i spesifisitet (IQR 25 til 85%; tabell 3). Således, i gjennomsnitt, ble en 45% nedgang i spesifisitet betraktet som den maksimale akseptable fallet i bytte for 10% økt følsomhet. At befolkningen prevalens på 0,2%, dette tilsvarer 2250 (IQR 1250 til 4250) flere falske positive diagnoser per ekstra sant-positive kreft. Gjennomsnittlig antall ekstra falsk-positive per ekstra sant-positiv oppdagelse var signifikant høyere for pasienter (median 4250 (IQR 2750 til 4250) enn fagfolk (median 1250, IQR 750-2250, p 0,001), dvs. den gjennomsnittlige pasienten oppfattet et større antall falske positiver akseptabelt å få en ekstra sann-positive.

Polypper

Totalt median tipping-point for polypp deteksjon var 15% (IQR 7,5 til 55,. tabell 3) Derfor, i gjennomsnitt, en 15% nedgang i spesifisitet ble ansett som den maksimale fall akseptabelt i bytte mot 10% økt følsomhet at befolkningen prevalens på 25%, tilsvarer dette 6 (IQR 3-22) ekstra falsk. . -positive diagnoser per ekstra sant-positive polypp Igjen var median antall ekstra falsk-positive per ekstra sant-positive var signifikant høyere for pasienter (55, IQR 15 til 65) enn fagfolk (15, IQR 5 til 25. p 0,001)

for pasienter og fagfolk kombinert, gjennomsnittlig antall ekstra falske-positive handles per ekstra sant-positiv oppdagelse var signifikant høyere for kreft enn polypper (45 vs 15.; p. 0,001), noe som indikerer at større fall i spesifisitet ble oppfattet akseptabelt når du tester for kreft

Det var ingen signifikant forskjell i total median tipping point utløst av radiolog eller psykolog, (p = 0,57) og heller ikke mellom medisinsk fagpersoners data innhentet ansikt-til-ansikt vs online (p = 0,59).

Vilje til betaling

Tre fjerdedeler av deltakerne var villige til å gi en prisklasse de ville være villige til å betale for en test med følsomhet hevet med 10%, men uten tap av spesifisitet. Median WTP var signifikant høyere for kreft enn polypper: 201-500GBP (IQR 101-200GBP til 501-1000 GBP) vs. 101-200 GBP (IQR 51-100 til 201-500 GBP), p 0,001, noe som indikerer deltakerne følte kreft deteksjon var verdt mer enn polypp gjenkjenning. Det var ingen signifikant forskjell i betalingsvillighet for polypp deteksjon når pasienter og fagfolk ble sammenlignet (p = 0,97), men pasientenes WTP var betydelig høyere enn fagfolk for diagnose av kreft: median 201-500 GBP (IQR 101-200 GBP til 201-500GBP ) vs median 101-200 GBP (IQR 51-100 GBP til 201-500 GBP, p = 0,036). Videre median husholdningsinntekt var signifikant lavere for pasienter enn fagfolk (20001-25000GBP mot 40000GBP; p = 0,021, tabell 4), noe som indikerer at pasientens verdier ble spesielt sterkt holdt fra en slektning perspektiv. De fleste deltakere (27 av 32 deltakere) som nektet å svare betalingsvillighet, nektet å svare for både polypper og kreft. Deltakere som falt ga i gjennomsnitt høyere verdier av falsk-positive per ekstra sant-positiv diagnose.

Diskusjoner

I forhold til screening for kolorektal kreft og polypper, pasienter og helsevesen fagfolk både verdsatte gevinster i diagnostisk sensitivitet utover tilsvarende tap av spesifisitet. I gjennomsnitt ble 2250 flere falske positiver ansett verdt handel for en eneste ekstra sann-positiv diagnose av kreft og 6 ekstra falske-positive for en ekstra sann-positiv diagnose av en polypp. Våre funn er lik de fra en studie av mammografi som finnes kvinner som er villige til å handle 500 falske positive mammografi (og deres konsekvenser) for å diagnostisere en eneste ekstra kreft som ellers ville ha vært savnet [12]. Mens det er kjent at pasienter verdi følsomhet med spesifisitet for kolorektal kreft screening [33], [34], vi finner ingen data som kvantifisert dette for en radiologisk test. Vår interesse ble stimulert ved studier av CAD for CTC, som øker følsomheten, men på bekostning av redusert spesifisitet, noen ganger betydelig [35] – [38]. Men de potensielle kliniske konsekvenser av savnet kreft (død) er ikke tilsvarer de av falske positive diagnose (unødvendig koloskopi); våre funn bekrefter at både pasienter og helsepersonell mener dette. Det er derfor viktig at analyse av forskningsstudier av diagnostiske tester ta hensyn til denne asymmetrien. Diagnostiske tester kan sammenlignes ved hjelp av netto ytelses tiltak, som innlemme relative vekter for ulike kliniske kostnader [11], [39]. I motsetning statistiske tiltak som ROC AUC ikke kan tildele forskjellige verktøy til gevinster i sensitivitet versus faller i spesifisitet og så kunne finne en ny test av ingen verdi når både pasienter og fagfolk kanskje mener noe annet.

Vi brukte en diskret valg eksperiment, en relativt ny metode for å etablere preferanser [40]. Tradisjonelt er preferanser fremkalte via vurdering [41], med test attributter vurderes isolert. Resultatene er derfor forutsigbare: Pasienter og fagfolk favorisere tester som er sensitive, spesifikke, billig, og ikke-invasiv. Men dette betyr ikke nødvendigvis avveiningene kreves av reell praksis. DCEs økende grad forfektet av forskere fordi respondentene indikerer preferanser mellom ulike testegenskaper, som mer nøyaktig gjenspeiler reelle valg [16] – [18], [41] – [43]. Fordi DCEs er komplekse, leverte vi de fleste forsøk ansikt til ansikt for å lette forståelsen og deltakelse, noe som kan øke generalizability resultater. Følgelig fleste deltakerne ga fullstendig, konsekvent, meningsfulle svar. Mens intervjueren bias er mulig, fant vi ingen signifikant forskjell mellom svarene hentet fra psykolog eller radiolog. Videre var det ingen signifikant forskjell i svarene innhentet ansikt til ansikt eller på nettet.

For å forenkle og fokusere kognitiv oppgave, vi sammenlignet bare to attributter, økning i sann-positive og falske positive diagnoser ved avbilding (også uttrykt av sensitivitet og spesifisitet). For å skape en «utvidet» test som oppblåst følsomhet for kreft til 95% (perfekt følsomhet ville være urealistisk) brukte vi en baseline sensitivitet på 85% for standard CTC, som trolig et underestimat. Men i denne type eksperiment, den relative vektingen gitt til attributter på tvers av ulike scenarier er nøkkelen, ikke den absolutte forskjell mellom dem. Ved hjelp av denne designen vi fremkalte den relative viktigheten av at deltakerne plassert på gevinster i følsomhet mot tap av spesifisitet.

Selv om begge gruppene verdsatte gevinster i følsomhet utover tilsvarende tap av spesifisitet, dette funnet var sterkere for pasienter. Helsepersonell, særlig de som er medisinsk kvalifisert, vil ha en dypere forståelse av fordeler og ulemper med diagnostisk testing; som nevnt tidligere, er det noen pasienter som ikke forstår at falsk-positiv diagnose er mulig [13]. Pasientene var eldre, avviklet utdannelse tidligere, og hadde omtrent halvparten av årlig husholdningsinntekt av helsepersonell, men pasientene tillegges en pengeverdi til økt følsomhet som var omtrent det dobbelte av fagfolk, noe som demonstrerer de anser følsomhet svært viktig.

Hvis statistiske analyser må redegjøre for avvikvekter for sensitivitet og følsomhet, er en spesielt interessant spørsmål som vekter skal brukes? Noen vil hevde at helsepersonell er det beste alternativet, spesielt medisinsk kvalifiserte leger fordi de ber om tester, har den dypeste forståelse av fordeler og ulemper, og dermed har den bredeste og mest informert perspektiv totalt. Andre vil hevde at samfunnet slutt gjennomgår og betaler for diagnostisk testing, og så pasientenes perspektiver som er mest hensiktsmessig. Dette problemet garanterer videre forskning.

Vår studie har begrensninger. Som nevnt tidligere, DCEs er utfordrende for deltakerne [44], som krever motivasjon, kompetanse, og tallforståelse, som kan innføre utvalgsskjevhet [23]. Vi forsøkte å redusere denne effekten ved å bruke en intervju snarere enn et spørreskjema. Selv om vi hadde makt for vår primære endepunktet, større og /eller forskjellige prøver vil bedre undersøke forskjeller mellom underkategorier av pasienter og helsepersonell. Fordi vi mente at vi ikke bør ignorere spesielt sterkt holdt tro, har vi inkludert ikke-tradere via beregne medianverdier; våre anslag er derfor et underestimat. Betalingsvillighet estimatene er også sannsynlig undervurderer grunn av motvilje mot å statlig inntektsskatt. Vi fulgte retningslinjer for beste praksis for DCE studier [18], men foreslår at strategier for design og analyse trenger videre undersøkelser [45], [46]. Felles for alle hypotetiske scenarier, kan fagenes handlinger i det virkelige liv ikke speile det som uttrykkes i en DCE. Endelig vektene vi utledet er spesifikke for tykktarmskreft screening. Vi mener imidlertid at de sannsynligvis vil være lik andre scenarier som involverer diagnostisering av kreft [12].

I sammendraget, via diskrete valg eksperiment fant vi at både pasienter og helsepersonell mener gevinster i diagnostisk sensitivitet er verdt mer enn det som oppfattes som negative konsekvensene av et tilsvarende tap av spesifisitet, når de vurderer colorectal cancer screening. Gevinst i følsomhet med tap av spesifisitet ble verdsatt mer høyt for kreft deteksjon (vs polypper) og hos pasienter i stedet for helsepersonell. Disse effektene bør påvirke vurderingen av nye screeningtester.

Legg att eit svar