PLoS ONE: Mønstre av Informasjon-Søker for kreft på Internett: En analyse av reelle data

Abstract

Selv om tradisjonelt de viktigste informasjonskildene for kreftpasienter har vært behandlende team, pasienter og pårørende i økende grad vende seg til Internett, selv om denne kilden kan være misvisende og forvirrende. Vi vurderer internettsøk mønstre for å forstå informasjonsbehovet til kreftpasienter og deres bekjente, samt å skjelne deres underliggende psykologiske tilstander. Vi skjermet 232,681 anonyme brukere som initierte kreftspesifikke søk på Yahoo Web søkemotor over tre måneder, og valgte for studie brukere med høye nivåer av interesse i dette emnet. Søk ble partisjonert av forventet overlevelse for sykdommen som søkte. Vi sammenlignet søkemønstre anonyme brukere og deres kontakter. Brukere som søker informasjon om aggressiv kreftsykdom som viste kortere søkeperioder, med fokus på sykdoms og behandling-relatert informasjon. Brukere som søker kunnskap om mer lat svulster søkte etter lengre perioder, vekslet mellom ulike fag, og viste en stor interesse for temaer som støttegrupper. Bekjente søkte for lengre perioder enn det proband brukeren når søker informasjon på aggressiv (sammenlignet med lat) kreft. Informasjonsbehov kan modelleres som overgangen mellom fem diskrete tilstander, hver med en unik signatur som representerer den typen informasjon av interesse for brukeren. Dermed tidlige fasene av informasjon-søkende for kreft følge en bestemt dynamisk mønster. Områder av interesse er sykdom og varierer fra probands og deres kontakter. Disse mønstrene kan brukes av leger og medisinsk Web site forfattere å skreddersy informasjon til behovene til pasienter og pårørende

Citation. Ofran Y, Paltiel O, Pelleg D, Rowe JM, Yom-Tov E (2012 ) Patterns of Information-Søker for kreft på Internett: en analyse av reelle data. PLoS ONE 7 (9): e45921. doi: 10,1371 /journal.pone.0045921

Redaktør: Petter Holme, Umeå Universitet, Sverige

mottatt: 8. mai 2012; Godkjent: 27 august 2012; Publisert: 21.09.2012

Copyright: © Ofran et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Alt arbeid ble gjort som en del av de respektive forfatternes forskning, uten ekstra eller ekstern finansiering

Konkurrerende interesser. DP og EYT er ansatte i Yahoo Inc. Yahoo ikke, og vil ikke få økonomisk fra dette arbeidet. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer. Forfatterne bekrefter at det ikke er noen patenter, produkter under utvikling eller markedsført produkter å erklære stammer fra dette arbeidet.

Innledning

For tretti år siden, Dr. Franz Ingelfinger, en gastroenterolog og tidligere redaktør av

New England Journal of Medicine

, ble diagnostisert med spiserørs adenokarsinom. I et foredrag levert etter hans diagnose [1], Dr. Ingelfinger beskrev nød forårsaket av flom av informasjon rettet mot ham og hans familie. Han roste en av hans venner for rådet ham til å «glemme den informasjonen du fikk fra mange hold og ser etter en person som ville bare fortelle deg hva du skal gjøre». «Du trenger en lege», sa han [1]. Tilbake i slutten av syttitallet, legene var det viktigste (og for mange pasienter den eneste) kilde til informasjon. I dag, pasienter trenger ikke være redaktører av et medisinsk tidsskrift for å møte torrents av informasjon fossende fra Internett. Dette kryssild av «fakta» utfordrer legenes rolle og myndighet. I tilfelle av kreftdiagnose, de fleste pasienter søke på internett for kreft informasjon, vanligvis før deres første møte med en onkologi spesialist [2]. Deres informasjonsbehov synes å variere med type kreft [3]. Internett-basert informasjon ble rapportert av pasienter til å være en trigger for sine beslutninger om behandling, kliniske studier og selv velge sine leger. Men studier har vist at pasienter har en tendens til ikke å dele uformell informasjon med sine leger [4] – [6]. Derfor er en god forståelse av hvordan pasienter administrere informasjon oppkjøpet gjennom Internett avgjørende for effektiv pasient-lege kommunikasjon som vil være relevant for pasientens behov.

Gransker hvordan pasientene søke etter informasjon på nettet er vanskelig. De fleste søk er utført i privatliv unna medisinske fasiliteter eller helsepersonell. Derfor kan to hovedmåter brukes til å studere det: Først gjennom retrospektive spørre eller via innhold generert mens du søker etter denne informasjonen på nettet. Selvrapporterte spørreskjemaer eller intervjuer [7], [8] har noen store ulemper. Først er det en iboende utvalgsskjevhet om pasienter som samtykker til å delta i undersøkelsen, med en tendens til å inkludere mennesker med bestemte sosiodemografiske kjennetegn som høyere inntekt og utdanningsnivå [9]. Second, selv en lav frafallsfrekvensen vil skjevhet studie konklusjoner [10]. Tredje, undersøkelser vanligvis fokusere på pasienter, men i mange tilfeller informasjonsinnhenting via Internett er gjennomført av pasientens familiemedlemmer [11], [12]. Sist, informasjon samlet i løpet av de første dagene av sykdommen anses grunnleggende for pasientens opplevelse av sykdommen [13] – [15]. Det er imidlertid svært vanskelig å gjennomføre undersøkelser som dekker dette kort og stressende periode [16], og har vist seg retrospektive egne rapporteringer til å være unøyaktig [17].

Søkemotorer og andre nettsteder registrere data produsert gjennom målrettet aktivitet (f.eks, skrive blogger eller sende forespørsler) og indirekte aktivitet (f.eks surfer på nettet). Kjent som brukergenerert innhold (UGC), har disse blitt brukt til å overvåke spredningen av influensa [18], undersøke nytten av litiumkarbonat i amyotrofisk lateral sklerose [19], og overvåke sesongmessige og geografiske endringer i depresjon forekomsten [20] blant annet epidemiologiske spørsmål [21] – [23]. I vårt arbeid, undersøkte vi anonym stor skala UGC, levert av Yahoo søkemotor for å undersøke kreftrelatert informasjon søkende mønstre.

Metoder

Datainnsamling og kategorisering

alle henvendelser postet av brukere av Yahoo Web søkemotor i USA mellom mai og juli 2010 er analysert. Data som brukes for å gjennomføre denne studien er privilegert informasjon samlet inn av Yahoo Inc., og samlet, DP og EYT, som er ansatte i Yahoo Inc. Informasjonen på hver spørring inkludert spørringen tekst, sin tid og dato, en liste over sider besøkt av brukeren som et resultat av spørringen, og en anonymisert brukeridentifikasjon.

spør~~POS=TRUNC ble filtrert til å omfatte bare kreftspesifikke spørsmål, definert som de som følger navnet på minst én av de 35 mest vanlige spesifikke kreft oppført etter seer [24], og delt av sine fem-års overlevelse i to ulike grupper: aggressiv (5-års overlevelse under den generelle median for kreftpasienter) og indolent (5-års overlevelse over den generelle median for kreftpasienter ).

Etikk uttalelse

All forskning er beskrevet her ble utført i henhold til Yahoo retningslinjer for menneskelige subjekt forskning, etter forhåndsgodkjenning av Yahoo interne menneskelige tema forskning rådgivende komité. Spesielt for denne oppgaven, ble data først anonymiseres og akkumuleres før analyse, og ingen enkeltnivå bruker datum ble undersøkt. Denne informasjonen kan være tilgjengelig for forskere etter en signering av de nødvendige juridiske avtaler for å opprettholde brukernes personvern.

Identifisere brukere med høy interesse i bestemte kreft

Blant de 232,681 skjermede brukere som søkte på kreft relatert informasjon, de fleste søkere sett bare snaut sider. Disse brukerne ble mer sannsynlig å bruke Yahoo søkemotor som en portal for å få til en bestemt web-side og ble ekskludert fra studien. Fordelingen av antall viste sider av hver bruker er svært skjev. Faktisk er det tilnærmes med en power-lov distribusjon, med bakkene i -2,19 (R

2 = 0,97), som beskriver en fordeling mønster der de fleste brukerne viser bare noen få sider og et mindretall mange sider. Derfor en vilkårlig terskel av fem besøkte sider ved posting kreft-relaterte spørsmål i løpet av studieperioden ble valgt, for å identifisere brukere med sterkest interesse i bestemte kreftformer. I det tilfelle at brukerne søkte etter mer enn en krefttype, ble det dominerende sykdommen per søkeren definert som den spesifikke krefttype som de søkte etter med den høyeste frekvens. Ved hjelp av de ovennevnte kriterier, ble 182,564 brukere ekskludert og totalt 50,117 brukere som postet 225,675 spørringer ble inkludert i studien.

Identifisering og kategorisering av populære web-sider

Antall brukere som så på hver side har en lignende effekt svigermor distribusjon, med bakkene i -2,25 (R

2 = 0,98). For å utforske innholdet av de mest populære sidene, fokuserte vi bare på sider besøkt av minst fem brukere og inspisert et tilfeldig utvalg av 500 sider manuelt. Ti kategorier ble identifisert, slik klassifisering av sider i henhold til sine temaer. For å merke alle sider besøkt av alle brukere, ble crowdsourcing brukt, spesielt Amazon Mechanical Turk tjeneste (https://www.mturk.com/), som gjør at hver side som skal vises til evaluatorer som er betalt for å kategorisere websider [25]. Tidligere arbeid har vist at denne kategoriseringen er utført med nøyaktighet som kan sammenlignes med eksperter [26]. Hver side ble sendt til 5 uavhengige personer for merking inn i en av de 10 kategoriene.

Alle 5987 besøkte sidene ble introdusert til 776 Mechanical Turk labelers, hver av dem merket, i gjennomsnitt, 34 sider (± 181 sider ). Av disse, 3602 sidene hadde en distinkt merke til enighet om minst 3 labelers. Antall sider i hver kategori er vist i tabell 1. De resterende 2385 sider ikke har veldefinerte etiketter, og ble fordelt som følger: I 46% av sidene, to kategoriene fikk to stemmer hver, og i 48% en kategori fikk to stemmer og tre fikk én stemme hver. Å utforske mulige årsaker til uenighet mellom labelers, sidene var in-silico kvantifisert ved å analysere ordene de inneholdt. Vi brukte et vektorrom modell [27] for å representere ordene på hver side, og målt avstand til den sentroide (dvs. den gjennomsnittlige vektor modell) for hver kategori. Avstanden av alle ikke-klassifiserte sider til kategoriene angis av labelers var omtrent den samme (i gjennomsnitt innenfor 5%). Men for sider hvor det var et flertall avtale mellom labelers, denne forskjellen var i gjennomsnitt 20% (rank sum test, p 10

-10). Vår konklusjon er at sider med ikke-diskret merking er genuint tvetydig når det gjelder merking, og er dermed ekskludert fra analysen.

Erkjennelsen søkemønstre

Brukernes søkemønstre ble definert som i hvilken rekkefølge bla de sider fra ulike kategorier, samt tiden det tar å gjøre dette. Behovet for informasjon er antatt å være dynamisk, skiftende som en funksjon av fysiske og mentale endringer [28]. Endre mønstre av den type opplysninger som kreves kan gjenspeile overgang mellom mentale tilstander felles for personer som deler kliniske og psykologiske tilstander. Disse observerbare statene er skjult, men kan identifiseres fra søke mønstre ved hjelp av skjulte Markov Models (HMM) [29], som estimerer de skjulte tilstander av et system, er sannsynligheten for overgang mellom dem, og sannsynligheten for hvert observer signal gitt skjult tilstand. For å finne den mest sannsynlige rekke skjulte tilstander brukere gikk gjennom i løpet av tiden vi har observert dem, må vi først trent HMM av et varierende antall skjulte tilstander, og 10 synlige sider kategorier. Den beste antall skjulte tilstander ble funnet ved hjelp av hjemmested, som følger: vi trent HMM bruker som leser data fra 75% av brukerne, og testet modellen nøyaktighet ved å sammenligne de forut sekvenser av søk for de resterende 25% av brukerne med deres faktiske atferd. Denne prosedyren ble gjentatt 5 ganger med et tilfeldig utvalg av den innledende modell parameteren, for å redusere sjansen for konvergens til et lokalt minimum.

proband bekjente

Til slutt, for å studere sammenhengen mellom søk i sosiale bekjente, brukte vi en liste over kontakter i Yahoo Instant Messenger (YIM) søknad som en proxy for brukernes sosiale nettverk. Antall kontakter per person er makt-loven fordelt (α = -0,99, R

2 = 0,93), med en median på 6.

Statistisk analyse

Vi har sammenlignet de mønstrene av søk ved hjelp av ikke-parametriske tester, på grunn av de ikke-Gaussian fordelinger av disse mønstrene. P-verdier mindre enn 0,05 ble ansett som statistisk signifikant.

Resultater

Hvor sannsynlig er våre søkere til å være ekte kreftpasienter?

Vi brukte en lineær regresjonsmodell å sammenligne frekvensen av hver enkelt krefttype i søkeloggen med sin kjente aldersjusterte insidensen, aldersjusterte 5-års relativ overlevelse, og median alder av diagnose. Aldersjusterte insidensen var sterkt korrelert med spørringen log utbredelse, forklarer over 65% av variansen. (P 10

-5), og var den eneste statistisk signifikant korrelerer av søkeloggen prevalens (figur 1)

forekomsten av kreft er sterkt korrelert med hvor ofte spørsmål knyttet til dem er lagt ut på Internett.

Dette arbeidet forsøkte å karakterisere behov og søkemønstre av pasienter og deres familier, venner og andre nære bekjente som bruker nettet som en viktig kilde til informasjon. Brukere som utvalgte sider av bare én kategori er sannsynlig enten ikke pasienter og deres primære omsorgspersoner (for eksempel studenter) eller andre brukere som foretrekker andre informasjonskilder enn nettet og bruker internett og til eller bare når vi leter etter spesifikk informasjon. I vår kohort av brukere identifiserte vi to grupper av brukere: en, som består av 20,808 (41,5%) personer, som besøkte sider fra to eller flere kategorier (for kategorier definisjoner se nedenfor) som viser interesse for flere aspekter av en kreftsykdom. De resterende 29,369 (58,5%) brukere innom kun sider fra en enkelt kategori. Brukere som viser et smalt spekter av interesser i Web-avledet kreft informasjon er ikke i fokus i dette arbeidet, og ble dermed ekskludert fra analysen.

Brukere av den første gruppen søkte etter informasjon for en gjennomsnittlig periode på 10,0 dager (± 14,5 dager) i løpet av dataperioden. Derfor er det åpenbart at en bestemt hendelse kan ha utløst søket. Vi spekulerer i at disse brukerne er enten nylig diagnostisert kreftpasienter eller de svært lukke dem, som tjener som deres «Internet agenter». Vi gir ekstra støtte for dette nedenfor.

Informasjon søkende mønstre kan representere underliggende psykologiske tilstander og er sykdomsrelatert

Den mest sannsynlige antallet skjulte tilstander er vist i figur 2. Den beste prediksjon av søkemønstre er nådd med fem skjulte stater, som vi spekulerer er et produkt av overganger mellom fem mentale tilstander i løpet av studieperioden. Mønsteret av søkene var knyttet til aggressivitet av kreft. Figur 3 viser at tilstandsdiagram for aggressive sykdommer er litt mer streng-aktig, med de to første statene å være den mest stabile, dvs. brukerne er mest sannsynlig å bli værende i disse statene. Derimot er tilstandsdiagram for de mer lat sykdommene er svært sammenvevd, overganger mellom stater er mer symmetrisk, og de mest stabile landene er de tre siste. Sammenligning av HMM lærte for lat versus aggressive sykdommer, finner vi at utgangstilstander rangeres annerledes, og at for sistnevnte, behandling informasjon er viktigere senere i søkeprosessen. Interessant, synes støtte bare som en betydelig utgangstilstanden for lat kreft.

Denne grafen viser gjennomsnittlig feil i å forutsi siden kategorien som en 25% undergruppe av befolkningen brukere vil surfe, gitt deres fortid surfing oppførsel og modellen bruker søker konstruert ved å anvende en annen undergruppe (de resterende 75%) av befolkningen. Den laveste feilen er nådd i 5 skjulte tilstander, noe som tyder på at brukerne passere gjennom fem faser av søk under søkeprosessen.

Staten overganger for kreft med under-median overlevelse er mer streng-aktig, med de to første statene som er den mest stabile stater. Derimot er tilstandsdiagrammer for mer lat sykdommene er svært sammenvevd, overganger mellom stater er mer symmetrisk, og de mest stabile landene er de siste tre stater. Tabellen viser alle side kategorier (observer stater) med en sannsynlighet større enn 0,05 for hver av de skjulte HMM tilstander, bestilt ved å redusere sannsynligheten. Mens utgang stater er lik for begge grupper av sykdommer, de er rangert forskjellig. Videre søkere for kreft med under-median overlevelse lete etter behandling informasjon senere i søkeprosessen. Interessant, synes støtte bare som en betydelig utgangstilstanden for lat kreft.

Brukere søker etter aggressive kreftformer har en organisert søkemønster med høy interesse for sykdom informasjon og behandling i begynnelsen og en lav interesse for støttende og sosiale organisasjoner. Brukere som er interessert i mer lat kreft følge en mindre direkte bane, beveger seg frem og tilbake mellom ulike kategorier og uttrykker stor interesse for støttegrupper.

Søk etter bekjente

Listen over kontakter til hver enkelt bruker fra Yahoo Instant Messenger (YIM) var tilgjengelig for å identifisere hver brukers liste over kontakter og å analysere forholdet mellom kreft-relaterte søk. I løpet av studieperioden, 279 brukere søkte etter kreft informasjonen i minst to kategorier, mens i det minste en av sine kontakter i YIM gjorde det også. Vi fant ikke et tilstrekkelig høyt nivå av kreft-relaterte søkeaktivitet for bekjente av de resterende brukerne, og dermed fokusere på søke oppførselen til denne forholdsvis lille gruppen av brukere. Vi merker oss at antall observerte par samtidig søker brukere er ca 6 ganger større enn forventet ved en tilfeldighet. Således disse samtidig forekommende søk i nettverket er av stor betydning. Den type kreft spørres i det minste en av de søkene overlappes mellom proband brukere og kjente i 56% av tilfellene. Dette sammenlignet med 25% hvis brukerne er tilfeldig matchet.

Bekjente av brukere som søker informasjon om mer lat sykdommer begynte å søke i gjennomsnitt 15 dager etter den første søkeren. For aggressive sykdommer, denne perioden var bare 9 dager (p = 0,06, rank sum) (figur 4). Bekjente søkt etter en mye kortere tid enn den første brukeren i tilfelle av lat sykdom (5,1 ± 8,1 dager versus 13,9 ± 18,9 dager, p = 0,01, logg test). I kontrast, i tilfeller av aggressiv sykdom bekjente søkte på litt lengre enn den første brukeren (12,5 ± 17,3 versus 11,0 ± 14,7 dager, ikke statistisk signifikant). Den første søkeren i et par bekjente på jakt etter informasjon om kreft søkte i gjennomsnitt for 28% flere sykdommer (sign rang, p = 0,03). Vi hypoteser dette kan representere ikke-spesifikke søk før endelig diagnose.

a. Når pasientene er diagnostisert med kreft, får de informasjon fra leger, internett og deres venner og familie. Ved å karakterisere pasientene informasjon-søkende mønsteret kan vi bedre forstå pasientens behov. B. Mønstre av Internett-søk reflekterer underliggende psykologiske tilstander. Mest sannsynlig utgang statene identifisert av HMM er lik for begge lat og aggressive sykdommer og er representert ved de fargede rutene. Men søkere for informasjon om aggressive kreftformer ser for behandling informasjon senere i søkeprosessen, mens støtte vises bare som en betydelig utgangstilstanden for lat kreft. C. Time-linje av kreft-relaterte søk ved proband søkeren (mest sannsynlig at pasienten eller hans primære omsorgsperson) og andre bekjente. Bekjente er svært aktive søkere for aggressive sykdommer, men mye mindre så for lat sykdommer, med kortere søkeperiode som ikke overlapper med at av de første søkere.

Til slutt, først søkere i hvert par av søkere er mer sannsynlig å undersøke sider relatert til kreft behandlinger (25% mer, p = 0,01, rank sum test) sammenlignet med andre søkere), og informasjon om kreft (14% mer, ikke statistisk signifikant). De senere-søker bekjente var mer sannsynlig å bla gjennom sider med informasjon om årsakene til kreft (116% mer (ikke statistisk signifikant), sammenlignet med proband søkere) og sosiale medier relatert til kreft (75% mer (ikke statistisk signifikant)).

Diskusjoner

100-dagers periode etter kreftdiagnose er anerkjent som «den eksistensielle situasjonen i kreft» [30]. I deres papir, Weisman og Worden [30] beskrev hvordan fundamental disse første dagene er for klimaendringer med kreft relatert nød i fremtiden. Opplysninger innhentet i denne perioden former og definerer pasientenes perspektiv om deres tilstand.

Internett revolusjonert måten pasienter og deres bekjente samle inn informasjon. Kreft eksperter ofte støter på pasienter som ble trukket av internett for å feilaktige selvdiagnose, ubekreftede behandlinger [31], [32], eller som er fortvilet etter eksponering for ekstreme utfall muligheter følgende Internett-søk. I denne studien har vi fokusert på informasjonsbehovet til antatte kreftpasienter og deres bekjente.

Vår studie viser at informasjonsbehovet til intensive søkere er forskjellige, avhengig av alvorlighetsgraden av kreft, og endrer seg raskt over en periode dager (figur 4). Vi antar at den første intensive søkeren er pasienten eller nær omsorgsperson (f.eks foreldre, ektefelle). Bare senere andre bekjente som venner eller andre familiemedlemmer delta i søket. I aggressive kreftformer, søketiden av pasienten er kortere, enten på grunn av behovet for øyeblikkelig behandling eller fordi pasienter foretrekker å undertrykke tall, statistikk og fakta om disse sykdommene. Onkologer som gir pålitelig informasjon, reserve pasienter ineffektive og noen ganger misvisende nettsurfing [32]. Den overraskende lav andel av Internett-bruk rapportert hos foreldre til barn med kreft og hos pasienter med avansert stadium kreft [33] – [35] kan gjenspeile et lignende fenomen. Våre data kan derfor gjenspeile tidligere henvisning til krefteksperter for pasienter med aggressiv sykdom.

Pasienter med aggressiv kreft tilbrakte en kort tid på å lete etter informasjon av seg selv, men deres bekjente ble involvert tidlig og søkte på relativt lengre perioder. Omvendt, for lat kreft, bekjente var involvert sent i søkeprosessen og brukte bare en kort periode å søke på Internett. Funnene tyder på at pasienter og primæromsorgspersoner av pasienter med mindre aggressive svulster har mer tid å bruke på Internett søker enn de med aggressive svulster. Forsinkelsen i bekjente «søk kan skyldes pasientenes kildeinformasjon før den endelige diagnosen. En kortere forsinkelse kan representere en kortere gap i aggressive kreftformer mellom tidlig mistanke og endelig diagnose eller behandling beslutninger.

Tilbake i 1976 uavhengig samle informasjon om de «sykdom var arbeidskrevende og var dermed svært avhengig av informasjon fra leger . I dag, ved hjelp av internett, betydelige mengder informasjon kan samles i svært kort tid. Faktisk våre funn viste at type og intensitet av å søke variert i løpet av dager, noe som tyder på at det i

Leger internett era «den eksistensielle situasjonen i kreft» varer mye mindre enn 100 dager og kan variere mellom pasienter med ulike kreftformer. se pasienter i løpet av en svært følelsesmessig dynamisk og kritiske perioden. Pasientens mentale tilstand påvirker informasjonssøkeprosessen og relevant informasjon kan i sin tur endrer pasientens mentale tilstand. De fleste begynner Internett-søk før møtet med onkolog [2]. Derfor er lengden av tidsforsinkelse mellom diagnose og henvisning til spesialister, så vel som intensiteten av sykdommen og alvoret av behandlingen er alle egnet til å påvirke informasjonen samle mønster.

Som vi demonstrert i våre resultater, søkemønstre er avhengig av alvorligheten av sykdommen, som er lengden av hele søkeprosessen og overgangen mellom HMM tilstander. Påfallende, i en modell av søking mønstre antall skjulte tilstander samsvarer med antall mentale tilstander spådd av Kübler-Ross modell [36]. Imidlertid er ytterligere forskning er nødvendig for å demonstrere om og hvordan de skjulte HMM statene matche de spådd av Kübler-Ross modell (dvs. fornektelse, sinne, forhandling, depresjon og aksept), og samspillet mellom de indre mentale tilstander og eksterne hendelser .

studier som er basert på UGC, særlig de i helse domene, er ofte den eneste objektiv kilde til informasjon om hvordan brukerne søker informasjon. Som vi fremhevet i denne studien, disse er viktig for leger å bedre forstå sine pasienter, og i sin tur for bedre informasjonsutveksling mellom pasienter og helsepersonell. Imidlertid bør behovet for disse studiene ikke kompromittere personvernet til brukerne. I denne studien har vi tatt konkrete skritt for å minimere risikoen ved anonymisering brukeridentitet og ved å analysere data etter å samle det fra flere brukere. Derfor tror vi at vi har fått mange av fordelene med å studere UGC, uten at det går brukernes personvern.

Forholdet mellom anonyme søkere og

real

kreftpasienter er en potensiell fallgruve i dette arbeidet. Å fokusere på brukerne mest sannsynlig til å ha en nær relasjon med en kreftpasient, ble Internett-brukere som ikke uttrykker et bredt spekter av interesse for en bestemt type kreft ekskludert. Det er rimelig å anta at antallet slike brukere som uttrykte en bred interesse i en enkelt sykdom for en annen årsak enn en betong pasient er lav. Det bør bemerkes at pasienter som ikke søker informasjon på nettet viste til en nær slektning som en som surfet på nettet etter dem [32]. Derfor utforske sedvanlig søke mønster av enten pasienter eller deres pårørende er viktig. Vår studie kan ha ekskludert noen brukere som faktisk var virkelige pasienter hvis de viste interesse for bare ett aspekt av sykdommen, selv om de kan ha vært representert ved fullmektig søkere. Vi merker oss imidlertid sterk sammenheng mellom sykdom utbredelsen og hyppigheten av søk i søkemotoren, som ytterligere støtte bevis for brukerne å være selve kreftpasienter og deres nære bekjente.

Vår studie har flere begrensninger. Naive Internett-brukere er tilbøyelige til selvfeildiagnostisering, gjennom et fenomen som kalles cyberchondria [31], da mindre symptomer (for eksempel hodepine) er tolket til å være symptomer på alvorlige sykdommer (f.eks kreft i hjernen). For å minimere skjevheter knyttet til spørsmål som genereres av folk som ikke er kreftpasienter, bare en utvalgt gruppe av brukere (42% 20808/50117, valgt som beskrevet i metodedelen) ble analysert. Det faktum at søkemønstre avviker med forventet overlevelse, øker sannsynligheten for at vi er trolig å gjøre med virkelige pasienter og deres bekjente. Yahoo søkemotor var vår eneste kilde til informasjon, men bare en liten del (anslått til 4%) [37] av befolkningen er kjent for å bruke flere søkemotorer i parallell. Brukere kan også finne informasjon på internett gjennom andre måter enn søkemotorer. Imidlertid indikerer data at flertallet av brukerne velger søkemotorer som den primære kilde til informasjon for helserelatert informasjon generelt, og for kreftrelatert informasjon spesielt: Det har blitt anslått at 66% av brukerne begynner sin søken etter helse -relaterte informasjon om søkemotorer [38]. Videre er en fersk studie fant at 71% av pasientene som søkte for kreft informasjon primært bruke en søkemotor som førstevalget sammenlignet med bare 13% som foretrakk å gå direkte til bestemte kreftrelaterte nettsteder [2]. Informasjon søker hjelp andre medier representerer en kilde til informasjon som mangler i vår analyse. Men vårt fokus på brukere som leverte et stort antall kreftrelaterte spørsmål betyr at våre data er avledet fra en befolkning som bruker søkemotorer som en viktig kilde til informasjon. The Mechanical Turk Systemet kan også være partisk. Fordeling av arbeidet til et stort antall labelers, hver av dem merket i gjennomsnitt bare 34 sider, minimerte potensielle skjevheter. Dataene ble samlet inn i løpet av en begrenset periode, og dermed er det ukjent om er befolkningen inkludert omfattet en begynnelse kohort. Men våre funn på lengden av typiske søke perioder (10 dager, mot 90 dager data) tyder på at befolkningen som begynte å søke før datainnsamlingen startet er relativt liten. Videre justerer HMM algoritmen data og forutsetter at begynnelsen av søkesekvensen kan mangle. Virkningen av den ikke-begynnelse kohort på våre resultater er således liten. Selv om større skala studier vil åpenbart gi større vekt på å finne, dette utgjør fortsatt den største databasen av sitt slag, bare begrenset av praktiske hensyn (for eksempel å kombinere data fra flere søkeleverandører eller innsamling av data over en lengre periode). Det er sannsynlig at resultatene ville være reproduserbar i andre lignende store studier.

Til tross for disse begrensningene, viser denne studien at UGC Internett-data kan brukes til å undersøke medisinske spørsmål på en stor skala. Overvåking brukernes søkemønstre kan bidra til nettsteder for å forbedre og tilpasse kommunikasjonsstrategier for å møte pasientenes dynamiske behov, som er kjent for slike tiltak for å forbedre brukeropplevelsen [39]

. Enda viktigere, våre funn gjør at leger til mer fullstendig forstå informasjonsbehovet til pasienter og fremheve viktigheten av effektive og omfattende informasjonsoverføring mellom leger og deres pasienter, fra den aller første dagen av mistanke gjennom prosessen med diagnosen. Ved å forstå mønstre av Internett-bruk, kan leger bruker dette verktøyet som en sterk partner i stedet for en kilde til nød i omsorgen for sine pasienter. Videre Internet innholdsleverandører må tilpasse innholdet ved å ta pasienten søkeloggen i betraktning når serverer innhold, som våre funn viser at informasjon trenger endringer over tid.

Legg att eit svar