PLoS ONE: tykktarmskreft og Human Gut mikrobiomer: reproduserbarhet med Whole-Genome Shotgun Sekvensering

Abstract

Samler bevis indikerer at tarmen microbiota påvirker kolorektal kreftutvikling, men tidligere studier har variert i befolkningen, tekniske metoder og assosiasjoner med kreft. Forstå disse variasjonene er nødvendig for sammenligninger og for potensielle pooling tvers av studier. Derfor utførte vi hel-genom hagle sekvensering på fekale prøver fra 52 før behandling med kolorektal kreft tilfeller og 52 kontrollpersoner fra Washington, DC. Vi sammenlignet funn fra en tidligere utgitt 16S rRNA studie til metagenomikk-avledet taksonomi innenfor samme populasjon. I tillegg metagenome-spådde gener, moduler og gangstier i Washington, DC saker og kontroller ble sammenlignet med saker og kontroller rekruttert i Frankrike der prøvene ble behandlet ved hjelp av samme plattform. Assosiasjoner mellom tilstedeværelse av fekal Fusobacteria,

Fusobacterium

, og

Porphyromonas

med tykktarmskreft oppdages av 16S rRNA ble reprodusert av metagenomikk, mens høyere relativ overflod av Clostridier i krefttilfeller basert på 16S rRNA var bare border basert på metagenomikk. Dette viser at i løpet av den samme prøvesett ble de fleste, men ikke alle taksonomisk assosiasjoner sett med begge metoder. Vurderer betydelige kreft assosiasjoner med den relative overflod av gener, moduler og gangstier i en nylig publisert franske metagenomikk datasett, statistisk signifikante assosiasjoner i Washington, ble DC befolkning oppdaget for fire av ti gener, tre av ni moduler, og sju av 17 trasé. Totalt ble tykktarmskreft status i Washington, DC studie assosiert med 39% av metagenome bestemte gener, moduler og gangstier identifisert i den franske studien. Mer innenfor og mellom befolknings sammenligninger for å identifisere kildene til variasjon og sykdom foreninger som kan reproduseres tross for disse variasjonene. Fremtidige studier bør ha større utvalgsstørrelser eller basseng data på tvers av studier for å ha nok strøm til å oppdage foreninger som er reproduserbar og signifikant etter korreksjon for multippel testing

Citation. Vogtmann E, Hua X, Zeller G, Sunagawa S, Voigt AY, Hercog R, et al. (2016) tykktarmskreft og Human Gut mikrobiomer: reproduserbarhet med Whole-Genome Shotgun Sequencing. PLoS ONE 11 (5): e0155362. doi: 10,1371 /journal.pone.0155362

Redaktør: John Parkinson, Hospital for Sick Children, CANADA

mottatt: 17 november 2015; Godkjent: 27 april 2016; Publisert: 12 mai 2016

Dette er en åpen tilgang artikkel, fri for all opphavsrett, og kan bli fritt reproduseres, distribueres, overføres, endres, bygd på, eller brukes av alle for ethvert lovlig formål. Arbeidet er gjort tilgjengelig under Creative Commons CC0 public domain engasjement

Data Tilgjengelighet:. Den hagle metagenomic sekvense data er tilgjengelig på det europeiske nukleotid Arkiv database med tiltredelse antall PRJEB12449 (https://www.ebi.ac .uk /ENA /data /view /PRJEB12449). På grunn av personvern, kan hele metadata gjøres tilgjengelig for kvalifiserte forskere ved å kontakte Dr. Rashmi Sinha ([email protected])

Finansiering:. Dette prosjektet ble støttet av egenutført Research Program av National Cancer Institutt. GZ, SS, AYV, RH, og PB mottatt støtte gjennom CancerBiome prosjektet (European Research Council prosjekt referanse 268985)

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

forkortelser: BMI, Body mass index; CRC, tykktarmskreft; DC, District of Columbia, HMP, Human mikrobiomer prosjekt; Motu, Metagenomic operasjonell taksonomisk enhet; Otu, Operational taksonomisk enhet; WGSS, hel-genom hagle sekvense

Innledning

Den menneskelige mikrobiomer er gjenstand for en voksende forskningsområde siden det er sannsynligvis relatert til helse og sykdom. Det er vist at mikrobiomer spiller en rolle i kolorektal kreft (CRC) utvikling eller progresjon, potensielt gjennom provoserende trasé eller kreftfremkallende mikrobielle metabolitter [1], og mikrobielle assosiasjoner med CRC har blitt foreslått i en rekke studier [2-9] . For eksempel med neste generasjons sekvensering av universell bakterielle 16S rRNA-genet i DNA ekstrahert fra avføring, har vår gruppe vist at sammenlignet med matchede kontroller, CRC tilfeller har lavere samfunnet mangfold, beskjedent lavere relativ overflod av Clostridier, og høyere forekomst av

Fusobacterium Hotell og

Porphyromonas product: [2]. Av forrige mikrobiomer og CRC studier, noen brukte 16S rRNA-genet sekvense [2, 4, 5, 7, 9], mens andre brukte hel-genom hagle sekvensering /hagle metagenomikk (WGSS, [3, 6, 8]). WGSS gir ikke bare profiler av bakteriell sammensetning og mangfold, men anslår også den funksjonelle potensialet i mikrobiomer [10].

Vi utførte hagle metagenomic sekvensering av fekale prøver fra en CRC case-control studie utført i 1980 i Washington, DC som tidligere ble analysert ved hjelp av 16S rRNA-genet sekvensering [2]. Ved å utsette de samme prøvene til en annen sekvenseringsmetode, var vi i stand til å sammenligne tidligere observert 16S rRNA assosiasjoner med data fra hagle metagenomic sekvensering. I tillegg, ved hjelp av denne teknologien, var vi i stand til å undersøke mulige mikrobielle gen-nivå assosiasjoner med CRC som ikke var mulig i 16S rRNA-genet sekvensering av data, og vi sammenlignet gen-nivå assosiasjoner med de oppdaget i en tidligere fransk case-control studien som gjaldt samme metagenomikk DNA-ekstraksjon og sekvensering plattform og bioinformatikk rørledning [8].

Materialer og metoder

Primær studiepopulasjonen

den fekale prøver ble samlet i en CRC case-control studie som tidligere er blitt beskrevet i detalj [11] og beskrivelsen av analysen av den respektive 16S rRNA-genet sekvense studie er tidligere publisert [2]. Kort fortalt ble CRC saker og frekvenskontrollpersoner som var ventet kirurgi for ikke-onkologiske og ikke-gastrointestinale tilstander rekruttert 1985-1987 i Washington DC, USA. Før operasjon eller annen behandling, deltakerne samlet alle avføring over en to dagers periode og lagret dem på tørris. I laboratoriet ble prøvene ble frysetørket, slått sammen og lagret kontinuerlig deretter ved -40 ° C. For inneværende hagle metagenomic studien, valgte vi prøver fra 52 saker og 52 kontroller (befolkning WGSS DC). Sakene og kontroller ble matchet av sex og kroppsmasseindeks (BMI; 20 kg /m

2 eller ≥ 20 kg /m

2). Foreninger i WGSS DC-analyse ble sammenlignet med de foregående 16S rRNA-genet sekvense studie (befolknings 16S DC), som omfattet 47 CRC tilfeller og 94 kontrollpersoner fra samme overordnede studien. Alle 47 CRC saker fra 16S DC ble inkludert i WGSS DC og de 52 kontrollene i WGSS DC ble inkludert i de 94 kontrollene fra 16S DC. Deltakerne forutsatt skriftlig informert samtykke og denne studien ble godkjent av Office of mennesker forskning ved National Institutes of Health.

Uavhengig validering befolkningen

Vi inkluderte data fra en tidligere publisert studie (befolkning F ) som uavhengig valideringssettet [8]. I korte trekk, ble CRC saker og tilfeldig valgte kontroller rekruttert 2004-2006 i Paris, Frankrike. Før kolonoskopi, ble en frisk avføringsprøve innsamlet og frosset ved -20 ° C i løpet av fire timer etter innsamling. Befolknings F inkludert 53 CRC tilfeller, 15 store adenom tilfeller, 27 små adenom tilfeller, og 61 normale kontroller. Siden kontrollene fra Washington DC kan ha omfattet også udiagnostiserte små adenomer, sammenligningen case-control satt fra befolkningen F inkludert 53 CRC tilfeller og 88 kontroller (dvs. 27 små adenomer og 61 friske kontrollpersoner) og ekskludert data fra de 15 store adenomer .

Vi inkluderte også er offentlig tilgjengelig hagle metagenomic data fra 292 MetaHIT deltakere [12, 13] og 94 Menneskelig mikrobiomer Project (HMP) fase i deltakere [14] for sammenligning av samlet mangfold, rikdom, og jevnhet med vår eksempler.

DNA ekstraksjon og hel-genom hagle sekvense

de frysetørkede fekale prøver fra WGSS DC ble tint, resuspendert i fosfatbufret saltoppløsning, og en prøve ble sendt til Genomics kjerne Facility, European Molecular Biology Laboratory i Heidelberg, Tyskland på tørris. Fremgangsmåtene for DNA-ekstraksjon, bibliotek forberedelse, og hel-genom hagle sekvensering er blitt beskrevet i detalj, [8] og var den samme for befolkningen WGSS DC og befolkning F. I korte trekk, DNA ble ekstrahert fra de fekale prøver ved å bruke den GNOME DNA Isolation Kit (MP Biomedicals) med mindre modifikasjoner. Hel-genom hagle sekvensering av den ekstraherte DNA ble utført ved hjelp av Illumina HiSeq 2000/2500 (Illumina, San Diego, USA). Prøvene ble sekvensert med en 100-bp leselengde for parvise end sekvenser på Genomics Kjerne Facility, European Molecular Biology Laboratory, Heidelberg med en målrettet sekvense dybde på 5 GBP.

Bioinformatikk

den generelle strategi for bioinformatiske behandling av hele genomet-sekvensering data har blitt tidligere beskrevet i detalj [8] og var den samme for både WGSS DC og populasjons F. taksonomiske overflod profiler sammenfattes ved NCBI taksonomiske rekkene som strekker seg fra art til rekken og metagenomic operative taksonomiske enheter (motu) [15, 16] ble opprettet ved hjelp av MOCAT [17]. MOCAT ble også brukt til å funksjonelt kommentere gener hentet fra metagenomic forsamlinger til KEGG database (versjon 62) [18]. Økologiske indekser (Shannon mangfold, artsrikdom, og samfunnet jevnhet) ble beregnet basert på motu relative hopetall og nedsamplet til 2000 inserts bruker vegan R programvarepakken [19]. En deltaker fra befolkningen WGSS DC og fire deltakere fra befolkningen F ble ekskludert på grunn av lavere lese dekning.

Statistisk analyse

Vi har sammenlignet Shannon mangfold, rikdom, og jevnhet for befolkningen WGSS DC, befolkning F , MetaHIT, og HMP fase i prøver og testet kasus-kontroll forskjeller i befolkningen WGSS DC og befolkningen F ved hjelp av Kruskal Wallis test. Deretter, for både det primære studiepopulasjonen (befolkning WGSS DC: 52 tilfeller vs 52 kontroller) og uavhengig validering befolkningen (befolkning F: 53 tilfeller vs 88 kontroller), vi testet for assosiasjoner mellom sak /kontroll status og både den relative overflod og tilstedeværelse /fravær av de ulike taksonomiske nivåer og gen kategorier (dvs. gener, moduler og pathways). En logistisk regresjonsmodell med justering for alder, kjønn, og kroppsmasseindeks (BMI) ble brukt og p-verdier ble beregnet på grunnlag av Wald test (S1 tabell). Tre CRC saker fra befolkningen WGSS DC manglet BMI data slik at vi følger disse verdiene ved hjelp av kjønnsspesifikk hjelp av CRC tilfeller. For sammenlignbarhet med 16S DC studien, vi også beregnet en ujustert logistisk modell for en tosidig Wald chi-squared test og en tosidig ikke-parametrisk Wilcoxon test for tilstedeværelse /fravær og relative overflod av spesifikke taxa, henholdsvis. Vi generert QQ plott av-log (observerte p-verdi) versus-log (p-verdier i henhold til en normalfordeling) innen WGSS DC og befolkningen F for alle taksonomiske nivåer og gen kategorier for å fastslå potensielt statistisk signifikante assosiasjoner etter korreksjon for multiple sammenligninger. For genet kategoridata i befolkningen F, brukte vi Bonferroni korreksjon av p-verdi for å bestemme statistisk signifikans (dvs. p 0,05 /antall tester) og regnes som en p-verdi 0,05 for å være statistisk signifikant for reproduserbarhet analyser i WGSS DC. Alle statistiske analyser ble utført ved bruk av R (versjon 3.0.0).

Resultater

Kjennetegn på de 52 CRC tilfeller og 52 kontroller fra befolkningen WGSS DC er presentert i tabell 1. De var godt matchet etter kjønn og BMI. Men CRC tilfellene hadde en høyere andel av ikke-spanske svarte (23,1% i saker og 5,8% i kontroller), lavere utdanningsnivå (15,4% av tilfellene, og 3,8% i kontrollgruppen hadde mindre enn en videregående utdanning), og mer oppdatert røykere (13,5% av tilfellene, og 3,8% av kontroller). Innenfor CRC tilfeller, 28,8% av tilfellene hadde kreft i tykktarm og høyre 34,6% hadde kreft i den venstre colon. Flertallet av CRC var invasive uten kjente metastaser (40,4%), men 34,6% var metastatisk.

kolorektal kreft foreninger i WGSS DC kontra 16S DC

I de tidligere 16S rRNA-genet sekvensering analyse i denne populasjonen (16S DC), tilstedeværelse av fire taxa og den relative overflod av 3 taxa var signifikant assosiert med CRC saksstatus med falske funnrate justert p-verdier mindre enn 0,05. Som det fremgår av tabell 2 gjengis vi en signifikant sammenheng mellom tilstedeværelsen av Fusobacteria phyla og CRC tilfelle status (p = 0,003), nemlig at 76,9% av tilfellene og 48,1% i kontrollgruppen hadde påvisbare Fusobacteria. Dette gjengir foreningen av Fusobacteria med saksstatus i 16S DC analyse; Selv om deteksjon var lavere (36,2% av tilfellene og 16,0% i kontrollgruppen, tabell 2). Sammenlignet med 16S DC, den WGSS hadde også høyere utbredt påvisningen av andre arter, og det gjengitt en signifikant sammenheng mellom tilstedeværelsen av

Fusobacterium plakater (p = 0,006) og

Porphyromonas plakater (p = 0,032) med CRC saksstatus. Sammenhengen mellom

Atopobium Hotell og CRC fra 16S DC ble ikke gjengitt i WGSS (tabell 2). Som det fremgår av tabell 3, hadde vi ikke reprodusere assosiasjoner mellom den relative overflod av spesifikke taxa og CRC saksstatus, selv om sammenhengen mellom den relative overflod av Clostridier tendens til å være lavere i tilfeller (p = 0,092). Spesielt, relative overflod av Clostridia estimert i WGSS var to ganger lavere for begge tilfeller og kontroller sammenlignet med det i det 16S DC studien. I befolkningen WGSS DC, klassen med en høyeste relative overflod var Bacteroidia, som hadde en relativ overflod av 53,2% i tilfeller og 50,9% i kontrollgruppen (S1 tabell).

Bilder

kolorektal kreft foreninger i WGSS DC versus befolkning F

i befolkningen WGSS DC, var det ingen signifikante forskjeller mellom CRC tilfeller og kontroller for Shannon mangfold, rikdom, eller jevnhet basert på motus, men generelt kontrollene hadde litt høyere alfa mangfold sammenlignet med tilfeller (fig 1). Shannon mangfold, rikdom, og jevnhet var lik for befolkningen WGSS DC, befolkning F, og MetaHIT prøvene, mens HMP prøvene tendens til å ha litt lavere Shannon mangfold, rikdom, og jevnhet.

statistiske forskjeller mellom tykktarmskreft saker og kontroller ble testet ved hjelp av Kruskal-Wallis test.

CRC saksstatus i befolkningen F [8] var sterkt assosiert med den relative overflod av mange metagenome-avledet KEGG gener, moduler og gangstier ( som vist ved den sterke avvik fra 45 ° grad linje i figur 2), men dette ble ikke sett i WGSS DC befolkningen. For tilstedeværelse av KEGG gener, moduler og gangstier, var det lite bevis for eventuelle assosiasjoner med CRC saksstatus i begge studiepopulasjonen (fig 2). Siden foreninger ble oppdaget for den relative overflod av gen-nivå data bare i befolkningen F, forsøkte vi å gjengi statistisk signifikante assosiasjoner etter Bonferroni korreksjon i befolkningen F med WGSS DC data uten korreksjon for multiple sammenligninger.

i motsetning til den globale vurdering (figur 2), når vi har vurdert at signifikant sammenheng mellom den relative overflod av KEGG gener (p 0,05 /8028), moduler (p 0,05 /485), og veier (p 0,05) i WGSS DC for fire av ti gener: aminomethyltransferase (K00605), tryptofanasesubstrat (K01667), peptid metioninsulfoksid reduktase msrA /ESRB (K12267) , og antatte membranprotein (K01421) (tabell 4). Likeledes WGSS DC reproduseres kreftforeninger for tre av ni moduler: leucine degradering, leucin = acetoacetat + acetyl-CoA (M00036), citrat syklus, andre karbon oksidasjon, 2-oksoglutarat = oksaloacetat (M00011), og metionin biosyntese, apartate = homoserin = metionin (M00017) (tabell 5). Ut av de 17 statistisk signifikante pathway foreninger i befolkningen F, den WGSS DC gjenforeninger med syv pathways: citrate syklus (ko00020), liponsyre metabolisme (ko00785), valin, leucin og isoleucin degradering (ko00280), amyotrofisk lateral sklerose (ko05014 ), lysin biosyntese (ko00300), geraniol degradering (ko00281), og nitrogen-metabolisme (ko00910) (Tabell 6). Ingen flere signifikante assosiasjoner med CRC ble funnet i WGSS DC

Diskusjoner

Denne studien hadde to hovedmål:. 1) å sammenligne de tidligere observerte 16S rRNA-genet assosiasjoner med data fra hel-genom hagle metagenomic sekvensering; og 2) å undersøke mulige mikrobielle gen-nivå assosiasjoner med CRC i ulike populasjoner. For det første mål, den metagenomikk tilnærmingen gjengitt noen av de tidligere observerte assosiasjoner i 16S rRNA-genet analyse, særlig høyere sannsynlighet for å detektere taksa i Fusobacteria phylum og

Fusobacterium

slekten blant CRC tilfeller. En stor forskjell mellom de to studiene var sensitiviteten for påvisning av taksa. For eksempel ble Fusobacteria phyla påvist i 36,2% av tilfellene, og 16,0% av kontrollene i 16S rRNA-genet studien, men ved hjelp av hel-genom hagle metagenomikk ble Fusobacteria påvist i 76,9% av tilfellene, og 48,1% av kontrollene . Det er uklart hva som kan føre til forskjellene mellom 16S rRNA og WGSS resultater, men det kan være på grunn av 16S rRNA-genet med variabel region sekvensert, dybden av sekvensering, den bioinformatiske tildeling av taksonomi eller tekniske forskjeller. Disse variasjonene i å påvise tilstedeværelse og relative overflod av taxa demonstrere en viktig forskjell når man sammenligner 16S rRNA sekvense til hel-genom hagle metagenomic studier og bør utredes nærmere i fremtiden.

For våre andre formål, det WGSS DC gjorde gjengi noen av de konkrete, statistisk signifikante gener, moduler og gangstier oppdaget i befolkningen F med CRC saksstatus [8]. To relaterte moduler og stier ble identifisert i uavhengige modeller: M00011 (Citrate syklus, andre karbon oksidasjon, to-oksoglutarat = oxaloacetate) og ko00020 (citrate syklus /TCA syklus); og M00036 (leucine degradering, leucin = acetoacetate + acetyl-CoA) og ko00280 (valin, leucin og isoleucin nedbrytning). Det er mulig at disse og andre funksjonelle evner er knyttet til CRC, men videre studier er nødvendig. Shannon mangfold, rikdom, og jevnhet basert på hel-genom hagle metagenomikk var ikke forbundet med CRC saksstatus i WGSS DC, men disse anslagene var lik de i MetaHIT og befolkningen F.

Vår reproduserbarhet statistisk signifikant assosiasjoner fra en tidligere studie [8] gir viktig informasjon om fremtidig data pooling gitt de store forskjellene mellom disse to datasettene. Våre prøver ble samlet inn i 1980-tallet i USA mens de prøver for befolkningen F ble samlet inn i 2000-tallet i Frankrike. Det finnes bevis på at lagring av fekale prøver ved lave temperaturer opprettholder mikrobiell samfunnsstruktur [20, 21], men så vidt vi vet, dette er ikke testet for prøver lagret i nesten 30 år. Og gitt tidligere arbeid som tyder på at mikrobielle assosiasjoner med type 2-diabetes kan variere fra befolkningen [22, 23], selv om disse forskjellene kan være drevet av metformin bruk [24], er det oppmuntrende at noen av foreningene var robuste mellom populasjoner i USA og Frankrike fra forskjellige år. I tillegg ble de fekale prøver i vår studie samles før innleggelse og behandling fra alle avføring i løpet av to dager, og deretter frysetørket. Dette står i kontrast med de metoder for befolkningen F, der prøvene ble samlet 2 uker til 3 dager før koloskopi, men alltid før tarm rensing, og var en delmengde fra en avføring som var frosset i løpet av fire timer. Frysetørking av fekale prøver har blitt funnet å potensielt påvirke de relative Forekomsten av ulike taxa for baby fekale prøver [25], så det er betryggende å gjenskape noen funn mellom ulike lagringsmetoder. I tillegg WGSS prøvene viste seg å ha lignende diversitet tiltak i forhold til en annen hagle metagenomic studie MetaHIT, som også inkluderte en annen populasjon og samlinger. Som det har blitt sett i menneskelige genom-wide assosiasjonsstudier er store utvalgsstørrelsene for å oppdage foreninger som overlever korreksjon for multippel testing. Med disse forskjellene i tidsperioden fra samlingen, befolkning, og prøvetaking, likheter i sammenhenger mellom mikrobielle taksonomiske og gen-nivå data med CRC saksstatus gir noe støtte for kontinuitets data på tvers av heterogene studier. Ytterligere arbeid har blitt utført for å vurdere de ideelle innsamlingsmetoder for fremtidige fecal samlinger [26-30] og effekten av laboratoriehåndteringsprosedyrer og bioinformatiske behandlingen av dataene [31] som kan gi tilleggsinformasjon for nedstrøms data pooling eller meta-analyse.

Andre tidligere studier har undersøkt assosiasjoner mellom fecal mikrobiomer og CRC [32]. I likhet med våre funn, gjorde en rekke studier ikke registrere en generell forskjell mellom CRC saker og kontroller for tiltak av samfunnet mangfold [4, 5, 9]. Imidlertid observerte en studie som CRC tilfeller hadde økt gen og genus rikdommen sammenlignet med kontroller [3], mens en annen studie detektert redusert gen fylde og gen-a-diversitet i CRC tilfeller i forhold til kontroller, selv om krets var ikke statistisk signifikant etter korrigering for fekal prøvetaking etter koloskopi [6]. Etter avtale med våre funn, de fleste tidligere studier har funnet at CRC tilfeller var mer sannsynlig å ha påvisbare eller høyere nivåer av

Fusobacterium

sammenlignet med kontroller [3, 5-7, 9], mens bare noen studier påvist høyere nivåer eller deteksjon av

Porphyromonas

i CRC tilfeller sammenlignet med kontroller [3, 5, 7]. I en tidligere hel-genom hagle metagenomic studien modulen M00036 og KEGG trasé ko00280 og ko00910 ble funnet å være betydelig anriket i CRC tilfeller sammenlignet med kontroller [6] lik det som ble påvist i denne studien. I den andre tidligere hel-genom hagle metagenomic studie, våre funn for KEGG trasé ko00020, ko00280, ko00281, ko00300, ko00785 ble bekreftet, men en forening for KEGG pathway ko00910 var i motsatt retning av det vi observerte [3]. I sammendraget, bekreftet vi noen foreninger observert i tidligere forskning, men alle tidligere studier (16S og hel-genom hagle sekvense) hadde lav effekt. Videre kan disse tidligere studiene ikke har vært i stand til å tilstrekkelig justere for potensielle confounders, som kan forklare noe av variasjonen mellom studiene. På grunn av de multiple sammenligninger i mikrobiomer analyser, vil data pooling være avgjørende for å overvinne den begrensede makt i disse analysene.

Den aktuelle studien er ikke uten begrensninger. For det første ble alle de fekale prøvene samlet tverrsnitt, så det er ikke mulig å bestemme om de mikrobiologiske endringer inntraff før utvikling av kreft, eller hvis de var på grunn av utviklingen av kreft. I tillegg har denne studien hadde en relativt liten utvalgsstørrelse, og derfor ble vi underpowered å oppdage mange statistisk signifikante assosiasjoner etter korreksjon for multippel testing. Til slutt, våre friske kontroller ble sykehuset baserte kontroller venter elektiv kirurgi og kan ikke representere den generelle befolkningen på den tiden. Imidlertid har studien også styrker. Vi var i stand til å utnytte eksisterende prøve ressurser som ble samlet inn over 30 år siden, og til å reprodusere assosiasjoner med CRC fra en pågående studie. Vår avføringsprøve var fra en to dagers samling som kan være mer representativ for den vanlige gut mikrobiomer. Vi var i stand til å utnytte andre eksisterende datakilder for sammenligning.

I denne studien, var vi i stand til å bruke hel-genom hagle metagenomic sekvensering for å gjengi en rekke betydelige funn i samme befolkningen som ble vurdert ved hjelp av 16S rRNA-genet sekvense [2]. Den aktuelle studien også gjengitt noen betydelige gen-nivå assosiasjoner med CRC fra en tidligere hel-genom hagle metagenomic studie av pasienter i Frankrike [8]. Fremtidige studier pooling data over tid, befolkning, og prøvetaking metoden vil bidra til å løse noen av de statistiske kraft problemer mot epidemiologiske studier av mikrobiomer og vil være nøkkelen til å identifisere viktige foreninger som kan være involvert i CRC påvisning eller forebygging. I tillegg, siden alle aktuelle studiene er tverrsnitts, er det viktig at potensielle kohortstudier inkluderer en avføringsprøve samling for å studere effekten av den menneskelige tarmen mikrobiomer på uheldige helsemessige konsekvenser, som CRC.

Hjelpemiddel informasjon

S1 Table. Gjennomsnittlig relativ overflod eller deteksjon av taksonomiske oppgaver (dvs. phylum, klasse, orden, familie, slekt, art, spesi, Motu) og gen kategorier (dvs. genet, modul, og sti) for befolkningen WGSS DC og befolkningen F.

Hver fane representerer en bestemt taksonomisk nivå eller genet oppdrag. Gjennomsnittlig relativ overflod eller gjennomsnittlig deteksjon (tilstedeværelse /fravær) er presentert for saker og kontroller, og p-verdi fra et Wald test justert for alder, kjønn og kroppsmasseindeks (BMI) er gitt

doi:. 10,1371 /journal .pone.0155362.s001 product: (XLS)

Takk

Dette prosjektet ble støttet av egenutført Research Program av National Cancer Institute. En del av dataanalysen ble drive ved hjelp av beregningsressurser av National Institutes of Health HPC Biowulf klynge (https://hpc.nih.gov). GZ, SS, AYV, RH, og PB mottatt støtte gjennom CancerBiome prosjektet (European Research Council prosjekt referanse 268985).

Legg att eit svar