PLoS ONE: mRNA-Seq Single Prostate Cancer Sirkulasjonstumorceller avslører gjentagelse av genekspresjon og Pathways Funnet i prostatakreft

Abstract

Sirkulasjonstumorceller (CTC) megle metastatisk spredning av mange solide svulster og opplisting av CTCs brukes i dag som en prognostisk indikator for å overleve i metastatisk prostatakreft pasienter. Noe bevis tyder på at det er mulig å utlede ytterligere informasjon om svulster fra ekspresjon analyse av CTCs, men den tekniske vanskelighet med å isolere og analysere de enkelte CTCs har begrenset fremgang på dette området. For å vurdere muligheten for en ny generasjon av MagSweeper å isolere intakt CTCs for nedstrøms analyse, vi utførte mRNA-Seq på enkelt CTCs isolert fra blodet hos pasienter med metastatisk prostatakreft og om enkelt prostatakreft cellelinje LNCaP celler tilsatt i blod friske donorer. Vi fant ut at MagSweeper effektivt isolert CTCs med en fangsteffektivitet som matchet CellSearch plattformen. Men i motsetning til CellSearch, forenkler MagSweeper isolering av individuelle levende CTCs uten forurensende leukocytter. Viktigere, mRNA-Seq analyse viste at MagSweeper isolasjonsprosess ikke har en merkbar innvirkning på den transkripsjonelle profilen av én LNCaPs isolert fra pigg humant blod, noe som tyder på at eventuelle forstyrrelser forårsaket av MagSweeper prosessen på den transkripsjonelle signaturen av isolerte celler er beskjedne. Selv om RNA fra pasient CTCs viste tegn til betydelig degradering, i samsvar med rapporter om kort halveringstid og apoptose blant CTCs, transkripsjons signaturer av prostatavevet og kreft var lett påvisbare med enkelt CTC mRNA-sekv. Disse resultatene viser at MagSweeper gir tilgang til intakte CTCs og at disse CTCs kan potensielt gi klinisk relevant informasjon

Citation. Cann GM, Gulzar ZG, Cooper S, Li R, Luo S, Tat M, et al . (2012) mRNA-Seq Single Prostate Cancer Sirkulasjonstumorceller avslører gjentagelse av genekspresjon og Pathways Funnet i prostatakreft. PLoS ONE 7 (11): e49144. doi: 10,1371 /journal.pone.0049144

Redaktør: Natasha Kyprianou, University of Kentucky College of Medicine, USA

mottatt: 30 juni 2012; Godkjent: 04.10.2012; Publisert: 07.11.2012

Copyright: © 2012 Cann et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet delvis av Department of Defense gi W81XWH-10-1-0510 (til JDB). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. Forfatterne har lest journalen politikk og har følgende konflikter: GMC, SC, RL, SL, MT, SS, GS, MR, og AT er for tiden ansatt ved Illumina. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.

introduksjon til

Sirkulasjonstumorceller (CTC) er celler som en del av en primær svulst eller metastase og inn i blodstrømmen via lekk blodkar som oppstår rundt en voksende svulst. En gang i blodet, CTCs møte skadelige påkjenninger forbundet med hemodynamisk skjær, lavt oksygenforhold, mangel på forankring områder, og immunforsvaret angrep [1], [2]. Et lite antall CTCs overleve imidlertid og ekstravasere i omkringliggende vev i frø metastaser eller reseed primærtumor [3]. Beskrevet over hundre år siden [4], CTCs kan nå nummerert med FDA godkjente CellSearch plattform for å gi prognostisk informasjon om overlevelse for metastatisk brystkreft, tykktarm og prostata kreftpasienter [5] – [7]. Flytte utover opplisting, har flere grupper antydet at genetisk og transcriptional analyse av enkelt CTCs kan utnyttes til å lage personlige medisinske avgjørelser for kreftbehandling og gi innsikt i de biologiske prosessene som er involvert i metastase [8] -. [10]

Flere metoder har blitt utnyttet for å isolere CTCs fra røde og hvite blodceller (WBC). Skille fysiske egenskaper og overflatemarkører CTCs har blitt utnyttet for deres isolasjon ved filtrering [11], microfluidic chip [12], [13], spenstig tetthet sentrifugering [14], Immunomagnetisk utvalg [15], [16], funksjonelle berikelse og påvisning [17], [18], og automatisert immunmikros [19], [20]. Immunomagnetisk anrikning med anti-EpCAM kulene etterfulgt av fluorescens-aktivert cellesortering er nylig blitt vist å være en effektiv metode for å isolere CTCs relativt fri for hematopoetiske celler [21]. Av plattformene for tiden er i bruk for å isolere CTCs, gir MagSweeper teknologien stor brukervennlighet og tilgang til høyt rene, intakte, individuelle CTCs egnet for genetisk og proteomikk analyse [22], [23].

CTCs er generelt til stede i lave tall i pasientblodprøver (vanligvis 1 per 10

7 kjerneholdige celler i blodet) så utpakking maksimal informasjon fra én eller tilgjengelig CTCs isolert fra en pasients blodprøve er viktig. Neste generasjon DNA-sekvensering er spesielt godt egnet for dyp avhør av kreft genomer og transcriptomes [24] selv når den brukes på celle-nivå [25]. I denne studien validert vi resultatene av en ny generasjon av MagSweeper hjelp piggete LNCaP prostatakreftceller i normalt blod. Vi gjennomførte en fangst følsomhet sammenligning av prostatakreft CTCs mellom CellSearch og MagSweeper på replikere pasientprøver. Hele transkriptomet sekvense studier av enkelt LNCaP celler avslørt at MagSweeper isolasjon har minimal effekt på genuttrykk. Videre ble mRNA-Seq mediert transkriptom profiler av individuelle prostata CTCs isolert fra metastatisk pasient blod i forhold til normal prostata vevsprøver og enkelt prostata kreft cellelinjer. Til tross for celle til celle heterogenitet og et bredt spekter av CTC RNA kvalitet, høyere ekspresjon av prostata relaterte gener som androgenreseptoren (AR), kan KLK3 (PSA) og TMPRSS2 skilles i prostata CTCs. Bioinformatiske skjermer for gener uttrykkes 100 ganger høyere i CTCs sammenlignet med normale prostataprøver avdekket andre kjente genet stier og signaturer som forventes av prostatakreft og deres vertens behandlingshistorikk.

Materialer og metoder

Etikk erklæringen

Denne undersøkelsen ble gjennomgått og godkjent av Stanford mennesker forskning Compliance styret og overholdt HIPPA forskrifter. Alle mennesker signert informert samtykke før blodprøvetakning.

Pasientprøver og blodprøvetaking

Pasientprøver ble tatt i 10 ml EDTA-rør (Beckton Dickenson) og behandlet innen 12 timer etter prøvetaking. Prøvene ble samlet i henhold til retningslinjer fastsatt og godkjent av en Institutional Review Board og etter informert samtykke. For sammenligninger mellom MagSweeper og CellSearch, ble en andre 7,5 ml blodprøve samles i en CellSave tube. CellSearch analysene ble utført av Quest Diagnostics. Total RNA fra tre histologisk normale prostata vev ble innhentet fra kirurgisk fjernet prostata under en egen IRB-godkjent protokoll.

Cell Culture and Cell Spike

LNCaP, PC-3, og T24 celler ble kjøpt og dyrket i henhold til betingelsene som er angitt av American Type Culture Collection (ATCC). Etter dissosiasjon levende og døde celler ble bestemt ved trypanblått eksklusjon. For spiking, ble cellene fortynnet til ca 3 × 10

3 celler per ml og cellekonsentrasjonen verifisert ved å fange opp og teller seks, ti mikroliter prøver av celler oppdaget på et glass objektglass. Ingen korrigering for døde celler basert på trypanblått eksklusjon ble brukt før spiking celler.

Perle innbinding og Cell Surface Farging

Custom 1,5 um Streptavidin belagte magnetiske kuler ble funksjon med en tilpasset biotinylert monoklonalt antistoff rettet mot ekstracellulære menneskelig EpCAM epitop. To 3,75 ml volumer av blod per prøve ble utsatt for lysering av røde blodlegemer med 10 volumer 1 x PharmLyse (BD Biosciences) i 15 minutter ved romtemperatur. Gjenværende celler ble pelletert ved 4 ° C i 15 minutter ved 300 x g. Cellepelletene ble overført med 2 x 1 ml porsjoner av 1% BSA /PBS /5 mM EDTA til et 2 ml flatbunnet mikrosentrifugerør (VWR). Cellene ble deretter pelletert i 5 minutter ved 510 x g. Cellepelletene ble resuspendert i et totalt volum på 1 ml av 1% BSA /PBS /5 mM EDTA inneholdende 15 ul av Alexa 488 anti-human CD45 (Life Technologies) og 30 ul av de tilpassede anti-EpCAM perler. Prøvene ble rotert i 30 minutter ved 4 ° C etterfulgt av tilsetning av 20 ul av Phycoerythrin (PE) anti-humane EpCAM monoklonalt antistoff (BD Biosciences 347198). Prøvene ble deretter rotert ved 4 ° C i ytterligere 30 minutter og deretter overført til en brønn i en 6-brønners plate inneholdende 6 ml av 1% BSA /PBS /5 mM EDTA. Prøvene ble blandet én gang ved å pipettere opp og ned i en 10 ml pipette, og platene ble sentrifugert i 5 minutter ved 400 rpm, etterfulgt av inkubasjon i 15 minutter ved 4 ° C før MagSweeper isolasjon. I noen spiking eksperimenter ble LNCaP celler merket før skyter med CFDA (Life Technologies) etter produsentens anvisninger.

MagSweeper og enkelt celle isolasjon

Antatte CTCs ble isolert ved hjelp av to runder med MagSweeper isolasjon. Celler isolert etter den første runden av MagSweeping ble løslatt og farget i en brønn i en seks-brønns plate som inneholder 500 nM membran ugjennomtrengelig DAPI (Life Technologies) slik at membran kompromittert celler kunne identifiseres. Etter en andre runde med MagSweeping celler ble dispergert og pelletert ved 400 rpm i 1 minutt i en brønn i en 6-brønns plate lav adhesjon i 10% Superblock (ThermoFisher) /PBS. Brønnene ble sett på med et Olympus invertert mikroskop utstyrt for epiflouresence. Antatte CTCs ble identifisert som celler som farget positivt for PE anti-EpCAM og negative for Alexa 488 anti-CD45. Antatte CTCs som var DAPI + ble ekskludert fra videre analyse. DAPI negative antatte CTCs ble isolert i en ul av 10% Superblock /PBS med et pipetteman inn i en 0,2 ml PCR-rør inneholdende 2,5 ul av 5% ribonuklease inhibitor (Life Technologies) /0.2% Triton X-100 (10% løsning, Sigma) fremstilt i nuklease fritt vann. Oppsamlede celler ble flash-frosset på tørris og lagret ved -80 ° C. Cell renhet ble målt som antall tilsatte celler gjenvunnet delt på antall tilsatte celler gjenvunnet pluss antall leukocytter.

enkelt celle mRNA-Seq

Enkeltceller ble lysert og RNA revers transkribert bruker smartere Ultra Low Input RNA for Illumina sekvense kit (Clontech). cDNA ble forsterket ved hjelp av Advantage to PCR kit (Clontech) for 18-25 sykluser før konvertering til en Illumina kompatibel DNA-sekvensering bibliotek bruker NextEra DNA Sample Prep Kit (Illumina) og 12 sykluser av PCR for å forsterke biblioteket. Bibliotekene ble kvantifisert ved hjelp av en BioAnalyzer (Agilent) og qPCR ved hjelp av en Kappa Syber Grønn PCR kit (Kappa biovitenskap) på en IIlumina ECO qPCR maskin. Sammenkoblede end flyt celler ble utarbeidet etter 20:00 av NextEra bibliotek per kjørefelt på en CBOT (Illumina) og sekvensert ved hjelp av enkelt 50 bp leser på en Illumina GAIIx.

Alignment

Sekvense data ble samlet inn med RTA versjon 1.9 og fastq filene ble generert med casava 1.8. Leser at ikke bestod Illumina standard kvalitet filter ble fjernet som standard. Leser ble justert til hg19 med tophat v1.3.3 og tellinger per transkripsjon ble beregnet for hg19 i iGenomes bruker mansjettknapper v1.1 med alternativene: -GTF genes.gtf -max-bundle-frags 20000000. Gene-by-genet rå teller og fragmenter per kilobase av exon per million fragmenter kartlagt (FPKM) ble samlet inn mansjettknapper isoform.fpkm_tracking fil ved å identifisere alle utskrifter med det samme genet navn og ta, henholdsvis summen av dekningen multiplisert med transkripsjon lengde /lese lengde for hvert transkript og summen av FPKM for hvert transkript. Den rå teller og FPKMs ble brukt i alle nedstrøms analyse, bortsett fra QC trinn.

RNA-Seq data Quality Control

Kvalitetskontroll (QC) ble gjort ved hjelp av en intern Illumina RNA-Seq QC script. Base-by-base-dekning ble beregnet over en håndplukket sett av 600 kvalitetskontroll gener som er valgt fra RefSeq og er svært kartleggbart og svært rik på universelle menneske RNA (UHR) prøver (Agilent). Meget kartlegg betyr at 90% av baser for en valgt transkripsjon har 100% mappability. Høy uttrykk i UHR betyr at bare gener med gjennomsnittlig dekning 1 × ble valgt. Slik at for en gitt transkript 1000 bp langt det er minst 20 lesninger av 50 bp tilordnet den. Gener i dette settet med større enn en FPKM ble brukt til å beregne ekstra statistikk. Median dekning over alle lengde-normalisert QC gener med større enn en FPKM ble plottet. For hver kvalitetskontroll gen med større enn en FPKM ble variasjonskoeffisienten beregnet på tvers av genet, og medianen av alle CV ble bestemt.

Unsupervised Clustering

Unsupervised hierarkisk clustering [26 ] ble gjort med heatmap funksjon i R, med standard Euklidsk avstand brukt som ulikheten beregning. For hver prøve, ble de 100 gener med den høyeste FPKM ble valgt, og den resulterende pool av 312 gener som brukes i clustering.

LNCaP uttrykk analyse

EDGER [27] ble kjørt ved hjelp moderert tagwise dispersjoner med rå teller per genet som input. Sammenheng mellom prøvene ble beregnet basert på rå antall leser tilordnet hvert gen.

Genes over-uttrykt i CTCs

På grunn av den iboende variabilitet i encellete data, kombinert med varierende grad av tilsynelatende mRNA degradering ble observert i CTCs, ble en enkel terskel metode som brukes til å identifisere over-uttrykte gener. For hvert gen forholdet mellom den 2

nd høyeste FPKM verdi blant settet av CTCs til FPKM i normal prostata RNA ble beregnet. Gener med et forhold på minst 100 x og minst ti total står i en av de CTCs ble valgt. GÅ ontologier ble generert ved hjelp av Panther Classification System (https://www.pantherdb.org/) [28].

Resultater

MagSweeper beregninger for CTC isolasjon

En ny prototype av Magsweeper [22] ble utviklet som er kompatibel med drift i de fleste biologisk skap (figur 1A). For å vurdere resultatene av denne plattformen, over en 11 måneders periode, ble 100 LNCaP cellene gjentatte ganger tilsatt i 3,75 ml normalt blod og isolert med MagSweeper (n = 54 forsøk og 11 blodgivere). Før spiking, LNCaP cellenes levedyktighet målt ved trypan blå eksklusjon var 89% ± 8%. Under isolering fra piggblod LNCaP-celler ble fluorescensmerket med antistoffer mot CD45 og EpCAM å skille LNCaP-celler fra WBC, og membranen ugjennomtrengelig nukleær flekk DAPI ble anvendt for å identifisere døde (membran kompromittert) celler. Post-isolasjon vi utvunnet et gjennomsnitt på 81% ± 16% av levende tilsatt LNCaP-celler (EpCAM + /CD45- /DAPI-) (figur 1B, blå linje), mens DAPI farging viste en ytterligere 12% ± 6% av de isolerte celler LnCap som var membran kompromittert (EpCAM + /CD45- /DAPI +). Siden den opprinnelige cellen pigg inneholdt 11% døde celler (målt ved trypan blå eksklusjon) gjenvinning av 12% DAPI-positive celler følgende MagSweeping indikerer at skade på piggete LNCaP-celler i løpet av hele prosedyren er minimal. Normal, unspiked blodprøver ikke klarte å gi EpCAM positive celler (data ikke vist).

(A) Bilde av panseret prototype av MagSweeper. (B) Prosent fangst av 100 LNCaP celler tilsatt i 3,75 ml normal blod (N = 54 forsøk og 11 givere). Blå sirklene viser bety prosent inngang på levende EpCAM (+) /CD45 (-) /DAPI (-) celler og røde sirkler viser gjennomsnitts inngang på membran kompromittert EpCAM (+) /CD45 (-) /DAPI (+) celler. Feilfelt representerer +/- 1 standardavvik (C) Prosent opptak og renhet av 10 LNCaP-celler isolert etter inndriving i 7,5 ml av normalt blod. Nedbørssøylene er gjennomsnittet prosent gjenvinning av celler etter MagSweeper isolasjon (Cell Capture) og plukke og manuell sted enkelt celle isolasjon (Cell Isolation) mens lilla Søylene viser renhet LNCaP celler etter MagSweeper og enkelt celle isolasjon (N = 6 eksperimenter og 4 givere ). Celle renhet ble beregnet som antall tilsatte celler isolert dividert med antall tilsatte celler tellet pluss hvite blodlegemer tellet. Feilfelt representerer +/- 1 standardavvik (D) Bright feltet (BF) og bilder av fluorescently farget CTCs isolert fra en prostata kreft pasient blodprøve, og forurenser WBC funnet etter MagSweeper isolasjon. Scale bar = 20 mikrometer. (E) MagSweeper versus CellSearch sammenligning av pasientprøver. Prøver med 0 CTC ble tildelt en verdi på 1 for plotting formål.

For å vurdere renhet ultra-sjeldne celler etter MagSweeping, 7,5 ml normal donor blod ble tilsatt 10 CFDA merkede celler (n = 6 eksperimenter og 4 donorer) og behandlet i henhold til vår protokoll for CTC isolasjon. Fangede LNCaP-celler ble identifisert ved fluorescerende påvisning av cfda, mens forurensende WBC ble identifisert ved positiv CD45 farging. Etter magnetisk sortering en gjennomsnittlig prosent LNCaP gjenvinning på 63% ± 25% ble observert. Opplisting av CD45-positive celler ga en initial renhet av isolert LNCaP-celler etter MagSweeper celleisolasjon på 10% ± 6% og 100% av enkeltcelleisolasjon ved hjelp av en hakke og sted metode (Fig. 1C).

neste utført en komparativ analyse av MagSweeper versus CellSearch i telling av CTC i blodprøver fra pasienter med metastatisk prostatakreft. På tidspunktet for trekningen ble to 7,5 ml prøver av blod oppsamlet, en prøve i en standard EDTA rør for MagSweeper celleisolasjon og et andre i en CellSave rør for analyse av et uavhengig laboratorium (Quest Diagnostics) ved bruk av CellSearch analysen. Immunofluorescent farging av MagSweeper isolerte celler identifisert CTCs som EpCAM positive og CD45 negative. CTCs ble lett skilles fra WBC som var CD45 positive, EpCAM negativ (Fig. 1 D). Antall helt rensede CTCs oppregnet av MagSweeper isolasjon og CellSearch ble sammenlignet og funnet å være rimelig lik, med en mild trend observert mot bedre CTC-fangst ved bruk av MagSweeper i prøver med lave CTC tall (figur 1E).

MagSweeper isolasjon har minimal effekt på encellete transcriptomes

for å vurdere om MagSweeper isolasjon prosessen påvirket den globale transcriptional profilen til isolerte celler, vi utførte enkelt celle mRNA-Seq på 4 friske LNCaP celler like før spiking til blod, og på 4 LNCaPs etter MagSweeper isolasjon fra piggete normal blod. Isolerte celler ble lagret frosset i minst en måned for å simulere lagringsbetingelser. Bioanalyzer spor av forsterket cDNA fra en frisk og en MagSweeper isolert celle avslørt lignende molekylvekt toppene amplifiseringsprodukter sentrert på ca 1000 basepar (fig. 2A).

(A) Bioanalyzer spor av forsterkede cDNA fra enkelt LNCaP celler pre (Enkelt LNCaP (pre)) og post MagSweeping (Enkelt LNCaP (post)), og positiv kontroll (12 pg av LNCaP total RNA) og negativ kontroll (negativ kontroll). (B) Heatmap av sammenhenger mellom frisk og MagSwept encellede RNA-Seq data og tabell over sammenhenger mellom friske og MagSwept prøver. Gul indikerer høyere korrelasjoner og røde lavere sammenhenger. (C) Representant Bioanalyzer spor av gode, middels og dårlige CTC cDNA amplifiseringsprodukter. (D) Prosent utbrudd av CTC RNA kvaliteten basert på klassifisering av cDNA amplifiseringsprodukter – grønn indikerer god kvalitet, gule prøvene er delvis degradert RNA og rødt indikerer degradert RNA prøver. (E) Sequenced CTCs, deres RNA kvalitet og% justering av bestått filter mRNA-Seq leser for det menneskelige genom bygge hg19. Pasient CTC ID indikerer enkeltpasient CTCs identifisert som pasientnummer. CTC nummer (P1.1). RNA Kvalitet er basert på Bioanalyzer spor av forsterket cDNA og Juster% er justeringen% av mRNA-sekv leser.

For å studere genene forskjellig uttrykt mellom frisk og MagSweeper isolert enkeltceller, vi brukte først Bioconductor edger pakke. Vi identifiserte bare ett gen som uttrykt forskjellig mellom MagSweeper isolerte og styrer LNCaP celler på en falsk funnrate (FDR) cutoff på 0,05 og ingen med en grenseverdi på 0,01.

Vi har også utforsket flere andre metoder for å identifisere forskjeller mellom friske og MagSweeper isolerte celler. Først, for å karakterisere den grad av celle-til-celle variasjon, spurte vi hvor mange gener hadde en meget høy FPKM ( 10) i det minste i en prøve og en meget lav FPKM ( 0,1) i det minste i en prøve. Vi vurderte tre ulike grupper av prøver: (1) 4 friske celler (2) 4 MagSwept celler og (3) to friske og 2 MagSwept celler. Antallet svært variable gener i fire friske celler (215), fire MagSwept celler (268) og en kombinasjon av to friske og 2 MagSwept celler (239) var lik i alle gruppene og sannsynligvis gjenspeiler celle til celle heterogenitet. I en annen sammenligning vi beregnet sammenhengen mellom antall leser per gen mellom hvert par av prøvene, og fant at i-gruppe korrelasjoner var ikke sterkere enn mellom konsern sammenhenger – det vil si, gjorde cellene ikke klynge basert på isolasjonsmetoden ( figur 2B). Til slutt i en egen studie, kjørte vi en Illumina uttrykk mikromatriser på bassenger av 10.000 LNCaP celler før og etter MagSweeper isolasjon. Igjen, det var høy krysskorrelasjon (R

2 = 0,985) mellom MagSweeper isolerte celler og kontroller som viser at MagSweeper produserer minimale endringer i genuttrykk (data ikke vist).

mRNA-Seq single prostata kreft CTCs

Vi utarbeidet forsterkede cDNA fra 67 CTCs isolert fra 13 prostatakreftpasienter. CTCs ble isolert etter MagSweeping basert på immunfluorescens farging for celler som var (EpCAM + /CD45- /DAPI-). I motsetning til dyrkede LNCaP celler (Figur 2A), fant vi at det var et bredt spekter av størrelser av forsterkede cDNA i pasient avledet CTCs, reflekterende av opprinnelig RNA kvalitet. Vi karakterisert spor av amplifiseringsprodukter i 3 grupper: 1) de som har topper sentrert rundt 1000 bps (god kvalitet), 2) rester med mellomliggende lengde amplifiseringsprodukter (delvis nedbrutt), og 3) sporer med overveiende lav molekylvekt amplifiseringsprodukter (degradert ) (fig. 2C). Ser over alle 67 CTCs, 21% hadde god kvalitet RNA, 37% var delvis degradert, og 42% av prøvene ble nedbrutt (fig. 2D). RNA kvalitet tendens til å være noe pasientspesifikk – for eksempel pasient 2 ga den høyeste nummer (8/12) av god kvalitet RNA prøver. Ved hjelp av RNA kvalitet som en guide, sekvensert vi bibliotekene på 24 CTCs som inkluderte representanter for alle tre RNA kvalitet klassifikasjoner, og justert sekvenser til det menneskelige genom (bygge hg19). Basert på sekvenssammenstilling Resultatet er større enn fem prosent sekvensdata for 20 CTCs samlet fra 4 pasienter (P1, P2, P3 og P4) ble valgt for ytterligere fordypning (fig. 2E).

mRNA Seq datakvalitet

for å vurdere mRNA-seq datakvalitet, ble dekningen beregnet med en kvalitetskontroll manus og et håndplukket sett av 600 kvalitetskontroll gener som er svært kartleggbart og uttrykt i universelle menneske RNA (se metoder, RNA -Seq data Quality Control for definisjon). De sekvensdata fra enkelt LNCaP, PC-3, og T24 celler bestått kvalitetskontroll standarder for 60% justering og 65% median justering CV vanligvis brukes på store RNA inngangs mRNA-Seq datasett (fig 3A.) . I kontrast, vises CTCs høyere dekning median CV og lavere andel av justeringer enn dyrkede celler. Typiske dekning tomter for cellelinjer, normal prostata vev og CTCs er vist i figur 3B. Cellelinjene som vises jevn dekning over hele lengden av transkriptet, mens de normale prostata prøver hadde en svak 3 «forspenningen, som er typisk for vevsprøver (Fig. 3B). De CTCs hadde et bredt spekter av dekning bias, som vist. Siden oligo-dT ble brukt til å prime cDNA syntese, en 3-prime skjevhet i dekningen data antyder mRNA degradering.

(A) Prosent av passerer filter (PF) leser at justert, prosentandel av justeringer som kart til kodende områder, median dekning CV, og prosentandelen av leser det kartet de fem gener med flest kartlagt leser. For å beregne «Median CV», første CV dekning ble beregnet over hver av 600 gener i et håndplukket sett av kvalitetskontroll gener uttrykt i universelle menneske RNA (Agilent), og deretter medianen av disse CV er tatt (vurderer bare de gener med minst 1 x dekning). Den «% på linje» er prosentandelen av PF lesninger som justere til genomet eller til et spleisesete, med unntak av mitokondrier og ribosomalt RNA. Basert på historiske data, forventede verdier for median CV og% justert er 65% og 60%, henholdsvis. Kode justeringer er det% av lesninger som kartet til eksoner. Den% av leser justert til topp 5 gener for hver prøve er vist (B) Eksempler på gjennomsnittlig lengde-normalisert dekning over 600 kvalitetskontroll gener, fra prøver LNCaP.3, N.1, P2.1, P3.4 . Posisjon 0 er 5′-enden av vitnemål og 100 er den ekstreme 3′-enden av karakterutskriften.

mRNA-Seq datainnhold

For å forstå transkripsjon overflod, variasjon og varierer i CTCs, sammenlignet vi distribusjoner av FPKM verdier av alle RefSeq RNA oppdaget i CTCs og LNCaP celler (tabell S1 og S2). Målinger av RefSeq utskrifter med ≥10 FPKM avslørt i LNCaP celler (n = 4) 4622 ± 136,2 transkripsjoner (med en rekkevidde på 4485 til 4786 transkripsjoner). I motsetning til i CTCs (n = 20) antall RefSeq utskrifter med ≥10 FPKM var 2362 ± 865 transkripsjoner (med en rekkevidde på 1233 til 3987 transkripsjoner).

Deretter så vi på uttrykk nivåer av flere prostata beslutningstakere og en leukocytt markør for å fastslå at pasient avledet celler var av prostata opprinnelse: androgen reseptor (AR), prostataspesifikt antigen (PSA, KLK3), TMPRSS2, og leukocytt markør CD45 i alle CTC prøver. Figur 4A viser FPKM av hver av disse markørene i pasient CTCs, vevskultur-cellelinjer og normal prostata, med verdier av 1 FPKM skyggelagt i grønt. Alle unntatt en av de CTCs var positiv for minst ett av prostata markører. LNCaP og normal prostata viste forventede ekspresjon av disse prostata markører. PC-tre manglet KLK3 og AR uttrykt som forventet [29], men gjorde uttrykkelig TMPRSS2. Viktigere, alle CTCs og cellelinjene var negative for WBC markør CD45. Normal prostata, som er sammensatt av mange celletyper, inkludert WBC, var positiv for CD45-ekspresjon som var den eneste WBC som ble utsatt for mRNA-Seq. Til slutt, T24, en blærekreft cellelinje som ikke uttrykker noen av disse markørene. For å forstå hvordan pasienten CTCs forholder seg til hverandre, utførte vi en unsupervised clustering analyse av alle pasient CTCs. Analysen viste at med unntak av to CTCs (P2.9 og P1.2), samtlige CTCs fra individuelle pasienter gruppert i en pasientspesifikk måte (Fig. 4B).

(A) Ekspresjon av prostatakreft tilknyttede gener. For hvert gen, er fragmenter per kilobase av exon per million fragmenter kartlagt (FPKM) for hver CTC og kontrollene som er vist. FPKM verdier større enn 5 er skyggelagt grønn og de med verdier mellom 1 og 5 er skyggelagt lys grønn. AR (androgen reseptor), KLK3 (prostata spesifikt antigen), og TMPRSS2are markører for prostata vev. CD45 er en hvit blodcellemarkør. Prostata kreft cellelinjer omfatter LNCaP og PC-3, mens T24 er et blærekreft, og WBC er en enkel hvit blodcelle. Normal betegner normal prostata vev. (B) Unsupervised gruppering av over-uttrykte gener i pasient CTCs. Fargede barer over toppen av figuren angir ulike pasienter mens individuelle pasient CTCs er listet nederst i klyngen. (C) Funksjonell klassifisering av gener overuttrykt i CTC bruker Gene ontologi (GO) klassifikasjoner. For hver funksjonell gruppering% av gener over-uttrykt i hvert GÅ kategori er indikert.

CTC Pathway Analysis

For å finne gener og stier som ble ulikt aktivert i CTCs vi sammenlignet transkripsjon profiler av CTCs til de fra normal prostata vev og fokusert på gener som var over uttrykt i CTCs. For å normalisere RNA-Seq data basert på genet størrelser og antall kartlagte fragmenter, brukte vi tophat og mansjettknapper å bestemme FPKM. Vi antok at de varierende grader av RNA-degradering i CTCs ville føre til falsk-positive telling på under uttrykte gener i CTCs, spesielt siden halveringstiden til RNA varierer fra genet til genet. Vi brukte en manuell thresholding metode for å identifisere gener som ble overuttrykt i CTCs. Nærmere bestemt har vi valgt gener som var minst 100 ganger høyere i det minste to av de CTCs i forhold til normal prostatavev og som inneholdt minst 10 kartlagt leser i minst en prøve.

Vi identifiserte gener 181 spissen -expressed i CTCs sammenlignet med normal prostata vev (tabell S3). For å få en oversikt over omfanget av biologiske funksjoner knyttet til disse transkripsjonene, Gene Ontologi merknader vi utledet fra GoSlim databasen ved hjelp av Panther Classification System leseren [28] (Fig. 4C) og kategorisert for biologiske prosesser. Ut av 181 gener, 110 ga 173 prosess treff som ble klassifisert i 14 biologiske prosesser. Disse ble vist ved hjelp Panther Pie Handlekurv funksjon (fig. 4C). Blant de resterende 71 genet merknader som ikke er klassifisert av GoSlim, 37 var ikke-kodende RNA inkludert medlemmer av MIR, SCARNA, snar, SNORA, SNORD og VTRNA familier. De resterende 34 transkripsjoner kunne identifiseres ved hjelp GeneCards. Undersøkelse av transkripter som er klassifisert ved hjelp av biologiske prosesser avslørt at en tredjedel var assosiert med enten metabolske prosesser (23%, GO: 0008152), eller cellesyklus (10%, GO: 0007049), i samsvar med mitotisk aktive celler (figur 4C.). Cellesyklus og mitose assosiert transkripsjoner i høyt uttrykt gen sett inkludert TPX2, CCNA2, CCNB1 og B2, CDC20, CSK2, CDC2, CDKN3, CENPE, CD28, TOP2A, ORC1L, NUF2, CDK1, KIF2C, PTTG1 og TTK.

det er interessant listen inneholder mange transkripsjoner germane til sykdomsutviklingen. For eksempel, alle 3 CTCs fra pasient en uttrykt høye nivåer av SPINK1, en transkripsjon og protein identifisert som forhøyet i TMPRSS2-ERG fusion negative prostatakreft og assosiert med aggressiv prostatakreft [30]. CTCs fra pasienter 1 og 2 uttrykte høye nivåer av BIRC5 (Survivin), et anti-apoptotiske-genet uttrykkes ved høye nivåer i kastrering resistent prostatakreft. CTCs også uttrykt kreft forbundet transkripsjoner (BÅGE, BAGE3, CT45A1, CT45A4, CT45A5, CT45A6, CTAG18, CTAG2, MAGEA12, MAGEA1, MAGEA3, MAGEA6, MAGEC1, MAGEC2, og PTTG1) og transkripsjoner viktige i regulering av utvikling (HOXB7, HOXB8, HOXB9

Legg att eit svar