PLoS ONE: Meta-analyser av Microarray datasett Identifiserer ANO1 og FADD prognostiske markører av hode og nakke kreft

Abstract

hode og hals plateepitelkarsinom (HNSCC) transkriptomet har blitt profilert mye, likevel identifisere biomarkører som er klinisk relevant og dermed med translasjonell fordel, har vært en stor utfordring. Målet med denne studien var å bruke en meta-analyse basert tilnærming til katalog kandidat biomarkører med høyt potensial for klinisk anvendelse i HNSCC. Data fra offentlig tilgjengelige microarray serie (N = 20) profilert hjelp Agilent (4X44K G4112F) og Affymetrix (HGU133A, U133A_2, U133Plus 2) plattformer ble lastet ned og analysert i et plattform /chip-spesifikk måte (GeneSpring programvare v12.5, Agilent, USA). Principal Component Analysis (PCA) og klyngeanalyse ble utført iterativt for å skille uteliggere; 140 normale og 277 tumorprøver fra 15-serien ble inkludert i den endelige analysen. Analysene identifiserte 181 forskjellig uttrykt, samstemmige og statistisk signifikante gener; STRING Analysen avdekket interaksjoner mellom 122 av dem, med to store gensamlingene koblet sammen med flere noder (MYC, FOS og HSPA4). Validering i HNSCC spesifikke database (N = 528) i Kreft Genome Atlas (TCGA) identifisert et panel (

ECT2

,

ANO1

,

TP63

,

FADD

,

EXT1

,

NCBP2

) som ble endret i 30% av prøvene. Validering i behandlingsnaive pasienter (gruppe I, n = 12) og etter behandling (gruppe II; N = 12) hos pasienter identifisert 8 gener signifikant assosiert med sykdommen (areal under kurve 0,6). Sammenheng med tilbakefall /re-gjentakelse viste

ANO1

hadde fram høyeste effekt (følsomhet: 0,8, spesifisitet: 0,6) for å forutsi svikt i gruppe I.

UBE2V2

,

PLAC8

,

FADD Hotell og

TTK

viste høy følsomhet (1.00) i gruppe i, mens

UBE2V2 Hotell og

CRYM

ble svært følsom ( 0,8) i å forutsi re-gjentakelse i gruppe II. Videre viste TCGA analyse som

ANO1 Hotell og

FADD

, som ligger på 11q13, ble co-uttrykt ved transkripsjon nivå og signifikant assosiert med generell og sykdomsfri overlevelse (

p

0,05). Meta-analysen tilnærmingen i denne studien har identifisert kandidat markører korrelerte med sykdom utfall i HNSCC; ytterligere validering i en større kohort av pasienter vil etablere sin kliniske relevansen

Citation. Reddy RB, Bhat AR, James BL, Govindan SV, Mathew R, DR R, et al. (2016) Meta-analyser av Microarray datasett Identifiserer

ANO1 Hotell og

FADD

prognostiske markører av hode- og halskreft. PLoS ONE 11 (1): e0147409. doi: 10,1371 /journal.pone.0147409

Redaktør: Muy-Teck Teh, Queen Mary University of London, Storbritannia

mottatt: 8 oktober 2015; Godkjent: 04.01.2016; Publisert: 25 januar 2016

Copyright: © 2016 Reddy et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet:. All relevant data er innenfor papir og tilhørende informasjon filer

Finansiering:. prosjektet ble finansiert av indiske rådet for medisinsk forskning, India (No: 5/8 /10-18 (Oto) /CFP /11-NCD -1). (https://www.icmr.nic.in/). AS fikk finansiering. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser. To av forfatterne er tilknyttet kommersielt selskap Strand miljø- og biovitenskap. Dette endrer ikke forfatternes tilslutning til PLoS ONE politikk på deling av data og materialer.

Innledning

Molecular profilering av svulster, inkludert Head and Neck plateepitelkreft (HNSCC), har vært ansatt å forstå mekanismene for karsinogenese, så vel som de underliggende årsakene til behandling motstand. Den økende globale forekomsten av HNSCC sammen med mangel på betydelig forbedring i total overlevelse rate i løpet av de siste fire tiår, nødvendig nyere tilnærminger til å forstå de molekylære mekanismer av sykdom og for å identifisere potensielle markører for tidlig diagnose, prognose og som mål for terapi. Molekyl profilering i kombinasjon med pasient validering i kreft i prostata, eggstokk og bryst har ført til klinisk anvendelse av markør paneler som Mamma trykk og Oncotype Dx. [1, 2]. Lignende forsøk på å etablere diagnostiske eller prognostiske molekylære markører i HNSCC for klinisk anvendelse har vært unnvikende.

Høy throughput molekylære profilering ved hjelp av teknikker som katalog forskjellene på hele genomet, transkriptomet [3] [4] [5] og proteom [6] nivåer har blitt utført i HNSCC. Disse studiene har katalogisert markører for progresjon [7] [8] og respons på behandling [9]. Likevel har oversettelse av disse markørene for klinisk nytte ikke er oppnådd på grunn av utfordringer knyttet til høy gjennomstrømning teknikker i form av markør utvalg og behovet for storskala validering pasient. Disse utfordringene er videre gjort til skamme på grunn av problemer som for eksempel betydelig uoverensstemmelse mellom ulike høy gjennomstrømning studier, tilskrives forskjeller i utvalgets behandling, type plattformer som brukes og analytiske algoritmer brukt [10] [11]. Dette problemet blir ytterligere forsterket i transcriptomic studier først og fremst fordi transkripsjon nivåendringer kan variere basert på scenen, vev-spesifikke og romlige variasjoner i uttrykket av ulike gener.

Analytiske strategier som kan benytte eksisterende databaser og identifisere markører samstemmige på tvers av studier kan være en gunstig måte å innskrenke til markører for økt tillit og klinisk anvendelse. Meta-analyse, med henvisning til analysen av offentlig tilgjengelige datasett, kan dermed potensielt mulig å identifisere klinisk relevant pool av markører; mange slike studier er rapportert i kreft i forskjellige områder. Meta-analyse basert tilnærminger i bukspyttkjertelkreft har ført til identifisering av nye mål og kandidat biomarkører [12]. I prostatakreft, markører årsaks til kreftfremkallende prosessen ble identifisert ved hjelp av en lignende tilnærming [13]. I tillegg markører sterkt assosiert med prognose og behandlingsresultat prediksjon i brystkreft [14] [15] Det ble også identifisert gjennom liknende meta-analyse basert tilnærminger. Hovedmålet med denne studien var å gjennomføre en cross-platform, cross-studie meta-analyse av offentlig tilgjengelige microarray datasett i hode- og halskreft, identifisere markører for biologisk relevans gjennom en felles analytisk rørledning og deretter validere dem i kliniske prøver.

Materialer og metoder

Søkekriterier og data Mining

Analyse av offentlig tilgjengelige microarray datasettene ble utført i henhold til PRISMA retningslinjer [16]. De offentlige databaser, Gene Expression Omnibus (GEO) (NCBI-http: //www.ncbi.nlm.nih.gov/geo/) og Array Express (EBI) [https://www.ebi.ac.uk/arrayexpress ] ble søkt for tilstedeværelsen av rådata av microarray eksperimenter utført i hode- og halskreft. Serien er valgt for analysen inkluderte data fra i) studier utført i hode og nakke plateepitelkarsinom pasienter ii) studier inkludert behandlingsnaive pasienter og iii) studier som utfører global profilering av transcriptomics med høy tetthet arrays. Studier /samples inkludert skjoldbruskkjertelen, orofarynx og nasopharynx ble ekskludert fra studien på grunn av deres varierte årsaker. De to plattformene som inngår i analysene var Affymetrix [Affymetrix Inc., California, USA] og Agilent [Agilent Technologies, California, USA]. Den rå dataserier profilert av begge plattformene ble gruppert basert på den enkelte teknologi og hver teknologi (av begge plattformene) ble inkludert i analysen dersom minst to serie var tilgjengelige i databasen. Den generelle arbeidsflyten fulgt trinnvis protokollen foreslått av Ramasamy

et al

for å utføre meta-analyse [17]. Den grunnleggende arbeid algoritme er beskrevet i figur 1.

De offentlig tilgjengelige rå microarray data på hode og hals plateepitelkreft (HNSCC) serien ble lastet ned og gruppert og analysert i Genespring statistisk programvare. Normalisering ble utført på prøvene, som ble deretter gruppert i svulsten og normal før gjennomføring av den gennivå eksperiment. Principal Component Analysis (PCA) ble utført for å fjerne uharmoniske prøvene. Brett endring og

p

verdi ble beregnet til å oppnå betydelige genet enheter. Disse statistisk signifikante enhetene ble brukt for videre analyse; database kommentarer (Gene ontologi, STRING og miRWALK) og pasient validering (Eksperimentell validering av Kvantitativ Real Time PCR (qPCR) og Kreft Genome Atlas (TCGA)).

Data Analysis Bruke Gene Spring

de rådatafiler brukt for analysene inngår .CEL (Affymetrix plattform) og TXT (Agilent) filer. Meta-analyse ble utført ved hjelp av Gene våren programvare (https://genespring-support.com) [v12.5, Agilent, California, USA]. Rådata som angår hver brikke ble lastet opp på programmet, hvor prøvene ble baseline transformert og normalisert ved Robust Multi-matrise Analysis (RMA) i Affymetrix eller 75

th persentil i Agilent plattformer (én farge). De enkelte eksempelfiler ble deretter klassifisert i «normal» og «tumor» og re-analysert som et enkelt eksperiment. Gennivå eksperimentelle data (aritmetisk middelverdi av alle probene tilordning til den samme sonde ID) ble generert og kvalitetskontroll ble utført ved anvendelse av Principal Component Analysis (PCA) i GeneSpring. Prøvene som ble uteliggere i PCA tomter ble fjernet og clustering utføres senere for å sikre en klar lagdeling mellom de to kategoriene av prøver (Normal og svulst). Fremgangsmåten ble gjennomført med flere iterasjoner for å oppnå et raffinert separasjon. Brett endring analyse ble deretter henrettet på prøvene følgende som uparet

t

-test (ulik varians) ble utført for å oppnå betydelige genet enheter.

p

-verdi beregning (asymptotisk) og multippel testing korreksjon (Benjamini Hochberg FDR) ble videre utført for å oppnå genet enheter med

p

-verdi 0,05 og fold endring (FC) av 2,0. Innebygd pathway analyse ble utført ved hjelp av identifiserte genet listen. Den betydelige genet listen og stier på tvers av ulike teknologier for Affymetrix ble sammenlignet ved hjelp av genet symbol /sti navn som en identifikator. Den enkelte genet enhet liste fra hver teknologi ble hentet fra Genespring programvare og eksporteres til Excel-filer. De samstemmige genet enheter samt felles trasé ble identifisert på tvers av teknologier ved hjelp av Microsoft Access (Microsoft Inc. WA, USA). Lignende tilnærming ble vedtatt for å identifisere alle de vanlige gener og stier på tvers av de to plattformene av Affymetrix og Agilent (fig 1).

Funksjonell merknad Bruke flere Web Resources

konkordant genet liste over de forskjellige plattformer ble analysert i de ulike nettressurser til å vurdere funksjonelle klasser, protein-protein interaksjoner og mirnas rettet mot genene. Gene ontologi Analysen ble utført ved hjelp PANTHER (Protein merknad gjennom Evolutionary Sivil) klassifiseringssystem (https://www.pantherdb.org/) [18] for å evaluere de funksjonelle klasser av gener. Den STRING database (STRING v9.1) (http: //string-db.orgnewstring_cgi) [19] ble brukt til å forutsi og katalogisere protein-protein interaksjoner mellom de samstemmige gener. De mirnas som er rettet mot disse genene ble undersøkt ved hjelp av miRWalk2.0 database (https://www.umm.uni-heidelberg.de/apps/zmf/mirwalk/index.html) [20].

Pasient basert Validering

konkordant genet listen ble også kryss sammenlignet med TCGA database (https://www.cbioportal.org) [21] for deres mutasjon, kopiere nummer variasjon (CNV) og mRNA uttrykk status. Den betydelige genet panel identifisert ble også vurdert for sine co-uttrykk data, generell og sykdomsfri overlevelse i sammenheng med deres uttrykk mønstre i TCGA kreftstudier (Head and Neck Plateepitelcarcinom, foreløpig, N = 528 prøver)

Den validering av utvalgte gener ble også utført i HNSCC pasienter som bruker kvantitativ real time PCR. Studien ble godkjent av Narayana Hrudayalaya Sykehus Institutional Review Board [NH /IRB-CL-2012-058]. Kirurgiske prøver av pasienter ble valgt fra bio oppbevaringssted for hode og nakke onkologi avdeling, Mazumdar Shaw Medical Center, Bangalore. Alle prøver ble samlet etter skriftlig informert samtykke. Tidligere ubehandlede og tilbakevendende pasienter diagnostisert med HNSCC av alle nettsteder (unntatt i skjoldbruskkjertelen, orofarynx og nasopharynx) og stadier i løpet av perioden mars 2010 til 2014, med detaljer om oppfølging, ble inkludert i studien. Den normale vevsprøver ble samlet fra friske frivillige under dental utvinning etter skriftlig informert samtykke. De demografiske, kliniske og patologiske data for pasienter ble hentet fra elektronisk pasientjournal og pasientene ble fulgt opp i en periode på 2 år.

Pasientene ble kategorisert basert på deres Humant papillomavirus (HPV) status som identifisert av p16 immunhistokjemi ved hjelp av etablerte protokoller. Formalinfiksert parafin innebygde delene av pasientene ble samlet inn fra avdeling for patologi ved senteret. I korthet tumorseksjoner (5 mikron) ble de-paraffinised og behandlet med 3% hydrogenperoksyd for å stoppe endogen peroksidaseaktivitet. Seksjonene ble inkubert med den primære antistoff (anti-p16, BioGenex, Fremont, CA, USA) og påfølgende påvisning ble utført ved hjelp av hest reddik (HRP) system som i henhold til produsentens instruksjoner (Dako REAL

™ EnVision

™ Detection System, Danmark). Seksjoner behandlet på samme måte men uten det primære antistoff ble tatt som negative kontroller. Scoring av de fargede lysbilder var i henhold til etablerte studier [22]. Skinnene ble evaluert ved hjelp av lysmikroskopi og scoret på en 0-3 skala tar hensyn til prosentvis positivitet og intensitet av farging; 0 (fullstendig fravær av tumor-farging), 1 (svak farging av tumorceller), 2 ( 50% tumor celler farget med moderat intensitet) og 3 (mer enn 50% tumor farging med moderat /sterk farging)

.

Marker Profiling for validering av Quantitative real Time PCR (qPCR)

RNA ble ekstrahert fra prøvene, arkivert i RNA senere (Ambion, Thermo Fisher Scientific, Massachusetts, USA), ved hjelp av TRIZOL reagens (Sigma Aldrich , MO, USA) og behandlet med DNase (Fermentas, Thermo Fisher Scientific, Massachusetts, USA) og vurderes for forurensning av Polymerase Chain Reaction (PCR). Integriteten og kvaliteten av RNA ble bestemt ved gel-elektroforese og forholdet 260/280. 1 ug RNA (260/280: 1,8-2,0) ble omdannet til komplementære DNA fra High Capacity cDNA Conversion kit (Applied Biosystems, CA, USA) i henhold til produsentens instruksjoner. De utvalgte markører ble profilert med spesifikke primere oppført i S1 tabell og alle primere ble evaluert for spesifisitet ved hjelp Basic Local Alignment Search Tool (BLAST) analyse (National Center for Biological Informasjon, NLM, USA). QPCR Effektiviteten ble vurdert ved hjelp av helningen av den lineære regresjonsmodellen i henhold til standard protokoller. Den Cp ble målt over flere serielle fortynninger av hver cDNA for å oppnå standardkurve og den tilsvarende skråning. Effektiviteten beregnes ved hjelp av formelen, Effektivitet = 10

(- 1 /skråning). Alle sanntid PCR reaksjoner ble utført i tre paralleller ved hjelp av Roche Lys Cycler 480 real time PCR system (Roche Diagnostics, Tyskland) eller ABI Trinn en Real Time Machine (Applied Biosystems, CA, USA) bruker Kapa SYBR Grønn PCR Master Mix ( Kapa Biosystems, MA, USA). De termiske sykluser Betingelsene var 50 ° C i 2 minutter etterfulgt av en innledende denatureringstrinn ved 95 ° C i 10 minutter, 45 sykluser ved 95 ° C i 30s, 60 ° C i 30 sekunder og 72 ° C i 30 sekunder. Forsøkene ble utført i tre eksemplarer for hvert datapunkt. Krysningspunktet (CP), og den etterfølgende analyse ble utført ved anvendelse av den andre deriverte maks Fremgangsmåte i programvaren (Roche Diagnostics, Basel, Sveits). Alle reaksjoner ble bekreftet for deres spesifisitet ved smelting kurve analyse av prøven og den ikke-target-kontroll (NTC). Et sett (N = 4) av referansegener [(glyseraldehyd-3-fosfat dehydrogenase (

GAPDH

), 60S surt ribosomalt protein P0 (

RPLP0

), 18S ribosomalt ribonukleinsyre (

18SRNA

) og β-glukuronidase (

GUS

)] ble vurdert ved hjelp av RefFinder [23] i en undergruppe av pasienten kohort (N = 26) og to av de beste referanse gener (RGS) ble valgt ut for videre analyse. den relative endringen i uttrykket ble evaluert ved bruk av geometrisk gjennomsnitt av de utvalgte referansegener [24]. uttrykket i normale prøver fungert som kalibrator.

statistiske metoder

statistisk analyse ble utført ved hjelp STATA11.1 (College Station, TX, USA). mottaker Drifts karakteristisk (ROC) kurve analyse ble brukt for å evaluere prediktiv kraft av hver av biomarkører, den optimale klippepunktet som ga maksimal følsomhet og spesifisitet var bestemt for hver biomarkør. ROC-kurver ble deretter plottet på grunnlag av et sett av optimale sensitivitet og spesifisitet verdier. Areal under kurven (AUC) ble beregnet via numerisk integrasjon av ROC kurver. Det biomarkør som har det største arealet under ROC-kurve ble identifisert til å ha den sterkeste forbindelse med tilstedeværelse av hode og nakke tumor. Sensitivitet og spesifisitet av foreningen av markører med tilbakefall /re-gjentakelse ble analysert ved hjelp av klinisk kalkulator (https://vassarstats.net/clin1.html~~number=plural).

Resultater

Data Mining

Basert på søkekriteriene, data mining av ulike databaser identifisert totalt 42 serie [Affymetrix plattform: N = 32, Agilent: N = 10]. Etter en ytterligere filtrering av data basert på inklusjons- og eksklusjonskriterier, ble 18-serien fra Affymetrix og to fra Agilent inkludert i studien (tabell 1). Teknologien og chips som var uforenlig med den analytiske rørledningen og hvor bare en serie var tilgjengelig ble ekskludert fra studien. Det totale antall analyserte prøvene var 667 svulster og 271 normalt. Den Affymetrix plattform inkluderte totalt 246 normal og 629 svulster (U133 pluss 2,0: N = 207, T = 419; U133A chip: N = 19, T = 147; U133A_2: N = 20, T = 63), mens Agilent plattform (4X44K G4112F) inkludert 25 Normal (N) og 38 tumor (T). De undersider undersøkt i den valgte serien var buccalslimhinnen, tunge, strupehode og svelg, og alveolus og retro-molar trigone. Den normale prøvene var fra gingivobuccal stedet i hele serien. Serien fra hver brikke i hver plattform ble analysert separat med Gene våren analyse programvare og som per analytisk rørledningen for å identifisere de samstemmige genet enheter lister.

Analyse over en enkelt plattform.

i Affymetrix plattformen, ble 18 analysert serie, som omfattet studier utført på U133 pluss 2 (N = 13), U133 a_2 (N = 2) og U133A (N = 4) chips; i en av serien, ble data analysert ved hjelp av to forskjellige brikker (tabell 1). Fem serie U133 pluss to ble ekskludert fordi prøvene var uteliggere under PCA og clustering; en total på 373 prøver ble tatt med i den endelige analysen (N = 122, T = 251). Den statistisk signifikant genet liste med FC 2,0 og

p

-verdi av 0,05 ble brukt for videre analyse. Totalt 12,079 gener ble identifisert etter analyser av U133 pluss 2,0, mens 4134 ble identifisert fra U133A og 3438 gener genet fra U133A_2. Microsoft tilgang analyse på tvers av disse gense listene avdekket en liste over 965 genet enheter hvorav 64,46% (N = 622) enheter er konkordant over 3 chips (585 opp regulerte og 37 ned regulert) (S1 A File) og 35,54% (N = 343 ) av genene viste feilaktige trender for regulering. Likeledes en vurdering av samsvar og disharmoni i forskriften gjennomføres på tvers av teknologier viste ulike trender (U133 Plus 2 Vs U133A Concordance = 76,53%; U133 Plus 2 Vs U133A_2 Concordance = 58,27%; U133A Vs U133A_2 Concordance = 86,11%).

de felles trasé tvers av teknologier ble identifisert ved sammenligning av deres individuelle sti lister. Listen (N = 54) ble deretter sortert basert på prosentandelen av enheter matchet med hensyn til det totale antall spredningsveier enheter. Tjue en trasé ble identifisert med 30% eller mer matchet enheter i alle de 3 teknologier, blant annet et flertall av dem er cellesyklusen knyttet baner (S1B fil).

I Agilent plattform (4x44k G4112F), 2 serie, hvorfra et totalt 44 prøver (N = 18, t = 26) ble inkludert i den endelige analysen totalt 8493 gener (opp og ned regulert) ble identifisert fra analysen (FC 2,0;

p

0,05); 338 av dem er meget signifikant (

p

0,001) med høy ganger endring forskjeller (FC 25 ganger). Bruk av en cut off på 50% av matchet enheter fra det totale antall enheter, ble 43 trasé identifisert. De mest betydningsfulle baner ( 65% av matchet enheter) identifisert var inflammatorisk respons og ekstracellulære matrise organisasjon (ECM) (S1C og S1D File)

Cross-plattform Analyse

Listen.. av gener som vanligvis identifisert mellom de to plattformene avdekket totalt 402 gener (

p

0,05 og FC 2,0), hvorav 181 (45,03%, 13 nedregulert og 168 opp regulert) var konkordant og 221 (54,97%) uharmoniske i reguleringen trend. Den konkordant liste over 181 gener er gitt i S2A fil. Gene ontologi analyse utført for dette genet listen i PANTHER database for klassifisering av genene, indikerte at i de molekylære funksjoner, bindingen kategori (GO: 0005488) viste maksimal representasjon (28,5%, N = 49) med protein og nukleinsyre syrebindende molekyler blir de viktigste komponentene. Tilsvarende i biologiske prosesser, celle (GO: 0009987, 20,10%, N = 75) og metabolsk prosess (GO: 0008152, 18,8%, N = 70) var et flertall. 24,40% av de cellulære komponentene var celledeler (GO: 0043226) og ekstracellulære regioner (GO: 0005576). Flertallet av protein klassene identifisert var transportører (PC00227) (9,30%; N = 21) og reseptorer (PC00197) (8,40%, N = 8) (S1A figur)

Den vanlige baner (N. = 16) ble identifisert på tvers av de to plattformer med MS tilgang. De mest betydningsfulle veier er identifisert var de som er forbundet med cytoskeletal oppførsel, kolesterolbiosyntese og IGF transport (ved 70% passet entiteter mellom plattformene). Onkostatin M signalering og Focal Heft var de andre viktige veier som ble feilregulert ( 25% matchet enheter på tvers av plattformer). (S2B File)

STRING database analyser identifisert et nettverk av interaksjoner mellom 122 gener fra konkordant liste . Den største samspillet nettverk besto av to store sammenhengende grupper med FBj Murine Osteosarkom Viral Oncogene homolog (FOS), Fibronektin 1 (FN1), cyclin-avhengig kinase 1 (CDK1), Heat shock 70 kDa protein 4 (HSPA4) og V-Myc Avian Myelocytomatosis (MYC) er nodene i forbindelse (fig 2). Den konkordant liste når ytterligere analysert for å identifisere de eksperimentelt validerte genet mål for miRNA uttrykk fra miRWalk2.0 databasen, to store familier av miRNA [

la product: (N = 17) og

mir product: ( N = 47)] ble identifisert som målrettet mer enn 5 gener fra listen (S3 File).

Analyse for protein-protein interaksjon med STRING nettverk identifisert to store sammenhengende klynger med høy grad interaksjoner mellom gener ( N = 122). Disse 2 store klynger ble koblet sammen av nodene MYC, fn1, FOS og HSPA4. Antall linjer representerer nivåene av bevis som angitt i fargen legende. De forskjellige størrelser av noden er basert på graden av protein strukturell informasjon som er tilgjengelig for hvert gen mens fargene i noden er et visuelt hjelpemiddel som brukes for bedre representasjon. Markørene fra denne analysen valgt for pasienten validering er omkranset.

TCGA Database og eksperimentell validering av genene i HNSCC Pasienter

181 genet listen var kryss sammenlignet med TCGA database ( https://www.cbioportal.org) for å vurdere mutasjonen, kopiere nummer og mRNA uttrykk status i hode- og halskreft kohort (N = 300). Totalt 59 gener ble endret på minst 10% av pasientene, mens en sub-sett av 6 gener [(epitelceller Trans gen 2 (

ECT2)

, Anoctamin en

(ANO1)

, Tumor Protein p63

(TP63)

, Fas -Associated Via Død Domain

(FADD)

, Exostosin-en

(EXT1) Hotell og Nuclear Cap Binding Protein underenhet 2

(NCBP2

)] ble endret på minst 30% av prøvene ved mutasjon /CNV og mRNA nivåer (S3 Fil- og S1B Fig). de 20 beste genene basert på den prosentvise endringer i TCGA er oppført i Tabell 2.

Experimental godkjenning ved kvantitativ real time PCR (qPCR) ble gjennomført i totalt 34 prøver inkludert primær ubehandlede tumorer (gruppe i, N = 12), tilbakevendende prøver (Gruppe II; . N = 12) og friske normale kontroller (N = 10) Flertallet av prøvene i pasient kohort (N = 24) var menn (75%, N = 18) og fra munnhulen sub området (83,3%, N = 20) med avansert stadium IV kreft (62,5%;. N = 15) Flertallet av pasientene var over en alder av 40 år (95,8%; N = 23) og 79,2% var enten røykere, tygger eller alkohol forbrukere (N = 19). Pasientene i det primære kullet enten gjennomgikk stråling etter kirurgi eller hadde ingen adjuvant behandling. Fem av disse pasientene utviklet tilbakefall under oppfølging mens tre var sykdomsfri (Fire pasienter ble ikke fulgt opp) (S2 tabell). I tilbakevendende kohort, pasientene gjennomgikk kjemoterapi og strålebehandling før kirurgisk behandling

Genene for validering ble valgt ut fra den 181-genet liste basert på flere kriterier.; nedregulert mer enn 5 ganger i 2 teknologier [Placenta-Specific 8 (

PLAC8

) og krystallin, Mu (

CRYM

)], noder i String-databasen (

FOS

,

TTK

, Ubiquitin konjugering enzym E2 variant 2 (

UBE2V2) Hotell og Centrosomal Protein 55kDa (

CEP55

)] og undergruppe av gener med endringer i minst 30% av pasientene (mutasjon, CNV og uttrykk) (

ECT2

,

ANO1

,

FADD

) i TCGA database. Alle primere, når validert viste en effektivitet som spenner fra 1,9 til 2.1 med den prosentvise effektivitet er 93% til 110% (S2 figur). Analyse ved RefFinder indikerte at blant referanse gener vurdert,

RPLP0

og

18SRNA

ble evaluert som den mest stabile ( geometrisk gjennomsnitt for rangering verdier:

RPLP0

: 1.19,

18SRNA

: 1.41,

GAPDH

: 3,0 og

GUS

: 4,00) etter analyse av multiple programvare (Delta CT, geNORM, Normfinder og Bestkeeper) (S3 figur). qPCR validering av utvalgte gener (N = 9) ble så utført ved bruk av relativ kvantifisering metode med det geometriske gjennomsnittet av de to referanse gener.

markørene viste regulerings trender i begge grupper tilsvarende de som oppnås fra meta-analyse (figur 3A-3D). Seks av de gener som viste mer enn 70% validering i prøvene vurderes;

PLAC8 plakater (91,67),

UBE2V2 plakater (87,5%),

ECT2 plakater (72,2%),

FADD plakater (69,5%),

CEP55 product: (69,5%) og

TTK plakater (76,2%). Vurdering av validering status i de to kohortene indikerte at mens alle gener ble validert på over 60% i gruppe I, bare 4 gener viste en lignende validering i gruppe II (

PLAC8

,

CRYM

ECT2 Hotell og

UBE2V2

). ROC analyse av markører i Cohort en indikert at

PLAC8 plakater (AUC: 0,89),

FOS

(AUC 0,82),

ANO1 plakater (AUC: 0,81) og

UBE2V2 plakater (AUC: 0,82) hadde den høyeste forbindelse med sykdom (figur 3E-3H)

Quantitative genekspresjon profilering av de utvalgte markører ble utført i gruppe i (primær, A). og gruppe II (tilbakevendende, B) kohort.

PLAC8 Hotell og

UBE2V2

ble validert i alle prøvene (100%) av gruppe I med hensyn til regulering trender, mens andre gener viste lignende trend i 60% av prøvene. I gruppe II, 60% av pasientene viste samstemmige regulering trender for fire gener. Basert på pasientens oppfølging, den gruppen jeg var sub-kategorisert i engangs (C) og tilbakevendende (D) og uttrykket ble ytterligere evaluert. ROC kurve analyse i gruppe I pasienter viste at

PLAC8 product: (E),

FOS

(F),

ANO1 product: (G) og

UBE2V2

(H) hadde høyest forbindelse med sykdommen (AUC 0,8). Bar representerer median ganger endring av Normals.

Vurdering av HPV-status, ved hjelp av p16 som surrogatmarkør, indikerte at blant pasienten kohort med tilgjengelige prøver (N = 20), 12 pasienter hadde svak eller ingen flekker, mens resten hadde moderat /sterk farging av p16 (N = 8) (S4A-S4D fig). Korrelasjon av genene med HPV-status (med HPV-score til 2-3 tas som positiv), indikerte at den totale ekspresjon mønster av markørene ikke viser noen tilknytning til HPV-status. Individuelle analyser indikerer at blant markører, bare

FADD

viste en sammenheng med HPV positivitet; økt prosentandel av pasientene (83%) med svak eller ingen farging av HPV viste høy ekspresjon av

FADD

sammenlignet med pasienter positive for HPV. (57%; p = 0,03) (fig S4E)

Korrelasjon av Marker Profile med behandlingsresultat

markørene ble korrelert med behandlingsresultat (gjentakelse i gruppe i og re-gjentakelse i gruppe II).

ANO1

viste best effekt (følsomhet: 0,83, spesifisitet: 0,67) for å påvise pasienter som ikke behandling i kohort 1.

ANO1

viste også en 3-ganger økning i median fold uttrykk i tilbakevendende kohort (4/5) av gruppe i sammenlignet med ikke-tilbakevendende kohort.

ECT2 plakater (0,83),

FADD Hotell og

UBE2V2 product: (1) viste også høy følsomhet i gruppe I. I gruppe II 7/9 (

UBE2V2

,

CRYM

,

FADD

,

CEP55

,

PLAC8

,

TTK Hotell og

FOS)

viste høy følsomhet (0,67 med å 1) ved påvisning av behandlingssvikt. De andre markører viste lav sensitivitet og spesifisitet (S3 Table) i begge gruppene.

HPV positivitet ble en god prognosticator i den totale kohorten med 37% (3/8) viser behandlingssvikt sammenlignet med 63% ( 7/11) i negative pasienter. Men i kombinasjon med FADD, den eneste markøren som viste signifikant sammenheng med HPV-status, FADD

høy /HPV pasientene viste en høy andel av behandlingssvikt (60%, 6/10) sammenlignet med FADD

lav /HPV + pasienter (33%, 1/3).

Blant disse genene, bare

ANO1 Hotell og

FADD

viste signifikant sammenheng med total overlevelse (OS) og sykdom gratis

Legg att eit svar