PLoS ONE: Molekyl Subtyper i hode- og halskreft Exhibit Distinkte mønstre av kromosom Gevinst og tap av Canonical Cancer Genes

Abstract

hode og hals plateepitelkarsinom (HNSCC) er en ofte dødelig heterogen sykdom. Utover rollen til human papilloma virus (HPV), har blitt etablert noen validert molekylær karakterisering av sykdommen. Ved hjelp av en integrert genomisk analyse og validering metode vi bekreftet fire molekylære klasser av HNSCC (basal, mesenchymale, atypiske, og klassisk) var i overensstemmelse med signaturer er etablert for plateepitel carcinom i lunge, herunder dereguleringen av KEAP1 /NFE2L2 oksidativt stress vei, differensial utnyttelse av avstamning markører SOX2 og TP63, og preferanse for onkogener PIK3CA og EGFR. For potensielle klinisk bruk signaturene er gratis for klassifisering av HPV-infeksjon status samt den antatte høy risiko markør CCND1 kopiantall gevinst. En molekylær etiologi for subtypene er foreslått av statistisk signifikante kromosomavvik og differensial celle opprinnelsesland uttrykk mønstre. Modell systemer representant for hver av de fire undertyper er også presentert

Citation. Walter V, Yin X, Wilkerson MD, Cabanski CR, Zhao N, Du Y, et al. (2013) Molecular Subtyper i hode- og halskreft Exhibit Distinkte mønstre av kromosom Gevinst og tap av Canonical kreftgener. PLoS ONE 8 (2): e56823. doi: 10,1371 /journal.pone.0056823

Redaktør: Muy-Teck Teh, Barts The London School of Medicine og odontologi, Queen Mary University of London, Storbritannia

mottatt: 01.10.2012; Godkjent: 15 januar 2013; Publisert: 22 februar 2013

Copyright: © 2013 Walter et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Klinisk /translasjonell Award fra UNC Lineberger Comprehensive Cancer Center, https://unclineberger.org/research/research/research/developmental-research-awards K12-RR-023248; https://www.nih.gov. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

hode og hals plateepitelkarsinom (HNSCC) er en heterogen sykdom som representerer den syvende vanligste formen for kreft i USA. Utover rollen til human papilloma virus (HPV), har blitt etablert noen validert molekylær karakterisering av sykdommen [1] – [4]. For ytterligere å karakterisere mangfoldet av HNSCC samt andre svulster, har vår gruppe og andre foreslo genuttrykk (GE) subtyper som et middel til å prioritere de dominerende genomisk mønstre innenfor en bestemt tumor gruppe [5] – [11]. Validerte subtyper basert primært på GE profilering av brystkreft, glioblastom, lungekreft og andre har fått bred interesse [5] – [7], [9] – [11]. Forarbeid har foreslått at klinisk relevante undergrupper er også funnet i hode- og halskreft [8], men funnene har ikke blitt kopiert, har ingen modellsystemer er foreslått, og etiologien av subtypene er uklar. Med andre tumortyper validering av molekylære signaturer har blitt etablert av følgende metode: (i) subtypene ble vist å være statistisk gyldig, (ii) genomiske forandringer underliggende subtypene ble dokumentert, og (iii) modellsystemer representant for uttrykket subtyper ble identifisert. Denne studien ble unnfanget for å løse hver av de punkter som er nevnt ovenfor. Fordi målet med denne studien var å påvise genuttrykk mønstre og underliggende genomiske hendelser som er til stede i HNSCC, gjorde studiedesign ikke innlemme noen molekylære undergrupper som ble definert a priori – f.eks subtyper klassifisert av HPV-status.

Resultater

Unsupervised Funn av HNSCC Expression Subtyper

For å ta opp spørsmålet om statistisk signifikante genuttrykk subtyper kan påvises i HNSCC, vi utførte hierarkisk clustering i en unsupervised og upartisk måte ved hjelp av veletablerte og objektive metoder [7]. Som i tidligere arbeid av Chung et al. [8], vi dokumentert nærvær av fire genuttrykk subtyper. Genuttrykk varmekart (figur 1A) og plott produsert av ConsensusClusterPlus [12] (figur S1 A – C) støtter ikke tilstedeværelsen av ytterligere statistisk signifikante klynger i dette datasettet. Et representativt sett av gener som er kjent eller mistenkt for å være relevant for hode- og nakkekreft er vist i figur 1B, og test statistikk for foreningen av alle genene i datasettet med svulst subtype er gitt i tabell S1. SigClust [13] Analysen viste at p-verdiene for alle de parvise sammenligninger av uttrykket subtyper var signifikante på the.05 nivå etter bruk av en Bonferroni korreksjon for multiple sammenligninger (Figur S1D). Det vises til uttrykk subtyper basal (BA), mesenchymale (MS), atypisk (AT), og klassisk (CL), basert på biologiske egenskaper gener høyt uttrykte i hver subtype.

Heatmaps av uttrykket verdiene av 840 Klassifiserings gener (A) og utvalgte gener assosiert med HNSCC (B) for hver av de uttrykk subtyper. Validering heatmaps av tyngdepunktbaserte avstander mellom centroids av uttrykket undertyper i denne studien og de fra Chung et al. (C) og LUSC subtyper av Wilkerson et al. (D).

Kliniske Kjennetegn

De kliniske kjennetegn ved pasientene i denne studien representerer et bredt tverrsnitt av pasienter med HNSCC som er svært representativ for befolkningen sett i en typisk klinisk praksis (tabell 1). Det var ingen sammenheng svulst subtype med alder, kjønn, rase, alkoholbruk, pakke år, eller tumorstørrelse. Tumor subtyper ble statistisk assosiert med nettstedet, selv om alle stedene hadde svulster i hver av de uttrykk undergrupper, med ett unntak (hypopharynx viste ingen BA). I tillegg ingen område bidratt mer enn 58% av sine prøver til ett uttrykk subtype. Ingen ekspresjon subtype ble bygget opp av mer enn 68% av tumorer fra et enkelt område. Derfor, i motsetning til andre molekylære markører som HPV eller p16, konkluderer vi med at uttrykket subtyper fanget en dimensjon av biologi som ikke var begrenset til en enkelt anatomisk sted [14]. Det var flere statistisk signifikante assosiasjoner mellom svulst subtype og HPV status, behandling, node status, og samlet scenen. Det er bemerkelsesverdig at flere BA tendert mot å være godt differensiert, mens 13 av 16 dårlig differensierte svulster var enten MS eller CL, men denne forskjellen var ikke statistisk signifikant.

Validering av Subtyper

Vi deretter slått vår oppmerksomhet til spørsmålet om uttrykket subtyper oppdaget i den aktuelle datasettet samsvarer med det som tidligere er rapportert av Chung et al. [8]. Wilkerson et al. [7] presentert en metode for å sammenligne genutrykksmønster funnet i uttrykket undertyper på tvers av flere studier. Vi benytter den samme prosedyre, som er beskrevet mer fullstendig i metodedelen. Kort, centroids uttrykks subtyper måle gjennomsnitts genuttrykk verdier og undergrupper med samstemmige uttrykk mønstre produsere centroids som er mer høyt korrelerte enn undergrupper med uharmoniske uttrykk mønstre. En klar korrespondanse ble observert (figur 1C), med BA, MS, AT, og CL viser de samme uttrykk mønstre som Chung subtyper 1, 2, 3, og 4, henholdsvis. Etter å ha oppdaget fire undergrupper ved hjelp av uavhengige og objektive datasett og metoder, anser vi disse fire uttrykk subtypene å få den godkjent.

Klare biologiske prosesser og likheter til Lung Plateepitelkarsinom

uttrykk mønstre som finnes i subtyper foreslå tilstedeværelsen av grunnleggende forskjeller i den underliggende biologi av de tilknyttede tumorer (Tabell S2). Genekspresjon i BA viste en sterk likhet med den signatur som finnes i basal celler fra den humane luftveisepitel, inkludert høy ekspresjon av gener som for eksempel

COL17A1, etter som er forbundet med den ekstracellulære matriks, vekstfaktor-reseptor og

TGFa Hotell og

EGFR

, og transkripsjonsfaktoren

TP63 product: [14]. Tumorer i MS ble eksemplifisert ved forhøyet ekspresjon av gener assosiert med epithelial-til-mesenchymale overgang (EMT), inkludert mesenchymale markører

VIM

og

DES

, transkripsjonsfaktor

TWIST1

, og vekstfaktor

HGF product: [15], [16]. AT svulster hadde en sterk HPV + signatur, noe som gjenspeiles ved forhøyet uttrykk for

CDKN2A, LIG1

, og transkripsjonsfaktoren

RPA2 product: [17]. Svulster i CL, subtype med den tyngste røyking historie, viste høy uttrykket av gener assosiert med eksponering for sigarettrøyk, inkludert xenobiotisk stoffskiftet gener

AKR1C1 /3 Hotell og

GPX2 product: [7], [18], [19] og transkripsjonsfaktoren

NFE2L2 product: [10]

plateepitelkarsinom fra forskjellige steder i kroppen deler en rekke molekylære egenskaper -. f.eks tap av kromosom 3p og gevinst på kromosom 3Q [20], [21] – så vi en hypotese om at en korrespondanse mellom våre uttrykk subtyper og nylig rapportert lunge plateepitelkarsinom (LUSC) uttrykk subtyper [7] ville bli observert. For å undersøke et bredere fenotype av plateepitelkarsinom i øvre aerodigestive kanalen, utvidet vi tyngdepunkt prediktor metodikk og evaluert korrespondanse centroids fra LUSC og HNSCC (figur 1D). Bemerkelsesverdig var det en klar mønster av korrelasjon observert i hvilken BA, MS, og CL subtyper av HNSCC samsvarer med LUSC basal, sekretoriske, og klassiske undertyper, henholdsvis, av Wilkerson et al. [7]. Undersøkelse av TCGA LUSC data [10] gitt ekstra overbevisende bevis for de underliggende sammenhenger mellom uttrykket subtyper ved de to svulst områder (figur S2). Korrespondansen mellom basal subtyper er bemerkelsesverdig fordi Wilkerson et al. [7] beskrevet tidsforløps forsøk med dyrkede humane bronkiale epitelceller som genuttrykksmønster på tidlige tidspunkter viste en sterk likhet med de som ble sett i basal subtype av LUSC. Likeledes, som vist i Tabell S3, observerte vi at de basale subtypen av HNSCC er mest lik den dag tre tidspunkt i tidsforløpet av data fra luften væske-grensesnittet (ALI) modell [22].

DNA Kopier Analyse av Undergruppe

Vi snudde oppmerksomheten mot de genomiske endringer av HNSCC målt ved kopi nummer (CN) arrays. Først bekreftet vi mange regioner som tidligere rapportert som endret på HNSCC, inkludert gevinst av kromosomer 3Q, 7p, og 11q (statistisk signifikante gevinster sett i både 11q13 og 11q22) og tap av kromosomer 3P, 9p, og 14q (tabell S4). Som det har blitt vist i andre tumorer [11], er det både samstemmige og uharmoniske mønstre av kopiantallet endring i viktige regioner av genomet som en funksjon av tumor subtype (figur 2, tabell S5). For eksempel gevinster av 3. kvartal varierer fra uttrykket subtype (p = 0,01), mens ingen signifikante CN forskjeller mellom subtypene ble påvist i 11q13, som inneholder

CCND1 product: (p = 1). Den kanoniske HNSCC 7p gevinst skjedde i en region som inneholder

EGFR

, men disse endringene ble funnet i BA, MS, og CL, ikke AT (p = 0,01). CN verdier i 3p var ikke signifikant forskjellige på tvers av undertypene (p = 0,47). Tap av 9p regionen som inneholder

CDKN2A

ble funnet i BA og bare CL, og CN forskjellene var signifikante (p = 0,01). Focal CN tap ble funnet i 14q32 for MS, CL, og er spesielt uttalt i AT, men selv om dette ikke ikke statistisk signifikans. Denne regionen inneholder miR203, noe som er bemerkelsesverdig fordi den er rettet mot ΔNp63 [23], en av seks proteinprodukter av

TP63

. Kromosomal ustabilitet også varieres betydelig ved å undertype (p = 2.2E-4), som vist i figur S3.

plott av det midlere kopitallverdier i HNSCC uttrykk subtyper etter glatting og avvikende fjerning, både genom-wide (A) og for spesifikke kromosomer eller regioner av interesse (B).

Kopier nummer endringer og differensial uttrykket av gener i kromosom 3Q av Expression Undergruppe

En av de mest typiske genomisk endringer assosiert med plateepitelkarsinom er gevinst på 3Q [20], [21], og i forrige avsnitt bemerket vi at CN verdiene i denne regionen varieres ved uttrykk subtype. Interessant, var det en tydelig differensial proporsjonal bruk av de tre genene vanligvis omtalt som målene i amplicon:

TP63, PIK3CA, etter og

SOX2 plakater (figur 3). CL og AT subtyper demonstrert forholdsmessig høyere uttrykk for

SOX2

forhold til MS og BA, som faktisk viste seg å uttrykke mindre

SOX2

enn normalt mandel kontroller. I motsetning til dette BA subtype uttrykt dramatisk høyere nivåer av

TP63

enn noen annen gruppe. På samme måte, selv om MS undertype oppviste kopitall gevinst i 3Q ingen av de antatte målgener ut til å bli uttrykt ved et nivå høyere enn normalt mandel. Kruskal-Wallis tester viste at uttrykk for hver av

TP63, PIK3CA, etter og

SOX2

ble forbundet med uttrykket subtype etter Bonferroni justering for multippel testing (tabell S6). Denne observasjonen øker muligheten for at heterogenitet HNSCC kan delvis forklares med differensial bruken av transkripsjonsfaktorer (

SOX2 Hotell og

TP63

) og onkogen (

PIK3CA

) i 3Q amplikon, som er mer kompleks enn det som har vært tidligere rapportert [24]. Det foreslår også at differensial bruk av transkripsjonsfaktorer og onkogener, fremmet delvis av forskjellige eksemplar nummer endringer, kan bidra til genekspresjonssignaturer som definerer uttrykket subtyper.

Mean genspesifikke kopi nummer og genekspresjon verdier i HNSCC uttrykk subtyper og normal mandel prøver (NL) for gener i 3Q amplicon.

Kopier Antall hendelser med Canonical kreftgener

vi har tidligere bemerket at kopitallverdier i gevinst og tap regioner var assosiert med uttrykket subtype. Nå beskriver vi lignende funn som ble innhentet da genspesifikke kopi tallverdier for gener som er kjent for å spille en rolle i HNSCC –

CCND1, CDKN2A, etter og

EGFR Anmeldelser – ble vurdert, ikke den bredere områdene omtalt ovenfor. I diskusjonen ovenfor uttalt vi at gevinster av 11q13 var ikke signifikant forskjellig på tvers av undergrupper, og tabell 2 viser at lignende resultater ble funnet ved oppmerksomhet ble begrenset til gevinster på

CCND1

. I motsetning til dette, hyppigheten av

EGFR

gevinst varierte fra 0% i AT til 31% i CL (p = 0,069), mens frekvensen av

CDKN2A

tap varierte mellom 10% MS til 63% i CL (p = 0,004). Begge disse funnene er konkordant med funnene i de bredere områder av 7p og 9 p, henholdsvis, er beskrevet ovenfor.

Tidligere studier har påvist sammenhenger mellom ulike genomiske hendelser, og disse funnene gitt innsikt i enten liggende biologi eller den kliniske behandlingen av kreftpasienter [25], [26]. I HNSCC, samtidige

CCND1

gevinster og

CDKN2A

tapene har blitt studert av Okami et al. [27] og Namazie et al. [28], med Namazie et al. påvise en sammenheng mellom disse genomiske arrangementer. Vi fant ut at

CCND1

CN gevinster ble assosiert med

CDNK2A

tap over alle undergrupper (Tabell S7), og at den felles arrangement var forbundet med uttrykket undertyper (tabell 2), og befester og utvide resultatene av Namazie et al.

Kliniske resultater av Expression Undergruppe og Focal Genomisk Endringer

etter å ha analysert den sett av nesten 140 HNSCC svulster i uttrykk subtyper, og i lys av kjente risikofaktorer slike som HPV, røyking og alkoholbruk, vurderte vi om ytterligere stratifisering for pasientens utfall kan bli foreslått. Vi først undersøkt om overlevelse fordel rapportert av Chung et al. for «subtype 1» kunne gjengis i dagens kohort. Vi klarte ikke å bekrefte dette resultatet, og i den aktuelle studien var det ingen sammenheng mellom tilbakefall overlevelse og tumor subtype, enten samlet (figur 4A) eller når vi begrenser til sent stadium pasienter (ikke vist). Disse forskjellene kan forklares med den kliniske heterogenitet av sykdommen kombinert med det faktum at svulsten språk utdelinger i de to studiene er svært ulike.

Kaplan-Meier plott og log-rank test p-verdier sammenligner tilbakefall-fri overlevelse ganger i alle uttrykk undergrupper (A), HPV + vs HPV fag (B), alle uttrykk undergrupper i HPV-fag (C), og AT vs ikke-AT i HPV-fag (D). Statistisk signifikans ble vurdert ved hjelp av logg Rank Test.

For å avklare om kjent eller mistenkt confounders kan ha påvirket vår evne til å oppdage subtype spesifikke forskjeller i pasientenes prognose, vi evaluert effekten av HPV-status på total overlevelse. Vi har observert en forholdsvis stor, men upresist effekt på grunn av den generelle lite antall HPV + pasienter (figur 4B). Vi vurderte det derfor rimelig å revurdere kohorten med HPV + pasienter ekskludert. Utelukkelse av HPV + pasienter viste at AT gruppen viste en spesielt ugunstig resultat (figur 4C), og denne forskjellen var statistisk signifikant sammenlignet med alle andre undergrupper kombinert (Figur 4D). Vi åpnet et uavhengig sett med 122 vev microarray (TMA) prøver i et forsøk på å validere dette funnet. Fordi arraybasert GE og immunhistokjemi (IHC) fargeverdiene ikke er sammenlignbare, det var ikke mulig å forutsi den tumor-subtypen av hver prøve TMA. I stedet brukte vi lav EGFR og høy p16 flekker som en proxy for AT status. Forskjellen i overlevelse ganger var ikke statistisk signifikant, men vi oppnådd resultater som ligner de som er beskrevet ovenfor (figur S4).

Vi undersøkte også om eventuelle brennkopitall hendelsene var assosiert med klinisk utfall. Tidligere studier har påvist en sammenheng mellom CCND1 gevinster og redusert tilbakefall overlevelse ganger i HNSCC [29]. Vi har fått lignende funn når vi undersøkte CN verdier for alle tumorprøver (figur S5), selv om våre resultater er marginalt signifikant (p = 0,07). Bemerkelsesverdig få AT fagene utstilt

CCND1

gevinster (tabell 2), og dette tyder på tilstedeværelsen av to i stor grad ulike grupper av pasienter med dårlige kliniske resultater: de med

CCND1

gevinster og de som er HPV – og AT. Figur S6 støtter denne konklusjonen.

Expression Subtyper i modellsystemer

The Cancer Cell linje Encyclopedia [30] inneholder genomiske data fra over 900 humane kreftcellelinjer, inkludert både GE og CN data fra 19 esophageal og 18 øvre aerodigestive veiscellelinjer. Vi søkte vår Tyngdepunktet prediktor til GE data fra disse cellelinjer og funnet ut at alle fire uttrykk subtypene var til stede (tabell S8). Disse funnene er spesielt overbevisende i lys av den kliniske betydningen av uttrykket subtyper fordi de gir grunnlag for fremtidige studier med modellsystemer. Figur S7 gir eksempler for å illustrere at subtype-spesifikke CN hendelser er også sett i cellelinjene

Diskusjoner

Vårt primære resultatet var påvisning av fire genuttrykk subtyper i HNSCC -. Basal, mesenchymale , atypisk, og klassisk. Vi viste også at disse subtyper har biologisk og klinisk relevans, og derfor gir de en nyttig og informativ mekanisme for å klassifisere HNSCC svulster som utfyller eksisterende metoder basert på histologi og svulststedet. Analyse av offentlig tilgjengelige ekspresjonsvektorer datasett avdekket at disse subtyper er reproduserbare i HNSCC [8] og er bemerkelsesverdig lik dem som finnes i LUSC [7], [10]. Selv genuttrykksmønster for sekretorisk LUSC subtype er lik de sett i mesenchymale subtype av HNSCC, favoriserer vi en alternativ nomenklatur. Data bekrefter den kjertel opprinnelsen til HNSCC er mindre overbevisende i forhold til den til lungen, og tegn på en mesenchymale signatur er rikt [7]. Selv om det ville være mulig å bruke eksisterende data til å produsere et gen prediktor for HPV-status, hadde vi ikke forsøke å gjøre dette fordi resultatene av denne art ble presentert av Martinez et al. [31]. Regioner av tilbakevendende DNA-kopi nummer gevinst og tap ble oppdaget, og noen av dem inneholder kjente onkogener og tumor dempere. De kopitallverdier i bestemte avvikende områder var assosiert med tumorundertype, noe som antyder at kopi antallet hendelser kan bidra til utviklingen av ekspresjonssystemer subtyper. Alle uttrykk subtyper ble påvist i HNSCC cellelinjer, et funn som gir grunnlag for fremtidige studier.

Vi har nå kort diskutere definisjonene av uttrykket subtyper. Basal og klassisk ble valgt fordi de uttrykk mønstre i disse subtypene viste sterke likhetstrekk med de basale og klassiske undergrupper av LUSC. Wilkerson et al. sammenlignet uttrykk mønstre i LUSC subtyper til annen kurs data fra å utvikle menneskelige bronchial epitelceller, og de fant at de basale subtype hadde lignende uttrykk mønstre til de sett på tidlige tidspunkter når basal celler er mest vanlig. Likeledes, som vist i Tabell S2, observerte vi at de basale subtypen av HNSCC er mest lik den dag tre tidspunkt i tidsforløpet av data fra ALI modell [22]. Den klassiske subtype viser kanoniske genomisk endringer i forbindelse med plateepitelkarsinom – f.eks sletting av 3p og 9 p, forsterkning av 3. kvartal, og focal forsterkning av både

EGFR Hotell og

CCND1

. Mesenchymale ble valgt basert på sti-analyse som indikerer en epitelial til mesenchymale overgang. Endelig atypisk ble valgt på grunn av mangel på enten

EGFR

forsterkning eller sletting av 9 p.

forskjeller i uttrykk mønstre funnet i undergrupper er klinisk relevant.

TP63

produserer seks forskjellige proteiner, og ΔNp63 er den mest tallrike isoformen i HNSCC [32]. Yang et al. [33] viser at ΔNp63 fremmer celledeling. Chatterjee et al. [32] bemerkes at eksponering for cisplatin førte til redusert nivå av ΔNp63, slik at denne behandling kan være spesielt effektiv for pasienter i BA. Barbieri et al. [34] viste at tap av

TP63

i HNSCC cellelinjer førte til anskaffelse av en mesenchymale fenotype, som er overbevisende i lys av de lave nivåer av

TP63

sett i MS. Martin og Cano [35] viste at forhøyet uttrykk for

TWIST1

eller

BMI1

i HNSCC cellelinjer kan øke sannsynligheten for invasivitet og migrasjon. Fordi MS svulster viste en EMT fenotype og økt uttrykk av både

TWIST1 Hotell og

BMI1

, kan disse fagene være mer sannsynlig å utvikle fjernmetastaser. Det faktum at

EGFR

er overuttrykt i de aller fleste HNSCC svulster [36] gjør

EGFR

hemmere et attraktivt alternativ behandling for denne sykdommen. Men disse behandlinger er mindre sannsynlighet for å være effektive i AT svulster fordi

EGFR

uttrykk var lavere enn i de andre uttrykk subtyper.

SOX2 Hotell og

ALDH1

ble sterkt uttrykt i AT og CL, og begge disse genene er mulige kreftstamcellemarkører på grunn av deres bidrag til selvfornyelse og en pleuripotent fenotype [37], [38]. Proteinproduktet av

PIK3CA

er p110α, som fosforylerer AKT. Aktivert AKT bidrar til overlevelse av tumorceller, og således onkogen transformasjon [39]. West et al. [40] har vist at eksponering av normale lunge epitelceller til nikotin muliggjør aktivering av AKT ved å gjøre den avhengig av PI3K alene. Denne observasjonen, kombinert med høye nivåer av røyking sett i CL, tyder på at PI3 kinase hemmere gir en attraktiv behandlingsalternativ for CL svulster.

Det var flere begrensninger i denne studien. Først må vi ikke har GE, CN, og kliniske data for alle forsøkspersonene, som begrenset vår evne til å i fellesskap analysere disse variablene. I tillegg, selv om subtype etiketter ble objektivt definert av en gruppering algoritme og genuttrykksmønster ble uavhengig validert, kliniske foreninger var ikke. Kopitallet matriser ble samlet for alle prøver med tilstrekkelig kvalitet og kvantitet av DNA. Dessverre, over 20% av arrays ikke klarte å oppfylle standardiserte kvalitet beregninger. Dessuten var det ikke klart hvilke isoform (r) av

TP63

ble analysert av våre genuttrykk arrays, og dessverre rollen som

TP63

spiller i basal subtype kan ikke være fullt verdsatt uten kunnskap av disse isoformer. På grunn av at HPV + prøver ble fjernet ved gjennomfører den sekundære overlevelsesanalyse, må disse resultatene bli sett på som utforskende og dermed må være uavhengig valideres. Endelig HPV status for alle pasienter var ikke tilgjengelig.

I konklusjonen, bekreftet vi fire molekylære klasser av HNSCC (basal, mesenchymale, atypisk, og klassisk), i samsvar med signaturer som er etablert for plateepitel karsinom i lungene. Ved hjelp av en integrert genomisk analyse og validering metodikk, dokumentert vi subtyper identifisert av kanoniske tumorsuppressorgener og onkogener, inkludert deregulering av

KEAP1 /NFE2L2

oksidativt stress vei, differensial utnyttelse av avstamning markører

SOX2

og

TP63

, og preferanse for de onkogener

PIK3CA Hotell og

EGFR

. For potensielle klinisk bruk, signaturene er gratis for klassifisering av HPV-infeksjon status samt den antatte høy risiko markør

CCND1

kopiere nummer gevinst. En molekylær etiologi for subtypene er foreslått av statistisk signifikante kromosomavvik og differensial celle opprinnelsesland uttrykk mønstre. Modell systemer representant for hver av de fire undertyper ble også presentert.

Materialer og metoder

Tumor Collection og genetiske analyser

Etter å ha mottatt skriftlig informert samtykke, fryst, kirurgisk pakket ut, macrodissected hode og nakke svulster ble samlet ved University of North Carolina i henhold Institutional Review Board protokollen # 01-1283. Tumor RNA ble ekstrahert og mRNA uttrykk ble analysert ved hjelp av Agilent 44k mikromatriser. Tumor DNA ble ekstrahert og DNA kopiantall ble analysert ved bruk av Affymetrix GenomeWide SNP 6,0 chips. Et sammendrag av alle genetiske data som brukes i denne studien kan finnes i tabell S9.

mRNA Expression Analysis

Kvalitetskontroll prosedyrer ble brukt på microarray probe-nivå intensitet filer. Totalt 138 kreft arrays igjen etter fjerning av lav kvalitet arrays, dupliserte matriser og arrays fra ikke-HNSCC prøver. Den normexp bakgrunnskorreksjon og løss normaliser [41] ble brukt til probe-nivå data. Etter logg

2 transformasjon, ble prober tilpasset et felles gen database for å produsere uttrykk verdier for 15597 gener.

Unsupervised Expression Undergruppe Disco

Den som beskrives her er lik det som dukket opp i Wilkerson et al. [7]. Etter uttrykk verdiene var genet median sentrert, ble genet variasjon beregnet ved hjelp av median absolusjon avvik. De 2500 mest variable gener ble valgt. ConsensusClusterPlus [12] ble brukt til å utføre uten tilsyn clustering for disse gener i de 138 matriser. Denne prosedyren ble utført med 1000 tilfeldig utvalgte sett av microarray prøver ved hjelp av et utvalg andel på 80% og en avstand metrisk lik en minus Pearsons korrelasjonskoeffisient.

Statistiske Betydningen av genutrykksmønster i Expression Subtyper

for å bekrefte den statistiske betydningen av fire klynger, SigClust [13] ble påført ved hjelp av sett av de 2500 mest variable gener som er beskrevet ovenfor. Alle parvise sammenligninger av subtypene ble undersøkt ved hjelp av 1000 simulerte prøver og den opprinnelige kovarians beregningsmetode.

Forskjellig uttrykte gener og metabolske veier

Forskjellig uttrykte gener ble påvist med R-pakken samr [42] ved hjelp av en median FDR terskel of.01. For hver av de UNC subtyper sammenlignet vi genekspresjon verdiene i undertypen til alle andre subtyper kombinert. DAVID [43] ble deretter brukt for å finne KEGG veier som viste berikelse for de høyt uttrykte gener i hver subtype. I tillegg uttrykt forskjellig gener med kjente funksjonelle kategorier, f.eks transkripsjonsfaktorer, ble funnet ved å sammenligne subtype-spesifikke genet liste til kjente genet ontologi kategorier [44].

Publisert Expression data

De microarray probe-nivå intensitet filer produsert av Chung et al. [8] ble utsatt for bakgrunnskorrigering, normalisering, og gen-nivå summarization fremgangsmåter som ligner de som er beskrevet ovenfor. Dette ga genuttrykk verdier for 60 fag og 8224 gener. De subtype etikettene for disse 60 arrays som dukket opp i [8] er referert til som Chung subtyper 1, 2, 3 og 4.

Oppsummering RPKM verdier for 20,502 gener og 178 personer ble innhentet basert på RNASeq data presentert i [10]. De RPKM verdiene var log

2 transformert, og hvilket som helst gen som inneholdt minst en manglende verdi ble fjernet fra analysen. Dette ga genuttrykk verdi for 15,314 gener.

Validering av Expression Subtyper

Konsensus clustering tildeler en subtype etikett til hver array. Som et resultat av dette kan enkelte matriser ikke være representativ for deres subtype. Bruke silhouette bredder [45], identifiserte vi et sett av 125 «kjerne» prøver hvis uttrykk mønstre var mer lik de medlemmer av sin egen subtype enn andre subtyper. ClaNC [46], en klassifisering metode basert på nærmeste centroids, ble deretter anvendt på UNC uttrykk data fra kjerneprøver i et forsøk på å skape et sett med Klassifiserings gener hvis ekspresjon signaturen kan brukes til å klassifisere nye prøver. Minimerer kryssvalidering feilrate produsert en liste over 840 Klassifiserings gener (210 gener per subtype).

Vi identifiserte sorter gener hvis uttrykk verdier er også til stede i Chung uttrykket datasettet, og deretter begrenset UNC og Chung uttrykk datasett til disse genene. Etter gen median sentre hvert datasett for seg, fant vi det geometriske tyngdepunkt for hver av UNC og Chung undertyper ved å beregne medianverdien uttrykket for hvert gen i løpet av alle matriser som har den passende subtype etiketten. Som i [7], avstandene mellom UNC og Chung centroids ble beregnet ved hjelp av en avstand metrisk lik en minus Pearsons korrelasjonskoeffisient. Denne valideringsprosessen ble gjentatt ved bruk av LUSC data fra Wilkerson et al. [7]. De RNASeq data fra [10] ble håndtert på samme måte med følgende forskjeller: (i) genuttrykk verdier fra UNC og logge

2 (RPKM) verdier fra TCGA datasett ble separat median sentrert og standardisert av genet, (ii)

Legg att eit svar