PLoS ONE: Meta-analyse av genuttrykk signaturer Definere Epitelial å Mesenchymale Transition under Cancer Progression

Abstract

epitelial til mesenchymale overgang (EMT) representerer en viktig hendelse i løpet kreft progresjon og formidling. EMT er omdannelsen av karsinomceller fra en epitelial til en mesenchymal fenotype som forbinder med en høyere celle motilitet samt forbedret chemoresistance og kreft stemness. Spesielt, EMT har blitt stadig mer anerkjent som en tidlig tilfelle av metastaser. Tallrike genuttrykkstudier (GES) har blitt gjennomført for å skaffe transkriptom signaturer og markørgener for å forstå de regulatoriske mekanismene bak EMT. Likevel har ingen meta-analyse med tanke på mangfoldet av GES av EMT er utført omfattende utdype kjerne gener i denne prosessen. Her rapporterer vi meta-analyse av 18 uavhengige og publisert GES av EMT som fokuserte på ulike celletyper og behandlingsmetoder. Beregnings analyse viste gruppering av GES i henhold til typen av behandling i stedet for til celletype. GES av EMT indusert via transformerende vekstfaktor-β og tumor nekrose faktor-α behandling, ga enhetlig definert klynger mens GES av modeller med alternative EMT induksjon gruppert på en mer kompleks måte. I tillegg har vi identifisert de opp- og downregulated gener som ble delt mellom de mange GES. Denne kjernen genet listen inneholder også kjente EMT markører samt nye gener så langt ikke er beskrevet i denne prosessen. Videre er det flere gener av EMT-core genet liste signifikant korrelert med nedsatt patologisk komplett respons hos brystkreftpasienter. Som konklusjon, gir denne meta-analysen en omfattende undersøkelse av tilgjengelige EMT uttrykk signaturer og viser grunnleggende innsikt i de mekanismene som styrer carcinoma progresjon

Citation. Groger CJ, Grubinger M, Waldhör T, Vierlinger K, Mikulits W (2012) Meta-analyse av genuttrykk signaturer Definere Epitelial å Mesenchymale Transition under kreft progresjon. PLoS ONE 7 (12): e51136. doi: 10,1371 /journal.pone.0051136

Redaktør: Olivier de Wever, Ghent University, Belgia

mottatt: 28 juni 2012; Godkjent: 29 oktober 2012; Publisert: 10.12.2012

Copyright: © 2012 Groger et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av EU, FP7 Health Research, prosjektnummer HELSE-F4-2008-202047. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

epitelial til mesenchymale overgang (EMT) er opprinnelig beskrevet som en viktig prosess med metazoan embryogenese [1]. I det siste tiåret har EMT blitt realisert som en kritisk hendelse i carcinoma progresjon som epiteliale kreftceller få en mesenchymale fenotype som tillater dem å løsne fra den primære svulsten og å invadere i den lokale vev [2]. Generelt er polariserte epitelceller organisert av celle-celle og celle kryss-forankrings- komplekser for å danne apikale og basolaterale overflate. I motsetning til dette danner mesenchymale celler irregulært formede strukturer i fravær av tette adhesjoner til nabocellene og redusert celle-kontakt til underlaget. Mesenchymale celler har en langstrakt form i forhold til epitel og vise en anterior-posterior polaritet som muliggjør forbedret migrasjon gjennom redusert vedheft styrker. Mens epitelceller invadere samlet i klynger, mesenchymalceller viser enkelt celle bevegelse som gir dem mulighet til å formidle fra bulkceller [3]. I tillegg er en delvis EMT som viser forskjellige nivåer av E-cadherin ekspresjon er blitt observert som kan fremdeles føre til kollektiv celle invasjon [4].

EMT er blitt klassifisert i tre subtyper [5]. Type 1 EMT er nødvendig for embryogenese å gi gastrulation og dannelse av neural crest celler som skiller inn i forskjellige celletyper uten systemisk spredning. Type 2 EMT er involvert i vev regenerering og fibrose av forskjellige organer slik som nyre, lever, lunge og tarm som fører til opphopning av bindevev. Skriv 3 EMT forbinder med en gevinst på malignitet av carcinoma celler. Neoplastiske epiteliske celler indusert til å gjennomgå EMT er ofte lokalisert på invasiv forsiden av primærtumor og initiere den kaskade av tumorcellespredning ved lokal celle invasjon som er etterfulgt av posten inn i vaskulaturen. Spesielt, representerer EMT en forbigående og reversibel prosess som kan føre til en mesenchymale til epitel overgang (MET) ved metastatisk kolonisering [5]. Sykluser av EMT og MET antas å være involvert i metastase formasjon ved distale områder [3]. Likevel er det molekylære grunnlaget for endringene i epitel plastisitet av EMT og MET fortsatt et åpent spørsmål, og dens rolle i kreftpasienter er et spørsmål om debatt. Signalmolekyler og induktorer av type 3 EMT gi motstanden av kreftceller til apoptose og oncogen-indusert begynnende alderdom, så vel som chemoresistance [6]. Nyere funn tyder på at EMT gir mesenchymalceller med stamcelle funksjoner som gjør carcinoma celler til å generere metastaser på videregående nettsider [3]. Disse kreft stamceller, også kalt kreft initiere celler, dele fenotypiske og funksjonelle egenskaper med trekk embryonale celler som viser en mesenchymale fenotype [6].

Profilering av transkriptomet ved hjelp av mikromatriser har blitt mye brukt for å belyse de uttrykk mønstre i løpet EMT under ulike forhold som avdekkes nye biomarkører og molekylære mekanismer fra enkeltstudier. En meta-analyse beskriver vanligvis en kombinasjon av et stort antall studier fra forskjellige prøver og vev eller sammenligning av egne data med publiserte data [7], [8]. Framskritt i etableringen av genuttrykk datasett gjør det mulig å identifisere nye markører og relevante mekanismer som ble undervurdert i enkeltstudier, men har kommet fram til en meta-analyse. Ved å nå en mengde genuttrykkstudier (GES) som dekker et bredt spekter av celletyper som gjennomgår EMT sammen med ulike former for induksjon er tilgjengelige. Likevel så vidt vi vet, har ingen meta-analyse arbeider med disse EMT studier utført hittil.

Endringer i et biologisk system krever en samordnet endring av genuttrykk sett. Bioinformatiske verktøy berikelse analyseverktøy undersøke genekspresjon sett for slike endringer. Disse verktøyene undersøke overrepresentasjon av gensettene i forhold til hele genomet, kart en inngang liste av gener til biologiske kategorier i online databaser og statistisk vurdere overrepresentasjon av gener for hver biologisk kategori eller merknad som Kyoto Encyclopedia of gener og genomer (KEGG ) trasé og genet ontologi (GO) termer [9]. Bruken av flere enkelt berikelse verktøy for samme inngang listen og hensynet til bare konsekvent beriket kategoriene har blitt rapportert å være en meget lovende strategi [10], [11].

Vi har samlet data fra 18 publiserte og uavhengige GES av EMT og hentet genet lister over betydelig opp- og downregulated gener for klyngeanalyse. Denne fremgangsmåten viste gensamlingene ifølge behandlingsmetoder i stedet for til celletype. Vi har senere hentet en EMT-core liste bestående av 130 gener med offisielle genet symboler og navn som ble ytterligere undersøkt ved anriking analyse med flere enkelt berikelse verktøy. Spesielt utvalgte gener fra EMT-core liste signifikant korrelert med nedsatt patologisk komplett respons (PCR) i brystkreftpasienter. Denne analysen foreslår at EMT-core genet listen er relevant for anerkjennelsen av de molekylære mekanismene for EMT. I tillegg viser klyngeanalyse romanen innsikt i relasjoner av EMT prosesser på tvers av ulike celletyper og induksjon moduser.

Resultater

Datainnsamling fra genuttrykkstudier (GES)

for å vurdere likheter mellom publiserte GES og definere en kjerne gen liste over menneskelig EMT, analyserte vi 18 uavhengige GES av EMT. Disse 18 uavhengige og publisert GES besto av 24 datasett totalt (tabell 1). Flere forfattere rapporterte EMT kinetikk i ulike celletyper eller doseavhengige effekter av EMT indusere innenfor enkeltstudier. Ikke desto mindre, bare den bestemte testpunkt som viser den sterkeste effekt eller EMT fenotype, som rapportert av forfatterne, er blitt valgt. Takahashi

et al.

Utgitt to beslektede GES, hvorav den ene besto av to datasett, noe som resulterer i tre datasett fra en uavhengig studie [12]. Taube

et al.

Rapportert 5 datasett publisert i løpet av en GES med liknende uttrykk mønstre og forskjellige moduser av EMT induksjon [13]. Bearbeidede data (normaliserte og generelt logarithmized data) ble lastet ned fra Gene uttrykket Omnibus (GEO) og ArrayExpress (AE) databaser og merket med BioConductor og NetAffx. Mange GES, tilgjengelig på GEO og AE, ble ekskludert fordi de enten ikke gi behandlet data eller ikke inneholde replikater eller ikke har blitt publisert. På grunn av den forskjellige mikroarray formater, så vel som forskjellige normalisering og filtreringsmetoder brukt i litteraturen, anvendte vi behandlet i stedet for rå data for å opprettholde kvalitetskriteriene anvendt av forfatterne under data preprosessering. Tosidige Student

t

-test ble brukt til å beregne p-verdier. Betydelig opp- og downregulated genene ble valgt for å møte en fold endring større enn 2 eller lavere enn 0,5 og en p-verdi under 0,05.

GES klyngeanalyse

Vi ga en matrise inneholder genet symboler på tvers av de analyserte GES (n = 14,113) som er unikt rapportert. Betydelig opp- og downregulated gener av hver GES ble overført til matrisen i henhold til type av regulering. Oppregulert gener ble merket med en, downregulated gener med -1 og ikke ulikt regulert gener med 0 (tabell S1). Denne informasjonen distribusjon besto av 88,22% ikke forskjellig regulert gener og 11,78% opp- eller nedregulert gener og er betydelig annerledes enn en binomisk fordeling med disse parametrene (p 0,0001). For å bestemme en cutoff for antall GES deling av et bestemt gen som brukes for klyngeanalyse, binomial fordeling funksjon fra R, så vel som de foreløpige hierarkiske clustering resultatene fra hver opsjon cutoff ble analysert (data ikke vist). Fra dette bestemte vi oss for å undersøke gruppering av genene felles mellom minst 10 datasett (n = 365; p 0,0001, figur 1). I tillegg viste denne analysen klynger av GES i henhold til modusen av EMT stimulus i stedet for til celletype (figur 2A). Interessant nok en mer stringent gruppering av gener som deles mellom minst 14 av de analyserte GES datasettene tilgjengelig lignende grupper, til tross for det faktum at denne listen bare inneholder 41 gener (figur 2B og fig S1).

Genes delt mellom i det minst 10 av 24 datasett ble brukt til Manhattan hierarkisk clustering. Den type regulering innenfor en bestemt studie ble visualisert via heatmap. Kolonner: gener delt mellom minst 10 datasett (n = 365); rekker: analysert GES (24 datasett totalt); grønne: downregulated gener; red: oppregulert gener; svart: gener ikke regulert. GSE: Gene uttrykk studenter (GEO) serie rekord; E.TABM: ArrayExpress (AE) serie rekord; TGF, transformerende vekstfaktor; TNF, tumornekrosefaktor.

celletype og behandlingsform av EMT ble merket og avslørt clustering i henhold til modusen for EMT induksjon. Clustering vedvarte når gener som deles mellom minst 14 GES datasett som ble brukt for analyse. (A) Hierarkisk clustering av 365 gener delt mellom minst 10 datasett. (B) Hierarkisk clustering av 41 gener som deles mellom minst 14 datasett. Legenden indikerer celletype og behandlingsform (høyre panel). *, transkripsjonsfaktor vektorer: Runx2, Six1, sneglen, Twist og Goosecoid. GSE: Gene uttrykk studenter (GEO) serie rekord; E.TABM: ArrayExpress (AE) serie rekord; TGF, transformerende vekstfaktor; TNF, tumornekrosefaktor.

Generering av EMT-core genet liste

Basert på klyngen analyse av GES, rettet vi definere en menings EMT-core genet liste som beskriver de fleste av de involverte gener på tvers av de analyserte GES. Klyngeanalyse av genene delt mellom i det minste 10 datasettene inneholdt 365 gener (tabell S2). Men det betyr ikke vise om et gen er opp- eller nedregulert på tvers av ulike GES. Derfor listen ble filtrert for å beholde bare gener som var enten opp- eller nedregulert i minst 10 av de GES datasett. Den resulterende listen inneholdt 130 gener som 67 er oppover- og 63 er nedregulert (Tabell 2 og Tabell S3). Dette utvalget av gener kan videre klassifiseres i fem kategorier ((i) celle adhesjon og migrasjon, (ii) utvikling, celledifferensiering og spredning, (iii) angiogenese og sårheling, (iv) metabolisme, (v) andre eller kategorier) ifølge enkelt anrikning analyse som beskrevet nedenfor. Flere gener var også til stede i mer enn en av disse kategoriene (Tabell S3). Som konklusjon, dette resulterer EMT-core genet Listen inneholder 130 gener som ble avledet fra en rekke celletyper og EMT innvielses metoder.

Jevnt beriket KEGG sti og GO sikt analyse av EMT-core-genet listen

for ytterligere analyse av EMT-core liste bestående av 130 gener, ble en streng enkelt berikelse analyse kombinert med strenge kriterier utvalgs utført. Først en anriket KEGG sekresjonen eller GO sikt måtte inneholde minst 5 gener fra inngangslisten og en p-verdi under 0,05 anses som signifikant. En opplisting av betydelig beriket vilkår og trasé er vist i Tabell 3. For det andre, en betydelig beriket KEGG gangsti eller GO sikt måtte bli observert i minst 4 av 5 brukte bioinformatiske verktøy. For det tredje, en konsekvent beriket KEGG gangsti eller GO sikt måtte bli identifisert i både EMT-core genet listen og 365 genet listen. Ved hjelp av disse kriteriene, fikk vi 6 KEGG trasé, 20 GÅ biologiske prosesser og 15 GÅ molekylære funksjoner konsekvent anriket på begge listene (tabell 4). De KEGG trasé besto av MAPK signalveien, axon veiledning, brennvidde heft, ECM-reseptor interaksjon, regulering av aktin cytoskjelettet og stier i kreft. Farten biologiske prosesser kan grupperes i prosessene som er involvert i vev utvikling, sårheling, cellemigrasjon eller celleproliferasjon. Farten molekylære funksjoner besto av ECM og cytoskjelett bestanddeler, peptidaseinhibitorer og binding av kollagen, vekstfaktorer, heparin og inte. Som forventet, listen med 365 gener omfattet alle betydelig beriket stier og GO vilkår fra 130 gener EMT-core liste med unntak av to GÅ biologiske prosesser (ECM organisering og lunge utvikling). Flere flere KEGG trasé, GÅ biologiske prosesser og molekylære funksjoner kan bli identifisert på listen med 365 gener (Tabell 3 og 4). Alle disse banene, biologiske prosesser og molekylære funksjoner er vel kjent for å være involvert i EMT [5], [14] – [16], og således bekrefte integriteten til EMT-kjerne-genet listen. I tillegg finnes både EMT-core listen og listen med 365 gener vise sammenlign berikelse forholdstall på KEGG stier og gå biologiske prosesser (figur 3), samt gå molekylære funksjoner (Figur S2). Derfor kan listen inneholder 365 gener anses som en forbedring av EMT-core liste ved inneholder flere gener som kan ha en tvetydig rolle i EMT. Oppsummert vår EMT-core liste på 130 gener og sin forbedring inneholder 365 gener viser sterk berikelse av EMT-relevante prosesser.

berikelse forholdet er antall observerte gener delt på antall forventede gener for en gitt periode eller sti. Berikelse forhold ble innhentet fra WebGestalt eller beregnet med data fra FatiGO. GO, genet ontologi; BP, biologisk prosess; KEGG, Kyoto leksikon av gener og genomer.

Klinisk relevans av EMT-core genet liste

Den EMT-core genet Listen inneholder flere gener med ennå uidentifiserte roller i kreft progresjon og /eller EMT. Vi forsøkte å undersøke den kliniske relevansen av dette valget av gener. Derfor korrelert vi deres ekspresjon med total overlevelse av pasienter som lider av plateepitel celle lungekarsinom (SCC) [17] og patologisk fullstendig reaksjon (PCR) av brystkreftpasienter [18]. Fra downregulated gener EMT-core genet liste, lav FXYD3 uttrykk viste en trend til dårlig total overlevelse av SCC pasienter (p = 0,17) og lav uttrykk for LAD1 (p = 0,00074), SLC7A5 (p = 0,0093) og SLPI ( p = 0,043) signifikant korrelert med dårligere pCR av brystkreftpasienter. Fra oppregulert gener EMT-core genet liste, har en tendens til høy PTX3 uttrykk for dårlig total overlevelse av SCC pasienter (p = 0,16) og høy uttrykk for NID2 (p = 0,0091), SPOCK1 (p = 0,038) og SULF1 (p = 0,00029) signifikant korrelert med nedsatt pCR av brystkreftpasienter. Disse korrelasjonene viser at sammenligning av ulike datasett er et kraftig verktøy for å identifisere nye relevante mål gener som ikke kommer fra enkeltstudier.

Diskusjoner

I løpet av det siste tiåret et betydelig antall GES som omhandler EMT har vært samler i litteraturen. Disse dekker en rekke celletyper som viser EMT og omfatter forskjellige moduser av EMT induksjon. Så langt har disse ressursene har bare vært delvis brukt til å sammenligne enkelt resultater med de i litteraturen [8], [19], [20]. Så vidt vi vet, er det ikke gjort forsøk på å undersøke de fleste av de uavhengige GES av EMT for deres forhold til hverandre. Selv om vi er klar over at genuttrykk data av EMT er ikke komplett, analyserte vi den tiden tilgjengelig GES å generere en EMT-core liste av gener endret oftest i løpet av EMT prosessen, som vist i flytdiagrammet (figur S3).

Cluster analyse av gener som deles mellom minst 10 GES datasett avslørte klynger av GES med den samme eller en lignende behandling type. GES hvori EMT ble indusert av TNF-α enten alene eller i kombinasjon med TGF-β, av TGF-β alene eller med forskjellige transkripsjonsfaktorer gående gruppert sammen. Disse klyngene vedvarte når gener delt mellom i det minste 14 datasettene ble anvendt for klyngeanalyse. En klar gruppering av forskjellige typer av EMT induksjon, ville imidlertid ha bare vært mulig dersom et tilstrekkelig antall GES på hver av disse EMT initiering metoder eksisterte. Siden flere behandlingsformer er bare representert en gang i litteraturen, slik GES klynge til sin mest beslektet behandling typen.

En klynge overveiende oppsto fra GES av TGF-β-indusert EMT som besto av 13 datasett. Interessant, omfatter klyngen den eksogene ekspresjon av Six1 (Micalizzi

et al

; GSE23655, [20]), som har vist seg å øke tumor-fremmende TGF-β signalering, og Runx2 (Baniwal

m.fl.

; GSE24261, [21]) som virker på nedstrømssiden av TGF-β signalering [22] – [25]. Derfor støtter denne clustering av disse studiene sammen med andre ved hjelp av TGF-β som EMT initiator. Undersøkelsen av van Zijl

et al plakater (GSE26391; [26]). Rives analyse av epiteliale og mesenchymale leverkreft celler avledet fra samme tumor pasient. Den gruppering av denne studien sammen med andre studier med TGF-β-indusert EMT antyder en involvering av TGF-β signalering i løpet av opprettelsen av mesenchymale cellelinje.

klynge av GES med TNF-α som EMT induktor inneholdt studiet av Takahashi

et al.

som analyserte ARPE19 cellelinje behandlet med enten TNF-α alene (GSE15205_TNFa), TNF-a sammen med TGF-β (GSE12548) eller TGF-β alene (GSE15205_TGFb) for å indusere EMT [12]. De to datasett med TNF-α behandling dannet en konsekvent klynge. Men den tredje datasettet som ble oppnådd fra den eksklusive behandling med TGF-β gruppert til andre GES beskriver EMT initiering av TGF-β. . Derfor er disse data tyder på en sterkere effekt av EMT stimulans på clustering snarere enn celletypen

En klynge besto hovedsakelig av datasettene fra Taube

et al plakater (GSE24202;. [13 ]) som rapportert induksjon av EMT i HMLE celler ved hjelp av overekspresjon av Twist, snegle, Goosecoid og TGF-β samt knockdown av E-cadherin. I samsvar med de data som rapporteres av Taube

et al

, datasettene fra Snail- og Twist-indusert EMT var mest lik innenfor denne klyngen. Dette funnet er konkordant med at Twist er et direkte mål for Snail [27]. Det høye antallet datasett i denne studien kan føre til en overrepresentasjon innenfor klyngeanalyse. Videre kan bruken av den samme cellelinje, så vel som transkripsjonsfaktorer med tilsvarende mål som vri og snegl føre til en høy grad av likhet i datasettene fra denne studien.

klynge bestående av Ke

et al product: (E-TABM-949 [28]). som benyttes høy celletetthet dyrking av EPT2 celler og Ohashi

et al plakater (GSE27424 [29]). som beskrev en NOTCH3 knock-down i EPC2 celler viser en lav forhold til andre klynger på grunn av den unike typer av EMT induksjon. Det synes sannsynlig at på den ene side disse GES danne en klynge på grunn av manglende forhold til de andre klynger. På den annen side kan det også foreslå en slektning av sine typer EMT start også.

Vi fant en rekke kjente markører for EMT oppregulert i vår EMT-core-genet liste som CDH2, CDH11 , COL1A1, COL3A1, FBLN5, FN1, has2, LOX, MMP2, plattformer, SERPINE1, VIM, WNT5A og ZEB1 [15], [30], [31]. Videre, vi har oppdaget downregulated gener rapportert å være redusert i EMT som ANK3, CDH1, CXADR, PRSS8 og SYK [15], [32] – [34], flere downregulated epiteliale cellemarkører som EpCAM, JUP, KRT15, ​​KRT17, OCLN, PKP2 og PPL [5], [15] og en rekke downregulated tumor-suppressorer som KLK10, MTUS1, OAS1 og SERPINB1 [35] – [38]. Sammen utgjør disse genene gir en solid bekreftelse på vår EMT-core genet listen. I tillegg til disse genene bekrefter integriteten til genet liste, men gener med ukjente funksjoner samt en ukjent eller uklart forhold til kreft og /eller EMT dukket opp som er nye kandidater for videre undersøkelser. Oppregulert gener inkluderer MAP1B, NID2, PTX3, SPOCK1, SULF1, TAGLN og TMEM158 mens downregulated gener består ABLIM1, LAD1, FAM169A, FXYD3, SLC7A5, SLPI, TMEM30B og TPD52L1.

To meta-analyser av EMT i bryst kreft med tanke på forskjellige cellelinjer eller typer av EMT induksjon er blitt rapportert. Disse har identifisert EMT-kjerne-genet listene 200 og 251 gener [13], [39], men overlappende med omtrent 10% bare. Våre EMT-kjerne liste som inneholder 130 gener som viser en dårlig overlapping på 7% med en liste over Choi

et al.

[39], men en overlapping på 55% med Taube

et al.

[ ,,,0],1. 3]. Begge lister ved Choi

et al.

Og Taube

et al.

Inneholde kartlagte identifikatorer (IDS) som array-IDer, uttrykte sekvens koder og locus IDer. Vi brukte konsekvent beriket pathway analyse for å ytterligere undersøke disse gen-lister. Spesielt vises vår EMT-core liste mer beriket KEGG stier og GO vilkår enn genet lister over Choi

et al.

Og Taube

et al.

(Tabell 3 og 4). Ved å redusere nivåene av analysen til to gener innen en beriket Rimelig, berikelse for listen over Choi

et al.

Ble ikke bedre, mens nesten alle KEGG stier og GO vilkår beriket i vår EMT-core listen kan være observert i listen over Taube

et al.

(data ikke vist, tabell 4).

den EMT-core liste inneholder flere gener med ukjente funksjoner og relasjoner til kreft og /eller EMT. Vi var i stand til å vise at FXYD3 og PTX3 uttrykk er assosiert med dårlig generell pasient overlevelse i SCC pasienter og LAD1, SLC7A5, SLPI, NID2, SPOCK1 og SULF1 korrelerte signifikant med nedsatt PCR i brystkreftpasienter. FXYD3 har vist seg å være involvert i tumorcelle-proliferasjon og for å bli nedregulert ved TGF-β signalering [40], [41]. PTX3 har blitt rapportert å være en lungekreft biomarkør [42]. NID2 er blitt vist å være forhøyet i løpet av forbol-12-myristat 13-acetat-indusert invasjon av flere humane tumorcellelinjer og som en potensiell tumor biomarkør [43], [44]. SPOCK1 har blitt rapportert å være involvert i neuronal feste og matriks-metalloproteinase-aktivering [45], [46]. SULF1 har vist seg å være en potensiell biomarkør for magekreft som kan induseres av TGF-β1 [47], [48]. LAD1 er en adapter protein som er involvert i ERK5 og JNK trasé [49]. SLPI er blitt rapportert å virke anti-tumorigen for visse tumorer, så vel som for å fremme migrering og invasjon i andre [50] – [52]. Derfor er disse genene synes å være lovende kandidater for videre undersøkelser. Til sammen foreslår at EMT-core liste på 130 gener er svært relevant for EMT og klyngeanalyse representerer en nyttig oversikt på relasjoner av tiden tilgjengelig GES av EMT.

Materialer og Metoder

Datainnsamling og annotering

Behandlet microarray data ble lastet ned fra hjemmesidene til GEO (tilgjengelig: https://www.ncbi.nlm.nih.gov/geo/) og AE (tilgjengelig: http: //www.ebi.ac.uk/arrayexpress/) ved hjelp av «EMT» som søkeord for publiserte GES til februar 2012. De nedlastede GES ble kommentert hente offisielle genet symboler, EntrezID og gen navn ved hjelp BioConductor 2.9 (tilgjengelig: http: //www.bioconductor.org/; vist: 2012 2.1) [53] og det elektroniske verktøyet NetAffx (tilgjengelig: https://www.affymetrix.com/analysis/index.affx; vist: 2012 25 juni). BioConductor ble brukt i R miljø [54]. Kommenterte data ble importert til MS-Excel 2010 og log2 forvandlet. Deretter fold endringer og p-verdier ved hjelp av tosidige Student

t

-test ble beregnet. Betydelig opp- og downregulated genene ble valgt ut og skilt fra hverandre når viser et ganger endring som er større enn 2 eller under 0,5, og en p-verdi under 0,05. Oppregulert gener ble beordret fra høyeste til laveste ganger endring. Vice versa, downregulated gener ble arrangert fra laveste til høyeste ganger endring. Duplikater ble fjernet etterpå. Gene symboler benyttes for videre analyse og vil bli referert til som gener.

Cluster analyse

De opp- og downregulated gener fra hver studie ble oppsummert, bestilt og duplikater ble fjernet for å oppnå en liste over alle unikt rapportert gener på tvers av alle studier. Oppregulert gener ble merket med en og downregulated gener ble merket med -1. Gener som ikke var signifikant deregulerte innenfor et GES og gener som ble funnet å være både opp- og nedregulert i løpet av en studie ble merket med 0. Fordelingen av det observerte antall opp- og downregulated-genene ble testet mot en binomial fordeling med parameter p = 11,78% ved hjelp av en chi-squared test. Vi beregnet mulighetene for å trekke alternativ hver cutoff for klyngeanalyse ( 1, 2, 3 og så videre) ved en tilfeldighet med binomisk fordeling funksjon fra R (sannsynlighet = 11,78%). Mulighetene for å trekke hvert alternativ cutoff ved en tilfeldighet ble sammenlignet med foreløpige klynge analyse av hver opsjon cutoff for å bestemme en passende cutoff. Den clustering ble utført i BioConductor 2.9 innebygd i R 2.14.1 (64 bit) med pakker gdata [55], gplots [56] og heatmap.plus [57] med hierarkisk heatmap clustering med Manhattan avstand funksjon.

Konsekvent berikelse av KEGG stier og GO vilkår

De genet listene ble analysert ved hjelp av fem ulike bioinformatiske berikelse verktøy. En omfattende oversikt over de brukte verktøy og deres egenskaper er vist i tabell S4. Verktøyene FatiGO og GeneCodis ble brukt på Babelomics 4 plattformen [58], som ga tilgang til både programmer samtidig. Utvalgskriteriene for betydelig beriket trasé var en p-verdi eller FDR under 0,05 og minimum 5 gener av inngangs liste innenfor en beriket kategori. Videre ble konsekvent beriket GO vilkår og KEGG trasé identifisert i minst 4 av 5 programmer i både EMT-core genet listen og 365 genet listen. Berikelse forholdstall (antall observerte gener delt på antall forventede gener for en GO eller KEGG kategori) har blitt oppnådd ved WebGestalt, eller alternativt, er beregnet som beskrevet av Zhang

et al.

Med data fra FatiGO [59].

Korrelasjon av EMT-core liste med kliniske data

Microarray og kliniske data for pasienter med plateepitelkarsinom lungekarsinom (n = 130) som ble rapportert av Raponi

et al. product: [17] med tiltredelse GDS2373 ble lastet ned fra GEO. . microarray og kliniske data for brystkreftpasienter (n = 133) som ble rapportert av Hess

et al product: [18] ble lastet ned fra MD Anderson Cancer Center hjemmeside (tilgjengelig: https://bioinformatics.mdanderson.org/pubdata.html; vist 2012 7 september). Pasientene ble delt inn i høy og lav uttrykker grupper for utvalgte gener innenfor EMT-core-listen. P-verdier ble beregnet ved hjelp av tosidige Student

t

-test. Overlevelsesanalyse for dataene etter Raponi

et al.

Ble utført med chi-squared test av likhet med overlevelse pakken i R [60]. P-verdier under 0,05 ble ansett som signifikant.

Hjelpemiddel Informasjon

Figur S1.

Cluster analyse av gener som deles mellom minst 14 GES datasett viser vedvarende og distinkte klynger.

doi: 10,1371 /journal.pone.0051136.s001 product: (PDF)

Figur S2.

130 gener EMT-core-listen og de 365 genene liste utviser sammenlign berikelse forholdstall på GO molekylære funksjoner.

doi: 10,1371 /journal.pone.0051136.s002 product: (PDF)

Figur S3.

Flytskjema som viser generasjon av EMT-core genet listen.

doi: 10,1371 /journal.pone.0051136.s003 product: (PDF)

Tabell S1.

Matrix inneholder betydelig opp- og downregulated gener på tvers av de analyserte GES datasett

doi:. 10,1371 /journal.pone.0051136.s004 plakater (XLS)

Tabell S2.

Liste over 365 gener betydelig regulert i minst 10 GES datasett

doi:. 10,1371 /journal.pone.0051136.s005 plakater (DOC)

tabell S3.

EMT-core genet liste over 130 opp- eller nedregulert gener delt mellom minst 10 GES datasett

doi:. 10,1371 /journal.pone.0051136.s006 plakater (DOC)

Tabell S4.

Enrichment verktøy som brukes i denne studien og deres egenskaper

doi:. 10,1371 /journal.pone.0051136.s007 plakater (DOC)

Legg att eit svar