PLoS ONE: Alternativ Behandling av U2 Small Nuclear RNA Produserer en 19-22nt Fragment med relevans for deteksjon av ikke-småcellet lungekreft i humant serum

Abstract

RNU2 eksisterer i to funksjonelle former (RNU2-1 og RNU2-2) kan skjelnes fra hverandre ved nærværet av en unik 4-baser motiv. Detaljert undersøkelse av datasett hentet fra dypt sekvensering av fem menneskelig lunge primære svulster viste at begge former uttrykker på en høy rente en 19-22nt fragment (MIR-U2-1 og -2) fra sin 3 «regionen og inneholder de 4-baser motiv . Deep sekvensering av uavhengige bassenger av serumprøver fra friske donorer og lungekreftpasienter viste at MIR-U2-1 og -2 er pervasively behandlet i lungevevet ved hjelp av endonucleolytic skillelinjer og stabilt eksportert til blodet. Deretter mikromatriser hybridisering eksperimenter av matchet normal /tumorprøver viste en signifikant overuttrykk av MIR-U2-1 i 14 av 18 lunge primære svulster. Deretter QRT-PCR av MIR-U2-1 bruker serum fra 62 lungekreftpasienter og 96 forskjellige kontrollene viste at dens uttrykk nivåer identifisere lunge kreftpasienter med 79% sensitivitet og 80% spesifisitet. MIR-U2-1 ekspresjon korrelerte med tilstedeværelsen eller fraværet av lungekreft hos pasienter med kronisk obstruktiv lungesykdom (KOLS), andre sykdommer i lunge – ikke kreft, og i friske kontroller. Disse data tyder på at RNU2-1 er en ny bi-funksjonell ncRNA som produserer en 19-22nt-fragment som kan være anvendelige ved påvisning av lungekreft en ikke-invasiv hos høyrisikopasienter

relasjon:. Mazières J, C Catherinne , Delfour O, Gouin S, Rouquette jeg, Delisle MB, et al. (2013) Alternativ Behandling av U2 Small Nuclear RNA Produserer en 19-22nt Fragment med relevans for deteksjon av ikke-småcellet lungekreft i Human Serum. PLoS ONE 8 (3): e60134. doi: 10,1371 /journal.pone.0060134

Redaktør: Liang-Hu Sandsvær, Sun Yat-sen-universitetet, Kina

mottatt: 23 november 2012; Godkjent: 21 februar 2013; Publisert: 20 mars 2013

Copyright: © 2013 Mazières et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette programmet mer spesielt blodprøvetaking, ble støttet av en bevilgning fra Midi-Pyrénées Regionrådet. Finansiører hadde ingen rolle i studien design, data analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. Forfatterne erklærer at de ikke har noen konkurrerende interesser. Den tilhørighet flere forfattere å Cepheid selskapet endrer ikke forfatternes tilslutning til alle PLoS ONE politikk.

Innledning

utforskning av ikke-protein-kodende RNA (ncRNA) transkriptom i humane celler og vev har lenge vært fokusert på profilering microRNAs. Fremveksten av high-throughput Next Generation Sekvense teknologier (NGS) har tillatt identifisering av nye typer ncRNAs og banet vei for studiet av deres funksjonelle foreninger [1]. De fleste nye ncRNA artene er nå oppdaget ved hjelp av NGS nærmer [2] – [5]. Siden funksjons ncRNAs er antatt å være beskyttet mot nedbrytning på grunn av deres tilknytning til proteiner og emballasje til partikler, og derfor er stabile, NGS har den unike fordelen av å være i stand til å gjenkjenne samtidig ekspresjon av tusener av funksjonelle små RNA-transkripter i en enkelt vevstype, avslører et nytt nivå av kompleksitet i produksjonen av små ncRNAs i humane celler, vev, organer og under forskjellige fysiologiske betingelser [2], [4], [8]. Den svært høye følsomheten NGS metoder har også tillatt oppdagelsen av tidligere uoppdagede «isomirs» produsert av post-transkripsjons redigering mekanismer, enkelt-nukleotid ikke-mal 3 «adenosin eller uracil tillegg tjene som et eksempel [6], [7]. Videre ble det nylig vist at en enkelt ncRNA kan generere forskjellige produkter, ikke bare gjennom tilfeldig nedbrytning men via spesifikk justering av de flere trinn for behandling som involverer dicer [9] eller andre enzymer [10], [11]. Slik alternativ ncRNA behandling kan forklare hvordan en enkelt primærtranskript ncRNA kan subserve mer enn en funksjon, som er analog med den alternative spleising av pre-mRNA-transkripter. Dermed er voksende samling av bi-funksjonell ncRNAs tilbyr et nytt syn på menneskets biologi som sett gjennom linsen av NGS.

Disse nyoppdagede klasser av små RNA produsert av ncRNAs med en annen funksjon dele noen fellestrekk med mikroRNA. Det er nå omfattende bevis for at flere tRNAs produsere tRNA-avledet regulatoriske små RNA (smRNAs) [9], [11] – [13]. Rikelig små RNA 18-22 nt i lengde, blir behandlet fra begge de 5 «og 3» endene av modne tRNA, så vel som fra den 3 «tilhengeren regioner av pre-tRNA. Den modne 3 «populasjonen (også kalt type I) ble funnet å være dicer avhengig og kompleksdannet med Argonautes 1-4. I motsetning til dette pre-tRNA 3 «trailer populasjonen (Type II) er dicer uavhengig og tilsynelatende omfatter virkningen av RNase Z. I tillegg ble RNA type II funnet å være kompleksbundet med Argonautes 3 og 4 og i mye mindre grad til Argonautes 1 og 2 [13]. Konsentrert i nucleoli flere snoRNAs funksjon i behandlingen av ribosomal RNA (rRNA) i løpet av ribosom-subenhet biosyntese og montering. Men de fleste av dem fungerer som guide for enzymatisk modifikasjon av målet rRNAs og spliceosomal U6 snRNAer på nukleotider valgt av RNA: RNA antisensprimere interaksjoner [14], [15]. SnoRNAs klassifiseres i to grupper, C /D boks snoRNAs som katalyserer 2 «O ribose metylering [16], og H /ACA boks snoRNAs som introduserer pseudouridine modifikasjoner [17]. Siste bioinformatikk analyse av små RNA bibliotek har foreslått eksistensen av smRNAs avledet fra enkelte av de snoRNAs følgende behandling [18] – [21]. H /ACA og C /D-boks avledet ncRNAs bruk av avvikende trasé BIOGENESIS avhengig av typen av utgangsforbindelse snoRNA som bearbeides [21] – [23]. H /ACA-avledede ncRNAs er overveiende 20-24 nt i lengde og stammer fra 3»-enden. Deres produksjon er uavhengig av drosha, men krever virkningen av dicer [18]. I motsetning til C /D avledet ncRNAs er enten 17-19 nt eller 27 nt i lengde og hovedsakelig stammer fra den 5 «ende [21]. Den store variasjonen av sekundære strukturer, antyder dicer uavhengig behandling basert på Ago2 endonuklease-aktivitet tilsvarende pre-MIR-451 behandling [24]. Flere eksempler på smRNAs avledet fra tRNA eller snoRNA forløpere har allerede blitt vist å ha mulige biologiske funksjoner [9], [11], [27], [28].

Kort leser blir også fremstilt fra en rekke forskjellige av andre typer strukturerte ncRNAs som 7SL, 5S, Y1 og Y3 [25]. Hvelv RNA som er involvert i multimedikamentresistens og intracellulær transport i mennesker har nylig blitt vist å fremstille en gruppe av ~23-nt RNA i en drosha uavhengig men dicer-mediert behandlingstrinn [26]. En av hvelvet-avledet ncRNAs er bundet til argonaute proteiner og formidler mRNA cleavage, mimicing det viktige mikro-RNA-lignende funksjoner.

Alle disse eksemplene tyder på at alternativ behandling av ncRNAs kan representere en viktig mekanisme som funksjonell diversitet for ncRNAs oppnås, og dessuten innebærer at nye lag av regulerende innflytelse og kontroll pålagt av ncRNAs på genekspresjon kan være fundamental for biologi. Man kan bare forestille seg den potensielle effekten av smRNAs avledet fra ncRNAs med en annen funksjon på uttrykk for metabolske mellomprodukter i ulike fysiologiske tilstander, samt påvirkning på viktige formidlere av signaltransduksjon i endrede pathophysiologic tilstander, som kreft.

i motsetning til snoRNAs og tRNAs, lite er kjent om snRNAer som er komponenter av spliceosome komplekse, dirigere nøyaktig fjerning av intronic sekvenser fra pre-mRNA [29]. Men nyere NGS eksperimenter antydet at spliceosomal snRNAer U1, U2, U6 og U12 samle små RNA-sekvenser [25], mens immunoprecipitation med argonaute proteiner tillatt identifisering av Ago-bundet RNA fragmenter fra U1, U2 og U12 [30]. Mer nylig ble et fragment av RNU2-1 vist over-uttrykt i bukspyttkjertelen og kolorektal kreft i forhold til normalt vev fra de organer [31]. For bedre å forstå hvorvidt ekspresjonen av små ncRNA fragmenter som følge av alternativ behandling er forbundet med nærværet av sykdom, vi målte nivåene av fragmentene produsert av snRNA U2 av flere metoder i lungevev og serum av pasienter med lungekreft, og sammenlignet dem med de RNU2 nivåer i serum fra pasienter med risiko for lungekreft (pasienter med KOLS) samt normale, friske kontrollpersoner. RNU2 er en av de mest sterkt uttrykt ncRNAs, og den er fortrinnsvis uttrykt i lungevev [32]. Ved å kombinere NGS, mikromatriser hybridiserings-eksperimenter og QRT-PCR, utførte vi en detaljert analyse av RNU2-avledet smRNAs i lunge primære svulster, sammenkoblet tilstøtende normalt lungevev fra de samme pasientene, og serumprøver fra lungekreftpasienter og friske kontrollpersoner, så vel som kontroller med andre lungesykdommer – ikke kreft. Resultatene tyder på at MIR-U2, et 19-22nt produkt av RNU2 alternativ behandling, tillater diskriminering av pasienter med lungekreft fra de med KOLS, men ingen kreft, og hever muligheten for at serum-baserte målinger av MIR-U2-nivåer kan være brukes som en ikke-invasiv, kostnadseffektiv, tidlig screening verktøy for å velge pasienter for videre evaluering med avansert billeddiagnostikk som spiral CT-skanning.

Materialer og Metoder

Prøver Collection

Vevsprøver og serumprøver ble innsamlet ved Hospital Rangueil og Hospital Larrey, Toulouse, Frankrike. Skriftlig informert samtykke ble innhentet fra alle personer før deres innmelding i denne studien, og studien ble godkjent av hensiktsmessige institusjonelle gjennomgang boards. Alle rekorder ble anonymisert for å beskytte individet konfidensialitet. Kliniske data ble samlet for hver enkelt på tidspunktet for vev eller blodprøvetaking. Klinisk stadium ble bestemt i henhold til 7

th International Association for studier av Lung Cancer staging system [33]. For åtte pasienter av atten som ble operert for lungekreft, sammen primærtumor og distal prøvene normale vev ble samlet. Blodet av lungekreftpasienter ble oppsamlet ved diagnosetidspunktet, men før tumorreseksjon eller en hvilken som helst spesiell behandling. Fem ml blod ble oppsamlet fra hver enkelt i SST-rør og umiddelbart bearbeidet. Rørene ble blandet ved hjelp av et par inversjoner, og deretter satt i romtemperatur i 30 minutter for koagulering. Rørene ble deretter sentrifugert (1000 g ved 4 ° C) i 10 minutter. Til slutt ble serum fraksjon alikvotert i 1 ml rør og umiddelbart lagret ved -80 ° C inntil brukstidspunktet. 45 friske kontrollprøver ble også anskaffet fra Asterand og behandlet på identisk måte. Vi organisert denne kohorten i fem grupper. Tre kontrollgrupper inneholde individer uten lungekreft: 1) bare personer uten symptomer på sykdom på tidspunktet for blodprøvetaking. De kan betraktes som «sunn» individer. 2) pasienter med en lungesykdom som ikke kols. Denne gruppen består hovedsakelig av personer som lider av astma, bronkitt og lungeinfeksjoner. 3) KOLS pasienter uten noen bevis for lungekreft ved tidspunktet for blodprøvetaking. Pasienter med lungekreft ble delt i to grupper: 1) alle pasienter med lungekreft uten noen KOLS symptomer, og 2) pasienter som lider av både lungekreft og kols

Utvinning-Rensing av RNA

.

RNA ble ekstrahert fra 0,5 ml serum ved bruk av Qiagen miRNeasy mini kit, i henhold til produsentens instruksjoner. En spike-kontroll (Cel-MIR-39) ble lagt inn etter den første denaturering trinnet.

Arkivert eller fersk snap-frosne vevsprøver ble homogenisert ved morter i TRIzol® Reagent Life Technologies (Carlsbad, CA ) og RNA ble videre ekstrahert i henhold til produsentens protokoll. Den lille RNA-fraksjonen ble hentet ved hjelp av Flash-PAGE parerings (Ambion). Alle mikroRNA prøvene ble fortynnet i RNase-fritt vann og lagret ved -80 ° C.

Deep sekvensering og bearbeiding av data

Bibliotek forberedelse og sekvenseringsforsøk ved bruk av RNA renset fra vev eller serumprøver ble utført av Fasteris (Sveits). I korthet, RNA-fragmenter (16-30 nt eller 25-50 nt) ble renset på gel, etterfulgt av ligering av enkelt-trådet RNA-3 «og 5» adaptere. En akrylamidgel rensetrinn ble utført før revers transkripsjon og PCR-amplifikasjon for å generere DNA-koloni templat-bibliotek. cDNA ble gelrenset og biblioteket ble kvantifisert før fortynning til 10 nM. De fortynnede cDNA-biblioteker ble så sekvensert ved anvendelse av Illumina HiSeq teknologi. Sekvensen leser ble behandlet med en kombinasjon av bioinformatikk algoritmer og manuell utvelgelse for å fjerne 5 «og 3» end adaptere (Tabell S7). Bare leser av 19nt lang eller lengre følgende adapter fjerning ble beholdt for analyse. 5 «og 3» ender uoverensstemmelser ble trimmet til perfekt match leser. Leser fra de forskjellige bibliotekene ble normalisert ved hjelp av det totale antall står i hvert bibliotek og uttrykkes som leser per million (RPM) for det formål å sammenligne relative ekspresjonsnivåer. Bare leser med en unik kamp til det humane genomet ble anvendt (NCBI bygge 37). Dermed leser kartlegging til funksjonelle RNU2 gener kart til ingen andre genomisk sted. Ingen interne uoverensstemmelser ble tillatt. For høyere selvtillit, ble bare RNA med et minimum av fem RPM vurdert for videre analyse.

Mikromatriser hybridiseringseksperimentene

Nexterion (Schott) microarray glassplater ble brukt som en solid støtte for microarray. Custom i huset designet oligonukleotider ble prikket inn sin overflate. Merkingen av mikroRNA ble tilpasset fra Castoldi et al. 2006 [34]. Det merkede mikroRNA fraksjonen ble hybridisert til flekket arrays som bruker Discovery hybridisering stasjonen (Ventana, Tucson, AZ). Arrays ble skannet med Axon skanneren (Molecular Devices, Sunnyvale, CA) og data ble samlet inn ved hjelp GenePix programvare. Seks hus tegnet spike-in interne kontroller ble brukt til å normalisere dataene. Disse syntetiske RNA-kontroller ble tilsatt til den totale RNA-fraksjon før hybridisering. Alle sekvenser for hvilken intensiteten av flekken var høyere enn den midlere lokale bakgrunnsintensitet pluss 1,5 ganger dens standard avvik ble kategorisert som uttrykt microRNAs. Statistiske normalisering av data ble gjort ved å beregne Logg

2 forhold hvor Logg

2 ratio = middels intensitet signal av dupliserte flekker /median intensitet av alle interne kontroller for blokken. Normaliserings ble gjort per blokk for å unngå ikke-homogen merking (tabell S4). Mikroarray data ble analysert ved å bruke R bioconductor pakken [35]. Den relative uttrykk for hver mikroRNA ble beregnet ved hjelp av to

-ΔΔCT metoden [36]. Den «MeV 4.8.1» (MultiExperimentViewer) [37] ble brukt for hierarkisk clustering analyse, hvor utvalgte mirnas ble gruppert hjelp Euklidsk avstand.

QRT-PCR av MIR-U2 uttrykk

Expression nivåer av MIR-U2-1 ble vurdert ved QRT-PCR bruker Exiqon tilpasset LNA

TM primere (Exiqon, Vedbæk, Danmark) i henhold til produsentens instruksjoner. Selv om primerne ble designet for å detektere isoform UGGAUUUUUGGAGCAGGGAG de Exiqon primere tillater påvisning av de andre isoformene (tabellene S5 og S6). Forsøk ble utført in triplo. På grunn av den manglende serum rengjøring små ncRNAs, normalisert vi mikroRNA konsentrasjon til den opprinnelige volum av serum (500 ul). En eksogen pigg-kontroll (Cel-MIR-39) ble også brukt for å kontrollere den robusthet av resultatene. Vi beregnet ΔCt verdi matrise for hver prøve ved å trekke grensen syklus nummer (Ct) verdi for MIR-U2 fra Ct verdien av Cel-MIR-39. En en-veis analyse av varians (ANOVA) ble anvendt for statistisk analyse ved sammenligning av prøve befolkninger og kontrollgruppene. Arealet under kurven (AUC) ble beregnet for mottageroperatøren kurver (ROC). Resultater bestemmes ved hjelp normalisering av Cel-MIR-39 spike-in og normalisering til volum av serum ble sammenlignet.

Diskusjon

Resultater og Lung primære svulster sterkt uttrykk for en 19-22nt ncRNA behandlet fra RNU2

Det menneskelige genom koder to funksjonelle U2 snRNA gener, RNU2-1 og RNU2-2 som ligger på 17q21.31 og 11q12.3 hhv. Organiseringen av genomet hos de to RNU2 gener skiller seg radikalt. RNU2-2 er til stede på en enkelt kopi, mens RNU2-1 er organisert i en klynge av 6 til ~ 30 tandemrepeterte kopier strekker seg over 30 til 150 kb. Hver repeterende enhet er 6,1 kb lange, inneholder en enkelt RNU2-1 gen og er sterkt konservert med andre gjenta enheter. Selv om RNU2-1 skiller seg genkopitallet fra individ til individ, er arrays stabilt arvet, avhengig av dosering kompensasjon og transkribert ved en uvanlig høy hastighet. For å finne ut om små ncRNAs kan bli effektivt behandlet fra de to funksjonelle RNU2 gener og å avgrense slike produkter presist, sekvensert vi den lille RNA transkriptomet av fem menneskelige lungekreft primære svulster samt tre bassenger av serumprøver, en fra friske donorer og to fra lungekreftpasienter (tabell 1). Sekvense relaterte prøver parallelt reduserer frekvensen av falske oppdagelsen av ncRNAs. ncRNAs som virkelig er over-uttrykt ville være forventet å bli funnet i flere uavhengige prøver. I et første skritt, kartla vi leser sekvensert fra sju bibliotekene fremstilt fra primærsvulster, fem kort størrelse (16-30nt) og to lange størrelse (25-50nt) direkte på RNA sekvens av de funksjonelle RNU2 gener. Den RNU2-1 locus på kromosom 17 ble fjernet fra det menneskelige genom forsamlingen siden versjon Bygg 37 (NCBI merknad Informasjon Gene ID: 6066, oppdatert 20.-Apr-2012). Det store flertallet av lyder fra de fem korte store bibliotekene kartene på en unik beliggenhet mellom posisjonene 93 og 114 av RNU2-1 (Fig. 1a-b). De høyest uttrykte leser varierer fra 19 til 22nt i lengde. Dette RNA fragment kalles MIR-U2-1. Bemerkelsesverdig, små RNA sekvensering av de tre bassengene av serumprøver viste at MIR-U2-1 er til stede i blodsirkulasjonen i begge lungekreftpasienter og friske, avslører sin gjennomtrengende uttrykk (Fig. 1c-d). Disse data tyder på at Mir-U2-1 aktivt eksportert i stedet for passivt slippes ut i sirkulasjon. Bare et delsett av mirnas har faktisk blitt oppdaget utenfor celler [38] -. [41], således MIR-U2-1 kan representere en ytterligere medlem av denne klasse

Lie leser detektert i primærsvulster (a) og serumprøver (c). Long-leser oppdaget i Primære svulster (e). Fargekoden viser antall normalisert leser oppdaget i hvert bibliotek. Den røde linjen lokaliserer MIR-U2. Antallet leser henhold til deres størrelse er gitt i (b) for de primære svulster i (d) for serumprøver.

Blant befolkningen leser stede i primære svulster som vel som i serum, observerte vi en opphopning av RNA-fragmenter som starter ved posisjon «A-94» eller «A-95» og avsluttes ved posisjon «G-113» eller «A-114″ (fig. 2). Dette begrensede antall av 5 «og 3» ende leser tilsvarer en bestemt og liten populasjon av varianter eller isomirs, et vanlig funksjonen av microRNAs. Sammen utgjør disse MIR-U2-1 isomirs representerer mer enn 75% av den leser matchende utelukkende til denne regionen av RNU2-1. Deres uttrykk nivåer er i størrelsesorden kanoniske microRNAs som miR16, MIR-17, MIR-200a eller MIR-451 (tabell S1). Dette betydelig opphopning av en unik og presist kløyvde RNA-fragment fra RNU2-1 representerer klare bevis favorisering hypotesen om at spesifikke prosesserings hendelser produsere en ny funksjonell ncRNA, MIR-U2-1, snarere enn alternativ forklaring, at disse er de tilfeldige produkter av RNA degradering. Disse resultatene indikerer videre at Mir-U2-1 er beskyttet mot endo- og exo-nukolytiske RNase fordøyelsen i kraft av emballasje i komplekse nucleoprotein partikler. MIR-U2-1 kan også pakkes i små membran partikler (exosomes, mikrovesikler, apoptotiske legemer) før eksport til sirkulasjon. Flertallet av microRNAs påvisbare i serum er faktisk konsentrert i exosomes [42], selv om noen kan ganske enkelt være forbundet med proteiner [43]. Samlet tyder dette på at behandlingen hendelser produserer MIR-U2-1 representerer viktige biologiske prosesser i menneske.

(a) Angir rekkefølgen av hvert les oppdaget og det normaliserte antall av hver lese er gitt for hver svulst eksemplar. (B) Det totale antall av hver type lese vises som et histogram. Histogrammer (c) og (d) viser antall leser på forskjellige 5 «starter og 3» ender av MIR-U2 hhv.

De sekvensene av RNU2-1 og RNU2-2 gener (187 nt) er sterkt konservert. Forskjellene mellom dem er begrenset til to punktmutasjoner som ligger i 3′-enden (posisjoner 170 og 187) og til et 4-base-mutasjon lokalisert i posisjonene 108-111 (fig. S1). Bemerkelsesverdig, RNU2-2 uttrykker også den samme regionen med en identisk størrelse (fig. S2). Det høyere antall lesninger detektert for MIR-U2-1 i sammenligning med MIR-U2-2 er forenlig med RNU2-1 er høyere genomkopiantall. Heldigvis er det fire-basen forskjell (GCAG og AAUA i RNU2-1 og RNU2-2 henholdsvis) å skille de to U2 genene ligger innenfor MIR-U2 sekvenser, tillater diskriminering av de to produktene. Denne polymorfisme synes ikke å ha noen merkbar innvirkning på behandlingen, noe som tyder på lignende BIOGENESIS mekanismer for MIR-U2-1 og MIR-U2-2. Imidlertid kan forskjellene i sekvens mellom MIR-U2-1 og MIR-U2-2 reflektere videre funksjonelle spredning, kanskje til rette for en finjustering av regulerende funksjon gjennom differensial mål valg eller proteinfaktorer bindende.

Bruk av NGS-teknologien er ikke uten sine fallgruver. Det er godt etablert at små RNA kan være utilsiktet tverr angitt til feil genomiske regionen. RNU2 gener er en kompleks familie som består av mer enn 50 pseudo som gjør kryss kartlegging feil utpreget mulig. Det har nylig blitt rapportert at to immunoutfelt argonaute-assosiert små RNA av 23nt og 30nt ble kartlagt til to forskjellige U2 pseudogener [30], til posisjoner 168-187 av den U2 pseudogen kodet for av kromosom 6 og til posisjoner 95-125 av U2 pseudogen kodet av kromosom 10 henholdsvis. Disse to fragmentene kartlegge de funksjonelle U2-1 RNA med 100% identitet. Vi hadde tidligere bemerket at RNU2-1 locus på kromosom 17 ble faktisk fjernet fra Human Genome Sequence Assembly Bygg 37 (NCBI merknad Informasjon Gene ID: 6066, oppdatere 20-April-2012), og dette er den mest sannsynlige forklaringen på hvorfor disse RNA fragmenter tilordnet disse pseudo snarere enn den funksjonelle RNU2 genet i seg selv. Tilsvarende to korte microRNAs (19 nt), MIR-1246 og MIR-1290, match MIR-U2-1 med 100% identitet og en mismatch henholdsvis [44]. Kartlegging leser fra våre fem korte bibliotekene til de respektive forløpere til disse to microRNAs [45] viste entydig at de to antatte forløpere av MIR-1246 og MIR-1290 er et resultat av falske kartlegging. De to foreslåtte modne microRNAs faktisk avkortet versjoner av MIR-U2-1. Dette ble indirekte bekreftet for MIR-1246, da forsøk på å sekvensere sin forløper i samme vev der MIR-1246 ble påvist mislyktes, noe som tyder på at den antatte forløper ikke eksisterer [46]. Dette resultatet ble nylig uavhengig bekreftet [31]. Når det gjelder MIR-1290 er det to mulige genomiske områder som kan kode den (fig. S3), men i våre eksperimenter er det detektert på samme nivå som bakgrunnsstøyen forbundet med sekvenseringsfeil (Tabell S2). Vi konkluderer ut fra disse dataene at alle resultater knyttet til MIR-1246 og MIR-1290 kan tildeles MIR-U2.

En dobbel funksjon for RNU2 gener

De eksperimentelle resultatene diskutert så langt foreslår en dobbel funksjon for RNU2-1 og RNU2-2 snRNAer. Deres 5 «domene inneholder mRNA gren nettstedet involvert i mRNA spleising, mens deres tre «domene koder MIR-U2 som inneholder Sm bindingssetet, og kan være involvert i reguleringen av genuttrykk. Dette funksjonelle partisjon av RNU2 korrelerer med de observerte forskjellene i strukturelle trekk som finnes i molekylet (Fig. 3). 5 «delen inneholder et imponerende antall post-transcriptional modifikasjoner inkludert 14 pseudouridylations og 10 denaturert nukleotider [47] – [49]. I motsetning til dette, er det ikke noen modifikasjoner identifisert nedstrøms for stilling 90 av RNU2, og dette domenet inneholder mer omfattende sekundær struktur, særlig når forløperen sekvensen er inkludert. Disse slående strukturelle ulikheter er sannsynligvis relatert til de respektive differensial funksjonene til de to halvdelene av RNU2. Selv om 5 «domenet er tilstrekkelig til å indusere mRNA-spleising in vitro [50] – [52], er det ingen bevis enten fra litteraturen eller fra våre eksperimenter som NGS noen del av 5»-regionen til RNU2 akkumuleres i celler. Dette antyder en alternativ behandling mekanisme som gir full størrelse RNU2 på den ene side, og MIR-U2 på den andre.

sekundærstruktur bretting av RNU2 forløperen er vist. Y steder er fra [49]. Denaturert nukleotider er angitt med symbolet «

m». Nukleotider i blått og grønt tilsvarer MIR-U2-1 sekvens. De grønne bokstaver lokalisere de fire nucleotide mutasjon mellom MIR-U2-1 og MIR-U2-2. Svart og røde bokstaver viser henholdsvis RNU2 og forløper spesifikke RNU2 sekvenser. Blå piler peker på 5 «og 3» ender av MIR-U2 isomirs. Den røde pilen indikerer 3’end av RNU2. De to svarte pilene peker på de to interne spaltningsseter identifisert i dette arbeidet.

For å bedre forstå mekanismen av MIR-U2 spleising, vi sekvensert to cDNA bibliotek for ncRNAs lenger enn MIR-U2 (25-50nt lang) for å identifisere potensielle mellomprodukter (Tabell 1). Antallet lang leser kartlegging for å RNU2 er betydelig lavere enn det man ser i liten størrelse cDNA bibliotek, noe som tyder på at mellommodnings er raskt degradert eller trimmet for å gi det endelige moden mikroRNA. Å undersøke fordelingen av lyder (målt i RPM) langs den forhånds RNU2 sekvensen observerer man to topper svarende til to mindre fragmenter som akkumuleres (fig. 1E). Som forventet, en topp er kartlagt til den modne MIR-U2, mens overraskende den andre kartene til 3′-enden av det modne RNU2, en region som ikke gir et stabilt ncRNA siden vi ikke observere det i våre sekvenseringsresultatene fra de korte dimensjonerte biblioteker. Dette RNU2 fragment svarer nøyaktig til den 30nt lang fragment binding Ago1 [30]. Dette tyder på at nedbrytningen av 3′-enden av RNU2 hemmes av den forbigående binding av Ago, men fordi den beskyttelse som gis ved siden 1 er forbigående, er det ikke gir opphav til en stabil ncRNA produkt. Alternativt kan dette produktet bli degradert i lunge vev på grunn av fraværet av ytterligere faktorer, men kan bli uttrykt i andre celletyper eller vev. Den avtagende antall lesninger av begge sider av de to toppene reflekterer en degradering av mellomproduktene med modning etter trimming mekanismer i forhold til begge ender, mens den dalen mellom dem lokaliserer posisjonen til en endonucleolytic spaltingssete (endo 3 «) i nærheten av stilling 145 innenfor stammen IV (fig. 1e og fig. 3). I motsetning til dette gjør den 5 «halvdel ikke inneholder noen fragment beskyttet fra nedbrytning. Likevel ser en andre endonucleolitic kuttesete (endo 5 «) for å bli plassert mellom posisjonene 70 og 80 innenfor stammen IIb.

Med tanke på ulike potensielle behandlings trasé for RNU2, innebærer den mest sannsynlige første trinnet 3’end spalting ved posisjon 187. Vi finner ingen lese matche den forventede konkrete forløper, noe som indikerer en tidlig og rask hendelse. Det første trinnet innebærer en base-paring mellom de forløper spesifikk sekvens (posisjoner 190-200) og posisjoner 100-110 av RNU2 som er en viktig strukturelt trekk som er nødvendig for å styre den 3 «ende behandling [53]. Bemerkelsesverdig, oppstår denne baseparring med MIR-U2-regionen og markerer nettopp de to strukturelt og funksjonelt forskjellige halvdeler av RNU2 (Fig. 3). Deretter, i fravær av Ago1-binding, binding av Sm-protein, sannsynligvis i kombinasjon med andre faktorer som U2A «og U2B «, kan stabilisere den fulle lengde RNU2. I motsetning til dette Ago1 binding til MIR-U2-sekvenser kan indusere en overgang til den endonucleolytic spaltinger reaksjonsveien som spalter i posisjonene 70-80 og 145 henholdsvis. Flere og tilstøtende små RNA-bindingsseter for Ago1 er kjent for å legge til rette for samarbeids interaksjoner som stabiliserer argonaute binding [54]. Siden Ago1 har ingen enzymatisk aktivitet, må en RNase rekrutteres for MIR-U2 modning, på samme måte som MIR-lignende ncRNAs produsert fra snoRNAs og tRNAs. Til slutt blir dette forbigående forløper raskt trimmet fra begge ender for å gi den modne MIR-U2.

Den eksklusive binding av MIR-U2 til Ago1 [30], i motsetning til de fleste av kanoniske microRNAs som også binder Ago2 [ ,,,0],55], antyder en annen rolle for MIR-U2. Selv om overvekt av dataene indikerer at microRNAs regulere genuttrykket i cytoplasma og P-organer, har de fire argonaute proteiner og en rekke microRNAs nylig blitt oppdaget i kjernen av menneskelige celler. Transporten av små RNA i kompleks med Ago proteiner til kjernen er avhengig av Importin-8 [56]. Denne mekanismen antyder en mulig interaksjon med kromatin og åpner spennende alternativ for deres direkte engasjement i å påvirke kjernefysiske prosesser som spleising eller transkripsjon ved å målrette genet promoter regioner. Interessant nok flere nyere studier viste funksjonell segregering mellom Ago1 og Ago2 [57] samt en differensial fordeling i kjernen i respons til promoter-målrettede siRNA under transkripsjonen genet Slå [58] som tyder på at Ago proteiner mediere den nukleære lokalisering av de små RNA . I tillegg til å definere den biologiske aktiviteten av små RNA, kan Ago proteiner også definere lengden av modne microRNAs [59].

Dette gir oss muligheten til å vurdere muligheten for at MIR-U2 kan spille epigenetiske roller på DNA-nivå hvor det kan virke som en regulator av ekspresjon av store kromosomale regioner. Det er faktisk kjent at mange arrangører av tumor-suppressor gener viser høyere nivåer av metylering, tyder på en mulig sammenheng med kreftrisiko. MIR-U2 kan for eksempel delta i guiding cytosin metylering, en prosess som er kjent for å være lydhør overfor miljømessige stimuli.

Legg att eit svar