Materias
- Splicing alternativo
- Pluripotente inducido células nai
- células nai neuronales
- neurología
- patogenesis
Resumo
mutacións que causan A esclerose lateral amyotrófica (ELA) implica moito os reguladores do procesamento de ARN expresados en forma omnipresente. Para comprender o impacto molecular dela-causando mutacións no desenvolvemento neuronal e enfermidade, analizamos transcriptomas durante a diferenciación in vitro de neuronas motores (MN) de control e de pacientes humanos inducida por VCP mutante múltiples mutantes (IPSC). Identificamos unha maior retención de intróns (IR) como unha característica dominante do programa de empalme durante a diferenciación neuronal precoz. É importante ter en conta que IR é producido prematuramente en cultivos mutantes de VCP en comparación cos seus homólogos de control. Estes eventos de IR aberrante tamén se ven en conxuntos de datos RNASEQ independentes de MN Mutantes SOD1 e FUS. O IR máis significativo é visto na transcrición de SFPQ. A proteína SFPQ está amplamente ligada ao seu intrón retenido, exhibe menos abundancia nuclear en cultivos mutantes VCP e perdeuse de mn núcleos en modelos de rato e sporadic als humano. En total, mostramos SFPQ IR e perda nuclear como distincións moleculares de familia e esporádica.
Introdución
A esclerose lateral amyotrófica (ELA) é unha condición rápidamente progresiva e incurable relacionada coa idade , que conduce á dexeneración selectiva das neuronas do motor (MN). As mutacións causadas por ALS implican reguladores cruciais do procesamento de ARN, normalmente expresados ao longo do desenvolvemento, na patoxénese subxacente. Isto suscita a posibilidade de que os cambios post-transcripcionais que se produzan nas primeiras etapas da vida, incluído o desenvolvemento neurológico, poden desempeñar un papel fundamental na patoxénese molecular subxacente do ELA. Comprender o impacto das mutacións que fan que os ALS no desenvolvemento neurolóxico e a enfermidade nos permitirán acelerar os eventos de inicio molecular. Isto, á súa vez, pode orientar o desenvolvemento de novas terapias dirixidas a mecanismos primarios antes de que a enfermidade progrese demasiado.
tanto o desenvolvemento como a neurona se baseen fundamentalmente na implementación precisa do procesamento alternativo de ARN do tipo de célula e por escenario, incluíndo empalme alternativo (como) e poliadenilación alternativa (APA) 1, 2, 3. Varios como mecanismos foron establecidos, que inclúen exon omisión, exóns mutuamente exclusivos e retención de intróns (IR). O uso alternativo do Exón caracterízase especialmente nas neuronas para regular a variedade de proteínas e función 4. Os tipos de células neuronais mostran unha maior proporción de intrones que se conservan en comparación con outros tecidos e hai un corpo de evidencia expansiva que demostra un papel funcional para o desenvolvemento neuronal e a homeostase 5, 6, 7, 8. Demostrouse que o aumento de ir durante a diferenciación neuronal regula a expresión de transcricións que son innecesarias para a fisioloxía neuronal madura 7. Un estudo recente mostrou probas de procesamento post-transcripcional de transcricións que conservan intrones en resposta á actividade neuronal 8.
APA é un modo de procesamento alternativo de ARN que xera diferentes extremos 3 ‘máis frecuentemente na rexión 3’ non Traducido (3 ‘UTR) do ARNm, engendando as isformas de lonxitude variable de 3’ UTR. Os 3 ‘UTR serven como unha plataforma clave na rede reguladora de ARN que controla a eficiencia, a situación e a estabilidade da tradución do ARNm 9, 10. UTR 3 ‘House Unha extensa variabilidade da lonxitude do tecido específico que afecta significativamente a súa función 11. De todo tipo de células humanas, as isoformas específicas do cerebro teñen a UTR de 3 ‘máis de 12, 13. Ademais, as mutacións que perturban a estrutura secundaria do ARNm e os sitios de interacción de Arnm-Miarn poden levar á neurodegeneración 14. A pesar destes descubrimentos, as funcións da regulación IR e 3 ‘UTR no contexto do desenvolvemento de MN e homeostase permaneceron pouco estudadas en comparación con outras formas de EA.
como e APA están coordinadas para a acción ou combinación individual das proteínas de unión de ARN (RBPS) que actúan en TRAND que se unen a sitios específicos dentro (pre-) ARNm 15, 16. RBPS mediate Splicing MRNA, exportación nuclear e localización.A acumulación de probas implica a PRR como reguladores clave do desenvolvemento neurológico e as formas específicas de neurodegeneración. De feito, as mutacións en varios RBP, incluíndo a proteína de unión de ADN de resposta transactiva, 43 KDA (TDP-43), fusionada en sarcoma (FUS) eo factor asociado coa proteína de unión á caixa de caixa (TAF15) a forma familiar de ELA que leva a defectos de procesamento de ARN nos modelos de rato 17, 18.
A nosa hipótese é que a articulación aberrante e a APA realizan roles importantes tanto no desenvolvemento como na enfermidade do sistema nervioso .. Neste contexto, tratamos de entender como aparecen os diferentes modos de AS e APA na neurogénesis do motor humano e examina sistematicamente o impacto das mutacións que causan a ELA na remodelación post-transcripcional durante a restrición de liñaxe. Ao combinar a diferenciación de células nai dirixida polo home inducida polo home (IPSC) con secuenciación de ARN resolto ao longo do tempo, primeiro identificamos o programa de remodelación post-transcripcional secuencial que subxace a neurogénesis do motor humano. Recentemente, identificamos fenotipos celulares claros de ELA a través do uso de IPSCs derivados de pacientes relacionados con Vallosine (VCP) 19. Esta plataforma permitiunos comparar VCP Mutant (VCP MU) para controlar os cultivos durante a diferenciación de MN e identificar a desregulación de splicing dependente da mutación nunha etapa específica de desenvolvemento. Identificamos a prolina e rico factor de splicing (SFPQ) como a transcrición de retención de intrones máis significativa entre as distintas mutacións causadas por ALS (VCP, SOD1 e FUS). Amosamos que a proteína SFPQ está ampliamente ligada ao seu intrón retenido, que exhibe abundancia elevada citoplasmática en MU VCP en comparación cos controis. Fundamentalmente, a proteína é menos abundante nos núcleos das culturas MU VCP e finalmente perdeuse dos núcleos de MN en modelos de ratos (modelos de ratones transxénicos SOD1 MU e VCP MU) e mostras post-mortemes esporádicas de ALS. En resumo, o noso estudo implica a SFPQ IR e a perda nuclear como os distintivos moleculares xerais da familia e o elo esporádico.
IR é o modo de empalme predominante na neurogénesis do motor.
para examinar post- Cambios transcripcionais durante a neurogénesis do motor humano, analizamos datos de secuenciación de ARN de alto rendemento (ARN-SEQ) para o ARN poliadenilado illado de células nai pluripotentes inducidas (IPSCS; Día 0), precursores neurales (NPC; Día 7), MNS precursores “con patrón “(ventral da medula espinal, PMNS; 14), postmithotic pero eletrofisiologicamente inmaturo MNS (MNS; 21), e MNS eletrofisiologicamente madura (MMNS, día 35) derivadas de dous pacientes con ELA gEN mutación VCP e dous controis sans (Fig. 1A, 31 mostras de 5 puntos temporais e 3 xenotipos; 2 clons de 2 controis saudables e 3 clons de 2 pacientes con ELA con mutacións VCP: R155C e R191Q). As mostras de células de cada etapa da diferenciación de MN caracterizáronse como se informou anteriormente. Aquí realizamos unha extensa caracterización adicional para confirmar os cultivos MN altamente enriquecidos (> 90%; Fig. 1A complementaria). É importante ter en conta que a eficiencia da diferenciación de MN era similar entre o control e as culturas de VCP (Fig. 1B, C). Usando un conxunto de 19 marcadores xenéticos clave da maduración do Spinal Mn e o desenvolvemento embrionario, tamén confirmamos un descubrimento previo que o NMM derivado do IPSC se asemellan a 20 fetales en lugar de adultos (figura 2a, b complementaria). Agrupación xerárquica non supervisada (correlación de clasificación de Spearman e agrupación completa) das 31 mostras que utilizan 15, 989 mostras segregadas de xenes expresadas de forma fiable dependendo da súa etapa de desenvolvemento dentro do linaje MN en lugar do fondo ou control xenético mutante (Fig.) 1b).
Retención de intron é O cambio de unión predominante durante a neurogénesis do motor inicial e é producido prematuramente nas culturas MU de VCP. Un esquema que representa a estratexia de diferenciación de IPSC para a neurogénesis do motor. As frechas indican puntos de tempo de mostraxe nos días. Os clons IPSC foron obtidos a partir de dous pacientes con mutacións confirmadas de VCP (R155C e R191Q, un total de 3 liñas IPSC, 1 inducción de cada liña) e 1 clon de cada un dos 2 controis saudables (un total de 2 liñas de IPSC diferentes, 2 Induccións dunha liña e 1 inducción da outra liña).Células nai pluripotentes inducidas (IPSC); precursores neuronales (NPC); “Modelado” neuronas de motores precursores (medula espinal ventral, PMN); neuronas postmóficas pero electrófisiológicamente inmaturas (MN); MNS electrofisiológicamente maduros (MMN). B O grupo jerárquico non supervisado de 15, 989 xenes agrupa as 31 mostras segundo a etapa de desenvolvemento neuronal, no canto do fondo xenético. Círculos grises = mostras de control; Magenta Circles = mostras MU VCP; Os puntos de tempo de mostraxe están indicados dentro dos círculos. ilustracións c circulares representan proporcións de eventos splicing en mostras de control e VCP Mu en diferentes fases de neurogese motor en relación ao punto temporal anterior. As áreas de gráfico son proporcionales ao número total de eventos en cada etapa. Retención de intrones (IR); Exon alternativo (Altex); microexons (micrófonos); Alternative 5 ‘e 3’ UTR (Alt5 e Alt3). D, os gráficos de barra que representan o número de eventos de empalme externos e intróns, respectivamente, no control (barras grises) e mostras de MU vcp (barras magenta) en puntos específicos durante a diferenciación de MN. E, G BAR Gráficos que amosan a puntuación de enriquecemento das vías biolóxicas GoS asociada con transcricións que experimentan eventos de empalme exonónico e introdutorio nas mostras de control. H na parte superior, os gráficos de efectivo representan as distribucións de porcentaxe de retención (ver métodos) para 167 intrones manualmente curados en réplicas en diferentes etapas de diferenciación nas mostras de control (esquerda) e VCP MU (dereita). Os diagramas de efectivo mostran o resumo de cinco números medianos, os cuartils inferior e superior, os valores mínimos e máximos. Abaixo, os mapas de calor da porcentaxe relativa estandarizada de IR en 167 intrones en mostras repetidas en cada etapa de diferenciación. I Como en H, pero para a diferenciación in vitro de Hescs á etapa de inducción neuronal (1 semana), NPC (4-10 semanas) que produce só neuronas despois da diferenciación adicional e despois de > 15 semanas, unha etapa máis glioxénica que produce ambas neuronas e células gliales 22
imaxe de tamaño completo
examinamos a dinámica temporal da diferenciación de MN. Usando as Vas-Tools 21 do tubo de ARN-Seq, identificamos 1599 e 1507 eventos ao longo do tempo nas mostras de control e VCP Mu, respectivamente (Fig. 2C, D). Segundo estudos anteriores, > 60% de como eventos en etapas posteriores da diferenciación do terminal MN foron exon alternativas (inclusión e exclusión de cassette exons) e omisión de eventos de intron (Fig. 2C d). Descubrimos que as mostras de control e VCP mu exhiben un aumento progresivo similar na inclusión do exón en cassette ao longo do tempo (Fig. 1C, D) en xenes enriquecidos para a organización de compoñentes celulares e funcións de ononoloxía xenética de axonogénesis (GO) ( Fig. 1E).
En contraste, o IR representado > 65% dos eventos como na fase previa de restrición de linaje NPC a PMN (Fig. 1C) .. A expresión das transcricións de retención de intras aumentou na transición de NPC a PMN (é dicir, patrón neuronal) en mostras de control (Fig. 1F). Curiosamente, as mostras de Mu VCP mostraron un incremento sorprendente na expresión das transcricións que conservan a intron na transición de desenvolvemento anterior de IPSCS a NPCs (é dicir, inducción neuronal, figura 1f). Descubrimos que o 53% dos acontecementos IR comezaron co patrón nas mostras de control (NPC a PMN); En contraste, o 72% dos acontecementos IR en MU Cultures of VCP comezaron con inducción neuronal (IPSC a NPC, Fig. 2E complementaria, dereita). É importante ter en conta que o 60% de todos os eventos IR íntrons implicados e transcritos idénticos entre VCP Mu e mostras de control (Fig. 2E complementarias, -se á esquerda), as cales implican grandemente xenes relacionados co procesamento e de splicing de ARN (Fig. 1g) .. Os eventos restantes foron exclusivos das culturas MU VCP ou ocorreron nun punto diferente. Isto indica que as mostras de MU VCP mostran que unha actividade é similar á que se observa nos homólogos de control durante a diferenciación, pero nunha etapa prematura.
Entón, curamos cada evento identificado automaticamente á lista curta con 167 con Alta confianza. Foi asignado un valor de retención para que cada evento estea relacionado coa expresión de exóns flanqueos (ver métodos). É inmediatamente evidente desde a figura 1h que os 167 intrones son sistemáticamente mantidos máis en VCP MU no paso do NPC en comparación coas mostras de control de calquera etapa.
Como validación inicial, evaluamos se os 167 intrones tamén se conservan en dous conxuntos de datos transcriptomáticos independentes de células nai embrionarias do embrionario 22, 23. O exame do seu nivel de retención xeral confirmou que IR durante a neurogénesis precoz é un fenómeno xeneralizable en varios modelos experimentais (Fig. 1i e Figura 2F Suplementario). A continuación, examinamos se os intrones mantidos presentaron características estruturais características que se poderían distinguir dos intróns invitutivamente empalmados e descubriron que o conxunto altamente seguro de 167 intrones retidos é máis longo e máis preservado que os intrones que non se conservan do mesmo conxunto de xenes (Figura 2G complementaria).
O VCP desempeña un papel na progresión do ciclo celular e unha porcentaxe máis elevada de IR pode resultar da ligazón establecida entre a eficiencia do splicing e do ciclo celular 24. Polo tanto, examinamos se a aparente aceleración en como programas en VCP Mu explícase por un aumento dependente da mutación na actividade do ciclo celular. Usamos a citometría de fluxo en IPSCS, NPCs e PMN tratados co axente fluorescente intercalado eo axente de staichométrico de ioduro de propidio para examinar o contido do ADN. Estes experimentos realmente excluíron as diferenzas no ciclo celular entre o VCP MU e as mostras de control (figura 2h-j suplementaria). Así, colectivamente, estes descubrimentos mostran que o IR é o cambio de unión predominante que afecta ás primeiras etapas da restrición neuronal. É importante ter en conta que o IR é producido tanto a niveis altos como prematuramente nas culturas MU VCP no escenario NPC, que non poden ser explicadas polas diferenzas na actividade do ciclo celular.
ir aberrante en MN Levar varias mutacións causadas por ALS
A placa patolóxica en > 97% de todos os casos de ELA (esporádica e familia) é citoplasmática nuclear con 43 25, 26. Non obstante, a ausencia de pobre localización do TDP-43 no 3% dos casos mantén que aínda se están descubrindo os mecanismos patóxenos comúns. Para solucionar isto, entón examinamos o impacto das mutacións que causan SOD1 e FUS, que, de forma característica, non presentan un sinal de localización errónea de TDP-43. Analizamos conxuntos de datos transcriptomic para Mutant SOD1 (SOD1 MU) (n = 5; 2 SOD1 A4V derivado de pacientes e 3 mn mostras purificadas con facs de control isógeno, onde a mutación) 27 foi corrixida e as mostras (fus mu) (n = 6; 3 fus R521G Derivados do paciente e 3 controis MN non afectados) 28. Confirmamos que IR é o modo predominante de cruce en MNS derivado de ambos os mutantes (Fig. 3A complementaria), que suxire un fenómeno molecular unificador a través de varios antecedentes xenéticos de ALS (VCP, SOD1 e FU). É importante notar que o noso alto conxunto de confianza de 167 eventos IR que se producen prematuramente durante a diferenciación de VCP MN tamén son xeralmente afectados en FUS MU e SOD1 MU MNS (Fig. 2A); En concreto, os eventos 74 e 59 mostrarán un aumento estatisticamente significativo en SOD1 MU e FUS MNS, respectivamente, en comparación cos controis (valor de P < 0, 01; Proba do reconto de Fisher; Fig. 3B complementaria). A extensión do empalme para aqueles intrones mantidos significativamente tanto en SOD1 MU como en FUS MU móstrase nun mapa de calor na fig. 2b. Estes forman unha rede de proteínas enriquecidas no splicing e na tradución do ARN (Fig. 2C, D). Isto mostra que os eventos IR identificados no noso modelo de ALS tamén están incluídos en MNS que levan outras mutacións causadas por ALS que non mostran unha situación incorrecta do TDP-43. Acumulativamente, estas conclusións confirman a posibilidade dunha xeración aberrante en diferentes formas xenéticas de ALS.
As transcricións implicadas na inducción neuronal mostran unha retención xeneralizada de intrones no MN derivado das mutacións que causan ALS FUS e SOD1. ilustracións caixa mostrando a distribución da porcentaxe de retención para 167 intrões realizada manualmente nas MNS control (caixa branca), as MNS mutante Mu fusi (caixa gris) ou mostras de SOD-1 Mu MNS (azul bar) 28, 50. As mostras mutantes exhiben sistematicamente unha maior proporción de ir en comparación cos controis. Os diagramas de caixa móstranse na figura 1h. B Heatmap agrupado xerárquicamente (distancia de Manhattan e Ward Agruping) de niveis relativos de IR en 40 xenes que mostran unha retención estadísticamente significativa durante a neurogénesis do motor tanto en SOD1 MU como en FUS MU MNS.círculos azul = mostras SOD1 mu, círculos grises = mostras de fusi Mu e círculos baleiros = mostras de control. C Rede de interaccións proteína-proteína para xenes que exhiben ir durante a neurogénesis do motor en SOD1 MU ou FUS MU MNS. Os bordos representan as interaccións proteína-proteína que se describen experimentalmente anotadas na cadea de base de datos 51. Os nodos indican proteínas, coloreadas segundo as condicións nas que mostra as mensaxes de transcrición correspondentes; Os tamaños dos círculos son proporcionales ao número de bordos da rede. D gráficos de barras que amosan puntuacións de enriquecemento (P Valor P Valor Fisher Proba) do GOS biolóxico asociado a xenes que mostran durante a neurogénesis motor en SOD1 MU e / ou FUS MU MNS en comparación cos controis
imaxe de tamaño completo
Remodelación UTR transitoria UTR 3 ‘en neurogénesis precoz
O splicativo e a regulación da poliadenilación adoitan estar interconectados. Para examinar se a lonxitude de UTR 3 varía ao longo da diferenciación e como o VCP Mu afecta a este proceso, primeiro ampliamos o catálogo actual do UTR Ensembl 3 ‘usando os nosos datos de ARN-Seq (ver métodos); Para cada xene, analizamos as súas lonxitudes máximas expresadas no curso da diferenciación. Tanto as mostras de control e VCP, as lonxitudes medias de 3 ‘UTR para 12, 364 xenes expresaron continuamente aumento durante o curso do tempo de diferenciación. Non obstante, excepcionalmente, UTR 3 ‘nas mostras de control están temporalmente acurtadas durante a etapa NPC (valor de P < 0, 01; test Wilcoxon; Fig. 3A). Como se espera que un alongamento de UTR 3 ‘do desenvolvemento embrionario, a redución observada na fase NPC (en comparación con IPSC) é sorprendente.
variación da lonxitude de 3 ‘UTR durante a neurogénesis do motor humano. Para os diagramas de caixa de 3 ‘Distribucións máximas de lonxitude UTR expresadas en diferentes etapas da diferenciación de MN nas mostras de control (esquerda) e VCP MU (dereita). Valor Val obtido coa proba de Wilcoxon. B Gráficos de Bar mostrando os números UTR 3 ‘con cambios estatísticamente significativos entre o promotor distal (esquerda) eo promotor proximal (dereito) en diferentes etapas de diferenciación en comparación con IPSCS no control (barras grises) e mostras de MU VCP (barras de magenta). Inserción, gráficos circulares que representan as proporcións de xenes que exhiben o uso de UTR en alternativa nas mostras de control e VCP MU (branco), só as mostras de control (área gris) ou só as mostras VCP Mu (área magenta). A análise de enriquecemento de rutas biolóxicas asociadas a xenes que mostran cambios distales estatísticamente significativos no uso do sitio de Poly (a) no control MM en comparación co control IPSC. D, e á esquerda, as opinións do navegador do xenoma dos perfís de ARN-Seq nos 3 ‘UTR de GNL1 e os xenes de Tardbp que mostran cambios estatísticamente significativos en proximal a distal no uso do sitio Poli en MMN en comparación con IPSCS. Á dereita, os gráficos de barras mostran o uso distal da UTR de 3 ‘en relación ao 3’ Proximal UTR. P- Valores obtidos coa proba de Fisher Count. F O mesmo que C por xenes que amosan cambios proximais estacionalmente significativos no uso do sitio Poly (a) no control NPC en comparación co control IPSC. G, h igual que D para os xenes ZNF254 e Dars que mostran cambios distantes a proximal estadísticamente significativos no uso do sitio de poli (a) en NPC en comparación con IPSC
imaxe de tamaño completo
Para investigar aínda máis a dinámica do procesamento UTR en 3 ‘, analizamos os sitios Tandem Poly (a) que se situaban no mesmo terminal Exon. Usando o número de lecturas asignadas ao terminal de 300 NT do segmento de cada 3 ‘UTR como proxy para o nivel de expresión ISOFORM, cuantificamos o uso do sitio alternativo de Poly (a) en diferentes etapas de desenvolvemento en comparación con IPSC. 822 xenes UTR ‘mostran cambios estatisticamente significativas en 3 de control e / ou VCP Mu (Fig. 3B). En 171 xenes, hai un maior uso do sitio distal de Poly (a) tanto no control como no VCP MMN (Fig. 3b), segundo un estudo anterior 29; Estes xenes están enriquecidos en termos relacionados co Splicice MRNA (Fig. 3C). Na etapa MN < 10, os xenes mostran un uso diferencial significativo de 3 ‘UTR cando se comparan directamente as culturas de control e VCP MU, o que confirma unha regulación de lonxitude de 3’ UTR similar Na diferenciación terminal entre control e VCP MU (Fig. 4A suplementaria).Cómpre salientar que, en varios casos, as mostras de VCP Mu mostraron un importante cambio distal do promotor nunha etapa relativamente anterior para controlar as mostras. Estes exemplos inclúen GNL1 (Fig. 3D) e Tardbp (Fig. 3E); Este último tamén mostra unha acumulación de ISOFORM de UTR 3 ‘en SOD1 MN en comparación cos controis, pero non en FUS MU (Fig. 4C, D). Ningunha destas variacións en UTR en 3 ‘levou a cambios mensuráveis na expresión de xenes ou proteínas (fig. 4e, f, com complementaria).
de 822 xenes, 169 exhiben un cambio proximal ao promotor Estadísticamente significativo específicamente no control NPC en comparación con IPSCS (Fig. 3b). Varias rutas biolóxicas, como a transcrición e regulación da neurotrofina, están representadas entre transcricións que mostran un acortamento de UTR de 3 ‘transicional (Fig. 3F). Aproximadamente o 80% destes eventos están ausentes en VCP MU (Fig. 3B, G, H); Isto é máis confirmado cando as mostras de VCP Mu e control son comparadas directamente na fase de NPC (Fig. 4A, B). Estes datos demostran que os seus extensos picos de variación de lonxitude UTR antes de ir e caracterizar a transición de IPSC a NPC. É importante notar que as mostras MU VCP non mostran ningún proceso similar aparente.
A regulación na parte inferior do factor de empalme coincide cun IR aberrante
Despois de identificar o principal As diferenzas de empalmina en mostras de ELA en comparación co control, entón intentou comprender se o fondo xenético ELA conduce a diferenzas transcruptoriales medibles durante a neurogénesis do motor. En concreto, investigamos cambios de expresión que non están identificados de forma óptima pola agrupación jerárquica (Fig. 1B), que moitas veces está dominada por un único programa de transcrición. Aplicamos a descomposición de valor exclusivo (SVD) a toda a expresión Matrix (15, 989 xenes en 31 mostras; Fig. 1A) para identificar os principais programas transcripcionais e os procesos biolóxicos asociados que subxacen a neurogénesis do motor 30. Usando este método, atopamos que (1) neurogénesis progresiva (2) indución neuronal e o patrón transitorio e (3) diferenciación terminal con algunha contribución á indución neuronal compoñen os principais programas de expresión celular ortogonal que operan ao longo do curso de tempo de desenvolvemento; Estes primeiros tres compoñentes capturan o 69% da varianza na expresión xénica (Fig. 4A-C, Fig. 5A complementaria). A análise de enriquecemento funcional de GO de grupos xenes que foron asociados de forma positiva ou negativa con estes compoñentes (Fig. 4D-F) confirma a asociación biolóxica de cada compoñente principal. É importante notar que as mostras de control e VCP MU compórtanse de forma similar nestes tres primeiros compoñentes. Unha análise lineal multivariante confirmou que o tempo na cultura no canto da mutación VCP é a variable que explica os compoñentes 1, 2 e 3 (fig. 5b complementary).
Regulamento para os compoñentes globais de consumo de baixos partidos. A – C valor de descomposición de valor singular da expresión de 15, 989 xenes en n = 31 mostras. Á esquerda, os gráficos de liña amosan os perfís de expresión dos tres primeiros vectores singulares \ (\ superaciónTarrow V _1) a través de \ (\ superaciónTarrow v _3 \), capturando 47%, 15% e 7% da varianza na expresión xénica , respectivamente. Os puntos de datos grises e magenta indican a expresión de mostras de control e Mu VCP. Á dereita, o mapa de calor da expresión estandarizada de xenes cuxos perfís de expresión correlacionan positivamente (indicados polos tres rectángulos máis escuros) e negativos (indicados polos tres rectángulos máis claros) cos tres primeiros vectores singulares á dereita. Os gráficos de barras D-F mostran as funcións de enriquecemento de GO Biological Funcións de xenes que están positivamente correlacionados (tres barras máis baixas) ou negativamente (tres barras máis baixas) cos tres primeiros vectores singulares á dereita. Os diagramas de bar de G na parte superior, que representan o número de xenes regulados ao descenso das mostras de MU de VCP en comparación co control en diferentes etapas da diferenciación de MN. A continuación, o mapa de calor das funcións biolóxicas de Go enriquece entre os xenes regulados nos puntos de tempo correspondentes.H MECH DIAGRAMS que mostran as distribucións de cambios nos cambios de rexistro de 66 xenes do factor de splicing esencial entre os mutantes e os controis de ALS; Branco Boxes = VCP MU en comparación cos controis, Blue Box = SOD1 MU en comparación con controis isógenos, caixa verde = FUS MU en comparación cos controis
Imaxe de tamaño completo
Seguinte, realizamos un Análise diferencial da expresión xénica para avaliar se os xenes específicos están regulados diferencialmente en diferentes etapas do desenvolvemento neuronal en MU VCP en comparación coas mostras de control. Douscentos cincuenta e seis xenes foron rexistrados estatisticamente en VCP MU no escenario NPC durante o cal un IR aberrante ocorre (LOG2FC > e valor de P < 0,01); Estes xenes son altamente enriquecidos no empalme de ARNm e as funcións de procesamento do 3 ‘FIN (Fig. 4G). Nótese que 47 destes xenes codifican Rbps (Fig. 5D complementaria). Había moitos menos xenes regulados cara arriba (Fig. 5C complementario). Tamén examinamos os niveis de expresión de 66 xenes reguladores de splicatory coñecidos 31; Existe unha clara regulación descendente global na fase NPC das mostras VCP Mu eo SOD1 Mu e fusi independente, coinciden cun IR aberrante no seu caso (Fig. 4h).
En resumo, Nós Descubriu que os programas de procesamento de transcrición e ARN reflicten a ruta de desenvolvemento de MN xa que as vías específicas están activadas por etapas. A pesar dos defectos post-transcripcionais, o programa transcripcional primario non se interrompe durante a diferenciación MN pola mutación VCP. Non obstante, unha regulación global descendente na expresión dos compoñentes de empalme ocorre concomitantemente cun iris aberrante en varias mutacións que causan als.
transcricións de IR citoplasmática e perda nuclear da proteína SFPQ
o Gene SFPQ, membro da familia do comportamento de Drosophila, o splicing humano (DBHS), codifica unha proteína que realiza funcións clave na transcrición, empalme, 3 ‘procesamento final e viabilidade dos axóns 32, 33, 34, 35. Aquí, o Intron 9/9 de 9 KB no xene SFPQ mostra o evento IR máis destacado identificado durante a neurogénesis do motor nas nosas mostras MU NPC de VPC en comparación cos homólogos de control. É importante notar que o SFPQ IR Aberrant tamén ocorre en SOD1 MU e MU MN en comparación cos controis (Fig. 5A, C). Validamos SFPQ IR ea súa desregulación en MU VCP en comparación coas mostras de control mediante a análise de QPCR de varias liñas de IPSC independentes (tres clons de tres controis saudables e catro clons de dous pacientes con mutacións VCP; Fig. 5B e Fig. 6A suplementaria). Ademais, validamos dous reguladores conxuntos de GUS e DDX39, que son igualmente afectados no NPC VCP MU, e en SOD1 MU e MU MN (fig. 6b-g suplementary).
Blengthing do intrón SFPQ en varias formas xenéticas de ALS ea súa interacción con proteína SFPQ .. Á esquerda, as opinións do navegador do xenoma dos perfís de ARN-Seq para o xene de retención de intregrade SFPQ en mostras de control e VCP nas etapas de IPSC, NPC e PMN. O intrón de 9 KB 9/9 de interese está indicado por unha caixa amarela. Á dereita, os gráficos de barras que cuantifican a porcentaxe de pasar ao longo do tempo no control e na VCP Mu (media ± SD; Fisher Count Test). b gráficos de barras que amosan os niveis de IR SFPQ medidos por QPCR; Bares brancos = Controis, barras negras = VCP Mu. Os niveis de ir en cada punto do tempo foron comparados cos da etapa IPSC do mesmo grupo. N = 3 liñas de control e n = 4 liñas VCP (media + sd * p < 0.05, ** p < 0.01, ANOVA ONE Camiño con corrección de Dunnet para múltiples comparacións). Os gráficos de bar de C que mostran a porcentaxe de SFPQ IR para FUS MU ou SOD1 MN MN no control en comparación con (media ± SD; Fisher Count Test). D Gráficos de barras D representan o nivel de enriquecemento na unión de RBP ao intrón que se conserva en comparación cos intrones que non se conservan dentro do mesmo xene; Barras azuis = xene SFPQ, bares verdes = Gen fus. E – F Vista do navegador do xenoma de Eclip SFPQ eventos cruzados ao longo das anotacións de transcrición de SFPQ e FUS. As pinturas grises resaltan a localización dos intróns retidos. G Gráficos de barras que mostran o nivel de localización nuclear e citoplástica das transcricións medidas por QPCR.Os niveis de ir en cada fracción foron comparados cos da fracción nuclear do control IPSC. N = 3 liñas de control e n = 4 liñas VCP, medios + valor SD p bidireccional ANOVA con corrección de tukey para múltiples comparacións. H SPFQ Subcelular Localización determinada por inmunocitoquímica en IPSCS, NPCs e PMNS. A proporción da intensidade media da mancha SFPQ no núcleo (n) versus citoplasma (c) foi determinada automaticamente nas células MU CTRL e VCP. Os datos mostrados son a relación n / c (± SD) por campo de visión de catro liñas de control e catro liñas MU VCP. Valor de proba T non emparejado con corrección de WELCH. Vexa tamén a figura 7D complementaria
imaxe de tamaño completo
Examinamos os datos de codificación a grande escala de códigos de 112 RBP en K562 e HEPG2 para identificar os candidatos que se unen aos intrones que se conservan en SFPQ e FUS 36, 37. A clasificación destes RBPs debido á proporción de eventos cruzados na intronement en comparación cos intróns non retenidos no mesmo xene revelou que SFPQ e HNRNPM son os RBPS máis enriquecidos (Fig. 5D-F e Fig. 7A suplementarias). Isto indica que a proteína SFPQ está directamente adxunta aos intróns SFPQ e FUS retenidos.
Ao descubrir probas de interaccións entre a proteína SFPQ e a intron 9/9 de SFPQ, tratamos de comprender a natureza desta interferencia .. Os cambios en IR non están acompañados por unha diferenza estatisticamente significativa nos niveis de expresión de xenes ou proteínas entre VCP MU e as mostras de control (Fig. 7b, c). No seu canto, usamos a fraccións citoplasmáticas nucleares e identificamos unha abundancia estadísticamente maior da norma de retención de intron SFPQ no citoplasma MU de VCP en comparación coas culturas de control (figura 5 g). Estes descubrimentos xuntos levaron á investigación da distribución subcelular da proteína SFPQ. Atopamos unha perda nuclear de modesta pero estadísticamente significativa da proteína SFPQ en VCP MU Cultures (Fig. 5h).
En resumo, o aumento máis significativo de pasar por VCP, FUS e SOD1 vese na transcrición de SFPQ. Esta secuencia de intron é amplamente ligada pola proteína SFPQ e os dous membros deste complexo (é dicir, a proteína e a transcrición da retención de intróns) exhiben unha distribución de células aberrantes.
perda nuclear de SFPQ a través da familia ELA e esporádica
Tendo establecido unha diminución da abundancia nuclear da proteína SFPQ na diferenciación de cultivos de IPSC, buscouse probar a xeneralización deste achado a través de modelos transxénicos de AL en Vivo e do tecido humano Mortem de casos de ELA esporádicos. Para iso, primeiro examinamos dous modelos transxénicos de Mouse ALS, incluíndo SOD1 G93A e VCP A232E. Usando este enfoque, demostramos a perda nuclear da proteína SFPQ da medula espiñal con ambas mutacións xenéticas relacionadas con ALS (Fig. 6A). Polo tanto, a perda nuclear da proteína emerxe en diferentes formas xenéticas do ELA que se sabe que exhibe a proteínopatía TDP43 (VCP MU) e aqueles que non (SOD1 MU). Obtendo que o 90% dos casos de ELA non están familiarizados, entón examinamos o tecido post-mortem da medula espiñal dos casos de ELA en humanos esporádicos. De feito, demostramos unha sorprendente perda nuclear da proteína SFPQ na era esporádica humana en comparación cos tecidos normais de control, que subliña a relevancia máis ampla deste descubrimento (Fig. 6b). Dende estes resultados, chegamos á conclusión de que a perda nuclear da proteína SFPQ é un selo distintivo a través de varios modelos in vitro e in vivo que representan ALS familiares e esporádicos.
A depuración nuclear de SFPQ é un selo molecular de ALS xenética e esporádica. Análise da localización subcelular de SFPQ en MN na medula espiñal ventral de ratos tipo salvaxe, VCP A232E e SOD1 G93A. O citoplasma MN foi identificado pola tinción de chat, os núcleos foron contrastados con Dapi. Os datos mostrados son a proporción nuclear / citoplasmática (N / C) (media ± SD) por célula de tres ratos SOD1 G93A e 3 VCP A232E de tipo salvaxe. Barra de escala: 20 μm. P- WELCH T valores de proba dun lado. As células animais individuais en cada condición agrúpanse logo de excluír o efecto dos ratones individuais comparando modelos lineares completos (enfermidade e factor individual) con modelos lineais reducidos (a enfermidade só) usando os criterios de información de Akaike. B Análise da localización subcelular de SFPQ en MN na medula espiñal ventral de controis e pacientes con Sporadic ELA (Sals).O citoplasma MN foi identificado pola tinción de chat, os núcleos foron contrastados con Dapi. Só se consideraron a análise de MN cun núcleo visible. Barra de escala de 50 μm. Os datos mostrados é unha relación n / c (media ± SD) por célula de tres casos por grupo
imaxe de tamaño completo
discusión
Os obxectivos desta O estudo foi dobre: (i) resolvendo eventos alternativos de procesamento de ARN que subxacen nas distintas etapas da MN e (II) restrición de mecanismos patóxenos primarios entre formas patológicamente diverxentes de ELA (é dicir, con ou sen proteínopatia TDP43). Para lograr isto, integramos a diferenciación dirixida dos IPSC específicos específicos en MN. Espinales con secuenciación de ARN e exame bioinformático completo. Amosamos que un sólido programa de unión subliña o desenvolvemento de MN como resumido na figura 6a. Ao resolver a natureza precisa dos programas post-transcripcionais secuenciales que subxacen as diferentes etapas da diferenciación de MN, revelamos que o tempo destes acontecementos moleculares coidadosamente coreografados é perturbado pola mutación VCP causada por ALS. Ao analizar as mostras de MN relacionadas con ALS adicional, tamén amosamos que a historia dos xenes de ALS, como SOD1 e FUS, afectan a estrutura de transcrición dos reguladores de empalme de RNA clave dun xeito similar aos obxectivos do Programa de Splicación Aberrante en mostras VCP. Ademais, mostramos que unha regulación ao descenso global dos compoñentes de empalme coincide cos defectos de splicing. Este “debilitamento” da maquinaria de empalme proporciona unha explicación plausible para o IR aberrante que atopamos no ALS relacionado coa mutación VCP, SOD1 e FUS. A transcrición SFPQ exhibe a intron mantida de forma máis significativa, á que a proteína SFPQ está adxuntada, proporcionando evidencias dunha interacción directa entre a proteína ea transcrición que conserva o intrón. Tamén mostramos que a transcrición de retención de intron SFPQ é exportada ao citoplasma. Isto ocorre en maior medida no mutante VCP que coincide co Programa Aberrante IR. Isto levounos a examinar a localización celular da proteína SFPQ, que descubriu a súa perda nuclear en ALS. SFPQ codifica un regulador clave da localización e desenvolvemento axonal do ARNm 38. Xuntos, estes resultados representan a idea de que a estrutura de transcrición desregulada pode desempeñar un papel fundamental na dexeneración axonal durante o desenvolvemento do ELA. De feito, SFPQ está emerxendo como un regulador clave da neurodegeneración máis amplamente amplamente 34, 38, 39, 40.
Cambios dinámicos de que se informou previamente no Forelebre de roedores entre diferentes etapas de desenvolvemento 41, 42 .. Aquí identificamos modificacións que non se recoñeceron previamente na estrutura de transcrición xenética que regulan o procesamento e empalme de RNA nas etapas iniciais da restrición de linaje MN humana (Figura 7A). Amosamos que unha remodelación máxima de 3 ‘UTR, incluíndo o acortamiento de 3’ UTR, precede a ir. En concreto, hai unha variación de lonxitude estatisticamente significativa de 3 ‘que afecta ás estruturas do transcrito cando as células saen da pluripotencia durante a indución neural. Isto precede ao pico de acumulación de transcrición de retención de intron que se produce no patrón neural da medula espinal ventral. Despois diso, o alongamento progresivo progresivo en 3 ‘, a inclusión de cassette exons eo splicing intrón caracterizan as fases restantes da diferenciación terminal a MNS como se mostra previamente 1, 6.
Diagrama esquemático do modelo proposto. Unha caricatura que resume o curso temporal de eventos post-transcripcionais que subxacen a neurogénesis do motor humano no control e as mostras MU VCP. Os nosos resultados suxiren que os eventos de procesamento de ARN predominantes nunha fase inicial da diferenciación neuronal son ir e remodelar 3 ‘UTR. Estes eventos comezan prematuramente en mostras MU VCP, pero non afectan os principais programas de transcrición que subxacen a diferenciación do MN humano. B Caricatura que resume a consecuencia funcional dun IR aberrante no xene SFPQ a través de varias formas xenéticas e esporádicas de ALS. Intron 9/9 de 9 KB en SFPQ está preservado en todos os fondos mutantes de Als, o que leva a unha maior abundancia citoplasmática de transcricións afectadas. A proteína SFPQ está amplamente ligada ao intrón retenido. A proteína SFPQ en si mesma é reubicada do núcleo ao citoplasma en todos os fondos mutantes de ALS, así como nas mostras post-mortem de pacientes esporádicos con ELA.
Imaxe de tamaño completo
UTR en 3 ‘Funcións clave de reprodución na regulación da expresión xénica post-transcripcional e MRNA expresada en tecidos cerebrais xeralmente teñen UTR en 3’ máis longa en comparación con Outros tecidos 12, 13. De feito, obsérvase un alargamento progresivo do ARNm 3 ‘UTR durante o desenvolvemento embrionario do rato 29. Aquí observamos unha extensa variación na lonxitude de 3 ‘UTR durante a indución neural dos IPSCs humanos. Inesperadamente, atopamos un acortamento transitorio de 3 ‘UTR que precede ao progresivo elongación de 3’ UTR anteriormente informado durante a diferenciación do terminal. A función molecular deste acortador permanece clara, aínda que outros estudos informan dun papel potencial do UTR 3 ‘na formación de parasitos e a saída da pluripotencia 43, 44. A natureza altamente transitoria deste proceso normativo pode explicar por que evadiu a detección experimental ata a data. O noso deseño experimental resolto ao longo do tempo permitiu a identificación de programas transportivos secuenciales que subxacen a neurogénesis do motor humano.
está a ser un novo mecanismo post-transcripcional que regula a expresión xénica. Os tipos de células neuronais e inmunitarias teñen maiores proporcións de intronses que se conservan en comparación con outros tecidos 7. Os estudos previos mostraron progresivos durante a diferenciación terminal das neuronas do rato e a relevancia das transcricións que conservan intron na regulación dos xenes específicos das neuronas vinculadas funcionalmente nos modelos de rato 6, 7. Aquí ofrecemos evidencias dun aumento transitorio nas transcricións de retención de intróns no escenario PMN que está dirixido a unha rede de reguladores de splicing. Ao recoñecer a interacción entre os acontecementos IR e os parespeckes nucleares, isto suscita a posibilidade de que estas transcricións contribúan á estabilización dos pares ou que son dinamicamente dinámicamente ditas estruturas nucleares para inhibir a súa función. Os experimentos futuros determinarán a estabilidade e a localización de tales transcricións.
Demostramos que a sincronización dos programas post-transcripcionais está perturbada en mostras con mutacións VCP que causan als, con prematuro e aumentado e, ata certo punto, cunha variación de lonxitude de 3 ‘UTR. Curiosamente, os principais reguladores de splicing de RNA seleccionados polo Programa Aberrante Junction en VCP Mu Samples tamén mostraron unha ampla IR no MN que protexen as mutacións noutros xenes de ELA, incluíndo SOD1 e FUS. En particular, observamos unha expresión reducida dos compoñentes clave do spliceosoma coincidindo cun IR aberrante en VCP, SOD1 e FUS. Isto é consistente cun recente estudo, que mostra a asociación entre IR e contratación reducida de factores de splicing 45. Aínda que o programa conxunto aberrante nas mostras de MU VCP podería estar ligado á dexeneración neuronal, a falta de cambios nos programas transcripcionais asociados coa neurogénesis do motor indica que as disfuncións no procesamento de IR e final 3 ‘non afectan o desenvolvemento fundamentalmente neuronal. Estes descubrimentos xuntos elevan a hipótese de que o Aberrante IR representa as manifestacións sutís dunha forma desregulada de desenvolver neuronas, que eventualmente contribúe á maior vulnerabilidade do MNA madura.
A transcrición de retención de intron máis significativa a través de modelos MU VCP , SOD1 MU e FUS MU IPSC foron SFPQ, que codifica unha proteína que realiza funcións clave en formas de saída relacionadas coa ELA, incluíndo a transcrición de ARN, o splicing, o procesamento final 3 ‘ea viabilidade do axón 32, 33, 34. Os experimentos posteriores mostraron que a transcrición da retención de intrusión é máis abundante no citoplasma de VCP MU en comparación cos homólogos de control e coincide coa diminución nuclear da proteína SFPQ. Tamén pensamos que a proteína SFPQ está amplamente ligada ao seu intrón retenido. A auto-regulación entre as proteínas de unión de ARN (RBPS) (por exemplo, o TDP43) é recoñecida e, polo tanto, este descubrimento é consistente coa literatura anterior 46, 47. De xeito crucial, atopamos a perda nuclear da proteína SFPQ en ambos os modelos transxénicos de SOD1 e o rato VCP e no cordón esporádico esporádico esporádico, o que suxire que isto representa un selo molecular de ALS. Polo tanto, propoñemos que a interacción entre a proteína SFPQ ea súa transcrición que conserva o intrón impón a súa co-localización aberrante no citoplasma (Fig. 7b).A abundancia reducida da proteína SFPQ nuclear pode afectar o empalme antes do ARNm, que podería contribuír a defectos post-transcripcionais que nós e outros identificaron en ALS 48, 49. Xuntos, descubrimos que o IR na transcrición de SFPQ e a perda nuclear da proteína SFPQ son características moleculares comúns en varias formas xenéticas e esporádicas de ALS.
Declaración de ética
Obtivo o consentimento informado de todos os pacientes e controis saudables neste estudo. Todos os protocolos experimentais realizáronse de acordo coas regras e directrices aprobadas polo Comité Nacional de Ética de Investigación do Hospital Nacional de Neuroloxía e Neurocirugía da UCLH e do Instituto de Neuroloxía da UCL (09/09/0272).
Derivación de fibroblastos humanos e IPSC
Os fibroblastos dérmicos foron cultivados en Optimem + FC a 10%. Os seguintes plásmidos episómicos foron transfectados para a xeración IPSC: PCXLO HOCT4 SHP53, PCXLE HSK e PCXLE HUL (addngene), como se informou anteriormente. Os detalles das liñas utilizadas neste estudo son proporcionadas na táboa complementaria 1. Dous das liñas de control utilizadas (Control 2 e Control 3) están comercialmente dispoñibles e compras desde Corell (ND41866 * C número de catálogo) e Thermofisher Scientific (Cat Non . Número A18945), respectivamente.
Cultura célula
Os PSC inducidos foron mantidos en Geltrex (Life Technologies) cun medio esencial (tecnoloxías de vida) e pasaron usando EDTA (Tecnoloxías de vida , 0, 5 mm). Todas as culturas celulares foron mantidas a 37 ° C e 5% de dióxido de carbono.
Diferenciación de neuronas de motor
A diferenciación MN realizouse usando unha versión adaptada dun protocolo 19 publicado anteriormente. Brevemente, os IPScs difiren por primeira vez en NeurePithelium mediante o 100% de confluencia en medio definido químicamente composto por DMEM / F12 glutamax, neurobasal, l-glutamina, suplemento N2, aminoácidos non esenciais, suplemento de B27, β- mercaetanol (todas as tecnoloxías da vida) e a insulina (SIGMA). O tratamento con pequenas moléculas do día 0 a 7 foi a seguinte: dorsomorfina 1 μm (milipóro), SB431542 2 μm (Biosciencia TOCRIS) e CHI99021 3, 3 μm (Miltenyi BIOTEC). O día 8, a capa neurepithelial estaba enzimáticamente disolta usando a dispaa (GIBCO, 1 mg ML- 1), foi colocado en follas revestidas con laminina e, a continuación, modelado por 7 días con ácido retinoico 0, 5 μm e 1 μm Purmorfamin. O día 14, os precursores da medula espiñal MN foron tratados con purmorfamina 0, 1 μm por 4 días máis antes de diferenciar terminalmente durante
10 días en composto e 0, 1 μm (Enzo vida Ciencias) para promover a saída do ciclo celular. Nos puntos de tempo relevantes, as células foron recollidas para a extracción de ARN ou foron fixos en 4% paraformaldeído para inmunomarcaje.
Extracción de ARN e secuenciación
O kit de células de ARN simple de Promega Maxwell RSC que inclúe o tratamento con ADNASA, xunto co instrumento Maxwell RSC, foi usado para extraccións de ARN. Para validacións de QPCR, o ARN foi extraído co RNEYS PLUS MINI KIT (Qiagen). O nanodrop foi usado para avaliar a concentración de ARN e a relación 260/280, eo bioanalista Agilento foi usado para avaliar a calidade. As puntuacións de integridade de ARN (RIN) foron > 8 para todas as mostras utilizadas neste traballo. As bibliotecas de RNaseq preparáronse utilizando o kit de mRNA trenzado Trusq (Illumina) con 1 μg de entrada de poli (a) + ARN. A continuación, os produtos foron purificados e enriquecidos con amplificación de PCR para crear as bibliotecas finais de CDNA. As bibliotecas foron enviadas para a secuenciación de alto rendemento, foron executados por 75 ciclos nunha célula de fluxo rápido, na instalación central de NGS do Instituto de Neuroloxía usando o Hiseq2500. Para a análise de transcricións nucleares e citoplasmáticas, utilizouse o kit de purificación do citoplasmático e nuclear de ARN (norgen biotek corp).
Os datos de secuenciación de ARN
a RNA foron obtidos dunha única secuencia de 50 BP de cinco etapas que non sexa a diferenciación de MN das mostras de control e VCP Mu (IPSC e os días 7, 14, 21 e 35); As mostras están listadas nos datos complementarios 1. O número de acceso de expresión xénica omnibus (GEO) para as bibliotecas de ARN-SEQ é GSE98290.Tamén obtivemos secuenciación de ARN único e emparejada de finais derivados de dous estudos independentes de diferenciación neuronal in vitro de Hescs (GSE20301 22 e GSE86985 23); dous estudos independentes sobre formas familiares de ALS causadas por mutante SOD1 (n = 5; 2 SOD1A4V de SOD1A4V e 3 de control isógeno). As mostras da mutación que a mutación foi corrixida; HB9 FACS purificado MNS, GSE54409 27 ou FU (N = 6; 3 fontes derivadas polo paciente R521G e 3 controis de irmáns saudables MNS, GSE77702 28; Dúas Datos de ARN-seq de Human COS compartidos por Miha Modic; Dous Fetal SPMN (E-MTAB-3871; NIH Wrapmap Epigenomics Mapping Consortium) e SPMN adulto (láser -Captured SPMN; GSE76514 53) Mostras.
Datos de expresión Pre-procesamento
Single-and Beared-Ler para cada un dos estudos inicialmente aliñados ás secuencias de ARN ribosomal para filtrar lecturas que pode provir da contaminación do ARN ribosomal usando Bowtie2 (-V 0) 57. As letras restantes estaban aliñadas co xenoma humano (H19) usando o aliñador de empalmante aliñador tophat2 58 con parámetros predeterminados. Todas as bibliotecas xeradas neste estudo tiña IV id = “200D958F0F” 1% RRNA, 90% de variedad e > 70% de exon IC le.
Cantificación xenética e caracterización sen supervisión do conxunto de datos
A cuantificación absoluta dos xenes realizouse mediante o reconto de HTSEQ 59. posterior análise realizouse co paquete estatístico R versión 3.3.1 (2016) ea versión Bioconductor bibliotecas 3.3 (R Core Team R: A linguaxe e ambiente para Statistical Computing Viena, Austria: .. R Foundation for Statistical Computing; 2013).
Antes da análise de clustería sen supervisión das 31 mostras da diferenciación de MN, identificamos xenes de forma fiable expresada por cada condición (MU VCP ou control nos días 0, 7, 14, 21 e 35). Para unha mostra dada, o histograma de Log2 Gene Conde é xeralmente bimodal, cos modos correspondentes a xenes non expresados e expresados. Os xenes expresados de forma fiable foron identificados ao axustar unha mestura gaussiana de dous compoñentes ata os datos de Gene COUNT de Log2 estimados con Pack McLust 60. Un xene foi considerado de forma fiable expresada nunha condición dada se a probabilidade de que pertencía á clase non expresada foi inferior ao 1% en cada mostra pertencente á condición. 15, 989 xenes foron seleccionados en función da súa expresión detectada en polo menos unha das 10 condicións (é dicir, cinco timepoints diferentes de restrición de linaje para o control e VCP MU). A continuación, o cuántico normalizamos as columnas do Gene Count Matrix con RAGE R Limma 61. A agrupación xerárquica non supervisada da matriz de xenes filtrada e normalizada foi realizada con correlación de rango de Spearman como medida de distancia e algoritmo de clusterización completa.
realizamos SVD da expresión dos 15, 989 xenes a través das cinco etapas distintas de diferenciación de MN a partir de controis saudables e mu VCP. A continuación, seleccionamos os compoñentes maximamente capturando a varianza na expresión xénica. Para visualizar os vectores singulares correctos \ (\ Left \ {{{\ superaciónArrow v _k} \ right \} \), trazamos a expresión sobre o eixe vertical como función do tempo correspondente a cada mostra no eixe horizontal e colorear todo As mostras correspondentes a controis saudables grises e os correspondentes a VCPMU en Magenta. A continuación identificamos xenes cuxos perfís de expresión correlacionados (correlación de Pearson entre o perfil de expresión xénica individual e os vectores singulares dereito) e contribuíron (proxección de cada perfil de expresión xénica individual en vectores singulares correctos) con máis forza (de forma positiva ou negativa) co perfil de expresión do perfil de expresión Vectores singulares. Para identificar xenes representativos para cada vector singular, os xenes foron clasificados segundo as puntuacións de proxección e correlación. O máis alto (as puntuacións máis positivas tanto na proxección como na correlación) e ás máis baixas (as puntuacións máis negativas en xenes de correlación e proxección) foron seleccionados para cada vector singular usando a clusterización de k-media para a análise de enriquecemento de entrada.
Análise De APA de ARN-SEQ
Para a identificación da identificación UTR alternativa de UTR de RNA-SEQ, a cobertura varada de nivel de nucleótidos obtívose para cada unha das 31 mostras que utilizan Genomecov do Suite de BedTools 62. A continuación identificáronse continuamente as rexións transcritas continuamente usando unha xanela deslizante en todo o xenoma que requiría unha cobertura mínima de sete leas en máis de 80 posicións por xanela de 100 BP; As rexións veciñas separadas por rexións de baixo custo foron fusionadas como anteriormente descritas 13. Os fragmentos expresados foron entón asociados coa superposición de 3 ‘UTR usando as últimas versións de Ensembl HG19 V75 63.Rexións expresadas illadas que non se superpoñen con ningunha característica foron asociadas ao máis próximo a 3 ‘UTR se (1) a característica anotada máis próxima non era máis que unha UTR 3’ (2) se a liña da rexión expresada estaba en liña co Strand do máis próximo 3 ‘UTR, e (3) Se a distancia ao UTR 3’ era inferior a 10’000 KB, que é o rango de distancia intragénica. Os UTRs resultantes de 3 ‘foron sometidos a un amplo filtro para excluír a transcrición intragénica potencial, as transcricións superpuestas e os intrones retenidos como anteriormente descritos 13. Finalmente intercambiamos o segmento UTR máis longo de 3 ‘anotados con datos de ARN-Seq cunha anotación de sitios de Poly (a) construída con letras de 3′-end Secuenciando bibliotecas en mostras humanas 64 para obter Poly Putative (a) dentro do segmento de UTR máis longo 3’ de cada transcrición.
A continuación, usamos o número de letras mapeadas a -300 NT rexión de terminal de cada 3 ‘UTR ISOFORMS como proxy para o nivel de expresión ISTORM de 3’ UTR para identificar os cambios no uso do proximal e sitios distantes de poli (a). A densidade de mapeado le na rexión terminal de 300 NT de 3 ‘istr ishroform é bimodal, cun pico de baixa densidade probablemente correspondente á transcrición de fondo IE 3’ UTR ISOFORMS de pouca abundancia ou 3 ‘UTR ISOFORMS á que leu que leu foron falsamente mapeados, e un pico de alta densidade correspondente a expresar 3 ‘istr torments. Para identificar de forma fiable expresada 3 ‘UTR ISOFORMS no estudo, unha mestura gaussiana de dous compoñentes foi axustada aos datos usando o paquete R MCLUST 60; Unha isoforma foi chamada de forma fiable expresada se en ambas as réplicas tiñan menos de 1% de posibilidades de pertenza á categoría de fondo.
Para identificar as transcricións que mostren un cambio marcado no uso do sitio Poly (a) entre as condicións , marcamos as diferenzas no uso de sitios proximais a distal (a) usando as seguintes dúas puntuacións:
\ (s_1 = {\ mathrm {log}} _ 2 \ esquerda ({\ frac {{ I _ {\ mathrm {proximal}}}} {{i _ {\ mathrm {Distal}}}}} \ right) _ {\ mathrm {Cond1}} – {\ mathrm {log}} _ 2 \ left ({\ frac { {I _ {\ mathrm {proximal}}}} {{i _ {\ mathrm {Distal}}}}} right) _ {\ mathrm {cond2}} \)
\ (s_2 = \ frac {{I _ {\ mathrm {proximal}}}} {{i _ {\ mathrm {proximal}} + i _ {\ mathrm {distal}}}} _ {\ mathrm {cond1}} – \ frac {{i _ {\ mathrm {proximal}}}} {{i _ {\ mathrm {proximal}} + i _ {\ mathrm {distal}}}} _ {\ mathrm {cond2}} \ in \ left \)
a estatística A importancia dos cambios na relación de sitios proximal-to-distal (a) entre dúas condicións foi avaliada pola proba de conta exacta de Fisher usando contas de lectura crúa resumida de VERSU de Promotor-Proximal S PROMOTER-DISTAL 3 ‘UTR ISOFORMATS ORDINACIÓN DA CONDICIÓNS. Axustamos o control de PVALUE para a taxa de descubrimento falsa (FDR) de 0,01. Restrinxemos a nosa análise sobre as transcricións de conxunto que conteñen polo menos dous 3 ‘UTR xerados pola poliadenilación tándem expresada en condicións de interese. Os cambios proximais foron seleccionados cando \ (s_1 \ le – 1 \), \ (s_2 \ le – 15 \%) e FDR < 0.01; Seleccionáronse o cambio distal cando se seleccionou cando \ (S_1 \ GE 1 \), \ (s_2 \ GE 15 \% \) e FDR < 0.01.
Splicing Análise
A identificación de todas as clases de eventos na diferenciación de MN realizouse cos vastos ferramentas de RNA-Seq. Para que un evento se considere diferente regulado entre dúas condicións, requiriamos unha media δPSI mínima (entre as réplicas emparejadas) de polo menos o 10% e que a transcrición dirixida polo evento de splicing en cuestión é expresada de forma fiable en todas as mostras do condicións en comparación, é dicir, a cobertura de lectura suficiente en todas as mostras de interese. A continuación realizamos o visor integrador de xenómica integración (IGV), a curación manualguidizada para eliminar a baixa cobertura IR obtendo 167 eventos IR de alta confianza. A análise centrada en IR realizouse nestes 167 eventos IR para os que unha porcentaxe de IR foi calculada a medida que a fracción de mapeamento de intróns le á cantidade media de mapeamento de lecturas aos 5 ‘e 3’ exons normalizadas ata a lonxitude do Intron e exóns respectivos. A proba de Fisher Count P -Value foi obtida cando se proban para o IR diferencial entre as condicións.
Análisis Diferencial da Expresión Génica.
Para a análise de expresión xénica diferencial que diriximos Kallisto 54 e Sleuth 55. Kallisto foi usado para (1) construír un índice de transcrición do Ensembl GRC38 Release 85 Homo sapiens Transcriptome (-K 31), (2) pseudo-aliñar o ARN-Seq le ao transcriptome e (3) cuantificar abundancia de transcrición (-b 100-single -l 275 -S 50-RF-STRANDED). A continuación identificamos xenes expresados diferenciados con Sleuth. A análise posterior realizouse coa versión estatística da versión 3.3.1 (2016) e Bioconductor Bibliotecas Versión 3.3 (R Core Team. R: Un idioma e ambiente para a computación estatística. Viena, Austria: R Fundación para a Computación estatística; 2013). Antes de seleccionar xenes expresados diferenciados identificamos xenes expresados de forma fiable.Kallisto saíu a abundancia de transcrición e, polo tanto, calculamos a abundancia de xenes resumindo a conta crúa estimada das isoformas constituyentes para obter un único valor por xene. Para unha mostra dada, o Histograma de Log2 Gene / Transcript contan é xeralmente bimodal, cos modos correspondentes a xenes non expresados e expresados. Os xenes / transcriptos expresados de forma fiable foron a próxima identificada ao axustar unha mestura gaussiana de dous compoñentes ata a transcrición estimada de Log2 e datos de xenes R co paquete MCLUST 60; Engadiuse un pseudocount de 1 antes da transformación de Log2. Un xene foi considerado de forma fiable expresada nunha determinada condición se a probabilidade de que pertencía á clase expresada estaba por riba de 0,1 en cada mostra pertencente á condición. Finalmente, os xenes que mostraron unha expresión diferencial do punto de rexistro e un P -Value < de 0.05 e que foron expresados de forma fiable en estado mutante VCP ou que se consideraban que se consideraban significativamente.
A análise de enriquecemento da análise
Go de análise de enriquecemento realizouse mediante a proba de Fisher Classic con Topgo Bioconductor Package 65. Só se consideraron condicións que conteñen polo menos 10 xenes anotados. Un p -value de 0,05 foi usado como o nivel de importancia. Nas cifras, os termos significativos importantes foron seleccionados manualmente eliminando os termos e termos redundantes que conteñen menos de cinco xenes significativos.
análisis de vermello
Información de interacción de proteína de proteína experimental Recuperado desde a base de datos de cadea 66 e visualizada en Cytoscape 67, 68.
O mapeo de datos de ECLIP
Os datos de ECLIP RAW foron descargados desde a codificación 36, 37. Antes de alineación, a eliminación de adaptadores de dúas etapas realizouse usando CUTADAPT de acordo co procedemento operativo estándar de codificación ECLIP. Tamén se usou un enfoque de dúas etapas para o aliñamento. En primeiro lugar, Bowtie2 foi usado para eliminar liches aliñándose a RRNA ou ARNA. Entón, a estrela foi usada para aliñar as letras restantes a GRCH38, só con letras de mapeamento exclusivamente. Os duplicados de PCR foron colapsados en función dos únicos identificadores moleculares e localizacións de mapeamento. A posición de crosslink de resolución de resolución de nucleótidos foi calculada como a coordenada inmediatamente anterior ao evento de truncación de transcrición inversa.
Transcrición inversa, QPCR e IR Validación
A transcrición inversa realizouse usando a primeira liña de transcrición de reverter Kit de síntese de CDNA (termoferente científico) usando 1 μg de ARN total e hexamers aleatorios. QPCR realizouse usando a powerup Sybr Green Master Mix (Thermofisher Scientific) eo sistema QPCR Agilent MX3000P ou o sistema de PCR en tempo real de Quantstudio 6 Flex (biosystems aplicados). Os cebadores utilizados están listados en táboa complementaria 2. A amplificación específica foi determinada pola análise da curva de Melt e a electroforesis do xel de agarosa dos produtos PCR. Utilizáronse pares de primer con 90-110% de eficiencia. Para cada valla de validación para a pantalla, utilizáronse tres pares de cebadores: (1) PRIMER PARA F1 R1 (Intron Spanning, a través de Exon-Exon Junction) foi usado para analizar os niveis de expresión xenética; (2) Primer par F2 R2 (unha imprimación sobre un exon flanqueando o intrón a ser analizado, o outro no intrón) foi usado para avaliar os niveis de IR; e (3) Primer par F3 R2 (ambos primers sobre os exóns flanqueando o intrón de interese, se é posible deseñado a través do Exon-Exon Junction) utilizado para medir os niveis da transcrición de Splicado. As mostras de RT-Minus utilizáronse como controis negativos. Os niveis de IR (parella primer F2R2) foron normalizados sobre o nivel de expresión de cada xene individual (parella primer F1R1). Os niveis de expresión de xenes foron medidos usando o método DDCT usando tres xenes de limpeza (GAPDH, POLR2B e UBE2D3).
Análisis do Ciclo Celular
A análise de ciclo celular foi realizada por citometría de fluxo segundo Protocolos estándar. Brevemente, as células foron disociadas usando AccuTase ou Trypsin (Tecnoloxías de vida), lavadas e fixadas en suspensión usando un etanol frío do 70%. As células foron manchadas usando o ioduro de propidio (PI, 50 μg ML -1, Sigma Aldrich) en presenza de RNase A (10 μg / ml, Sigma Aldrich). As células foron analizadas usando un BD FACS calibur (BD Biocience). Os dobletes foron excluídos da análise e 10, 000 eventos foron recollidos na porta dunha soa vez por exemplo. Os datos de ciclo celular foron analizados mediante o módulo multicículo do FCS Express 6 (software de novo).
Animais, modelos transxénicos e procesamento de tecidos
Todos os experimentos de animais descritos neste estudo foron levados Out baixo licenza da oficina na casa do Reino Unido, e foron aprobados polo Panel de revisión ética do Instituto de Neuroloxía. Utilizáronse as seguintes liñas de rato transxénicas: (1) SOD1 G93A MICE (B6SJL-TG (SOD1 * G93A) 1GUR / J, Jackson Laboratories) (2) Over-Expressing Mutante VCPA232E foi xerado por J. Paul Taylor et al, St Hospital de Investigación infantil de Jude, Memphis, TN, EE. UU. E descríbense en Custer et al, 2010 69 e criado a tipo salvaxe C57 Black 6 (C57 / B6).Fondo mixto de tipo salvaxe C56BL / 6-SJL (Jackson Laboratories) utilizáronse como control. Para a colección de tecidos, os animais foron inxectados con anestesia terminal (pentobarbital sodio, eutatal) e perfeccionáronse transcardialmente co 4% paraformaldeído. A rexión lumbar da medula espiñal foi eliminada e post-fixada cun 4% paraformaldeído e crioprotado durante a noite cun 30% de sacarosa; As criormes transversais en serie de 10 ou 20 μm foron cortadas para a tinción de inmunofluorescencia.
Tecido post-mortem humano
Seccións de tecido conxelado de Snap derivadas de medias espiñales lumbares de tres anos de idade Pacientes esporádicos ALS, duración da enfermidade 1, 2 e 2 anos, respectivamente, e tres anos e xénero coinciden con materias de control sen historia de enfermidade neurolóxica (n = 3 pacientes e 9 seccións; medios de idades: 68 + 6.55 e 69.5 + 2.12 anos ; Ver a táboa complementaria 3). Os tempos de atrasos da morte a Snap-conxelación tamén foron comparables entre os grupos (atraso: 25 + 5.29 e 29.33 + 9.29 h, para control e pacientes con sals, respectivamente). As mostras da medula espiñal foron obtidas a partir da neurorrentura do banco de tecidos, o Instituto UCL de Neurología, Londres, Reino Unido. As mostras foron doadas ao banco de tecidos con doador de tecido escrito informado o consentimento informado despois da revisión ética do Comité NHS NRES London-Central e almacenado baixo unha licenza de sector da investigación da autoridade do tecido humano do Reino Unido (HTA).
inmunolabel e Imaging
Para a inmunocitoquímica e inmunohistoquímica, as mostras foron bloqueadas nun 10% de serio normal de cabra (NGS) ou o 10% de soro de burro normal (NDS) segundo corresponda e permeabilizado en 0,3% Triton X-100 (Sigma-Aldrich; en PBS) a temperatura ambiente (RT) durante 1 h. A inmunolabélica realizouse con anticorpos primarios en NGS (5%) e Triton X-100 (0,1% en PBS) a 4 ° C durante a noite seguido de anticorpos secundarios específicos de especies durante 1 h en RT e Dapi Countante Nuclear (100 ng / ml) durante 10 minutos en RT. Para a fixación de mostras post-mortem humanas e a permeabilización en metanol frío (-20 ° C, 20 min) realizouse antes da inmunosaining. Os anticorpos primarios foron diluídos do seguinte xeito: Rabbit Anti Olig2 (Millipore, AB9610) 1: 200; rato anti smi32 (Cambridge Bioscience, SMI-32R-500) 1: 1000; Cabra Anti Chat (Millipore, AB144P) 1: 100; Rabbit Anti Pax6 (Biolegend, 901301) 1: 300; rato e coello anti sfpq (ABCAM, AB11825 e AB38148, respectivamente) 1: 100; rato e coello anti beta-tubuliniii (biolegend, 801201), rato anti lim3 (DSHB, 67.4e12) 1:50; pollo anti nkx2.2 (DSHB, 74.5A5) 1:50. As imaxes foron adquiridas usando un Microscopio Confecal Confecal de Scanning (Zeiss) ou o sistema de selección de alta contido de Opera Phenix (Perkin Elmer). Para a análise de imaxes, Fiji ou o Sistema de Análise de Imaxes de Columbus (Perkin Elmer) utilizáronse.
Blotting western
Western Blotting foi realizado de acordo cos protocolos estándar (Biorad). Lysates de células completas obtivéronse a partir de pellets de células conxeladas de Snap usando o Buffer Lysis Lysis-M EDTA (ROCHE). A concentración de proteínas foi determinada por Pierce BCA Ensay (Thermofisher Scientific) e usado para maximizar a carga igual a través dos xeles (~ 9 μg por pista). A electroforesis foi executada en 4-12% Criterion ™ XT BIS-Tris Protein Gel (Biorad) en constante tensión (200 V, unha hora) e seguido de transferencia de proteínas a unha membrana nitrocelulosa (Biorad). O bloqueo realizouse en PBS, 0,1% entre o 5% de leite seco en po (Marvel) en RT por unha hora seguido da incubación de anticorpos primarios á noite a 4 ° C. Os anticorpos primarios foron diluídos en PBS, 0,1% entre o 5% de leite seco en po do seguinte xeito: rato anti sfpq (ABCAM, AB11825) 1: 250; Rabbit Anti TLS / FU (ABCAM, AB84078) 1: 500; Rabbit Anti DDX39 (Sigma Aldrich, Sab2700315) 1: 500, Rabbit Anti Dars (ABCAM, AB182157) 1: 1000; rato anti gln1 (anticorpos en liña, aa 1-373) 1: 1000; Rabbit Anti TDP-43 (ABCAM, AB133547) 1:10, 000; Rato Anti Gapdh (Life Technologies, Clone 6C5, AM43000) 1: 5000. Para as membranas de detección foron incubadas con especies específicas preto de anticorpos fluorescentes infravermellos (IRDYE, LICOR) durante unha hora en RT e imaxes usando un sistema de imaxe de Odyssey FC (licor).
Disponibilidad de datos
O número de adhesión GEO para as bibliotecas de ARN-SEQ recentemente xeradas é GSE98290 (//www.ncbi.nlm.nih.gov/geo/QUery/acc.cg?acc = GSE98290). Tamén obtivemos secuenciación de ARN único e emparejada de finais derivados de dous estudos independentes de diferenciación neuronal in vitro de Hescs (GSE20301 22 e GSE86985 23); dous estudos independentes sobre formas familiares de ALS causadas por mutante SOD1 (n = 5; 2 SOD1A4V de SOD1A4V e 3 de control isógeno). As mostras da mutación que a mutación foi corrixida; HB9 FACS purificado MNS, GSE54409 27 ou FU (N = 6; 3 fontes derivadas polo paciente R521G e 3 controis de irmáns saudables MNS, GSE77702 28; Dous datos de ARN-seq de Human COS compartido por Miha Modic; Dous Fetal SPMN (E-MTAB-3871gene Expression Omnibus; WWW .EBI.AC.UK / ArrayExpress / Experiments / E-MTAB-3871 /) e SPMN adulto (SPMN capturado por láser; GSE76514 52, 53). Deben dirixirse a máis información e solicitudes de recursos e reactivos e serán cumpridos polo contacto directo, Rickie Patani ().
Expresiones de Gratitud
Os autores desexan agradecer aos pacientes para donacións de fibroblast. Tamén agradecemos a Miha Modic para compartir os datos de Hesc RNA-SEQ, Martina Hallegger e Roberto Simone pola súa entrada sobre o deseño de cebador, AnoB M Chakrabarti para compartir ficheiros de cama de datos eclip aliñados. Agradecemos a Benjamin Clarke, Mhoriam Ahmed e membros dos Laboratorios de Schiavo e Greensmith por valioso apoio técnico. Agradecemos a Selina Wray por xentilmente proporcionar acceso ás liñas VCP Mutant IPSC. Este traballo foi apoiado polo Instituto Francisco Crick, que recibe o seu fundamento básico do cancro de investigación do Reino Unido (FC010110), o Consello de Investigación Médica do Reino Unido (FC010110) e o Wellcome Trust (FC010110). Recoñecemos financiamento Wellcome Trust para RP, a NML e JU, unha concesión de infraestruturas MRC eMedLab Medical Bioinformática para a NML (MR / L016311 / 1), o UCL Premio Grandes Desafíos (CEH), unha Bolsa de Investigación Marie Curie de post-doutoramento (657749- Neuroutr) e unha avanzada Fellowship Mobility Mobility da Fundación Swiss National Science (P300PA_174461) a RLNML é un líder de Winton Group en recoñecemento ao apoio de Winton Carition Foundation cara ao establecemento do Instituto Francis Crick. Recoñecemos a plataforma DPUK / MRC para a prestación de Opera Phenix en alta throughput análise IPSC e xeneroso apoio do Instituto Nacional para a Universidade de Investigación en Saúde College London Hospitals Biomedical Research Center.
Materia suplementario electrónico.
-
Información suplementaria
-
Descripción de arquivos suplementarios adicionales
-
datos suplementarios 1