A retenção de introns e perda nuclear de SFPq são altones moleculares – comunicações naturais – comunicações 2021

  • splicing alternativo
  • pluripotente induzido Células-tronco
  • células-tronco neurais
  • neurologia
  • patogênese

resumo

mutações que causam A esclerose lateral amiotrófica (ELA) envolvem muito os reguladores do processamento de RNA expressos em forma onipresente. Para entender o impacto molecular das mutações causadoras de ela em desenvolvimento e doenças neuronais, analisamos os transcriptomas durante a diferenciação in vitro de neurônios motorizados (MN) de controle humano e mutantes mutantes induzidos por VCP do paciente (IPSC). Identificamos a retenção de introns maiores (IR) como uma característica dominante do programa em splice durante a diferenciação neural precoce. É importante notar que o IR é produzido prematuramente em colheitas mutantes de VCP em comparação com suas contrapartes de controle. Esses eventos de IR aberrantes também são vistos em conjuntos de dados independentes de RNaseq de mutantes MN Sod1 e Fus. O IR mais significativo é visto na transcrição do SFPQ. A proteína SFPQ é amplamente anexada ao seu intron retido, exibe menos abundância nuclear nas culturas mutantes VCP e é perdida a partir de mn núcleos em modelos de mouse e Human Sporadic Als. Ao todo, mostramos a perda de sfpq IR e nuclear como distinções moleculares da família e esporádica.

introdução

A esclerose lateral amiotrófica (ELA) é uma condição rápida progressiva e incurável relacionada à idade , que leva a degeneração seletiva de neurônios motores (MN). As mutações causadas pelo ALS envolvem reguladores cruciais do processamento de RNA, normalmente expressas em todo o desenvolvimento, na patogênese subjacente. Isso levanta a possibilidade de que mudanças pós-transcricionais que ocorram nos estágios iniciais da vida, incluindo o desenvolvimento neurológico, podem desempenhar um papel fundamental na patogênese molecular subjacente da ELA. Compreender o impacto das mutações que causam a ELS no desenvolvimento neurológico e da doença nos permitirá elucidar os eventos iniciais moleculares. Isso, por sua vez, pode orientar o desenvolvimento de novas terapias destinadas a mecanismos primários antes que a doença progrida demais.

Tanto o desenvolvimento e neurônio homeostase sejam fundamentalmente com base na implementação precisa do processamento alternativo de RNA do tipo de célula e por palco, incluindo emenda alternativa (como) e poliadenilação alternativa (APA) 1, 2, 3. Vários mecanismos foram estabelecidos, que incluem omissão exon, exons e retenção de introns mutuamente exclusivos (IR). O uso alternativo do Exon é particularmente caracterizado em neurônios para regular a variedade de proteínas e função 4. Os tipos de células neuronais mostram uma proporção maior de introns retidos em comparação com outros tecidos e há um corpo de evidência em expansão que demonstra um papel funcional para ir sobre desenvolvimento neuronal e homeostase 5, 6, 7, 8. Foi demonstrado que o aumento de ir durante a diferenciação neuronal regula a expressão de transcrições que são desnecessárias para fisiologia neuronal madura 7. Um estudo recente mostrou provas de processamento pós-transcricional de transcrições que retêm introns em resposta à atividade neuronal 8.

APA é um modo de processamento ARN alternativo que gera extremos diferentes 3 ‘com mais frequência na região 3’ não Traduzido (3 ‘UTR) do ARNm, encobrindo isoformas de comprimento variável de 3’ UTR. O UTR de 3 ‘Servir como uma plataforma chave na rede reguladora de RNA que controla a eficiência, localização e estabilidade de tradução do mRNA 9, 10. Utr 3 ‘Casa uma extensa variabilidade do comprimento específico do tecido que afeta significativamente sua função 11. De todos os tipos de células humanas, as isoformas específicas do cérebro têm o UTR de 3 ‘mais 12, 13. Além disso, as mutações que perturbam a estrutura secundária do ARNm e os locais de interação ARNM-Miarn podem levar à neurodegeneração 14. Apesar desses achados, as funções do regulamento IR e 3 ‘UTR no contexto do desenvolvimento MN e a homeostase permaneceram pouco estudadas em comparação com outras formas de EA.

como e APA são coordenadas para a ação ou combinações individuais de proteínas de ligação RNA (RBPS) que atuam em trans que se ligam a locais específicos dentro de (pré-) mRNA 15, 16. Rbps mediam a splicing de mRNA, exportação nuclear e localização.O acúmulo de evidências envolve o PRR como reguladores-chave de desenvolvimento neurológico e as formas específicas de neurodegeneração. De fato, mutações em vários RBP, incluindo a proteína de ligação de ADN de resposta transativa, 43 KDA (TDP-43), mescladas em sarcoma (FUs) e o fator associado à proteína de ligao de caixa de caixa (TAF15) que foram causalmente ligadas a A forma familiar de ELA que leva a defeitos de processamento de RNA nos modelos do rato 17, 18.

Nossa hipótese é que a articulação aberrante e a APA realizam papéis importantes tanto no desenvolvimento quanto na doença do sistema nervoso . Neste contexto, tentamos entender como os diferentes modos de APA aparecem na neurogênese do motor humano e examinam sistematicamente o impacto das mutações causadoras de ela na remodelação pós-transcrição durante a restrição de linhagem. Ao combinar a diferenciação de células-tronco orientadas pelo homem induzida pelo homem (IPSC) com sequenciamento de RNA resolvido ao longo do tempo, primeiro identificamos o programa seqüencial de remodelação pós-transcricional que é subjacente à neurogênese do motor humano. Recentemente, identificamos fenótipos celulares claros de ELA através do uso de IPSCs derivados de pacientes relacionados à vallosina (VCP) 19. Esta plataforma nos permitiu comparar o mutante VCP (VCP MU) para controlar as culturas durante a diferenciação MN e identificar a desregulamentação em grupo dependente da mutação em uma etapa específica do desenvolvimento. Identificamos o fator de splicing prolina e rico (SFPQ) como a transcrição de retenção de introns mais significativa entre as várias mutações causadas pelo ALS (VCP, SOD1 e FUs). Mostramos que a proteína SFPQ é amplamente ligada ao seu intron retido, que exibe alta abundância citoplasmática no MU VCP em comparação com os controles. Fundamentalmente, a proteína é menos abundante nos núcleos das culturas de MU da VCP e, finalmente, é perdida dos núcleos MN em modelos de camundongos (modelos de camundongos transgênicos SOD1 MU e VCP mu) e amostras espórticas humanas de ALS. Em resumo, nosso estudo envolve a perda de SFPQ IR e nuclear como distintivos moleculares gerais da família e esporádica Elo.

IR é o modo de emenda predominante na neurogênese do motor.

para examinar Mudanças transcricionais durante a neurogênese do motor humano, analisamos dados de sequenciamento de RNA de alto desempenho (RNA-SEQ) para RNA poliadenilado isolados de células-tronco pluripotentes induzidas (IPScs; dia 0), precursores neurais (NPC; dia 7), precursores mns “com padrão “(medula espinhal ventral, PMNs; dia 14), pós-mitótica, mas eletrofisiologicamente imatura (MNS; dia 21), e MNS eletrofisiologicamente madura (MMNs, dia 35) derivados de dois pacientes com Mutation VCP da ALS Gen (Fig. 1a, 31 amostras de 5 pontos temporários e 3 genótipos; 2 clones de 2 controles saudáveis e 3 clones de 2 pacientes com ELA com mutações de VCP: R155C e R191Q). As amostras de células de cada estágio da diferenciação MN foram caracterizadas como relatadas anteriormente. Aqui, realizamos uma extensa caracterização adicional para confirmar as culturas MN altamente enriquecidas (> 90%; Fig. 1a complementar). É importante notar que a eficiência da diferenciação MN foi semelhante entre o controle e as culturas do VCP (Fig. 1B, C). Usando um conjunto de 19 marcadores genéticos-chave da maturação da coluna vertebral e desenvolvimento embrionário, também confirmamos uma descoberta prévia de que o NMM derivado do IPSC se assemelhar, em vez de adultos (Figura 2A, complementar). Agrupamento hierárquico não supervisionado (correlação de classificação de Spearman e agrupamento total) das 31 amostras usando 15, 989 amostras segregadas de genes expressas de maneira confiável, dependendo do seu estágio de desenvolvimento dentro da linhagem ou controle genético mutante em vez do mutante e controle genético (Fig. 1b).

Imagem

retenção de introm é A troca predominante da junção durante a neurogênese do motor antecipado e é prematuramente produzida nas culturas da MU da VCP. Um esquema que representa a estratégia de diferenciação do IPSC para neurogênese motora. As setas indicam pontos de tempo de amostragem nos dias. Os clones do IPSC foram obtidos de dois pacientes com mutações confirmadas de VCP (R155C e R191Q, um total de 3 linhas IPSC, 1 Indução de cada linha) e 1 clone de cada um dos 2 controles saudáveis (um total de 2 linhas IPSC diferentes, 2 induções de uma linha e 1 indução da outra linha).Células-tronco pluripotentes induzidas (IPSC); precursores neurais (NPC); “Modelado” neurônios de motores precursores (medula espinhal ventral, PMN); neurônios motoros póspheco mas eletrofisiologicamente imaturos (MN); Mns eletrofisiologicamente maduros (mmn). B O grupo hierárquico não supervisionado de 15, 989 genes agrupa as 31 amostras de acordo com a fase de desenvolvimento neuronal, em vez do fundo genético. Círculos cinzentos = amostras de controle; Círculos Magenta = Amostras de MU de VCP; Os pontos de tempo de amostragem são indicados dentro dos círculos. C gráficos circulares representando proporções de eventos em splice nas amostras de controle e mu VCP em diferentes estágios da neurogênese motora em comparação com o ponto temporário anterior. As áreas de gráfico são proporcionais ao número total de eventos em cada etapa. Retenção de introns (IR); Exon alternativo (Altex); microexons (mic); Alternativa 5 ‘e 3’ UTR (ALT5 e ALT3). D, F Garrafas de bar Representando o número de eventos externos e intrônicos de splice, respectivamente, no controle (barras cinzentas) e amostras VCP (barras magentas) em pontos específicos durante a diferenciação MN. E, G gráficos de bar Mostrando a pontuação do enriquecimento das vias biológicas associadas a transcrições que experimentam eventos exonônicos e introdutórios em splice em amostras de controle. H no topo, os gráficos de caixa representam as distribuições de percentagem de retenção (ver métodos) para 167 introns manualmente curados em réplicas em diferentes estágios de diferenciação nas amostras de controle (esquerda) e VCP mu (direita). Os diagramas de dinheiro mostram o resumo de cinco números medianos, os quartis inferiores e superiores, os valores mínimo e máximo. Abaixo, os mapas de calor da porcentagem relativa padronizada de IR em 167 introns em amostras repetidas em cada fase de diferenciação. Eu, como em H, mas para a diferenciação in vitro de HSC para a fase de indução neural (1 semana), NPC (4-10 semanas) que produz apenas neurônios após diferenciação adicional e após > 15 semanas, um estágio mais gliogênico que produz neurônios e células gliais 22

Imagem de tamanho completo

Examinamos a dinâmica temporária de como durante a diferenciação MN. Usando os VAS-Tools 21 do tubo RNA-SEQ, identificamos 1599 e 1507 eventos como ao longo do tempo nas amostras de controle e VCP MU, respectivamente (Fig. 2c, D). De acordo com estudos anteriores, > 60% dos eventos subsequentes da diferenciação do terminal MN foram alternativa exon (inclusão e exclusão de exons cassete) e eventos de omissão de intron (Fig. 2c d). Descobrimos que os amostras de controlo e VcP Mu exibem um aumento progressivo semelhante na inclusão do exon em cassete ao longo do tempo (fig. 1c, d) em genes enriquecidos para a organização de componentes celulares e funções de onomia de onomia de gênica (Go) (Go) Fig. 1e).

Em contraste, o IR representou > 65% dos eventos como na fase anterior da restrição de linhagem NPC para PMN (Fig. 1c) . A expressão das transcrições de retenção de intron aumentou na transição da NPC para PMN (ou seja, padrão neural) em amostras de controle (Fig. 1f). Curiosamente, as amostras de MU da VCP mostraram um aumento surpreendente na expressão das transcrições que retêm o intron na transição de desenvolvimento anterior de IPSCs para NPCs (ou seja, indução neural, fig. 1f). Descobrimos que 53% dos eventos IR começaram com o padrão nas amostras de controle (NPC para PMN); Em contraste, 72% dos eventos de IR em culturas MU da VCP começaram com indução neural (IPSC a NPC, Fig. 2E complementares, à direita). É importante notar que 60% de todos os eventos IR envolviam introns e transcrições idênticas entre as amostras de MU e controle VCP (Fig. 2E complementar, até à esquerda), o que envolve grandemente os genes relacionados ao processamento e na Bolsa de RNA (Fig. 1G) . Os restantes eventos foram exclusivos de culturas de mu vcp ou ocorreram em um ponto diferente. Isso indica que as amostras de MU do VCP mostram uma atividade semelhante à observada nas contrapartes de controle durante a diferenciação, mas em um estágio prematuro.

Então, nós curamos cada evento identificado automaticamente para a lista curta 167 com Alta confiança. Um valor de retenção foi atribuído para cada evento a ser relacionado à expressão de exons com flanqueamento (ver métodos). É imediatamente evidente da Fig. 1h que os 167 introns são sistematicamente retidos mais no VCP MU no passo de NPC em comparação com as amostras de controle de qualquer estágio.

Como uma validação inicial, avaliamos se os 167 introns também são retidos em dois conjuntos de dados transcripticos independentes de células-tronco embrionárias humanas 22, 23. O exame do seu nível de retenção geral confirmou que o IR durante a neurogênese precoce é um fenômeno generalizável em vários modelos experimentais (Fig. 1i e Fig. 2F suplementar). Em seguida, examinamos se os introns retidos apresentaram características estruturais características que poderiam ser distinguidas dos introns convencionalmente emendados e descobriram que o conjunto altamente seguro de 167 introns retidos é mais longo e mais preservado do que os introns não são retidos a partir do mesmo conjunto de genes (Fig. 2G complementar).

O VCP desempenha um papel na progressão do ciclo de células e uma porcentagem maior de IR pode resultar do link estabelecido entre a eficiência do splicing e o ciclo de célula 24. Portanto, examinamos se a aparente aceleração em como programas no VCP Mu é explicada por um aumento dependente da mutação na atividade do ciclo celular. Usamos citometria de fluxo em IPSCs, NPCs e PMNs tratados com o agente fluorescente intercalado e o agente staichiométrico de iodeto de propídio para examinar o conteúdo do DNA. Essas experiências realmente excluíram as diferenças no ciclo celular entre o VCP Mu e as amostras de controle (Figura 2H-J suplementar). Assim, coletivamente, esses achados mostram que o IR é a mudança predominante da junção que afeta os estágios iniciais da restrição de linhagem neural. É importante notar que o IR é produzido em altos níveis e prematuramente nas culturas da MU da VCP na fase de NPC, que não podem ser explicadas pelas diferenças na atividade do ciclo celular.

IR Aberrante em Mn carregando várias mutações causadas por ALS

o crachá patológico em > 97% de todos os casos de ALA (esporádica e família) é o citoplasmático nuclear do TDP- 43 25, 26. No entanto, a ausência de localização ruim do TDP-43 em 3% dos casos mantém que os mecanismos patogênicos comuns ainda estão sendo descobertos. Para resolver isso, então examinamos o impacto das mutações que causam Sod1 e Fus Als, que, de forma característica, não exibem um sinal de localização incorreto do TDP-43. Analisamos conjuntos de dados transcriptômicos para SOD1 mutante (SOD1 MU) (n = 5; 2 A4V de SOD1 derivados de pacientes e 3 mn amostras purificadas com faces de controle isogênico, onde a mutação) 27 foi corrigida e amostras de FUs (n = 6; 3 Fus R521G Derivativos do Paciente e 3 controles MN não afetados) 28. Confirmamos que o IR é o modo predominante de junção no MNS derivado de ambos os mutantes (Fig. 3a complementar), sugerindo um fenômeno molecular unificador através de vários Als Genetic Background (VCP, SOD1 e FUs). É importante notar que nosso alto conjunto de confiança de 167 eventos IR que ocorrem prematuramente durante a diferenciação do VCP MN também são geralmente afetados em Fus Mu e Sod1 Mu MNS (Fig. 2A); Especificamente, os eventos 74 e 59 mostrarão um aumento estatisticamente significativo no SOD1 Mu e no FUS MNS, respectivamente, comparados aos controles (valor de p < 0, 01; Prova da contagem de Fisher; Fig. 3b complementar). A extensão da emenda para aqueles introns retidos significativamente tanto em SOD1 MU como no Fus Mu seja mostrado em um mapa de calor na Fig. 2b. Estes formam uma rede de proteína enriquecida no splicing e a tradução de RNA (Fig. 2c, D). Isso mostra que os eventos de IR identificados em nosso modelo ALS também estão incluídos no MNS que carregam outras mutações causadas pelo ALS que não mostram uma localização ruim do TDP-43. Cumulativamente, essas descobertas confirmam a possibilidade de uma generalização aberrante em diferentes formas genéticas de ALS.

Imagem

As transcrições envolvidas na indução neural mostram uma retenção generalizada de introns no MN derivado das mutações que causam a ALS Fus e SOD1. Graphics de caixa mostrando a distribuição do percentual de retenção para 167 introns mantidos manualmente no controle MNS (caixa branca), o MNS mutantes mu fus (caixa cinza) ou amostras de SOD1 MNS (Barra azul) 28, 50. As amostras mutantes exibem sistematicamente uma proporção maior de se comparar aos controles. Os diagramas de caixa são mostrados na Fig. 1h. B HeatMap agrupado hierarquicamente (distância de Manhattan e agrupamento de ala) de níveis relativos de IR em 40 genes mostrando uma retenção estatisticamente significativa durante a neurogênese motora, tanto em SOD1 MU e em Fus Mu MNS.Círculos azuis = amostras sod1 mu, círculos cinzentos = amostras Fus mu e círculos vazios = amostras de controle. C Rede de interações proteicas de proteína para genes que exibem ir durante a neurogênese motora em SOD1 MU ou Fus Mu MNS. As bordas representam interações proteicas-proteicas descritas experimentalmente anotadas na base de dados da string 51. Os nós indicam proteínas, coloridos de acordo com as condições em que a transcrição correspondente mostra; Os tamanhos dos círculos são proporcionais ao número de bordas na rede. D Bar Graphics mostrando pontuações de enriquecimento (teste P valor P Fisher de valor) dos GOS biológicos associados a genes que mostram durante a neurogênese motora em SOD1 MU e / ou Fus Mu MNS em comparação com os controles

Imagem de tamanho normal

/ p>

Remodelação transitória UTR 3 ‘no início da neurogênese

a emenda e a regulação da poliadenilação são geralmente interligadas. Para examinar se o comprimento de 3 ‘UTR varia ao longo da diferenciação e como o VCP MU afeta esse processo, primeiro estendemos o catálogo atual do UTR do Ensembl 3’ usando nossos dados de RNA-SEQ (veja os métodos); Para cada gene, analisamos seus comprimentos máximos expressos no curso da diferenciação. Ambas as amostras de controle e VCP, os comprimentos médios de 3 ‘UTR para 12, 364 genes expressos aumentam continuamente durante o curso do tempo de diferenciação. No entanto, excepcionalmente, a UTR 3 ‘nas amostras de controle são temporariamente encurtadas durante o estágio NPC (valor de p < 0, 01; teste de wilcoxon; Fig. 3A). Como um alongamento de 3 ‘Utr no desenvolvimento embrionário é esperado, o encurtamento observado no estágio NPC (comparado ao IPSC) é surpreendente.

Imagem

variação do comprimento de 3 ‘UTR durante a neurogênese do motor humano. Para diagramas de caixa de 3 ‘distribuições máximas de comprimento UTR expressas em diferentes estágios da diferenciação MN nas amostras de controle (esquerda) e VCP mu (direita). Valor de val obtido com o teste Wilcoxon. B GRÁFICOS DE BAR Mostrando os 3 ‘números UTR com alterações estatisticamente significantes entre o promotor distal (esquerda) e o promotor proximal (direita) em diferentes estágios de diferenciação em comparação com o IPScs no controle (barras cinzentas) e vcp mu (barras magenta). Inserção, gráficos circulares representando as proporções de genes que exibem o uso de UTR em alternativa nas amostras de controle e VCP MU (branco), apenas as amostras de controle (área cinza) ou apenas as amostras vcp mu (área magenta). C Ir Enriquecimento Análise de rotas biológicas associadas a genes que mostram mudanças distais estatisticamente significativas na utilização do local de poli (a) no controle MM em comparação com o controle IPSC. D, e à esquerda, as vistas do navegador do genoma dos perfis de RNA-SEQ nos genes 3 ‘UTR de GNL1 e TARDBP mostrando mudanças estatisticamente significativas no proximal para distal no uso do local da poli em comparação com o IPSCS. À direita, gráficos de barras mostrando o uso distal do UTR de 3 ‘em relação ao UTR proximal 3’. P- Valores obtidos com o teste de contagem de Fisher. F O que c para genes que mostram alterações proximais estatisticamente significantes no uso do site poli (a) no NPC de controle em comparação com o controle do IPSC. G, h assim como D para os genes do ZNF254 e DARS que mostram alterações distais em proximal estatisticamente significativo no uso do site poli (a) em NPCs em comparação com o IPSC

Imagem de tamanho completo

> Para investigar ainda mais a dinâmica do processamento da UTR em 3 ‘, analisamos os sites de tandem poli (a) que estavam localizados no mesmo terminal exon. Usando o número de leituras atribuídas ao terminal de 300 NT do segmento de cada 3 ‘UTR como proxy para o nível de expressão de isoforme, quantificamos o uso do site alternativo poli (a) em diferentes estágios de desenvolvimento em comparação com o IPSC. 822 Genes mostram alterações estatisticamente significativas de UTR 3 ‘no controle e / ou VCP mu (Fig. 3B). Em 171 genes, há maior uso do site Distal Poly (A), tanto no controle quanto no VCP MMN (Fig. 3B), de acordo com um estudo anterior 29; Estes genes são enriquecidos em termos de forma relacionados à emenda de mRNA (Fig. 3c). Na fase mn < 10, os genes mostram um uso diferencial significativo de 3 ‘utr quando as culturas de controle e VCP mu são diretamente comparados, o que confirma uma regulação de comprimento de 3’ UTR na diferenciação terminal entre o controle e o VCP mu (Fig. 4a suplementar).Vale ressaltar que, em vários casos, as amostras de VCP Mu mostraram uma mudança distal significativa do promotor em um estágio comparativamente anterior para controlar as amostras. Estes exemplos incluem o GNL1 (Fig. 3D) e TARDBP (Fig. 3e); Este último também mostra um acúmulo de isoforma longa UTR 3 ‘em SOD1 MN em comparação com os controles, mas não em Fus Mu (Fig. 4C, D). Nenhuma dessas variações no UTR em 3 ‘levou a mudanças mensuráveis na expressão de genes ou proteínas (Fig. 4e, f, g, g).

de 822 genes, 169 exibem uma mudança proximal para o promotor Estatisticamente significante especificamente no NPC de controle em comparação com o IPSCS (Fig. 3B). Várias rotas biológicas, como a transcrição e regulação da neurotrófina, são representadas entre transcrições que mostram um curto encurtamento de UTR de transição (Fig. 3F). Aproximadamente 80% desses eventos estão ausentes no VCP Mu (Fig. 3B, G, H); Isso é confirmado ainda quando as amostras de MU e controle VCP são comparadas diretamente no estágio NPC (Fig. 4A, B). Esses dados demonstram que a variação extensa 3 ‘de comprimento UTR antes de ir e caracterizar a transição do IPSC para NPC. É importante notar que as amostras de MU do VCP não mostram nenhum processo semelhante aparente.

O regulamento na parte inferior do fator de emenda corresponde a um Aberrant IR

depois de ter identificado o As diferenças de emenda nas amostras de ELA em comparação com o controle, então foi tentada compreender se o fundo genético da ELA leva a diferenças transcricionais mensuráveis durante a neurogênese motora. Especificamente, investigamos mudanças de expressão que não são identificadas otimamente por agrupamento hierárquico (Fig. 1B), que muitas vezes é dominado por um único programa de transcrição. Aplicamos a decomposição de valor exclusivo (SVD) para toda a matriz de expressão (15, 989 genes em 31 amostras; Fig. 1a) para identificar os principais programas transcricionais e os processos biológicos associados que sublinham a neurogênese do motor 30. Usando este método, descobrimos que (1) neurogênese progressiva, (2) indução neural e o padrão transitório, e (3) diferenciação terminal com alguma contribuição para a indução neural compõem os principais programas de expressão ortogonais que operam em muito tempo do curso de tempo de desenvolvimento; Estes primeiros três componentes captam 69% da variância na expressão gênica (Fig. 4A-C, Fig. 5a complementar). A análise de enriquecimento funcional go de grupos genéticos que foram positivos ou negativamente associados a esses componentes (Fig. 4D-F) confirma ainda a associação biológica de cada componente principal. É importante notar que as amostras de controle e MU do VCP se comportam de forma semelhante nos três primeiros componentes. Uma análise linear multivariada confirmou que o tempo na cultura em vez da mutação VCP é a variável que explica os componentes 1, 2 e 3 (fig. 5b complementar).

Imagem

Regulamento para os componentes globais de emenda baixo corresponde indo. A – C Análise de decomposição de valor singular da expressão de 15, 989 genes em n = 31 amostras. À esquerda, os gráficos de linha mostram os perfis de expressão dos três primeiros vetores singulares \ (\ OverwightTarrow v _1 \) via \ (\ overighttarrow v _3 \), capturando 47%, 15% e 7% da variação na expressão gênica , respectivamente. Os pontos de dados cinza e magenta indicam expressão para amostras de controle e VCP mu. À direita, o mapa de calor da expressão padronizada de genes cujos perfis de expressão correlacionam positivamente (indicados pelos três retângulos mais escuros) e negativos (indicados pelos três retângulos mais claros) com os três primeiros vetores singulares à direita. Os gráficos de barras D-F mostram pontuações de enriquecimento para as funções biológicas de genes que são positivamente correlacionadas (três barras inferiores) ou negativamente (três barras inferiores) com os três primeiros vetores singulares à direita. G Diagramas de bar no topo, que representam o número de genes regulamentados para o declínio em amostras de MU de VCP em comparação com o controle em diferentes estágios da diferenciação MN. Abaixo, o mapa de calor das funções biológicas enriquecidas entre os genes regulados nos pontos de tempo correspondentes.h diagramas de dinheiro que mostram as distribuições de mudanças nas mudanças registram2 para 66 genes do fator de emenda essencial entre os mutantes e controles da ALS; Caixas brancas = MU VCP em comparação com controles, caixa azul = SOD1 MU em comparação com controles isogênicos, caixa verde = fus mu em comparação com os controles

Imagem de tamanho completo

Em seguida, realizamos um Análise diferencial da expressão gênica para avaliar se os genes específicos são diferencialmente regulados em diferentes estágios de desenvolvimento neuronal em VCP mu em comparação com as amostras de controle. Duzentos e cinquenta e seis genes foram regulados estatisticamente no VCP Mu na fase de NPC durante o qual ocorre uma aberrante IR (log2fc > 1,5 e valor de p < 0,01); Estes genes são altamente enriquecidos na emenda de mRNA e nas funções de processamento de go da extremidade 3 ‘(Fig. 4G). Deve-se notar que 47 desses genes codificam RBPS (Fig. 5D complementar). Havia muitos genes mais regulamentados (Fig. 5c suplementar). Também examinamos os níveis de expressão de 66 genes reguladores de splicing conhecidos 31; Existe um regulamento decrescente global claro no estágio de NPC das amostras de MU da VCP e no SOD1 Mu e Fus independentes, coincidem com um IR aberrante em cada caso (Fig. 4H).

em resumo, Descobrimos que os programas de transcrição e de processamento RNA refletem o caminho de desenvolvimento MN, uma vez que as vias específicas são ativadas por estágios. Apesar dos defeitos pós-transcricionais, o principal programa transcricional não é interrompido durante a diferenciação MN da mutação VCP. No entanto, uma regulamentação global para baixo na expressão dos componentes da emenda ocorre concomitantemente com uma íris aberrante em várias mutações causando als.

Transcrições de IR citoplasmáticas e perda nuclear da proteína SFPQ

GENE SFPQ, membro da família Drosophila Comportamento, em splicing humano (DBHS), codifica uma proteína que realiza funções fundamentais na transcrição, em splicing, 3 ‘processamento final e viabilidade dos Axons 32, 33, 35, 35. Aqui, o Intron 9/9 de 9 KB no gene SFPQ mostra o evento de IR mais proeminente identificado durante a neurogênese motora em nossas amostras VPC Mu NPC em comparação com as contrapartes de controle. É importante notar que o SFPQ IR Aberrante também ocorre em Sod1 Mu e Mu Mn em comparação com os controles (Fig. 5A, C). Validamos o SFPQ IR e sua desregulamentação no VCP Mu em comparação com as amostras de controle por meio da análise QPCR de múltiplas linhas IPSC independentes (três clones de três controles saudáveis e quatro clones de dois pacientes com mutações de VCP; Fig. 5b e Fig. 6A suplementar). Além disso, validamos dois reguladores conjuntos Gus e DDX39, que são igualmente afetados no NPC VCP mu, e em SOD1 MU e Mu MN (Fig. 6B-G suplementar).

imagem

blangthing do intrão SFPQ em várias formas genéticas de ALS e sua interação com proteína SFPQ . À esquerda, vistas do navegador genoma de perfis de RNA-SEQ para o gene de retenção de intrcriade SFPQ nos amostras de controle e VCP MU nos estágios IPSC, NPC e PMN. O intrão de 9 kb 9/9 de interesse é indicado por uma caixa amarela. À direita, os gráficos de barras que quantificam a porcentagem de passar ao longo do tempo no controle e do VCP MU (teste ± DP; teste de contagem de Fisher). B Graphics Bar mostrando níveis de IR SFPQ medidos por QPCR; Barras brancas = controles, barras pretas = vcp mu. Os níveis de indo em cada ponto foram comparados com os do estágio do IPSC do mesmo grupo. N = 3 linhas de controle e n = 4 linhas vcp (mídia + sd * p < 0.05, ** p < 0,01, ANOVA ONE maneira com correção de dunnet para comparações múltiplas). C Graphics de bar Mostrando a porcentagem de SFPQ IR para Fus Mu ou SOD1 MN MN no controle em comparação com (média ± DP; teste de contagem de Fisher). D Os gráficos de barras representam o nível de enriquecimento na ligação do RBP para o intron retido em comparação com os introns não retidos dentro do mesmo gene; Barras azuis = gene sfpq, barras verdes = gen Fus. E – F Vista do genoma Navegador de eventos de reticulação de Eclip SFPQ ao longo das anotações de transcrição de SFPQ e FUs. Pinturas cinzentas destacam a localização dos introns retidos. G Gráficos de bar Mostrando o nível de localização nuclear e citoplástica das transcrições de ir medidas pelo QPCR.Os níveis de ir em cada fração foram comparados com os da fração nuclear do controle do IPSC. N = 3 linhas de controle e n = 4 linhas vcp, mídia + valor sd p anova de duas vias com correção de Tukey para várias comparações. H SPFQ subcelular localização determinada por imunocitoquímica em IPSCs, NPCs e PMNs. A proporção da intensidade média da coloração SFPQ no núcleo (n) versus citoplasma (C) foi determinada automaticamente nas células Mu Ctrl e VCP. Os dados mostrados são a relação N / C (± DP) por campo de visão de quatro linhas de controle e quatro linhas de MU de VCP. Valor de teste t não emparelhado com correção de welch. Veja também a fig. 7D complementar

Examinamos os dados codificados da ECLIP em larga escala de 112 RBP nas células K562 e HEPG2 para identificar candidatos que juntam aos introns retidos no SFPQ e FUs 36, 37. A classificação desses RBPs devido à proporção de eventos de reticulação na intromissão em comparação com os introns não retidos no mesmo gene revelou que o SFPQ e o HNRNPM são os RBPs mais altamente enriquecidos (Fig. 5d-F e Fig. 7A suplementares). Isso indica que a proteína SFPQ está diretamente conectada aos introns retidos SFPQ e FUs.

Ao descobrir evidências de interações entre a proteína SFPQ e o Intron 9/9 do SFPQ, tentamos entender a natureza dessa interferência . As alterações no IR não são acompanhadas por uma diferença estatisticamente significante nos níveis de expressão de genes ou proteínas entre o VCP Mu e as amostras de controle (Fig. 7b, C). Em vez disso, usamos a fracionamento citoplasmática nuclear e identificamos uma abundância estatisticamente maior da isoforma de retenção de intron de SFPQ no citoplasma de MU da VCP em comparação com culturas de controle (Figura 5 g). Esses achados juntos levaram à investigação da distribuição subcelular da proteína SFPQ. Encontramos uma perda nuclear modesta, mas estatisticamente significativa da proteína SFPQ em culturas de mu vcp (fig. 5h).

Em resumo, o aumento mais significativo de passar por VCP, FUs e SOD1 é visto na transcrição de sfpq. Esta sequência de intron é amplamente ligada pela proteína SFPQ e ambos os membros desse complexo (ou seja, a proteína e a transcrição de retenção de introns) exibem uma distribuição de células aberrantes.

Perda nuclear do SFPQ através da família e espórtica da ELA / H2>

Tendo estabelecido uma redução na abundância nuclear da proteína SFPQ na diferenciação de culturas do IPSC, foi buscado testar a generalização desta descoberta através de modelos transgênicos de Página Al in vivo e pós-tecido humano de casos de ela esporádicos. Para este fim, examinamos primeiro dois modelos transgênicos de Mouse ALS, incluindo SOD1 G93A e VCP A232E. Usando esta abordagem, demonstramos a perda nuclear da proteína SFPQ da medula espinhal com as mutações genéticas relacionadas a ALS (Fig. 6A). Portanto, a perda nuclear da proteína surge em diferentes formas genéticas da ELA que é conhecida por exibir proteicopatia TDP43 (VCP MU) e aquelas que não (SOD1 MU). Observando que 90% dos casos de ELA não estão familiarizados, examinamos o tecido pós-mortem da medula espinhal de casos de ELA em humanos esporádicos. De fato, demonstramos uma surpreendente perda nuclear da proteína SFPQ na era esporádica humana em comparação com tecidos de controle normais, que sublinha a relevância mais ampla desta descoberta (Fig. 6b). A partir desses resultados, chegamos à conclusão de que a perda nuclear da proteína SFPQ é uma vedação distinta através de vários modelos in vitro e in vivo que representam als familiares e esporádicos.

Imagem

nuclear Depuração do SFPQ é um selo molecular de ALS genéticos e esporádicos. Análise da localização subcelular de SFPQ em MN na medula espinhal ventral de ratos selvagens, VCP A232E e SOD1 G93A. O citoplasma MN foi identificado por coloração de bate-papo, os núcleos foram contrastados com DAPI. Os dados mostrados são a proporção nuclear / citoplasmática (N / C) (média ± DP) por célula de três ratos SOD1 G93A e 3 VCP A232E de tipo selvagem. Barra de escala: 20 μm. P- Valores de teste de Welch T de um lado. As células animais individuais em cada condição foram agrupadas após excluir o efeito de camundongos individuais comparando modelos lineares completos (doença e fator individual) com modelos lineares reduzidos (somente doença) usando os critérios de informação de Akaike. B Análise da localização subcelular de SFPQ em MN na medula espinhal ventral de controles saudáveis e pacientes com ELA esporádico (sals).O citoplasma MN foi identificado por coloração de bate-papo, os núcleos foram contrastados com DAPI. Apenas a MN com um núcleo visível foi considerada para análise. Barra de escala 50 μm. Os dados mostrados é uma relação N / C (média ± DP) por célula de três casos por grupo

Imagem de tamanho completo

discussão

Os objetivos deste O estudo foi o dobro: (i) Resolvendo eventos alternativos de processamento de RNA que se uniram nas diferentes etapas da MN e (ii) restrição de mecanismos patogênicos primários entre formas patologicamente divergentes de ELA (ou seja, com ou sem proteínaPathy TDP43). Para conseguir isso, integramos a diferenciação dirigida de ipscs específicos do paciente em MN. Espinês com sequenciamento de RNA e exame bioinformático completo. Mostramos que um programa de junção sólido subjacente ao desenvolvimento de MN como resumido na Fig. 6a. Ao resolver a natureza precisa dos programas pós-transcricionais sequenciais que subjacam os diferentes estágios da diferenciação MN, revelamos que o tempo desses eventos moleculares cuidadosamente coreografados é perturbado pela mutação VCP causada pelo ALS. Ao analisar as amostras de MN relacionadas a Als adicionais, também mostramos que a história dos genes da ALS, como SOD1 e FUs, afetam a estrutura de transcrição dos principais reguladores de emenda de RNA de uma maneira semelhante aos objetivos do programa Aberrant Splice em vcp. Além disso, mostramos que um regulamento para o declínio global dos componentes em splice coincide com defeitos em splicing. Este “enfraquecimento” da maquinaria em splicing fornece uma explicação plausível para o Aberrant IR que encontramos no ALS relacionado à mutação VCP, SOD1 e FUS. A transcrição SFPq exibe o intron retido mais significativamente, ao qual a proteína SFPQ é avidamente conectada, proporcionando provas de uma interação direta entre a proteína e a transcrição que retém o intron. Também mostramos que a transcrição de retenção de intron SFPQ é exportada para o citoplasma. Isso ocorre em maior medida no mutante VCP que coincide com o programa Aberrant IR. Isso nos levou a examinar a localização celular da proteína SFPQ, que descobriu sua perda nuclear em ALS. O SFPQ codifica um regulador chave de localização e desenvolvimento axonal do ARNM 38. Juntos, esses resultados representam a ideia de que a estrutura de transcrição desregulamentada pode desempenhar um papel fundamental na degeneração axonal durante o desenvolvimento da ELA. De fato, o SFPQ está emergindo como um regulador-chave da neurodegeneração mais 34, 38, 39, 40.

Dinâmico de como foram anteriormente informados na forelebrain de roedores entre diferentes fases de desenvolvimento 41, 42 . Aqui nós identificamos modificações não reconhecidas anteriormente na estrutura de transcrição genética que regulam o processamento de RNA e a emenda nos estágios iniciais da restrição de linhagem MN humana (Figura 7A). Mostramos que uma remodelação máxima de 3 ‘UTR, incluindo o encurtamento de 3’ UTR, precede a ir. Especificamente, há uma variação de comprimento 3 ‘estatisticamente significante que afeta as estruturas dos transcritos como as células saem da pluripotência durante a indução neural. Isso precede o pico do acúmulo de transcrição de retenção de intron que é produzido no padrão neural da medula espinhal ventral. Depois disso, o alongamento progressivo progressivo em 3 ‘, a inclusão de exonsções de cassete e a splicing intron caracterizam as fases restantes da diferenciação terminal para MNS como anteriormente mostrado 1, 6.

Imagem

diagrama esquemático do modelo proposto. Uma caricatura que resume o curso temporário dos eventos pós-transcricionais que subjacente a neurogênese do motor humano nos amostras de controle e VCP. Nossos resultados sugerem que eventos predominantes de processamento de RNA em um estágio inicial da diferenciação neural são IR e remodelação de 3 ‘UTR. Esses eventos começam prematuramente em amostras de MU da VCP, mas não afetam os principais programas de transcrição que sublinham a diferenciação da MN humana. B caricatura que resume a conseqüência funcional de um IR aberrante no gene SFPQ através de várias formas genéticas e esporádicas de ALS. O Intron 9/9 de 9 kb no SFPQ é preservado em todos os fundos mutantes da ALS, que leva a uma maior abundância citoplasmática de transcrições afetadas. A proteína SFPQ é amplamente anexada ao intron retido. A própria proteína SFPq é realocada do núcleo ao citoplasma em todos os fundos mutantes da ALS, bem como em amostras pós-mortem de pacientes esporádicos com a ELA.

Imagem em tamanho normal

utr em 3 ‘Play tecla funções na regulação da expressão genética pós-transcricional e os MRNAs expressos em tecidos cerebrais geralmente têm UTR em 3’ mais longo em comparação com outros tecidos 12, 13. De fato, um alongamento progressivo do ARNM 3 ‘UTR durante o desenvolvimento embrionário do mouse 29 é observado. Aqui observamos uma extensa variação no comprimento de 3 ‘UTR durante a indução neural de IPSCs humanos. Inesperadamente, encontramos um encurtamento transicional de 3 ‘UTR que precede o alongamento progressivo de 3’ UTR anteriormente relatado durante a diferenciação terminal. A função molecular desse encurtamento permanece pouco clara, embora outros estudos relatem um papel potencial do 3 ‘UTR na formação de parasitas e a produção de pluripotência 43, 44. A natureza altamente transitória deste processo regulatório pode explicar por que evitou a detecção experimental até à data. Nosso design experimental resolveu ao longo do tempo permitiu a identificação de programas transcricionais sequenciais que subjacente a neurogênese do motor humano.

vai se tornar um novo mecanismo pós-transcricional que regula a expressão gênica. Os tipos de células neuronais e imunes têm maiores proporções de intrônios retidos em comparação com outros tecidos 7. Estudos anteriores mostraram progressivo durante a diferenciação do terminal dos neurônios do rato e a relevância das transcrições que retêm o intron na regulação de genes específicos de neurônios ligados funcionalmente nos modelos de mouse 6, 7. Aqui nós fornecemos evidências de um aumento transitório nas transcrições de retenção de introns na fase PMN que é direcionada a uma rede de reguladores em splicing. Ao reconhecer a interação entre os eventos IR e os paraspeeckles nucleares, isso aumenta a possibilidade de que essas transcrições contribuam para a estabilização dos parapareckles ou que são dinamicadas dinamicamente nas referidas estruturas nucleares para inibir sua função. Experimentos futuros determinarão a estabilidade e a localização de tais transcrições.

Demonstramos que a sincronização dos programas pós-transcricionais é perturbada em amostras com mutações vcp causando als, com prematura e aumentada e, até certo ponto, com uma variação de comprimento de 3 ‘utr. Curiosamente, os principais reguladores de splicing RNA selecionados pelo Programa Aberrante Junction em Amostras de MU da VCP também mostraram um amplo IR no MN que abrigam mutações em outros genes causadores de ELA, incluindo Sod1 e Fus. Em particular, observamos uma expressão reduzida dos principais componentes do esplicante coincidindo com um IR aberrante em VCP, SOD1 e FUs. Isso é consistente com um estudo recente que mostra a associação entre IR e redução do recrutamento de fatores de emenda 45. Embora o Programa Conjunto Aberrante em Amostras de MU do VCP possa ser ligado à degeneração neuronal, a falta de mudanças nos programas transcricionais associadas à neurogênese motora indica que as disfunções no processamento de IR e no final 3 “não afetam o desenvolvimento fundamentalmente neuronal. Esses achados juntos levantam a hipótese de que o IR aberrante representa manifestações sutis de uma maneira desregulada de desenvolvimento de neurônios, que eventualmente contribui para a maior vulnerabilidade da madura do MNA.

A transcrição de retenção de intron mais significativa através de modelos VCP MU , SOD1 MU e FUS MU IPSC foi SFPQ, que codifica uma proteína que realiza funções-chave em formas de saída relacionadas à ELA, incluindo transcrição de RNA, emenda, processamento final 3 ‘e a viabilidade do AXON 32, 33, 34. Os experimentos subsequentes mostraram que a transcrição de retenção intrar é mais abundante no citoplasma do VCP Mu em comparação com as contrapartes de controle e coincide com a diminuição nuclear da proteína SFPQ. Também descobrimos que a proteína SFPQ é amplamente anexada ao seu intron retido. A auto-regulação entre as proteínas de ligação de RNA (RBPS) (por exemplo, TDP43) é reconhecida e, portanto, esta achação é consistente com a literatura anterior 46, 47. De forma crucial, encontramos a perda nuclear da proteína SFPQ em ambos os modelos transgênicos de SOD1 e VCP do mouse, e no cordão esporádico esporádico e esporádico, sugerindo que isso representa um selo molecular de ALS. Portanto, propomos que a interação entre a proteína SFPQ e sua transcrição que mantêm o intron impõe sua co-localização aberrante no citoplasma (Fig. 7b).A abundância reduzida da proteína SFPQ nuclear pode afetar a parte anterior ao ARNm, o que poderia contribuir para defeitos pós-transcricionais que nós e outros identificaram no ALS 48, 49. Em conjunto, descobrimos que o IR na transcrição do SFPq e a perda nuclear da proteína SFPQ são características moleculares comuns em várias formas genéticas e esporádicas de ALS.

Declaração de Ética

O consentimento informado foi obtido de todos os pacientes e controles saudáveis neste estudo. Todos os protocolos experimentais foram realizados de acordo com as regras e diretrizes aprovadas pelo Comitê Nacional de Ética de Pesquisa do Hospital Nacional de Neurologia e Neurocirurgia da UCLH e do Instituto de Neurologia da UCL (09/0272).

Derivação de fibroblastos humanos e IPSC

Os fibroblastos dérmicos foram cultivados no Optimem + FCS a 10%. Os seguintes plasmídeos episómicos foram transfectados para geração IPSC: PCXLE HOCT4 SHP53, PCXle HSK e PCXle Hul (Addngene), conforme relatado anteriormente. Os detalhes das linhas utilizadas neste estudo são fornecidos na tabela complementar 1. Duas das linhas de controle utilizadas (Control 2 e Control 3) estão comercialmente disponíveis e compradas da Corell (ND41866 * C Catalog Number) e Termofisher Scientific (Cat No . Número A18945), respectivamente.

Cultura de células

Os PSCs induzidos foram mantidos em Geltrex (Life Technologies) com um meio essencial (tecnologias de vida) e passaram usando EDTA (Technologies Life 0, 5 mm). Todas as culturas de células foram mantidas a 37 ° C e 5% de dióxido de carbono.

Diferenciação do neurônio de motor

MN diferenciação foi realizada utilizando uma versão adaptada de um protocolo 19 publicado anteriormente. Resumidamente, os IPSCs diferiam pela primeira vez em Neurepithelium por meio de confluência a 100% em meio quimicamente definido composta por DMEM / F12 Glutamax, neurobasal, l-glutamina, suplemento N2, aminoácidos não essenciais, suplemento de B27, β- mercaptoetanol (todas as tecnologias da vida) e insulina (Sigma). O tratamento com pequenas moléculas do dia 0 a 7 foi o seguinte: dorsomorfina 1 μm (Millipore), SB431542 2 μm (TCris Bioscience) e Chi99021 3, 3 μm (Miltenyi Biotec). No dia 8, a camada neurepitelial foi enzimaticamente dissolvida usando Disposse (Gibco, 1 mg de ML-1), foi colocada em folhas revestidas com laminina e depois modelada durante 7 dias com ácido retinóico 0, 5 μm e 1 μm purmorfamina. No dia 14, os precursores da medula espinhal MN foram tratados com purmorfamina 0, 1 μm por 4 dias mais antes de terminalmente diferenciado durante

10 dias no composto E 0, 1 μm (vida enzo Ciências) para promover a saída do ciclo celular. Nos pontos de tempo relevantes, as células foram coletadas para a extração de RNA ou foram fixadas em 4% paraformaldeído para imunomarcaje.

Extração de RNA e sequenciamento

o kit de células de RNA simples de Promega Maxwell RSC que inclui tratamento com Adnasa, juntamente com o instrumento Maxwell RSC, foi usado para extrações de RNA. Para validações de QPCR, o RNA foi extraído com o kit mini rneasy plus (Qiagen). O NanoDrop foi utilizado para avaliar a concentração de RNA e a proporção 260/280, e o bioanalisador agilente foi utilizado para avaliar a qualidade. As pontuações da integridade do RNA (RIN) foram > 8 para todas as amostras usadas neste trabalho. As bibliotecas de rnaseq foram preparadas usando o kit de mRNA trusek (Illumina) com 1 μg de entrada de poli (a) + RNA. Em seguida, os produtos foram purificados e enriquecidos com a amplificação de PCR para criar as bibliotecas finais de ADNc. As bibliotecas foram enviadas para sequenciamento de alto desempenho, foram executados para 75 ciclos em uma célula de fluxo rápido, na instalação central de NGS do Instituto de Neurologia, utilizando o Heeq2500. Para a análise de transcritos nucleares e citoplasmáticos, foi utilizado o kit de purificação Cytoplasmic e nuclear RNA (Norgen Biotek Corp).

Dados de sequenciamento de RNA

rNA foram obtidos de uma única sequência de 50 pb de cinco etapas que não sejam a diferenciação MN das amostras de controle e VCP MU (IPSC e dias 7, 14, 21 e 35); As amostras são listadas nos dados suplementares 1. O número de acesso de expressão gênica Omnibus (GEO) para bibliotecas RNA-SEQ é GSE98290.Também obtivemos sequenciamento de RNA de extremidade única e pareado lidos derivados de dois estudos independentes de diferenciação neural in vitro de HESC (GSE20301 22 e GSE86985 23); Dois estudos independentes sobre formas familiares de ALS causados pelo mutante SOD1 (n = 5; 2 sod1A4V derivado de pacientes e 3 amostras de controle isogênico, onde a mutação foi corrigida; HB9 Facs purificados MNS, GSE54409 27 ou FUs (n = 6; 3 FUs derivados de pacientes R521G e 3 controles de irmãos saudáveis MNS, GSE77702 28; dois dados de RNA-SEQ de CES humano compartilhado por Miha Modic; dois Fetal SPMN (E-MTAB-3871; NIH Roadmap Epigenomics Mapping Consortium) e adulto SPMN (laser -Captured SPMN; GSE76514 53) amostras.

Dados de expressão Pré-processamento

leituras simples e pareadas para cada um dos estudos foram alinhados inicialmente às sequências RNA ribossômicas para filtrar as leituras que pode vir da contaminação RNA ribossomal usando Bowtie2 (-V 0) 57. As leituras restantes estavam alinhadas ao genoma humano (H19) usando o Alinhador Aprendido de Splice Aligner Tophat2 com parâmetros padrão. Todas as bibliotecas geradas neste estudo tiveram < 1% RRNA, 90% de strandedness e > 70% exon O IC lê.

Quantificação do gene e caracterização não supervisionada do conjunto de dados

A quantificação absoluta dos genes foi realizada usando o HTSEQ Count 59. A análise subseqüente foi realizada com o pacote estatístico R versão 3.3.1 (2016) e BioconDuctor Libraries versão 3.3 (R: R: uma linguagem e ambiente para computação estatística. Viena, Áustria: r fundação para computação estatística; 2013). / p>

Antes da análise de agrupamento não supervisionada das 31 amostras de diferenciação MN, identificamos genes expressos de forma confiável para cada condição (VCP mu ou controle nos dias 0, 7, 14, 21 e 35). Para uma determinada amostra, o histograma da contagem de genes log2 é geralmente bimodal, com os modos correspondentes a genes não expressos e expressos. Genes expressos confiáveis foram identificados por ajuste uma mistura gaussiana de dois componentes para os dados do gene de contagem estimado de log2 com pacote R McLust 60. Um gene foi considerado confiável de forma confiável em uma determinada condição, se a probabilidade de pertencer à classe não expressa foi inferior a 1% em cada amostra pertencente à condição. 15, 989 genes foram selecionados com base na expressão detectada em pelo menos uma das 10 condições (ou seja, cinco pontos de tempo diferentes de restrição de linhagem para controle e VCP MU). Em seguida, quantias normalizamos as colunas da matriz de contagem de genes com o pacote RIMMA 61. O agrupamento hierárquico não supervisionado da matriz de contagem de genes filtrados e normalizados foi realizado com correlação de classificação de Spearman como medida de distância e algoritmo de agrupamento completo.

Realizamos SVD da expressão dos 15, 989 genes nos cinco estágios distintos de diferenciação mn de controles saudáveis e VCP mu. Em seguida, selecionamos os componentes que capturam maximamente a variação na expressão gênica. Para visualizar os vetores singulares corretos \ (\ left \ {{\ overwighterrrow v _k} \ direito \} \), nós plotei a expressão no eixo vertical como uma função do tempo correspondente a cada amostra no eixo horizontal e para colorir tudo Amostras correspondentes a controles saudáveis cinza, e aqueles correspondentes a VCPMU em Magenta. Em seguida, identificamos genes cujos perfis de expressão correlacionaram (correlação de Pearson entre perfil individual de expressão gênica e vetores singulares corretos) e contribuíram (projeção de cada perfil de expressão gênica individual para vetores singulares certos) com o perfil de expressão do perfil da expressão (positivamente ou negativamente) vetores singulares. A fim de identificar genes representativos para cada vetor singular, os genes foram classificados de acordo com as pontuações de projeção e correlação. As maiores (pontuações mais positivas em projeção e correlação) e a menor (mais pontuações negativas em genes de correlação e projeção) foram selecionadas para cada vetor singular usando agrupamento K-média para a análise de enriquecimento de movimento a jusante.

Análise de APA de RNA-SEQ

Para a identificação da identificação UTR alternativa de 3 ‘a partir do RNA-SEQ, foi obtida cobertura de cadeia nucleotídica para cada uma das 31 amostras utilizando Genomecov da Suite Bedtools 62. A próxima regiões transcritas continuamente foram identificadas usando uma janela deslizante pelo genoma que requer uma cobertura mínima de sete leituras em mais de 80 posições por janela de 100 pb; As regiões vizinhas separadas por regiões de baixa potência foram mescladas como anteriormente descritas 13. Os fragmentos expressos foram então associados à sobreposição de 3 ‘UTR usando as últimas versões HG19 Ensembl V75 63.Regiões expressas isoladas que não se sobrepõem a qualquer recurso foram mais associadas ao mais próximo 3 ‘UTR IF (1) O recurso anotado mais próximo não foi nada além de um 3’ UTR, (2) se a vertente da região expressa estava alinhada com o fita do mais próximo 3 ‘UTR, e (3) se a distância para o 3’ UTR fosse inferior a 10’000 KB, que é a faixa de distância intragênica. Os UTRs 3 ‘resultantes foram submetidos a uma extensa filtragem para excluir potencial transcrição intragênica, transcritos sobrepostos e introns retidos como descrito anteriormente 13. Finalmente interceptamos do mais longo segmento UTR anotado com dados de RNA-SEQ com uma anotação do site poli (a) construída usando lidas de bibliotecas de sequenciamento de 3 termeiras em amostras humanas 64 para obter poli putative (A) dentro do segmento de 3 ‘maior de cada transcrição.

Em seguida, usamos o número de leituras mapeadas para -300 nt região de terminal de cada 3 ‘UTR ISOFORMS como um proxy para o nível de expressão de iSOFORME UTR para identificar alterações no uso de e locais distais poli (a). A densidade de leituras mapeadas em -300 nt região terminal de 3 ‘UTR ISOFORM é bimodal, com um pico de baixa densidade provavelmente correspondente à transcrição de fundo, isto é, 3’ utr isoformas de baixa abundância ou 3 ‘isoformas UTR para quais leituras foram mapeadas espúidas, e um pico de alta densidade correspondente a expresso de 3 ‘Isoformas UTR. A fim de identificar expresso de forma confiável 3 ‘Isoformas UTR no estudo, uma mistura gaussiana de dois componentes foi montada nos dados usando o pacote R McLust 60; Uma isoforma foi chamada de forma confiável se em ambas as réplicas tinham menos de 1% de chance de pertencer à categoria de fundo.

Para identificar transcrições que mostram uma mudança marcada no uso do site poli (a) entre as condições , classificamos as diferenças no uso de site Poly (A) proximal-a-distal usando as duas pontuações a seguir:

\ (s_1 = {\ mathrm {log}} _ 2 \ left ({\ frac {{\ frac {{\ frac {{\ I _ {\ mathrm {proximal}}}} {{i _ {\ mathrm {distal}}}}}}}} {\ mathrm {cond1}} – {\ mathrm {log}} _ 2 \ esquerda ({\ frac { {I _ {\ mathrm {proximal}}}} {{i _ {\ mathrm {distal}}}}}}}}}} {\ mathrm {cond2}} \)

\ (s_2 = \ frac {{I _ {\ mathrm {proximal}}}} {{i _} {\ mathrm {proximal}} + i _ {\ mathrm}}}}}}}}}}}}}} {COND1}} – \ frac {{{i _ _} {\ frac {{{{{{{i _ _ {\ m mathrm {proximal}}}} {{I _ {\ mathrm {proximal}} + I _ {\ mathrm {distal}}}} _ {\ mathrm {cond2}} \ no \ esquerda \)

A estatística A significância das mudanças na relação de local (a) poli (a) proximal-a-distal entre duas condições foi avaliada pelo teste de contagem exato de Fisher usando contagens de leitura bruta resumidas de promoção do promotor-proximal s promotor-distal 3 ‘UTR ISOFORMS originários de condições. Ajustamos o controle P-Value para falsa taxa de descoberta (FDR) de 0,01. Nós restringimos nossa análise em transcrições do ensembl contendo pelo menos dois 3 ‘UTRs gerados por poliadenilação em conjunto expressas em condições de interesse. Os turnos proximais foram então selecionados quando \ (s_1 \ le – 1 \), \ (s_2 \ le – 15 \% \ \) e fdr < 0,01; Deslocamento Distal foram selecionados quando selecionados quando \ (S_1 \ GE 1 \), \ (S_2 \ GE 15 \% \%) e fdr < 0,01.

splicing Análise

A identificação de todas as classes de como eventos na diferenciação MN foi realizada com as vastos-ferramentas 21 de pipeline RNA-SEQ. Para que um evento seja considerado diferencialmente regulado entre duas condições, exigimos uma média mínima ΔPSI (entre os replicados emparelhados) de pelo menos 10% e que a transcrição alvejada pelo evento em splicing em questão a ser expressa de forma confiável em todas as amostras condições comparadas, ou seja, cobertura de leitura suficiente em todas as amostras de interesse. Em seguida, realizamos a curativa manual integrada de Genomics Genomics (IGV) para remover a baixa cobertura IR obtendo 167 eventos de alta confiança. A análise focada do IR foi realizada nestes 167 eventos de IR para os quais uma porcentagem de IR foi calculada como a fração de mapeamento de intron lê para o número médio de leituras de mapeamento para os fiscais de 5 ‘e 3’ normalizado para o comprimento do comprimento do respectivo intron e exons. Um teste de contagem de pescadores p-Value foi obtido ao testar para o IR diferencial entre as condições.

Análisis Diferencial de la Expresión Génica.

Para a análise de expressão gênica diferencial Nós corremos Kallisto 54 e Sleuth 55. Kallisto foi utilizado para (1) construir um índice de transcrição da liberação do ensembl grc38 85 Homo sapiens transcriptoma (-k 31), (2) pseudo-alinhe o RNA-SEQ Leituras para o transcriptoma e (3) quantificar as abundâncias de transcrição (-B 100 single -l 275 -s 50-RF-encalhado). Next identificamos genes diferencialmente expressos diferenciados com o sleuth. A análise subseqüente foi realizada com o pacote estatístico R versão 3.3.1 (2016) e BioconDuctor Libraries versão 3.3 (R: uma linguagem e um ambiente para computação estatística. Viena, Áustria: r Fundação para computação estatística; 2013). Antes de selecionar genes diferencialmente expressos, identificamos genes expressos de forma confiável.A Kallisto produz abundância de transcrição e, portanto, calculamos a abundância de genes resumindo a contagem bruta estimada das isoformas constituintes para obter um único valor por gene. Para uma determinada amostra, o histograma da contagem de genes / transcript log2 é geralmente bimodal, com os modos correspondentes a genes não expressos e expressos. Genes / transcrições expressos de forma confiável foram os seguintes identificados pela montagem de uma mistura gaussiana de dois componentes à transcrição de contagem estimada de log2 e dados genéticos R com pacote McLust 60; Um pseudocup de 1 foi adicionado antes da transformação do log2. Um gene foi considerado de forma confiável em uma determinada condição, se a probabilidade de pertencer à classe expressa estava acima de 0,1 em cada amostra pertencente à condição. Finalmente, os genes que mostraram uma expressão diferencial de log duplo e um p -value < 0,05, e que foram expressos de forma confiável na condição de mutante ou controle de VCP foram considerados como alterando significativamente.

Ir análise de enriquecimento

A análise de enriquecimento foi realizada com teste de Fisher clássico com o TopGo Bioconductor Package 65. Apenas os termos contendo pelo menos 10 genes anotados foram considerados. Um p -value de 0,05 foi usado como o nível de significância. Nas figuras, os principais termos significativos foram selecionados manualmente removendo os termos e os termos redundantes que contêm menos de cinco genes significativos.

Análisis de Vermelho

A informação experimental da interação da proteína-proteína tem Foi recuperado do banco de dados de string 66 e visualizado no citoscape 67, 68.

Mapeamento de dados Eclip

Os dados de Eclip RAW foram baixados da codificação 36, 37. Antes do alinhamento, a remoção do adaptador de dois estágios foi realizada usando o CutAdAPT de acordo com o procedimento operacional padrão ECLIP ECLIP. Uma abordagem de dois estágios também foi usada para alinhamento. Primeiro, Bowtie2 foi usado para remover leituras alinhando para RRNA ou TRNA. Então, a estrela foi usada para alinhar as leituras restantes para GRCH38, com apenas leituras de mapeamento exclusivamente retidas. As duplicatas de PCR foram colapsadas com base nos identificadores moleculares exclusivos e locais de mapeamento. A posição cruzada de resolução de nucleotídeos foi calculada como a coordenada imediatamente anterior ao evento de truncamento de transcrição reversa.

Validação reversa, QPCR e Validação de IR

A transcrição reversa foi realizada usando o primeiro strand de reverter Kit de síntese de cDNc (termofisher científico) usando 1 μg de RNA total e hexamers aleatórios. O QPCR foi realizado usando o Mistura Master Sybr Green (termofisher Científico) e o sistema de QPCR Agilent MX3000P ou o sistema de PCR em tempo real QuantStudio 6 (Biosystems aplicados). Os iniciadores utilizados estão listados na tabela suplementar 2. A amplificação específica foi determinada por análise da curva de fusão e eletroforese de gel de agarose dos produtos PCR. Pares de primer com 90-110% de eficiência foram usados. Para cada validação de IR para a tela três pares de primers foram utilizados: (1) par de primer F1 R1 (intron abrangendo, através da junção exon-exon) para analisar os níveis de expressão gênica; (2) par de primer F2 R2 (um primer em um exon flanqueando o intron a ser analisado, o outro no intron) foi utilizado para avaliar os níveis de IR; e (3) par de primer F3 R2 (ambos os primers nas exons que flanqueam o intron de interesse, se possível, projetado em toda a junção exon-exon) para medir os níveis da transcrição emendados. Amostras de RT-Minus foram usadas como controles negativos. Os níveis de IR (par de primer f2r2) foram normalizados sobre o nível de expressão de cada gene individual (par de primer F1R1). Os níveis de expressão gênica foram medidos usando o método DDCT usando três genes de limpeza (GAPDH, POLR2B e UBE2D3).

Análise ANÁLISIS DO CICLO>

Ciclo de Cédulas foi realizada por citometria de fluxo de acordo com protocolos padrão. Resumidamente, as células foram dissociadas usando accutase ou tripsina (tecnologias de vida), lavadas e fixadas em suspensão utilizando 70% de etanol frio. As células foram manchadas utilizando iodeto de propidium (PI, 50 μg ml -1, Sigma Aldrich) na presença de RNase A (10 μg / ml, Sigma Aldrich). As células foram analisadas usando um BD Facs Calibur (BD Bioscience). Doublets foram excluídos da análise e 10 000 eventos foram coletados no portão de célula única por amostra. Os dados do ciclo de célula foram analisados utilizando o módulo multicticlo do FCS Express 6 (software de Novo).

Animais, modelos transgênicos e processamento de tecidos

Todas as experiências de animais descritas neste estudo foram realizadas neste estudo sob licença do Office Home do Reino Unido, e foram aprovados pelo Painel de Revisão Ética do Instituto de Neurologia. As seguintes linhas transgênicas do mouse foram utilizadas: (1) ratos SOD1 G93A (B6SJL-TG (SOD1 * G93A) 1GUR / J, Jackson Laboratories) (2) Expressar o Mutant VCPA232e humano foram gerados por J. Paul Taylor et al, ST Jude Children’s Research Hospital, Memphis, TN, EUA e são descritos em Custer et al, 2010 69 e criados para o fundo preto 6 (C57 / B6) tipo C57 (C57 / B6).O tipo selvagem C56BL / 6-SJL de fundo misto (Laboratórios Jackson) foram usados como controle. Para coleta de tecidos, os animais foram injetados com anestesia terminal (pentobarbital sódio, eutatal) e foram transcordoriamente perfundidos com 4% paraformaldeído. A região lombar da medula espinhal foi removida e pós-fixada com 4% de paraformaldeído e crioprotected durante a noite com sacarose de 30%; As crioseções transversais seriais de 10 ou 20 μm foram cortadas para coloração de imunofluorescência.

Tecido pós-mortem humano

Snap-congelados seções derivadas de medula espinhal lombar de três pessoas e sexo pacientes esporádicos da ALS, duração da doença 1, 2 e 2 anos, respectivamente, e três ternos e gênero combinavam sujeitos sem história de doença neurológica (n = 3 pacientes e 9 seções; meio de idades: 68 + 6,55 e 69,5 anos de idade ; ver a tabela complementar 3). A morte para os tempos de atraso congelamento de encaixe também foram comparáveis entre os grupos (atraso: 25 + 5,29 e 29,33 + 9,29 h, para os pacientes com controle e sals, respectivamente). As amostras da medula espinhal foram obtidas do Neuroresource do Banco Tissue, UCL Instituto de Neurologia, Londres, Reino Unido. As amostras foram doadas ao banco de tecidos com o doador de tecidos escritos, informou o consentimento após a revisão ética pelo Comitê NHS Nres Londres-Central e armazenado sob uma licença do setor de pesquisa da Autoridade de Tecidos Humanos do Reino Unido (HTA).

ImunoLabling e Imaging

para imunocitoquímica e imuno-histoquímica, as amostras foram bloqueadas em 10% de soro normal de cabra (NGS) ou 10% de soro normal de burro (NDS), conforme apropriado e permeabilizado em 0,3% Triton X-100 (Sigma-Aldrich; em PBS) à temperatura ambiente (RT) por 1 h. A imunoabelação foi realizada com anticorpos primários em NGS (5%) e Triton X-100 (0,1% em PBS) a 4 ° C durante a noite, seguidos por anticorpos secundários específicos de espécies para 1 h na RT e Counterstain nuclear (100 ng / ml). por 10 min na RT. Para fixação de amostras pós-mortem humanas e permeabilização em metanol frio (-20 ° C, 20 min) foi realizada antes da imunotaining. Anticorpos primários foram diluídos da seguinte forma: Rabbit Anti olig2 (Millipore, AB9610) 1: 200; mouse anti smi32 (Cambridge Biocience, SMI-32R-500) 1: 1000; Cabra Anti Chat (Millipore, AB144P) 1: 100; coelho anti pax6 (Biolegend, 901301) 1: 300; Mouse e Rabbit Anti SFPQ (Abcam, AB11825 e AB38148, respectivamente) 1: 100; mouse e coelho anti beta-tubuliniii (Biolegend, 801201), mouse Anti Lim3 (DSHB, 67.4E12) 1:50; Frango Anti NKX2.2 (DSHB, 74,5A5) 1:50. As imagens foram adquiridas usando um microscópio confocal de varredura de 710 laser (ZEISS) ou o sistema de triagem de alto teor de ópera Phenix (Perkin Elmer). Para análise de imagens, Fiji ou o sistema de análise de imagem de Columbus (Perkin Elmer) foram utilizados.

Western blotting

Western blotting foi realizado de acordo com protocolos padrão (Biorad). Os lisados celulares inteiros foram obtidos de pellets de células Snap-congelados usando o tampão de lise livre de EDTA completos ™ Lise-M (Roche). A concentração de proteína foi determinada por Pierce BCA ensaio (termofisher científico) e usado para maximizar a carga igual através dos géis (~ 9 μg por faixa). A eletroforese foi executada em 4-12% Criterion ™ XT Bis-Tris Protein Gel (BioRad) na tensão constante (200 V, uma hora) e seguida de transferência de proteína para uma membrana nitrocelulose (Bioad). O bloqueio foi realizado em PBS, 0,1% Tween, 5% de leite seco em pó (maravilha) a RT por uma hora seguida de incubação primária de anticorpos durante a noite a 4 ° C. Os anticorpos primários foram diluídos em PBS, 0,1% tween, 5% de leite seco em pó da seguinte forma: Mouse Anti SFPQ (ABCAM, AB11825) 1: 250; Rabbit Anti TLS / FUs (ABCAM, AB84078) 1: 500; Coelho Anti DDX39 (Sigma Aldrich, SAb2700315) 1: 500, Rabbit Anti Dars (ABCAM, AB182157) 1: 1000; mouse anti gln1 (anticorpos online, AA 1-373) 1: 1000; coelho anti TDP-43 (ABCAM, AB133547) 1:10, 000; Mouse Anti Gapdh (Tecnologias Life, Clone 6C5, AM43000) 1: 5000. Para as membranas de detecção foram incubadas com anticorpos fluorescentes infra-vermelhos específicos de espécies (Irdye, licor) durante uma hora na RT e fotoquecidos usando um sistema de imagem Odyssey FC (licor).

Disponibilidad de Dados

O número de adesão GEO para as bibliotecas RNA-SEQ recém-geradas é GSE98290 (//www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc = GSE98290). Também obtivemos sequenciamento de RNA de extremidade única e pareado lidos derivados de dois estudos independentes de diferenciação neural in vitro de HESC (GSE20301 22 e GSE86985 23); Dois estudos independentes sobre formas familiares de ALS causados pelo mutante SOD1 (n = 5; 2 sod1A4V derivado de pacientes e 3 amostras de controle isogênico, onde a mutação foi corrigida; HB9 Facs purificados MNS, GSE54409 27 ou FUs (n = 6; 3 fus derivados de pacientes R521G e 3 controles de irmãos saudáveis MNS, GSE77702 28; dois dados de RNA-SEQ de Humano Escolhido por Miha Modic; dois Fetal SPMN (E-MTAB-3871Gene Expressão Omnibus; Nih Roadmap Epigenômica Mapeando Consórcio; // www .bi.ac.Reino Unido / ArrayExpress / Experimentos / E-MTAB-3871 /) e Adulto SPMN (SPMN capturado a laser; GSE76514 52, 53) amostras. Outras informações e solicitações de recursos e reagentes devem ser direcionados e serão cumpridos pelo contato líder, Rickie Patani ().

Expresiones de Gratitud

Os autores desejam agradecer aos pacientes para doações de fibroblastos. Agradecemos também Miha Modic por compartilhar os dados do HSC RNA-SEQ, Martina Hallegger e Roberto Simone para sua contribuição sobre design de primer, ANOB M Chakrubarti para compartilhar arquivos de cama de eClip alinhados. Agradecemos Benjamin Clarke, Mhoriam Ahmed e membros do Schievo e Greensmith Labs para valioso apoio técnico. Agradecemos à Selina Wray por gentilmente fornecendo acesso às linhas IPSC mutantes VCP. Este trabalho foi apoiado pelo Instituto Francis Crick, que recebe seu financiamento principal da pesquisa de câncer UK (FC010110), o Conselho de Pesquisa Médica do Reino Unido (FC010110) e a confiança de Wellcome (FC010110). Reconhecemos o financiamento de confiança de Wellcome para RP, para NML e JU, um prêmio de infraestrutura MRC Emedlab Medical Bioinformatics para NML (Sr. / L016311 / 1), o Prêmio UCL Grand Desafios (CEH), uma bolsa de pesquisa Pós-doutorado Marie Curie (657749- Neuroutr) e uma comunhão avançada de mobilidade pós-ciências da Swiss National Science Foundation (P300PA_174461) para RLNML é um líder do Grupo Winton em reconhecimento ao apoio do Winton Charitable Foundation para o estabelecimento do Instituto Francis Crick. Reconhecemos a plataforma DPUK / MRC para o fornecimento da Ópera Phenix para análise IPSC de alta taxa de transferência e suporte generoso do Instituto Nacional de Instituto de Saúde Universidade de Londres Londres Centro de Investigação Biomédica.

Material Suplementario Electrógrafo.

  1. información suplementaria

  2. des Descripción de arquivos suplementarios adicionales

  3. datos suplementarios 1

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *