abstrato
o volume de dados biológicos, químicos e funcionais depositados no domínio público Está crescendo rapidamente, graças ao seqüenciamento de próxima geração e às tecnologias de triagem altamente automatizadas. Esses conjuntos de dados representam recursos inestimáveis para a descoberta de drogas, particularmente para patógenos negligenciados menos estudados. Para alavancar esses conjuntos de dados, a integração inteligente e intensiva de dados é necessária para orientar inferências computacionais em diversos organismos. O recurso Chemogenomics TDR integra dados genômicos de patógenos humanos e organismos modelos, juntamente com informações sobre compostos bioativos e suas atividades anotadas. Este relatório destaca as últimas atualizações sobre os dados e funcionalidades disponíveis em alvos de TDR 6. Com base nos modelos de rede Chemogenomic que fornecem links entre inibidores e alvos, o banco de dados agora incorpora prioridades alvo orientadas por rede e novas visualizações de subcános de rede exibindo produtos químicos e alvos Bairros -similaridade, juntamente com links de bioactividade compostos alvo associados. Os dados disponíveis podem ser navegados e consultados por meio de uma nova interface de usuário, que permitam que os usuários realizem prioridades de alvos de proteína e inibidores químicos. Como tal, os alvos de TDR agora facilitam a investigação da droga que repture contra os alvos do patógeno, o que pode potencialmente ajudar na identificação de metas candidatas para compostos bioativos com alvos anteriormente desconhecidos. Os alvos de TDR estão disponíveis em https://tdrtargets.org
introdução
Negligenciamento de doenças tropicais (NTDs) afetam desproporcionalmente ~1,5 bilhões de pessoas em baixa renda e desenvolvimento países, onde são uma causa principal para os anos de vida perdidos para a deficiência e morte prematura (1). Historicamente, a falta de envolvimento da indústria farmacêutica, em combinação com investimentos limitados em programas de pesquisa pública em países afetados, resultou em uma deficiência de drogas disponíveis para controlar efetivamente a maioria dessas doenças (2). Além disso, as drogas atualmente em uso para tratar essas doenças são muitas vezes comprometidas em termos de custo, dificuldades em administração, eficácia, resistência de drogas ou perfis de segurança.
Discovery de drogas é um processo demorado e caro (3 4). Para os NTDs, em particular, os programas de descoberta de drogas precisam sobreviver por tempo suficiente através de escassez de financiamento generalizadas para torná-lo em testes clínicos subseqüentes (5). Neste contexto, uma abordagem estratégica para a descoberta de medicamentos da NTD é o reposicionamento de drogas (6), que pode ajudar a reduzir os custos, facilitando as aprovações regulamentares em tentativas precoces para as drogas que já passaram por pesquisas clínicas para outras doenças e / ou indicações e fracassados por razões outras do que segurança (6). Além disso, se o escopo da remessa de drogas for ampliado para incluir drogas e compostos bioativos da pesquisa sobre organismos não humanos, também pode levar à identificação de pelo menos novas ferramentas químicas para sondar a função de metas e vias em patógenos humanos. Assim, aproveitando as vastas quantidades de dados disponíveis de programas de pesquisa bem financiados em doenças humanas e organismos de modelos, a paisagem de descoberta de drogas em NTDs recebe um impulso positivo (7).
Estratégias computacionais estão se tornando cada vez mais Essencial na descoberta de medicamentos translacionais, tanto na academia quanto na indústria farmacêutica. A integração inteligente e intensiva dos volumes crescentes de dados gerados durante todas as fases da descoberta de medicamentos já está permitindo que os principais desafios do processo sejam abordados (8). Desde a sua introdução, o banco de dados de alvos do TDR tem sido um recurso confiável para pesquisadores de doenças negligenciadas para acessar dados de quimogênica para priorização alvo de drogas e drogas que repulam em doenças negligenciadas. Introduzido em 2008 (9), este recurso de acesso aberto permitiu aos pesquisadores encontrarem novos alvos de proteína e inibidores químicos, e priorizá-los para ajudar o desenvolvimento de medicamentos para os patógenos da NTD. Os alvos de TDR utilizam conjuntos de dados funcionais genômicos disponíveis publicamente para permitir que os usuários encontrem e priorize os alvos com base em seus conhecimentos da biologia de seu patógeno de interesse e natureza da doença (10,11). Isso é implementado por uma seleção de destino baseada em usuários flexível (usando critérios de filtragem) e classificação (usando ponderação específica de critérios) (12,13).
Aqui, descrevemos as atualizações para os conjuntos de dados subjacentes e funcionalidade no recurso de alvos de TDR, acumulado desde sua publicação anterior em 2012 (13). A nova versão de TDR (V6.1, abreviada TDR6 neste documento) integra informações genômicas específicas do patógeno com dados funcionais (por exemplo,expressão, relacionamentos baseados em ortologia, essencialidade) de uma seleção de organismos, juntamente com dados de compostos bioativos (estrutura química, propriedade e informação de bioactividade / alvo); Tudo o que pode ser consultado e navegado pelo aplicativo da web. Todas as consultas podem ser salvas em um esconderijo pessoal por usuários registrados e publicados através do aplicativo da Web para maximizar as oportunidades de colaboração. Listas priorizadas de alvos podem ser exportadas para mais análises off-line. Detalhes completos de todos os novos recursos podem ser encontrados nas notas de lançamento (https://tdrtargets.org / lançamentos). Este relatório apresenta um passo a passo completo do aplicativo da Web, seus novos recursos e exemplos para ilustrar casos de uso.
Visão geral e organização de alvos de TDR
como nos comunicados anteriores de alvos de TDR, O TDR6 também é organizado em duas seções principais: alvos e compostos. A seção de alvos do banco de dados contém dados genômicos para 20 patógenos humanos, e permite que os usuários executem consultas e prioridades de alvos de proteína com base em vários recursos e dados relevantes para a descoberta de drogas (ver Tabela 1). A seção de compostos do banco de dados contém informações sobre > 2 milhões de compostos bioativos, e permite consultas com base nas propriedades químicas dos compostos e suas bioatividades anotadas (ver Tabela 2).
Consultas de destino disponíveis em alvos de TDR
consulta. | patógenos para os quais os dados estão disponíveis. | Tipos de dados disponíveis para consultar. | |||
---|---|---|---|---|---|
nomes & Anotações | Todos | Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos) | |||
Características de proteína | Todos | MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI). | |||
Informações estruturais | todos | disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase | |||
expressão gênica | plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii | Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas. | |||
Informações filogenéticas | Todos | Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados. | |||
essencialidade | c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei | Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos. | |||
dados de validação de destino | schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum | dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados) | |||
Tudo | Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal) | ||||
Todos | Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE) | ||||
Referências bibliográficas | Todos | Alvos de filtro com base em publicações disponíveis |
grupo de consulta. | patógenos para os quais os dados estão disponíveis. | Tipos de dados disponíveis para consultar. | |||
---|---|---|---|---|---|
nomes & Anotações | Todos | Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos) | |||
Características de proteína | Todos | MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI). | |||
Informações estruturais | todos | disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase | |||
expressão gênica | plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii | Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas. | |||
Informações filogenéticas | Todos | Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados. | |||
essencialidade | c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei | Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos. | |||
dados de validação de destino | schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum | dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados) | |||
Tudo | Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal) | ||||
Todos | Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE) | ||||
Referências bibliográficas | Todos | Alvos de filtro com base em publicações disponíveis |
Consultas de destino disponíveis em alvos de TDR
grupo de consulta. | patógenos para os quais os dados estão disponíveis. | Tipos de dados disponíveis para consultar. | |||
---|---|---|---|---|---|
nomes & Anotações | Todos | Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos) | |||
Características de proteína | Todos | MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI). | |||
Informações estruturais | todos | disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase | |||
expressão gênica | plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii | Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas. | |||
Informações filogenéticas | Todos | Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados. | |||
essencialidade | c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei | Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos. | |||
dados de validação de destino | schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum | dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados) | |||
Tudo | Precedente para modulação química bem sucedida da atividade ou função de destino.Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal) | ||||
Todos | Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE) | ||||
Referências bibliográficas | Todos | Alvos de filtro com base em publicações disponíveis |
grupo de consulta. | patógenos para os quais os dados estão disponíveis. | Tipos de dados disponíveis para consultar. | |||
---|---|---|---|---|---|
nomes & Anotações | Todos | Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos) | |||
Características de proteína | Todos | MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI). | |||
Informações estruturais | todos | disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase | |||
expressão gênica | plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii | Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas. | |||
Informações filogenéticas | Todos | Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados. | |||
essencialidade | c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei | Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos. | |||
dados de validação de destino | schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum | dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados) | |||
Tudo | Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal) | ||||
Todos | Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE) | ||||
Referências bibliográficas | Todos | Alvos de filtro com base em publicações disponíveis |
Consultas de compostos disponíveis em alvos de TDR
grupo de consulta. | Tipos de dados disponíveis para consultar. |
---|---|
Pesquisas baseadas em texto | |
nomes & anotações | nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi |
Propriedades químicas | peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski) | Busca | Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) | Bioatividade | Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm) |
compostos órfãos | busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas) |
Compostos com alvos | compostos que têm informações alvo e ensaios baseados em mecanismo |
Pesquisas baseadas em estrutura | |
semelhança composta | Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas |
Subestrutura composta | Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento. |
grupo de consulta. | Tipos de dados disponíveis para consultar. |
---|---|
Pesquisas baseadas em texto | |
nomes & anotações | nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi |
Propriedades químicas | peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski) | Busca | Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) | Bioatividade | Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm) |
compostos órfãos | busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas) |
Compostos com alvos | compostos que têm informações alvo e ensaios baseados em mecanismo |
Pesquisas baseadas em estrutura | |
semelhança composta | Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas |
Subestrutura composta | Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento. |
consultas compostos disponíveis em alvos de TDR
grupo de consulta. | Tipos de dados disponíveis para consultar. |
---|---|
Pesquisas baseadas em texto | |
nomes & anotações | nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi |
Propriedades químicas | peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski) | Busca | Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) | Bioatividade | Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm) |
compostos órfãos | busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas) |
Compostos com alvos | compostos que têm informações alvo e ensaios baseados em mecanismo |
Pesquisas baseadas em estrutura | |
semelhança composta | Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas |
Subestrutura composta | Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento. |
grupo de consulta. | Tipos de dados disponíveis para consultar. |
---|---|
Pesquisas baseadas em texto | |
nomes & anotações | nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi |
Propriedades químicas | peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski) | Busca | Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) | Bioatividade | Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo,IC50 < 5 μm) |
órfãos | busca por compostos que têm relatórios de bioactividade no organismo integral ou ensaios de células inteiras, mas não têm informações alvo e mecanismo (inibidores / drogas de órfãos) |
Compostos com alvos | encontrar compostos que têm informações alvo e mecanismo ensaios |
Pesquisas baseadas em estrutura | |
semelhança composta | desenhar / colar Composto ou fragmento 2D estrutura e busca compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas |
Subestrutura composta | Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento. |
novos recursos em Alvos de TDR 6
relatamos recentemente um modelo de rede integrativa (14), onde todos os conjuntos de dados de escala de genoma disponíveis em alvos de TDR (alvos de proteína), informações químicas (compostos bioativos) e suas relações (bioatividade de compostos ensaios baseados em alvo) foram ligados a um gráfico multicamado. No TDR6, este modelo de rede foi atualizado integrando novos conjuntos de dados (descritos abaixo). Este modelo incorpora links entre alvos e compostos bioativos derivados da curativa manual de ensaios de bioactividade publicados (ou seja, links diretos entre alvos e compostos químicos), bem como de relações computadas (links alvo-alvo e links compostos compostos) baseados em Anotações Proteína (Domínios de PFAM, Grupos Ortólogos) e similaridade química. Um aspecto fundamental desses links no modelo de rede multicamada é que eles possibilitam a rápida exploração e visualização do bairro ao redor de alvos selecionados e / ou compostos bioativos. Isso permite que os usuários explorem compostos vinculados a alvos, inspecione a vizinhança química de similaridade em torno de compostos bioativos e visualize esses dados de maneira amigável e abrangente (veja a Figura 1).
Visualizações de rede esquemática nas visualizações de TDR6 e Sub-Graph: O composto ou as páginas de destino exibem agora uma visualização subgráfica contendo objetos na vizinhança da rede da entidade selecionada. Esses gráficos são construídos a partir de um gráfico de rede complexo de três camadas. Um esquema deste gráfico é apresentado no topo. Ambos os subgrafos de destino e compostos são sempre organizados da seguinte forma: os nós compostos (verdes) são conectados a alvos (laranja = patógenos; cinza = não-patógenos) através de bordas de bioatividade. Esses links retratam resultados positivos (verdes), neutros (cinza) ou negativos (vermelhos). Finalmente, destina a mapa para um conjunto de afiliações funcionais (anotações, nós azuis). No exemplo, o gráfico mostra um conjunto de inibidores conhecidos para uma aciltransferase humana (15). Essas bioatividades (todas positivas) são desenhadas como elos verdes entre os compostos (nós verdes) e o alvo (nós cinzentos para não patogênicos, nós laranja para patógenos). O gráfico destaca as oportunidades de reivindicação para aciltransferases de helmintos (linhas tracejadas, adicionadas manualmente para esta figura), com base em anotações compartilhadas com o alvo humano drodgable conhecido. O nó vermelho na camada de drogas indica o composto selecionado. Os tamanhos dos nó são determinados pelo número de conexões na rede (grau), enquanto as larguras de link de bioactividade (arestas) estão relacionadas ao número cumulativo de evidências experimentais para um determinado par de drogas (número de ensaios).
Visualizações de Schematic em TDR6 e Sub-Graph Visualizações: As páginas compostas ou de destino exibem agora uma visualização subgráfica contendo objetos no vizinhança de rede da entidade selecionada. Esses gráficos são construídos a partir de um gráfico de rede complexo de três camadas. Um esquema deste gráfico é apresentado no topo. Ambos os subgrafos de destino e compostos são sempre organizados da seguinte forma: os nós compostos (verdes) são conectados a alvos (laranja = patógenos; cinza = não-patógenos) através de bordas de bioatividade. Esses links retratam resultados positivos (verdes), neutros (cinza) ou negativos (vermelhos). Finalmente, destina a mapa para um conjunto de afiliações funcionais (anotações, nós azuis). No exemplo, o gráfico mostra um conjunto de inibidores conhecidos para uma aciltransferase humana (15). Essas bioatividades (todas positivas) são desenhadas como elos verdes entre os compostos (nós verdes) e o alvo (nós cinzentos para não patogênicos, nós laranja para patógenos). O gráfico destaca as oportunidades de reivindicação para aciltransferases de helmintos (linhas tracejadas, adicionadas manualmente para esta figura), com base em anotações compartilhadas com o alvo humano drodgable conhecido. O nó vermelho na camada de drogas indica o composto selecionado. Os tamanhos dos nó são determinados pelo número de conexões na rede (grau), enquanto as larguras de link de bioactividade (bordas) estão relacionadas ao número cumulativo de evidências experimentais para um determinado par de drogas (número de ensaios).
Com essas atualizações, o TDR6 agora fornece aos usuários as seguintes funcionalidades: (i) priorizações alvo inteiro-genoma dirigidas pela rede, (ii) exploração de reivindicação de medicamentos; e iii) a exploração de metas candidatas para compostos órfãos. Estes casos de uso são possíveis por um número de recursos baseados em rede pré-computados, como uma nova pontuação de farmacibilidade de rede (NDS). Associando uma métrica quantitativa a metas com base no enriquecimento de compostos bioativos em nós de rede estreitamente conectados, esta pontuação facilita a classificação de metas em grupos de farmacia (DG), que estão disponíveis para usuários em consultas de banco de dados.
o O modelo de rede também é a base para as priorizações prioritárias de rede pré-computadas (NDPS), que podem ser consultadas pelos usuários e também são usadas internamente pelo TDR6 para selecionar alvos conectados e compostos para exibição nas visualizações de rede recém-desenvolvidas (veja abaixo). Quando a partir de um composto de interesse TDR6 usa as prioridades pré-computador das metas candidatas para ajudar os usuários na navegação do espaço-alvo em torno do composto (e vice-versa ao iniciar a partir de um alvo de interesse). Ao fornecer essas métricas e classificações de enriquecimento pré-computado, o banco de dados agora facilita a descoberta de novas associações-alvo de drogas. Além desses novos NDPs pré-computados, os usuários podem priorizar os destinos usando a mesma funcionalidade que nos alvos anteriores TDR lançamentos.
Esta versão também inclui várias atualizações de dados, nomeadamente a inclusão de 22 novos genomas (20 novos patógenos e 2 novos organismos de modelo) e atualizações extensas para dados químicos e de bioatividade entre outros. A interface de usuário aprimorada e versátil, juntamente com as atualizações de dados renovam o compromisso dos destinos de TDR para fornecer uma ferramenta integrada e poderosa para explorar dados genômicos e químicos no contexto de doenças tropicais negligenciadas.
Usando os alvos de TDR 6
H2>
priorizações alvo inteiro
priorizações alvo inteiro
O modelo de rede (14) é a base para a nova pontuação de farmacibilidade, que é uma métrica derivada de rede relacionada ao enriquecimento em compostos bioativos para dado alvo (NDS, “pontuação de drogabilidade de rede”). Os ndss estão disponíveis para todos os organismos de nível 1, que podem ser consultados e usados para consultas de peso para filtrar (dentro ou fora) alvos em pipelines de priorização personalizados definidos pelo usuário. Como explicado ainda nos detalhes da integração de rede, para cada organismo, os alvos foram classificados em cinco grupos de farmacibilidade (DG), do menor (DG1) até a maior pontuação (DG5), de acordo com seu desempenho nas priorizações da rede.
Como nas versões anteriores dos alvos de TDR, os usuários podem combinar diferentes conjuntos de dados simplesmente executando consultas individuais em diferentes tipos de dados e combinando-os na página Histórico (9,10,12,13). Isso é útil quando, por exemplo, os usuários gostariam de incluir tipos de dados adicionais para prioridades baseadas em farmacibilidade, como aqueles que confiam na expressão gênica em estágios de ciclo de vida relevantes, ou aqueles que fornecem informações sobre fitness / letalidade de alvos (essencialidade).
Como exemplo, apresentamos aqui um exemplo de priorização usando o Toxoplasma Gondii como o patógeno de interesse. T. Gondii é um parasita apicomplexan, muitas vezes usado como modelo para investigar a biologia subjacente a várias doenças humanas e animais (15). A estratégia de pesquisa é resumida na Figura 2. A consulta foi iniciada pesquisando todas as metas de T. gondii e filtrando esses alvos com homólogos em humanos (para selecionar apenas alvos específicos do parasita). Em seguida, selecionamos genes essenciais candidatos com base em perfis de fitness durante a infecção de fibroblastos humanos (16); e também os genes selecionados altamente expressos em tachyzoites (estágio replicativo de T. gondii) consultando os genes no top 80-100 percentil da abundância de transcrição do RNaseq (17). Essas seleções foram combinadas com os rankings da droga de rede. Para isso, consideramos genes em grupos 3, 4 ou 5 (DG ≥ 3) (ver Figura 2). A figura mostra todas as consultas e seus resultados como visto na página de histórico, e as operações realizadas ao combinar consultas (Union, Intersection). A lista final de alvos classificados com base nesses critérios foi divulgada e está disponível na seção de alvos de TDR das listas publicadas.
Target Estratégia de exemplo de priorização para T. gondii. A imagem composta mostra (a) os termos de consulta usados para encontrar alvos de T. gondii que não têm homólogos em humanos, que são altamente expressos na fase de taquyzoite virulento do parasita durante a infecção por células humanas, que provavelmente são essenciais e provavelmente para a pontuação da farmacibilidade da rede. (B) Resumo das consultas executadas na página ‘Targets’, mostrando como essas consultas aparecem na página ‘Histórico’, onde podem ser revisadas e transformadas. Os botões de gerenciamento de consulta em linha permitem ações selecionadas (remover, renomear, exportar) em conjuntos de resultados.(C) Combinações de consulta permitem que os usuários executem a União, interseperem ou subtrair ações em consultas com e entre si. Exemplos de ações de união e interseção são mostradas. (D) As consultas podem ser salvas em um esconderijo privado (meus conjuntos de consulta) de onde podem ser enviados de volta para o espaço de trabalho (para executar operações de consulta adicionais) ou compartilhadas publicamente com outros usuários de destino do TDR (meus conjuntos de consulta de destino publicado).
estratégia de exemplo de priorização do alvo para T. gondii. A imagem composta mostra (a) os termos de consulta usados para encontrar alvos de T. gondii que não têm homólogos em humanos, que são altamente expressos na fase de taquyzoite virulento do parasita durante a infecção por células humanas, que provavelmente são essenciais e provavelmente para a pontuação da farmacibilidade da rede. (B) Resumo das consultas executadas na página ‘Targets’, mostrando como essas consultas aparecem na página ‘Histórico’, onde podem ser revisadas e transformadas. Os botões de gerenciamento de consulta em linha permitem ações selecionadas (remover, renomear, exportar) em conjuntos de resultados. (C) Combinações de consulta permitem que os usuários executem a União, interseperem ou subtrair ações em consultas com e entre si. Exemplos de ações de união e interseção são mostradas. (D) As consultas podem ser salvas em um esconderijo privado (meus conjuntos de consulta) de onde podem ser enviados de volta para o espaço de trabalho (para executar operações de consulta adicionais) ou compartilhadas publicamente com outros usuários de destino do TDR (meus conjuntos de consulta de destino publicado).
Drug Repurponing Estratégias usando transformações de consulta
A consulta da farmacibilidade no TDR6 permite que os usuários selecionem alvos com inibidores / drogas específicas. As informações sobre alvos com drogas conhecidas vêm da curativa de literatura, enquanto as associações previstas (indiretas) de alvos com inibidores / drogas são obtidas por meio de cálculos de similaridade ou orthologia (para alvos drogáveis conhecidos), ou através de inferências suportadas por rede (14). Todos esses métodos são implementados no TDR6. Assim, quando os usuários filtram um conjunto de genes com base na farmacibilidade, eles limitam a seleção a alvos altamente classificados, que devem fornecer uma rica fonte de oportunidades de reivindicação de drogas.
Para mostrar a utilidade do TDR6 nesta área que mostramos Como procurar por drogas candidatas para reivindicar para o echinococcus multilocularis (o agente causador do ecinococose alveolar). Isto é mostrado na Figura 3. O processo é semelhante ao descrito anteriormente para T. gondii, mas nesta estratégia de consulta não descartamos homólogos humanos, e utilizaram conjuntos de dados C. Elegans Rnai-Letralidade como proxy para essencialidade do nematode. Como resultado, obtivemos uma priorização completa do genoma para E. Multilocularis. Em seguida, aplicando um filtro baseado em farmacibilidade para essa consulta, reduzimos a seleção do gene para um punhado de genes. O usuário pode inspecionar manualmente os alvos selecionados para descobrir quais drogas foram listadas por meio de associações indiretas. As páginas de destino exibirão todos os compostos associados na seção de farmacibilidade, classificadas de acordo com a origem da inferência. Para inferências conduzidas pela rede, a pontuação para cada composto proposta aparecerá tanto como uma lista quanto como um enredo de classificação, para identificar rapidamente os candidatos promissores. Alternativamente, para minimizar a inspeção manual, a lista de genes (isto é, a própria consulta) pode ser facilmente convertida em uma lista de drogas associadas clicando no botão “Converter esses consulta” no topo das páginas de resultados da consulta. Essa funcionalidade fornece uma maneira rápida de começar a criar uma biblioteca de triagem para um conjunto de alvos. As transformações de consulta podem ser baseadas em drogas curadas (drogas conhecidas para um conjunto de alvos), previstos (associações computadas a drogas) ou ambos. Em todas as três abordagens, os inibidores / drogas associados a alvos drogáveis conhecidos são transitivamente associados aos genes da lista. A Figura 3 resume a estratégia de priorização, a conversão de consulta de lista de genes a compostos, e um exemplo da visualização do sub-gráfico disponível na página composta de um acerto de repaturação. Atualmente, essas conversões são executadas em segundo plano e os resultados aparecem na seção Histórico do site quando concluídas (os usuários também são alertados por e-mail).
Droga Repurposição Oportunidades para E. Multilocularis usando transformações de consulta. Um regime de priorização alvo para o Echinococcus multilocularis dependendo de inferência baseada em ortologia e drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) lista inicial de alvos priorizados. (C) Qualquer lista de destino pode ser “transformada” em uma lista de seus medicamentos associados, usando qualquer um dos métodos de links compostas disponíveis (consulte o texto principal). (D) Lista resultante de compostos bioativos. (E) Exemplo de visualização do sub-gráfico de rede de um composto selecionado, mostrando links de bioactividade ativos e inativos. Os compostos (nós verdes) são conectados a metas de patógeno (laranja) de acordo com registros de bioactivity (verde = ativo; vermelho = inativo, consulte o texto principal para os limites de atividade).Alvos, por sua vez, estão conectados (links cinzentos) a afiliações funcionais (nós azuis). A renderização do sub-gráfico fornece dicas visuais sobre como o alvo inicial de E. Multiocularis é conectado com o composto selecionado na rede.
Figura 3.
>
Droga que repture oportunidades para E. MULTILOCULARIS usando transformações de consulta. Um regime de priorização alvo para o Echinococcus multilocularis dependendo de inferência baseada em ortologia e drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) lista inicial de alvos priorizados. (C) Qualquer lista de destino pode ser “transformada” em uma lista de seus medicamentos associados, usando qualquer um dos métodos de links compostas disponíveis (consulte o texto principal). (D) Lista resultante de compostos bioativos. (E) Exemplo de visualização do sub-gráfico de rede de um composto selecionado, mostrando links de bioactividade ativos e inativos. Os compostos (nós verdes) são conectados a metas de patógeno (laranja) de acordo com registros de bioactivity (verde = ativo; vermelho = inativo, consulte o texto principal para os limites de atividade). Alvos, por sua vez, estão conectados (links cinzentos) a afiliações funcionais (nós azuis). A renderização do sub-representa fornece dicas visuais sobre como o alvo inicial de E. Multilocularis é conectado com o composto selecionado na rede.
Exploração de compostos órfãos
As atividades dos compostos extraídos da literatura por curação aparecem na forma de ensaios baseados em alvo (link direto ao alvo) ou na forma de ensaios de base ou organismo integral. Na ausência de outras informações, essas últimas classes de ensaios não fornecem pistas para o alvo ou mecanismo de ação dos compostos. Durante o processo de atualizações de dados químicos em TDR6, identificamos compostos com efeitos fenotípicos relatados no organismo inteiro ou nos ensaios baseados em células, com base em suas classificações quimblicas. Esta informação foi utilizada para identificar os compostos ‘órfãos’ ativos contra um patógeno particular em exibições primárias ou secundárias à base de células, mas para as quais não há um ensaio baseado em alvo.
Os compostos órfãos no TDR6 podem ser Procurou qualquer espécie com dados de triagem fenotípicos disponíveis, dentro da página de pesquisa compostos. Isso permite uma maneira rápida de alavancar dados de ensaios de alta taxa de transferência, permitindo que os usuários iniciam suas prioridades de compostos com atividade conhecida contra um patógeno de interesse.
O modelo de rede integrado no TDR6 também é útil para identificar candidato alvos para compostos órfãos. Conforme descrito na publicação original (14), a vizinhança de similaridade química computada em torno de um composto órfão selecionado pode fornecer links indiretos a um ou mais alvos. Usando esta estratégia, realizamos prioridades alvo para todos os compostos órfãos no TDR6. Estas priorizações compostas orientadas à rede pré-executadas estão disponíveis para todos os organismos para os quais os dados de triagem fenotípicos estão disponíveis. Resumos globais mostrando todos os compostos órfãos para estes organismos estão ligados a partir da página “Resumo de dados” (consulte https://tdrtargets.org / datasummary e clique nas espécies de interesse). Um exemplo de priorização baseada em composto órfão para T. cruzi é mostrada na Figura 4. Considerando que as prioridades que a partir de um único composto estão disponíveis em cada página composto.
Exploração de metas candidatas para compostos de órfãos de Trypanosoma Cruzi. O enredo resume a priorização alvo acionada por rede para compostos órfãos ativos contra T. Cruzi. Todas as sequências de codificação de proteína no genoma de T. Cruzi (alvos candidatos) são organizadas no eixo X. Os pontos de dados no enredo correspondem a associações de fármacos-alvo marcados pelo algoritmo (pontuação plotada no eixo Y). Como exemplo, destacamos dois alvos putativos para duas drogas diferentes (conforme exibido na página de resumo de dados T. Cruzi). Parcelas semelhantes estão disponíveis on-line para organismos de nível 1 em TDR6 (ligado a partir da página de resumo de dados).
Exploração de alvos candidatos para compostos de órfãos de Trypanosoma Cruzi. O enredo resume a priorização alvo acionada por rede para compostos órfãos ativos contra T. Cruzi. Todas as sequências de codificação de proteína no genoma de T. Cruzi (alvos candidatos) são organizadas no eixo X. Os pontos de dados no enredo correspondem a associações de fármacos-alvo marcados pelo algoritmo (pontuação plotada no eixo Y). Como exemplo, destacamos dois alvos putativos para duas drogas diferentes (conforme exibido na página de resumo de dados T. Cruzi). Parcelas semelhantes estão disponíveis on-line para organismos de nível 1 em TDR6 (ligado a partir da página de resumo de dados).
Atualizações e atualizações de dados
novos dados genômicos em Alvos TDR V6.1
Desde a publicação anterior do banco de dados de destino do TDR (13), vários genomas de patógenos foram adicionados. Uma lista detalhada é fornecida na Tabela 3, bem como on-line na página Resumo de dados TDR6 (https://tdrtargets.org / datasummary).
Resumo de disponibilidade de dados para patógenos de nível superior. Resumo dos dados alvo disponíveis para organismos de nível 1 em alvos de TDR. CDs: sequências de codificação; PFAM: Número de proteínas com domínio (s) de PFAM mapeado; Vá: Número de proteínas com termos mapeados de ontologia genética; CE: Número de proteínas com números de comissão de enzimas mapeadas (CE); Caminhos: Número de proteínas mapeadas para mapas de pathway KEGG; Ortólogos: Número de seqüências mapeadas para grupos ortólogos de Orthomcl. Uma tabela de resumo de dados mais completa está disponível online em https://tdrtargets.org / datasummary
espécie. | CDs. | pfam. | vá. | CE. | vias. | orthologs. | |
---|---|---|---|---|---|---|---|
plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |
plasmodium vivax | 5344 | 3264 | 2631 | 641 | 806 | 5207 | |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |
chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | |
mycobacterium leprae | 1630 | 1236 | 929 | 628 | 611 | 1473 | |
mycobacterium tuberculose | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |
mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |
trep onema pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |
wolbachia endosymbiont de B. malayi | 805 | 628 | 577 | 308 | 382 | 688 | |
brugia malayi | 11316 | 7042 | 6368 | 1278 | 1787 | 8424 | |
echinococcus granulosus | 10249 | 6481 | 5432 | 854 | 1965 | 7109 | |
echinococcus multilocularis | 10474 | 6817 | 5768 | 878 | 2079 | 7539 | |
loa loa (worm olho) | 16292 | 8071 | 6774 | 1539 | 2207 | 10484 | |
onchocerca volvulus | 12224 | 3248 | 2178 | 246 | 563 | 4054 | schistosoma mansoni | 12692 | 7818 | 7384 | 1218 | 1649 | 10386 |
leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |
Trypanosoma Brucei | 10270 | 5665 | 5482 | 1019 | 1264 | 9259 | |
trypanosoma cruzi | 18639 | 9908 | 8572 | 1495 | 1495 | 1735 | 18140 |
entamoeba histolytica | 8211 | 4920 | 4087 | 645 | 1094 | 7692 | |
giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | tricomonas vaginalis | 95600 | 35474 | 18435 | 843 | 1366 | 87303 |
espécie. | CDs. | pfam. | vá. | CE. | vias. | orthologs. |
---|---|---|---|---|---|---|
plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 |
plasmodium vivax | 5344 | 3264 | 2631 | 641 | 806 | 5207 |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 |
chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 |
mycobacterium leprae | 1630 | 1236 | 929 | 628 | 611 | 1473 |
mycobacterium tuberculose | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 |
mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 |
trep onema pallidum | 1036 | 791 | 634 | 221 | 335 | 733 |
wolbachia endosymbiont de B.malayi | 805 | 628 | 577 | 308 | 382 | 688 |
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | |
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | ||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | |
Loa Loa (verme olho)
16292 |
8071 | 6774 | 1539
2207 10484 |
|||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | |
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 |
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | |
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | |
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 |
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Resumo disponibilidade de dados para os melhores patógenos linha. Resumo de dados de destino disponíveis para Tier 1 organismos em Metas TDR. CDs: sequências codificantes; Pfam: número de proteínas com mapeada Pfam domínio (s); GO: número de proteínas com mapeadas termos Gene ontologia; CE: número de proteínas com números mapeadas Comissão Enzyme (CE); Vias: número de proteínas mapeadas para mapas pathway KEGG; Ortólogos: número de sequências mapeadas para grupos OrthoMCL ortólogo. Uma tabela de resumo de dados mais completa está disponível online em https://tdrtargets.org / datasummary
Espécies. | CDs. | PFAM. | GO. | CE. | Pathways. | ortólogos. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |||||||||
5344 | 3264 | 2631 | 641 | 806 | 5207 | ||||||||||
Toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |||||||||
Chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | |||||||||
Mycobacterium leprae
1630 |
1236 | 929 | 628 | 611 | 1473 | ||||||||||
Mycobacterium tuberculosis | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |||||||||
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |||||||||
Trep onema pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |||||||||
Wolbachia endosymbiont de B.Malayi | 588 | 588 | 388 | ||||||||||||
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 6481 | 6481 | 854 | 1965 | 7109 | ||||||
Echinococcus multilocularis
10474 |
6817 | 779 | 758 | ||||||||||||
Loa Loa (verme do olho) | 1509 071 | 1559 071 | 1539 071 | 679 071 | 15371 | 1539 071 | 1539 071 | 1559 071 | 2207 | 10484 | 2378 | 2178 | 246 | 563 | 4054 |
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||||||||||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | 5480 |
1019 | 1264 | 9259 | |||||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | Giardia Lambia | 2263 | 2263 | 2735 272 |
3635 |
2235 |
514 |
5977 |
|
|
Trichomonas vaginalis
95600 35474 |
18435 | 843 | CDs. | pfam. | vá. | CE. | Pathes. | orthoogs. | lasmoodium | 3322 551 | 7166 | Plasmox vivax | 641 | 606 06 06 06 06 5207 | |
Toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 |
598 | 269 | Mycobacterium | 1630 | 1236 p2 |
673 | ||||
Mycobaacterium TDULESIS página | 1174 | 1174 | 1174 | 1174 | 3287 | 873 | 1002 | 3459 | |||||||
Trep. Onema pallven
1036 |
61 33 33 33 33 33 33 | 633 | |||||||||||||
wolbia indussibriant de bmalayi | 805 | 628 | 577 | 308 | 382 | 688 | |||||||||
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | ||||||||||
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | |||||||||||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | ||||||||||
Loa Loa (verme olho)
16292 |
8071 | 6774 | 1539
2207 10484 |
||||||||||||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | ||||||||||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||||||||||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |||||||||
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | ||||||||||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | ||||||||||
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | |||||||||
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Dada a diversidade de organismos Integrado Metas TDR e, consequentemente, a variedade de fontes de dados necessário para cobrir toda a genomas; esforço substancial tem sido posta em padronizar os dados de análise e recuperação de informação a partir do genoma destes organismos. A maior parte do genoma completo EuPathDB Foram obtidos a partir de (18), GenBank (19), GeneDB (20), Wormbase parasita (21), GenoList (22) ou Mycobrowser (23). Uma descrição completa das fontes de genoma e dada na Tabela anterior Suplementar S1. Para atualizar os dados para organismos presentes na versão anterior de Metas TDR genes codificadores de proteínas de liberação atual de genomas eram ou mapeado para genes existentes nas Metas TDR, ou não entraram os novos registros. O mapeamento algoritmo utiliza uma combinação de condições para rastrear identificadores Gene através das versões e manter a identidade de genes: as somas de verificação de sequência correspondente (utilizando valores de 128 bits hash gerado pelo algoritmo MD5), nomes de gene ou identificadores e explosão (24) SE ou combinações perfeitas são encontrados. Depois de actualização de registos, o pipeline calcula propriedades físico-químicas que utilizam Pepstats (25), verifica se há domínios transmembranares com TMHMM (26), os péptidos de sinal com SignalP (27), e glicosilfosfatidilinositol Os pontos de ancoragem, usando PredGPI (28). O algoritmo descarta todas as sequências codificadoras não, os mais bem quaisquer pseudogenes, para evitar enganosa anotações e minimizar falsos pressupostos durante os fluxos de trabalho de priorização. A maioria dos TDR6, mencionado acima todas as tarefas de genoma integração e atualização foram quebradas no fluxo de trabalho automatizado para facilitar mais rápido atualizações em lançamentos futuros. Um esquema da actualização e Pipeline algoritmo mostrado na Figura Suplementar anterior S1. O Pipeline também automatiza o cálculo de anotações usando estratégias individuais ad hoc para diferentes anotações, contando com serviços web e APIs (apareceu no Kaas (29) Serviço de proteínas de mapeamento para Vias Metabólicas e ao Número da CE Classificação de enzimas, ou a OrthoMCL banco de dados e a ferramenta (30,31) para os grupos de mapeamento ortólogo a proteínas. a Pipeline também depende de computação contra bases de dados instalados localmente apareceu mais InterPro (32), utilizando InterProScan (33) para identificar domios proteicos Pfam () e mapear termos para vocabulários controlados e classificações (termos GO). recursos adicionais apareceu mais 3D estruturas e modelos estruturais foram obtidos a partir do Protein Data Bank (34), utilizando serviços web e baixado do site Modbase FTP (35), respectivamente.
Também o número de conjuntos de dados funcionais principais foram integrados nesta versão, incluindo (i) os conjuntos de dados transcriptomic que fornecem evidência de expressão de genes em estágios do ciclo de vida ou condições experimentais que são relevante para Drug Discovery (36-47) e (ii) os conjuntos de dados essencialidade derivado de dois agentes patogénicos Apicomplexan (P. berghei e T. gondii) (16,48), que fornecem informação de Estratégias Vital AUXILIAR prioritização.
Actualizações de dados Chemical
Para os compostos bioactivos, também, os fluxos de trabalho de actualização de dados foram automatizados para esta versão.A maioria dos compostos bioativos foi recuperada da libertação química do 24º (49), que contém alguns conjuntos de dados adicionais, como os de caixas químicas específicas de patógeno – caixas GSK Kinetoplastid (50), caixa de patogénio MMV (51). O processo de integração começa a partir de descrições da molécula (2D) no formato SDF, a partir do qual calculamos todas as impressões digitais compostas necessárias (necessárias para as pesquisas de similaridade / subestrutura composta) usando o CheckMol (52). O pipeline também calcula propriedades químicas adicionais, como o coeficiente de partição de octanol / água do logp e outros descritores estruturais usando XLOGP3 (53), e o Open Babel Tools Obprop e OBrotâmero (54). Outros dados relevantes foram obtidos ou calculados diretamente da estrutura composta, como os identificadores Inchi e Inchikey (55) usado para rastreamento composto; e outras regras padrão usadas em química medicinal e descoberta de drogas, como a regra de Lipinski de cinco (56) e a regra relacionada de três (57).
Após a integração em alvos de TDR, todos os compostos foram sujeitos Para todos os cálculos de comparação de similaridade química, utilizando ChemFP (58), que produz medidas de similaridade em pares com base no índice / distância do Tanimoto (59). Além disso, nós calculamos um mapa global (todo versus) de relacionamentos de subestrutura entre os compostos no banco de dados (x é uma subestrutura de Y; Y é uma superestrutura de X). Sabendo que o problema de encontrar os subgrafos comuns máximos entre moléculas é computacionalmente difícil, aplicamos uma abordagem heurística para encontrar subestruturas. O algoritmo obtém primeiro um subconjunto de possíveis moléculas candidatas, fazendo uso de impressões digitais calculadas anteriormente. Os candidatos devem ter impressões digitais correspondentes com a molécula de assunto. Uma vez obtida uma lista de candidatos, é feita a determinação de substrutura de atom-by-atom completo, é feita usando matchmol (52). Os dados disponíveis para compostos e as consultas que podem ser executadas em cada tipo de dados são resumidas na tabela 2. O peso molecular (MW) e a distribuição da área de superfície polar (PSA) para todos os compostos no banco de dados é mostrado na figura suplementar S2. / p>
curadoria e integração de dados de bioactividade
Como com compostos químicos, a maioria das bioactividades integradas em alvos de TDR vêm diretamente das fontes de dados a montante (por exemplo, químicas). Ao integrar dados de bioactividade, preservamos tanto a anotação do ensaio (por exemplo, a ensaio de redução de motilidade in vitro contra Brugia Malayi microfilária a 10 μm ‘) e o valor numérico e unidades associadas a atividades compostas (por exemplo, ‘80% de inibição’, ‘80% μm IC50 ‘, ’10 nm mic’), que são todos os campos pesquisáveis. Além disso, e para facilitar as consultas de usuário, as bioactividades relatadas foram usadas para agrupar compostos ensaiados em classes “ativas” ou ‘inativas’. No entanto, para minimizar o efeito de usar fronteiras duras ao redor de limiares arbitrários e aumentar a separação entre classificações ativas / inativas, também definimos uma área cinza indeterminada. Assim, os compostos marcando logo abaixo de um limiar arbitrário não são considerados inativos para fins de consulta e visualização.
Nem todos os tipos de atividade foram passíveis de classificação, no entanto. Apesar dos esforços na padronização desses dados de atividade, a interpretação das atividades dos compostos nessa escala é difícil, pois muitas vezes dependem do tipo de ensaio particular, as unidades relatadas e as condições específicas em que cada ensaio foi conduzido. No entanto, um conjunto significativo de tipos de ensaio pode ser automaticamente classificado em categorias ativas / indeterminadas / inativas com base em limiares de atividade. Para isso, todos os tipos de ensaio com relatórios > 100 000 (ver Figura suplementar S3 para uma atividade por ensaio de distribuição do composto) foram considerados para auditoria de atividade, embora apenas ensaios baseados em concentração (como IC50, KI ou Potência) foram considerados robustos o suficiente para tal determinação, porque os ensaios baseados em porcentagem (como% de atividade,% de atividade residual ou $ inibição) eram ambíguos em relatórios de bioatividade. Os limites usados para classificar as atividades para cada tipo de ensaio podem ser encontrados na Tabela 4, e a distribuição de compostos nessas classes de atividade é resumida na Figura 5.
Tipos de ensaio e limites de atividade usados para determinação da tag de atividade: apenas os ensaios baseados em concentração foram usados para determinar as tags de atividade. As atividades relatando menos do que o valor máximo admitido para positivos foram consideradas interações ativas (+), enquanto aquelas maiores do que o “valor mínimo admitido para negativos” foram considerados inativos (-). Qualquer atividade relatada entre esses dois valores foi considerada como indeterminada (0)
Ensaio do tipo. | padrão da unidade. | Máximo valor admitido para os ativos. | valor admitido mínimo para inactivos. |
---|---|---|---|
AC50 | 20000 | 100000 | |
EC50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potência | nm | 20000 | 100000 |
Ensaio. | padrão da unidade. | Máximo valor admitido para os ativos. | valor admitido mínimo para inactivos. |
---|---|---|---|
AC50 | 20000 | 100000 | |
EC50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potência | nm | 20000 | 100000 |
Ensaio do tipo. | padrão da unidade. | Máximo valor admitido para os ativos. | valor admitido mínimo para inactivos. |
---|---|---|---|
AC50 | 20000 | 100000 | |
EC50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potência | nm | 20000 | 100000 |
Ensaio. | padrão da unidade. | Máximo valor admitido para os ativos. | valor admitido mínimo para inactivos. |
---|---|---|---|
AC50 | 20000 | 100000 | |
EC50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potência | nm | 20000 | 100000 |
Misturas de distribuição e evidência de atividade entre dados: (a) Diagrama de Venn mostrando a distribuição de valores de bioactividade nas classes ativa, inativa e indeterminada em TDR6 (ver texto principal para detalhes) . Os casos de contagem de interseções em que o mesmo medicamento tem diferentes resultados de atividade contra o mesmo destino. Exemplos desses casos são fornecidos em painéis B por F (IDs compostas representam identificadores TDR6). (B) Actividade de C329137 (uma hidroxi-benzamidina) contra o diidrofolato bifuncional de P. falciparum, sintase de redutilo-timidilato. (C) Exemplo de registros positivos para inibidores da aciltransferase humana. (D) Exemplo de atividades negativas e neutras para compostos TriPhenylcarbinol e benzo-hidrol, respectivamente. Finalmente, ambos positivos (e) e negativos (f) podem ser misturados com evidências indeterminadas, como mostrado para C2164865 testado contra a colinesterase a cavalo e C306882 testado contra a hidrolase de nucleotídeo recombinante P. falciparum de 5′-trifosfato, respectivamente.
Misturas de distribuição e evidência de atividade entre dados: (a) Diagrama de Venn mostrando a distribuição de valores de bioactividade no ativo aulas inativas e indeterminadas em TDR6 (ver texto principal para detalhes).Os casos de contagem de interseções em que o mesmo medicamento tem diferentes resultados de atividade contra o mesmo destino. Exemplos desses casos são fornecidos em painéis B por F (IDs compostas representam identificadores TDR6). (B) Actividade de C329137 (uma hidroxi-benzamidina) contra o diidrofolato bifuncional de P. falciparum, sintase de redutilo-timidilato. (C) Exemplo de registros positivos para inibidores da aciltransferase humana. (D) Exemplo de atividades negativas e neutras para compostos TriPhenylcarbinol e benzo-hidrol, respectivamente. Finalmente, ambos positivos (e) e negativos (f) podem ser misturados com evidências indeterminadas, como mostrado para C2164865 testado contra a colinesterase a cavalo e C306882 testado contra a hidrolase de nucleotídeo recombinante P. falciparum de 5′-trifosfato, respectivamente.
A liberação química 24.º conta com mais de 15,2 milhões de bioactividades relatadas, das quais apenas cerca de 6 milhões correspondiam a relacionamentos envolvendo drogas e metas de proteína (proteínas únicas, famílias proteicas e complexos proteicos, com ~ 93% sendo proteínas únicas). Outras bioactividades restantes no banco de dados foram relatórios para uma ampla variedade de metas não proteicas, como células inteiras (3,6m), organismos inteiros (2,2M), tecidos (83k) e macromoléculas não-peptídicas (85K) ou pequenas moléculas (< 100). Estes não foram usados na construção de rede, porque a rede é de proteína (isto é, alvo) centrada. A Figura 5 também mostra algumas visualizações de rede de exemplo que descrevem como o TDR6 exibe essas bioactividades.
Integração de características derivadas de rede: farmacibilidade e priorizações
Como mencionado acima, dados genômicos, anotações genéticas, Compostos químicos e interações genéticas-fármacas foram integrados a uma complexa orientada para a reivindicação de medicamentos, conforme descrito em Berenstein et al. (14). A rede foi usada para calcular uma pontuação de farmacibilidade de rede (NDS), para todos os alvos em patógenos prioritários (Tier 1). O NDS está relacionado à chance de encontrar compostos bioativos nas próximas proximidades do gráfico de rede de um determinado alvo (intervalo é de 0 a 1). O algoritmo foi descrito anteriormente em detalhes (14), mas brevemente, com base em um teste de excesso de representação de proteínas drogáveis conhecidas anotadas, calcula uma pontuação de relevância (RS) para cada categorias de grupos de domínio e ortologia da PFAM. A pontuação do NDS para um determinado alvo resulta de uma soma cumulativa ponderada sobre os Rs de todas as contribuições de afiliação comuns ao nó alvo e proteínas vizinhas ligadas a compostos ativos.
Para facilitar a interpretação das pontuações do NDS que realizamos um Avaliação estatística para identificar grupos de farmacilidade distintas (DG) com base em dois tipos de limites que ajudam a classificar as previsões de farmacibilidade a zonas de confiança. Estes são ilustrados na Figura 6. Por um lado, enquanto todos os alvos de pontuação não zero têm algum grau de conectividade a alvos conhecidos-medicamentosos, um Baixo NDS sugere que essas conexões não são relevantes para avaliação da farmacibilidade. Assim, um corte-ruído (uma linha de base calculada como 5 vezes o valor de 0,25 percentil da distribuição completa do NDS) é considerado para identificar alvos de baixa pontuação. O segundo limite é derivado do índice máximo de J de Yeden (60), que é calculado como a pontuação na qual tanto a especificidade como a sensibilidade são ideais (melhor sensibilidade sem comprometer a especificidade e vice-versa). Este valor só pode ser calculado para patógenos com positivos verdadeiros (alvos drogáveis conhecidos). Um mínimo arbitrário de 10 verdadeiros positivos foi considerado suficiente para a determinação de corte de você. Para outros patógenos, sem essas informações, um corte global de Youden foi usado (calculado usando todos os verdadeiros positivos da rede). Os correspondentes grupos de farmacilidade são, portanto,: DG1 para alvos com valores do NDS variando de 0 ao limiar de ruído; DG2 para alvos com valores de NDS que vão desde o limiar de ruído até o corte do yenden; e DG 3, 4 e 5 com valores de NDS que são 1-, 10- e 100 vezes acima do corte do yenden. Por conseguinte, estes últimos grupos contribuem para os alvos mais prováveis drogáveis. A Figura 6 mostra um exemplo estático de uma priorização orientada pela rede para os ulceranos Mycobacterium (que não possui alvos com compostos conhecidos na liberação atual). Todas as prioridades para os alvos de TDR Os organismos prioritários podem ser vistos on-line na página Resumo de dados para cada espécie (consulte https://tdrtargets.org / datasummary, clicando na espécie de interesse). Nesse caso, as parcelas on-line são interativas e podem ser ampliadas e exportadas. Nos casos em que há alvos com compostos bioativos conhecidos para as espécies, estes são mostrados distintamente no enredo.
Priorização do alvo do genoma para Ulcerans Mycobacterium: alvos candidatos no genoma do M. ulcerãs foram classificados por seus NDS (pontuação de drogabilidade de rede, ver texto principal).O lote descreve todos os alvos do genoma (no eixo X), juntamente com sua correspondente pontuação NDS (no eixo Y). Os pontos vermelhos correspondem aos 10 alvos classificados Top-10, com rótulos indicando o nome e o produto do gene. Navegando a priorização inteira do genoma a partir do resumo de dados, o usuário pode acessar uma página do gene clicando nela no enredo de priorização. Um exemplo de subgraph da família de genes da EMBA / EMBB / EMBC é mostrado (como visto em suas páginas genéticas correspondentes). A figura também exibe zonas de confiança, DG1 (vermelho): delimitado por zero e corte de ruído; DG2 (amarelo): entre o ruído e o endoff do Yeden; e dg3-5: com pontuações superiores ao ponto de endoff.
Genoma inteiro acionado por rede Priorização do alvo para Ulcerans Mycobacterium: Os alvos candidatos no genoma do M. ulcerans foram classificados por seus NDS (pontuação de drogabilidade de rede, ver texto principal). O lote descreve todos os alvos do genoma (no eixo X), juntamente com sua correspondente pontuação NDS (no eixo Y). Os pontos vermelhos correspondem aos 10 alvos classificados Top-10, com rótulos indicando o nome e o produto do gene. Navegando a priorização inteira do genoma a partir do resumo de dados, o usuário pode acessar uma página do gene clicando nela no enredo de priorização. Um exemplo de subgraph da família de genes da EMBA / EMBB / EMBC é mostrado (como visto em suas páginas genéticas correspondentes). A figura também exibe zonas de confiança, DG1 (vermelho): delimitado por zero e corte de ruído; DG2 (amarelo): entre o ruído e o endoff do Yeden; e DG3-5: com pontuações superiores ao corte de vocês.
Estas priorizações orientadas por rede podem funcionar nos dois sentidos. Ao partir de um composto de interesse, o algoritmo pode priorizar os alvos, usando a semelhança ponderada de vizinhos químicos para alvos iniciais de candidatos. E ao iniciar a meta de interesse, pode priorizar os compostos, usando alvos vizinhos dramínsos conectados e depois após links ponderados para inibidores / drogas candidatos. Pontuações pré-computadas para compostos e destinos são usados internamente por TDR6 e estão no núcleo de transformações de consulta baseadas em rede.
Visualizações de sub-gráfico de rede e atualização de interface de usuário
a rede sub -Graphs para compostos e alvos (e suas respectivas pontuações do NDS) podem ser navegadas a partir do aplicativo da Web usando um medicamento ou um alvo como ponto de partida para obter dicas para drogas não testadas ou alvos drogáveis, respectivamente. Através de visualizações recém-desenvolvidas, os usuários podem verificar os bairros de rede em torno de drogas e metas nas páginas correspondentes. Listas de interações putativas derivadas de rede também podem ser exploradas em formato tabular sob a “farmacilidade” (para alvos) e “alvos conhecidos e previstos” (para drogas) seções.
Essas visualizações são conduzidas por D3.js (61) Implementando layouts forçados para visualizações do sub-gráfico. No painel Subgráfico D3, os usuários podem realizar pesquisas de nó dentro do gráfico (identificadores de destino), além de alternar a visibilidade dos destinos em uma espécie por maneira de espécies, e personalizar a opacidade dos nós. Reunijos, esses novos recursos fornecem uma visualização clara e abrangente da proximidade de metas e compostos, permitindo que os usuários manipulem os gráficos enquanto exploram os dados.
A interface do usuário (UI) e as ferramentas disponíveis Para a reivindicação de drogas e a priorização alvo passaram por uma grande atualização. Em primeiro lugar, a interface do usuário foi redesenhada nos padrões do W3C para obter uma aplicação mais saudável e escalável. Nós integramos o bootstrap (https://getbootstrap.com/) e jQuery (https://jquery.com) Estruturas no desenvolvimento e design do aplicativo da Web TDR6 e na frente- funcionalidade final. Para consultas de estrutura compostas, licenciamos e implementamos o aplicativo de desenho químico da Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Registros tabulados dentro das páginas de destino e drogas agora usam o plugin JavaScript Javay DataTable (https://datatables.net) para criar facilmente paginações, filtragem e classificação de funcionalidades. Finalmente, representações 2D compostas são agora geradas automaticamente usando uma implementação do módulo JavaScript do SmilesDrawer (62).
Disponibilidade comercial de compostos
Um aspecto importante ao priorizar os compostos para testes no laboratório , é a disponibilidade deles. No TDR6 agora exibimos informações sobre a disponibilidade comercial de compostos. Atualmente, iniciamos esse recurso vinculando com o Molport (um mercado químico on-line que fontes compostos de grandes fornecedores) e mostram usuários uma pista visual em páginas compostas que dão uma rápida indicação de se o composto está em estoque ou pode ser feito para encomendar . Como a disponibilidade comercial de compostos é atualmente implementada em TDR6 na forma de consultas assíncronas contra o Molport, neste momento esse recurso está disponível apenas no modo de navegação (não em consultas).No entanto, os usuários podem priorizar os compostos usando qualquer uma das estratégias de consulta disponíveis no TDR6 e finalizar suas seleções compostas inspecionando os compostos manualmente para a disponibilidade comercial.
Discussão e instruções futuras
os novos dados , a interface e a funcionalidade do TDR6 fornecem aos usuários com navegação e visualização aprimoradas de metas e compostos.
O modelo de rede atual conecta alvos através da afiliação de entidades (proteínas) a conceitos de anotação (domínios de PFAM). Estes foram selecionados com base em sua ampla cobertura e facilidade relativa de cálculo. Complementando estes conceitos com outros critérios importantes para a validação de meta de medicamentos (essencialidade, expressão em etapas de ciclo de vida relevantes) podem ser feitas por usuários com as ferramentas e funcionalidades fornecidas pelo TDR6, mas no futuro eles podem ser construídos no próprio modelo de rede subjacente, em menos para alguns organismos passíveis de avaliação experimental genoma.
Várias melhorias-chave são necessárias para manter os alvos de TDR relevantes para a comunidade de cientistas que trabalham em doenças tropicais. Integração de metabólitos naturais e conectar essas pequenas moléculas a outros compostos bioativos por meio de subestruturas compartilhadas ou por similaridade química será um foco importante no futuro. Isso permitirá navegar pelo gráfico de destinos de drogas usando os conceitos de reações bioquímicas, que naturalmente conectam enzimas não ortólogas através de seus substratos / produtos e cofatores compartilhados.
Finalmente, como já mencionado anteriormente (13), Ainda há uma grande lacuna de curação que precisa ser preenchida. Muitos compostos bioativos foram testados pela comunidade de pesquisadores que trabalham em doenças tropicais negligenciadas. No entanto, muitos desses ensaios e resultados são relatados em periódicos fora dos principais periódicos de química medicinal e, portanto, são perdidos por grandes esforços de curação, como o LED por quimbles (49). Curação e integração destes dados ausentes (incluindo dados negativos!) Deve ser uma prioridade para a comunidade, pois economizaria tempo e recursos valiosos.
Dados suplementares
Os dados suplementares estão disponíveis Na Nar Online.
Agradecimentos
Os autores gostariam de agradecer Matthew Berriman e Magdalena Zarowiecki (Instituto Wellcome Trust Sanger) para compartilhar dados e anotação de genoma de pré-liberação do Echinococcus para inclusão no TDR Alvos; e Ben Webb e Andrej Sali (Universidade da Califórnia São Francisco) para o cálculo de modelos 3D para genomas patógenos de nível 1 em alvos de TDR. L.u.l., A.B. e s.v. eram ou são apoiados por bolsas do Conselho Nacional de Pesquisa (Conicet, Argentina). A.C. e F.A. são membros da carreira de pesquisa do Conselho Nacional de Pesquisa (Conicet, Argentina). PM. Gostaria de reconhecer uma comunhão da Comissão Universitária (UGC), na Índia.
Financiamento
Glaxosmithkline Argentina e a Agência Nacional para a Promoção da Ciência e Tecnologia, Argentina (ANPCYT); Indo-Argentina Projecto de cooperação bilateral (financiamento conjunto do Departamento de Ciência e Tecnologia da Índia (DST) e Ministério da Ciência e Tecnologia Argentina (Metcyt). Financiamento para taxa de acesso aberto: Fondo Para La Investigación Científica Y Tecnológica.
Conflito de juros. Nenhum declarado.
Notas
Apresentar: Ariel J Berenstein, Instituto Multidisciplinario de Investigaciones en Patológicos Pediáticas (IMIPP), CONICET-GCBA, Laboratorio de Biología molecular, División Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.
,
Sachs
,
,
,
.
;
:
–
.
,
torreele
,
,
,
.
;
:
–
.
,
.
;
:
–
.
,
.
.
;
:
–
.
,
IH
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
.
;
:
.
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
berriman
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
,
,
et al. .
.
;
.
,
,
,
,
.
.
;
–
.
,
,
,
,
,
.
;
:
–
.
,
,
.
;
:
.
,
.
;
:
–
.
ganesan
,
,
,
,
,
et al. .
.
.
;
:
–
.
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
agacha
,
,
,
.
.
;
:
–
.
,
,
clark
,
,
,
et al. .
.
;
:
–
.
,
.
;
:
–
.
,
shafie
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
.
;
:
–
.
,
,
,
,
,
,
.
.
;
.
,
.
.
;
.
,
von heijne
,
.
;
:
–
.
,
sønderby
,
,
,
,
.
;
:
–
.
,
,
.
.
;
.
,
,
,
.
;
:
–
.
,
,
jr,
.
;
:
–
.
s.
,
,
,
jr
.
;
.
,
babbitt
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
nuka
>
et al. .
.
;
:
–
.
,
,
c.
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
et al. .
.
;
:
–
.
l.
,
IMWONG
,
,
,
,
Preiser
.
;
:
.
,
,
,
,
,
,
,
et al. .
.
.
;
:
.
,
,
,
,
,
,
woestenenk
et al. .
.
;
:
–
.
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
.
.
;
.
,
,
,
,
.
.
;
:
.
,
sismeiro
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
Dewell
,
.
;
:
–
.
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
nc
.
.
;
:
.
,
,
,
,
et al. .
.
.
;
:
–
.
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
.
.
;
.
.
.
;
:
–
.
,
,
,
,
.
;
:
–
.
,
james
,
,
.
.
;
:
.
,
.
.
;
:
.
,
,
.
;
:
–
.
,
.
.
;
:
–
.
.
.
;
:
.
,
.
.
;
:
–
.
.
.
;
:
–
.
,
,
.
;
:
–
.
,
.
;
:
–
.