TDR alvos 6: Discovery de droga de condução para patógenos humanos através de integração intensiva de dados quimogênicos

abstrato

o volume de dados biológicos, químicos e funcionais depositados no domínio público Está crescendo rapidamente, graças ao seqüenciamento de próxima geração e às tecnologias de triagem altamente automatizadas. Esses conjuntos de dados representam recursos inestimáveis para a descoberta de drogas, particularmente para patógenos negligenciados menos estudados. Para alavancar esses conjuntos de dados, a integração inteligente e intensiva de dados é necessária para orientar inferências computacionais em diversos organismos. O recurso Chemogenomics TDR integra dados genômicos de patógenos humanos e organismos modelos, juntamente com informações sobre compostos bioativos e suas atividades anotadas. Este relatório destaca as últimas atualizações sobre os dados e funcionalidades disponíveis em alvos de TDR 6. Com base nos modelos de rede Chemogenomic que fornecem links entre inibidores e alvos, o banco de dados agora incorpora prioridades alvo orientadas por rede e novas visualizações de subcános de rede exibindo produtos químicos e alvos Bairros -similaridade, juntamente com links de bioactividade compostos alvo associados. Os dados disponíveis podem ser navegados e consultados por meio de uma nova interface de usuário, que permitam que os usuários realizem prioridades de alvos de proteína e inibidores químicos. Como tal, os alvos de TDR agora facilitam a investigação da droga que repture contra os alvos do patógeno, o que pode potencialmente ajudar na identificação de metas candidatas para compostos bioativos com alvos anteriormente desconhecidos. Os alvos de TDR estão disponíveis em https://tdrtargets.org

introdução

Negligenciamento de doenças tropicais (NTDs) afetam desproporcionalmente ~1,5 bilhões de pessoas em baixa renda e desenvolvimento países, onde são uma causa principal para os anos de vida perdidos para a deficiência e morte prematura (1). Historicamente, a falta de envolvimento da indústria farmacêutica, em combinação com investimentos limitados em programas de pesquisa pública em países afetados, resultou em uma deficiência de drogas disponíveis para controlar efetivamente a maioria dessas doenças (2). Além disso, as drogas atualmente em uso para tratar essas doenças são muitas vezes comprometidas em termos de custo, dificuldades em administração, eficácia, resistência de drogas ou perfis de segurança.

Discovery de drogas é um processo demorado e caro (3 4). Para os NTDs, em particular, os programas de descoberta de drogas precisam sobreviver por tempo suficiente através de escassez de financiamento generalizadas para torná-lo em testes clínicos subseqüentes (5). Neste contexto, uma abordagem estratégica para a descoberta de medicamentos da NTD é o reposicionamento de drogas (6), que pode ajudar a reduzir os custos, facilitando as aprovações regulamentares em tentativas precoces para as drogas que já passaram por pesquisas clínicas para outras doenças e / ou indicações e fracassados por razões outras do que segurança (6). Além disso, se o escopo da remessa de drogas for ampliado para incluir drogas e compostos bioativos da pesquisa sobre organismos não humanos, também pode levar à identificação de pelo menos novas ferramentas químicas para sondar a função de metas e vias em patógenos humanos. Assim, aproveitando as vastas quantidades de dados disponíveis de programas de pesquisa bem financiados em doenças humanas e organismos de modelos, a paisagem de descoberta de drogas em NTDs recebe um impulso positivo (7).

Estratégias computacionais estão se tornando cada vez mais Essencial na descoberta de medicamentos translacionais, tanto na academia quanto na indústria farmacêutica. A integração inteligente e intensiva dos volumes crescentes de dados gerados durante todas as fases da descoberta de medicamentos já está permitindo que os principais desafios do processo sejam abordados (8). Desde a sua introdução, o banco de dados de alvos do TDR tem sido um recurso confiável para pesquisadores de doenças negligenciadas para acessar dados de quimogênica para priorização alvo de drogas e drogas que repulam em doenças negligenciadas. Introduzido em 2008 (9), este recurso de acesso aberto permitiu aos pesquisadores encontrarem novos alvos de proteína e inibidores químicos, e priorizá-los para ajudar o desenvolvimento de medicamentos para os patógenos da NTD. Os alvos de TDR utilizam conjuntos de dados funcionais genômicos disponíveis publicamente para permitir que os usuários encontrem e priorize os alvos com base em seus conhecimentos da biologia de seu patógeno de interesse e natureza da doença (10,11). Isso é implementado por uma seleção de destino baseada em usuários flexível (usando critérios de filtragem) e classificação (usando ponderação específica de critérios) (12,13).

Aqui, descrevemos as atualizações para os conjuntos de dados subjacentes e funcionalidade no recurso de alvos de TDR, acumulado desde sua publicação anterior em 2012 (13). A nova versão de TDR (V6.1, abreviada TDR6 neste documento) integra informações genômicas específicas do patógeno com dados funcionais (por exemplo,expressão, relacionamentos baseados em ortologia, essencialidade) de uma seleção de organismos, juntamente com dados de compostos bioativos (estrutura química, propriedade e informação de bioactividade / alvo); Tudo o que pode ser consultado e navegado pelo aplicativo da web. Todas as consultas podem ser salvas em um esconderijo pessoal por usuários registrados e publicados através do aplicativo da Web para maximizar as oportunidades de colaboração. Listas priorizadas de alvos podem ser exportadas para mais análises off-line. Detalhes completos de todos os novos recursos podem ser encontrados nas notas de lançamento (https://tdrtargets.org / lançamentos). Este relatório apresenta um passo a passo completo do aplicativo da Web, seus novos recursos e exemplos para ilustrar casos de uso.

Visão geral e organização de alvos de TDR

como nos comunicados anteriores de alvos de TDR, O TDR6 também é organizado em duas seções principais: alvos e compostos. A seção de alvos do banco de dados contém dados genômicos para 20 patógenos humanos, e permite que os usuários executem consultas e prioridades de alvos de proteína com base em vários recursos e dados relevantes para a descoberta de drogas (ver Tabela 1). A seção de compostos do banco de dados contém informações sobre > 2 milhões de compostos bioativos, e permite consultas com base nas propriedades químicas dos compostos e suas bioatividades anotadas (ver Tabela 2).

tabela 1.

Consultas de destino disponíveis em alvos de TDR

consulta. patógenos para os quais os dados estão disponíveis. Tipos de dados disponíveis para consultar.
nomes & Anotações Todos Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
Características de proteína Todos MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais todos disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas Todos Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
Tudo Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas Todos Alvos de filtro com base em publicações disponíveis
grupo de consulta. patógenos para os quais os dados estão disponíveis. Tipos de dados disponíveis para consultar.
nomes & Anotações Todos Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
Características de proteína Todos MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais todos disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas Todos Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
Tudo Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas Todos Alvos de filtro com base em publicações disponíveis

tabela 1 .

Consultas de destino disponíveis em alvos de TDR

grupo de consulta. patógenos para os quais os dados estão disponíveis. Tipos de dados disponíveis para consultar.
nomes & Anotações Todos Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
Características de proteína Todos MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais todos disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas Todos Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
Tudo Precedente para modulação química bem sucedida da atividade ou função de destino.Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas Todos Alvos de filtro com base em publicações disponíveis
grupo de consulta. patógenos para os quais os dados estão disponíveis. Tipos de dados disponíveis para consultar.
nomes & Anotações Todos Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
Características de proteína Todos MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais todos disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas Todos Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
Tudo Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas Todos Alvos de filtro com base em publicações disponíveis

tabela 2 .

Consultas de compostos disponíveis em alvos de TDR

grupo de consulta. Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
Busca Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) Bioatividade Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm)
compostos órfãos busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas)
Compostos com alvos compostos que têm informações alvo e ensaios baseados em mecanismo
Pesquisas baseadas em estrutura
semelhança composta Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.
grupo de consulta. Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
Busca Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) Bioatividade Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm)
compostos órfãos busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas)
Compostos com alvos compostos que têm informações alvo e ensaios baseados em mecanismo
Pesquisas baseadas em estrutura
semelhança composta Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.

tabela 2.

consultas compostos disponíveis em alvos de TDR

grupo de consulta. Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
Busca Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) Bioatividade Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm)
compostos órfãos busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas)
Compostos com alvos compostos que têm informações alvo e ensaios baseados em mecanismo
Pesquisas baseadas em estrutura
semelhança composta Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.
grupo de consulta. Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
Busca Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N) Bioatividade Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo,IC50 < 5 μm)
órfãos busca por compostos que têm relatórios de bioactividade no organismo integral ou ensaios de células inteiras, mas não têm informações alvo e mecanismo (inibidores / drogas de órfãos)
Compostos com alvos encontrar compostos que têm informações alvo e mecanismo ensaios
Pesquisas baseadas em estrutura
semelhança composta desenhar / colar Composto ou fragmento 2D estrutura e busca compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.

novos recursos em Alvos de TDR 6

relatamos recentemente um modelo de rede integrativa (14), onde todos os conjuntos de dados de escala de genoma disponíveis em alvos de TDR (alvos de proteína), informações químicas (compostos bioativos) e suas relações (bioatividade de compostos ensaios baseados em alvo) foram ligados a um gráfico multicamado. No TDR6, este modelo de rede foi atualizado integrando novos conjuntos de dados (descritos abaixo). Este modelo incorpora links entre alvos e compostos bioativos derivados da curativa manual de ensaios de bioactividade publicados (ou seja, links diretos entre alvos e compostos químicos), bem como de relações computadas (links alvo-alvo e links compostos compostos) baseados em Anotações Proteína (Domínios de PFAM, Grupos Ortólogos) e similaridade química. Um aspecto fundamental desses links no modelo de rede multicamada é que eles possibilitam a rápida exploração e visualização do bairro ao redor de alvos selecionados e / ou compostos bioativos. Isso permite que os usuários explorem compostos vinculados a alvos, inspecione a vizinhança química de similaridade em torno de compostos bioativos e visualize esses dados de maneira amigável e abrangente (veja a Figura 1).

Figura 1.

Visualizações de rede esquemática nas visualizações de TDR6 e Sub-Graph: O composto ou as páginas de destino exibem agora uma visualização subgráfica contendo objetos na vizinhança da rede da entidade selecionada. Esses gráficos são construídos a partir de um gráfico de rede complexo de três camadas. Um esquema deste gráfico é apresentado no topo. Ambos os subgrafos de destino e compostos são sempre organizados da seguinte forma: os nós compostos (verdes) são conectados a alvos (laranja = patógenos; cinza = não-patógenos) através de bordas de bioatividade. Esses links retratam resultados positivos (verdes), neutros (cinza) ou negativos (vermelhos). Finalmente, destina a mapa para um conjunto de afiliações funcionais (anotações, nós azuis). No exemplo, o gráfico mostra um conjunto de inibidores conhecidos para uma aciltransferase humana (15). Essas bioatividades (todas positivas) são desenhadas como elos verdes entre os compostos (nós verdes) e o alvo (nós cinzentos para não patogênicos, nós laranja para patógenos). O gráfico destaca as oportunidades de reivindicação para aciltransferases de helmintos (linhas tracejadas, adicionadas manualmente para esta figura), com base em anotações compartilhadas com o alvo humano drodgable conhecido. O nó vermelho na camada de drogas indica o composto selecionado. Os tamanhos dos nó são determinados pelo número de conexões na rede (grau), enquanto as larguras de link de bioactividade (arestas) estão relacionadas ao número cumulativo de evidências experimentais para um determinado par de drogas (número de ensaios).

Visualizações de Schematic em TDR6 e Sub-Graph Visualizações: As páginas compostas ou de destino exibem agora uma visualização subgráfica contendo objetos no vizinhança de rede da entidade selecionada. Esses gráficos são construídos a partir de um gráfico de rede complexo de três camadas. Um esquema deste gráfico é apresentado no topo. Ambos os subgrafos de destino e compostos são sempre organizados da seguinte forma: os nós compostos (verdes) são conectados a alvos (laranja = patógenos; cinza = não-patógenos) através de bordas de bioatividade. Esses links retratam resultados positivos (verdes), neutros (cinza) ou negativos (vermelhos). Finalmente, destina a mapa para um conjunto de afiliações funcionais (anotações, nós azuis). No exemplo, o gráfico mostra um conjunto de inibidores conhecidos para uma aciltransferase humana (15). Essas bioatividades (todas positivas) são desenhadas como elos verdes entre os compostos (nós verdes) e o alvo (nós cinzentos para não patogênicos, nós laranja para patógenos). O gráfico destaca as oportunidades de reivindicação para aciltransferases de helmintos (linhas tracejadas, adicionadas manualmente para esta figura), com base em anotações compartilhadas com o alvo humano drodgable conhecido. O nó vermelho na camada de drogas indica o composto selecionado. Os tamanhos dos nó são determinados pelo número de conexões na rede (grau), enquanto as larguras de link de bioactividade (bordas) estão relacionadas ao número cumulativo de evidências experimentais para um determinado par de drogas (número de ensaios).

Com essas atualizações, o TDR6 agora fornece aos usuários as seguintes funcionalidades: (i) priorizações alvo inteiro-genoma dirigidas pela rede, (ii) exploração de reivindicação de medicamentos; e iii) a exploração de metas candidatas para compostos órfãos. Estes casos de uso são possíveis por um número de recursos baseados em rede pré-computados, como uma nova pontuação de farmacibilidade de rede (NDS). Associando uma métrica quantitativa a metas com base no enriquecimento de compostos bioativos em nós de rede estreitamente conectados, esta pontuação facilita a classificação de metas em grupos de farmacia (DG), que estão disponíveis para usuários em consultas de banco de dados.

o O modelo de rede também é a base para as priorizações prioritárias de rede pré-computadas (NDPS), que podem ser consultadas pelos usuários e também são usadas internamente pelo TDR6 para selecionar alvos conectados e compostos para exibição nas visualizações de rede recém-desenvolvidas (veja abaixo). Quando a partir de um composto de interesse TDR6 usa as prioridades pré-computador das metas candidatas para ajudar os usuários na navegação do espaço-alvo em torno do composto (e vice-versa ao iniciar a partir de um alvo de interesse). Ao fornecer essas métricas e classificações de enriquecimento pré-computado, o banco de dados agora facilita a descoberta de novas associações-alvo de drogas. Além desses novos NDPs pré-computados, os usuários podem priorizar os destinos usando a mesma funcionalidade que nos alvos anteriores TDR lançamentos.

Esta versão também inclui várias atualizações de dados, nomeadamente a inclusão de 22 novos genomas (20 novos patógenos e 2 novos organismos de modelo) e atualizações extensas para dados químicos e de bioatividade entre outros. A interface de usuário aprimorada e versátil, juntamente com as atualizações de dados renovam o compromisso dos destinos de TDR para fornecer uma ferramenta integrada e poderosa para explorar dados genômicos e químicos no contexto de doenças tropicais negligenciadas.

Usando os alvos de TDR 6

H2>

priorizações alvo inteiro

O modelo de rede (14) é a base para a nova pontuação de farmacibilidade, que é uma métrica derivada de rede relacionada ao enriquecimento em compostos bioativos para dado alvo (NDS, “pontuação de drogabilidade de rede”). Os ndss estão disponíveis para todos os organismos de nível 1, que podem ser consultados e usados para consultas de peso para filtrar (dentro ou fora) alvos em pipelines de priorização personalizados definidos pelo usuário. Como explicado ainda nos detalhes da integração de rede, para cada organismo, os alvos foram classificados em cinco grupos de farmacibilidade (DG), do menor (DG1) até a maior pontuação (DG5), de acordo com seu desempenho nas priorizações da rede.

Como nas versões anteriores dos alvos de TDR, os usuários podem combinar diferentes conjuntos de dados simplesmente executando consultas individuais em diferentes tipos de dados e combinando-os na página Histórico (9,10,12,13). Isso é útil quando, por exemplo, os usuários gostariam de incluir tipos de dados adicionais para prioridades baseadas em farmacibilidade, como aqueles que confiam na expressão gênica em estágios de ciclo de vida relevantes, ou aqueles que fornecem informações sobre fitness / letalidade de alvos (essencialidade).

Como exemplo, apresentamos aqui um exemplo de priorização usando o Toxoplasma Gondii como o patógeno de interesse. T. Gondii é um parasita apicomplexan, muitas vezes usado como modelo para investigar a biologia subjacente a várias doenças humanas e animais (15). A estratégia de pesquisa é resumida na Figura 2. A consulta foi iniciada pesquisando todas as metas de T. gondii e filtrando esses alvos com homólogos em humanos (para selecionar apenas alvos específicos do parasita). Em seguida, selecionamos genes essenciais candidatos com base em perfis de fitness durante a infecção de fibroblastos humanos (16); e também os genes selecionados altamente expressos em tachyzoites (estágio replicativo de T. gondii) consultando os genes no top 80-100 percentil da abundância de transcrição do RNaseq (17). Essas seleções foram combinadas com os rankings da droga de rede. Para isso, consideramos genes em grupos 3, 4 ou 5 (DG ≥ 3) (ver Figura 2). A figura mostra todas as consultas e seus resultados como visto na página de histórico, e as operações realizadas ao combinar consultas (Union, Intersection). A lista final de alvos classificados com base nesses critérios foi divulgada e está disponível na seção de alvos de TDR das listas publicadas.

Figura 2.

Target Estratégia de exemplo de priorização para T. gondii. A imagem composta mostra (a) os termos de consulta usados para encontrar alvos de T. gondii que não têm homólogos em humanos, que são altamente expressos na fase de taquyzoite virulento do parasita durante a infecção por células humanas, que provavelmente são essenciais e provavelmente para a pontuação da farmacibilidade da rede. (B) Resumo das consultas executadas na página ‘Targets’, mostrando como essas consultas aparecem na página ‘Histórico’, onde podem ser revisadas e transformadas. Os botões de gerenciamento de consulta em linha permitem ações selecionadas (remover, renomear, exportar) em conjuntos de resultados.(C) Combinações de consulta permitem que os usuários executem a União, interseperem ou subtrair ações em consultas com e entre si. Exemplos de ações de união e interseção são mostradas. (D) As consultas podem ser salvas em um esconderijo privado (meus conjuntos de consulta) de onde podem ser enviados de volta para o espaço de trabalho (para executar operações de consulta adicionais) ou compartilhadas publicamente com outros usuários de destino do TDR (meus conjuntos de consulta de destino publicado).

Figura 2.

estratégia de exemplo de priorização do alvo para T. gondii. A imagem composta mostra (a) os termos de consulta usados para encontrar alvos de T. gondii que não têm homólogos em humanos, que são altamente expressos na fase de taquyzoite virulento do parasita durante a infecção por células humanas, que provavelmente são essenciais e provavelmente para a pontuação da farmacibilidade da rede. (B) Resumo das consultas executadas na página ‘Targets’, mostrando como essas consultas aparecem na página ‘Histórico’, onde podem ser revisadas e transformadas. Os botões de gerenciamento de consulta em linha permitem ações selecionadas (remover, renomear, exportar) em conjuntos de resultados. (C) Combinações de consulta permitem que os usuários executem a União, interseperem ou subtrair ações em consultas com e entre si. Exemplos de ações de união e interseção são mostradas. (D) As consultas podem ser salvas em um esconderijo privado (meus conjuntos de consulta) de onde podem ser enviados de volta para o espaço de trabalho (para executar operações de consulta adicionais) ou compartilhadas publicamente com outros usuários de destino do TDR (meus conjuntos de consulta de destino publicado).

Drug Repurponing Estratégias usando transformações de consulta

A consulta da farmacibilidade no TDR6 permite que os usuários selecionem alvos com inibidores / drogas específicas. As informações sobre alvos com drogas conhecidas vêm da curativa de literatura, enquanto as associações previstas (indiretas) de alvos com inibidores / drogas são obtidas por meio de cálculos de similaridade ou orthologia (para alvos drogáveis conhecidos), ou através de inferências suportadas por rede (14). Todos esses métodos são implementados no TDR6. Assim, quando os usuários filtram um conjunto de genes com base na farmacibilidade, eles limitam a seleção a alvos altamente classificados, que devem fornecer uma rica fonte de oportunidades de reivindicação de drogas.

Para mostrar a utilidade do TDR6 nesta área que mostramos Como procurar por drogas candidatas para reivindicar para o echinococcus multilocularis (o agente causador do ecinococose alveolar). Isto é mostrado na Figura 3. O processo é semelhante ao descrito anteriormente para T. gondii, mas nesta estratégia de consulta não descartamos homólogos humanos, e utilizaram conjuntos de dados C. Elegans Rnai-Letralidade como proxy para essencialidade do nematode. Como resultado, obtivemos uma priorização completa do genoma para E. Multilocularis. Em seguida, aplicando um filtro baseado em farmacibilidade para essa consulta, reduzimos a seleção do gene para um punhado de genes. O usuário pode inspecionar manualmente os alvos selecionados para descobrir quais drogas foram listadas por meio de associações indiretas. As páginas de destino exibirão todos os compostos associados na seção de farmacibilidade, classificadas de acordo com a origem da inferência. Para inferências conduzidas pela rede, a pontuação para cada composto proposta aparecerá tanto como uma lista quanto como um enredo de classificação, para identificar rapidamente os candidatos promissores. Alternativamente, para minimizar a inspeção manual, a lista de genes (isto é, a própria consulta) pode ser facilmente convertida em uma lista de drogas associadas clicando no botão “Converter esses consulta” no topo das páginas de resultados da consulta. Essa funcionalidade fornece uma maneira rápida de começar a criar uma biblioteca de triagem para um conjunto de alvos. As transformações de consulta podem ser baseadas em drogas curadas (drogas conhecidas para um conjunto de alvos), previstos (associações computadas a drogas) ou ambos. Em todas as três abordagens, os inibidores / drogas associados a alvos drogáveis conhecidos são transitivamente associados aos genes da lista. A Figura 3 resume a estratégia de priorização, a conversão de consulta de lista de genes a compostos, e um exemplo da visualização do sub-gráfico disponível na página composta de um acerto de repaturação. Atualmente, essas conversões são executadas em segundo plano e os resultados aparecem na seção Histórico do site quando concluídas (os usuários também são alertados por e-mail).

Figura 3.

Droga Repurposição Oportunidades para E. Multilocularis usando transformações de consulta. Um regime de priorização alvo para o Echinococcus multilocularis dependendo de inferência baseada em ortologia e drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) lista inicial de alvos priorizados. (C) Qualquer lista de destino pode ser “transformada” em uma lista de seus medicamentos associados, usando qualquer um dos métodos de links compostas disponíveis (consulte o texto principal). (D) Lista resultante de compostos bioativos. (E) Exemplo de visualização do sub-gráfico de rede de um composto selecionado, mostrando links de bioactividade ativos e inativos. Os compostos (nós verdes) são conectados a metas de patógeno (laranja) de acordo com registros de bioactivity (verde = ativo; vermelho = inativo, consulte o texto principal para os limites de atividade).Alvos, por sua vez, estão conectados (links cinzentos) a afiliações funcionais (nós azuis). A renderização do sub-gráfico fornece dicas visuais sobre como o alvo inicial de E. Multiocularis é conectado com o composto selecionado na rede.

Figura 3.

Figura 3.

>

Droga que repture oportunidades para E. MULTILOCULARIS usando transformações de consulta. Um regime de priorização alvo para o Echinococcus multilocularis dependendo de inferência baseada em ortologia e drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) lista inicial de alvos priorizados. (C) Qualquer lista de destino pode ser “transformada” em uma lista de seus medicamentos associados, usando qualquer um dos métodos de links compostas disponíveis (consulte o texto principal). (D) Lista resultante de compostos bioativos. (E) Exemplo de visualização do sub-gráfico de rede de um composto selecionado, mostrando links de bioactividade ativos e inativos. Os compostos (nós verdes) são conectados a metas de patógeno (laranja) de acordo com registros de bioactivity (verde = ativo; vermelho = inativo, consulte o texto principal para os limites de atividade). Alvos, por sua vez, estão conectados (links cinzentos) a afiliações funcionais (nós azuis). A renderização do sub-representa fornece dicas visuais sobre como o alvo inicial de E. Multilocularis é conectado com o composto selecionado na rede.

Exploração de compostos órfãos

As atividades dos compostos extraídos da literatura por curação aparecem na forma de ensaios baseados em alvo (link direto ao alvo) ou na forma de ensaios de base ou organismo integral. Na ausência de outras informações, essas últimas classes de ensaios não fornecem pistas para o alvo ou mecanismo de ação dos compostos. Durante o processo de atualizações de dados químicos em TDR6, identificamos compostos com efeitos fenotípicos relatados no organismo inteiro ou nos ensaios baseados em células, com base em suas classificações quimblicas. Esta informação foi utilizada para identificar os compostos ‘órfãos’ ativos contra um patógeno particular em exibições primárias ou secundárias à base de células, mas para as quais não há um ensaio baseado em alvo.

Os compostos órfãos no TDR6 podem ser Procurou qualquer espécie com dados de triagem fenotípicos disponíveis, dentro da página de pesquisa compostos. Isso permite uma maneira rápida de alavancar dados de ensaios de alta taxa de transferência, permitindo que os usuários iniciam suas prioridades de compostos com atividade conhecida contra um patógeno de interesse.

O modelo de rede integrado no TDR6 também é útil para identificar candidato alvos para compostos órfãos. Conforme descrito na publicação original (14), a vizinhança de similaridade química computada em torno de um composto órfão selecionado pode fornecer links indiretos a um ou mais alvos. Usando esta estratégia, realizamos prioridades alvo para todos os compostos órfãos no TDR6. Estas priorizações compostas orientadas à rede pré-executadas estão disponíveis para todos os organismos para os quais os dados de triagem fenotípicos estão disponíveis. Resumos globais mostrando todos os compostos órfãos para estes organismos estão ligados a partir da página “Resumo de dados” (consulte https://tdrtargets.org / datasummary e clique nas espécies de interesse). Um exemplo de priorização baseada em composto órfão para T. cruzi é mostrada na Figura 4. Considerando que as prioridades que a partir de um único composto estão disponíveis em cada página composto.

Figura 4.

Exploração de metas candidatas para compostos de órfãos de Trypanosoma Cruzi. O enredo resume a priorização alvo acionada por rede para compostos órfãos ativos contra T. Cruzi. Todas as sequências de codificação de proteína no genoma de T. Cruzi (alvos candidatos) são organizadas no eixo X. Os pontos de dados no enredo correspondem a associações de fármacos-alvo marcados pelo algoritmo (pontuação plotada no eixo Y). Como exemplo, destacamos dois alvos putativos para duas drogas diferentes (conforme exibido na página de resumo de dados T. Cruzi). Parcelas semelhantes estão disponíveis on-line para organismos de nível 1 em TDR6 (ligado a partir da página de resumo de dados).

Figura 4.

Exploração de alvos candidatos para compostos de órfãos de Trypanosoma Cruzi. O enredo resume a priorização alvo acionada por rede para compostos órfãos ativos contra T. Cruzi. Todas as sequências de codificação de proteína no genoma de T. Cruzi (alvos candidatos) são organizadas no eixo X. Os pontos de dados no enredo correspondem a associações de fármacos-alvo marcados pelo algoritmo (pontuação plotada no eixo Y). Como exemplo, destacamos dois alvos putativos para duas drogas diferentes (conforme exibido na página de resumo de dados T. Cruzi). Parcelas semelhantes estão disponíveis on-line para organismos de nível 1 em TDR6 (ligado a partir da página de resumo de dados).

Atualizações e atualizações de dados

novos dados genômicos em Alvos TDR V6.1

Desde a publicação anterior do banco de dados de destino do TDR (13), vários genomas de patógenos foram adicionados. Uma lista detalhada é fornecida na Tabela 3, bem como on-line na página Resumo de dados TDR6 (https://tdrtargets.org / datasummary).

Tabela 3 .

Resumo de disponibilidade de dados para patógenos de nível superior. Resumo dos dados alvo disponíveis para organismos de nível 1 em alvos de TDR. CDs: sequências de codificação; PFAM: Número de proteínas com domínio (s) de PFAM mapeado; Vá: Número de proteínas com termos mapeados de ontologia genética; CE: Número de proteínas com números de comissão de enzimas mapeadas (CE); Caminhos: Número de proteínas mapeadas para mapas de pathway KEGG; Ortólogos: Número de seqüências mapeadas para grupos ortólogos de Orthomcl. Uma tabela de resumo de dados mais completa está disponível online em https://tdrtargets.org / datasummary

espécie. CDs. pfam. vá. CE. vias. orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166
plasmodium vivax 5344 3264 2631 641 806 5207
toxoplasma gondii 7946 4025 3795 772 967 6764
chlamydia trachomatis 887 704 598 269 357 645
mycobacterium leprae 1630 1236 929 628 611 1473
mycobacterium tuberculose 4004 2934 2001 1174 1145 3287
mycobacterium ulcerans 4232 3602 2578 873 1002 3459
trep onema pallidum 1036 791 634 221 335 733
wolbachia endosymbiont de B. malayi 805 628 577 308 382 688
brugia malayi 11316 7042 6368 1278 1787 8424
echinococcus granulosus 10249 6481 5432 854 1965 7109
echinococcus multilocularis 10474 6817 5768 878 2079 7539
loa loa (worm olho) 16292 8071 6774 1539 2207 10484
onchocerca volvulus 12224 3248 2178 246 563 4054
schistosoma mansoni 12692 7818 7384 1218 1649 10386
leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma Brucei 10270 5665 5482 1019 1264 9259
trypanosoma cruzi 18639 9908 8572 1495 1495 1735 18140
entamoeba histolytica 8211 4920 4087 645 1094 7692
giardia lamblia 9665 2726 2263 326 514 5977
tricomonas vaginalis 95600 35474 18435 843 1366 87303

5432

Entamoeba histolytica

espécie. CDs. pfam. vá. CE. vias. orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166
plasmodium vivax 5344 3264 2631 641 806 5207
toxoplasma gondii 7946 4025 3795 772 967 6764
chlamydia trachomatis 887 704 598 269 357 645
mycobacterium leprae 1630 1236 929 628 611 1473
mycobacterium tuberculose 4004 2934 2001 1174 1145 3287
mycobacterium ulcerans 4232 3602 2578 873 1002 3459
trep onema pallidum 1036 791 634 221 335 733
wolbachia endosymbiont de B.malayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (verme olho)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Tabela 3.

Resumo disponibilidade de dados para os melhores patógenos linha. Resumo de dados de destino disponíveis para Tier 1 organismos em Metas TDR. CDs: sequências codificantes; Pfam: número de proteínas com mapeada Pfam domínio (s); GO: número de proteínas com mapeadas termos Gene ontologia; CE: número de proteínas com números mapeadas Comissão Enzyme (CE); Vias: número de proteínas mapeadas para mapas pathway KEGG; Ortólogos: número de sequências mapeadas para grupos OrthoMCL ortólogo. Uma tabela de resumo de dados mais completa está disponível online em https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071


Entamoeba histolytica


3C34827 “ iv id = “0B01674E”” DV ID =” 0B01674E.


V ID = “29971A56991”

5344

2631

887 87 04 04 04 04

ara TepNE


Mycobaacterium 6678 678 678 678 678


5432

Entamoeba histolytica

Espécies. CDs. PFAM. GO. CE. Pathways. ortólogos.
Plasmodium falciparum 5349 3322 3551 750 1083 5166
5344 3264 2631 641 806 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764
Chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae

1630

1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep onema pallidum 1036 791 634 221 335 733
Wolbachia endosymbiont de B.Malayi 588 588 388
Brugia malayi

11316

7042 6368 1278 1787 6481 6481 854 1965 7109
Echinococcus multilocularis

10474

6817 779 758
Loa Loa (verme do olho) 1509 071 1559 071 1539 071 679 071 15371 1539 071 1539 071 1559 071 2207 10484 2378 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250 5480 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia Lambia 2263 2263 2735 363

272 3635 363 2235 363 514 5977
Trichomonas vaginalis

95600

35474

18435 843 CDs. pfam. vá. CE. Pathes. orthoogs.
lasmoodium 3322 551 7166 Plasmox vivax 641 606 06 06 06 06 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764 598 269 Mycobacterium 1630 1236 p2 673 673
Mycobaacterium TDULESIS página 1174 1174 1174 1174 3287 873 1002 3459
Trep. Onema pallven

1036

61 33 33 33 33 33 33 633
wolbia indussibriant de bmalayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (verme olho)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Dada a diversidade de organismos Integrado Metas TDR e, consequentemente, a variedade de fontes de dados necessário para cobrir toda a genomas; esforço substancial tem sido posta em padronizar os dados de análise e recuperação de informação a partir do genoma destes organismos. A maior parte do genoma completo EuPathDB Foram obtidos a partir de (18), GenBank (19), GeneDB (20), Wormbase parasita (21), GenoList (22) ou Mycobrowser (23). Uma descrição completa das fontes de genoma e dada na Tabela anterior Suplementar S1. Para atualizar os dados para organismos presentes na versão anterior de Metas TDR genes codificadores de proteínas de liberação atual de genomas eram ou mapeado para genes existentes nas Metas TDR, ou não entraram os novos registros. O mapeamento algoritmo utiliza uma combinação de condições para rastrear identificadores Gene através das versões e manter a identidade de genes: as somas de verificação de sequência correspondente (utilizando valores de 128 bits hash gerado pelo algoritmo MD5), nomes de gene ou identificadores e explosão (24) SE ou combinações perfeitas são encontrados. Depois de actualização de registos, o pipeline calcula propriedades físico-químicas que utilizam Pepstats (25), verifica se há domínios transmembranares com TMHMM (26), os péptidos de sinal com SignalP (27), e glicosilfosfatidilinositol Os pontos de ancoragem, usando PredGPI (28). O algoritmo descarta todas as sequências codificadoras não, os mais bem quaisquer pseudogenes, para evitar enganosa anotações e minimizar falsos pressupostos durante os fluxos de trabalho de priorização. A maioria dos TDR6, mencionado acima todas as tarefas de genoma integração e atualização foram quebradas no fluxo de trabalho automatizado para facilitar mais rápido atualizações em lançamentos futuros. Um esquema da actualização e Pipeline algoritmo mostrado na Figura Suplementar anterior S1. O Pipeline também automatiza o cálculo de anotações usando estratégias individuais ad hoc para diferentes anotações, contando com serviços web e APIs (apareceu no Kaas (29) Serviço de proteínas de mapeamento para Vias Metabólicas e ao Número da CE Classificação de enzimas, ou a OrthoMCL banco de dados e a ferramenta (30,31) para os grupos de mapeamento ortólogo a proteínas. a Pipeline também depende de computação contra bases de dados instalados localmente apareceu mais InterPro (32), utilizando InterProScan (33) para identificar domios proteicos Pfam () e mapear termos para vocabulários controlados e classificações (termos GO). recursos adicionais apareceu mais 3D estruturas e modelos estruturais foram obtidos a partir do Protein Data Bank (34), utilizando serviços web e baixado do site Modbase FTP (35), respectivamente.

Também o número de conjuntos de dados funcionais principais foram integrados nesta versão, incluindo (i) os conjuntos de dados transcriptomic que fornecem evidência de expressão de genes em estágios do ciclo de vida ou condições experimentais que são relevante para Drug Discovery (36-47) e (ii) os conjuntos de dados essencialidade derivado de dois agentes patogénicos Apicomplexan (P. berghei e T. gondii) (16,48), que fornecem informação de Estratégias Vital AUXILIAR prioritização.

Actualizações de dados Chemical

Para os compostos bioactivos, também, os fluxos de trabalho de actualização de dados foram automatizados para esta versão.A maioria dos compostos bioativos foi recuperada da libertação química do 24º (49), que contém alguns conjuntos de dados adicionais, como os de caixas químicas específicas de patógeno – caixas GSK Kinetoplastid (50), caixa de patogénio MMV (51). O processo de integração começa a partir de descrições da molécula (2D) no formato SDF, a partir do qual calculamos todas as impressões digitais compostas necessárias (necessárias para as pesquisas de similaridade / subestrutura composta) usando o CheckMol (52). O pipeline também calcula propriedades químicas adicionais, como o coeficiente de partição de octanol / água do logp e outros descritores estruturais usando XLOGP3 (53), e o Open Babel Tools Obprop e OBrotâmero (54). Outros dados relevantes foram obtidos ou calculados diretamente da estrutura composta, como os identificadores Inchi e Inchikey (55) usado para rastreamento composto; e outras regras padrão usadas em química medicinal e descoberta de drogas, como a regra de Lipinski de cinco (56) e a regra relacionada de três (57).

Após a integração em alvos de TDR, todos os compostos foram sujeitos Para todos os cálculos de comparação de similaridade química, utilizando ChemFP (58), que produz medidas de similaridade em pares com base no índice / distância do Tanimoto (59). Além disso, nós calculamos um mapa global (todo versus) de relacionamentos de subestrutura entre os compostos no banco de dados (x é uma subestrutura de Y; Y é uma superestrutura de X). Sabendo que o problema de encontrar os subgrafos comuns máximos entre moléculas é computacionalmente difícil, aplicamos uma abordagem heurística para encontrar subestruturas. O algoritmo obtém primeiro um subconjunto de possíveis moléculas candidatas, fazendo uso de impressões digitais calculadas anteriormente. Os candidatos devem ter impressões digitais correspondentes com a molécula de assunto. Uma vez obtida uma lista de candidatos, é feita a determinação de substrutura de atom-by-atom completo, é feita usando matchmol (52). Os dados disponíveis para compostos e as consultas que podem ser executadas em cada tipo de dados são resumidas na tabela 2. O peso molecular (MW) e a distribuição da área de superfície polar (PSA) para todos os compostos no banco de dados é mostrado na figura suplementar S2. / p>

curadoria e integração de dados de bioactividade

Como com compostos químicos, a maioria das bioactividades integradas em alvos de TDR vêm diretamente das fontes de dados a montante (por exemplo, químicas). Ao integrar dados de bioactividade, preservamos tanto a anotação do ensaio (por exemplo, a ensaio de redução de motilidade in vitro contra Brugia Malayi microfilária a 10 μm ‘) e o valor numérico e unidades associadas a atividades compostas (por exemplo, ‘80% de inibição’, ‘80% μm IC50 ‘, ’10 nm mic’), que são todos os campos pesquisáveis. Além disso, e para facilitar as consultas de usuário, as bioactividades relatadas foram usadas para agrupar compostos ensaiados em classes “ativas” ou ‘inativas’. No entanto, para minimizar o efeito de usar fronteiras duras ao redor de limiares arbitrários e aumentar a separação entre classificações ativas / inativas, também definimos uma área cinza indeterminada. Assim, os compostos marcando logo abaixo de um limiar arbitrário não são considerados inativos para fins de consulta e visualização.

Nem todos os tipos de atividade foram passíveis de classificação, no entanto. Apesar dos esforços na padronização desses dados de atividade, a interpretação das atividades dos compostos nessa escala é difícil, pois muitas vezes dependem do tipo de ensaio particular, as unidades relatadas e as condições específicas em que cada ensaio foi conduzido. No entanto, um conjunto significativo de tipos de ensaio pode ser automaticamente classificado em categorias ativas / indeterminadas / inativas com base em limiares de atividade. Para isso, todos os tipos de ensaio com relatórios > 100 000 (ver Figura suplementar S3 para uma atividade por ensaio de distribuição do composto) foram considerados para auditoria de atividade, embora apenas ensaios baseados em concentração (como IC50, KI ou Potência) foram considerados robustos o suficiente para tal determinação, porque os ensaios baseados em porcentagem (como% de atividade,% de atividade residual ou $ inibição) eram ambíguos em relatórios de bioatividade. Os limites usados para classificar as atividades para cada tipo de ensaio podem ser encontrados na Tabela 4, e a distribuição de compostos nessas classes de atividade é resumida na Figura 5.

Tabela 4.

Tipos de ensaio e limites de atividade usados para determinação da tag de atividade: apenas os ensaios baseados em concentração foram usados para determinar as tags de atividade. As atividades relatando menos do que o valor máximo admitido para positivos foram consideradas interações ativas (+), enquanto aquelas maiores do que o “valor mínimo admitido para negativos” foram considerados inativos (-). Qualquer atividade relatada entre esses dois valores foi considerada como indeterminada (0)

nm

Ensaio do tipo. padrão da unidade. Máximo valor admitido para os ativos. valor admitido mínimo para inactivos.
AC50 20000 100000
EC50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potência nm 20000 100000

nm

Ensaio. padrão da unidade. Máximo valor admitido para os ativos. valor admitido mínimo para inactivos.
AC50 20000 100000
EC50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potência nm 20000 100000

Tabela 4.

Tipos de ensaio e limites de atividade usados para determinação da tag de atividade: Somente os ensaios baseados em concentração foram usados para determinar as tags de atividades. As atividades relatando menos do que o valor máximo admitido para positivos foram consideradas interações ativas (+), enquanto aquelas maiores do que o “valor mínimo admitido para negativos” foram considerados inativos (-). Qualquer atividade relatada entre esses dois valores foi considerada como indeterminada (0)

nm

Ensaio do tipo. padrão da unidade. Máximo valor admitido para os ativos. valor admitido mínimo para inactivos.
AC50 20000 100000
EC50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potência nm 20000 100000

nm

Ensaio. padrão da unidade. Máximo valor admitido para os ativos. valor admitido mínimo para inactivos.
AC50 20000 100000
EC50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potência nm 20000 100000

Figura 5.

Misturas de distribuição e evidência de atividade entre dados: (a) Diagrama de Venn mostrando a distribuição de valores de bioactividade nas classes ativa, inativa e indeterminada em TDR6 (ver texto principal para detalhes) . Os casos de contagem de interseções em que o mesmo medicamento tem diferentes resultados de atividade contra o mesmo destino. Exemplos desses casos são fornecidos em painéis B por F (IDs compostas representam identificadores TDR6). (B) Actividade de C329137 (uma hidroxi-benzamidina) contra o diidrofolato bifuncional de P. falciparum, sintase de redutilo-timidilato. (C) Exemplo de registros positivos para inibidores da aciltransferase humana. (D) Exemplo de atividades negativas e neutras para compostos TriPhenylcarbinol e benzo-hidrol, respectivamente. Finalmente, ambos positivos (e) e negativos (f) podem ser misturados com evidências indeterminadas, como mostrado para C2164865 testado contra a colinesterase a cavalo e C306882 testado contra a hidrolase de nucleotídeo recombinante P. falciparum de 5′-trifosfato, respectivamente.

Misturas de distribuição e evidência de atividade entre dados: (a) Diagrama de Venn mostrando a distribuição de valores de bioactividade no ativo aulas inativas e indeterminadas em TDR6 (ver texto principal para detalhes).Os casos de contagem de interseções em que o mesmo medicamento tem diferentes resultados de atividade contra o mesmo destino. Exemplos desses casos são fornecidos em painéis B por F (IDs compostas representam identificadores TDR6). (B) Actividade de C329137 (uma hidroxi-benzamidina) contra o diidrofolato bifuncional de P. falciparum, sintase de redutilo-timidilato. (C) Exemplo de registros positivos para inibidores da aciltransferase humana. (D) Exemplo de atividades negativas e neutras para compostos TriPhenylcarbinol e benzo-hidrol, respectivamente. Finalmente, ambos positivos (e) e negativos (f) podem ser misturados com evidências indeterminadas, como mostrado para C2164865 testado contra a colinesterase a cavalo e C306882 testado contra a hidrolase de nucleotídeo recombinante P. falciparum de 5′-trifosfato, respectivamente.

A liberação química 24.º conta com mais de 15,2 milhões de bioactividades relatadas, das quais apenas cerca de 6 milhões correspondiam a relacionamentos envolvendo drogas e metas de proteína (proteínas únicas, famílias proteicas e complexos proteicos, com ~ 93% sendo proteínas únicas). Outras bioactividades restantes no banco de dados foram relatórios para uma ampla variedade de metas não proteicas, como células inteiras (3,6m), organismos inteiros (2,2M), tecidos (83k) e macromoléculas não-peptídicas (85K) ou pequenas moléculas (< 100). Estes não foram usados na construção de rede, porque a rede é de proteína (isto é, alvo) centrada. A Figura 5 também mostra algumas visualizações de rede de exemplo que descrevem como o TDR6 exibe essas bioactividades.

Integração de características derivadas de rede: farmacibilidade e priorizações

Como mencionado acima, dados genômicos, anotações genéticas, Compostos químicos e interações genéticas-fármacas foram integrados a uma complexa orientada para a reivindicação de medicamentos, conforme descrito em Berenstein et al. (14). A rede foi usada para calcular uma pontuação de farmacibilidade de rede (NDS), para todos os alvos em patógenos prioritários (Tier 1). O NDS está relacionado à chance de encontrar compostos bioativos nas próximas proximidades do gráfico de rede de um determinado alvo (intervalo é de 0 a 1). O algoritmo foi descrito anteriormente em detalhes (14), mas brevemente, com base em um teste de excesso de representação de proteínas drogáveis conhecidas anotadas, calcula uma pontuação de relevância (RS) para cada categorias de grupos de domínio e ortologia da PFAM. A pontuação do NDS para um determinado alvo resulta de uma soma cumulativa ponderada sobre os Rs de todas as contribuições de afiliação comuns ao nó alvo e proteínas vizinhas ligadas a compostos ativos.

Para facilitar a interpretação das pontuações do NDS que realizamos um Avaliação estatística para identificar grupos de farmacilidade distintas (DG) com base em dois tipos de limites que ajudam a classificar as previsões de farmacibilidade a zonas de confiança. Estes são ilustrados na Figura 6. Por um lado, enquanto todos os alvos de pontuação não zero têm algum grau de conectividade a alvos conhecidos-medicamentosos, um Baixo NDS sugere que essas conexões não são relevantes para avaliação da farmacibilidade. Assim, um corte-ruído (uma linha de base calculada como 5 vezes o valor de 0,25 percentil da distribuição completa do NDS) é considerado para identificar alvos de baixa pontuação. O segundo limite é derivado do índice máximo de J de Yeden (60), que é calculado como a pontuação na qual tanto a especificidade como a sensibilidade são ideais (melhor sensibilidade sem comprometer a especificidade e vice-versa). Este valor só pode ser calculado para patógenos com positivos verdadeiros (alvos drogáveis conhecidos). Um mínimo arbitrário de 10 verdadeiros positivos foi considerado suficiente para a determinação de corte de você. Para outros patógenos, sem essas informações, um corte global de Youden foi usado (calculado usando todos os verdadeiros positivos da rede). Os correspondentes grupos de farmacilidade são, portanto,: DG1 para alvos com valores do NDS variando de 0 ao limiar de ruído; DG2 para alvos com valores de NDS que vão desde o limiar de ruído até o corte do yenden; e DG 3, 4 e 5 com valores de NDS que são 1-, 10- e 100 vezes acima do corte do yenden. Por conseguinte, estes últimos grupos contribuem para os alvos mais prováveis drogáveis. A Figura 6 mostra um exemplo estático de uma priorização orientada pela rede para os ulceranos Mycobacterium (que não possui alvos com compostos conhecidos na liberação atual). Todas as prioridades para os alvos de TDR Os organismos prioritários podem ser vistos on-line na página Resumo de dados para cada espécie (consulte https://tdrtargets.org / datasummary, clicando na espécie de interesse). Nesse caso, as parcelas on-line são interativas e podem ser ampliadas e exportadas. Nos casos em que há alvos com compostos bioativos conhecidos para as espécies, estes são mostrados distintamente no enredo.

Figura 6.

Priorização do alvo do genoma para Ulcerans Mycobacterium: alvos candidatos no genoma do M. ulcerãs foram classificados por seus NDS (pontuação de drogabilidade de rede, ver texto principal).O lote descreve todos os alvos do genoma (no eixo X), juntamente com sua correspondente pontuação NDS (no eixo Y). Os pontos vermelhos correspondem aos 10 alvos classificados Top-10, com rótulos indicando o nome e o produto do gene. Navegando a priorização inteira do genoma a partir do resumo de dados, o usuário pode acessar uma página do gene clicando nela no enredo de priorização. Um exemplo de subgraph da família de genes da EMBA / EMBB / EMBC é mostrado (como visto em suas páginas genéticas correspondentes). A figura também exibe zonas de confiança, DG1 (vermelho): delimitado por zero e corte de ruído; DG2 (amarelo): entre o ruído e o endoff do Yeden; e dg3-5: com pontuações superiores ao ponto de endoff.

Figura 6.

Genoma inteiro acionado por rede Priorização do alvo para Ulcerans Mycobacterium: Os alvos candidatos no genoma do M. ulcerans foram classificados por seus NDS (pontuação de drogabilidade de rede, ver texto principal). O lote descreve todos os alvos do genoma (no eixo X), juntamente com sua correspondente pontuação NDS (no eixo Y). Os pontos vermelhos correspondem aos 10 alvos classificados Top-10, com rótulos indicando o nome e o produto do gene. Navegando a priorização inteira do genoma a partir do resumo de dados, o usuário pode acessar uma página do gene clicando nela no enredo de priorização. Um exemplo de subgraph da família de genes da EMBA / EMBB / EMBC é mostrado (como visto em suas páginas genéticas correspondentes). A figura também exibe zonas de confiança, DG1 (vermelho): delimitado por zero e corte de ruído; DG2 (amarelo): entre o ruído e o endoff do Yeden; e DG3-5: com pontuações superiores ao corte de vocês.

Estas priorizações orientadas por rede podem funcionar nos dois sentidos. Ao partir de um composto de interesse, o algoritmo pode priorizar os alvos, usando a semelhança ponderada de vizinhos químicos para alvos iniciais de candidatos. E ao iniciar a meta de interesse, pode priorizar os compostos, usando alvos vizinhos dramínsos conectados e depois após links ponderados para inibidores / drogas candidatos. Pontuações pré-computadas para compostos e destinos são usados internamente por TDR6 e estão no núcleo de transformações de consulta baseadas em rede.

Visualizações de sub-gráfico de rede e atualização de interface de usuário

a rede sub -Graphs para compostos e alvos (e suas respectivas pontuações do NDS) podem ser navegadas a partir do aplicativo da Web usando um medicamento ou um alvo como ponto de partida para obter dicas para drogas não testadas ou alvos drogáveis, respectivamente. Através de visualizações recém-desenvolvidas, os usuários podem verificar os bairros de rede em torno de drogas e metas nas páginas correspondentes. Listas de interações putativas derivadas de rede também podem ser exploradas em formato tabular sob a “farmacilidade” (para alvos) e “alvos conhecidos e previstos” (para drogas) seções.

Essas visualizações são conduzidas por D3.js (61) Implementando layouts forçados para visualizações do sub-gráfico. No painel Subgráfico D3, os usuários podem realizar pesquisas de nó dentro do gráfico (identificadores de destino), além de alternar a visibilidade dos destinos em uma espécie por maneira de espécies, e personalizar a opacidade dos nós. Reunijos, esses novos recursos fornecem uma visualização clara e abrangente da proximidade de metas e compostos, permitindo que os usuários manipulem os gráficos enquanto exploram os dados.

A interface do usuário (UI) e as ferramentas disponíveis Para a reivindicação de drogas e a priorização alvo passaram por uma grande atualização. Em primeiro lugar, a interface do usuário foi redesenhada nos padrões do W3C para obter uma aplicação mais saudável e escalável. Nós integramos o bootstrap (https://getbootstrap.com/) e jQuery (https://jquery.com) Estruturas no desenvolvimento e design do aplicativo da Web TDR6 e na frente- funcionalidade final. Para consultas de estrutura compostas, licenciamos e implementamos o aplicativo de desenho químico da Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Registros tabulados dentro das páginas de destino e drogas agora usam o plugin JavaScript Javay DataTable (https://datatables.net) para criar facilmente paginações, filtragem e classificação de funcionalidades. Finalmente, representações 2D compostas são agora geradas automaticamente usando uma implementação do módulo JavaScript do SmilesDrawer (62).

Disponibilidade comercial de compostos

Um aspecto importante ao priorizar os compostos para testes no laboratório , é a disponibilidade deles. No TDR6 agora exibimos informações sobre a disponibilidade comercial de compostos. Atualmente, iniciamos esse recurso vinculando com o Molport (um mercado químico on-line que fontes compostos de grandes fornecedores) e mostram usuários uma pista visual em páginas compostas que dão uma rápida indicação de se o composto está em estoque ou pode ser feito para encomendar . Como a disponibilidade comercial de compostos é atualmente implementada em TDR6 na forma de consultas assíncronas contra o Molport, neste momento esse recurso está disponível apenas no modo de navegação (não em consultas).No entanto, os usuários podem priorizar os compostos usando qualquer uma das estratégias de consulta disponíveis no TDR6 e finalizar suas seleções compostas inspecionando os compostos manualmente para a disponibilidade comercial.

Discussão e instruções futuras

os novos dados , a interface e a funcionalidade do TDR6 fornecem aos usuários com navegação e visualização aprimoradas de metas e compostos.

O modelo de rede atual conecta alvos através da afiliação de entidades (proteínas) a conceitos de anotação (domínios de PFAM). Estes foram selecionados com base em sua ampla cobertura e facilidade relativa de cálculo. Complementando estes conceitos com outros critérios importantes para a validação de meta de medicamentos (essencialidade, expressão em etapas de ciclo de vida relevantes) podem ser feitas por usuários com as ferramentas e funcionalidades fornecidas pelo TDR6, mas no futuro eles podem ser construídos no próprio modelo de rede subjacente, em menos para alguns organismos passíveis de avaliação experimental genoma.

Várias melhorias-chave são necessárias para manter os alvos de TDR relevantes para a comunidade de cientistas que trabalham em doenças tropicais. Integração de metabólitos naturais e conectar essas pequenas moléculas a outros compostos bioativos por meio de subestruturas compartilhadas ou por similaridade química será um foco importante no futuro. Isso permitirá navegar pelo gráfico de destinos de drogas usando os conceitos de reações bioquímicas, que naturalmente conectam enzimas não ortólogas através de seus substratos / produtos e cofatores compartilhados.

Finalmente, como já mencionado anteriormente (13), Ainda há uma grande lacuna de curação que precisa ser preenchida. Muitos compostos bioativos foram testados pela comunidade de pesquisadores que trabalham em doenças tropicais negligenciadas. No entanto, muitos desses ensaios e resultados são relatados em periódicos fora dos principais periódicos de química medicinal e, portanto, são perdidos por grandes esforços de curação, como o LED por quimbles (49). Curação e integração destes dados ausentes (incluindo dados negativos!) Deve ser uma prioridade para a comunidade, pois economizaria tempo e recursos valiosos.

Dados suplementares

Os dados suplementares estão disponíveis Na Nar Online.

Agradecimentos

Os autores gostariam de agradecer Matthew Berriman e Magdalena Zarowiecki (Instituto Wellcome Trust Sanger) para compartilhar dados e anotação de genoma de pré-liberação do Echinococcus para inclusão no TDR Alvos; e Ben Webb e Andrej Sali (Universidade da Califórnia São Francisco) para o cálculo de modelos 3D para genomas patógenos de nível 1 em alvos de TDR. L.u.l., A.B. e s.v. eram ou são apoiados por bolsas do Conselho Nacional de Pesquisa (Conicet, Argentina). A.C. e F.A. são membros da carreira de pesquisa do Conselho Nacional de Pesquisa (Conicet, Argentina). PM. Gostaria de reconhecer uma comunhão da Comissão Universitária (UGC), na Índia.

Financiamento

Glaxosmithkline Argentina e a Agência Nacional para a Promoção da Ciência e Tecnologia, Argentina (ANPCYT); Indo-Argentina Projecto de cooperação bilateral (financiamento conjunto do Departamento de Ciência e Tecnologia da Índia (DST) e Ministério da Ciência e Tecnologia Argentina (Metcyt). Financiamento para taxa de acesso aberto: Fondo Para La Investigación Científica Y Tecnológica.

Conflito de juros. Nenhum declarado.

Notas

Apresentar: Ariel J Berenstein, Instituto Multidisciplinario de Investigaciones en Patológicos Pediáticas (IMIPP), CONICET-GCBA, Laboratorio de Biología molecular, División Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

hotez
Pj
Molyneux
DH
fenwick

,

kumaresan
j.

Sachs

se

,

Sachs
jd

,

savioli

,

savioli
l.
Controle de doenças tropicais negligenciadas

.

n. Engl. J. med.
2007

;

357

:

1018

1027

.

trouiller
p.

,

olliaro
p.

torreele

e.

,

orbinski
j.

,

laing

,

ford
n.
Desenvolvimento de drogas para doenças negligenciadas: um mercado deficiente e um público Falha na política de saúde

.

Lancet North AM. Ed.
2002

;

359

:

2188

2194

.

hughes
j.

,

rees
s.
kalindjian
s.
Philpott
k.
Princípios da descoberta precoce de drogas

.

br. J. Pharmacol.
2011

;

162

:

1239

1249

.

adams
cp

,

brantner
vv
Estimando o custo do novo desenvolvimento de drogas: é realmente US $ 802 milhões

.

Health Aff. (Milhawood)

.

2006

;

25

:

420

428

.

wyatt
pg

,

gilbert

IH

Leitura
kd
fairlamb
ah
validação de destino : Vinculando alvo e propriedades químicas ao perfil desejado do produto

.

curr. Topo. Med. Chem.
2011

;

11

:

1275

1283

.

Farha
ma

,

brown
ed
droga Repurposição para descoberta antimicrobiana

.

nat. Microbiol.
2019

;

4

:

565

577

.

hernandez
hw
soeung
m.
zorn
km

,

ashoura
n.

,

Mottin
m.
andrade
ch
caffrey
cr

,

de Siqueira-Neto
jl

,

ekins
s.
alta taxa de transferência e repaturação computacional para doenças negligenciadas

.

Pharm. Res.
2018

;

36

:

27

.

wooller
sk

,

benstead- Hume
g.

,

chen
x.

,

Ali
y.

,

Pearl
FMG
bioinformatics na descoberta de drogas translacionais

.

biosci. Rep.
2017

;

37

:

doi: 10.1042 / bsr20160180

.

agüero
f.

,

al -Lazikani
b.

,

Aslett
m.

,

berriman
m.

,

Buckner
fs

,

campbell
rk
Carmona

,

Carruthers
im
chan
wewe

,

chen

f .

et al. .

Priorização da escala genômica de alvos de drogas: o banco de dados de alvos do TDR

.

nat. Rev. Drug Discov.
2008

;

7

:

900

907

.

crowther
gj

,

shanmugam
d.

,

carmona
sj

,

Doyle
ma
Hertz-fowler
c.

berriman

m.

,

nwaka
s.

,

ralph
sa

,

Roos
ds

,

van voorhis
wc

et al. .

Identificação de alvos atrativos de drogas em patógenos da doença negligenciada usando uma abordagem de silico

.

plos de magia. Trop. Dis.
2010

;

4

:

E804

.

lykins
jd

,

filippova
ev

,

halavaty
como
minasov
g.

,

Zhou
y.

,

Dubrovska
i.

,

Flores
kj

,

shuvalova
la

,

ruan
j.

,

el bissati
k.

et al. .

CSGID resolve estruturas e identifica fenótipos para cinco enzimas em toxoplasma gondii

.

frontal. Célula. Infectar. Microbiol.
2018

;

8
352

.

shanmugam
d.

,

ralph
SA

,

Carmona
sj

,

crowther
gj

,

Roos
DS
agüero
f.
caffrey
cr
Selzer
PM
Integrando e minimando genomas de helmintos para descobrir e priorizar novos alvos terapêuticos

.

helmintos parasitas: metas, telas, drogas e vacinas

.

2012

;

wiley-blackwell
43

59

.

magariños
pm

,

carmona
sj
Moodther
gj
ralph
sa

,

roos
DS

,

shanmugam
d.

,

van voorhis
wc

,

agüero
f.
TDR alvos: um recurso quimogênico para doenças negligenciadas

.

nucleic. Ácidos. Res.
2012

;

40

:

d1118

d1127

.

berenstein
aj

,

magariños
pm
chernomoretz

,

agüero
f.
Uma abordagem de rede multicamada para orientar o reposicionamento de drogas em doenças negligenciadas

.

plos de magia. Trop. Dis.
2016

;

10

:

e0004300

.

kim
k.

,

weiss
lm
toxoplasma gondii: o modelo apicomplexan

.

int. J. parasitol.
2004

;

34

:

423

432

.

sidik
sm
huet
d.

ganesan

sm
huynh
m.-h.
Wang
t.

,

Nasamu
como

,

Thiru
P.

,

saeij
jpj

,

carruthers
vb

,

niles
jc

et al. .

Uma tela CRISPR em todo o genoma em Toxoplasma identifica genes essenciais apicomplexan

.

Cell

.

2016

;

166

:

1423

1435

.

gajria
b.

,

bahl
brestelli
j.

,

dommer
j.

,

fischer
s.
gao
x.

,

heiges
M.

,

iodice
j.

,

kissinger
jc

,

macey

AJ

et al. .

toxodb: um recurso de banco de dados do Toxoplasma Gondii integrado

.

ácidos nucleicos res.
2007

;

36

:

d553

d556

.

warrenfeltz
s.

,

basenko
ey

agacha

k.

,

harb
OS
> Kissinger
JC
Roos
DS

,

shanmugasundram
a.

,

Silva-Franco
f.
kollmar
m
eupathdb: o recurso de banco de dados de genomics do patogênico eucariótico

.

Bancos de dados genômicos eucarióticos

.

2018

;

1757

:

ny
springer
69

113

.

sayers
ew

,

agarwala
r.
bolton
ee

,

breater
jr
Canese
k.

clark

k.

,

connor
r.
Fiorini
n.

,

funk
k.

,

hefferon
t.

et al. .

Recursos de banco de dados do Centro Nacional de Informações de Biotecnologia

.

ácidos nucleicos res.
2019

;

47

:

d23

d28

.

hertz-fowler
c.

,

Pavão
cs
Introduzindo a geredb: um banco de dados genérico

.

tendências parasitol.
2002

;

18

:

465

467

.

parafuso
bj

,

rodgers
fh

shafie

m.

,

kersey
pj

,

Berriman
m.
wowe
kl
Usando o parasita de WormBase: uma plataforma integrada para explorar os dados genómicos de helmintos

.

Métodos mol. Biol
2018

;

1757

:

471

491

.

lechat
p.

,

hummel
l.

,

Rousseau
s.

,

moszer
i.
genolista: um ambiente integrado para análise comparativa de genomas microbianos

.

ácidos nucleicos res.
2007

;

36

:

D469

D474

.

kapopoulou
a.

,

lew
jm
cole
st
o portal mycobrowser: um recurso abrangente e anotado manualmente para genomas micobacterianos

.

tuberculose

.

2011

;

91

:

8

13

.

camacho
c.

,

coulouris
g.

,

avagyan
v.

,

ma
n.

,

papadopoulos
j.

,

Baler
k.

,

Madden
tl
blast +: arquitetura e aplicativos

.

BMC BioInformatics

.

2009

;

10
421

.

hancock
jm

,

bishop
mj
gravar (a suíte de software de biologia molecular europeu)

.

dicionário de bioinformática e biologia computacional

.

2004

;

Chichester
John Wiley & filhos, Ltd
DOB0206

.

krogh
a.

,

larsson
b.

von heijne

g.

,

sonnhammer
el
Prevendo a topologia da proteína transmembrana com um modelo oculto Markov: aplicação para completar genomas

.

j. Mol. Biol.
2001

;

305

:

567

580

.

almagro armentaleros
jj

,

tsirigos
kd

sønderby

ck
petersen
tn

,

Winther
O.

,

brunak
s.

,

von heijne
g.

,

Nielsen
h.
sinalp 5.0 melhora as previsões do péptido de sinal usando redes neurais profundas

.

nat. Biotechnol.
2019

;

37

:

420

423

.

pierleoni
a.

,

martelli
p.

,

casadio
r.
Predgpi: um preditor de âncora gpi

.

BMC BioInformatics

.

2008

;

9
392

.

moriya
y.

,

Itoh
m.

,

Okuda
s.

,

yoshizawa
AC
Kanehisa
m.
kaas: um servidor automático de genoma e servidor de reconstrução do caminho

.

ácidos nucleicos res.
2007

;

35

:

w182

w185

.

chen
f.

,

macey

,

stoeckert
cj

jr,

roos
ds
Orthomcl-DB: Consultando uma coleção abrangente de várias espécies de grupos ortólogos

.

ácidos nucleicos res.
2006

;

34

:

d363

d368

.

fischer
s.

s.

,

BRUNK
bp
chen
f.
gao
x.
harb
OS
iodice
jb

,

shanmugam
d.

,

ds
stoeckert
cj

jr

usando orthomcl para atribuir proteínas aos grupos orthomcl-db ou a proteomas de cluster em novos grupos ortólogos

.

Curr Protoc Bioinforma.
2011

;

doi: 10.1002 / 0471250953.bi0612s35

.

mitchell
al

,

ttwood
tk

babbitt

pc
blum
m.

,

Bork
p.

,

Bridge
a.

,

Brown
sd

,

chang
h.-y.

,

el-gebali
s.

,

fraser
mi

et al. .

interpro em 2019: melhorar a cobertura, classificação e acesso a anotações de sequência de proteína

.

ácidos nucleicos res.
2019

;

47

:

d351

d360

.

jones
p.

,

binns
d.
Chang
H.-y.

,

fraser
m.

,

li
w.

,

McCulla
c.

,

mcwilliam
H.
Maslen
j.
Mitchell

,

nuka

nuka

>

g.

et al. .

Inuthuscan 5: Classificação de função de proteína de escala genoma

.

bioinforma. Oxf. ENGL.
2014

;

30

:

1236

1240

.

burley
sk

,

Berman
hm
bhikadiya
c.

,

bi
c.

c.

,

Chen
l.
Costanzo
ld
Christie
c.
Duarte
jm

,

dutta
s.

,

feng
Z.

et al. .

Banco de dados de proteína: o único arquivo global para dados de estrutura macromolecular 3D

.

ácidos nucleicos res.
2019

;

47

:

D520

D528

.

pieper
u.

,

webb
BM

,

dong
gq
schneidman-duhovny
d.

,

,

kim
sj
khuri
n.

,

derramamento
yg
weinkam
p.

,

hammel
m .

et al. .

Modbase, um banco de dados de modelos de estrutura de proteína comparativa anotada e recursos associados

.

ácidos nucleicos res.
2014

;

42

:

d336

d346

.

zhu
l.

l.

,

mok
s.

IMWONG

m.

,

jaideee
a.

,

Russell
b.
Nosten
f.

,

dia
np

,

branco
nj

Preiser

pr
bozdech
z.
Novos insights no transcriptoma de plasmodium vivax usando RNA-SEQ

.

sci. Rep.
2016

;

6

:

20498

.

smircich
p.

,

Eastman
g.
Bispo
s.

,

Duhagon
ma
guerra-slompo
ep

,

garat
b.

,

goldenberg
s.

,

munroe
dj

,

dallagiovanna
b.

,

holetz
F.

et al. .

Perfil do ribossomo revela o controle de tradução como um mecanismo chave gerando expressão gênica diferencial no Trypanosoma Cruzi

.

genômica BMC

.

2015

;

16

:

443

.

lasonder
e.

,

rijpma
sr

,

van schaijk
bcl

,

hoeijmakers
wam

,

Kensche
pr
gresnigt
ms

,

italiaander

,

Vos
MW

woestenenk

r.
bousema
t.

et al. .

Análises transcritivas e proteômicas integradas de P. Falciparum gametócitos: insight molecular em processos específicos do sexo e repressão translacional

.

ácidos nucleicos res.
2016

;

44

:

6087

6101

.

Otto
td
wilinski
d.

,

assefa
s.

,

keane
tm
,

Sarry
lr
böhme
u.

,

lemieux
j.

,

Barrell
b.
dor

,

berriman
m.

et al. .

Novos insights sobre o transcriptoma do estágio sanguíneo do plasmodium falciparum usando o RNA-SEQ

.

mol. Microbiol.
2010

;

76

:

12

24

.

Otto
td
böhme
u.
jackson
ap

,

hunt
m.

,

Franke-Fayard
b.

,

hoeijmakers
wam

,

religado
aa
>,

Robertson
l.

,

Sanders
m.

,

ogun
s sa

et al. .

Uma avaliação abrangente de genomas de parasita de malária de roedores e expressão gênica

.

BMC Biol.
2014

;

12

:

86

.

zanghì
g.

,

vembar
ss
Baumgarten
s.

,

ding
s.
Guizetti
j.
Bryant
JM
Mattei
d.

,

jensen
tr

,

rénia
l.

,

Goh
ys

et al. .

Um pfemp1 específico é expresso em sporozoites de P. falciparum e desempenha um papel na infecção do hepatócito

.

rep.
2018

;

22

:

2951

2963

.

fernandes
mc

,

dillon
lal
Belew
em
bravo
hc

,

mosser

nm
Perfil do transcriptoma duplo de macrófagos humanos infectados à leishmania revela assinaturas distintas de reprogramação

.

mbio

.

2016

;

7
E00027-16

.

fritz
hm
buchholz
kr
chen
x.

,

durbin-johnson
b.

,

dm

,

conrad
pa

,

boothroyd
jc
Análise transcriptômica do desenvolvimento de toxoplasma revela muitas novas funções e estruturas específicas para esporozoitas e oocistos

.

plos um

.

2012

;

7

:

e29998

.

Hon
c.-c.

,

weber
c.

sismeiro

o.

,

PRUX

c.

,

koutero
m.

,

deloger
m.

,

das
S.
agrahari
m.

,

Dillies
M.-a.

,

jagla
b.

et al. .

Quantificação de ruído estocástico de splicing e poliadenilação em Entamoeba histolytica

.

ácidos nucleicos res.
2013

;

41

:

1936

1952

.

siegel
tn

,

hekstra
dr
wang
x.

Dewell

s.

,

Cross
gam
Análise genoma-ampla da abundância de mRNA em Duas fases de ciclo de vida do Trypanosoma Brucei e identificação de locais de emenda e poliadenilação

.

ácidos nucleicos res.
2010

;

38

:

4946

4957

.

yeoh
lm

,

goodman
cd
mollard
v.

,

mcfadden
gi

,

Ralph
SA
Transcriptomia comparativa de gametócitos femininos e masculinos em Plasmodium Berghei e a evolução do sexo em alvejantes

.

genômica BMC

.

2017

;

18

:

734

.

hehl
ab

,

basso
wu

,

lippuner
c.

,

Ramakrishnan
c.

,

Okoniewski
m.

,

walker
ra

,

grigg
me

,

nc

nc

deplazes
p.
A expansão assexual de toxoplasma gondii merozoites é distinta dos tachyzoites e envolve a expressão de famílias genéticas não sobrepostas para anexar, invadir e replicar dentro dos enterócitos felinos

.

genômica BMC

.

2015

;

16

:

66

.

bushell
e.

,

gomes
ar
sanderson
t.
anar
b.
Girling
g.

,

rebanho
c.

,

metcalf

t.

,

modrzynska
k.
schwach
f.
Martin
Re

et al. .

Perfil funcional de um genoma de plasmodium revela uma abundância de genes essenciais

.

Cell

.

2017

;

170

:

260

272

.

mendez
d.

,

gaulton
bento
ap

,

câmaras
j.
de veij
m.
félix
e.

,

magariños
pm

,

mosquera
jf
mutowo
p.
Nowotka
m .

et al. .

Chembl: para a deposição direta de dados de bioensaio

.

ácidos nucleicos res.
2019

;

47

:

d930

D940

.

peña
i.

,

pilar Manzano
m.
cantizani
j.

,

kessler

Alonso-Padilla
j.

,

Barda
ai

,

alvarez
e .

,

Colmenarejo
g.

,

Cotillo
i.

,

Roquero
i.

et al. .

Novos conjuntos compostos identificados a partir de rastreio fenotípico de alta taxa de transferência contra três parasitas Kinetoplastid: um recurso aberto

.

sci. Rep.
2015

;

5

:

8771

.

spangenberg
t.

,

tocas
jn
kowalczyk
p.

,

mcdonald
s.
Wells
tnc
willis
p.
A caixa de malária de acesso aberto: um catalisador de descoberta de drogas para doenças negligenciadas

.

plos um

.

2013

;

8
e62906

.

Haider
n.
padrão de funcionalidade Combinando como uma ferramenta eficiente de pesquisa de estrutura complementar / reação: uma abordagem de código aberto

.

moléculas

.

2010

;

15

:

5079

5092

.

cheng
t.

,

zhao
y.
li
x.
lin
f.

,

xu
y.
zhang
x.

,

li
y.
wang

,

lai
l.
cálculo de coeficientes de partição octanol-água por orientando um modelo aditivo com conhecimento

.

j. Chem. Inf. Modelo.
2007

;

47

:

2140

2148

.

O’Boyle
nm

,

Banck
m.

james

ca
Morley
c.

,

vandermeersch
t.

,

hutchison
gr
Abra Babel: uma caixa de ferramentas química aberta

.

j. ChemInformatics

.

2011

;

3

:

33

.

heller
sr
mcnaught
pletnev
i.

,

stein
s.
tchekhovskoi
d.
Inchi, o IUPAC International Chemical Identifier

.

j. ChemInformatics

.

2015

;

7

:

23

.

lipinski
ca

,

lombardo
f.

,

Dominy
bw
feeney
pj
experimental e abordagens computacionais para estimar a solubilidade e a permeabilidade nas configurações de descoberta e desenvolvimento de medicamentos

.

adv. Deliv Dobra. Rev.
2001

;

46

:

3

26

.

congreve
m.

,

carr
r.
Murray
c.
jhoti
h.
uma “regra de três” para a descoberta de chumbo baseada em fragmentos

.

droga discov. Hoje

.

2003

;

8

:

876

877

.

dalke
a.
chemfp – Formatos e ferramentas rápidos e portáteis de impressões digitais

.

j. ChemInformatics

.

2011

;

3

:

p12

.

rogers
dj

,

tanimoto
tt
um programa de computador para classificar as plantas

.

ciência

.

1960

;

132

:

1115

1118

.

youden
wj
index por classificação Testes de diagnóstico

.

câncer

.

1950

;

3

:

32

35

.

bostock
m.

,

ogievetsky
v.

,

heer
j.
D3 Documentos orientados por dados

.

IEEE Trans. Vis. Compute. Gráfico.
2011

;

17

:

2301

2309

.

probst
d.

,

reymond
j.-l.
smilesdrawer: analisar e desenhando estruturas moleculares codificadas por sorrisos usando JavaScript do lado do cliente

.

j. Chem. Inf. Modelo.
2018

;

58

:

1

7

.

O autor (s) 2019. Publicado pela Universidade de Oxford Press em nome da pesquisa de ácidos nucleicos.
Este é um artigo de acesso aberto distribuído sob os termos do Creative Commons Atribuição Não-Comercial Licença (http://creativecommons.org/licenses/by-nc/4.0/), que permite reutilização, distribuição e reprodução não comercial Em qualquer meio, desde que o trabalho original seja citado adequadamente. Para reutilização comercial, entre em contato com os perió[email protected]

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *