Alvos TDR 6: Discurso de Droga de Condução para Patógenos Humanos através de Intensidade Intensiva de Dados Chemogênicos | Pesquisa de ácidos nucleicos

abstrato

o volume de dados biológicos, químicos e funcionais depositados no domínio público Está crescendo rapidamente, graças ao seqüenciamento de próxima geração e às tecnologias de triagem altamente automatizadas. Esses conjuntos de dados representam recursos inestimáveis para a descoberta de drogas, particularmente para patógenos negligenciados menos estudados. Para alavancar esses conjuntos de dados, a integração inteligente e intensiva de dados é necessária para orientar inferências computacionais em diversos organismos. O recurso Chemogenomics TDR integra dados genômicos de patógenos humanos e organismos modelos, juntamente com informações sobre compostos bioativos e suas atividades anotadas. Este relatório destaca as últimas atualizações sobre os dados e funcionalidades disponíveis em alvos de TDR 6. Com base nos modelos de rede Chemogenomic que fornecem links entre inibidores e alvos, o banco de dados agora incorpora prioridades alvo orientadas por rede e novas visualizações de subcános de rede exibindo produtos químicos e alvos Bairros -similaridade, juntamente com links de bioactividade compostos alvo associados. Os dados disponíveis podem ser navegados e consultados por meio de uma nova interface de usuário, que permitam que os usuários realizem prioridades de alvos de proteína e inibidores químicos. Como tal, os alvos de TDR agora facilitam a investigação da droga que repture contra os alvos do patógeno, o que pode potencialmente ajudar na identificação de metas candidatas para compostos bioativos com alvos anteriormente desconhecidos. Os alvos de TDR estão disponíveis em https://tdrtargets.org

introdução

Negligenciamento de doenças tropicais (NTDs) afetam desproporcionalmente ~1,5 bilhões de pessoas em baixa renda e desenvolvimento países, onde são uma causa principal para os anos de vida perdidos para a deficiência e morte prematura (1). Historicamente, a falta de envolvimento da indústria farmacêutica, em combinação com investimentos limitados em programas de pesquisa pública em países afetados, resultou em uma deficiência de drogas disponíveis para controlar efetivamente a maioria dessas doenças (2). Além disso, as drogas atualmente em uso para tratar essas doenças são muitas vezes comprometidas em termos de custo, dificuldades em administração, eficácia, resistência de drogas ou perfis de segurança.

Discovery de drogas é um processo demorado e caro (3 4). Para os NTDs, em particular, os programas de descoberta de drogas precisam sobreviver por tempo suficiente através de escassez de financiamento generalizadas para torná-lo em testes clínicos subseqüentes (5). Neste contexto, uma abordagem estratégica para a descoberta de medicamentos da NTD é o reposicionamento de drogas (6), que pode ajudar a reduzir os custos, facilitando as aprovações regulamentares em tentativas precoces para as drogas que já passaram por pesquisas clínicas para outras doenças e / ou indicações e fracassados por razões outras do que segurança (6). Além disso, se o escopo da remessa de drogas for ampliado para incluir drogas e compostos bioativos da pesquisa sobre organismos não humanos, também pode levar à identificação de pelo menos novas ferramentas químicas para sondar a função de metas e vias em patógenos humanos. Assim, aproveitando as vastas quantidades de dados disponíveis de programas de pesquisa bem financiados em doenças humanas e organismos de modelos, a paisagem de descoberta de drogas em NTDs recebe um impulso positivo (7).

Estratégias computacionais estão se tornando cada vez mais Essencial na descoberta de medicamentos translacionais, tanto na academia quanto na indústria farmacêutica. A integração inteligente e intensiva dos volumes crescentes de dados gerados durante todas as fases da descoberta de medicamentos já está permitindo que os principais desafios do processo sejam abordados (8). Desde a sua introdução, o banco de dados de alvos do TDR tem sido um recurso confiável para pesquisadores de doenças negligenciadas para acessar dados de quimogênica para priorização alvo de drogas e drogas que repulam em doenças negligenciadas. Introduzido em 2008 (9), este recurso de acesso aberto permitiu aos pesquisadores encontrarem novos alvos de proteína e inibidores químicos, e priorizá-los para ajudar o desenvolvimento de medicamentos para os patógenos da NTD. Os alvos de TDR utilizam conjuntos de dados funcionais genômicos disponíveis publicamente para permitir que os usuários encontrem e priorize os alvos com base em seus conhecimentos da biologia de seu patógeno de interesse e natureza da doença (10,11). Isso é implementado por uma seleção de destino baseada em usuários flexível (usando critérios de filtragem) e classificação (usando ponderação específica de critérios) (12,13).

Aqui, descrevemos as atualizações para os conjuntos de dados subjacentes e funcionalidade no recurso de alvos de TDR, acumulado desde sua publicação anterior em 2012 (13). A nova versão de TDR (V6.1, abreviada TDR6 neste documento) integra informações genômicas específicas do patógeno com dados funcionais (por exemplo,expressão, relacionamentos baseados em ortologia, essencialidade) de uma seleção de organismos, juntamente com dados de compostos bioativos (estrutura química, propriedade e informação de bioactividade / alvo); Tudo o que pode ser consultado e navegado pelo aplicativo da web. Todas as consultas podem ser salvas em um esconderijo pessoal por usuários registrados e publicados através do aplicativo da Web para maximizar as oportunidades de colaboração. Listas priorizadas de alvos podem ser exportadas para mais análises off-line. Detalhes completos de todos os novos recursos podem ser encontrados nas notas de lançamento (https://tdrtargets.org / lançamentos). Este relatório apresenta um passo a passo completo do aplicativo da Web, seus novos recursos e exemplos para ilustrar casos de uso.

Visão geral e organização de alvos de TDR

como nos comunicados anteriores de alvos de TDR, O TDR6 também é organizado em duas seções principais: alvos e compostos. A seção de alvos do banco de dados contém dados genômicos para 20 patógenos humanos, e permite que os usuários executem consultas e prioridades de alvos de proteína com base em vários recursos e dados relevantes para a descoberta de drogas (ver Tabela 1). A seção de compostos do banco de dados contém informações sobre > 2 milhões de compostos bioativos, e permite consultas com base nas propriedades químicas dos compostos e suas bioatividades anotadas (ver Tabela 2).

tabela 1.

Consultas de destino disponíveis em alvos de TDR

consulta.	patógenos para os quais os dados estão disponíveis.	Tipos de dados disponíveis para consultar.
nomes & Anotações	Todos	Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
			Características de proteína	Todos	MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais	todos	disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica	plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii	Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas	Todos	Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade	c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei	Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino	schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum	dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
	Tudo	Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos	Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas	Todos	Alvos de filtro com base em publicações disponíveis

grupo de consulta.	patógenos para os quais os dados estão disponíveis.	Tipos de dados disponíveis para consultar.
nomes & Anotações	Todos	Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
			Características de proteína	Todos	MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais	todos	disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica	plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii	Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas	Todos	Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade	c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei	Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino	schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum	dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
	Tudo	Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos	Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas	Todos	Alvos de filtro com base em publicações disponíveis

tabela 1 .

Consultas de destino disponíveis em alvos de TDR

grupo de consulta.	patógenos para os quais os dados estão disponíveis.	Tipos de dados disponíveis para consultar.
nomes & Anotações	Todos	Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
			Características de proteína	Todos	MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais	todos	disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica	plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii	Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas	Todos	Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade	c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei	Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino	schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum	dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
	Tudo	Precedente para modulação química bem sucedida da atividade ou função de destino.Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos	Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas	Todos	Alvos de filtro com base em publicações disponíveis

grupo de consulta.	patógenos para os quais os dados estão disponíveis.	Tipos de dados disponíveis para consultar.
nomes & Anotações	Todos	Antigores GENE e anotações Funcionais (números CE, TERMOS, Domínios de PFAM, Mapeamentos de Caminhos Metabólicos)
			Características de proteína	Todos	MW, ponto isoelétrico, presença de péptido de sinal previsto, segmentos de membrana e âncoras de glicosilfosfatidilinositol (GPI).
Informações estruturais	todos	disponibilidade de estruturas 3D em PDB; Disponibilidade de modelos estruturais em modbase
expressão gênica	plasmodium spp.; Leishmania spp; Trypanosoma spp; Mycobacterium tuberculose; Echinococcus multilocularis; Entamoeba histolytica; Toxloplasma Gondii	Dados de expressão gênica de fases de ciclo de vida de patógeno e / ou condições experimentais que são relevantes para a descoberta de drogas.
Informações filogenéticas	Todos	Alvos de filtro utilizando ‘presentes / ausentes’ simplificados em outros critérios de espécies, com base na informação do grupo Ortólogo . Inclui organismos de modelos (humanos) e outros patógenos relacionados.
essencialidade	c. elegans (modelo para helminths); E. coli (modelo para bactérias); S. cerevisiae (modelo para patógenos eucarióticos); Trypanosoma Brucei; Mycobacterium tuberculose; Toxoplasma gondii; Plasmodium Berghei	Inferência à base de essencialidade de genes nos estágios de ciclo de vida e / ou condições experimentais relevantes para a descoberta de medicamentos. Integrado da interrupção do genoma genoma selecionado (por exemplo, Transposon, CRISPR / CAS) e conjuntos de dados Knockdown (e. RNAI) em patógenos e organismos modelos.
dados de validação de destino	schistosoma mansoni; Leishmania major; Trypanosoma Cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculose; Plasmodium falciparum	dados curados manualmente em credenciais de validação de destino (fenótipos genéticos, químicos e / ou farmacológicos, observados)
	Tudo	Precedente para modulação química bem sucedida da atividade ou função de destino. Resumido em uma pontuação de farmacibilidade calculada a partir do modelo de rede (consulte o texto principal)
Todos	Ensaios bioquímicos disponíveis para proteína Metas (mapeamento com base nos números da CE)
Referências bibliográficas	Todos	Alvos de filtro com base em publicações disponíveis

tabela 2 .

Consultas de compostos disponíveis em alvos de TDR

grupo de consulta.	Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações	nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas	peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
	Busca	Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N)	Bioatividade	Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm)
compostos órfãos	busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas)
Compostos com alvos	compostos que têm informações alvo e ensaios baseados em mecanismo
Pesquisas baseadas em estrutura
semelhança composta	Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta	Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.

grupo de consulta.	Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações	nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas	peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
	Busca	Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N)	Bioatividade	Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm)
compostos órfãos	busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas)
Compostos com alvos	compostos que têm informações alvo e ensaios baseados em mecanismo
Pesquisas baseadas em estrutura
semelhança composta	Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta	Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.

tabela 2.

consultas compostos disponíveis em alvos de TDR

grupo de consulta.	Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações	nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas	peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
	Busca	Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N)	Bioatividade	Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo, IC50 < 5 μm)
compostos órfãos	busca por compostos que têm reportagens de bioactividade em organismo integral ou ensaios de células inteiras, mas não têm informações de meta e mecanismo (órfãos inibidores / drogas)
Compostos com alvos	compostos que têm informações alvo e ensaios baseados em mecanismo
Pesquisas baseadas em estrutura
semelhança composta	Desenhar / colar estrutura ou fragmento de estrutura 2D e procurar compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta	Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.

grupo de consulta.	Tipos de dados disponíveis para consultar.
Pesquisas baseadas em texto
nomes & anotações	nomes ou sinônimos de compostos; Identificadores de banco de dados (por exemplo, putícula, pubchem); Identificadores de chave Inchi e Inchi
Propriedades químicas	peso molecular; LogP Octanol / Coeficiente de Partição de Água; Número de doadores h e aceitadores, número de ligações flexíveis e número de correspondência RO5 (Lipinski)
	Busca	Pesquisa por compostos contendo um número específico ( por exemplo, 3) de átomos definidos (por exemplo, CL, F, BR, N)	Bioatividade	Pesquisa de texto nas descrições de ensaio; Busca numérica por valores em ensaios (por exemplo,IC50 < 5 μm)
órfãos	busca por compostos que têm relatórios de bioactividade no organismo integral ou ensaios de células inteiras, mas não têm informações alvo e mecanismo (inibidores / drogas de órfãos)
Compostos com alvos	encontrar compostos que têm informações alvo e mecanismo ensaios
Pesquisas baseadas em estrutura
semelhança composta	desenhar / colar Composto ou fragmento 2D estrutura e busca compostos semelhantes. A busca é baseada na correspondência de impressões digitais químicas
Subestrutura composta	Desenhar / colar estrutura ou fragmento 2D estrutura e busca por compostos no banco de dados que contêm a consulta fragmento.

novos recursos em Alvos de TDR 6

relatamos recentemente um modelo de rede integrativa (14), onde todos os conjuntos de dados de escala de genoma disponíveis em alvos de TDR (alvos de proteína), informações químicas (compostos bioativos) e suas relações (bioatividade de compostos ensaios baseados em alvo) foram ligados a um gráfico multicamado. No TDR6, este modelo de rede foi atualizado integrando novos conjuntos de dados (descritos abaixo). Este modelo incorpora links entre alvos e compostos bioativos derivados da curativa manual de ensaios de bioactividade publicados (ou seja, links diretos entre alvos e compostos químicos), bem como de relações computadas (links alvo-alvo e links compostos compostos) baseados em Anotações Proteína (Domínios de PFAM, Grupos Ortólogos) e similaridade química. Um aspecto fundamental desses links no modelo de rede multicamada é que eles possibilitam a rápida exploração e visualização do bairro ao redor de alvos selecionados e / ou compostos bioativos. Isso permite que os usuários explorem compostos vinculados a alvos, inspecione a vizinhança química de similaridade em torno de compostos bioativos e visualize esses dados de maneira amigável e abrangente (veja a Figura 1).

Figura 1.

Visualizações de rede esquemática nas visualizações de TDR6 e Sub-Graph: O composto ou as páginas de destino exibem agora uma visualização subgráfica contendo objetos na vizinhança da rede da entidade selecionada. Esses gráficos são construídos a partir de um gráfico de rede complexo de três camadas. Um esquema deste gráfico é apresentado no topo. Ambos os subgrafos de destino e compostos são sempre organizados da seguinte forma: os nós compostos (verdes) são conectados a alvos (laranja = patógenos; cinza = não-patógenos) através de bordas de bioatividade. Esses links retratam resultados positivos (verdes), neutros (cinza) ou negativos (vermelhos). Finalmente, destina a mapa para um conjunto de afiliações funcionais (anotações, nós azuis). No exemplo, o gráfico mostra um conjunto de inibidores conhecidos para uma aciltransferase humana (15). Essas bioatividades (todas positivas) são desenhadas como elos verdes entre os compostos (nós verdes) e o alvo (nós cinzentos para não patogênicos, nós laranja para patógenos). O gráfico destaca as oportunidades de reivindicação para aciltransferases de helmintos (linhas tracejadas, adicionadas manualmente para esta figura), com base em anotações compartilhadas com o alvo humano drodgable conhecido. O nó vermelho na camada de drogas indica o composto selecionado. Os tamanhos dos nó são determinados pelo número de conexões na rede (grau), enquanto as larguras de link de bioactividade (arestas) estão relacionadas ao número cumulativo de evidências experimentais para um determinado par de drogas (número de ensaios).

Visualizações de Schematic em TDR6 e Sub-Graph Visualizações: As páginas compostas ou de destino exibem agora uma visualização subgráfica contendo objetos no vizinhança de rede da entidade selecionada. Esses gráficos são construídos a partir de um gráfico de rede complexo de três camadas. Um esquema deste gráfico é apresentado no topo. Ambos os subgrafos de destino e compostos são sempre organizados da seguinte forma: os nós compostos (verdes) são conectados a alvos (laranja = patógenos; cinza = não-patógenos) através de bordas de bioatividade. Esses links retratam resultados positivos (verdes), neutros (cinza) ou negativos (vermelhos). Finalmente, destina a mapa para um conjunto de afiliações funcionais (anotações, nós azuis). No exemplo, o gráfico mostra um conjunto de inibidores conhecidos para uma aciltransferase humana (15). Essas bioatividades (todas positivas) são desenhadas como elos verdes entre os compostos (nós verdes) e o alvo (nós cinzentos para não patogênicos, nós laranja para patógenos). O gráfico destaca as oportunidades de reivindicação para aciltransferases de helmintos (linhas tracejadas, adicionadas manualmente para esta figura), com base em anotações compartilhadas com o alvo humano drodgable conhecido. O nó vermelho na camada de drogas indica o composto selecionado. Os tamanhos dos nó são determinados pelo número de conexões na rede (grau), enquanto as larguras de link de bioactividade (bordas) estão relacionadas ao número cumulativo de evidências experimentais para um determinado par de drogas (número de ensaios).

Com essas atualizações, o TDR6 agora fornece aos usuários as seguintes funcionalidades: (i) priorizações alvo inteiro-genoma dirigidas pela rede, (ii) exploração de reivindicação de medicamentos; e iii) a exploração de metas candidatas para compostos órfãos. Estes casos de uso são possíveis por um número de recursos baseados em rede pré-computados, como uma nova pontuação de farmacibilidade de rede (NDS). Associando uma métrica quantitativa a metas com base no enriquecimento de compostos bioativos em nós de rede estreitamente conectados, esta pontuação facilita a classificação de metas em grupos de farmacia (DG), que estão disponíveis para usuários em consultas de banco de dados.

o O modelo de rede também é a base para as priorizações prioritárias de rede pré-computadas (NDPS), que podem ser consultadas pelos usuários e também são usadas internamente pelo TDR6 para selecionar alvos conectados e compostos para exibição nas visualizações de rede recém-desenvolvidas (veja abaixo). Quando a partir de um composto de interesse TDR6 usa as prioridades pré-computador das metas candidatas para ajudar os usuários na navegação do espaço-alvo em torno do composto (e vice-versa ao iniciar a partir de um alvo de interesse). Ao fornecer essas métricas e classificações de enriquecimento pré-computado, o banco de dados agora facilita a descoberta de novas associações-alvo de drogas. Além desses novos NDPs pré-computados, os usuários podem priorizar os destinos usando a mesma funcionalidade que nos alvos anteriores TDR lançamentos.

Esta versão também inclui várias atualizações de dados, nomeadamente a inclusão de 22 novos genomas (20 novos patógenos e 2 novos organismos de modelo) e atualizações extensas para dados químicos e de bioatividade entre outros. A interface de usuário aprimorada e versátil, juntamente com as atualizações de dados renovam o compromisso dos destinos de TDR para fornecer uma ferramenta integrada e poderosa para explorar dados genômicos e químicos no contexto de doenças tropicais negligenciadas.

Usando os alvos de TDR 6

H2>

priorizações alvo inteiro

O modelo de rede (14) é a base para a nova pontuação de farmacibilidade, que é uma métrica derivada de rede relacionada ao enriquecimento em compostos bioativos para dado alvo (NDS, “pontuação de drogabilidade de rede”). Os ndss estão disponíveis para todos os organismos de nível 1, que podem ser consultados e usados para consultas de peso para filtrar (dentro ou fora) alvos em pipelines de priorização personalizados definidos pelo usuário. Como explicado ainda nos detalhes da integração de rede, para cada organismo, os alvos foram classificados em cinco grupos de farmacibilidade (DG), do menor (DG1) até a maior pontuação (DG5), de acordo com seu desempenho nas priorizações da rede.

Como nas versões anteriores dos alvos de TDR, os usuários podem combinar diferentes conjuntos de dados simplesmente executando consultas individuais em diferentes tipos de dados e combinando-os na página Histórico (9,10,12,13). Isso é útil quando, por exemplo, os usuários gostariam de incluir tipos de dados adicionais para prioridades baseadas em farmacibilidade, como aqueles que confiam na expressão gênica em estágios de ciclo de vida relevantes, ou aqueles que fornecem informações sobre fitness / letalidade de alvos (essencialidade).

Como exemplo, apresentamos aqui um exemplo de priorização usando o Toxoplasma Gondii como o patógeno de interesse. T. Gondii é um parasita apicomplexan, muitas vezes usado como modelo para investigar a biologia subjacente a várias doenças humanas e animais (15). A estratégia de pesquisa é resumida na Figura 2. A consulta foi iniciada pesquisando todas as metas de T. gondii e filtrando esses alvos com homólogos em humanos (para selecionar apenas alvos específicos do parasita). Em seguida, selecionamos genes essenciais candidatos com base em perfis de fitness durante a infecção de fibroblastos humanos (16); e também os genes selecionados altamente expressos em tachyzoites (estágio replicativo de T. gondii) consultando os genes no top 80-100 percentil da abundância de transcrição do RNaseq (17). Essas seleções foram combinadas com os rankings da droga de rede. Para isso, consideramos genes em grupos 3, 4 ou 5 (DG ≥ 3) (ver Figura 2). A figura mostra todas as consultas e seus resultados como visto na página de histórico, e as operações realizadas ao combinar consultas (Union, Intersection). A lista final de alvos classificados com base nesses critérios foi divulgada e está disponível na seção de alvos de TDR das listas publicadas.

Figura 2.

Target Estratégia de exemplo de priorização para T. gondii. A imagem composta mostra (a) os termos de consulta usados para encontrar alvos de T. gondii que não têm homólogos em humanos, que são altamente expressos na fase de taquyzoite virulento do parasita durante a infecção por células humanas, que provavelmente são essenciais e provavelmente para a pontuação da farmacibilidade da rede. (B) Resumo das consultas executadas na página ‘Targets’, mostrando como essas consultas aparecem na página ‘Histórico’, onde podem ser revisadas e transformadas. Os botões de gerenciamento de consulta em linha permitem ações selecionadas (remover, renomear, exportar) em conjuntos de resultados.(C) Combinações de consulta permitem que os usuários executem a União, interseperem ou subtrair ações em consultas com e entre si. Exemplos de ações de união e interseção são mostradas. (D) As consultas podem ser salvas em um esconderijo privado (meus conjuntos de consulta) de onde podem ser enviados de volta para o espaço de trabalho (para executar operações de consulta adicionais) ou compartilhadas publicamente com outros usuários de destino do TDR (meus conjuntos de consulta de destino publicado).

Figura 2.

estratégia de exemplo de priorização do alvo para T. gondii. A imagem composta mostra (a) os termos de consulta usados para encontrar alvos de T. gondii que não têm homólogos em humanos, que são altamente expressos na fase de taquyzoite virulento do parasita durante a infecção por células humanas, que provavelmente são essenciais e provavelmente para a pontuação da farmacibilidade da rede. (B) Resumo das consultas executadas na página ‘Targets’, mostrando como essas consultas aparecem na página ‘Histórico’, onde podem ser revisadas e transformadas. Os botões de gerenciamento de consulta em linha permitem ações selecionadas (remover, renomear, exportar) em conjuntos de resultados. (C) Combinações de consulta permitem que os usuários executem a União, interseperem ou subtrair ações em consultas com e entre si. Exemplos de ações de união e interseção são mostradas. (D) As consultas podem ser salvas em um esconderijo privado (meus conjuntos de consulta) de onde podem ser enviados de volta para o espaço de trabalho (para executar operações de consulta adicionais) ou compartilhadas publicamente com outros usuários de destino do TDR (meus conjuntos de consulta de destino publicado).

Drug Repurponing Estratégias usando transformações de consulta

A consulta da farmacibilidade no TDR6 permite que os usuários selecionem alvos com inibidores / drogas específicas. As informações sobre alvos com drogas conhecidas vêm da curativa de literatura, enquanto as associações previstas (indiretas) de alvos com inibidores / drogas são obtidas por meio de cálculos de similaridade ou orthologia (para alvos drogáveis conhecidos), ou através de inferências suportadas por rede (14). Todos esses métodos são implementados no TDR6. Assim, quando os usuários filtram um conjunto de genes com base na farmacibilidade, eles limitam a seleção a alvos altamente classificados, que devem fornecer uma rica fonte de oportunidades de reivindicação de drogas.

Para mostrar a utilidade do TDR6 nesta área que mostramos Como procurar por drogas candidatas para reivindicar para o echinococcus multilocularis (o agente causador do ecinococose alveolar). Isto é mostrado na Figura 3. O processo é semelhante ao descrito anteriormente para T. gondii, mas nesta estratégia de consulta não descartamos homólogos humanos, e utilizaram conjuntos de dados C. Elegans Rnai-Letralidade como proxy para essencialidade do nematode. Como resultado, obtivemos uma priorização completa do genoma para E. Multilocularis. Em seguida, aplicando um filtro baseado em farmacibilidade para essa consulta, reduzimos a seleção do gene para um punhado de genes. O usuário pode inspecionar manualmente os alvos selecionados para descobrir quais drogas foram listadas por meio de associações indiretas. As páginas de destino exibirão todos os compostos associados na seção de farmacibilidade, classificadas de acordo com a origem da inferência. Para inferências conduzidas pela rede, a pontuação para cada composto proposta aparecerá tanto como uma lista quanto como um enredo de classificação, para identificar rapidamente os candidatos promissores. Alternativamente, para minimizar a inspeção manual, a lista de genes (isto é, a própria consulta) pode ser facilmente convertida em uma lista de drogas associadas clicando no botão “Converter esses consulta” no topo das páginas de resultados da consulta. Essa funcionalidade fornece uma maneira rápida de começar a criar uma biblioteca de triagem para um conjunto de alvos. As transformações de consulta podem ser baseadas em drogas curadas (drogas conhecidas para um conjunto de alvos), previstos (associações computadas a drogas) ou ambos. Em todas as três abordagens, os inibidores / drogas associados a alvos drogáveis conhecidos são transitivamente associados aos genes da lista. A Figura 3 resume a estratégia de priorização, a conversão de consulta de lista de genes a compostos, e um exemplo da visualização do sub-gráfico disponível na página composta de um acerto de repaturação. Atualmente, essas conversões são executadas em segundo plano e os resultados aparecem na seção Histórico do site quando concluídas (os usuários também são alertados por e-mail).

Figura 3.

Droga Repurposição Oportunidades para E. Multilocularis usando transformações de consulta. Um regime de priorização alvo para o Echinococcus multilocularis dependendo de inferência baseada em ortologia e drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) lista inicial de alvos priorizados. (C) Qualquer lista de destino pode ser “transformada” em uma lista de seus medicamentos associados, usando qualquer um dos métodos de links compostas disponíveis (consulte o texto principal). (D) Lista resultante de compostos bioativos. (E) Exemplo de visualização do sub-gráfico de rede de um composto selecionado, mostrando links de bioactividade ativos e inativos. Os compostos (nós verdes) são conectados a metas de patógeno (laranja) de acordo com registros de bioactivity (verde = ativo; vermelho = inativo, consulte o texto principal para os limites de atividade).Alvos, por sua vez, estão conectados (links cinzentos) a afiliações funcionais (nós azuis). A renderização do sub-gráfico fornece dicas visuais sobre como o alvo inicial de E. Multiocularis é conectado com o composto selecionado na rede.

Figura 3.

Droga que repture oportunidades para E. MULTILOCULARIS usando transformações de consulta. Um regime de priorização alvo para o Echinococcus multilocularis dependendo de inferência baseada em ortologia e drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) lista inicial de alvos priorizados. (C) Qualquer lista de destino pode ser “transformada” em uma lista de seus medicamentos associados, usando qualquer um dos métodos de links compostas disponíveis (consulte o texto principal). (D) Lista resultante de compostos bioativos. (E) Exemplo de visualização do sub-gráfico de rede de um composto selecionado, mostrando links de bioactividade ativos e inativos. Os compostos (nós verdes) são conectados a metas de patógeno (laranja) de acordo com registros de bioactivity (verde = ativo; vermelho = inativo, consulte o texto principal para os limites de atividade). Alvos, por sua vez, estão conectados (links cinzentos) a afiliações funcionais (nós azuis). A renderização do sub-representa fornece dicas visuais sobre como o alvo inicial de E. Multilocularis é conectado com o composto selecionado na rede.

Exploração de compostos órfãos

As atividades dos compostos extraídos da literatura por curação aparecem na forma de ensaios baseados em alvo (link direto ao alvo) ou na forma de ensaios de base ou organismo integral. Na ausência de outras informações, essas últimas classes de ensaios não fornecem pistas para o alvo ou mecanismo de ação dos compostos. Durante o processo de atualizações de dados químicos em TDR6, identificamos compostos com efeitos fenotípicos relatados no organismo inteiro ou nos ensaios baseados em células, com base em suas classificações quimblicas. Esta informação foi utilizada para identificar os compostos ‘órfãos’ ativos contra um patógeno particular em exibições primárias ou secundárias à base de células, mas para as quais não há um ensaio baseado em alvo.

Os compostos órfãos no TDR6 podem ser Procurou qualquer espécie com dados de triagem fenotípicos disponíveis, dentro da página de pesquisa compostos. Isso permite uma maneira rápida de alavancar dados de ensaios de alta taxa de transferência, permitindo que os usuários iniciam suas prioridades de compostos com atividade conhecida contra um patógeno de interesse.

O modelo de rede integrado no TDR6 também é útil para identificar candidato alvos para compostos órfãos. Conforme descrito na publicação original (14), a vizinhança de similaridade química computada em torno de um composto órfão selecionado pode fornecer links indiretos a um ou mais alvos. Usando esta estratégia, realizamos prioridades alvo para todos os compostos órfãos no TDR6. Estas priorizações compostas orientadas à rede pré-executadas estão disponíveis para todos os organismos para os quais os dados de triagem fenotípicos estão disponíveis. Resumos globais mostrando todos os compostos órfãos para estes organismos estão ligados a partir da página “Resumo de dados” (consulte https://tdrtargets.org / datasummary e clique nas espécies de interesse). Um exemplo de priorização baseada em composto órfão para T. cruzi é mostrada na Figura 4. Considerando que as prioridades que a partir de um único composto estão disponíveis em cada página composto.

Figura 4.

Exploração de metas candidatas para compostos de órfãos de Trypanosoma Cruzi. O enredo resume a priorização alvo acionada por rede para compostos órfãos ativos contra T. Cruzi. Todas as sequências de codificação de proteína no genoma de T. Cruzi (alvos candidatos) são organizadas no eixo X. Os pontos de dados no enredo correspondem a associações de fármacos-alvo marcados pelo algoritmo (pontuação plotada no eixo Y). Como exemplo, destacamos dois alvos putativos para duas drogas diferentes (conforme exibido na página de resumo de dados T. Cruzi). Parcelas semelhantes estão disponíveis on-line para organismos de nível 1 em TDR6 (ligado a partir da página de resumo de dados).

Figura 4.

Exploração de alvos candidatos para compostos de órfãos de Trypanosoma Cruzi. O enredo resume a priorização alvo acionada por rede para compostos órfãos ativos contra T. Cruzi. Todas as sequências de codificação de proteína no genoma de T. Cruzi (alvos candidatos) são organizadas no eixo X. Os pontos de dados no enredo correspondem a associações de fármacos-alvo marcados pelo algoritmo (pontuação plotada no eixo Y). Como exemplo, destacamos dois alvos putativos para duas drogas diferentes (conforme exibido na página de resumo de dados T. Cruzi). Parcelas semelhantes estão disponíveis on-line para organismos de nível 1 em TDR6 (ligado a partir da página de resumo de dados).

Atualizações e atualizações de dados

novos dados genômicos em Alvos TDR V6.1

Desde a publicação anterior do banco de dados de destino do TDR (13), vários genomas de patógenos foram adicionados. Uma lista detalhada é fornecida na Tabela 3, bem como on-line na página Resumo de dados TDR6 (https://tdrtargets.org / datasummary).

Tabela 3 .

Resumo de disponibilidade de dados para patógenos de nível superior. Resumo dos dados alvo disponíveis para organismos de nível 1 em alvos de TDR. CDs: sequências de codificação; PFAM: Número de proteínas com domínio (s) de PFAM mapeado; Vá: Número de proteínas com termos mapeados de ontologia genética; CE: Número de proteínas com números de comissão de enzimas mapeadas (CE); Caminhos: Número de proteínas mapeadas para mapas de pathway KEGG; Ortólogos: Número de seqüências mapeadas para grupos ortólogos de Orthomcl. Uma tabela de resumo de dados mais completa está disponível online em https://tdrtargets.org / datasummary

espécie.	CDs.	pfam.	vá.	CE.	vias.	orthologs.
plasmodium falciparum	5349	3322	3551	750	1083	5166
plasmodium vivax	5344	3264	2631	641	806	5207
toxoplasma gondii	7946	4025	3795	772	967	6764
chlamydia trachomatis	887	704	598	269	357	645
mycobacterium leprae	1630	1236	929	628	611	1473
mycobacterium tuberculose	4004	2934	2001	1174	1145	3287
mycobacterium ulcerans	4232	3602	2578	873	1002	3459
trep onema pallidum	1036	791	634	221	335	733
wolbachia endosymbiont de B. malayi	805	628	577	308	382	688
brugia malayi	11316	7042	6368	1278	1787	8424
echinococcus granulosus	10249	6481	5432	854	1965	7109
echinococcus multilocularis	10474	6817	5768	878	2079	7539
loa loa (worm olho)	16292	8071	6774	1539	2207	10484
onchocerca volvulus	12224	3248	2178	246	563	4054
	schistosoma mansoni	12692	7818	7384	1218	1649	10386
leishmania major	8280	4641	4415	1067	1162	8250
Trypanosoma Brucei	10270	5665	5482	1019	1264	9259
trypanosoma cruzi	18639	9908	8572	1495	1495	1735	18140
entamoeba histolytica	8211	4920	4087	645	1094	7692
giardia lamblia	9665	2726	2263	326	514	5977
	tricomonas vaginalis	95600	35474	18435	843	1366	87303

5432

Entamoeba histolytica

espécie.	CDs.	pfam.	vá.	CE.	vias.	orthologs.
plasmodium falciparum	5349	3322	3551	750	1083	5166
plasmodium vivax	5344	3264	2631	641	806	5207
toxoplasma gondii	7946	4025	3795	772	967	6764
chlamydia trachomatis	887	704	598	269	357	645
mycobacterium leprae	1630	1236	929	628	611	1473
mycobacterium tuberculose	4004	2934	2001	1174	1145	3287
mycobacterium ulcerans	4232	3602	2578	873	1002	3459
trep onema pallidum	1036	791	634	221	335	733
wolbachia endosymbiont de B.malayi	805	628	577	308	382	688
Brugia malayi 11316	7042	6368	1278	1787	8424
Echinococcus granulosus 10249	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	5768	878	2079	7539
Loa Loa (verme olho) 16292	8071	6774	1539 2207 10484
Onchocerca volvulus 12224	3248	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania major	8280	4641	4415	1067	1162	8250
Trypanosoma brucei 10270	5665	5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia lamblia	9665	2726	2263	326	514	5977
Trichomonas vaginalis 95600 35474 18435	843	1366 87303

Tabela 3.

Resumo disponibilidade de dados para os melhores patógenos linha. Resumo de dados de destino disponíveis para Tier 1 organismos em Metas TDR. CDs: sequências codificantes; Pfam: número de proteínas com mapeada Pfam domínio (s); GO: número de proteínas com mapeadas termos Gene ontologia; CE: número de proteínas com números mapeadas Comissão Enzyme (CE); Vias: número de proteínas mapeadas para mapas pathway KEGG; Ortólogos: número de sequências mapeadas para grupos OrthoMCL ortólogo. Uma tabela de resumo de dados mais completa está disponível online em https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071

Entamoeba histolytica

3C34827 “ iv id = “0B01674E”” DV ID =” 0B01674E.

V ID = “29971A56991”

5344

2631

887 87 04 04 04 04

ara TepNE

Mycobaacterium 6678 678 678 678 678

5432

Entamoeba histolytica

Espécies.	CDs.	PFAM.	GO.	CE.	Pathways.	ortólogos.
Plasmodium falciparum	5349	3322	3551	750	1083	5166
5344	3264	2631	641	806	5207
Toxoplasma gondii	7946	4025	3795	772	967	6764
Chlamydia trachomatis	887	704	598	269	357	645
Mycobacterium leprae 1630	1236	929	628	611	1473
Mycobacterium tuberculosis	4004	2934	2001	1174	1145	3287
Mycobacterium ulcerans	4232	3602	2578	873	1002	3459
Trep onema pallidum	1036	791	634	221	335	733
Wolbachia endosymbiont de B.Malayi	588	588	388
Brugia malayi 11316	7042	6368	1278	1787	6481	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	779	758
Loa Loa (verme do olho)	1509 071	1559 071	1539 071	679 071	15371	1539 071	1539 071	1559 071	2207	10484	2378	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania major	8280	4641	4415	1067	1162	8250			5480 5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia Lambia	2263	2263	2735 363	272	3635 363	2235 363	514	5977
Trichomonas vaginalis 95600 35474	18435	843	CDs.	pfam.	vá.	CE.	Pathes.	orthoogs.
lasmoodium	3322 551				7166	Plasmox vivax	641	606 06 06 06 06 5207
Toxoplasma gondii	7946	4025	3795	772	967 6764	598	269	Mycobacterium	1630	1236 p2 673	673
Mycobaacterium TDULESIS página	1174	1174	1174	1174	3287	873	1002	3459
Trep. Onema pallven 1036	61 33 33 33 33 33 33	633
wolbia indussibriant de bmalayi	805	628	577	308	382	688
Brugia malayi 11316	7042	6368	1278	1787	8424
Echinococcus granulosus 10249	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	5768	878	2079	7539
Loa Loa (verme olho) 16292	8071	6774	1539 2207 10484
Onchocerca volvulus 12224	3248	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania major	8280	4641	4415	1067	1162	8250
Trypanosoma brucei 10270	5665	5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia lamblia	9665	2726	2263	326	514	5977
Trichomonas vaginalis 95600 35474 18435	843	1366 87303

Dada a diversidade de organismos Integrado Metas TDR e, consequentemente, a variedade de fontes de dados necessário para cobrir toda a genomas; esforço substancial tem sido posta em padronizar os dados de análise e recuperação de informação a partir do genoma destes organismos. A maior parte do genoma completo EuPathDB Foram obtidos a partir de (18), GenBank (19), GeneDB (20), Wormbase parasita (21), GenoList (22) ou Mycobrowser (23). Uma descrição completa das fontes de genoma e dada na Tabela anterior Suplementar S1. Para atualizar os dados para organismos presentes na versão anterior de Metas TDR genes codificadores de proteínas de liberação atual de genomas eram ou mapeado para genes existentes nas Metas TDR, ou não entraram os novos registros. O mapeamento algoritmo utiliza uma combinação de condições para rastrear identificadores Gene através das versões e manter a identidade de genes: as somas de verificação de sequência correspondente (utilizando valores de 128 bits hash gerado pelo algoritmo MD5), nomes de gene ou identificadores e explosão (24) SE ou combinações perfeitas são encontrados. Depois de actualização de registos, o pipeline calcula propriedades físico-químicas que utilizam Pepstats (25), verifica se há domínios transmembranares com TMHMM (26), os péptidos de sinal com SignalP (27), e glicosilfosfatidilinositol Os pontos de ancoragem, usando PredGPI (28). O algoritmo descarta todas as sequências codificadoras não, os mais bem quaisquer pseudogenes, para evitar enganosa anotações e minimizar falsos pressupostos durante os fluxos de trabalho de priorização. A maioria dos TDR6, mencionado acima todas as tarefas de genoma integração e atualização foram quebradas no fluxo de trabalho automatizado para facilitar mais rápido atualizações em lançamentos futuros. Um esquema da actualização e Pipeline algoritmo mostrado na Figura Suplementar anterior S1. O Pipeline também automatiza o cálculo de anotações usando estratégias individuais ad hoc para diferentes anotações, contando com serviços web e APIs (apareceu no Kaas (29) Serviço de proteínas de mapeamento para Vias Metabólicas e ao Número da CE Classificação de enzimas, ou a OrthoMCL banco de dados e a ferramenta (30,31) para os grupos de mapeamento ortólogo a proteínas. a Pipeline também depende de computação contra bases de dados instalados localmente apareceu mais InterPro (32), utilizando InterProScan (33) para identificar domios proteicos Pfam () e mapear termos para vocabulários controlados e classificações (termos GO). recursos adicionais apareceu mais 3D estruturas e modelos estruturais foram obtidos a partir do Protein Data Bank (34), utilizando serviços web e baixado do site Modbase FTP (35), respectivamente.

Também o número de conjuntos de dados funcionais principais foram integrados nesta versão, incluindo (i) os conjuntos de dados transcriptomic que fornecem evidência de expressão de genes em estágios do ciclo de vida ou condições experimentais que são relevante para Drug Discovery (36-47) e (ii) os conjuntos de dados essencialidade derivado de dois agentes patogénicos Apicomplexan (P. berghei e T. gondii) (16,48), que fornecem informação de Estratégias Vital AUXILIAR prioritização.

Actualizações de dados Chemical

Para os compostos bioactivos, também, os fluxos de trabalho de actualização de dados foram automatizados para esta versão.A maioria dos compostos bioativos foi recuperada da libertação química do 24º (49), que contém alguns conjuntos de dados adicionais, como os de caixas químicas específicas de patógeno – caixas GSK Kinetoplastid (50), caixa de patogénio MMV (51). O processo de integração começa a partir de descrições da molécula (2D) no formato SDF, a partir do qual calculamos todas as impressões digitais compostas necessárias (necessárias para as pesquisas de similaridade / subestrutura composta) usando o CheckMol (52). O pipeline também calcula propriedades químicas adicionais, como o coeficiente de partição de octanol / água do logp e outros descritores estruturais usando XLOGP3 (53), e o Open Babel Tools Obprop e OBrotâmero (54). Outros dados relevantes foram obtidos ou calculados diretamente da estrutura composta, como os identificadores Inchi e Inchikey (55) usado para rastreamento composto; e outras regras padrão usadas em química medicinal e descoberta de drogas, como a regra de Lipinski de cinco (56) e a regra relacionada de três (57).

Após a integração em alvos de TDR, todos os compostos foram sujeitos Para todos os cálculos de comparação de similaridade química, utilizando ChemFP (58), que produz medidas de similaridade em pares com base no índice / distância do Tanimoto (59). Além disso, nós calculamos um mapa global (todo versus) de relacionamentos de subestrutura entre os compostos no banco de dados (x é uma subestrutura de Y; Y é uma superestrutura de X). Sabendo que o problema de encontrar os subgrafos comuns máximos entre moléculas é computacionalmente difícil, aplicamos uma abordagem heurística para encontrar subestruturas. O algoritmo obtém primeiro um subconjunto de possíveis moléculas candidatas, fazendo uso de impressões digitais calculadas anteriormente. Os candidatos devem ter impressões digitais correspondentes com a molécula de assunto. Uma vez obtida uma lista de candidatos, é feita a determinação de substrutura de atom-by-atom completo, é feita usando matchmol (52). Os dados disponíveis para compostos e as consultas que podem ser executadas em cada tipo de dados são resumidas na tabela 2. O peso molecular (MW) e a distribuição da área de superfície polar (PSA) para todos os compostos no banco de dados é mostrado na figura suplementar S2. / p>

curadoria e integração de dados de bioactividade

Como com compostos químicos, a maioria das bioactividades integradas em alvos de TDR vêm diretamente das fontes de dados a montante (por exemplo, químicas). Ao integrar dados de bioactividade, preservamos tanto a anotação do ensaio (por exemplo, a ensaio de redução de motilidade in vitro contra Brugia Malayi microfilária a 10 μm ‘) e o valor numérico e unidades associadas a atividades compostas (por exemplo, ‘80% de inibição’, ‘80% μm IC50 ‘, ’10 nm mic’), que são todos os campos pesquisáveis. Além disso, e para facilitar as consultas de usuário, as bioactividades relatadas foram usadas para agrupar compostos ensaiados em classes “ativas” ou ‘inativas’. No entanto, para minimizar o efeito de usar fronteiras duras ao redor de limiares arbitrários e aumentar a separação entre classificações ativas / inativas, também definimos uma área cinza indeterminada. Assim, os compostos marcando logo abaixo de um limiar arbitrário não são considerados inativos para fins de consulta e visualização.

Nem todos os tipos de atividade foram passíveis de classificação, no entanto. Apesar dos esforços na padronização desses dados de atividade, a interpretação das atividades dos compostos nessa escala é difícil, pois muitas vezes dependem do tipo de ensaio particular, as unidades relatadas e as condições específicas em que cada ensaio foi conduzido. No entanto, um conjunto significativo de tipos de ensaio pode ser automaticamente classificado em categorias ativas / indeterminadas / inativas com base em limiares de atividade. Para isso, todos os tipos de ensaio com relatórios > 100 000 (ver Figura suplementar S3 para uma atividade por ensaio de distribuição do composto) foram considerados para auditoria de atividade, embora apenas ensaios baseados em concentração (como IC50, KI ou Potência) foram considerados robustos o suficiente para tal determinação, porque os ensaios baseados em porcentagem (como% de atividade,% de atividade residual ou $ inibição) eram ambíguos em relatórios de bioatividade. Os limites usados para classificar as atividades para cada tipo de ensaio podem ser encontrados na Tabela 4, e a distribuição de compostos nessas classes de atividade é resumida na Figura 5.

Tabela 4.

Tipos de ensaio e limites de atividade usados para determinação da tag de atividade: apenas os ensaios baseados em concentração foram usados para determinar as tags de atividade. As atividades relatando menos do que o valor máximo admitido para positivos foram consideradas interações ativas (+), enquanto aquelas maiores do que o “valor mínimo admitido para negativos” foram considerados inativos (-). Qualquer atividade relatada entre esses dois valores foi considerada como indeterminada (0)

Ensaio do tipo.	padrão da unidade.	Máximo valor admitido para os ativos.	valor admitido mínimo para inactivos.
AC50	20000	100000
EC50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potência	nm	20000	100000

Ensaio.	padrão da unidade.	Máximo valor admitido para os ativos.	valor admitido mínimo para inactivos.
AC50	20000	100000
EC50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potência	nm	20000	100000

Tabela 4.

Tipos de ensaio e limites de atividade usados para determinação da tag de atividade: Somente os ensaios baseados em concentração foram usados para determinar as tags de atividades. As atividades relatando menos do que o valor máximo admitido para positivos foram consideradas interações ativas (+), enquanto aquelas maiores do que o “valor mínimo admitido para negativos” foram considerados inativos (-). Qualquer atividade relatada entre esses dois valores foi considerada como indeterminada (0)

Ensaio do tipo.	padrão da unidade.	Máximo valor admitido para os ativos.	valor admitido mínimo para inactivos.
AC50	20000	100000
EC50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potência	nm	20000	100000

Ensaio.	padrão da unidade.	Máximo valor admitido para os ativos.	valor admitido mínimo para inactivos.
AC50	20000	100000
EC50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potência	nm	20000	100000

Figura 5.

Misturas de distribuição e evidência de atividade entre dados: (a) Diagrama de Venn mostrando a distribuição de valores de bioactividade nas classes ativa, inativa e indeterminada em TDR6 (ver texto principal para detalhes) . Os casos de contagem de interseções em que o mesmo medicamento tem diferentes resultados de atividade contra o mesmo destino. Exemplos desses casos são fornecidos em painéis B por F (IDs compostas representam identificadores TDR6). (B) Actividade de C329137 (uma hidroxi-benzamidina) contra o diidrofolato bifuncional de P. falciparum, sintase de redutilo-timidilato. (C) Exemplo de registros positivos para inibidores da aciltransferase humana. (D) Exemplo de atividades negativas e neutras para compostos TriPhenylcarbinol e benzo-hidrol, respectivamente. Finalmente, ambos positivos (e) e negativos (f) podem ser misturados com evidências indeterminadas, como mostrado para C2164865 testado contra a colinesterase a cavalo e C306882 testado contra a hidrolase de nucleotídeo recombinante P. falciparum de 5′-trifosfato, respectivamente.

Misturas de distribuição e evidência de atividade entre dados: (a) Diagrama de Venn mostrando a distribuição de valores de bioactividade no ativo aulas inativas e indeterminadas em TDR6 (ver texto principal para detalhes).Os casos de contagem de interseções em que o mesmo medicamento tem diferentes resultados de atividade contra o mesmo destino. Exemplos desses casos são fornecidos em painéis B por F (IDs compostas representam identificadores TDR6). (B) Actividade de C329137 (uma hidroxi-benzamidina) contra o diidrofolato bifuncional de P. falciparum, sintase de redutilo-timidilato. (C) Exemplo de registros positivos para inibidores da aciltransferase humana. (D) Exemplo de atividades negativas e neutras para compostos TriPhenylcarbinol e benzo-hidrol, respectivamente. Finalmente, ambos positivos (e) e negativos (f) podem ser misturados com evidências indeterminadas, como mostrado para C2164865 testado contra a colinesterase a cavalo e C306882 testado contra a hidrolase de nucleotídeo recombinante P. falciparum de 5′-trifosfato, respectivamente.

A liberação química 24.º conta com mais de 15,2 milhões de bioactividades relatadas, das quais apenas cerca de 6 milhões correspondiam a relacionamentos envolvendo drogas e metas de proteína (proteínas únicas, famílias proteicas e complexos proteicos, com ~ 93% sendo proteínas únicas). Outras bioactividades restantes no banco de dados foram relatórios para uma ampla variedade de metas não proteicas, como células inteiras (3,6m), organismos inteiros (2,2M), tecidos (83k) e macromoléculas não-peptídicas (85K) ou pequenas moléculas (< 100). Estes não foram usados na construção de rede, porque a rede é de proteína (isto é, alvo) centrada. A Figura 5 também mostra algumas visualizações de rede de exemplo que descrevem como o TDR6 exibe essas bioactividades.

Integração de características derivadas de rede: farmacibilidade e priorizações

Como mencionado acima, dados genômicos, anotações genéticas, Compostos químicos e interações genéticas-fármacas foram integrados a uma complexa orientada para a reivindicação de medicamentos, conforme descrito em Berenstein et al. (14). A rede foi usada para calcular uma pontuação de farmacibilidade de rede (NDS), para todos os alvos em patógenos prioritários (Tier 1). O NDS está relacionado à chance de encontrar compostos bioativos nas próximas proximidades do gráfico de rede de um determinado alvo (intervalo é de 0 a 1). O algoritmo foi descrito anteriormente em detalhes (14), mas brevemente, com base em um teste de excesso de representação de proteínas drogáveis conhecidas anotadas, calcula uma pontuação de relevância (RS) para cada categorias de grupos de domínio e ortologia da PFAM. A pontuação do NDS para um determinado alvo resulta de uma soma cumulativa ponderada sobre os Rs de todas as contribuições de afiliação comuns ao nó alvo e proteínas vizinhas ligadas a compostos ativos.

Para facilitar a interpretação das pontuações do NDS que realizamos um Avaliação estatística para identificar grupos de farmacilidade distintas (DG) com base em dois tipos de limites que ajudam a classificar as previsões de farmacibilidade a zonas de confiança. Estes são ilustrados na Figura 6. Por um lado, enquanto todos os alvos de pontuação não zero têm algum grau de conectividade a alvos conhecidos-medicamentosos, um Baixo NDS sugere que essas conexões não são relevantes para avaliação da farmacibilidade. Assim, um corte-ruído (uma linha de base calculada como 5 vezes o valor de 0,25 percentil da distribuição completa do NDS) é considerado para identificar alvos de baixa pontuação. O segundo limite é derivado do índice máximo de J de Yeden (60), que é calculado como a pontuação na qual tanto a especificidade como a sensibilidade são ideais (melhor sensibilidade sem comprometer a especificidade e vice-versa). Este valor só pode ser calculado para patógenos com positivos verdadeiros (alvos drogáveis conhecidos). Um mínimo arbitrário de 10 verdadeiros positivos foi considerado suficiente para a determinação de corte de você. Para outros patógenos, sem essas informações, um corte global de Youden foi usado (calculado usando todos os verdadeiros positivos da rede). Os correspondentes grupos de farmacilidade são, portanto,: DG1 para alvos com valores do NDS variando de 0 ao limiar de ruído; DG2 para alvos com valores de NDS que vão desde o limiar de ruído até o corte do yenden; e DG 3, 4 e 5 com valores de NDS que são 1-, 10- e 100 vezes acima do corte do yenden. Por conseguinte, estes últimos grupos contribuem para os alvos mais prováveis drogáveis. A Figura 6 mostra um exemplo estático de uma priorização orientada pela rede para os ulceranos Mycobacterium (que não possui alvos com compostos conhecidos na liberação atual). Todas as prioridades para os alvos de TDR Os organismos prioritários podem ser vistos on-line na página Resumo de dados para cada espécie (consulte https://tdrtargets.org / datasummary, clicando na espécie de interesse). Nesse caso, as parcelas on-line são interativas e podem ser ampliadas e exportadas. Nos casos em que há alvos com compostos bioativos conhecidos para as espécies, estes são mostrados distintamente no enredo.

Figura 6.

Priorização do alvo do genoma para Ulcerans Mycobacterium: alvos candidatos no genoma do M. ulcerãs foram classificados por seus NDS (pontuação de drogabilidade de rede, ver texto principal).O lote descreve todos os alvos do genoma (no eixo X), juntamente com sua correspondente pontuação NDS (no eixo Y). Os pontos vermelhos correspondem aos 10 alvos classificados Top-10, com rótulos indicando o nome e o produto do gene. Navegando a priorização inteira do genoma a partir do resumo de dados, o usuário pode acessar uma página do gene clicando nela no enredo de priorização. Um exemplo de subgraph da família de genes da EMBA / EMBB / EMBC é mostrado (como visto em suas páginas genéticas correspondentes). A figura também exibe zonas de confiança, DG1 (vermelho): delimitado por zero e corte de ruído; DG2 (amarelo): entre o ruído e o endoff do Yeden; e dg3-5: com pontuações superiores ao ponto de endoff.

Figura 6.

Genoma inteiro acionado por rede Priorização do alvo para Ulcerans Mycobacterium: Os alvos candidatos no genoma do M. ulcerans foram classificados por seus NDS (pontuação de drogabilidade de rede, ver texto principal). O lote descreve todos os alvos do genoma (no eixo X), juntamente com sua correspondente pontuação NDS (no eixo Y). Os pontos vermelhos correspondem aos 10 alvos classificados Top-10, com rótulos indicando o nome e o produto do gene. Navegando a priorização inteira do genoma a partir do resumo de dados, o usuário pode acessar uma página do gene clicando nela no enredo de priorização. Um exemplo de subgraph da família de genes da EMBA / EMBB / EMBC é mostrado (como visto em suas páginas genéticas correspondentes). A figura também exibe zonas de confiança, DG1 (vermelho): delimitado por zero e corte de ruído; DG2 (amarelo): entre o ruído e o endoff do Yeden; e DG3-5: com pontuações superiores ao corte de vocês.

Estas priorizações orientadas por rede podem funcionar nos dois sentidos. Ao partir de um composto de interesse, o algoritmo pode priorizar os alvos, usando a semelhança ponderada de vizinhos químicos para alvos iniciais de candidatos. E ao iniciar a meta de interesse, pode priorizar os compostos, usando alvos vizinhos dramínsos conectados e depois após links ponderados para inibidores / drogas candidatos. Pontuações pré-computadas para compostos e destinos são usados internamente por TDR6 e estão no núcleo de transformações de consulta baseadas em rede.

Visualizações de sub-gráfico de rede e atualização de interface de usuário

a rede sub -Graphs para compostos e alvos (e suas respectivas pontuações do NDS) podem ser navegadas a partir do aplicativo da Web usando um medicamento ou um alvo como ponto de partida para obter dicas para drogas não testadas ou alvos drogáveis, respectivamente. Através de visualizações recém-desenvolvidas, os usuários podem verificar os bairros de rede em torno de drogas e metas nas páginas correspondentes. Listas de interações putativas derivadas de rede também podem ser exploradas em formato tabular sob a “farmacilidade” (para alvos) e “alvos conhecidos e previstos” (para drogas) seções.

Essas visualizações são conduzidas por D3.js (61) Implementando layouts forçados para visualizações do sub-gráfico. No painel Subgráfico D3, os usuários podem realizar pesquisas de nó dentro do gráfico (identificadores de destino), além de alternar a visibilidade dos destinos em uma espécie por maneira de espécies, e personalizar a opacidade dos nós. Reunijos, esses novos recursos fornecem uma visualização clara e abrangente da proximidade de metas e compostos, permitindo que os usuários manipulem os gráficos enquanto exploram os dados.

A interface do usuário (UI) e as ferramentas disponíveis Para a reivindicação de drogas e a priorização alvo passaram por uma grande atualização. Em primeiro lugar, a interface do usuário foi redesenhada nos padrões do W3C para obter uma aplicação mais saudável e escalável. Nós integramos o bootstrap (https://getbootstrap.com/) e jQuery (https://jquery.com) Estruturas no desenvolvimento e design do aplicativo da Web TDR6 e na frente- funcionalidade final. Para consultas de estrutura compostas, licenciamos e implementamos o aplicativo de desenho químico da Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Registros tabulados dentro das páginas de destino e drogas agora usam o plugin JavaScript Javay DataTable (https://datatables.net) para criar facilmente paginações, filtragem e classificação de funcionalidades. Finalmente, representações 2D compostas são agora geradas automaticamente usando uma implementação do módulo JavaScript do SmilesDrawer (62).

Disponibilidade comercial de compostos

Um aspecto importante ao priorizar os compostos para testes no laboratório , é a disponibilidade deles. No TDR6 agora exibimos informações sobre a disponibilidade comercial de compostos. Atualmente, iniciamos esse recurso vinculando com o Molport (um mercado químico on-line que fontes compostos de grandes fornecedores) e mostram usuários uma pista visual em páginas compostas que dão uma rápida indicação de se o composto está em estoque ou pode ser feito para encomendar . Como a disponibilidade comercial de compostos é atualmente implementada em TDR6 na forma de consultas assíncronas contra o Molport, neste momento esse recurso está disponível apenas no modo de navegação (não em consultas).No entanto, os usuários podem priorizar os compostos usando qualquer uma das estratégias de consulta disponíveis no TDR6 e finalizar suas seleções compostas inspecionando os compostos manualmente para a disponibilidade comercial.

Discussão e instruções futuras

os novos dados , a interface e a funcionalidade do TDR6 fornecem aos usuários com navegação e visualização aprimoradas de metas e compostos.

O modelo de rede atual conecta alvos através da afiliação de entidades (proteínas) a conceitos de anotação (domínios de PFAM). Estes foram selecionados com base em sua ampla cobertura e facilidade relativa de cálculo. Complementando estes conceitos com outros critérios importantes para a validação de meta de medicamentos (essencialidade, expressão em etapas de ciclo de vida relevantes) podem ser feitas por usuários com as ferramentas e funcionalidades fornecidas pelo TDR6, mas no futuro eles podem ser construídos no próprio modelo de rede subjacente, em menos para alguns organismos passíveis de avaliação experimental genoma.

Várias melhorias-chave são necessárias para manter os alvos de TDR relevantes para a comunidade de cientistas que trabalham em doenças tropicais. Integração de metabólitos naturais e conectar essas pequenas moléculas a outros compostos bioativos por meio de subestruturas compartilhadas ou por similaridade química será um foco importante no futuro. Isso permitirá navegar pelo gráfico de destinos de drogas usando os conceitos de reações bioquímicas, que naturalmente conectam enzimas não ortólogas através de seus substratos / produtos e cofatores compartilhados.

Finalmente, como já mencionado anteriormente (13), Ainda há uma grande lacuna de curação que precisa ser preenchida. Muitos compostos bioativos foram testados pela comunidade de pesquisadores que trabalham em doenças tropicais negligenciadas. No entanto, muitos desses ensaios e resultados são relatados em periódicos fora dos principais periódicos de química medicinal e, portanto, são perdidos por grandes esforços de curação, como o LED por quimbles (49). Curação e integração destes dados ausentes (incluindo dados negativos!) Deve ser uma prioridade para a comunidade, pois economizaria tempo e recursos valiosos.

Dados suplementares

Os dados suplementares estão disponíveis Na Nar Online.

Agradecimentos

Os autores gostariam de agradecer Matthew Berriman e Magdalena Zarowiecki (Instituto Wellcome Trust Sanger) para compartilhar dados e anotação de genoma de pré-liberação do Echinococcus para inclusão no TDR Alvos; e Ben Webb e Andrej Sali (Universidade da Califórnia São Francisco) para o cálculo de modelos 3D para genomas patógenos de nível 1 em alvos de TDR. L.u.l., A.B. e s.v. eram ou são apoiados por bolsas do Conselho Nacional de Pesquisa (Conicet, Argentina). A.C. e F.A. são membros da carreira de pesquisa do Conselho Nacional de Pesquisa (Conicet, Argentina). PM. Gostaria de reconhecer uma comunhão da Comissão Universitária (UGC), na Índia.

Financiamento

Glaxosmithkline Argentina e a Agência Nacional para a Promoção da Ciência e Tecnologia, Argentina (ANPCYT); Indo-Argentina Projecto de cooperação bilateral (financiamento conjunto do Departamento de Ciência e Tecnologia da Índia (DST) e Ministério da Ciência e Tecnologia Argentina (Metcyt). Financiamento para taxa de acesso aberto: Fondo Para La Investigación Científica Y Tecnológica.

Conflito de juros. Nenhum declarado.

Notas

Apresentar: Ariel J Berenstein, Instituto Multidisciplinario de Investigaciones en Patológicos Pediáticas (IMIPP), CONICET-GCBA, Laboratorio de Biología molecular, División Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

hotez

Molyneux

fenwick

kumaresan

Sachs

savioli

Controle de doenças tropicais negligenciadas

n. Engl. J. med.

2007

;

357

1018

–

1027

trouiller

olliaro

torreele

orbinski

laing

ford

Desenvolvimento de drogas para doenças negligenciadas: um mercado deficiente e um público Falha na política de saúde

Lancet North AM. Ed.

2002

;

359

2188

–

2194

hughes

rees

kalindjian

Philpott

Princípios da descoberta precoce de drogas

br. J. Pharmacol.

2011

;

162

1239

–

1249

adams

brantner

Estimando o custo do novo desenvolvimento de drogas: é realmente US $ 802 milhões

Health Aff. (Milhawood)

2006

;

420

–

428

wyatt

gilbert

Leitura

fairlamb

validação de destino : Vinculando alvo e propriedades químicas ao perfil desejado do produto

curr. Topo. Med. Chem.

2011

;

1275

–

1283

Farha

brown

droga Repurposição para descoberta antimicrobiana

nat. Microbiol.

2019

;

565

–

577

hernandez

soeung

zorn

ashoura

Mottin

andrade

caffrey

de Siqueira-Neto

ekins

alta taxa de transferência e repaturação computacional para doenças negligenciadas

Pharm. Res.

2018

;

wooller

benstead- Hume

chen

Ali

Pearl

FMG

bioinformatics na descoberta de drogas translacionais

biosci. Rep.

2017

;

doi: 10.1042 / bsr20160180

agüero

al -Lazikani

Aslett

berriman

Buckner

campbell

Carmona

Carruthers

chan

wewe

chen

f .

et al. .

Priorização da escala genômica de alvos de drogas: o banco de dados de alvos do TDR

nat. Rev. Drug Discov.

2008

;

900

–

907

crowther

shanmugam

carmona

Doyle

Hertz-fowler

berriman

nwaka

ralph

Roos

van voorhis

et al. .

Identificação de alvos atrativos de drogas em patógenos da doença negligenciada usando uma abordagem de silico

plos de magia. Trop. Dis.

2010

;

E804

lykins

filippova

halavaty

como

minasov

Zhou

Dubrovska

Flores

shuvalova

ruan

el bissati

et al. .

CSGID resolve estruturas e identifica fenótipos para cinco enzimas em toxoplasma gondii

frontal. Célula. Infectar. Microbiol.

2018

;

352

shanmugam

ralph

Carmona

crowther

Roos

agüero

caffrey

Selzer

Integrando e minimando genomas de helmintos para descobrir e priorizar novos alvos terapêuticos

helmintos parasitas: metas, telas, drogas e vacinas

2012

;

wiley-blackwell

–

magariños

carmona

Moodther

ralph

roos

shanmugam

van voorhis

agüero

TDR alvos: um recurso quimogênico para doenças negligenciadas

nucleic. Ácidos. Res.

2012

;

d1118

–

d1127

berenstein

magariños

chernomoretz

agüero

Uma abordagem de rede multicamada para orientar o reposicionamento de drogas em doenças negligenciadas

plos de magia. Trop. Dis.

2016

;

e0004300

kim

weiss

toxoplasma gondii: o modelo apicomplexan

int. J. parasitol.

2004

;

423

–

432

sidik

huet

ganesan

huynh

m.-h.

Wang

Nasamu

como

Thiru

saeij

jpj

carruthers

niles

et al. .

Uma tela CRISPR em todo o genoma em Toxoplasma identifica genes essenciais apicomplexan

Cell

2016

;

166

1423

–

1435

gajria

bahl

brestelli

dommer

fischer

gao

heiges

iodice

kissinger

macey

et al. .

toxodb: um recurso de banco de dados do Toxoplasma Gondii integrado

ácidos nucleicos res.

2007

;

d553

–

d556

warrenfeltz

basenko

agacha

harb

> Kissinger

Roos

shanmugasundram

Silva-Franco

kollmar

eupathdb: o recurso de banco de dados de genomics do patogênico eucariótico

Bancos de dados genômicos eucarióticos

2018

;

1757

springer

–

113

sayers

agarwala

bolton

breater

Canese

clark

connor

Fiorini

funk

hefferon

et al. .

Recursos de banco de dados do Centro Nacional de Informações de Biotecnologia

ácidos nucleicos res.

2019

;

d23

–

d28

hertz-fowler

Pavão

Introduzindo a geredb: um banco de dados genérico

tendências parasitol.

2002

;

465

–

467

parafuso

rodgers

shafie

kersey

Berriman

wowe

Usando o parasita de WormBase: uma plataforma integrada para explorar os dados genómicos de helmintos

Métodos mol. Biol

2018

;

1757

471

–

491

lechat

hummel

Rousseau

moszer

genolista: um ambiente integrado para análise comparativa de genomas microbianos

ácidos nucleicos res.

2007

;

D469

–

D474

kapopoulou

lew

cole

o portal mycobrowser: um recurso abrangente e anotado manualmente para genomas micobacterianos

tuberculose

2011

;

–

camacho

coulouris

avagyan

papadopoulos

Baler

Madden

blast +: arquitetura e aplicativos

BMC BioInformatics

2009

;

421

hancock

bishop

gravar (a suíte de software de biologia molecular europeu)

dicionário de bioinformática e biologia computacional

2004

;

Chichester

John Wiley & filhos, Ltd

DOB0206

krogh

larsson

von heijne

sonnhammer

Prevendo a topologia da proteína transmembrana com um modelo oculto Markov: aplicação para completar genomas

j. Mol. Biol.

2001

;

305

567

–

580

almagro armentaleros

tsirigos

sønderby

petersen

Winther

brunak

von heijne

Nielsen

sinalp 5.0 melhora as previsões do péptido de sinal usando redes neurais profundas

nat. Biotechnol.

2019

;

420

–

423

pierleoni

martelli

casadio

Predgpi: um preditor de âncora gpi

BMC BioInformatics

2008

;

392

moriya

Itoh

Okuda

yoshizawa

Kanehisa

kaas: um servidor automático de genoma e servidor de reconstrução do caminho

ácidos nucleicos res.

2007

;

w182

–

w185

chen

macey

stoeckert

jr,

roos

Orthomcl-DB: Consultando uma coleção abrangente de várias espécies de grupos ortólogos

ácidos nucleicos res.

2006

;

d363

–

d368

fischer

BRUNK

chen

gao

harb

iodice

shanmugam

stoeckert

usando orthomcl para atribuir proteínas aos grupos orthomcl-db ou a proteomas de cluster em novos grupos ortólogos

Curr Protoc Bioinforma.

2011

;

doi: 10.1002 / 0471250953.bi0612s35

mitchell

ttwood

babbitt

blum

Bork

Bridge

Brown

chang

h.-y.

el-gebali

fraser

et al. .

interpro em 2019: melhorar a cobertura, classificação e acesso a anotações de sequência de proteína

ácidos nucleicos res.

2019

;

d351

–

d360

jones

binns

Chang

H.-y.

fraser

McCulla

mcwilliam

Maslen

Mitchell

nuka

et al. .

Inuthuscan 5: Classificação de função de proteína de escala genoma

bioinforma. Oxf. ENGL.

2014

;

1236

–

1240

burley

Berman

bhikadiya

Chen

Costanzo

Christie

Duarte

dutta

feng

et al. .

Banco de dados de proteína: o único arquivo global para dados de estrutura macromolecular 3D

ácidos nucleicos res.

2019

;

D520

–

D528

pieper

webb

dong

schneidman-duhovny

fã

kim

khuri

derramamento

weinkam

hammel

m .

et al. .

Modbase, um banco de dados de modelos de estrutura de proteína comparativa anotada e recursos associados

ácidos nucleicos res.

2014

;

d336

–

d346

zhu

mok

IMWONG

jaideee

Russell

Nosten

dia

branco

Preiser

bozdech

Novos insights no transcriptoma de plasmodium vivax usando RNA-SEQ

sci. Rep.

2016

;

20498

smircich

Eastman

Bispo

Duhagon

guerra-slompo

garat

goldenberg

munroe

dallagiovanna

holetz

et al. .

Perfil do ribossomo revela o controle de tradução como um mecanismo chave gerando expressão gênica diferencial no Trypanosoma Cruzi

genômica BMC

2015

;

443

lasonder

rijpma

van schaijk

bcl

hoeijmakers

wam

Kensche

gresnigt

italiaander

Vos

woestenenk

bousema

et al. .

Análises transcritivas e proteômicas integradas de P. Falciparum gametócitos: insight molecular em processos específicos do sexo e repressão translacional

ácidos nucleicos res.

2016

;

6087

–

6101

Otto

wilinski

assefa

keane

Sarry

böhme

lemieux

Barrell

dor

berriman

et al. .

Novos insights sobre o transcriptoma do estágio sanguíneo do plasmodium falciparum usando o RNA-SEQ

mol. Microbiol.

2010

;

–

Otto

böhme

jackson

hunt

Franke-Fayard

hoeijmakers

wam

religado

Robertson

Sanders

ogun

s sa

et al. .

Uma avaliação abrangente de genomas de parasita de malária de roedores e expressão gênica

BMC Biol.

2014

;

zanghì

vembar

Baumgarten

ding

Guizetti

Bryant

Mattei

jensen

rénia

Goh

et al. .

Um pfemp1 específico é expresso em sporozoites de P. falciparum e desempenha um papel na infecção do hepatócito

rep.

2018

;

2951

–

2963

fernandes

dillon

lal

Belew

bravo

mosser

Perfil do transcriptoma duplo de macrófagos humanos infectados à leishmania revela assinaturas distintas de reprogramação

mbio

2016

;

E00027-16

fritz

buchholz

chen

durbin-johnson

conrad

boothroyd

Análise transcriptômica do desenvolvimento de toxoplasma revela muitas novas funções e estruturas específicas para esporozoitas e oocistos

plos um

2012

;

e29998

Hon

c.-c.

weber

sismeiro

PRUX

koutero

deloger

das

agrahari

Dillies

M.-a.

jagla

et al. .

Quantificação de ruído estocástico de splicing e poliadenilação em Entamoeba histolytica

ácidos nucleicos res.

2013

;

1936

–

1952

siegel

hekstra

wang

Dewell

Cross

gam

Análise genoma-ampla da abundância de mRNA em Duas fases de ciclo de vida do Trypanosoma Brucei e identificação de locais de emenda e poliadenilação

ácidos nucleicos res.

2010

;

4946

–

4957

yeoh

goodman

mollard

mcfadden

Ralph

Transcriptomia comparativa de gametócitos femininos e masculinos em Plasmodium Berghei e a evolução do sexo em alvejantes

genômica BMC

2017

;

734

hehl

basso

lippuner

Ramakrishnan

Okoniewski

walker

grigg

deplazes

A expansão assexual de toxoplasma gondii merozoites é distinta dos tachyzoites e envolve a expressão de famílias genéticas não sobrepostas para anexar, invadir e replicar dentro dos enterócitos felinos

genômica BMC

2015

;

bushell

gomes

sanderson

anar

Girling

rebanho

metcalf

modrzynska

schwach

Martin

et al. .

Perfil funcional de um genoma de plasmodium revela uma abundância de genes essenciais

Cell

2017

;

170

260

–

272

mendez

gaulton

bento

câmaras

de veij

félix

magariños

mosquera

mutowo

Nowotka

m .

et al. .

Chembl: para a deposição direta de dados de bioensaio

ácidos nucleicos res.

2019

;

d930

–

D940

peña

pilar Manzano

cantizani

kessler

Alonso-Padilla

Barda

alvarez

e .

Colmenarejo

Cotillo

Roquero

et al. .

Novos conjuntos compostos identificados a partir de rastreio fenotípico de alta taxa de transferência contra três parasitas Kinetoplastid: um recurso aberto

sci. Rep.

2015

;

8771

spangenberg

tocas

kowalczyk

mcdonald

Wells

tnc

willis

A caixa de malária de acesso aberto: um catalisador de descoberta de drogas para doenças negligenciadas

plos um

2013

;

e62906

Haider

padrão de funcionalidade Combinando como uma ferramenta eficiente de pesquisa de estrutura complementar / reação: uma abordagem de código aberto

moléculas

2010

;

5079

–

5092

cheng

zhao

lin

zhang

wang

lai

cálculo de coeficientes de partição octanol-água por orientando um modelo aditivo com conhecimento

j. Chem. Inf. Modelo.

2007

;

2140

–

2148

O’Boyle

Banck

james

Morley

vandermeersch

hutchison

Abra Babel: uma caixa de ferramentas química aberta

j. ChemInformatics

2011

;

heller

mcnaught

pletnev

stein

tchekhovskoi

Inchi, o IUPAC International Chemical Identifier

j. ChemInformatics

2015

;

lipinski

lombardo

Dominy

feeney

experimental e abordagens computacionais para estimar a solubilidade e a permeabilidade nas configurações de descoberta e desenvolvimento de medicamentos

adv. Deliv Dobra. Rev.

2001

;

–

congreve

carr

Murray

jhoti

uma “regra de três” para a descoberta de chumbo baseada em fragmentos

droga discov. Hoje

2003

;

876

–

877

dalke

chemfp – Formatos e ferramentas rápidos e portáteis de impressões digitais

j. ChemInformatics

2011

;

p12

rogers

tanimoto

um programa de computador para classificar as plantas

ciência

1960

;

132

1115

–

1118

youden

index por classificação Testes de diagnóstico

câncer

1950

;

–

bostock

ogievetsky

heer

D3 Documentos orientados por dados

IEEE Trans. Vis. Compute. Gráfico.

2011

;

2301

–

2309

probst

reymond

j.-l.

smilesdrawer: analisar e desenhando estruturas moleculares codificadas por sorrisos usando JavaScript do lado do cliente

j. Chem. Inf. Modelo.

2018

;

–

O autor (s) 2019. Publicado pela Universidade de Oxford Press em nome da pesquisa de ácidos nucleicos.

Este é um artigo de acesso aberto distribuído sob os termos do Creative Commons Atribuição Não-Comercial Licença (http://creativecommons.org/licenses/by-nc/4.0/), que permite reutilização, distribuição e reprodução não comercial Em qualquer meio, desde que o trabalho original seja citado adequadamente. Para reutilização comercial, entre em contato com os perió[email protected]

TDR alvos 6: Discovery de droga de condução para patógenos humanos através de integração intensiva de dados quimogênicos

abstrato

introdução

Visão geral e organização de alvos de TDR

novos recursos em Alvos de TDR 6

Usando os alvos de TDR 6

H2>

priorizações alvo inteiro

Drug Repurponing Estratégias usando transformações de consulta

Exploração de compostos órfãos

Atualizações e atualizações de dados

novos dados genômicos em Alvos TDR V6.1

Actualizações de dados Chemical

curadoria e integração de dados de bioactividade

Integração de características derivadas de rede: farmacibilidade e priorizações

Visualizações de sub-gráfico de rede e atualização de interface de usuário

Disponibilidade comercial de compostos

Discussão e instruções futuras

Dados suplementares

Agradecimentos

Financiamento

Notas

Deixe uma resposta Cancelar resposta