Obxectivos TDR 6: Discovery de drogas de condución para patóxenos humanos a través dunha integración de datos de quimiogenómica intensiva

Resumen

O volume de datos biolóxicos, químicos e funcionais depositado no dominio público está crecendo rapidamente, grazas á secuenciación de próxima xeración e as tecnoloxías de selección altamente automatizadas. Estes conxuntos de datos representan recursos inestimables para o descubrimento de drogas, especialmente para os patóxenos de enfermidades menos estudadas. Para aproveitar estes conxuntos de datos, a integración de datos intelixentes e intensivos é necesaria para orientar inferencias computacionais en diversos organismos. Os obxectivos TDR son os recursos de quimiogenómicos integran datos xenómicos de patóxenos humanos e organismos modelo xunto con información sobre compostos bioactivos e as súas actividades anotadas. Este informe destaca as últimas actualizacións sobre os datos e funcionalidades dispoñibles nos obxectivos TDR 6. Con base nos modelos de rede de quimiogenómicos que proporcionan enlaces entre inhibidores e obxectivos, a base de datos agora incorpora prioridades obxecto de aprendizaxe dirixidas á rede e novas visualizacións de subgráficas de rede que amosan químicos e obxectivos -Similaridade barrios xunto con enlaces de bioactividade composta de destino asociados. Os datos dispoñibles poden ser navegados e consultados a través dunha nova interface de usuario que permite aos usuarios realizar prioridades de obxectivos de proteínas e inhibidores químicos. Como tal, os obxectivos TDR agora facilitan a investigación de medicamentos de medicamento contra os obxectivos de patóxenos, que poden axudar a identificar obxectivos candidatos a compostos bioactivos con obxectivos anteriormente descoñecidos. Os obxectivos TDR están dispoñibles en https://tdrtargets.org.

Introdución

Enfermidades tropicais descoidadas (NTD) afectan desproporcionadamente a 1,5 millóns de persoas en baixos ingresos e en desenvolvemento Países, onde son unha das principais causas de anos de vida perdidas á discapacidade e á morte prematura (1). Históricamente, a falta de implicación da industria farmacéutica, en combinación con limitado investimento en programas de investigación de saúde pública en países afectados, resultou nunha deficiencia de drogas dispoñibles para controlar de forma eficaz a maioría destas enfermidades (2). Ademais, as drogas actualmente en uso para tratar estas enfermidades adoitan comprometerse en termos de custo, dificultades na administración, eficacia, resistencia ás drogas ou perfís de seguridade.

O descubrimento de drogas é un proceso de tempo e custoso (3 , 4). Para NTD en particular, os programas de descubrimento de drogas deben sobrevivir o tempo suficiente a través de escaseza de financiamento penetrante para facelo en ensaios clínicos posteriores (5). Neste contexto, un enfoque estratéxico para o descubrimento de drogas NTD é o reposicionamento de drogas (6), que pode axudar a diminuír os custos facilitando as aprobacións reguladoras nos primeiros ensaios por medicamentos que xa sufriron a investigación clínica para outras enfermidades e / ou indicacións que a seguridade (6). Ademais, se o alcance da repursión de drogas é ampliado para incluír drogas e compostos bioactivos da investigación sobre organismos non humanos, tamén pode levar á identificación de polo menos novas ferramentas químicas para probando a función de obxectivos e vías nos patóxenos humanos. Así, aproveitando as grandes cantidades de datos dispoñibles a partir de programas de investigación ben financiados sobre enfermidades humanas e organismos modelo, a paisaxe de descubrimento de drogas en NTD recibe un impulso positivo (7).

As estratexias computacionais están cada vez máis Esencial no descubrimento de drogas translacionales, tanto na academia como na industria farmacéutica. A integración intelixente e intensiva dos volumes crecentes de datos xerados durante todas as fases do descubrimento de drogas xa está permitindo que os retos clave do proceso sexan abordados (8). Desde a súa introdución, a base de datos de TDR Obxectivos foi un recurso de confianza para que os investigadores de enfermidades descoidados accedan a datos de quimiogenómica para a priorización de drogas e os medicamentos repurecen sobre enfermidades descoidadas. Introducido en 2008 (9), este recurso acceso aberto permitiu aos investigadores atopar obxectivos nova proteína e inhibidores químicos, e prioriza-los para axudar o desenvolvemento de medicamentos para patógenos DTN. Os obxectivos TDR fan uso de conxuntos de datos funcionais de todo o mundo para que os usuarios poidan atopar e priorizar obxectivos en función do seu coñecemento da bioloxía do seu patóxeno de interese e natureza da enfermidade (10,11). Esta é implementada por unha selección de destino flexible e baseada no usuario (usando criterios de filtrado) e clasificación (utilizando ponderación específica de criterios) (12,13).

Aquí describimos as actualizacións dos conxuntos de datos subxacentes e Funcionalidade no recurso de obxectivos TDR, acumulado desde a súa publicación anterior en 2012 (13). Os novos obxectivos TDR (V6.1, abreviado TDR6 neste artigo) integra a información xenómica específica do patóxeno con datos funcionais (por exemplo)Expresión, relacións baseadas en ortoloxía, esencialidade) a partir dunha selección de organismos, xunto con datos de compostos bioactivos (estrutura química, propiedade e bioactividade / información de destino); Todos os cales poden ser consultados e navegados a través da aplicación web. Todas as consultas pódense gardar a un Stash persoal por usuarios rexistrados e publicados a través da aplicación web para maximizar as oportunidades de colaboración. As listas priorizadas de obxectivos poden ser exportados para unha análise máis destacada. Os detalles completos de todas as novidades pódense atopar nas notas de lanzamento (https://tdrtargets.org / Releases). Este informe presenta un paseo completo da aplicación web, as súas novidades e exemplos para ilustrar os casos de uso.

Resumo e organización de obxectivos TDR

Como en lanzamentos anteriores de obxectivos TDR, TDR6 tamén está organizado en dúas seccións principais: obxectivos e compostos. A sección de obxectivos da base de datos contén datos de xenoma para 20 patóxenos humanos e permite aos usuarios realizar consultas e prioridades de obxectivos proteicos baseados nunha serie de características e datos relevantes para o descubrimento de drogas (ver táboa 1). A sección de compostos da base de datos contén información sobre > 2 millóns de compostos bioactivos e permite consultas en función das propiedades químicas dos compostos e as súas bioactividades anotadas (ver táboa 2).

Táboa 1.

Consultas de destino dispoñibles en obxectivos TDR

grupo de consulta. patóxenos para os que hai datos dispoñibles. Tipos de datos dispoñibles para a consulta.
nomes & Anotacións Todos Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS)
Características de proteínas Todos MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI).
Información estrutural Todos Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase
expresión xénica Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas.
Información filoxenética Todos Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados.
essencialidade C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo.
Datos de validación de destino Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos)
drogabilidade Todos precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe. Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal)
ensayabilidad Todos ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC)
Referencias bibliográficas Todos Obxectivos de filtro baseados en publicacións dispoñibles
grupo de consulta. patóxenos para os que hai datos dispoñibles. Tipos de datos dispoñibles para a consulta.
nomes & Anotacións Todos Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS)
Características de proteínas Todos MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI).
Información estrutural Todos Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase
expresión xénica Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas.
Información filoxenética Todos Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados.
essencialidade C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo.
Datos de validación de destino Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos)
drogabilidade Todos precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe. Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal)
ensayabilidad Todos ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC)
Referencias bibliográficas Todos Obxectivos de filtro baseados en publicacións dispoñibles

Táboa 1 .

consultas de destino dispoñibles na obxectivos TDR

grupo de consulta. patóxenos para os que hai datos dispoñibles. Tipos de datos dispoñibles para a consulta.
nomes & Anotacións Todos Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS)
Características de proteínas Todos MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI).
Información estrutural Todos Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase
expresión xénica Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas.
Información filoxenética Todos Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados.
essencialidade C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo.
Datos de validación de destino Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos)
drogabilidade Todos precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe.Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal)
ensayabilidad Todos ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC)
Referencias bibliográficas Todos Obxectivos de filtro baseados en publicacións dispoñibles
grupo de consulta. patóxenos para os que hai datos dispoñibles. Tipos de datos dispoñibles para a consulta.
nomes & Anotacións Todos Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS)
Características de proteínas Todos MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI).
Información estrutural Todos Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase
expresión xénica Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas.
Información filoxenética Todos Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados.
essencialidade C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo.
Datos de validación de destino Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos)
drogabilidade Todos precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe. Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal)
ensayabilidad Todos ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC)
Referencias bibliográficas Todos Obxectivos de filtro baseados en publicacións dispoñibles

Táboa 2 .

Consultas compostas dispoñibles en obxectivos TDR

TD

grupo de consulta. Tipos de datos dispoñibles para a consulta.
Buscas baseadas en texto
nomes & anotacións nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi
Propiedades químicas Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski)
Fórmula composta Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n)
bioactividade Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo, IC50 < 5 μm)
compostos huérfanos buscar compostos que teñen informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas)
compostos con obxectivos Buscar compostos que teñen información de destino de información e mecanismo baseados en bicos
Buscas baseadas en estrutura
similaridade composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos similares. A busca baséase na correspondencia das pegadas químicas
Substitución composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento.

TD

grupo de consulta. Tipos de datos dispoñibles para a consulta.
Buscas baseadas en texto
nomes & anotacións nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi
Propiedades químicas Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski)
Fórmula composta Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n)
bioactividade Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo, IC50 < 5 μm)
compostos huérfanos buscar compostos que teñen informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas)
compostos con obxectivos Buscar compostos que teñen información de destino de información e mecanismo baseados en bicos
Buscas baseadas en estrutura
similaridade composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos similares. A busca baséase na correspondencia das pegadas químicas
Substitución composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento.

Táboa 2.

Consultas compostas dispoñibles en obxectivos TDR

TD

grupo de consulta. Tipos de datos dispoñibles para a consulta.
Buscas baseadas en texto
nomes & anotacións nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi
Propiedades químicas Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski)
Fórmula composta Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n)
bioactividade Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo, IC50 < 5 μm)
compostos huérfanos buscar compostos que teñen informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas)
compostos con obxectivos Buscar compostos que teñen información de destino de información e mecanismo baseados en bicos
Buscas baseadas en estrutura
similaridade composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos similares. A busca baséase na correspondencia das pegadas químicas
Substitución composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento.

TD

iv id = “a4c5658932”

Novas funcións en TDR Obxectivos 6

Recientemente informamos dun modelo de rede integradora (14) onde todos os conxuntos de datos a escala de xenomas dispoñibles en obxectivos TDR (obxectivos de proteínas), información química (compostos bioactivos) e as súas relacións (bioactividade de compostos en Os ensaios baseados en obxectivos) estaban ligados a un gráfico multicapa. En TDR6, este modelo de rede foi actualizado integrando novos datos (descritos a continuación). Este modelo incorpora enlaces entre os obxectivos e os compostos bioactivos derivados da curación manual dos ensaios de bioactividade publicados (é dicir, enlaces directos entre obxectivos e compostos químicos), así como a partir de relacións calculadas (ligazóns de destino de destino e enlaces compostos) en función das anotacións de proteínas (Dominios de PFAM, Grupos Ortholog) e similaridade química. Un aspecto clave destes enlaces no modelo de rede multilayer é que permiten a rápida exploración e visualización do barrio en torno a obxectivos seleccionados e / ou compostos bioactivos. Isto permite aos usuarios explorar compostos vinculados a obxectivos, inspeccionar o barrio de semellanza química en torno a compostos bioactivos e visualizar estes datos dun xeito amigable e amigable (ver Figura 1).

Figura 1. / div>

Modelo de rede esquemática en visualizacións de TDR6 e Sub-Graph: páxinas compostas ou obxecto de aprendizaxe agora amosan unha visualización de subgráficas que conteñen obxectos nas proximidades da rede da entidade seleccionada. Estes gráficos están construídos a partir dun gráfico de rede de tres capas complexas. Un esquema deste gráfico preséntase na parte superior. Ambos branco e subgráficos compostos son sempre dispostos do seguinte xeito: os nós composto (verde) están ligadas aos obxectivos (laranxa = patógenos; gris = non-patógenos) mediante arestas bioactividade. Estas ligazóns representan positivos (verdes), neutros (grises) ou negativos de ensaios de ensaio. Finalmente, dirixe o mapa a un conxunto de afiliacións funcionais (anotacións, nodos azuis). No exemplo, o gráfico mostra un conxunto de inhibidores coñecidos para un acyltransferase humano (15). Estas bioactividades (todos positivos) están deseñados como enlaces verdes entre os compostos (nodos verdes) eo obxectivo (nodos grises para non patóxenos, nodos de laranxa para patóxenos). O gráfico destaca as oportunidades de repurición dos aciltransferases de Helminth (liñas discontinuas, engadidas manualmente por esta cifra), baseadas en anotacións compartidas co obxectivo humano druggable coñecido. O nodo vermello da capa de drogas indica o composto seleccionado. Os tamaños de nodos están determinados polo número de conexións da rede (grao), mentres que os anchos de enlace de bioactividade (bordos) están relacionados co número acumulado de probas experimentais para un dato drog—obxectivo (número de ensaios).

Figura 1.

Modelo de rede esquemática en TDR6 e Sub-Graph Visualizations: Páxinas compostas ou de destino agora amosar unha visualización de subgráficas que conteñen obxectos no Veciñanza da rede da entidade seleccionada. Estes gráficos están construídos a partir dun gráfico de rede de tres capas complexas. Un esquema deste gráfico preséntase na parte superior. Os subgrafos de destino e compostos están sempre dispostos do seguinte xeito: os nodos compostos (verdes) están conectados a obxectivos (laranxa = patóxenos; gris = non patóxenos) a través de bordos de bioactividade. Estas ligazóns representan positivos (verdes), neutros (grises) ou negativos de ensaios de ensaio. Finalmente, dirixe o mapa a un conxunto de afiliacións funcionais (anotacións, nodos azuis). No exemplo, o gráfico mostra un conxunto de inhibidores coñecidos para un acyltransferase humano (15). Estas bioactividades (todos positivos) están deseñados como enlaces verdes entre os compostos (nodos verdes) eo obxectivo (nodos grises para non patóxenos, nodos de laranxa para patóxenos). O gráfico destaca as oportunidades de repurición dos aciltransferases de Helminth (liñas discontinuas, engadidas manualmente por esta cifra), baseadas en anotacións compartidas co obxectivo humano druggable coñecido. O nodo vermello da capa de drogas indica o composto seleccionado. Os tamaños de nodos están determinados polo número de conexións da rede (grao), mentres que os anchos de enlace de bioactividade (bordos) están relacionados co número acumulado de evidencias experimentais para un dato drogo-drog-obxectivo (número de ensaios).

Con estas actualizacións, TDR6 agora dá aos usuarios as seguintes funcións: (i) Prioridades de Target Genome de rede en rede (II) Exploración de medicamentos de medicamento; e III) a exploración de obxectivos candidatos por compostos huérfanos. Estes casos de uso son posibles por unha serie de características baseadas en rede precomputadas, como unha novela Network-Druggability Score (NDS). Asociando unha métrica cuantitativa aos obxectivos baseados no enriquecemento dos compostos bioactivos en nodos de rede estreitamente conectados, esta puntuación facilita a clasificación dos obxectivos en grupos de drogas (DG), que están dispoñibles para os usuarios en consultas de base de datos.

o O modelo de rede tamén é a base para prioridades de rede precomputadas (NDPS) que poden ser consultadas polos usuarios e tamén se usan internamente por TDR6 para seleccionar obxectivos conectados e compostos para a visualización nas visualizacións da rede recentemente desenvolvida (ver a continuación). Ao comezar a partir dun composto de interese TDR6 utiliza as prioridades precomputadas dos obxectivos candidatos a axudar aos usuarios na navegación do espazo obxectivo ao redor do composto (e viceversa ao comezar a partir dun destino de interese). Ao proporcionar estas métricas de enriquecemento precomputadas e rankings a base de datos facilita agora o descubrimento de novas asociacións de drogas-obxectivo. Ademais destes novos NDPS precomputados, os usuarios poden priorizar obxectivos utilizando a mesma funcionalidade que nos lanzamentos de obxectivos TDR anteriores.

Esta versión tamén inclúe varias actualizacións de datos, é dicir, a inclusión de 22 novos xenomas (20 novos patóxenos e 2 novos Organismos modelo) e extensas actualizacións para datos químicos e de bioactividade entre outros. A interface de usuario mellorada e versátil, xunto coas actualizacións de datos renovando o compromiso dos obxectivos TDR de proporcionar unha ferramenta integrada e poderosa para explorar datos xenómicos e químicos no contexto de enfermidades tropicais descoidadas.

Usando obxectivos TDR 6

Prioridades de Target Genómetros de todo o xenoma

O modelo de rede (14) é a base para a nova puntuación de drogabilidade, que é unha métrica derivada de rede que está relacionada co enriquecemento en compostos bioactivos para un Dado o destino (NDS, ‘Network Farmgability Score’). NDSS están dispoñibles para todos os organismos de nivel 1, que se poden consultar e utilizados para que as consultas de peso filtren (en ou fóra) os obxectivos definidos por usuarios de priorización personalizados definidos. Como se explica aínda máis nos detalles da integración de rede, para cada organismo, os obxectivos clasificáronse en cinco grupos de drogas (DG), desde o máis baixo (DG1) ata a puntuación máis alta (DG5), de acordo co seu rendemento nas prioridades da rede.

Como en versións anteriores de obxectivos TDR, os usuarios poden combinar diferentes conxuntos de datos simplemente executando consultas individuais en diferentes tipos de datos e combinándoos na páxina de Historia (9,10,12,13). Isto é útil cando, por exemplo, os usuarios desexen incluír tipos de datos adicionais a prioridades baseadas en drogabilidade, como aqueles que dependen da expresión xénica nas etapas de ciclo de vida relevantes ou aquelas que proporcionen información sobre a aptitude / letalidade dos obxectivos (esencialidade).

Como exemplo, presentamos aquí un exemplo de priorización usando Toxoplasma Gondii como o patóxeno de interese. T. Gondii é un parasito apicomplex, moitas veces usado como modelo para investigar a bioloxía subxacente a varias enfermidades humanas e animais (15). A estratexia de busca resúmese na Figura 2. A consulta foi iniciada buscando todos os obxectivos T. gondii e filtrando eses obxectivos con homólogos en humanos (para seleccionar só obxectivos específicos de parasito). A continuación, seleccionamos os xenes esenciais candidatos baseados en perfís de fitness durante a infección dos fibroblastos humanos (16); e tamén seleccionado xenes altamente expresados en taquizoítos (fase replicativa de T. gondii), consultando a xenes na parte superior 80-100 percentil de RNA-Seq abundancia transcrición (17). Estas seleccións foron combinadas coas rankings de drogabilidade da rede. Para iso consideramos xenes nos grupos de drogabilidade 3, 4 ou 5 (DG ≥ 3) (ver Figura 2). A figura mostra todas as consultas e os seus resultados como se ve na páxina de historia e as operacións realizadas ao combinar consultas (Unión, intersección). A lista final de obxectivos clasificados en base a estes criterios foi feita pública e está dispoñible na sección de obxectivos TDR de listas publicadas.

Figura 2.

Target Estratexia de exemplo de priorización para T. Gondii. A imaxe composta mostra (a) os termos de consulta utilizados para atopar obxectivos de T. gondii que non teñen homólogos nos seres humanos, que son altamente expresados na etapa virulenta taquinoita do parasito durante a infección celular humana, que probablemente sexan esenciais e probablemente sexan drogables segundo a puntuación de drogabilidade de rede. (B) Resumo das consultas realizadas na páxina de “Obxectivos”, mostrando como aparecen estas consultas na páxina “Historia”, onde poden ser revisadas e transformadas. Os botóns de xestión de consulta en liña permiten as accións seleccionadas (eliminar, renomear, exportar) en conxuntos de resultados.(C) As combinacións de consulta permiten aos usuarios executar a Unión, interseccionar ou restar accións en consultas entre si. Mostran exemplos de accións sindicais e intersección. (D) As consultas pódense gardar a un Stash privado (os meus conxuntos de consulta) desde onde se poden enviar de volta ao espazo de traballo (para realizar operacións de consulta adicional) ou compartidas publicamente con outros usuarios de obxectivos TDR (os meus conxuntos de consulta de destino publicado).

Figura 2.

Target Prioritation Exemplo Strategy para T. Gondii. A imaxe composta mostra (a) os termos de consulta utilizados para atopar obxectivos de T. gondii que non teñen homólogos nos seres humanos, que son altamente expresados na etapa virulenta taquinoita do parasito durante a infección celular humana, que probablemente sexan esenciais e probablemente sexan drogables segundo a puntuación de drogabilidade de rede. (B) Resumo das consultas realizadas na páxina de “Obxectivos”, mostrando como aparecen estas consultas na páxina “Historia”, onde poden ser revisadas e transformadas. Os botóns de xestión de consulta en liña permiten as accións seleccionadas (eliminar, renomear, exportar) en conxuntos de resultados. (C) As combinacións de consulta permiten aos usuarios executar a Unión, interseccionar ou restar accións en consultas entre si. Mostran exemplos de accións sindicais e intersección. (D) As consultas pódense gardar a un Stash privado (os meus conxuntos de consulta) desde onde se poden enviar de volta ao espazo de traballo (para realizar operacións de consulta adicional) ou compartidas publicamente con outros usuarios de obxectivos TDR (os meus conxuntos de consulta de destino publicado).

estratexias de reputación de medicamentos que utilizan transformacións de consulta

A consulta de drugabilidade en TDR6 permite aos usuarios seleccionar obxectivos con inhibidores / drogas coñecidas ou previstas. A información sobre os obxectivos con medicamentos coñecidos proveñen da curación da literatura, mentres que as asociacións previstas (indirectas) de obxectivos con inhibidores / medicamentos obtéñense a través de cálculos de similitud de secuencia ou ortoloxía (a obxectivos drugables coñecidos) ou a través de inferencias compatibles con rede (14). Todos estes métodos están implementados en TDR6. Por iso, cando os usuarios filtren un conxunto de xenes baseado na drogabilidade, limitan a selección a obxectivos altamente clasificados, que deben proporcionar unha fonte rica de oportunidades de reputación de medicamentos.

para mostrar a utilidade de TDR6 nesta área mostramos Como buscar drogas candidatas por repurición de Echinococcus Multilocularis (o axente causante da echinococosis alveolar). Isto móstrase na Figura 3. O proceso é similar ao que se describe anteriormente para T. Gondii, pero nesta estratexia de consulta non descartamos homólogos humanos e usou C. elegans RNAI Lethality Datasets como proxy para a esencialidade de Nematode. Como resultado, obtivemos unha priorización integral de xenoma para E. Multilocularis. A continuación, aplicando un filtro baseado en drogabilidade a esta consulta, reducimos a selección do xene a un puñado de xenes. O usuario pode inspeccionar manualmente os obxectivos seleccionados para descubrir que medicamentos foron listados a través de asociacións indirectas. As páxinas de destino mostrarán todos os compostos asociados na sección de drogas, clasificados segundo a fonte da inferencia. Para inferencias dirixidas á rede, a puntuación de cada composto proposta aparecerá tanto como unha lista como como unha parcela de rango, para identificar rapidamente aos candidatos prometedores. Alternativamente, para minimizar a inspección manual, a lista de xenes (é dicir, a consulta en si) pode ser facilmente converter a unha lista de drogas asociadas facendo clic nos botóns “Converter esta consulta” nas páxinas de resultados da consulta. Esta funcionalidade proporciona unha forma rápida de comezar a crear unha biblioteca de selección para un conxunto de obxectivos. As transformacións de consulta poden estar baseadas en cutados (drogas coñecidas para un conxunto de obxectivos), previsto (asociacións calculadas ás drogas) ou ambas. Nos tres enfoques, os inhibidores / drogas asociados a obxectivos drugables coñecidos están asociados transitivamente cos xenes da lista. A Figura 3 resume a estratexia de priorización, a conversión de consulta da lista de xenes a compostos e un exemplo da visualización sub-gráfica dispoñible desde a páxina composta dun hit de repursión. Actualmente, estas conversións son executadas no fondo e os resultados aparecen na sección de historial do sitio web cando se realiza (os usuarios tamén están avisados por correo electrónico).

Figura 3.

Repursión de drogas oportunidades para E. Multilocularis utilizando transformacións de consulta. Un réxime de priorización obxecto de aprendizaxe para o echinococcus multilocularis baseado na inferencia baseada na ortoloxía e a drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) Lista inicial de obxectivos priorizados. (C) Calquera lista de destino pode ser “transformada” nunha lista das súas drogas asociadas, utilizando calquera dos métodos de ligazón compostos dispoñibles (ver o texto principal). (D) Lista resultante de compostos bioactivos. (E) Exemplo de visualización de sub-gráfica de rede dun composto seleccionado, mostrando ligazóns de bioactividade activa e inactiva. Os compostos (nodos verdes) están conectados a obxectivos patóxenos (laranxa) de acordo cos rexistros de bioactividade (verde = activo; vermello = inactivo, consulte o texto principal para os limiar de actividade).Os obxectivos, á súa vez, están conectados (ligazóns grises) a afiliacións funcionais (nodos azuis). A renderización de sub-gráfica proporciona consellos visuais sobre como o obxectivo de E. Multilocularis inicial está conectado co composto seleccionado na rede.

Figura 3.

Repurpos de drogas Oportunidades para E. Multilocularis utilizando transformacións de consulta. Un réxime de priorización obxecto de aprendizaxe para o echinococcus multilocularis baseado na inferencia baseada na ortoloxía e a drogabilidade prevista (DG ≥ 3). (A) consultas combinadas; (B) Lista inicial de obxectivos priorizados. (C) Calquera lista de destino pode ser “transformada” nunha lista das súas drogas asociadas, utilizando calquera dos métodos de ligazón compostos dispoñibles (ver o texto principal). (D) Lista resultante de compostos bioactivos. (E) Exemplo de visualización de sub-gráfica de rede dun composto seleccionado, mostrando ligazóns de bioactividade activa e inactiva. Os compostos (nodos verdes) están conectados a obxectivos patóxenos (laranxa) de acordo cos rexistros de bioactividade (verde = activo; vermello = inactivo, consulte o texto principal para os limiar de actividade). Os obxectivos, á súa vez, están conectados (ligazóns grises) a afiliacións funcionais (nodos azuis). A renderización de sub-gráfica proporciona consellos visuais sobre como se conecta o obxectivo inicial de E. Multilocularis co composto seleccionado na rede.

Exploración de compostos huérfanos

As actividades de compostos extraídos da literatura por curación aparecen en forma de ensaios baseados en destino (ligazón directa ao destino) ou en forma de ensaios baseados en celulares ou de todo o organismo. En ausencia doutra información, estas últimas clases de ensaios non proporcionan pistas ao obxectivo ou mecanismo de acción dos compostos. Durante o proceso de actualizacións de datos químicos en TDR6, identificamos compostos con efectos fenotípicos informados sobre todo o organismo ou ensaios baseados en células, en función das súas clasificacións de química. Esta información foi utilizada para identificar compostos “orfos” activos contra un patóxeno particular en proxeccións primarias ou secundarias baseado en células, pero para o que non hai ningún tipo de ensaio baseado en obxectivos.

Os compostos orfos en TDR6 poden ser Buscou calquera especie con datos de selección fenotípica dispoñible, dentro da páxina de busca de compostos. Isto permite unha forma rápida de aproveitar datos de ensaios de alto rendemento, permitindo aos usuarios iniciar as súas prioridades de compostos con actividade coñecida contra un patóxeno de interese.

O modelo de rede integrado en TDR6 tamén é útil para identificar o candidato Obxectivos para compostos huérfanos. Como se describe na publicación orixinal (14), o barrio de semellanza química calculado ao redor dun composto orfo seleccionado pode proporcionar ligazóns indirectas a un ou máis obxectivos. Usando esta estratexia realizamos prioridades obxecto de aprendizaxe para todos os compostos huéranos en TDR6. Estas prioridades compostas por rede precomputadas están dispoñibles para todos os organismos para os que están dispoñibles datos de selección fenotípica. Os resumos globais que amosan todos os compostos huérfanos destes organismos están ligados desde a páxina “Resumo de datos” (ver https://tdrtargets.org / DatasMary e prema sobre a especie de interese). Un exemplo de priorización baseada en composta orpmenta para T. Cruzi móstrase na Figura 4. Mentres que as prioridades que a partir dun único composto están dispoñibles en cada páxina composta.

Figura 4.

Exploración de obxectivos candidatos para os compostos de Cruzi Cruzi Cruzi. A trama resume a priorización obxecto de aprendizaxe dirixida por rede para os compostos huérfanos activa contra T. Cruzi. Todas as secuencias de codificación de proteínas no xenoma de T. Cruzi (obxectivos candidatos) están dispostas no eixe x. Os puntos de datos da parcela corresponden ás asociacións de drogas obxecto de aprendizaxe marcadas polo algoritmo (puntuación trazada no eixe Y). Como exemplo, destacamos dous obxectivos putativos para dúas drogas diferentes (como se mostra na páxina de resumo de datos T. Cruzi). As parcelas similares están dispoñibles en liña para os organismos de nivel 1 en TDR6 (ligados á páxina Resumo de datos).

4.

Exploración de obxectivos candidatos para os compostos huéranos de Cruzi Cruzi. A trama resume a priorización obxecto de aprendizaxe dirixida por rede para os compostos huérfanos activa contra T. Cruzi. Todas as secuencias de codificación de proteínas no xenoma de T. Cruzi (obxectivos candidatos) están dispostas no eixe x. Os puntos de datos da parcela corresponden ás asociacións de drogas obxecto de aprendizaxe marcadas polo algoritmo (puntuación trazada no eixe Y). Como exemplo, destacamos dous obxectivos putativos para dúas drogas diferentes (como se mostra na páxina de resumo de datos T. Cruzi). As parcelas semellantes están dispoñibles en liña para os organismos de nivel 1 en TDR6 (ligados á páxina Resumo de datos).

funcionalidades e actualizacións de datos

Novos datos xenómicos en TDR Obxectivos V6.1

Desde a publicación anterior da base de datos TDR Obxectivos (13), engadíronse varios genómetros de patóxenos. Ofrécese unha lista detallada na táboa 3, así como en liña na páxina de resumo de datos TDR6 (https://tdrtargets.org / datasmarmary).

Táboa 3 ..

Resumo de dispoñibilidade de datos para patóxenos de nivel superior. Resumo dos datos de destino dispoñibles para os organismos de nivel 1 en obxectivos TDR. CD: secuencias de codificación; PFAM: Número de proteínas con dominio (s) de PFAM mapeado; Ir: Número de proteínas con gene mapeado Condicións de ontoloxía; CE: Número de proteínas con números mapeados da comisión de enzimas (CE); Pathways: Número de proteínas mapeadas a Mapas de Pathway Kegg; Orthologs: número de secuencias mapeadas a grupos ortholog ortomcl. Unha táboa de resumo de datos máis completa está dispoñible en liña en https://tdrtargets.org / datasummary

grupo de consulta. Tipos de datos dispoñibles para a consulta.
Buscas baseadas en texto
nomes & anotacións nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi
Propiedades químicas Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski)
Fórmula composta Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n)
bioactividade Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo,IC50 < 5 μM)
compostos huérfanos buscar compostos que teñan informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas)
compostos con obxectivos atopar compostos que teñen a base de información e mecanismo baseados ensaios
Buscas baseadas en estrutura
similaridade composta debuxar / pegar Estrutura 2D composta ou fragmentada e busca compostos similares. A busca baséase na correspondencia das pegadas químicas
Substitución composta Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento.
especies. CDs. Pfam. vai. CE. rutas. Orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166
PLASMODIUM VIVAX 5344 3264 2631 641 806 5207
toxoplasma gondii 7946 4025 3795 772 967 6764
CHLAMYDIA TRACHOMISIS 887 704 598 269 357
Mycobacterium leprae 1630 1236 929 628 611 1473
Mycobacterium Tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
trep Onema Pallidum 1036 791 634 221 335 733
Wolbachia Endosimbiont de B. Malayi 805 628 577 308 382 688
Brugia Malayi 11316 7042 6368 1278 1787 8424
Echinococcus granulosus 10249 6481 5432 854 1965 7109
echinococcus multilocularis 10474 6817 5768 878 2079 7539
Loa Loa (Worm Eye) 16292 8071 6774 1539 2207 10484
OnChocerca Volvulus 12224 3248 2178 246 563 4054
Schistosoma Mansoni 12692 7818 7384 1218 1649
Leishmania Major 8280 4641 4415 1067 1162 8250
TRYPANOSOMA BRUCEI 10270 5665 5482 1019 1264 9259
trypanosoma Cruzi 18639 9908 8572 1495 1735 18140
Entamoeba Histolytica 8211 4920 4087 645 1094 7692
GIARDIA LAMBLIA 9665 2726 2263 326 514 5977
trichomonas vaginalis 95600 35474 18435 843 1366 87303

5432

Entamoeba histolytica

especies. CDs. Pfam. vai. CE. rutas. Orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166
PLASMODIUM VIVAX 5344 3264 2631 641 806 5207
toxoplasma gondii 7946 4025 3795 772 967 6764
CHLAMYDIA TRACHOMISIS 887 704 598 269 357
Mycobacterium leprae 1630 1236 929 628 611 1473
Mycobacterium Tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
trep Onema Pallidum 1036 791 634 221 335 733
Wolbachia Endosimbiont de B.malayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (verme ollo)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Táboa 3.

Resumo dispoñibilidade de datos para os mellores patógenos liña. Resumo de datos de destino dispoñibles para Tier 1 organismos en Metas TDR. CDs: secuencias codificantes; Pfam: número de proteínas con mapeada Pfam dominio (s); GO: número de proteínas con mapeadas termos Gene ontoloxía; CE: número de proteínas con números mapeadas Comisión Enzyme (CE); Vías: número de proteínas mapeadas para mapas PATHWAY KEGG; Ortólogos: número de secuencias mapeadas para grupos OrthoMCL ortólogo. Unha táboa de resumo de datos máis completa está dispoñible en liña en https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071

Entamoeba histolytica

3c34827 “ iv id =” 0b01674e “” DV Id = “0b01674e.


v id = “29971a56991”

5344 2631

887 87 04 04 04 04

Tepne

Mycobaacterium 6678 678 678 678 678

5432

Entamoeba histolytica





Especies. CDs. PFAM. GO. CE. PATHWAYS. ortólogos.
Plasmodium falciparum 5349 3322 3551 750 1083 5166
5344 3264 2631 641 806 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764
Chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae

1630

1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep onema pallidum 1036 791 634 221 335 733
Wolbachia endosymbiont de B.MALAYI 588 588 388
Brugia MALAYI

11316

7042 6368 1278 1787 6481 6481 854 1965 7109
Echinococcus multilocularis

10474

6817 779 758
Loa Loa (Worm Eye) 1509 071 1559 071 1539 071 679 071 15371 1539 071 1539 071 2207 10484 2378 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania Major 8280 4641 4415 1067 1162 8250 5480 5482 1019 1264 9259
Trypanosoma Cruzi

18639

9908 8572 1495 1735

D

8211 4920 4087 645 1094 7692 GIARDIA LAMBIA 2263 2263 2735 363

272 3635 363 2235 363 514 5977
trichomonas vaginalis

95600

35474

18435 843 CDS. PFAM. vai. CE. camiños. orthOogs.
lasmoodium 3322 551 7166 PLASMOX VIVAX 641 606 06 06 06 06 5207
toxoplasma gondii 7946 4025 3795 772 967 6764 598 269 Mycobacterium 1630 1236 P2 673 673
Mycobaacterium tdulesis paper 1174 1174 1174 1174 3287 873 1002 3459
Trep. Onema pallven 1036 61 33 33 33 33 33 33 633
wolbia indussiabiante de bmalayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (verme ollo)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Dada a diversidade de organismos Integrado Obxectivos TDR e, en consecuencia, a variedade de fontes de datos necesario para cubrir toda a xenomas; esforzo substancial foi posta en estandarizar os datos de análise e recuperación de información a partir do xenoma destes organismos. A maior parte do xenoma completo EuPathDB obtivéronse a partir de (18), GenBank (19), GeneDB (20), Wormbase parasito (21), GenoList (22) ou Mycobrowser (23). Unha descrición completa das fontes de xenoma e dada na táboa anterior Adicional S1. Para actualizar os datos para organismos presentes na versión anterior de Metas TDR xenes codificadores de proteínas de liberación actual de genomas eran ou mapeado para xenes existentes nas Metas TDR, ou non entraron os novos rexistros. O mapeamento algoritmo utiliza unha combinación de condicións para rastrexar identificadores Gene través das versións e manter a identidade de xenes: as sumas de comprobación de secuencia correspondente (utilizando valores de 128 bits hash xerado polo algoritmo MD5), nomes de xene ou identificadores e explosión (24) SE ou combinacións perfectas son atopados. Despois de actualización de rexistros, o pipeline calcula propiedades fisicoquímicas que utilizan Pepstats (25), para saber se hai ámbitos transmembranares con TMHMM (26), os péptidos sinal con SignalP (27), e glicosilfosfatidilinositol Os puntos de ancoraxe, usando PredGPI (28). O algoritmo descarta todas as secuencias codificadoras non, os máis ben calquera pseudogenes, para evitar enganosa anotacións e minimizar falsos supostos durante os fluxos de traballo de priorización. A maioría dos TDR6, mencionado arriba todas as tarefas de xenoma integración e actualización foron rotas no fluxo de traballo automatizado para facilitar máis rápido actualizacións en lanzamentos futuros. Un esquema de actualización e Segmentación algoritmo se mostra na Figura Adicional anterior S1. O Pipeline tamén automatizar o cálculo de notas mediante estratexias individuais ad hoc para diferentes notas, contando con servizos web e APIs (apareceu no Kaas (29) Servizo de proteínas de cartografía para Vías Metabólicas eo Número de CE Clasificación de encimas, ou a OrthoMCL base de datos e ferramenta (30,31) para os grupos de cartografía ortólogo a proteínas. a Segmentación tamén depende de computación contra bases de datos instaladas localmente apareceu máis InterPro (32), utilizando InterProScan (33) para identificar domios proteicos Pfam () e mapear termos para vocabularios controlados e clasificacións (termos GO). funcionalidades adicionais apareceu máis 3D estruturas e modelos estruturais foron obtidos a partir do Protein Data Bank (34), utilizando servizos web e descargar do sitio web Modbase FTP (35), respectivamente.

Tamén o número de conxuntos de datos funcionais principais foron integrados nesta versión, incluíndo (i) os conxuntos de datos transcriptomic que proporcionan evidencia de expresión de xenes en etapas do ciclo de vida ou condicións experimentais que son pertinente a Drug Discovery (36-47) e (ii) os conxuntos de datos esencialidade derivado dous axentes patóxenos Apicomplexan (P. berghei e T. gondii) (16,48), que fornecen información de Estratexias Vital AUXILIAR prioritização.

Actualizacións de datos Chemical

Para os compostos bioactivos, tamén, os fluxos de traballo de actualización de datos foron automatizados para esta versión.A maioría dos compostos bioactivos foron recuperados desde a versión 24ª CHEMBL (49), que contén algúns conxuntos de conxuntos adicionais como os de caixas químicas específicas de patóxeno – gsk kinetoplastid caixas (50), caixa de patóxeno MMV (51). O proceso de integración comeza a partir das descricións de moléculas (2D) en formato SDF, a partir das cales calculamos todas as impresións dixitais compostas necesarias (necesarias para as buscas de similitud compostas / substructos) usando a lámpada (52). A tubaxe tamén calcula Propiedades químicas adicionais, como o coeficiente de octanol logP / auga partición e outros descritores estruturais utilizando xLogp3 (53), e as ferramentas abertas Babel obprop e obrotamer (54). Outros datos relevantes foron obtidos ou calculados directamente desde a estrutura composta, como os identificadores de Inchi e Inchikey (55) utilizados para o seguimento composto; e outras regras estándar de polgar usadas na química medicinal e ao descubrimento de drogas, como a regra de Lipinski de cinco (56) e a regra relacionada de tres (57).

Despois da integración en obxectivos TDR, todos os compostos foron suxeitos a todos vs todo o cálculo de comparación de semellanza química utilizando a CHEMFP (58) que produce medidas de semellanza de pares baseadas no índice de Tanimoto (59). Ademais, calculamos un mapa global (todo fronte a todos) de relacións de subestruturas entre compostos na base de datos (x é unha subestrutura de y; y é unha superestructura de x). Sabendo que o problema de atopar subgráficas comúns entre as moléculas é computacionalmente difícil, aplicamos un enfoque heurístico para atopar subestruturas. O algoritmo obtén un subconxunto de posibles moléculas candidatas mediante a utilización de impresións dixitais previamente calculadas. Os candidatos deben ter impresións dixitais coa molécula do asunto. Unha vez que se obteña unha lista de candidatos, a determinación de subestiminación de atom-atom-atom-atom-atom-atom-atom-atom-tot-atom está feito usando Matchmol (52). Os datos dispoñibles para compostos e as consultas que se poden executar en cada tipo de datos resúmense na táboa 2. O peso molecular (MW) e área de superficie polar (PSA) para todos os compostos da base de datos móstrase na figura complementaria S2.

Curación e integración de datos de bioactividade

Como con compostos químicos, a maioría das bioactividades integradas nos obxectivos TDR veñen directamente das fontes de datos de Upstream (por exemplo, Chembl). Ao integrar datos de bioactividade, preservamos tanto a anotación do ensaio (por exemplo, “Ensaio de redución de motilidade in vitro contra a microfilaria de Malayi de Brugia a 10 μm) eo valor numérico e as unidades asociadas a actividades compostas (por exemplo, o 80% de inhibición”, 1.5 μm IC50 ‘, ’10 NM MIC’), que son todos os campos de busca. Ademais, e para facilitar as consultas dos usuarios, as bioactividades informadas foron utilizadas para agrupar compostos ensagados en clases “activas” ou “inactivas”. Non obstante, para minimizar o efecto do uso de límites duros ao redor de limiares arbitrarios e aumentar a separación entre clasificacións activas / inactivas, tamén definimos unha área gris indeterminada. Por iso, os compostos de puntuación debaixo dun limiar arbitrario non se consideran inactivos para fins de consulta e visualización.

Non todos os tipos de actividade foron susceptibles de clasificar. A pesar dos esforzos na estandarización destes datos de actividade, a interpretación das actividades de compostos a esta escala é difícil, xa que a miúdo dependen do tipo de ensaio particular, as unidades reportadas e as condicións particulares nas que se realizou cada ensaio. Non obstante, un conxunto significativo de tipos de ensaio podería clasificarse automaticamente en categorías activas / indeterminadas / inactivas baseadas en limiar de actividade. Para iso, todos os tipos de ensaios con > 100 000 informes (ver complementaria S3 para unha actividade por tipo de ensaio / por compacto de distribución composta) foron considerados para a auditoría de actividade, aínda que só con ensaios baseados en concentración (como IC50, ki ou potencia) atopáronse o suficientemente robustos como para tal determinación, porque porcentaxe baseado en ensaios (como% actividade,% de actividade residual ou inhibición de $) foron ambiguos nos informes de bioactividade. Os limiares utilizados para clasificar as actividades para cada tipo de ensaio pódense atopar na táboa 4 e a distribución de compostos nestas clases de actividade resúmese na figura 5.

Táboa 4.

Tipos de ensaio e limiar de actividade utilizados para a determinación da etiqueta de actividade: só se empregaron ensaios baseados en concentración para determinar as etiquetas de actividade. As actividades que informan menos que o valor máximo admitido dos positivos consideráronse activos (+) interaccións, mentres que aqueles maiores que o “valor mínimo admitido por negativos” foron considerados inactivos (-). Calquera actividade que se informou entre estes dous valores foi considerada como indeterminada (0)

TD

tipo de ensaio
.
Unidade estándar. valor máximo admitido por activos. valor mínimo admitido para inactivos.
AC50 nm 20000 100000 EC50 NM 20000 100000
IC50 NM 20000 100000
IC50 UG ML-1 15 50
kd NM 20000 100000
ki Nm 20000 100000
Potencia NM 20000 100000

TD

Tipo de ensaio
.
Unidade estándar. valor máximo admitido por activos. valor mínimo admitido para inactivos.
AC50 nm 20000 100000 EC50 NM 20000 100000
IC50 NM 20000 100000
IC50 UG ML-1 15 50
kd NM 20000 100000
ki Nm 20000 100000
Potencia NM 20000 100000

Táboa 4.

Tipos de ensaio e limiar de actividade utilizados para a determinación da etiqueta de actividade: só se empregaron ensaios baseados en concentración para determinar as etiquetas de actividade. As actividades que informan menos que o valor máximo admitido dos positivos consideráronse activos (+) interaccións, mentres que aqueles maiores que o “valor mínimo admitido por negativos” foron considerados inactivos (-). Calquera actividade que se informou entre estes dous valores foi considerada como indeterminada (0)

TD

tipo de ensaio
.
Unidade estándar. valor máximo admitido por activos. valor mínimo admitido para inactivos.
AC50 nm 20000 100000 EC50 NM 20000 100000
IC50 NM 20000 100000
IC50 UG ML-1 15 50
kd NM 20000 100000
ki Nm 20000 100000
Potencia NM 20000 100000

TD

Tipo de ensaio
.
Unidade estándar. valor máximo admitido por activos. valor mínimo admitido para inactivos.
AC50 nm 20000 100000 EC50 NM 20000 100000
IC50 NM 20000 100000
IC50 UG ML-1 15 50
kd NM 20000 100000
ki Nm 20000 100000
Potencia NM 20000 100000

Figura 5.

Etiquetas de actividade Distribución e evidencia Mesturas entre datos: (a) Diagrama de Venn que mostra a distribución de valores de bioactividade nas clases activas, inactivas e indeterminadas en TDR6 (ver o texto principal para máis detalles) .. Interseccións conta casos en que a mesma droga ten diferentes resultados de actividade contra o mesmo obxectivo. Exemplos destes casos son proporcionados en paneis B a F (ID de compostos representan identificadores TDR6). (B) Actividade de C329137 (unha hidroxi-benzamidina) contra P. falciparum bifunctional dihydrofolate reductase-thymidylate sintase. (C) Exemplo de rexistros positivos para inhibidores de aciltransferase humanos. (D) Exemplo de actividades negativas e neutras para compostos Triphenylcarbinol e benzohidrol, respectivamente. Finalmente, as probas positivas (E) e negativas (f) poden ser mesturadas con probas indeterminadas, como se mostra para C2164865 probado contra a colinestera do cabalo e C306882 probado contra o recombinante P. Falciparum deoxyuridine 5′-trifosphate nucleotido hidrolase, respectivamente.

Figura 5.

Etiquetas de actividade Distribución e evidencia Mesturas entre datos: (a) Diagrama de Venn que mostra a distribución de valores de bioactividade no activo Clases inactivas e indeterminadas en TDR6 (ver o texto principal para máis detalles).Interseccións conta casos en que a mesma droga ten diferentes resultados de actividade contra o mesmo obxectivo. Exemplos destes casos son proporcionados en paneis B a F (ID de compostos representan identificadores TDR6). (B) Actividade de C329137 (unha hidroxi-benzamidina) contra P. falciparum bifunctional dihydrofolate reductase-thymidylate sintase. (C) Exemplo de rexistros positivos para inhibidores de aciltransferase humanos. (D) Exemplo de actividades negativas e neutras para compostos Triphenylcarbinol e benzohidrol, respectivamente. Finalmente, as probas positivas (E) e negativas (f) poden ser mesturadas con probas indeterminadas, como se mostra para C2164865 probado contra a colinestera do cabalo e C306882 probado contra o recombinante P. Falciparum deoxyuridine 5′-trifosphate nucleotido hidrolase, respectivamente.

O CHEMBL 24ª versión conta con máis de 15,2 millóns de bioactividades informadas, das cales só uns 6 millóns correspondían a relacións que impliquen medicamentos e obxectivos de proteínas (proteínas individuais, familias de proteínas e complexos de proteína, con ~ 93% sendo proteínas individuais). Outras bioactividades restantes na base de datos foron informes para unha gran variedade de obxectivos non proteicos, como as células enteiras (3,6 m), os organismos enteiros (2,2 millóns de tecidos (83k) e as macromoléculas non peptídicas (85k) ou Moléculas pequenas (< 100). Estes non foron utilizados na construción de rede, porque a rede é proteína (é dicir, obxectivo) céntrica. A Figura 5 tamén mostra algunhas visualizacións de rede de exemplo que representan como a TDR6 mostra estas bioactividades.

Integración de características derivadas de rede: drogabilidade e priorización

Como mencionado anteriormente, datos xenómicos, anotacións xenéticas, Os compostos químicos e as interaccións de medicamentos xenéticas integráronse nunha rede complexa orientada a medicamentos, como se describe en Berenstein et al. (14). A rede foi usada para calcular unha puntuación de drogabilidade de rede (NDS), para todos os obxectivos en prioridade (Tier 1) patóxenos. O NDS está relacionado coa posibilidade de atopar compostos bioactivos nas proximidades do gráfico de rede dun determinado obxectivo (o rango é de 0 a 1). O algoritmo foi descrito previamente en detalle (14), pero brevemente, baseado nunha proba de exceso de representación das proteínas drugables coñecidas anotadas, calcula unha puntuación de relevancia (RS) para cada dominio de PFAM e categorías de grupos de orthología da rede. A puntuación NDS para obter resultados de destino determinados a partir dunha suma acumulada ponderada sobre os RS de todas as contribucións de afiliación común ao nodo de destino e ás proteínas do veciño ligadas a compostos activos.

para facilitar a interpretación das puntuacións NDS realizamos un Avaliación estatística para identificar grupos distintos de drogabilidade (DG) en función de dous tipos de limiares que axudan a clasificar as previsións de drogabilidade en zonas de confianza. Estes son ilustrados na figura 6. Por unha banda, mentres todos os obxectivos de puntuación distinta de cero teñen algún grao de conectividade para brancos coñecidos-druggable, un baixo NDS suxire estas conexións non son relevantes para a avaliación druggability. Por iso, un corte de ruído (unha base de base calculada como 5 veces o valor de 0,25 por percentil da distribución completa da NDS) considérase identificar obxectivos de baixa puntuación. O segundo limiar derívase do índice máximo de Youen J (60), que se calcula como a puntuación na que tanto a especificidade como a sensibilidade son óptimas (a mellor sensibilidade sen comprometer a especificidade e viceversa). Este valor só pode ser calculado para patóxenos con verdadeiros positivos (obxectivos drugables coñecidos). Un mínimo arbitrario de 10 verdadeiros positivos foi considerado suficiente para a súa determinación de corte de Cutoff. Para outros patóxenos que faltan esa información, utilizouse un Cutoff Global Youen (calculado usando todos os verdadeiros positivos da rede). Os grupos de drogabilidade correspondentes son así: DG1 para obxectivos con valores NDS que van desde 0 ao limiar de ruído; DG2 para obxectivos con valores NDS que van desde o limiar de ruído ata o corte de Youde; e DGS 3, 4 e 5 con valores NDS que son 1-, 10- e 100 veces por riba do corte de Youde. En consecuencia, estes últimos grupos fan que os obxectivos drugables máis probables. A Figura 6 mostra un exemplo estático dunha priorización dirixida pola rede para Mycobacterium ulcerans (que carece de obxectivos con compostos coñecidos no lanzamento actual). Todas as prioridades para os obxectivos TDR para os organismos prioritarios poden verse en liña na páxina Resumo de datos para cada especie (ver https://tdrtargets.org / DatasMary, premendo sobre a especie de interese). Neste caso, as parcelas en liña son interactivas e poden ser ampliadas e exportadas. Nos casos en que hai obxectivos con compostos bioactivos coñecidos para a especie, estes móstranse de forma distinta na trama.

Figura 6.

Whole-driven Priorización do obxectivo do xenoma para Mycobacterium ulcerans: obxectivos candidatos no xenoma de M. ulcerans foi clasificado polo seu NDS (puntuación de drogabilidade de rede, ver o texto principal).A trama mostra todos os obxectivos do xenoma (no eixe x) xunto coa súa puntuación NDS correspondente (no eixo Y). Os puntos vermellos corresponden aos obxectivos clasificados Top-10, con etiquetas que indican o nome do xene eo produto. Navega pola priorización do xenoma enteiro do resumo de datos, o usuario pode acceder a unha páxina de xenes facendo clic nel na trama de priorización. Un subgráfico Exemplo de Familia Genera EMBA / AMB / MABC móstrase (como se ve nas súas páxinas de xenes correspondentes). A figura tamén mostra zonas de confianza, DG1 (vermello): delimitado por cero e corte de ruído; DG2 (amarelo): Entre o ruído eo Cutoff Youen; e DG3-5: con puntuacións máis altas que o Cutoff Youen.

Figura 6.

Genome enteiro dirixido á rede Priorización de obxectivos para Mycobacterium Ulcerans: os obxectivos candidatos no xenoma de M. ulcerans foron clasificados polo seu NDS (puntuación de drogabilidade de rede, ver o texto principal). A trama mostra todos os obxectivos do xenoma (no eixe x) xunto coa súa puntuación NDS correspondente (no eixo Y). Os puntos vermellos corresponden aos obxectivos clasificados Top-10, con etiquetas que indican o nome do xene eo produto. Navega pola priorización do xenoma enteiro do resumo de datos, o usuario pode acceder a unha páxina de xenes facendo clic nel na trama de priorización. Un subgráfico Exemplo de Familia Genera EMBA / AMB / MABC móstrase (como se ve nas súas páxinas de xenes correspondentes). A figura tamén mostra zonas de confianza, DG1 (vermello): delimitado por cero e corte de ruído; DG2 (amarelo): Entre o ruído eo Cutoff Youen; e DG3-5: con puntuacións superiores ao corte de YouTen.

Estas prioridades dirixidas por rede poden funcionar de ambos xeitos. Ao partir dun composto de interese, o algoritmo pode priorizar obxectivos, utilizando a similitude ponderada dos veciños químicos aos obxectivos candidatos iniciais. E ao comezar de destino de interese, pode priorizar compostos, utilizando obxectivos de veciños drugables conectados e despois seguir ligazóns ponderadas a inhibidores / drogas candidatas. Puntuacións precomputadas para compostos e para obxectivos son utilizados internamente por TDR6 e están no núcleo das transformacións de consulta baseadas en rede.

Network Sub-Graph Visualizations e interface de usuario Upgrade

a rede Sub -Graps para ambos compostos e obxectivos (e as súas respectivas puntuacións NDS) poden ser navegadas desde a aplicación web usando unha droga ou un obxectivo como punto de partida para obter suxestións para drogas non probadas ou obxectivos drugables, respectivamente. A través de visualizacións recentemente desenvolvidas, os usuarios poden consultar os barrios de rede en torno a drogas e obxectivos nas páxinas correspondentes. As listas de interaccións putativas derivadas de rede tamén poden ser exploradas en formato tabular baixo a “drogabilidade” (para obxectivos) e “seccións de obxectivos” coñecidos e previstos “(para drogas).

Estas visualizacións son conducidas por D3.JS (61) Implementación de disposicións forzadas para visualizacións sub-gráficas. Dentro do panel de subgrafo D3, os usuarios poden realizar buscas de nodos dentro do gráfico (identificadores obxecto de aprendizaxe), ademais de alternar a visibilidade dos obxectivos nunha especie por parte da especie e personalizar a opacidade dos nodos. Tomado conxuntos estas novas características proporcionan unha visualización clara e completa das proximidades de sub-rede de obxectivos e compostos, permitindo aos usuarios manipular os gráficos ao explorar os datos.

A interface de usuario (IU) e as ferramentas dispoñibles Para a repurición de medicamentos e a priorización obxecto de aprendizaxe pasaron por unha gran actualización. En primeiro lugar, a IU foi rediseñada baixo os estándares W3C para lograr unha aplicación máis sa e máis escalable. Integramos o bootstrap (https://getbootstrap.com/) e jQuery (https://jquery.com) no desenvolvemento e deseño da aplicación web TDR6 e na parte frontal Funcionalidade final. Para as consultas de estruturas compostas que temos licenciado e implementado a aplicación de debuxo químico de Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Os rexistros tabulados dentro das páxinas de destino e drogas agora usan o plugin jquey de javery de datos (https://datatables.net) para crear facilmente praginations, filtrando e ordenar funcións. Finalmente, as representacións 2D compostas agora xeráronse automaticamente usando unha implementación do módulo JavaScript SmileDer (62).

dispoñibilidade comercial de compostos

Un aspecto importante ao priorizar os compostos para a proba no laboratorio , é a súa dispoñibilidade. En TDR6 agora estamos mostrando información sobre a dispoñibilidade comercial de compostos. Actualmente comezamos esta función ligando con Molport (un mercado químico en liña que as fontes compostas de grandes provedores) e amosan aos usuarios unha pista visual en páxinas compostas que dan unha indicación rápida de se o composto está en stock ou pode ser feito para solicitar .. Debido a que a dispoñibilidade comercial de compostos está actualmente implementada en TDR6 en forma de consultas asíncronas contra Molport, neste momento esta función só está dispoñible no modo de navegación (non en consultas).Non obstante, os usuarios poden priorizar compostos utilizando calquera das estratexias de consulta dispoñibles en TDR6 e finalizar as súas seleccións compostas ao inspeccionar compostos manualmente para a dispoñibilidade comercial.

Discusión e direccións futuras

Os novos datos , a interface ea funcionalidade de TDR6 proporciona aos usuarios unha mellor navegación e visualización de obxectivos e compostos.

O modelo de rede actual conecta os obxectivos a través da afiliación das entidades (proteínas) a conceptos de anotación (dominios de PFAM, grupos de ortoloxía). Estes foron seleccionados en función da súa ampla cobertura e relativa facilidade de cálculo. Complementando estes conceptos con outros criterios importantes para a validación de obxectivos de drogas (esencialidade, expresión en etapas de ciclo de vida relevantes) pode ser realizada por usuarios coas ferramentas e funcionalidades proporcionadas por TDR6 pero no futuro pode ser integrado no propio modelo de rede subxacente, en Nenos por algúns organismos susceptibles de avaliación experimental de todo o xenoma.

Hai varias melloras clave necesarias para manter os obxectivos TDR relevantes para a comunidade de científicos que traballan en enfermidades tropicais. A integración dos metabólicos naturais e conectando estas pequenas moléculas a outros compostos bioactivos a través de subestruturas compartidas ou por semellanza química será un gran foco no futuro. Isto permitirá a navegación do gráfico de obxectivos de drogas utilizando os conceptos de reaccións bioquímicas, o que naturalmente conecta as enzimas non ortolóxicas a través dos seus substratos / produtos e cofactores compartidos.

Finalmente, como xa se mencionou antes (13), Aínda hai unha gran variedade de curación que hai que cubrir. Moitos compostos bioactivos foron probados pola comunidade de investigadores que traballan en enfermidades tropicais descoidadas. Con todo, moitos destes ensaios e os resultados son relativos en revistas fóra do mainstream revistas Medicinal Chemistry, e polo tanto, se perde por grandes esforzos de curadoria, como o liderado por ChEMBL (49). Curación e integración destes datos que faltan (incluíndo datos negativos!) Debería ser unha prioridade para a comunidade, xa que aforraría un valioso tempo e recursos.

Datos complementarios

Os datos complementarios están dispoñibles en Nar en liña.

Recoñecementos

Os autores desexan agradecer a Matthew Berminan e Magdalena Zarowiecki (Wellcome Trust Sanger Institute) para compartir datos de xenoma de echinococcus pre-liberación e anotación de inclusión en TDR Obxectivos; e Ben Webb e Andrej Sali (Universidade de California San Francisco) para o cálculo de modelos 3D para xenomas de patóxenos de nivel 1 en obxectivos TDR. L.u.l., a.b. e s.v. foron ou son compatibles con becas do Consello Nacional de Investigación (Conicet, Arxentina). A.C. e F.A. son membros da carreira investigadora do Consello Nacional de Investigación (Conicet, Arxentina). P.M. Quere recoñecer unha bolsa de subvencións da Universidade (UGC), India.

Financiamento

GlaxoSmithKline Arxentina e da Axencia Nacional de Promoción da Ciencia e Tecnoloxía, Arxentina (Anpcyt); Proxecto de cooperación bilateral indo-arxentina (financiamento conxunto do Departamento de Ciencia e Tecnoloxía India (DST) e do Ministerio de Ciencia e Tecnoloxía Arxentina (Mincyt). Financiamento para carga de acceso aberto: Fondo para a investigación Científica e Tecnológica.

Conflito de Interese. Ningún declarado.

Notas

Enderezo actual: Ariel J Berenstein, Instituto Multidisciplinario de Investigacións en Patologías Pediatricas (Impp), Conicet-Gcba, Laboratorio de Biología Molecular, División Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Bos Aires, Arxentina.

Pj

,

molyneux
dh

,

fenwick
a.

,

kumaresan
j.

,

Sachs
se

,

Sachs
jd

,

savioli
l.
Control de enfermidades tropicais descoidadas

.

n. ENGL. J. med.
2007

;

357

:

1018

1027

.

trouiller
p.

,

Olliaro
p.

,

Torreele
e.

,

orbinski
j.

,

laing
r.

,

Ford
n.
Desenvolvemento de drogas para enfermidades negligenciadas: un mercado deficiente e un público Falla da política sanitaria

.

Lancet North Am. Ed.
2002

;

359

:

2188

2194

.

hughes
j.

,

Rees
s.

,

kalindjian
s.

,

philpott
k.
Principios de Discovery Drug

.

br. J. Pharmacol.
2011

;

162

:

1239

1249

.

Adams
cp

,

brantner
VV
Estimación do custo do novo desenvolvemento de drogas: é realmente 802 millóns de dólares

.

Health Aff. (Millwood)

.

2006

;

25

:

420

428

.

wyatt
pg

,

gilbert
IH

,

Ler
KD

,

FAIRLAMB
AH
Validación de destino : ligando obxectivos e propiedades químicas ao perfil de produto desexado

.

curr. Arriba. Med. Chem.
2011

;

11

:

1275

1283

.

farha
ma

,

marrón
ed
repursión de drogas para descubrimento antimicrobiano

.

Nat. Microbiol.
2019

;

4

:

565

577

.

hernandez
hw

,

soeung
m.

,

Zorn
km

,

ashoura
n.

,

Mottin
m

,

andrade
ch

,

Caffrey
cr

,

de siqueira-neto
jl

,

ekins
s.
rendemento elevado e repugnante computacional para enfermidades negligenciadas

.

Pharm. Res.
2018

;

36

:

27

.

wooller
sk

,

benstead- Hume
g.

,

chen
x.

,

ali
y.

,

Pearl
FMG
Bioinformática en Discovery de drogas translacional

.

Biosci. Rep.
2017

;

37

:

doi: 10.1042 / bsr20160180

.

agüero
f.

,

al -Lazikani
b.

,

aslett
m.

,

berminan
m.

,

Buckner
fs

,

Campbell
rk

,

carmona
s.

,

Carruthers
im

,

chan
awe

,

chen
f .

et al. ..

Priorización de escala xenómica dos obxectivos de drogas: a base de datos de obxectivos TDR

.

Nat. Rev. Destacado Discov.
2008

;

7

:

900

907

.

crowther
gj

,

shanmugam
d.

,

carmona
sj

,

doyle
ma

,

Hertz-Fowler
c.

,

berriman
m.

,

nwaka
s.

,

ralph
sa

,

roos
ds

,

van voorhis
wc

et al. ..

Identificación de obxectivos de drogas atractivos en patóxenos de enfermidade descoidados usando un enfoque en silicio

.

PLOs Negl. Trop. Dis.
2010

;

4

:

e804

.

lykins
jd

,

filippova
eV

,

Halavaty
como

,

minasov
g.

,

Zhou
y.

,

Dubrovska
i.

,

Flores
kj

,

shuvalova
la

,

Ruan
j.

,

el bisati
k.

et al. ..

CSGID resolve estruturas e identifica fenotipos por cinco enzimas en toxoplasma gondii

.

Front. Célula. Infectar. Microbiol.
2018

;

8

:

352

.

shanmugam
d.

,

Ralph
sa

,

carmona
sj

,

crowther
gj

,

Roos
ds

,

agüero
f.
Caffrey
cr

,

Selzer
PM
Genomes de helminth minería para descubrir e priorizar novos obxectivos terapéuticos

.

Helminths parasitarios: obxectivos, pantallas, drogas e vacinas

.

2012

;

wiley-blackwell
43

59

.

magariños
MP

,

Carmona
sj

,

crowther
gj

,

ralph
sa

,

roos
ds

,

shanmugam
d.

,

van voorhis
wc

,

agüero
f.
TDR Targets: un recurso de quimiogenómica para enfermidades descoidadas

.

nucleico. Ácidos. Res.
2012

;

40

:

d1118

d1127

.

Berenstein
aj

,

magariños
MP

,

Chernomoretz
a.

,

agüero
f.
Un enfoque de rede multicapa para a orientación de medicamentos reposicionándose en enfermidades descoidadas

.

PLOs Negl. Trop. Dis.
2016

;

10

:

e0004300

.

kim
k.

,

weiss
lm
toxoplasma gondii: o modelo apicomplexan

.

int. J. parasitol.
2004

;

34

:

423

432

.

sidik
sm

,

huet
d.

,

Ganesan
sm

,

huynh
m.-h.

,

wang
t.

,

nasamu
como

,

thiru
p.

,

SAEIJ
jpj

,

Carruthers
vb

,

niles
jc

et al. ..

Unha pantalla crispr de xenoma en Togoplasma identifica xenes apicomplexan esenciais

.

cela

.

2016

;

166

:

1423

1435

.

gajria
b.

,

bahl
a.

,

brestelli
j.

,

Dommer
j.

,

fischer
s.

,

GAO
x.

,

heiges
M.

,

iodecy
j.

,

kissinger
jc

,

mackey
AJ

et al. ..

toxodb: un recurso integrado de bases de datos de toxoplasma gondii

.

ácidos nucleicos res.
2007

;

36

:

d553

D556

.

warrenfeltz
s.

,

basenko
ey

,

crouch
k.

,

harb
OS

,

Kissinger
jc

,

Roos
ds

,

shanmugaundram
a.

,

silva-franco
f.
kollmar
m
eupathdb: o eucariótico Pathogen Genomics Databica Resource

..

bases de datos xenómicas eucarióticas

.

2018

;

1757

:

ny
springer
69

113

.

Sayers
ew

,

agarwala
r.

,

Bolton
ee

,

brister
jr

,

Canese
k.

,

Clark
k.

,

connor
r.

,

fiorini
n.

,

funk
k.

,

hefferon
t.

et al. ..

Recursos de base de datos do Centro Nacional de Información de Biotecnoloxía

.

ácidos nucleicos res.
2019

;

47

:

D23

D28

.

Hertz-Fowler
c.

,

Peacock
cs
Presentando Genedb: unha base de datos xenérica

.

tendencias parasitol.
2002

;

18

:

465

467

.

Bolt
bj

,

Rodgers
fh

,

shafie
m.

,

kersey
pj

,

Berriman
m.

,

howe
kl
usando o parásito wormbase: unha plataforma integrada para explorar datos xenómicos de helminth

..

Métodos MOL. Biol.
2018

;

1757

:

471

491

.

lechat
p.

,

Hummel
l.

,

russeau
s.

,

Moser
i.
Genolist: un ambiente integrado para a análise comparativa dos xenomas microbianos

.

ácidos nucleicos res.
2007

;

36

:

D469

D474

.

kapopoulou
a.

,

Lew
jm

,

cole
st
o portal de mycobrowser: un recurso amplo e amplo de forma manual para os xenomas micobacterianos

.

tuberculose

.

2011

;

91

:

8

13

.

camacho
c.

,

Coulouris
g.

,

avagyan
v.

,

ma
n.

,

papadopoulos
j.

,

bealer
k.

,

Madden
tl
Blast +: arquitectura e aplicacións

.

bioinformática BMC

.

2009

;

10

:

421

.

hancock
jm

,

bispo
MJ
Subros (a bioloxía europea de Bioloxía Molecular Open Software Suite)

. Dicionario de bioinformática e bioloxía computacional

.

2004

;

Chichester
John Wiley & Sons, Ltd
DOB0206

.

krogh
a.

,

Larsson
b.

,

g.

,

sonnhammer
el
Predición de topoloxía de proteínas transmembrana cun modelo de Markov oculto: aplicación para completar xenomas

.

j. MOL. Biol.
2001

;

305

:

567

580

.

almagro armenteros
jj

,

tsirigos
kd

,

sønderby
ck

,

petersen
tn

,

Winther
o.

,

brunak
s.

,

g.

,

Nielsen
h.
SignAlp 5.0 mellora as previsións do péptido de sinal usando redes neuronais profundas

.

Nat. Biotecnol.
2019

;

37

:

420

423

.

pierleoni
a.

,

martelli
p.

,

casadio
r.
Predgpi: un predictor GPI-ANKOR

.

bioinformática BMC

.

2008

;

9

:

392

.

moriya
y.

,

Itoh
m.

,

okuda
s.

,

yoshizawa
ac

,

kanehisa
m.
kaas: un servidor de reconstrución automático de xenoma e ruta

.

ácidos nucleicos res.
2007

;

35

:

w182

w185

.

chen
f.

,

Mackey
aj

,

stoeckert
cj

jr,

roos
ds
ORTHOMCL-DB: Consultando unha colección integral de especies de especies de grupos de ortólogos

.

ácidos nucleicos res.
2006

;

34

:

D363

D368

.

fischer
s.

,

brillo
bp

,

chen
f.

,

GAO
x.

,

HARB
OS

,

iodice
jb

,

shanmugam
d.

,

Roos
ds

,

Stoeckert
cj

jr

usando orthomcl para asignar proteínas a grupos de orthomcl-db ou a Proteomes de clúster en novos grupos de ortoloxía

.

curr protoc bioinforma.
2011

;

doi: 10.1002 / 0471250953.bi0612s35

.

Mitchell
al

,

attwood
tk

,

babbitt
PC

,

blum
m.

,

Bork
p.

,

ponte
a.

,

brown
sd

,

Chang
H.-y.

,

el-gebali
s.

,

Fraser
mi

et al. ..

Interpro en 2019: Mellorar a cobertura, a clasificación e acceso ás anotacións de secuencia de proteínas

.

ácidos nucleicos res.
2019

;

47

:

D351

D360

.

jones
p.

,

binns
d.

,

chang
h.-y.

,

Fraser
m.

,

li
w.

,

Mcanulla
c.

,

McWilliam
H.

,

maslen
j.

,

mitchell
a.

,

nuka
g.

et al. ..

Interproscan 5: Clasificación de funcións de proteínas a escala de xenoma

.

Bioinforma. OXF. ENGL.
2014

;

30

:

1236

1240

.

burley
sk

,

berman
hm

,

bhikadiya
c.

,

bi
c.

,

Chen
l.

,

Costanzo
ld

,

Christie
c.

,

Duarte
jm

,

dutta
s.

,

feng
z.

et al. ..

Protein Data Bank: o único arquivo global para datos de estrutura macromolecular 3D

.

ácidos nucleicos res.
2019

;

47

:

D520

D528

.

pieper
u.

,

webb
bm

,

dong
gq

,

schneidman-duhovny
d.

,

fan
h.

,

kim
sj

,

khuri
n.

,

Spill
yg

,

weinkam
p.

,

hammel
m .

et al. ..

ModBase, unha base de datos de modelos de estrutura de proteínas comparativas anotadas e recursos asociados

.

ácidos nucleicos res.
2014

;

42

:

D336

D346

.

zhu
l.

,

mok
s.

,

imwong
m.

,

jaidee
a.

,

russell
b.

,

nosten
f.

,

día
np

,

white
nj

,

Preiser
pr

,

bozdech
z.
Novas ideas sobre o plasmodium vivax transcriptome usando ARN-SEQ

.

SCI. Rep.
2016

;

6

:

20498

.

smircich
p.

,

Eastman
g.

,

bispo
s.

,

Duhagon
ma

,

Guerra-Slompo
EP

,

Garat
b.

,

Goldenberg
s.

,

munroe
dj

,

dallagiovanna
b.

,

holetz
F.

et al. ..

O perfil de ribosoma revela o control de tradución como mecanismo de clave xerando expresión xenética diferencial no tripanosoma cruzi

.

BMC Genomics

.

2015

;

16

:

443

.

lasonder
e.

,

rijpma
sr

,

van Schaijk
BCL

,

Hoeijmakers
wam

,

KENSCHE
PR

,

GRESNIGT
MS

,

ITALIALADOR
a.

,

vos
MW

,

woestenenk
r.

,

Bousema
t.

et al. ..

Análise integrada transcriptomic e proteómica de GameTocytes P. Falciparum: Insight molecular en procesos específicos de sexo e represión translacional

.

ácidos nucleicos res.
2016

;

44

:

6087

6101

.

Otto
td

,

wilinski
d.

,

assefa
s.

,

keane
tm

,

Sarry
lr

,

böhme
u.

,

lemieux
j.

,

barrell
b.

,

dor
a.

,

berminan
m.

et al. ..

Novas ideas sobre a etapa de sangue Transcriptome de Plasmodium falciparum usando ARN-SEQ

.

mol. Microbiol.
2010

;

76

:

12

24

.

Otto
td

,

böhme
u.

,

jackson
ap

,

Hunt
m.

,

Franke-Fayard
b.

,

Hoeijmakers
wam

,

Religma
aa

,

robertson
l.

,

sanders
m.

,

Ogun
SA

et al. ..

Unha avaliación completa dos xenomas de parasito de roedores da malaria e expresión xénica

.

BMC BIOL.
2014

;

12

:

86

.

zanghì
g.

,

Vembar
ss

,

baumgarten
s.

,

ding
s.

,

Guizetti
j.

,

Bryant
jm

,

mattei
d.

,

jensen
atr

,

rénia
l.

,

goh
y

et al. ..

Un PFEMP1 específico exprésase en P. Falciparum Sporozoites e desempeña un papel na infección hepatocita

.

célula
2018

;

22

:

2951

2963

.

fernandes
MC

,

Dillon
lal

,

belew
en

,

bravo
hc

,

Mosser
DM

,

el-sayed
nm
Perfil transcriptome dobre de macrófagos humanos infectados por leishmania revela distintas sinaturas de reprogramación

.

Mbio

.

2016

;

7

:

e00027-16

.

fritz
hm

,

buchholz
kr

,

chen
x.

,

durbin-johnson
b.

,

ROCKE
DM

,

Conrad
pa

,

boothroyd
jc
A análise transcriptomica do desenvolvemento de toxoplasma revela moitas funcións e estruturas novas específicas para esporozoitas e oocistros

.

PLOS ONE

.

2012

;

7

:

e29998

.

hon
C.-C.

,

WEBER
c.

,

SISMEIRO
O.

,

PROUX
C.

,

koutero
m

,

Deloger
m.

,

das
S.

,

agrahari
m.

,

dillies
m.-a.

,

jagla
b.

et al. ..

cuantificación do ruído estocástico de splicing e poliadenilación en entomoeba histolytica

.

ácidos nucleicos res.
2013

;

41

:

1936

1952

.

Siegel
tn

,

hekstra
dr

,

wang
x.

,

dewell
s.

,

Cross
gam
análise de genoma de abundancia de mRNA en Dúas etapas de ciclo de vida do tripano Brucei e identificación de splicing e sitios de poliadenilación

.

ácidos nucleicos res.
2010

;

38

:

4946

4957

.

yeoh
lm

,

Goodman
cd

,

mollard
v.

,

McFadden
gi

,

Ralph
SA
Transcriptómica comparativa de gametocitos masculinos e masculinos en Berghei plasmodium e a evolución do sexo en alvéolados

.

BMC Genomics

.

2017

;

18

:

734

.

hehl
ab

,

Basso
wu

,

Lippuner
c.

,

ramakrishnan
c.

,

Okoniewski
m.

,

walker
ra

,

grigg
me

,

Smith
nc

,

deplazes
p.
A expansión asexual dos toxoplasma gondii Merozoites é distinta de taquízoites e implica a expresión de familias xenéticas sen solapamento para achegar, invadir e replicar dentro dos enterocitos felinos

.

BMC Genomics

.

2015

;

16

:

66

.

Bushell
e.

,

gomes
ar

,

sanderson
t.

,

anar
b.

,

Girling
g.

,

Herd
c.

,

Metcalf
t.

,

modrzynska
k.

,

schwach
f.

,

Martin
RE

et al. ..

O perfil funcionivo dun xenoma de plasmodio revela unha abundancia de xenes esenciais

.

cela

.

2017

;

170

:

260

272

.

Mendez
d.

,

Gaulton
a.

,

bento
ap

,

cámaras
j.

,

de veij
m.

,

Félix
e.

,

magariños
MP

,

mosquera
jf

,

mutowo
p.

,

nowotka
m .

et al. ..

CHEMBL: cara á deposición directa dos datos de bioensayy

.

ácidos nucleicos res.
2019

;

47

:

D930

D940

.

peña
i.

,

pilar Manzano
m

,

cantizani
j.

,

kessler
a.

,

alonso-padilla
j.

,

bardera
ai

,

alvarez
e .

,

colmenarejo
g.

,

cotillo
i.

,

roquero
i.

et al. ..

Novos conxuntos compostos identificados a partir de alta proxección fenotípica de produción contra tres parasitos de Kinetoplastid: un recurso aberto

.

SCI. Rep.
2015

;

5

:

8771

.

spangenberg
t.

,

madrigueras
jn

,

kowalczyk
p.

,

McDonald
s.

,

pozos
tnc

,

willis
p.
O cadro de malaria de acceso aberto: un catalizador de descubrimento de drogas para enfermidades descoidadas

.

PLOS ONE

.

2013

;

8

:

e62906

.

Haider
n.
patrón de funcionalidad combinando como ferramenta complementaria eficiente busca estrutura / reacción: un enfoque

código aberto.

moléculas

.

2010

;

15

:

5079

5092

.

cheng
t.

,

zhao
y.

,

li
x.

,

lin
f.

,

xu
y.

,

zhang
x.

,

li
y.

,

Wang
r.

,

Lai
l.
Computación de coeficientes de partición de octanol-auga por Guiar un modelo aditivo con coñecemento

.

j. Chem. Inf. Modelo.
2007

;

47

:

2140

2148

.

o’boyle
nm

,

Banck
m.

,

James
CA

,

Morley
c.

,

vandermeersch
t.

,

hutchison
gr
abre babel: unha caixa de ferramentas químicas abertas

.

j. Cheminformatics

.

2011

;

3

:

33

.

heller
sr

,

mcnaught
a.

,

pletnev
i.

,

Stein
s.

,

TChekhovskoi
d.
Inchi, o identificador químico internacional IUPAC

.

j. Cheminformatics

.

2015

;

7

:

23

.

lipinski
CA

,

lombardo
f.

,

Dominy
bw

,

feeney
pj
experimental e enfoques computacionais para estimar a solubilidade e permeabilidade no descubrimento de drogas e a configuración de desenvolvemento

.

adv. Drug Deliv. Rev.
2001

;

46

:

3

26

.

congreve
m.

,

Carr
r.

,

murray
c.

,

jhoti
h.
unha “regra de tres” para o descubrimento de chumbo baseado en fragmentos

.

Dominia Discov. Hoxe

.

2003

;

8

:

876

877

.

Dalke
a.
CHEMFP – Formatos e ferramentas de impresión dixital rápido e portátil

.

j. Cheminformatics

.

2011

;

3

:

p12

.

Rogers
dj

,

tanimoto
tt
Un programa informático para clasificar as plantas

.

Ciencia

.

1960

;

132

:

1115

1118

.

youden
wj
Índice para a clasificación Probas de diagnóstico

.

cancro

.

1950

;

3

:

32

35

.

bostock
m.

,

Ogievetsky
v.

,

Heer
j.
D3 Documentos dirixidos a datos

.

IEEE Trans. Vis. Comput. Gráfico.
2011

;

17

:

2301

2309

.

Probst
d.

,

Reymond
j.-l.
SmilesDrawer: analizar e debuxar estruturas moleculares codificadas por sorrisos usando Javascript de lado cliente

.

j. Chem. Inf. Modelo.
2018

;

58

:

1

7

.

© o autor (s) 2019. Publicado por Oxford University Press en nome de Investigación de ácidos nucleicos.
Este é un artigo de acceso aberto distribuído baixo os termos da licenza Creative Commons recoñecemento non comercial (http://creativecommons.org/licenses/by-nc/4.0/), que permite a reutilización, distribución e reprodución non comercial En calquera medio, sempre que o traballo orixinal estea correctamente citado. Para a reutilización comercial, póñase en contacto con [email protected]