Resumen
O volume de datos biolóxicos, químicos e funcionais depositado no dominio público está crecendo rapidamente, grazas á secuenciación de próxima xeración e as tecnoloxías de selección altamente automatizadas. Estes conxuntos de datos representan recursos inestimables para o descubrimento de drogas, especialmente para os patóxenos de enfermidades menos estudadas. Para aproveitar estes conxuntos de datos, a integración de datos intelixentes e intensivos é necesaria para orientar inferencias computacionais en diversos organismos. Os obxectivos TDR son os recursos de quimiogenómicos integran datos xenómicos de patóxenos humanos e organismos modelo xunto con información sobre compostos bioactivos e as súas actividades anotadas. Este informe destaca as últimas actualizacións sobre os datos e funcionalidades dispoñibles nos obxectivos TDR 6. Con base nos modelos de rede de quimiogenómicos que proporcionan enlaces entre inhibidores e obxectivos, a base de datos agora incorpora prioridades obxecto de aprendizaxe dirixidas á rede e novas visualizacións de subgráficas de rede que amosan químicos e obxectivos -Similaridade barrios xunto con enlaces de bioactividade composta de destino asociados. Os datos dispoñibles poden ser navegados e consultados a través dunha nova interface de usuario que permite aos usuarios realizar prioridades de obxectivos de proteínas e inhibidores químicos. Como tal, os obxectivos TDR agora facilitan a investigación de medicamentos de medicamento contra os obxectivos de patóxenos, que poden axudar a identificar obxectivos candidatos a compostos bioactivos con obxectivos anteriormente descoñecidos. Os obxectivos TDR están dispoñibles en https://tdrtargets.org.
Introdución
Enfermidades tropicais descoidadas (NTD) afectan desproporcionadamente a 1,5 millóns de persoas en baixos ingresos e en desenvolvemento Países, onde son unha das principais causas de anos de vida perdidas á discapacidade e á morte prematura (1). Históricamente, a falta de implicación da industria farmacéutica, en combinación con limitado investimento en programas de investigación de saúde pública en países afectados, resultou nunha deficiencia de drogas dispoñibles para controlar de forma eficaz a maioría destas enfermidades (2). Ademais, as drogas actualmente en uso para tratar estas enfermidades adoitan comprometerse en termos de custo, dificultades na administración, eficacia, resistencia ás drogas ou perfís de seguridade.
O descubrimento de drogas é un proceso de tempo e custoso (3 , 4). Para NTD en particular, os programas de descubrimento de drogas deben sobrevivir o tempo suficiente a través de escaseza de financiamento penetrante para facelo en ensaios clínicos posteriores (5). Neste contexto, un enfoque estratéxico para o descubrimento de drogas NTD é o reposicionamento de drogas (6), que pode axudar a diminuír os custos facilitando as aprobacións reguladoras nos primeiros ensaios por medicamentos que xa sufriron a investigación clínica para outras enfermidades e / ou indicacións que a seguridade (6). Ademais, se o alcance da repursión de drogas é ampliado para incluír drogas e compostos bioactivos da investigación sobre organismos non humanos, tamén pode levar á identificación de polo menos novas ferramentas químicas para probando a función de obxectivos e vías nos patóxenos humanos. Así, aproveitando as grandes cantidades de datos dispoñibles a partir de programas de investigación ben financiados sobre enfermidades humanas e organismos modelo, a paisaxe de descubrimento de drogas en NTD recibe un impulso positivo (7).
As estratexias computacionais están cada vez máis Esencial no descubrimento de drogas translacionales, tanto na academia como na industria farmacéutica. A integración intelixente e intensiva dos volumes crecentes de datos xerados durante todas as fases do descubrimento de drogas xa está permitindo que os retos clave do proceso sexan abordados (8). Desde a súa introdución, a base de datos de TDR Obxectivos foi un recurso de confianza para que os investigadores de enfermidades descoidados accedan a datos de quimiogenómica para a priorización de drogas e os medicamentos repurecen sobre enfermidades descoidadas. Introducido en 2008 (9), este recurso acceso aberto permitiu aos investigadores atopar obxectivos nova proteína e inhibidores químicos, e prioriza-los para axudar o desenvolvemento de medicamentos para patógenos DTN. Os obxectivos TDR fan uso de conxuntos de datos funcionais de todo o mundo para que os usuarios poidan atopar e priorizar obxectivos en función do seu coñecemento da bioloxía do seu patóxeno de interese e natureza da enfermidade (10,11). Esta é implementada por unha selección de destino flexible e baseada no usuario (usando criterios de filtrado) e clasificación (utilizando ponderación específica de criterios) (12,13).
Aquí describimos as actualizacións dos conxuntos de datos subxacentes e Funcionalidade no recurso de obxectivos TDR, acumulado desde a súa publicación anterior en 2012 (13). Os novos obxectivos TDR (V6.1, abreviado TDR6 neste artigo) integra a información xenómica específica do patóxeno con datos funcionais (por exemplo)Expresión, relacións baseadas en ortoloxía, esencialidade) a partir dunha selección de organismos, xunto con datos de compostos bioactivos (estrutura química, propiedade e bioactividade / información de destino); Todos os cales poden ser consultados e navegados a través da aplicación web. Todas as consultas pódense gardar a un Stash persoal por usuarios rexistrados e publicados a través da aplicación web para maximizar as oportunidades de colaboración. As listas priorizadas de obxectivos poden ser exportados para unha análise máis destacada. Os detalles completos de todas as novidades pódense atopar nas notas de lanzamento (https://tdrtargets.org / Releases). Este informe presenta un paseo completo da aplicación web, as súas novidades e exemplos para ilustrar os casos de uso.
Resumo e organización de obxectivos TDR
Como en lanzamentos anteriores de obxectivos TDR, TDR6 tamén está organizado en dúas seccións principais: obxectivos e compostos. A sección de obxectivos da base de datos contén datos de xenoma para 20 patóxenos humanos e permite aos usuarios realizar consultas e prioridades de obxectivos proteicos baseados nunha serie de características e datos relevantes para o descubrimento de drogas (ver táboa 1). A sección de compostos da base de datos contén información sobre > 2 millóns de compostos bioactivos e permite consultas en función das propiedades químicas dos compostos e as súas bioactividades anotadas (ver táboa 2).
Consultas de destino dispoñibles en obxectivos TDR
grupo de consulta. | patóxenos para os que hai datos dispoñibles. | Tipos de datos dispoñibles para a consulta. |
---|---|---|
nomes & Anotacións | Todos | Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS) |
Características de proteínas | Todos | MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI). |
Información estrutural | Todos | Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase |
expresión xénica | Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii | Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas. |
Información filoxenética | Todos | Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados. |
essencialidade | C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei | inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo. |
Datos de validación de destino | Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum | Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos) |
drogabilidade | Todos | precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe. Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal) |
ensayabilidad | Todos | ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC) |
Referencias bibliográficas | Todos | Obxectivos de filtro baseados en publicacións dispoñibles |
grupo de consulta. | patóxenos para os que hai datos dispoñibles. | Tipos de datos dispoñibles para a consulta. |
---|---|---|
nomes & Anotacións | Todos | Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS) |
Características de proteínas | Todos | MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI). |
Información estrutural | Todos | Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase |
expresión xénica | Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii | Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas. |
Información filoxenética | Todos | Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados. |
essencialidade | C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei | inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo. |
Datos de validación de destino | Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum | Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos) |
drogabilidade | Todos | precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe. Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal) |
ensayabilidad | Todos | ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC) |
Referencias bibliográficas | Todos | Obxectivos de filtro baseados en publicacións dispoñibles |
consultas de destino dispoñibles na obxectivos TDR
grupo de consulta. | patóxenos para os que hai datos dispoñibles. | Tipos de datos dispoñibles para a consulta. |
---|---|---|
nomes & Anotacións | Todos | Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS) |
Características de proteínas | Todos | MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI). |
Información estrutural | Todos | Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase |
expresión xénica | Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii | Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas. |
Información filoxenética | Todos | Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados. |
essencialidade | C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei | inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo. |
Datos de validación de destino | Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum | Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos) |
drogabilidade | Todos | precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe.Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal) |
ensayabilidad | Todos | ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC) |
Referencias bibliográficas | Todos | Obxectivos de filtro baseados en publicacións dispoñibles |
grupo de consulta. | patóxenos para os que hai datos dispoñibles. | Tipos de datos dispoñibles para a consulta. |
---|---|---|
nomes & Anotacións | Todos | Identificadores de xenes e anotacións funcionais (números CE, Termos de VO, Dominios de PFAM, METABOLICA PATHWAY MAPPINGS) |
Características de proteínas | Todos | MW, punto isoeléctrico, presenza de péptido de sinal previsto, segmentos trans-membrana e ancoras de glicosilfoshatidilinositol (GPI). |
Información estrutural | Todos | Dispoñibilidade de estruturas 3D en PDB; Dispoñibilidade de modelos estruturais en modbase |
expresión xénica | Plasmodium spp.; Leishmania spp.; TRYPANOSOMA SPP.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba Histolytica; Toxoplasma gondii | Datos de expresión xénica dos etapas de ciclo de vida patóxenos e / ou condicións experimentais que son relevantes para o descubrimento de drogas. |
Información filoxenética | Todos | Obxectivos de filtro usando ‘presente / ausente’ simplificado noutros criterios de especies, baseado na información do grupo de ortoloxía .. Inclúe organismos modelo (humanos) e outros patóxenos relacionados. |
essencialidade | C. elegans (modelo para helminths); E. coli (modelo para bacterias); S. CEREVISIAE (modelo para patóxenos eucarióticos); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei | inferencia baseada en ortoloxía da esencialidade dos xenes nas etapas de ciclo de vida e / ou condicións experimentais relevantes para o descubrimento de drogas. Integrado a partir da interrupción do xenoma do xenoma seleccionada (por exemplo, o transposón, crispr / cas) e knockdown (e.g. rnai) en patóxenos e organismos modelo. |
Datos de validación de destino | Schistosoma Mansoni; Leishmania Major; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium falciparum | Datos comisariados manualmente sobre credenciais de validación de destino (fenotipos xeneticamente, químicos e / ou farmacolóxicos) |
drogabilidade | Todos | precedente para a exitosa modulación química da actividade ou función obxecto de aprendizaxe. Resumido nunha puntuación de drogabilidade calculada a partir do modelo de rede (ver texto principal) |
ensayabilidad | Todos | ensaios bioquímicos dispoñibles para proteínas obxectivos (mapeamento a base de números EC) |
Referencias bibliográficas | Todos | Obxectivos de filtro baseados en publicacións dispoñibles |
Consultas compostas dispoñibles en obxectivos TDR
grupo de consulta. | Tipos de datos dispoñibles para a consulta. |
---|---|
Buscas baseadas en texto | |
nomes & anotacións | nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi |
Propiedades químicas | Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski) |
Fórmula composta | Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n) |
bioactividade | Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo, IC50 < 5 μm) |
compostos huérfanos | buscar compostos que teñen informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas) |
compostos con obxectivos | Buscar compostos que teñen información de destino de información e mecanismo baseados en bicos |
Buscas baseadas en estrutura | |
similaridade composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos similares. A busca baséase na correspondencia das pegadas químicas |
Substitución composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento. |
grupo de consulta. | Tipos de datos dispoñibles para a consulta. |
---|---|
Buscas baseadas en texto | |
nomes & anotacións | nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi |
Propiedades químicas | Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski) |
Fórmula composta | Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n) |
bioactividade | Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo, IC50 < 5 μm) |
compostos huérfanos | buscar compostos que teñen informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas) |
compostos con obxectivos | Buscar compostos que teñen información de destino de información e mecanismo baseados en bicos |
Buscas baseadas en estrutura | |
similaridade composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos similares. A busca baséase na correspondencia das pegadas químicas |
Substitución composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento. |
Consultas compostas dispoñibles en obxectivos TDR
grupo de consulta. | Tipos de datos dispoñibles para a consulta. |
---|---|
Buscas baseadas en texto | |
nomes & anotacións | nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi |
Propiedades químicas | Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski) |
Fórmula composta | Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n) |
bioactividade | Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo, IC50 < 5 μm) |
compostos huérfanos | buscar compostos que teñen informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas) |
compostos con obxectivos | Buscar compostos que teñen información de destino de información e mecanismo baseados en bicos |
Buscas baseadas en estrutura | |
similaridade composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos similares. A busca baséase na correspondencia das pegadas químicas |
Substitución composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento. |
grupo de consulta. | Tipos de datos dispoñibles para a consulta. | |||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Buscas baseadas en texto | ||||||||||||||||||||||||||||||||
nomes & anotacións | nomes compostos ou sinónimos; Identificadores de bases de datos (por exemplo, Chembl, Pubchem); Identificadores de pulgadas de Inchi e Inchi | |||||||||||||||||||||||||||||||
Propiedades químicas | Peso molecular; Logp Octanol / Coeficiente de partición de auga; Número de Donantes e aceptores H, número de bonos flexibles e número de coincidencia de RO5 (Lipinski) | |||||||||||||||||||||||||||||||
Fórmula composta | Busca por compostos que conteñen un número específico ( por exemplo, 3) de átomos definidos (por exemplo, cl, f, br, n) | |||||||||||||||||||||||||||||||
bioactividade | Busca de texto en descricións de ensaios; Busca numérica de valores en ensaios (por exemplo,IC50 < 5 μM) | |||||||||||||||||||||||||||||||
compostos huérfanos | buscar compostos que teñan informes de bioactividade en todo o organismo ou ensaios de células enteiras, pero sen información de destino e mecanismo (huérdicos inhibidores / drogas) | |||||||||||||||||||||||||||||||
compostos con obxectivos | atopar compostos que teñen a base de información e mecanismo baseados ensaios | |||||||||||||||||||||||||||||||
Buscas baseadas en estrutura | ||||||||||||||||||||||||||||||||
similaridade composta | debuxar / pegar Estrutura 2D composta ou fragmentada e busca compostos similares. A busca baséase na correspondencia das pegadas químicas | |||||||||||||||||||||||||||||||
Substitución composta | Draw / Paste composto ou fragmento de estrutura 2D e busca compostos na base de datos que conteñen a consulta fragmento. |
especies. | CDs. | Pfam. | vai. | CE. | rutas. | Orthologs. | |
---|---|---|---|---|---|---|---|
plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |
PLASMODIUM VIVAX | 5344 | 3264 | 2631 | 641 | 806 | 5207 | |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |
CHLAMYDIA TRACHOMISIS | 887 | 704 | 598 | 269 | 357 | ||
Mycobacterium leprae | 1630 | 1236 | 929 | 628 | 611 | 1473 | |
Mycobacterium Tuberculosis | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |
trep Onema Pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |
Wolbachia Endosimbiont de B. Malayi | 805 | 628 | 577 | 308 | 382 | 688 | |
Brugia Malayi | 11316 | 7042 | 6368 | 1278 | 1787 | 8424 | |
Echinococcus granulosus | 10249 | 6481 | 5432 | 854 | 1965 | 7109 | |
echinococcus multilocularis | 10474 | 6817 | 5768 | 878 | 2079 | 7539 | |
Loa Loa (Worm Eye) | 16292 | 8071 | 6774 | 1539 | 2207 | 10484 | |
OnChocerca Volvulus | 12224 | 3248 | 2178 | 246 | 563 | 4054 | |
Schistosoma Mansoni | 12692 | 7818 | 7384 | 1218 | 1649 | ||
Leishmania Major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |
TRYPANOSOMA BRUCEI | 10270 | 5665 | 5482 | 1019 | 1264 | 9259 | |
trypanosoma Cruzi | 18639 | 9908 | 8572 | 1495 | 1735 | 18140 | |
Entamoeba Histolytica | 8211 | 4920 | 4087 | 645 | 1094 | 7692 | |
GIARDIA LAMBLIA | 9665 | 2726 | 2263 | 326 | 514 | 5977 | |
trichomonas vaginalis | 95600 | 35474 | 18435 | 843 | 1366 | 87303 |
especies. | CDs. | Pfam. | vai. | CE. | rutas. | Orthologs. |
---|---|---|---|---|---|---|
plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 |
PLASMODIUM VIVAX | 5344 | 3264 | 2631 | 641 | 806 | 5207 |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 |
CHLAMYDIA TRACHOMISIS | 887 | 704 | 598 | 269 | 357 | |
Mycobacterium leprae | 1630 | 1236 | 929 | 628 | 611 | 1473 |
Mycobacterium Tuberculosis | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 |
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 |
trep Onema Pallidum | 1036 | 791 | 634 | 221 | 335 | 733 |
Wolbachia Endosimbiont de B.malayi | 805 | 628 | 577 | 308 | 382 | 688 |
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | |
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | ||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | |
Loa Loa (verme ollo)
16292 |
8071 | 6774 | 1539
2207 10484 |
|||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | |
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 |
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | |
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | |
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 |
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Resumo dispoñibilidade de datos para os mellores patógenos liña. Resumo de datos de destino dispoñibles para Tier 1 organismos en Metas TDR. CDs: secuencias codificantes; Pfam: número de proteínas con mapeada Pfam dominio (s); GO: número de proteínas con mapeadas termos Gene ontoloxía; CE: número de proteínas con números mapeadas Comisión Enzyme (CE); Vías: número de proteínas mapeadas para mapas PATHWAY KEGG; Ortólogos: número de secuencias mapeadas para grupos OrthoMCL ortólogo. Unha táboa de resumo de datos máis completa está dispoñible en liña en https://tdrtargets.org / datasummary
Especies. | CDs. | PFAM. | GO. | CE. | PATHWAYS. | ortólogos. | ||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | ||||||||||||||||||||||||||
5344 | 3264 | 2631 | 641 | 806 | 5207 | |||||||||||||||||||||||||||
Toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | ||||||||||||||||||||||||||
Chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | ||||||||||||||||||||||||||
Mycobacterium leprae
1630 |
1236 | 929 | 628 | 611 | 1473 | |||||||||||||||||||||||||||
Mycobacterium tuberculosis | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | ||||||||||||||||||||||||||
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | ||||||||||||||||||||||||||
Trep onema pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | ||||||||||||||||||||||||||
Wolbachia endosymbiont de B.MALAYI | 588 | 588 | 388 | |||||||||||||||||||||||||||||
Brugia MALAYI
11316 |
7042 | 6368 | 1278 | 1787 | 6481 | 6481 | 854 | 1965 | 7109 | |||||||||||||||||||||||
Echinococcus multilocularis
10474 |
6817 | 779 | 758 | |||||||||||||||||||||||||||||
Loa Loa (Worm Eye) | 1509 071 | 1559 071 | 1539 071 | 679 071 | 15371 | 1539 071 | 1539 071 | 2207 | 10484 | 2378 | 2178 | 246 | 563 | 4054 | ||||||||||||||||||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
||||||||||||||||||||||||||||
Leishmania Major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | 5480 |
1019 | 1264 | 9259 | ||||||||||||||||||||||
Trypanosoma Cruzi
18639 |
9908 | 8572 | 1495 | 1735
D |
||||||||||||||||||||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | GIARDIA LAMBIA | 2263 | 2263 | 2735 272 |
3635 |
2235 |
514 |
5977 |
trichomonas vaginalis
|
95600 35474 18435 |
843 |
3c34827 “ CDS. |
PFAM. |
vai. |
CE. |
camiños. |
orthOogs. |
v id = “29971a56991” lasmoodium |
3322 551 |
|
|
|
7166 |
PLASMOX VIVAX |
|
641 | 606 06 06 06 06 5207 |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 |
598 | 269 | Mycobacterium | 1630 | 1236 P2 |
673 | |||||||||||||||||||||
Mycobaacterium tdulesis paper | 1174 | 1174 | 1174 | 1174 | 3287 | 873 | 1002 | 3459 | ||||||||||||||||||||||||
Trep. Onema pallven |
61 33 33 33 33 33 33 | 633 | ||||||||||||||||||||||||||||||
wolbia indussiabiante de bmalayi | 805 | 628 | 577 | 308 | 382 | 688 | ||||||||||||||||||||||||||
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | |||||||||||||||||||||||||||
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | ||||||||||||||||||||||||||||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | |||||||||||||||||||||||||||
Loa Loa (verme ollo)
16292 |
8071 | 6774 | 1539
2207 10484 |
|||||||||||||||||||||||||||||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | |||||||||||||||||||||||||||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
||||||||||||||||||||||||||||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | ||||||||||||||||||||||||||
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | |||||||||||||||||||||||||||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
||||||||||||||||||||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | |||||||||||||||||||||||||||
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | ||||||||||||||||||||||||||
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Dada a diversidade de organismos Integrado Obxectivos TDR e, en consecuencia, a variedade de fontes de datos necesario para cubrir toda a xenomas; esforzo substancial foi posta en estandarizar os datos de análise e recuperación de información a partir do xenoma destes organismos. A maior parte do xenoma completo EuPathDB obtivéronse a partir de (18), GenBank (19), GeneDB (20), Wormbase parasito (21), GenoList (22) ou Mycobrowser (23). Unha descrición completa das fontes de xenoma e dada na táboa anterior Adicional S1. Para actualizar os datos para organismos presentes na versión anterior de Metas TDR xenes codificadores de proteínas de liberación actual de genomas eran ou mapeado para xenes existentes nas Metas TDR, ou non entraron os novos rexistros. O mapeamento algoritmo utiliza unha combinación de condicións para rastrexar identificadores Gene través das versións e manter a identidade de xenes: as sumas de comprobación de secuencia correspondente (utilizando valores de 128 bits hash xerado polo algoritmo MD5), nomes de xene ou identificadores e explosión (24) SE ou combinacións perfectas son atopados. Despois de actualización de rexistros, o pipeline calcula propiedades fisicoquímicas que utilizan Pepstats (25), para saber se hai ámbitos transmembranares con TMHMM (26), os péptidos sinal con SignalP (27), e glicosilfosfatidilinositol Os puntos de ancoraxe, usando PredGPI (28). O algoritmo descarta todas as secuencias codificadoras non, os máis ben calquera pseudogenes, para evitar enganosa anotacións e minimizar falsos supostos durante os fluxos de traballo de priorización. A maioría dos TDR6, mencionado arriba todas as tarefas de xenoma integración e actualización foron rotas no fluxo de traballo automatizado para facilitar máis rápido actualizacións en lanzamentos futuros. Un esquema de actualización e Segmentación algoritmo se mostra na Figura Adicional anterior S1. O Pipeline tamén automatizar o cálculo de notas mediante estratexias individuais ad hoc para diferentes notas, contando con servizos web e APIs (apareceu no Kaas (29) Servizo de proteínas de cartografía para Vías Metabólicas eo Número de CE Clasificación de encimas, ou a OrthoMCL base de datos e ferramenta (30,31) para os grupos de cartografía ortólogo a proteínas. a Segmentación tamén depende de computación contra bases de datos instaladas localmente apareceu máis InterPro (32), utilizando InterProScan (33) para identificar domios proteicos Pfam () e mapear termos para vocabularios controlados e clasificacións (termos GO). funcionalidades adicionais apareceu máis 3D estruturas e modelos estruturais foron obtidos a partir do Protein Data Bank (34), utilizando servizos web e descargar do sitio web Modbase FTP (35), respectivamente.
Tamén o número de conxuntos de datos funcionais principais foron integrados nesta versión, incluíndo (i) os conxuntos de datos transcriptomic que proporcionan evidencia de expresión de xenes en etapas do ciclo de vida ou condicións experimentais que son pertinente a Drug Discovery (36-47) e (ii) os conxuntos de datos esencialidade derivado dous axentes patóxenos Apicomplexan (P. berghei e T. gondii) (16,48), que fornecen información de Estratexias Vital AUXILIAR prioritização.
Actualizacións de datos Chemical
Para os compostos bioactivos, tamén, os fluxos de traballo de actualización de datos foron automatizados para esta versión.A maioría dos compostos bioactivos foron recuperados desde a versión 24ª CHEMBL (49), que contén algúns conxuntos de conxuntos adicionais como os de caixas químicas específicas de patóxeno – gsk kinetoplastid caixas (50), caixa de patóxeno MMV (51). O proceso de integración comeza a partir das descricións de moléculas (2D) en formato SDF, a partir das cales calculamos todas as impresións dixitais compostas necesarias (necesarias para as buscas de similitud compostas / substructos) usando a lámpada (52). A tubaxe tamén calcula Propiedades químicas adicionais, como o coeficiente de octanol logP / auga partición e outros descritores estruturais utilizando xLogp3 (53), e as ferramentas abertas Babel obprop e obrotamer (54). Outros datos relevantes foron obtidos ou calculados directamente desde a estrutura composta, como os identificadores de Inchi e Inchikey (55) utilizados para o seguimento composto; e outras regras estándar de polgar usadas na química medicinal e ao descubrimento de drogas, como a regra de Lipinski de cinco (56) e a regra relacionada de tres (57).
Despois da integración en obxectivos TDR, todos os compostos foron suxeitos a todos vs todo o cálculo de comparación de semellanza química utilizando a CHEMFP (58) que produce medidas de semellanza de pares baseadas no índice de Tanimoto (59). Ademais, calculamos un mapa global (todo fronte a todos) de relacións de subestruturas entre compostos na base de datos (x é unha subestrutura de y; y é unha superestructura de x). Sabendo que o problema de atopar subgráficas comúns entre as moléculas é computacionalmente difícil, aplicamos un enfoque heurístico para atopar subestruturas. O algoritmo obtén un subconxunto de posibles moléculas candidatas mediante a utilización de impresións dixitais previamente calculadas. Os candidatos deben ter impresións dixitais coa molécula do asunto. Unha vez que se obteña unha lista de candidatos, a determinación de subestiminación de atom-atom-atom-atom-atom-atom-atom-atom-tot-atom está feito usando Matchmol (52). Os datos dispoñibles para compostos e as consultas que se poden executar en cada tipo de datos resúmense na táboa 2. O peso molecular (MW) e área de superficie polar (PSA) para todos os compostos da base de datos móstrase na figura complementaria S2.
Curación e integración de datos de bioactividade
Como con compostos químicos, a maioría das bioactividades integradas nos obxectivos TDR veñen directamente das fontes de datos de Upstream (por exemplo, Chembl). Ao integrar datos de bioactividade, preservamos tanto a anotación do ensaio (por exemplo, “Ensaio de redución de motilidade in vitro contra a microfilaria de Malayi de Brugia a 10 μm) eo valor numérico e as unidades asociadas a actividades compostas (por exemplo, o 80% de inhibición”, 1.5 μm IC50 ‘, ’10 NM MIC’), que son todos os campos de busca. Ademais, e para facilitar as consultas dos usuarios, as bioactividades informadas foron utilizadas para agrupar compostos ensagados en clases “activas” ou “inactivas”. Non obstante, para minimizar o efecto do uso de límites duros ao redor de limiares arbitrarios e aumentar a separación entre clasificacións activas / inactivas, tamén definimos unha área gris indeterminada. Por iso, os compostos de puntuación debaixo dun limiar arbitrario non se consideran inactivos para fins de consulta e visualización.
Non todos os tipos de actividade foron susceptibles de clasificar. A pesar dos esforzos na estandarización destes datos de actividade, a interpretación das actividades de compostos a esta escala é difícil, xa que a miúdo dependen do tipo de ensaio particular, as unidades reportadas e as condicións particulares nas que se realizou cada ensaio. Non obstante, un conxunto significativo de tipos de ensaio podería clasificarse automaticamente en categorías activas / indeterminadas / inactivas baseadas en limiar de actividade. Para iso, todos os tipos de ensaios con > 100 000 informes (ver complementaria S3 para unha actividade por tipo de ensaio / por compacto de distribución composta) foron considerados para a auditoría de actividade, aínda que só con ensaios baseados en concentración (como IC50, ki ou potencia) atopáronse o suficientemente robustos como para tal determinación, porque porcentaxe baseado en ensaios (como% actividade,% de actividade residual ou inhibición de $) foron ambiguos nos informes de bioactividade. Os limiares utilizados para clasificar as actividades para cada tipo de ensaio pódense atopar na táboa 4 e a distribución de compostos nestas clases de actividade resúmese na figura 5.
Tipos de ensaio e limiar de actividade utilizados para a determinación da etiqueta de actividade: só se empregaron ensaios baseados en concentración para determinar as etiquetas de actividade. As actividades que informan menos que o valor máximo admitido dos positivos consideráronse activos (+) interaccións, mentres que aqueles maiores que o “valor mínimo admitido por negativos” foron considerados inactivos (-). Calquera actividade que se informou entre estes dous valores foi considerada como indeterminada (0)
tipo de ensaio . |
Unidade estándar. | valor máximo admitido por activos. | valor mínimo admitido para inactivos. | |||||
---|---|---|---|---|---|---|---|---|
AC50 | nm | 20000 | 100000 | EC50 | NM | 20000 | 100000 | |
IC50 | NM | 20000 | 100000 | |||||
IC50 | UG ML-1 | 15 | 50 | |||||
kd | NM | 20000 | 100000 | |||||
ki | Nm | 20000 | 100000 | |||||
Potencia | NM | 20000 | 100000 |
Tipo de ensaio . |
Unidade estándar. | valor máximo admitido por activos. | valor mínimo admitido para inactivos. | |||||
---|---|---|---|---|---|---|---|---|
AC50 | nm | 20000 | 100000 | EC50 | NM | 20000 | 100000 | |
IC50 | NM | 20000 | 100000 | |||||
IC50 | UG ML-1 | 15 | 50 | |||||
kd | NM | 20000 | 100000 | |||||
ki | Nm | 20000 | 100000 | |||||
Potencia | NM | 20000 | 100000 |
Tipos de ensaio e limiar de actividade utilizados para a determinación da etiqueta de actividade: só se empregaron ensaios baseados en concentración para determinar as etiquetas de actividade. As actividades que informan menos que o valor máximo admitido dos positivos consideráronse activos (+) interaccións, mentres que aqueles maiores que o “valor mínimo admitido por negativos” foron considerados inactivos (-). Calquera actividade que se informou entre estes dous valores foi considerada como indeterminada (0)
tipo de ensaio . |
Unidade estándar. | valor máximo admitido por activos. | valor mínimo admitido para inactivos. | |||||
---|---|---|---|---|---|---|---|---|
AC50 | nm | 20000 | 100000 | EC50 | NM | 20000 | 100000 | |
IC50 | NM | 20000 | 100000 | |||||
IC50 | UG ML-1 | 15 | 50 | |||||
kd | NM | 20000 | 100000 | |||||
ki | Nm | 20000 | 100000 | |||||
Potencia | NM | 20000 | 100000 |
Tipo de ensaio . |
Unidade estándar. | valor máximo admitido por activos. | valor mínimo admitido para inactivos. | |||||
---|---|---|---|---|---|---|---|---|
AC50 | nm | 20000 | 100000 | EC50 | NM | 20000 | 100000 | |
IC50 | NM | 20000 | 100000 | |||||
IC50 | UG ML-1 | 15 | 50 | |||||
kd | NM | 20000 | 100000 | |||||
ki | Nm | 20000 | 100000 | |||||
Potencia | NM | 20000 | 100000 |
Etiquetas de actividade Distribución e evidencia Mesturas entre datos: (a) Diagrama de Venn que mostra a distribución de valores de bioactividade nas clases activas, inactivas e indeterminadas en TDR6 (ver o texto principal para máis detalles) .. Interseccións conta casos en que a mesma droga ten diferentes resultados de actividade contra o mesmo obxectivo. Exemplos destes casos son proporcionados en paneis B a F (ID de compostos representan identificadores TDR6). (B) Actividade de C329137 (unha hidroxi-benzamidina) contra P. falciparum bifunctional dihydrofolate reductase-thymidylate sintase. (C) Exemplo de rexistros positivos para inhibidores de aciltransferase humanos. (D) Exemplo de actividades negativas e neutras para compostos Triphenylcarbinol e benzohidrol, respectivamente. Finalmente, as probas positivas (E) e negativas (f) poden ser mesturadas con probas indeterminadas, como se mostra para C2164865 probado contra a colinestera do cabalo e C306882 probado contra o recombinante P. Falciparum deoxyuridine 5′-trifosphate nucleotido hidrolase, respectivamente.
Etiquetas de actividade Distribución e evidencia Mesturas entre datos: (a) Diagrama de Venn que mostra a distribución de valores de bioactividade no activo Clases inactivas e indeterminadas en TDR6 (ver o texto principal para máis detalles).Interseccións conta casos en que a mesma droga ten diferentes resultados de actividade contra o mesmo obxectivo. Exemplos destes casos son proporcionados en paneis B a F (ID de compostos representan identificadores TDR6). (B) Actividade de C329137 (unha hidroxi-benzamidina) contra P. falciparum bifunctional dihydrofolate reductase-thymidylate sintase. (C) Exemplo de rexistros positivos para inhibidores de aciltransferase humanos. (D) Exemplo de actividades negativas e neutras para compostos Triphenylcarbinol e benzohidrol, respectivamente. Finalmente, as probas positivas (E) e negativas (f) poden ser mesturadas con probas indeterminadas, como se mostra para C2164865 probado contra a colinestera do cabalo e C306882 probado contra o recombinante P. Falciparum deoxyuridine 5′-trifosphate nucleotido hidrolase, respectivamente.
O CHEMBL 24ª versión conta con máis de 15,2 millóns de bioactividades informadas, das cales só uns 6 millóns correspondían a relacións que impliquen medicamentos e obxectivos de proteínas (proteínas individuais, familias de proteínas e complexos de proteína, con ~ 93% sendo proteínas individuais). Outras bioactividades restantes na base de datos foron informes para unha gran variedade de obxectivos non proteicos, como as células enteiras (3,6 m), os organismos enteiros (2,2 millóns de tecidos (83k) e as macromoléculas non peptídicas (85k) ou Moléculas pequenas (< 100). Estes non foron utilizados na construción de rede, porque a rede é proteína (é dicir, obxectivo) céntrica. A Figura 5 tamén mostra algunhas visualizacións de rede de exemplo que representan como a TDR6 mostra estas bioactividades.
Integración de características derivadas de rede: drogabilidade e priorización
Como mencionado anteriormente, datos xenómicos, anotacións xenéticas, Os compostos químicos e as interaccións de medicamentos xenéticas integráronse nunha rede complexa orientada a medicamentos, como se describe en Berenstein et al. (14). A rede foi usada para calcular unha puntuación de drogabilidade de rede (NDS), para todos os obxectivos en prioridade (Tier 1) patóxenos. O NDS está relacionado coa posibilidade de atopar compostos bioactivos nas proximidades do gráfico de rede dun determinado obxectivo (o rango é de 0 a 1). O algoritmo foi descrito previamente en detalle (14), pero brevemente, baseado nunha proba de exceso de representación das proteínas drugables coñecidas anotadas, calcula unha puntuación de relevancia (RS) para cada dominio de PFAM e categorías de grupos de orthología da rede. A puntuación NDS para obter resultados de destino determinados a partir dunha suma acumulada ponderada sobre os RS de todas as contribucións de afiliación común ao nodo de destino e ás proteínas do veciño ligadas a compostos activos.
para facilitar a interpretación das puntuacións NDS realizamos un Avaliación estatística para identificar grupos distintos de drogabilidade (DG) en función de dous tipos de limiares que axudan a clasificar as previsións de drogabilidade en zonas de confianza. Estes son ilustrados na figura 6. Por unha banda, mentres todos os obxectivos de puntuación distinta de cero teñen algún grao de conectividade para brancos coñecidos-druggable, un baixo NDS suxire estas conexións non son relevantes para a avaliación druggability. Por iso, un corte de ruído (unha base de base calculada como 5 veces o valor de 0,25 por percentil da distribución completa da NDS) considérase identificar obxectivos de baixa puntuación. O segundo limiar derívase do índice máximo de Youen J (60), que se calcula como a puntuación na que tanto a especificidade como a sensibilidade son óptimas (a mellor sensibilidade sen comprometer a especificidade e viceversa). Este valor só pode ser calculado para patóxenos con verdadeiros positivos (obxectivos drugables coñecidos). Un mínimo arbitrario de 10 verdadeiros positivos foi considerado suficiente para a súa determinación de corte de Cutoff. Para outros patóxenos que faltan esa información, utilizouse un Cutoff Global Youen (calculado usando todos os verdadeiros positivos da rede). Os grupos de drogabilidade correspondentes son así: DG1 para obxectivos con valores NDS que van desde 0 ao limiar de ruído; DG2 para obxectivos con valores NDS que van desde o limiar de ruído ata o corte de Youde; e DGS 3, 4 e 5 con valores NDS que son 1-, 10- e 100 veces por riba do corte de Youde. En consecuencia, estes últimos grupos fan que os obxectivos drugables máis probables. A Figura 6 mostra un exemplo estático dunha priorización dirixida pola rede para Mycobacterium ulcerans (que carece de obxectivos con compostos coñecidos no lanzamento actual). Todas as prioridades para os obxectivos TDR para os organismos prioritarios poden verse en liña na páxina Resumo de datos para cada especie (ver https://tdrtargets.org / DatasMary, premendo sobre a especie de interese). Neste caso, as parcelas en liña son interactivas e poden ser ampliadas e exportadas. Nos casos en que hai obxectivos con compostos bioactivos coñecidos para a especie, estes móstranse de forma distinta na trama.
Whole-driven Priorización do obxectivo do xenoma para Mycobacterium ulcerans: obxectivos candidatos no xenoma de M. ulcerans foi clasificado polo seu NDS (puntuación de drogabilidade de rede, ver o texto principal).A trama mostra todos os obxectivos do xenoma (no eixe x) xunto coa súa puntuación NDS correspondente (no eixo Y). Os puntos vermellos corresponden aos obxectivos clasificados Top-10, con etiquetas que indican o nome do xene eo produto. Navega pola priorización do xenoma enteiro do resumo de datos, o usuario pode acceder a unha páxina de xenes facendo clic nel na trama de priorización. Un subgráfico Exemplo de Familia Genera EMBA / AMB / MABC móstrase (como se ve nas súas páxinas de xenes correspondentes). A figura tamén mostra zonas de confianza, DG1 (vermello): delimitado por cero e corte de ruído; DG2 (amarelo): Entre o ruído eo Cutoff Youen; e DG3-5: con puntuacións máis altas que o Cutoff Youen.
Genome enteiro dirixido á rede Priorización de obxectivos para Mycobacterium Ulcerans: os obxectivos candidatos no xenoma de M. ulcerans foron clasificados polo seu NDS (puntuación de drogabilidade de rede, ver o texto principal). A trama mostra todos os obxectivos do xenoma (no eixe x) xunto coa súa puntuación NDS correspondente (no eixo Y). Os puntos vermellos corresponden aos obxectivos clasificados Top-10, con etiquetas que indican o nome do xene eo produto. Navega pola priorización do xenoma enteiro do resumo de datos, o usuario pode acceder a unha páxina de xenes facendo clic nel na trama de priorización. Un subgráfico Exemplo de Familia Genera EMBA / AMB / MABC móstrase (como se ve nas súas páxinas de xenes correspondentes). A figura tamén mostra zonas de confianza, DG1 (vermello): delimitado por cero e corte de ruído; DG2 (amarelo): Entre o ruído eo Cutoff Youen; e DG3-5: con puntuacións superiores ao corte de YouTen.
Estas prioridades dirixidas por rede poden funcionar de ambos xeitos. Ao partir dun composto de interese, o algoritmo pode priorizar obxectivos, utilizando a similitude ponderada dos veciños químicos aos obxectivos candidatos iniciais. E ao comezar de destino de interese, pode priorizar compostos, utilizando obxectivos de veciños drugables conectados e despois seguir ligazóns ponderadas a inhibidores / drogas candidatas. Puntuacións precomputadas para compostos e para obxectivos son utilizados internamente por TDR6 e están no núcleo das transformacións de consulta baseadas en rede.
Network Sub-Graph Visualizations e interface de usuario Upgrade
a rede Sub -Graps para ambos compostos e obxectivos (e as súas respectivas puntuacións NDS) poden ser navegadas desde a aplicación web usando unha droga ou un obxectivo como punto de partida para obter suxestións para drogas non probadas ou obxectivos drugables, respectivamente. A través de visualizacións recentemente desenvolvidas, os usuarios poden consultar os barrios de rede en torno a drogas e obxectivos nas páxinas correspondentes. As listas de interaccións putativas derivadas de rede tamén poden ser exploradas en formato tabular baixo a “drogabilidade” (para obxectivos) e “seccións de obxectivos” coñecidos e previstos “(para drogas).
Estas visualizacións son conducidas por D3.JS (61) Implementación de disposicións forzadas para visualizacións sub-gráficas. Dentro do panel de subgrafo D3, os usuarios poden realizar buscas de nodos dentro do gráfico (identificadores obxecto de aprendizaxe), ademais de alternar a visibilidade dos obxectivos nunha especie por parte da especie e personalizar a opacidade dos nodos. Tomado conxuntos estas novas características proporcionan unha visualización clara e completa das proximidades de sub-rede de obxectivos e compostos, permitindo aos usuarios manipular os gráficos ao explorar os datos.
A interface de usuario (IU) e as ferramentas dispoñibles Para a repurición de medicamentos e a priorización obxecto de aprendizaxe pasaron por unha gran actualización. En primeiro lugar, a IU foi rediseñada baixo os estándares W3C para lograr unha aplicación máis sa e máis escalable. Integramos o bootstrap (https://getbootstrap.com/) e jQuery (https://jquery.com) no desenvolvemento e deseño da aplicación web TDR6 e na parte frontal Funcionalidade final. Para as consultas de estruturas compostas que temos licenciado e implementado a aplicación de debuxo químico de Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Os rexistros tabulados dentro das páxinas de destino e drogas agora usan o plugin jquey de javery de datos (https://datatables.net) para crear facilmente praginations, filtrando e ordenar funcións. Finalmente, as representacións 2D compostas agora xeráronse automaticamente usando unha implementación do módulo JavaScript SmileDer (62).
dispoñibilidade comercial de compostos
Un aspecto importante ao priorizar os compostos para a proba no laboratorio , é a súa dispoñibilidade. En TDR6 agora estamos mostrando información sobre a dispoñibilidade comercial de compostos. Actualmente comezamos esta función ligando con Molport (un mercado químico en liña que as fontes compostas de grandes provedores) e amosan aos usuarios unha pista visual en páxinas compostas que dan unha indicación rápida de se o composto está en stock ou pode ser feito para solicitar .. Debido a que a dispoñibilidade comercial de compostos está actualmente implementada en TDR6 en forma de consultas asíncronas contra Molport, neste momento esta función só está dispoñible no modo de navegación (non en consultas).Non obstante, os usuarios poden priorizar compostos utilizando calquera das estratexias de consulta dispoñibles en TDR6 e finalizar as súas seleccións compostas ao inspeccionar compostos manualmente para a dispoñibilidade comercial.
Discusión e direccións futuras
Os novos datos , a interface ea funcionalidade de TDR6 proporciona aos usuarios unha mellor navegación e visualización de obxectivos e compostos.
O modelo de rede actual conecta os obxectivos a través da afiliación das entidades (proteínas) a conceptos de anotación (dominios de PFAM, grupos de ortoloxía). Estes foron seleccionados en función da súa ampla cobertura e relativa facilidade de cálculo. Complementando estes conceptos con outros criterios importantes para a validación de obxectivos de drogas (esencialidade, expresión en etapas de ciclo de vida relevantes) pode ser realizada por usuarios coas ferramentas e funcionalidades proporcionadas por TDR6 pero no futuro pode ser integrado no propio modelo de rede subxacente, en Nenos por algúns organismos susceptibles de avaliación experimental de todo o xenoma.
Hai varias melloras clave necesarias para manter os obxectivos TDR relevantes para a comunidade de científicos que traballan en enfermidades tropicais. A integración dos metabólicos naturais e conectando estas pequenas moléculas a outros compostos bioactivos a través de subestruturas compartidas ou por semellanza química será un gran foco no futuro. Isto permitirá a navegación do gráfico de obxectivos de drogas utilizando os conceptos de reaccións bioquímicas, o que naturalmente conecta as enzimas non ortolóxicas a través dos seus substratos / produtos e cofactores compartidos.
Finalmente, como xa se mencionou antes (13), Aínda hai unha gran variedade de curación que hai que cubrir. Moitos compostos bioactivos foron probados pola comunidade de investigadores que traballan en enfermidades tropicais descoidadas. Con todo, moitos destes ensaios e os resultados son relativos en revistas fóra do mainstream revistas Medicinal Chemistry, e polo tanto, se perde por grandes esforzos de curadoria, como o liderado por ChEMBL (49). Curación e integración destes datos que faltan (incluíndo datos negativos!) Debería ser unha prioridade para a comunidade, xa que aforraría un valioso tempo e recursos.
Datos complementarios
Os datos complementarios están dispoñibles en Nar en liña.
Recoñecementos
Os autores desexan agradecer a Matthew Berminan e Magdalena Zarowiecki (Wellcome Trust Sanger Institute) para compartir datos de xenoma de echinococcus pre-liberación e anotación de inclusión en TDR Obxectivos; e Ben Webb e Andrej Sali (Universidade de California San Francisco) para o cálculo de modelos 3D para xenomas de patóxenos de nivel 1 en obxectivos TDR. L.u.l., a.b. e s.v. foron ou son compatibles con becas do Consello Nacional de Investigación (Conicet, Arxentina). A.C. e F.A. son membros da carreira investigadora do Consello Nacional de Investigación (Conicet, Arxentina). P.M. Quere recoñecer unha bolsa de subvencións da Universidade (UGC), India.
Financiamento
GlaxoSmithKline Arxentina e da Axencia Nacional de Promoción da Ciencia e Tecnoloxía, Arxentina (Anpcyt); Proxecto de cooperación bilateral indo-arxentina (financiamento conxunto do Departamento de Ciencia e Tecnoloxía India (DST) e do Ministerio de Ciencia e Tecnoloxía Arxentina (Mincyt). Financiamento para carga de acceso aberto: Fondo para a investigación Científica e Tecnológica.
Conflito de Interese. Ningún declarado.
Notas
Enderezo actual: Ariel J Berenstein, Instituto Multidisciplinario de Investigacións en Patologías Pediatricas (Impp), Conicet-Gcba, Laboratorio de Biología Molecular, División Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Bos Aires, Arxentina.
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
,
,
,
,
.
;
:
.
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
.
,
,
,
,
,
,
.
.
;
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
.
,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
,
..
;
:
–
.
,
,
,
.
;
:
–
.
,
,
.
.
;
:
–
.
,
,
,
,
,
,
.
.
;
:
.
,
.
.
;
.
,
,
,
.
;
:
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
.
.
;
:
.
,
,
,
,
.
;
:
–
.
,
,
jr,
.
;
:
–
.
,
,
,
,
,
,
,
,
jr
.
;
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
.
;
:
–
.
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. ..
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. ..
.
;
:
.
,
,
,
,
,
.
.
;
:
.
código aberto.
.
;
:
–
.
,
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
,
,
,
,
.
.
;
:
.
,
,
,
.
;
:
–
.
,
,
,
.
.
;
:
–
.
.
.
;
:
.
,
.
.
;
:
–
.
.
.
;
:
–
.
,
,
.
;
:
–
.
,
.
;
:
–
.