Cibles TDR 6: Découverte de la drogue de conduite pour les agents pathogènes humains grâce à une intégration de données chimiogénomique intensive

abstrait

Le volume de données biologiques, chimiques et fonctionnelles déposées dans le domaine public se développe rapidement, grâce au séquençage de la prochaine génération et aux technologies de dépistage hautement automatisées. Ces ensembles de données représentent des ressources précieuses pour la découverte de médicaments, en particulier pour les agents pathogènes de maladie négligés moins étudiés. Pour tirer parti de ces ensembles de données, une intégration de données intelligente et intensive est nécessaire pour guider les inférences de calcul à divers organismes. La TDR cible la ressource de chimiogénomique intègre des données génomiques provenant des agents pathogènes humains et des organismes modèles ainsi que des informations sur les composés bioactifs et leurs activités annotées. Ce rapport met en évidence les dernières mises à jour sur les données et fonctionnalités disponibles dans les objectifs du TDR 6. Sur la base des modèles de réseau chimiogénomique fournissant des liens entre des inhibiteurs et des objectifs, la base de données intègre désormais des priorités cibles axées sur le réseau et de nouvelles visualisations de sous-graphes de réseau affichant la chimie et la cible QuartiersImarchés avec des liens de bioactivité de cible associés. Les données disponibles peuvent être parcourues et interrogées via une nouvelle interface utilisateur, permettant aux utilisateurs d’effectuer des priorités d’objectifs de protéines et d’inhibiteurs de produits chimiques. En tant que tels, les objectifs du TDR facilitent désormais l’enquête sur la réutilisation de médicaments contre des cibles d’agents pathogènes, ce qui peut potentiellement aider à identifier les objectifs candidats aux composés bioactifs avec des cibles auparavant inconnues. Les cibles du TDR sont disponibles à https://tdrtargets.org.

Introduction

Les maladies tropicales négligées (NTD) affectent de manière disproportionnée ~ 15 milliards de personnes à faible revenu et en développement Les pays, où ils constituent une cause de premier plan pour les années de vie perdues au handicap et à la mort prématurée (1). Historiquement, le manque d’implication de l’industrie pharmaceutique, associé à des investissements limités dans les programmes de recherche sur la santé publique dans les pays touchés, a entraîné une lacune de médicaments disponibles pour contrôler efficacement la majorité de ces maladies (2). De plus, les médicaments actuellement utilisés pour traiter ces maladies sont souvent compromis en termes de coût, de difficultés d’administration, d’efficacité, de résistance à la drogue ou de profils de sécurité.

Discovery médicamenteux est un processus fastidieux et coûteux (3 , 4). Pour les NTD en particulier, les programmes de découverte de la drogue doivent survivre suffisamment longtemps grâce à des pénuries de financement omniprésentes pour en faire des essais cliniques ultérieurs (5). Dans ce contexte, une approche stratégique pour la découverte de la drogue de la NTD est le repositionnement de la drogue (6), ce qui peut aider à réduire les coûts en facilitant les approbations réglementaires des premiers essais pour les médicaments qui ont déjà subi une recherche clinique pour d’autres maladies et / ou des indications et ont échoué pour des raisons autres. que la sécurité (6). En outre, si la portée de la réutilisation de médicaments est élargie pour inclure des médicaments et des composés bioactifs de la recherche sur les organismes non humains, il peut également entraîner l’identification d’au moins de nouveaux outils chimiques pour sonder la fonction des cibles et des voies des agents pathogènes humains. Ainsi, en tirant parti des vastes quantités de données provenant de programmes de recherche bien financés sur les maladies humaines et les organismes modèles, le paysage de la découverte de médicaments sur les NTDS obtient un coup de pouce positif (7).

stratégies de calcul devient de plus en plus Indispensable dans la découverte des médicaments traductionnels, tant dans les universités que dans l’industrie pharmaceutique. L’intégration intelligente et intensive des volumes croissants de données générée au cours de toutes les phases de la découverte de médicaments permettent déjà de traiter les principaux défis du processus (8). Depuis son introduction, la base de données TDR cible a été une ressource fiable pour les chercheurs de maladies négligés pour accéder aux données de chimenomologie pour la hiérarchisation des cible de médicaments et la réutilisation de médicaments sur des maladies négligées. Introduit en 2008 (9), cette ressource d’accès ouvert a permis aux chercheurs de trouver de nouvelles cibles de protéines et des inhibiteurs de produits chimiques et de les hiérarchiser pour le développement de médicaments pour les pathogènes de la NTD. Les cibles du TDR utilisent des jeux de données fonctionnels à l’échelle du génome publiquement disponibles afin de permettre aux utilisateurs de trouver et de hiérarchiser les objectifs en fonction de leurs connaissances de la biologie de leur agent d’intérêt et de la nature de la maladie (10,11). Ceci est implémenté par une sélection de cible flexible et basée sur l’utilisateur (à l’aide de critères de filtrage) et du classement (en utilisant une pondération spécifique à des critères) (12,13).

ici, nous décrivons les mises à niveau sur les jeux de données sous-jacents et La fonctionnalité dans la ressource TDR cible, accumulée depuis sa publication précédente en 2012 (13). La nouvelle version de TDR cible (V6.1, TDR6 abrégée dans cet article) intègre des informations génomiques spécifiques à l’agent pathogène avec des données fonctionnelles (par exemple.l’expression, les relations à base d’orthologie, l’essentialité) d’une sélection d’organismes, ainsi que des données de composés bioactifs (structure chimique, propriété et bioactivité / informations cible); Tous peuvent être interrogés et parcourus à travers l’application Web. Toutes les questions peuvent être enregistrées sur une réserve personnelle par les utilisateurs enregistrés et publiées via l’application Web pour maximiser les opportunités de collaboration. Les listes de cibles prioritaires peuvent être exportées pour une analyse hors ligne. Les détails complets de toutes les nouvelles fonctionnalités sont disponibles dans les notes de version (https://tdrtargets.org / Communiqués). Ce rapport présente une procédure normale complète de l’application Web, ses nouvelles fonctionnalités et des exemples visant à illustrer les cas d’utilisation.

Aperçu et organisation des cibles TDR

comme dans les versions précédentes des cibles du TDR, TDR6 est également organisé en deux sections principales: cibles et composés. La section cibles de la base de données contient des données à l’échelle du génome de 20 agents pathogènes humains et permet aux utilisateurs d’exécuter des requêtes et des hiérarchies d’objectifs de protéines basées sur un certain nombre de fonctionnalités et de données pertinentes pour la découverte de médicaments (voir tableau 1). La section Composés de la base de données contient des informations sur > 2 millions de composés bioactifs et permet des requêtes en fonction des propriétés chimiques des composés et de leurs bioactivités annotées (voir tableau 2).

Tableau 1.

requêtes cibles disponibles dans les cibles TDR

groupe de requêtes. Pathogènes pour lesquels des données sont disponibles. Types de données disponibles pour interrogation.
noms & Annotations Tous identifiants de gènes et annotations fonctionnelles (numéros de la CE, termes de go, domaines PFAM, mappages de voie métabolique) Caractéristiques des protéines Tous MW, point isoélectrique, présence de peptide signal prédit, de segments de membrane trans-membrane et d’ancres glycosylphosphatidylinositol (GPI). Informations structurelles Tous Disponibilité des structures 3D en PDB; Disponibilité des modèles structurels dans modbase expression gène plasmodium spp.; Leishmania spp.; Trypanosome spp.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba histolytica; TOXOPLASMA GONFIII Données d’expression des gènes des étapes du cycle de vie pathogène et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Informations phylogénétiques Tous Cibles de filtrage à l’aide de «présents / absents» simplifiés dans d’autres critères d’espèce, en fonction des informations de groupe ortholog. . Comprend des organismes modèles (humains) et d’autres agents pathogènes connexes. essentialité C. elegans (modèle pour Helminths); E. coli (modèle pour bactéries); S. cerevisiae (modèle pour les agents pathogènes eucaryotes); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei L’inférence sur l’essentialité d’essentialité des gènes dans des étapes de cycle de vie et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Intégré de la perturbation de gènes de génome sélectionnée (par exemple, des jeux de données sur des agents pathogènes et des organismes modèles. Données de validation cible Schistosoma Mansoni; Leishmania majeur; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium Falciparum Conférence manuellement des données sur les informations d’identification de la validation de la cible (phénotypes génétiques, chimiques et / ou pharmacologiques, observés) droguérabilité Tous précédent pour une modulation chimique réussie de l’activité ou de la fonction cible. Résumés dans un score de pharmacibilité calculé à partir du modèle de réseau (voir texte principal) Assayabilité Tous dosages biochimiques disponibles pour protéines cibles (mappage basé sur les numéros de la CE) Références bibliographiques Tous Cibles de filtrage basées sur des publications disponibles
« 1b01f6074e »>

« 0C75667CCE »>

groupe de requêtes. Pathogènes pour lesquels des données sont disponibles. Types de données disponibles pour interrogation.
noms & Annotations Tous identifiants de gènes et annotations fonctionnelles (numéros de la CE, termes de go, domaines PFAM, mappages de voie métabolique) Caractéristiques des protéines Tous MW, point isoélectrique, présence de peptide signal prédit, de segments de membrane trans-membrane et d’ancres glycosylphosphatidylinositol (GPI). Informations structurelles Tous Disponibilité des structures 3D en PDB; Disponibilité des modèles structurels dans modbase expression gène plasmodium spp.; Leishmania spp.; Trypanosome spp.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba histolytica; TOXOPLASMA GONFIII Données d’expression des gènes des étapes du cycle de vie pathogène et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Informations phylogénétiques Tous Cibles de filtrage à l’aide de «présents / absents» simplifiés dans d’autres critères d’espèce, en fonction des informations de groupe ortholog. . Comprend des organismes modèles (humains) et d’autres agents pathogènes connexes. essentialité C. elegans (modèle pour Helminths); E. coli (modèle pour bactéries); S. cerevisiae (modèle pour les agents pathogènes eucaryotes); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei L’inférence sur l’essentialité d’essentialité des gènes dans des étapes de cycle de vie et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Intégré de la perturbation de gènes de génome sélectionnée (par exemple, des jeux de données sur des agents pathogènes et des organismes modèles. Données de validation cible Schistosoma Mansoni; Leishmania majeur; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium Falciparum Conférence manuellement des données sur les informations d’identification de la validation de la cible (phénotypes génétiques, chimiques et / ou pharmacologiques, observés) droguérabilité Tous précédent pour une modulation chimique réussie de l’activité ou de la fonction cible. Résumés dans un score de pharmacibilité calculé à partir du modèle de réseau (voir texte principal) Assayabilité Tous dosages biochimiques disponibles pour protéines cibles (mappage basé sur les numéros de la CE) Références bibliographiques Tous Cibles de filtrage basées sur des publications disponibles
« A4C5658932 »>

TABLE 1 .

requêtes cibles disponibles dans les cibles TDR

groupe de requêtes. Pathogènes pour lesquels des données sont disponibles. Types de données disponibles pour interrogation.
noms & Annotations Tous identifiants de gènes et annotations fonctionnelles (numéros de la CE, termes de go, domaines PFAM, mappages de voie métabolique) Caractéristiques des protéines Tous MW, point isoélectrique, présence de peptide signal prédit, de segments de membrane trans-membrane et d’ancres glycosylphosphatidylinositol (GPI). Informations structurelles Tous Disponibilité des structures 3D en PDB; Disponibilité des modèles structurels dans modbase expression gène plasmodium spp.; Leishmania spp.; Trypanosome spp.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba histolytica; TOXOPLASMA GONFIII Données d’expression des gènes des étapes du cycle de vie pathogène et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Informations phylogénétiques Tous Cibles de filtrage à l’aide de «présents / absents» simplifiés dans d’autres critères d’espèce, en fonction des informations de groupe ortholog. . Comprend des organismes modèles (humains) et d’autres agents pathogènes connexes. essentialité C. elegans (modèle pour Helminths); E. coli (modèle pour bactéries); S. cerevisiae (modèle pour les agents pathogènes eucaryotes); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei L’inférence sur l’essentialité d’essentialité des gènes dans des étapes de cycle de vie et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Intégré de la perturbation de gènes de génome sélectionnée (par exemple, des jeux de données sur des agents pathogènes et des organismes modèles. Données de validation cible Schistosoma Mansoni; Leishmania majeur; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium Falciparum Conférence manuellement des données sur les informations d’identification de la validation de la cible (phénotypes génétiques, chimiques et / ou pharmacologiques, observés) droguérabilité Tous précédent pour une modulation chimique réussie de l’activité ou de la fonction cible.Résumés dans un score de pharmacibilité calculé à partir du modèle de réseau (voir texte principal) Assayabilité Tous dosages biochimiques disponibles pour protéines cibles (mappage basé sur les numéros de la CE) Références bibliographiques Tous Cibles de filtrage basées sur des publications disponibles
« 1b01f6074e »>

« 0C75667CCE »>

groupe de requêtes. Pathogènes pour lesquels des données sont disponibles. Types de données disponibles pour interrogation.
noms & Annotations Tous identifiants de gènes et annotations fonctionnelles (numéros de la CE, termes de go, domaines PFAM, mappages de voie métabolique) Caractéristiques des protéines Tous MW, point isoélectrique, présence de peptide signal prédit, de segments de membrane trans-membrane et d’ancres glycosylphosphatidylinositol (GPI). Informations structurelles Tous Disponibilité des structures 3D en PDB; Disponibilité des modèles structurels dans modbase expression gène plasmodium spp.; Leishmania spp.; Trypanosome spp.; Mycobacterium tuberculosis; Echinococcus multilocularis; Entamoeba histolytica; TOXOPLASMA GONFIII Données d’expression des gènes des étapes du cycle de vie pathogène et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Informations phylogénétiques Tous Cibles de filtrage à l’aide de «présents / absents» simplifiés dans d’autres critères d’espèce, en fonction des informations de groupe ortholog. . Comprend des organismes modèles (humains) et d’autres agents pathogènes connexes. essentialité C. elegans (modèle pour Helminths); E. coli (modèle pour bactéries); S. cerevisiae (modèle pour les agents pathogènes eucaryotes); Trypanosoma brucei; Mycobacterium tuberculosis; Toxoplasma gondii; Plasmodium Berghei L’inférence sur l’essentialité d’essentialité des gènes dans des étapes de cycle de vie et / ou des conditions expérimentales pertinentes pour la découverte de médicaments. Intégré de la perturbation de gènes de génome sélectionnée (par exemple, des jeux de données sur des agents pathogènes et des organismes modèles. Données de validation cible Schistosoma Mansoni; Leishmania majeur; Trypanosoma Cruzi; Trypanosoma brucei; Mycobacterium leprae; Mycobacterium tuberculosis; Plasmodium Falciparum Conférence manuellement des données sur les informations d’identification de la validation de la cible (phénotypes génétiques, chimiques et / ou pharmacologiques, observés) droguérabilité Tous précédent pour une modulation chimique réussie de l’activité ou de la fonction cible. Résumés dans un score de pharmacibilité calculé à partir du modèle de réseau (voir texte principal) Assayabilité Tous dosages biochimiques disponibles pour protéines cibles (mappage basé sur les numéros de la CE) Références bibliographiques Tous Cibles de filtrage basées sur des publications disponibles
« A4C5658932 »>

TABLE 2 .

requêtes composées disponibles dans les cibles TDR

groupe de requêtes. Types de données disponibles pour interrogation. Recherches de texte noms & annotations noms composés ou synonymes; Identificateurs de base de données (par exemple chimibl, pubchem); Identificateurs de clé Inchi et Inchi Propriétés chimiques Poids moléculaire; Coefficient de partition d’octanol / eau de Logp; Nombre de donateurs et d’accepteurs h, nombre d’obligations flexibles et de nombre d’assorties RO5 (lipinski) formule composée Recherche par composé contenant un nombre spécifique ( par exemple 3) des atomes définis (par exemple, cl, f, br, n) bioactivité recherche de texte sur des descriptions de dosage; Recherche numérique de valeurs dans les tests (par exemple, IC50 < 5 μm) composés orphelins recherche de composés qui ont des rapports de bioactivité dans des analyses entiers ou des analyses à cellules entières mais manquent d’informations de cible et de mécanisme (inhibiteurs d’orphelins / médicaments) composés avec des cibles trouver Les composés qui ont des analyses cibles et des analyses basées sur des mécanismes recherchées à base de structure Similaire composé Structure du composé ou de la structure 2D de décomposition ou de fragment de pâte et recherchez des composés similaires. La recherche est basée sur la correspondance des empreintes chimiques Substructure de composée Structure du composé dessinée / coller ou de fragment 2D et recherchez des composés dans la base de données contenant la requête contenant la requête fragment.
groupe de requêtes. Types de données disponibles pour interrogation. Recherches de texte noms & annotations noms composés ou synonymes; Identificateurs de base de données (par exemple chimibl, pubchem); Identificateurs de clé Inchi et Inchi Propriétés chimiques Poids moléculaire; Coefficient de partition d’octanol / eau de Logp; Nombre de donateurs et d’accepteurs h, nombre d’obligations flexibles et de nombre d’assorties RO5 (lipinski) formule composée Recherche par composé contenant un nombre spécifique ( par exemple 3) des atomes définis (par exemple, cl, f, br, n) bioactivité recherche de texte sur des descriptions de dosage; Recherche numérique de valeurs dans les tests (par exemple, IC50 < 5 μm) composés orphelins recherche de composés qui ont des rapports de bioactivité dans des analyses entiers ou des analyses à cellules entières mais manquent d’informations de cible et de mécanisme (inhibiteurs d’orphelins / médicaments) composés avec des cibles trouver Les composés qui ont des analyses cibles et des analyses basées sur des mécanismes recherchées à base de structure Similaire composé Structure du composé ou de la structure 2D de décomposition ou de fragment de pâte et recherchez des composés similaires. La recherche est basée sur la correspondance des empreintes chimiques Substructure de composée Structure du composé dessinée / coller ou de fragment 2D et recherchez des composés dans la base de données contenant la requête contenant la requête fragment.

Tableau 2.

requêtes composées disponibles dans les cibles TDR

0C75667CCE « >

groupe de requêtes. Types de données disponibles pour interrogation. Recherches de texte noms & annotations noms composés ou synonymes; Identificateurs de base de données (par exemple chimibl, pubchem); Identificateurs de clé Inchi et Inchi Propriétés chimiques Poids moléculaire; Coefficient de partition d’octanol / eau de Logp; Nombre de donateurs et d’accepteurs h, nombre d’obligations flexibles et de nombre d’assorties RO5 (lipinski) formule composée Recherche par composé contenant un nombre spécifique ( par exemple 3) des atomes définis (par exemple, cl, f, br, n) bioactivité recherche de texte sur des descriptions de dosage; Recherche numérique de valeurs dans les tests (par exemple, IC50 < 5 μm) composés orphelins recherche de composés qui ont des rapports de bioactivité dans des analyses entiers ou des analyses à cellules entières mais manquent d’informations de cible et de mécanisme (inhibiteurs d’orphelins / médicaments) composés avec des cibles trouver Les composés qui ont des analyses cibles et des analyses basées sur des mécanismes recherchées à base de structure Similaire composé Structure du composé ou de la structure 2D de décomposition ou de fragment de pâte et recherchez des composés similaires. La recherche est basée sur la correspondance des empreintes chimiques Substructure de composée Structure du composé dessinée / coller ou de fragment 2D et recherchez des composés dans la base de données contenant la requête contenant la requête fragment.
groupe de requêtes. Types de données disponibles pour interrogation. Recherches de texte noms & annotations noms composés ou synonymes; Identificateurs de base de données (par exemple chimibl, pubchem); Identificateurs de clé Inchi et Inchi Propriétés chimiques Poids moléculaire; Coefficient de partition d’octanol / eau de Logp; Nombre de donateurs et d’accepteurs h, nombre d’obligations flexibles et de nombre d’assorties RO5 (lipinski) formule composée Recherche par composé contenant un nombre spécifique ( par exemple 3) des atomes définis (par exemple, cl, f, br, n) bioactivité recherche de texte sur des descriptions de dosage; Recherche numérique de valeurs dans les tests (par exemple.IC50 < 5 μm) composés orphelins recherche de composés contenant des rapports de bioactivité dans l’organisme entier ou des analyses de cellules entières mais manquent d’informations sur la cible et le mécanisme (inhibiteurs d’orphelins / médicaments) composés avec des cibles trouvent des composés qui ont des informations cibles et basées sur le mécanisme tests recherche basée sur la structure Similaire composé dessin / pâte Structure de composé ou fragment 2D et recherche de composés similaires. La recherche est basée sur la correspondance des empreintes chimiques Substructure de composée Structure du composé dessinée / coller ou de fragment 2D et recherchez des composés dans la base de données contenant la requête contenant la requête fragment.
« A4C5658932 »>

nouvelles fonctionnalités de Cibles TDR 6

Nous avons récemment signalé un modèle de réseau intégrateur (14) où tous les ensembles de données à échelle génomique disponibles dans des objectifs de TDR (cibles de protéines), informations chimiques (composés bioactifs) et leurs relations (bioactivité de composés dans Les tests basés sur la cible) ont été liés à un graphique multicouche. Dans TDR6, ce modèle de réseau a été mis à jour en intégrant de nouveaux ensembles de données (décrits ci-dessous). Ce modèle intègre des liens entre des cibles et des composés bioactifs dérivés de la curation manuelle des tests de bioactivité publiés (liens directs entre cibles et composés chimiques), ainsi que des relations calculées (liaisons cibles cibles et des liaisons composés composés) à base d’annotations de protéines (Domaines PFAM, groupes ortholog) et similarité chimique. Un aspect clé de ces liens dans le modèle multicouche-réseau est qu’ils permettent d’explorer et de visualiser rapidement le voisinage autour de cibles sélectionnées et / ou de composés bioactifs. Cela permet aux utilisateurs d’explorer les composés liés aux cibles, d’inspecter le quartier de similarité chimique autour de composés bioactifs et de visualiser ces données de manière conviviale et complète (voir la figure 1).

Figure 1.

Modèle de réseau schématique dans les visualisations de TDR6 et de sous-graphique: les pages composées ou cible affichent maintenant une visualisation sous-graphique contenant des objets contenant des objets du réseau de l’entité sélectionnée. Ces graphiques sont construits à partir d’un graphique réseau complexe à trois couches. Un schéma de ce graphique est présenté en haut. Les sous-graphiques cibles et composés sont toujours agencés comme suit: Les nœuds de composés (vert) sont connectés à des cibles (orange = pathogènes; gris = non pathogènes) à travers des bords de bioactivité. Ces liens représentent des résultats positifs (verts), neutres (gris) ou négatifs (rouge) (rouge). Enfin, cible la carte dans un ensemble d’affiliations fonctionnelles (annotations, nœuds bleus). Dans l’exemple, le graphique montre un ensemble d’inhibiteurs connus pour une acyltransférase humaine (15). Ces bioactivités (toutes positives) sont dessinées sous forme de liaisons vertes entre les composés (nœuds verts) et la cible (nœuds gris pour les nœuds non pathogènes, nœuds orange pour agents pathogènes). Le graphique met en évidence les opportunités de réutilisation des acyltransférases helminthe (lignes pointillées, ajoutées manuellement pour cette figure), basée sur des annotations partagées avec la cible humaine pharmactable connue. Le nœud rouge dans la couche de drogue indique le composé sélectionné. Les tailles de nœuds sont déterminées par le nombre de connexions dans le réseau (degré), tandis que les largeurs de liaison de bioactivité (bords) sont liées au nombre cumulé de preuves expérimentales pour une paire cible de médicament donnée (nombre d’essais).

Figure 1.

Modèle de réseau schématique dans TDR6 et les visualisations de sous-graphique: Les pages composées ou cible affichent maintenant une visualisation sous-graphique contenant des objets dans le Vicité du réseau de l’entité sélectionnée. Ces graphiques sont construits à partir d’un graphique réseau complexe à trois couches. Un schéma de ce graphique est présenté en haut. Les sous-graphiques cibles et composés sont toujours agencés comme suit: Les nœuds de composés (vert) sont connectés à des cibles (orange = pathogènes; gris = non pathogènes) à travers des bords de bioactivité. Ces liens représentent des résultats positifs (verts), neutres (gris) ou négatifs (rouge) (rouge). Enfin, cible la carte dans un ensemble d’affiliations fonctionnelles (annotations, nœuds bleus). Dans l’exemple, le graphique montre un ensemble d’inhibiteurs connus pour une acyltransférase humaine (15). Ces bioactivités (toutes positives) sont dessinées sous forme de liaisons vertes entre les composés (nœuds verts) et la cible (nœuds gris pour les nœuds non pathogènes, nœuds orange pour agents pathogènes). Le graphique met en évidence les opportunités de réutilisation des acyltransférases helminthe (lignes pointillées, ajoutées manuellement pour cette figure), basée sur des annotations partagées avec la cible humaine pharmactable connue. Le nœud rouge dans la couche de drogue indique le composé sélectionné. Les tailles de nœuds sont déterminées par le nombre de connexions dans le réseau (degré), tandis que les largeurs de liaison de bioactivité (bords) sont liées au nombre cumulé de preuves expérimentales pour une paire de médicaments donnée (nombre d’essais).

Avec ces mises à jour, TDR6 donne maintenant aux utilisateurs les fonctionnalités suivantes: (i) des priorités ciblées sur le génome entiers axées sur le réseau, (ii) l’exploration de la réutilisation de médicaments; et iii) l’exploration des objectifs candidats pour les composés orphelins. Ces cas d’utilisation sont possibles grâce à un certain nombre de fonctionnalités de réseau précalcules telles qu’un nouveau score de réseaux-droguabilité (NDS). En associant une métrique quantitative à des cibles basées sur l’enrichissement des composés bioactifs sur les nœuds de réseau étroitement connectés, ce score facilite la classification des objectifs en groupes de pharmacibilité (DGS), qui sont disponibles pour les utilisateurs des requêtes de base de données.

Le Le modèle de réseau constitue également la base des priorités de la part des réseaux précomptes (NDD) pouvant être interrovisé par les utilisateurs et sont également utilisées en interne par TDR6 pour sélectionner des objectifs connectés et des composés à afficher dans les visualisations de réseau nouvellement développées (voir ci-dessous). Lors du partage d’un composé d’intérêt, TDR6 utilise les priorités précalisées des objectifs candidats pour aider les utilisateurs à la navigation dans la navigation de l’espace cible autour du composé (et inversement à partir d’une cible d’intérêt). En fournissant ces métriques et classements d’enrichissement précalculés, la base de données facilite désormais la découverte de nouvelles associations de cible de médicaments. Outre ces nouveaux NDD précalisés, les utilisateurs peuvent hiérarchiser les objectifs à l’aide des mêmes fonctionnalités que dans les versions précédentes de TDR cibles.

Cette version inclut également plusieurs mises à niveau de données, à savoir l’inclusion de 22 nouveaux génomes (20 nouveaux agents pathogènes et 2 nouveaux organismes modèles) et des mises à jour approfondies des données chimiques et de bioactivité entre autres. L’interface utilisateur améliorée et polyvalente, ainsi que les mises à jour de données renouvellent l’engagement de TDR pour fournir un outil intégré et puissant pour explorer les données génomiques et chimiques dans le contexte de maladies tropicales négligées.

Utilisation de cibles TDR 6

priorités cible de génome entier

Le modèle de réseau (14) est la base du nouveau score de pharmacibilité, qui est une métrique dérivée de réseau liée à l’enrichissement des composés bioactifs pour un cible (NDS, «score de droguabilité du réseau»). Les NDS sont disponibles pour tous les organismes de niveau 1, qui peuvent être interrogés et utilisés pour peser des requêtes pour filtrer (dans ou Out) cibles dans des pipelines de priorités personnalisées définies par l’utilisateur. Comme expliqué plus avant dans les détails de l’intégration du réseau, pour chaque organisme, des objectifs ont été classés en cinq groupes de drogue (DG), du plus bas (DG1) à la notation la plus élevée (DG5), en fonction de leurs performances dans les priorités de réseau.

Comme dans les versions précédentes des cibles TDR, les utilisateurs peuvent combiner différents ensembles de données simplement en exécutant des requêtes individuelles sur différents types de données et en les combinant sur la page d’historique (9, 10,12,13). Ceci est utile lorsque, par exemple, les utilisateurs souhaiteraient inclure des types de données supplémentaires aux priorités axées sur la drogue, telles que celles qui s’appuient sur l’expression de gènes dans des étapes de cycle de vie pertinentes, ou celles fournissant des informations sur la condition physique / la létalité des objectifs (essentiellement).

Par exemple, nous présentons ici un exemple de priorisation utilisant TOXOPLASMA GONDIII comme agent pathogène d’intérêt. T. GONDIII est un parasite apicomplexique souvent utilisé comme modèle pour étudier la biologie sous-jacente à plusieurs maladies humaines et animales (15). La stratégie de recherche est résumée à la figure 2. La requête a été lancée par la recherche de toutes les cibles T. GONDII et filtrant ces objectifs avec des homologues chez l’homme (pour ne sélectionner que des objectifs spécifiques à la parasite). Ensuite, nous avons sélectionné des gènes essentiels candidats basés sur des profils de fitness lors de l’infection de fibroblastes humains (16); et aussi des gènes sélectionnés hautement exprimés en tachyzoites (étape réplique de T. gondii) en interrogant pour les gènes dans le top 80-100 centile de l’abondance de la transcription RNaseq (17). Ces sélections ont été combinées au classement de la droguabilité du réseau. Pour cela, nous avons considéré des gènes dans des groupes de drogue 3, 4 ou 5 (DG ≥ 3) (voir la figure 2). La figure montre toutes les requêtes et leurs résultats comme indiqué dans la page Historique, et les opérations effectuées lors de la combinaison des requêtes (Union, intersection). La liste finale des objectifs classés sur la base de ces critères a été rendue publique et est disponible dans la section cibles TDR des listes publiées.

Figure 2.

cible Exemple de priorisation Stratégie pour T. GONDIII. L’image composite montre (a) les termes de la requête utilisées pour trouver T. gondii cibles qui n’ont aucun homologue chez l’homme, qui sont très exprimés dans la phase de tachyzoïte virulente du parasite pendant l’infection cellule humaine, probablement essentielle et probablement pharmactable selon au score de drogue réseau. (B) Résumé des requêtes effectuées à la page « Cugets », indiquant comment ces requêtes apparaissent dans la page « Historique », où elles peuvent être examinées et transformées. Les boutons de gestion des requêtes en ligne permettent des actions sélectionnées (supprimer, renommer, exporter) sur les résultats des résultats.(C) Les combinaisons de requêtes permettent aux utilisateurs d’exécuter un syndicat, intersecter ou soustraire des actions sur les requêtes et les unes des autres. Des exemples d’actions union et intersection sont montrés. (D) Les requêtes peuvent être sauvegardées sur une cachette privée (ma requête) de l’endroit où elles peuvent être renvoyées à l’espace de travail (pour effectuer des opérations de requête supplémentaires) ou partagées publiquement avec d’autres utilisateurs de TDR cible (mes séries de requêtes cibles publiées).

Figure 2.

Exemple de priorisation cible Stratégie pour T. GONDIII. L’image composite montre (a) les termes de la requête utilisées pour trouver T. gondii cibles qui n’ont aucun homologue chez l’homme, qui sont très exprimés dans la phase de tachyzoïte virulente du parasite pendant l’infection cellule humaine, probablement essentielle et probablement pharmactable selon au score de drogue réseau. (B) Résumé des requêtes effectuées à la page « Cugets », indiquant comment ces requêtes apparaissent dans la page « Historique », où elles peuvent être examinées et transformées. Les boutons de gestion des requêtes en ligne permettent des actions sélectionnées (supprimer, renommer, exporter) sur les résultats des résultats. (C) Les combinaisons de requêtes permettent aux utilisateurs d’exécuter un syndicat, intersecter ou soustraire des actions sur les requêtes et les unes des autres. Des exemples d’actions union et intersection sont montrés. (D) Les requêtes peuvent être sauvegardées sur une cachette privée (ma requête) de l’endroit où elles peuvent être renvoyées à l’espace de travail (pour effectuer des opérations de requête supplémentaires) ou partagées publiquement avec d’autres utilisateurs de TDR cible (mes séries de requêtes cibles publiées).

Stratégies de réutilisation de médicaments à l’aide de Transformations de requête

La requête de la pharmacibilité dans TDR6 permet aux utilisateurs de sélectionner des cibles d’inhibiteurs / drogues prédites connus ou prédits. Les informations sur les cibles avec des médicaments connus proviennent de la curation de la littérature, alors que les associations d’objectifs prédits (indirectes) avec des inhibiteurs / médicaments sont obtenues grâce à des calculs de similitude ou d’orthologie de séquence (cibles droguées connues) ou par des inférences supportées par le réseau (14). Toutes ces méthodes sont implémentées dans TDR6. Par conséquent, lorsque les utilisateurs filtrent un gène défini sur la droguauté, ils limitent la sélection à des objectifs hautement classés, ce qui devrait fournir une source riche d’opportunités de réutilisation de médicaments.

pour mettre en valeur l’utilité de TDR6 dans cette zone que nous montrons Comment rechercher des médicaments candidats pour réutiliser pour l’échinococcus multiloculoculaire (l’agent causatif de l’échinococcose alvéolaire). Ceci est montré à la figure 3. Le processus est similaire à celui décrit précédemment pour T. GONDIII, mais dans cette stratégie de requête, nous n’avons pas exclu d’homologues humains et ont utilisé C. Elegans Rnai Létasets de données comme proxy pour l’essentialité Nematode. En conséquence, nous avons obtenu une hiérarchisation globale du génome pour E. Multilocularis. Ensuite, appliquez un filtre basé sur une drogue à cette requête, nous avons réduit la sélection de gènes à une poignée de gènes. L’utilisateur peut inspecter manuellement les objectifs sélectionnés pour savoir quels médicaments ont été répertoriés via des associations indirectes. Les pages cibles afficheront tous les composés associés dans la section Droguative, classés en fonction de la source de l’inférence. Pour les déductions axées sur le réseau, le score de chaque composé proposé apparaîtra à la fois en tant que liste et en termes de grade, d’identifier rapidement des candidats prometteurs. Alternativement, pour minimiser l’inspection manuelle, la liste des gènes (c’est-à-dire la requête elle-même) peut être facilement convertie en une liste de médicaments associés en cliquant sur les boutons ‘Convertir cette requête’ en haut des pages Résultats de la requête. Cette fonctionnalité offre un moyen rapide de commencer à créer une bibliothèque de filtrage pour un ensemble d’objectifs. Les transformations de requête peuvent être basées sur les médicaments incrustés (médicaments connus pour un ensemble de cibles), prévus (associations calculées à la drogue) ou les deux. Dans les trois approches, les inhibiteurs / médicaments associés à des cibles droguées connues sont associés de manière transitoire aux gènes de la liste. La figure 3 résume la stratégie de hiérarchisation, la conversion de la requête de la liste des gènes en composés et un exemple de la visualisation de sous-graphique disponible à partir de la page composée d’un hit de réutilisation. Actuellement, ces conversions sont exécutées en arrière-plan et les résultats figurent dans la section Historique du site Web lors de la fin (les utilisateurs sont également alertés par courrier électronique).

Figure 3.

Possibilités de réutilisation de médicaments pour E. Multilocularis à l’aide de transformations de requête. Un schéma de hiérarchisation cible d’Echinococcus multiloculoculaire s’appuie sur l’inférence sur l’orthologie et la drogue prédite (DG ≥ 3). A) des requêtes combinées; (B) la liste initiale des objectifs prioritaires. (C) toute liste cible peut être «transformée» dans une liste de leurs médicaments associés, en utilisant l’une des méthodes de liaison des composés disponibles (voir le texte principal). (D) Liste résultante des composés bioactifs. (E) Exemple de visualisation de sous-graphique réseau à partir d’un composé sélectionné, montrant des liens de bioactivité actifs et inactifs. Les composés (nœuds verts) sont connectés à des cibles pathogènes (orange) selon des enregistrements de bioactivité (vert = actif; rouge = inactif, voir le texte principal des seuils d’activité).Les cibles sont à son tour connectées (liaisons grises) aux affiliations fonctionnelles (nœuds bleus). Le rendu des sous-graphiques fournit des conseils visuels sur la manière dont la cible initiale E. Multilocularis est connectée au composé sélectionné dans le réseau.

Figure 3.

Possibilités de réutilisation de médicaments pour E. Multilocularis à l’aide de transformations de requête. Un schéma de hiérarchisation cible d’Echinococcus multiloculoculaire s’appuie sur l’inférence sur l’orthologie et la drogue prédite (DG ≥ 3). A) des requêtes combinées; (B) la liste initiale des objectifs prioritaires. (C) toute liste cible peut être «transformée» dans une liste de leurs médicaments associés, en utilisant l’une des méthodes de liaison des composés disponibles (voir le texte principal). (D) Liste résultante des composés bioactifs. (E) Exemple de visualisation de sous-graphique réseau à partir d’un composé sélectionné, montrant des liens de bioactivité actifs et inactifs. Les composés (nœuds verts) sont connectés à des cibles pathogènes (orange) selon des enregistrements de bioactivité (vert = actif; rouge = inactif, voir le texte principal des seuils d’activité). Les cibles sont à son tour connectées (liaisons grises) aux affiliations fonctionnelles (nœuds bleus). Le rendu des sous-graphiques fournit des conseils visuels sur la manière dont la cible initiale E. Multilocularis est connectée au composé sélectionné dans le réseau.

Exploration des composés orphelins

Les activités des composés extraits de la littérature par curation apparaissent sous la forme d’analyses à base de cible (liaison directe vers la cible) ou sous la forme d’essais à base de cellules ou d’organisme entiers. En l’absence d’autres informations, ces derniers classes de tests ne fournissent pas d’indices sur la cible ou le mécanisme d’action des composés. Au cours du processus de mises à jour des données chimiques dans TDR6, nous avons identifié des composés avec des effets phénotypiques rapportés sur les analyses entiers ou les analyses à base de cellules, sur la base de leurs classifications de la chimique. Ces informations ont été utilisées pour identifier les composés « orphelins » qui sont actifs contre un agent pathogène particulier dans les projections primaires ou secondaires à base de cellules, mais pour lesquels il n’y a pas d’essai basé sur la cible.

composés orphelins dans TDR6 peut être Recherche de toute espèce avec des données de dépistage phénotypiques disponibles dans la page Recherche de composés. Cela permet d’obtenir un moyen rapide de tirer parti des données provenant de tests à haut débit, permettant aux utilisateurs de commencer leurs priorités à partir de composés avec une activité connue contre un agent pathogène d’intérêt.

Le modèle réseau intégré dans TDR6 est également utile pour identifier le candidat cibles pour les composés orphelins. Comme décrit dans la publication d’origine (14), le quartier de similarité chimique calculé autour d’un composé orphelin sélectionné peut fournir des liens indirects à une ou plusieurs cibles. En utilisant cette stratégie, nous avons effectué des priorités cibles pour tous les composés orphelins dans TDR6. Ces priorités de composition de réseau précalisées sont disponibles pour tous les organismes pour lesquels des données de criblage phénotypique sont disponibles. Les résumés globaux montrant tous les composés orphelins pour ces organismes sont liés à partir de la page « Résumé des données » (voir https://tdrtargets.org / DataSummary, et cliquez sur l’espèce d’intérêt). Un exemple de hiérarchisation basée sur le composé orpheline pour T. cruzi est illustré à la figure 4. Alors que les priorités à partir d’un seul composé sont disponibles dans chaque page composée.

Figure 4.
>

Exploration des objectifs candidats pour les composés d’orphelins de Trypanosoma Cruzi. L’intrigue résume la hiérarchisation cible axée sur le réseau pour les composés orphelins actifs contre T. Cruzi. Toutes les séquences de codage protéique dans le génome de T. Cruzi (cibles candidates) sont disposées sur l’axe des x. Les points de données de l’intrigue correspondent aux associations de médicaments cible marquées par l’algorithme (marquée tracée sur l’axe des Y). Par exemple, nous avons souligné deux cibles putatives pour deux médicaments différents (comme indiqué dans la page Récapitulatif de données T. Cruzi). Des parcelles similaires sont disponibles en ligne pour les organismes de niveau 1 dans TDR6 (liés à partir de la page de résumé des données).

Exploration des objectifs candidats pour les composés orphelins de Trypanosoma Cruzi. L’intrigue résume la hiérarchisation cible axée sur le réseau pour les composés orphelins actifs contre T. Cruzi. Toutes les séquences de codage protéique dans le génome de T. Cruzi (cibles candidates) sont disposées sur l’axe des x. Les points de données de l’intrigue correspondent aux associations de médicaments cible marquées par l’algorithme (marquée tracée sur l’axe des Y). Par exemple, nous avons souligné deux cibles putatives pour deux médicaments différents (comme indiqué dans la page Récapitulatif de données T. Cruzi). Des parcelles similaires sont disponibles en ligne pour les organismes de niveau 1 de TDR6 (liés à partir de la page Récapitulatif des données).

Fonctionnalité et mises à jour de données

Nouvelles données génomiques dans TDR cible V6.1

Depuis la publication précédente de la base de données TDR cible (13), plusieurs génomes d’agent pathogène ont été ajoutés. Une liste détaillée est fournie dans le tableau 3 ainsi que en ligne sur la page Récapitulatif de données TDR6 (https://tdrtargets.org / DataSummary).

Tableau 3 .

Sommaire de disponibilité des données pour les agents pathogènes de niveau supérieur. Résumé des données cibles disponibles pour les organismes de niveau 1 dans les objectifs de TDR. CD: séquences de codage; PFAM: nombre de protéines avec domaine (s) mappé (s) PFAM; Aller: Nombre de protéines avec des termes de l’ontologie du gène mappé; CE: nombre de protéines avec des chiffres de la Commission d’enzyme mappé (CE); Voies: nombre de protéines mappées sur les cartes de la voie de Kegg; Orthologs: nombre de séquences mappées sur des groupes orthomcl ortholog. Un tableau de récapitulatif de données plus complet est disponible en ligne à https://tdrtargets.org / datasummary

espèce. CDS. PFAM. Go. CE. Pathways. Orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166 Plasmodium Vivax 5344 3264 2631 641 806 5207 TOXOPLASMA GONIII 7946 4025 3795 772 967 6764 chlamydia trachomatis 887 704 598 269 357 645 Mycobacterium Leprae 1630 1236 929 628 611 1473 Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287 mycobacterium ulcerans 4232 3602 2578 873 1002 3459 Trep Onema pallidum 1036 791 634 221 335 733 Wolbachia endosymbiont de B. Malayi 805 628 577 308 382 688 BRUGIA Malayi 11316 7042 6368 1278 1787 8424 Echinococcus granulosus 10249 6481 5432 854 1965 7109 Echinococcus multiloculoculaire 10474 6817 5768 878 2079 7539 loa loa (ver oeil) 16292 8071 6774 1539 2207 10484 ONCHOCERCA VOLVULUS 12224 3248 2178 246 563 4054 Schistosoma Mansoni 12692 7818 7384 1218 1649 10386 Leishmania majeur 8280 4641 4415 1067 1162 8250 Trypanosoma brucei 10270 5665 5482 1019 1264 9259 TRYPANOSOMA CRUZI 18639 9908 8572 1495 1735 18140 ENTAMOEBA HISTOLYTICA 8211 4920 4087 645 1094 7692 Giardia LAMBLIA 9665 2726 2263 326 514 5977 trichomonas vaginalis 95600 35474 18435 843 1366 87303
« A4C5658932 »>

 » 1b01f6074e « >
espèce. CDS. PFAM. Go. CE. Pathways. Orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166 Plasmodium Vivax 5344 3264 2631 641 806 5207 TOXOPLASMA GONIII 7946 4025 3795 772 967 6764 chlamydia trachomatis 887 704 598 269 357 645 Mycobacterium Leprae 1630 1236 929 628 611 1473 Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287 mycobacterium ulcerans 4232 3602 2578 873 1002 3459 Trep Onema pallidum 1036 791 634 221 335 733 Wolbachia endosymbiont de B.malayi 805 628 577 308 382 688 Brugia malayi

11316

7042 6368 1278 1787 8424 Echinococcus granulosus

10249

6481

5432

854 1965 7109 Echinococcus multilocularis

10474

6817 5768 878 2079 7539 Loa loa (à vis sans fin de l’œil)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054 Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250 Trypanosoma brucei

10270

5665 5482 1019 1264 9259 Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

Entamoeba histolytica

8211 4920 4087 645 1094 7692 Giardia lamblia 9665 2726 2263 326 514 5977 Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Tableau 3.

Sommaire des données Disponibilité Top pathogènes de niveau. Résumé des données cibles disponibles pour les organismes de niveau 1 dans les cibles TDR. CD: séquences de codage; PFAM: nombre de protéines avec mappée Pfam Domaine (s); GO: nombre de protéines avec des termes cartographiées Gene Ontology; CE: nombre de protéines avec le nombre des enzymes (EC) a cartographié; Pathways: nombre de protéines cartographiées à des cartes de la voie KEGG; Orthologues: nombre de séquences mises en correspondance avec les groupes de OrthoMCL. Une table de données plus complète Résumé est disponible en ligne à https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071


Enttamoeba histolytica


3c34827 «  iv iD = » 0b01674e «  » DV Id = « 0B01674E.


V ID = « 29971A56991 »

5344

2631

887 87 04 04 04 87

Tepne


Mycobaacterium 6678 678 678 678 678 678 678 678 678


5432

Entamoeba histolytica

espèces. CD. Pfam. GO. CE. Pathways. Orthologues.
Plasmodium falciparum 5349 3322 3551 750 1083 5166
5344 3264 2631 641 806 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764
Chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae

1630

1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep Onema pallidum 1036 791 634 221 335 733
Wolbachia endosymbiont de B.Malaisi 588 588 388
brugia malayie

11316

7042 6368 1278 1787 6481 6481 854 1965 7109
Echinococcus multiloculoculaire

10474

6817 779 758
loa loa (ver oeil) 1509 071 1559 071 1539 071 679 071 15371 1539 071 1539 071 1559 071 2207 10484 2378 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania Major 8280 4641 4415 1067 1162 8250 5480 5482 1019 1264 9259
TRYPANOSOMA CRUZI

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia Lambia 2263 2263 2735 363

272 3635 363 2235 363 514 5977
Trichomonas vaginalis

95600

35474

18435 843 CDS. PFAM. Go. CE. sentiers. orthoogs.
lasmoodium 3322 551 7166 Plasmox Vivax 641 606 06 06 06 06 5207
TOXOPLASMA GONIII 7946 4025 3795 772 967 6764 598 269 mycobacterium 1630 1236 P2 673 673
Mycobaacterium tdulesis page 1174 1174 1174 1174 3287 873 1002 3459
Trep Onema pallen 1036 61 33 33 33 33 33 33 633
Wolbia IndussiABiant de Bmalayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa loa (à vis sans fin de l’œil)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Compte tenu de la diversité des organismes intégrés dans des cibles TDR et, par conséquent, la variété des sources de données nécessaires pour couvrir toutes les génomes; des efforts considérables ont été mis en normalisation des données et l’analyse récupération des informations du génome Ces organismes. La plupart des génomes complets ont été obtenus à partir de EupathDB (18), GenBank (19), GeneDB (20), WormBase Parasite (21), GenoList (22) ou Mycobrowser (23). Une description complète des sources génomiques et données dans le tableau précédent complémentaire S1. Pour mettre à jour les données sur les organismes présents dans la version précédente des cibles TDR gènes codant des protéines de la version actuelle des génomes ont été soit à des gènes existants mappées dans les cibles TDR, ou autrement entrés dans les nouveaux enregistrements. Le mappage algorithme utilise une combinaison de conditions pour suivre des identifiants de gènes dans les rejets et maintenir l’identité des gènes: séquence de mise en correspondance des sommes de contrôle (à l’aide des valeurs de hachage de 128 bits générés par l’algorithme MD5), les noms de gène ou des identificateurs et le souffle (24) SI ou matchs parfaits sont trouvés. Après la mise à jour des enregistrements, le Pipeline calcule à l’aide de propriétés physico-chimiques Pepstats (25), des analyses pour les domaines transmembranaires avec TMHMM (26), des peptides de signal avec SignalP (27) et points d’ancrage glycosylphosphatidylinositol, en utilisant PredGPI (28). L’algorithme rejette toutes les séquences codantes non, dont les plus les pseudogènes, pour éviter des annotations trompeuses et de minimiser les fausses hypothèses au cours des flux de travail de priorisation. La plupart des TDR6, mentionné ci-dessus pour toutes les tâches génome intégration et mise à jour ont été raccourcies dans le flux de travail automatisé pour faciliter les mises à jour plus rapidement dans les prochaines versions. Un schéma de la mise à jour et l’algorithme de tuyau représenté sur la figure précédente complémentaire S1. Le pipeline permet également d’automatiser le calcul des annotations à l’aide ad hoc des stratégies individuelles pour les différentes annotations, en se fondant sur les services Web et les API (apparu dans le service Kaas (29) pour les protéines de cartographie à des voies métaboliques et au nombre CE Classification des enzymes, ou OrthoMCL base de données et un outil (30,31) pour les groupes de cartographie aux protéines. Le pipeline repose également sur le calcul des bases de données installées localement sont apparues les plus InterPro (32), en utilisant InterProScan (33) pour identifier les domaines de protéines (Pfam) et carte termes de vocabulaires contrôlés et classifications (termes GO). des ressources supplémentaires sont apparues plus 3D Structures et modèles structurels ont été extraites de la Protein Data Bank (34) en utilisant les services Web et téléchargés à partir du site FTP Modbase (35), respectivement.

aussi le nombre d’ensembles de données fonctionnels clés ont été intégrés dans le présent communiqué, y compris (i) des ensembles de données transcriptomiques, qui témoignent de l’expression génique dans les stades du cycle de vie ou des conditions expérimentales qui sont pertinente pour la découverte de médicaments (36-47) et (ii) des jeux de données de essentialité proviennent de deux agents pathogènes apicomplexes (P. berghei et T. gondii) (16,48), qui fournissent des informations sur les stratégies vitales ASSIST des priorités.

Mises à jour des données chimiques

Pour les composés bioactifs aussi, les flux de travail de mise à jour des données ont été automatisées pour cette version.La majorité des composés bioactifs ont été récupérés à partir de la libération chimique 24th (49), qui contient des jeux de données supplémentaires tels que ceux des boîtes chimiques spécifiques à pathogènes – des boîtes Kinetoplastid GSK (50), une boîte pathogène MMV (51). Le processus d’intégration commence à partir des descriptions de molécules (2D) au format SDF, à partir desquelles nous avons calculé toutes les empreintes digitales de composition nécessaires (requises pour les recherches de similarité / sous-structure composées) à l’aide de Checkmol (52). Le pipeline calcule également des propriétés chimiques supplémentaires telles que le coefficient de cloison d’octanol / eau de Logp et d’autres descripteurs structurels à l’aide de XLOGP3 (53) et les outils de babélisation ouverts obprrop et OBROTAMER (54). D’autres données pertinentes ont été obtenues ou calculées directement à partir de la structure composée, telle que les identificateurs Inchi et InchikeTy (55) utilisés pour le suivi composé; et d’autres règles standard utilisées dans la chimie médicinale et la découverte de médicaments, telles que la règle de Lipinski de cinq (56 ans) et la règle connexe de trois (57).

Après l’intégration dans des objectifs du TDR, tous les composés ont été soumis à à un tout contre tout la comparaison de la similarité chimique en utilisant Chemfp (58) qui produit des mesures de similarité par paires basées sur l’indice Tanimoto / Distance (59). En outre, nous avons calculé une carte globale (toutes par rapport à toutes) des relations de sous-structure entre les composés de la base de données (X est une sous-structure de Y; Y est une superstructure de x). Sachant que le problème de la recherche de sous-graphes ordinaires maximum entre les molécules est calculé en calcul, nous avons appliqué une approche heuristique pour trouver des sous-structures. L’algorithme obtient d’abord un sous-ensemble de molécules candidates possibles en utilisant des empreintes digitales précédemment calculées. Les candidats doivent avoir des empreintes digitales correspondantes avec la molécule d’objet. Une fois que la liste des candidats est obtenue, la détermination de la sous-structure complète des atomes-atoms est effectuée par paire à l’aide de Matchmol (52). Les données disponibles pour les composés et les requêtes pouvant être exécutées sur chaque type de données sont résumées dans le tableau 2. La distribution de poids moléculaire (MW) et de surface polaire (PSA) pour tous les composés de la base de données est indiquée dans la figure supplémentaire S2.

Curation et intégration des données de bioactivité

Comme avec des composés chimiques, la plupart des bioactivités intégrées aux cibles du TDR proviennent directement des sources de données en amont (par exemple, Chembl). Lors de l’intégration des données de bioactivité, nous avons préservé à la fois l’annotation du test (test de réduction de la motilité par exemple in vitro contre Brugia Malayi Microfiliariae à 10 μm ‘) et la valeur numérique et des unités associées aux activités composées (par exemple, inhibition de 80%’, ‘1.5 μM IC50 ‘, ’10 NM MIC’), qui sont tous des champs interrogeables. De plus, et pour faciliter les requêtes des utilisateurs, les bioactivités signalées ont été utilisées pour grouper des composés dosés dans des classes «actives» ou «inactives». Cependant, pour minimiser l’effet de l’utilisation des limites dures autour des seuils arbitraires et d’augmenter la séparation entre les classifications actives / inactives, nous avons également défini une zone grise indéterminée. Par conséquent, les composés scoring juste en dessous d’un seuil arbitraire ne sont pas considérés comme inactifs à des fins de la requête et de la visualisation.

Tous les types d’activité n’ont toutefois pas été utilisés pour la classification. Malgré les efforts de la normalisation de ces données d’activité, l’interprétation des activités des composés à cette échelle est difficile, car elles dépendent souvent du type de test particulier, des unités signalées et des conditions particulières dans lesquelles chaque test a été effectué. Cependant, un ensemble significatif de types de dosage pourrait être automatiquement classé dans des catégories active / indéterminée / inactives basées sur des seuils d’activité. Pour cela, tous les types de test avec > 100 000 rapports (voir la figure supplémentaire S3 pour une activité par type de test / par tracé de distribution composé) ont été considérés pour l’audit d’activité, bien que seuls des analyses à base de concentration (tels que le CI50, le KI ou la puissance) ont été trouvés suffisamment robustes pour une telle détermination, car des tests basés sur le pourcentage (telles que% activité,% d’activité résiduelle ou d $ inhibition) étaient ambiguës dans les rapports de bioactivité. Les seuils utilisés pour classifier les activités de chaque type de test peuvent être trouvés dans le tableau 4 et la distribution de composés dans ces classes d’activité est résumée à la figure 5.

Tableau 4.

Types de test et seuils d’activité utilisés pour la détermination des balises d’activité: Seuls les dosages à base de concentration ont été utilisés pour déterminer les étiquettes d’activité. Les activités de déclaration inférieure à la valeur maximale admise pour les positifs ont été considérées comme des interactions actives (+), tandis que celles supérieures à la « valeur ajoutée minimale pour les négatifs » étaient considérées comme inactives (-). Toute activité indiquée entre ces deux valeurs était considérée comme indéterminée (0)

test
type. Unité standard. Valeur maximale admis pour les actifs. Valeur minimale admise pour les inactifs.
ac50 nm 20000 100000 EC50 NM 20000 100000 ic50 nm 20000 100000 ic50 ug ml-1 15 50 kd nm 20000 100000 ki nm 20000 100000 POUTENCE NM 20000 100000
test
type. Unité standard. Valeur maximale admis pour les actifs. Valeur minimale admise pour les inactifs.
ac50 nm 20000 100000 EC50 NM 20000 100000 ic50 nm 20000 100000 ic50 ug ml-1 15 50 kd nm 20000 100000 ki nm 20000 100000 POUTENCE NM 20000 100000

Tableau 4.

Types de test et seuils d’activité utilisés pour la détermination des balises d’activité: Seuls les dosages à base de concentration ont été utilisés pour déterminer les étiquettes d’activité. Les activités de déclaration inférieure à la valeur maximale admise pour les positifs ont été considérées comme des interactions actives (+), tandis que celles supérieures à la « valeur ajoutée minimale pour les négatifs » étaient considérées comme inactives (-). Toute activité indiquée entre ces deux valeurs était considérée comme indéterminée (0)

test
type. Unité standard. Valeur maximale admis pour les actifs. Valeur minimale admise pour les inactifs.
ac50 nm 20000 100000 EC50 NM 20000 100000 ic50 nm 20000 100000 ic50 ug ml-1 15 50 kd nm 20000 100000 ki nm 20000 100000 POUTENCE NM 20000 100000
test
type. Unité standard. Valeur maximale admis pour les actifs. Valeur minimale admise pour les inactifs.
ac50 nm 20000 100000 EC50 NM 20000 100000 ic50 nm 20000 100000 ic50 ug ml-1 15 50 kd nm 20000 100000 ki nm 20000 100000 POUTENCE NM 20000 100000

Figure 5 . Les intersections comptent des cas où le même médicament a des résultats d’activité différents contre la même cible. Des exemples de ces cas sont fournis dans des panneaux B à F (ID du composé représente des identificateurs TDR6). (B) Activité de C329137 (une hydroxy-benzamidine) contre P. Falciparum Dihydrofolate Dihydrofolate-Thymidylate Synthase. (C) Exemple d’enregistrements positifs pour les inhibiteurs de l’acyltransférase humain. (D) Exemple d’activités négatives et neutres pour les composés triphénylcarbinol et benzohydrol, respectivement. Enfin, les preuves positives (e) et négatives (f) (F) peuvent être mélangées à des preuves indéterminées, comme indiqué pour C2164865 testé contre la cholinéestérase de chevaux et C306882 testé contre le recombinant P. Falciparum Deoxyuridine 5′-TripHosphate Nucléotidide Hydrolase, respectivement.

Figure 5.

Activité Tags Distribution et preuve Mélanges parmi les données: (a) Diagramme de Venn montrant la distribution des valeurs de bioactivité dans l’actif Les classes inactives et indéterminées dans TDR6 (voir le texte principal pour plus de détails).Les intersections comptent des cas où le même médicament a des résultats d’activité différents contre la même cible. Des exemples de ces cas sont fournis dans des panneaux B à F (ID du composé représente des identificateurs TDR6). (B) Activité de C329137 (une hydroxy-benzamidine) contre P. Falciparum Dihydrofolate Dihydrofolate-Thymidylate Synthase. (C) Exemple d’enregistrements positifs pour les inhibiteurs de l’acyltransférase humain. (D) Exemple d’activités négatives et neutres pour les composés triphénylcarbinol et benzohydrol, respectivement. Enfin, les preuves positives (e) et négatives (f) (F) peuvent être mélangées à des preuves indéterminées, comme indiqué pour C2164865 testé contre la cholinéestérase de chevaux et C306882 testé contre le recombinant P. Falciparum Deoxyuridine 5′-TripHosphate Nucléotidide Hydrolase, respectivement.

La libération de la chimiblée de la chimique comporte plus de 15,2 millions de bioactivités rapportées, dont environ 6 millions correspondaient à des relations impliquant des médicaments et des cibles de protéines (protéines monoparentales, familles protéinées et complexes de protéines, de protéines et de complexes protéiques, 93% étant des protéines individuelles). Les autres bioactivités restantes de la base de données ont été rapportées à une grande variété d’objectifs non protéiques, tels que les cellules entières (3,2 m), les organismes entiers (2,2 m), les tissus (83k) et les macromolécules non peptidiques (85k) ou petites molécules (< 100). Celles-ci n’ont pas été utilisées dans la construction de réseau, car le réseau est une protéine (c’est-à-dire cible) centrée. La figure 5 montre également quelques exemples de visualisations de réseau décrivant comment TDR6 affiche ces bioactivités.

Intégration des caractéristiques dérivées du réseau: Drogualisabilité et priorités

Comme mentionné ci-dessus, données génomiques, annotations géniques, Les composés chimiques et les interactions médicamenteurs générés ont été intégrés à un réseau complexe orienté vers une réutilisation de médicaments, comme décrit à Berenstein et al. (14). Le réseau a été utilisé pour calculer un score de dérogation au réseau (NDS), pour toutes les cibles de la priorité (niveau 1) des agents pathogènes. La NDS est liée aux chances de trouver des composés bioactifs à proximité du graphique réseau d’une cible donnée (plage est de 0 à 1). L’algorithme a déjà été décrit en détail (14), mais brièvement, sur la base d’un test de surprésentation des protéines droguées connues annotées, elle calcule une note de pertinence (RS) pour chaque domaine de domaine de domaine PFAM et de catégories de groupe d’orthologie du réseau. Le score NDS pour une cible donnée résulte d’une somme cumulative pondérée sur les RS de toutes les contributions d’affiliation communes au nœud cible et des protéines voisines liées à des composés actifs.

pour faciliter l’interprétation des scores NDS que nous avons effectué une Évaluation statistique Pour identifier les groupes de droguabilité distincts (DG) sur la base de deux types de seuils qui aident à classer les prévisions de la droguabilité dans les zones de confiance. Celles-ci sont illustrées à la figure 6. D’une part, tandis que toutes les cibles de notation non nulles ont une certaine connectivité à des objectifs connus-pharmactables, une LOW NDS suggère que ces connexions ne sont pas pertinentes pour l’évaluation de la toxicomanie. Par conséquent, une coupure de bruit (une base calculée à 5 fois la valeur de 0,25 centile de la distribution complète des NDS) est considérée comme identifiant de faibles cibles de notation. Le deuxième seuil est dérivé de l’indice maximum (60) de Youden (60), qui est calculé comme le score auquel la spécificité et la sensibilité sont optimales (meilleure sensibilité sans compromettre la spécificité, et inversement). Cette valeur ne peut être calculée que pour les agents pathogènes avec des véritables positifs (cibles droguées connues). Un minimum arbitraire de 10 vrais positifs a été considéré comme suffisant pour la détermination de la coupure de Youden. Pour les autres agents pathogènes dépourvus de telles informations, une extrusion de Youden globale a été utilisée (calculée à l’aide de tous les vrais positifs du réseau). Les groupes de pharmacibilité correspondants sont donc les suivants: DG1 pour des cibles avec des valeurs NDS allant de 0 au seuil de bruit; DG2 pour des cibles avec des valeurs NDS allant du seuil de bruit à la coupure de Youden; et les DGS 3, 4 et 5 avec des valeurs NDS 1-, 10- et 100 fois au-dessus de la coupure de Youden. En conséquence, ces derniers groupes font pour les cibles pharmactables les plus susceptibles. La figure 6 montre un exemple statique d’une priorisation axée sur le réseau pour les ulibérans mycobactéries (qui manque de cibles avec des composés connus dans la libération actuelle). Toutes les priorités des organismes prioritaires de TDR cible peuvent être visibles en ligne sur la page de résumé des données pour chaque espèce (voir https://tdrtargets.org / DataSummary, en cliquant sur l’espèce d’intérêt). Dans ce cas, les parcelles en ligne sont interactives et peuvent être zoomées et exportées. Dans les cas où il y a des objectifs avec des composés bioactifs connus pour l’espèce, ceux-ci sont montrés distinctement dans la parcelle.

Figure 6.

axé sur le réseau Priorité cible du génome pour les Ucobacterium ulcérans: les objectifs candidats dans le génome de M. Ulcerans ont été classés par leur NDS (score de dérogation au réseau, voir le texte principal).L’intrigue décrit toutes les cibles de génome (dans l’axe X) avec leur score NDS correspondant (dans l’axe Y). Les points rouges correspondent aux cibles classées Top-10, avec des étiquettes indiquant le nom du gène et le produit. Parcourez la priorisation globale du génome du résumé des données, l’utilisateur peut accéder à une page de gène en cliquant dessus dans la parcelle de la priorisation. Un exemple sous-graphique de la famille des gènes EMBA / EDBB / EMBC est indiqué (comme indiqué dans leurs pages de gène correspondantes). La figure affiche également les zones de confiance, DG1 (rouge): délimitée par zéro et coupure de bruit; DG2 (jaune): entre le bruit et la coupure de Youden; et DG3-5: avec des scores supérieurs à la coupure de Youden.

figure 6.

Génome entièrement basé sur le réseau Priorité cible pour les Ulcerans Mycobacterium: les objectifs candidats dans le génome de M. Ulcerans ont été classés par leur NDS (score de dérogation au réseau, voir le texte principal). L’intrigue décrit toutes les cibles de génome (dans l’axe X) avec leur score NDS correspondant (dans l’axe Y). Les points rouges correspondent aux cibles classées Top-10, avec des étiquettes indiquant le nom du gène et le produit. Parcourez la priorisation globale du génome du résumé des données, l’utilisateur peut accéder à une page de gène en cliquant dessus dans la parcelle de la priorisation. Un exemple sous-graphique de la famille des gènes EMBA / EDBB / EMBC est indiqué (comme indiqué dans leurs pages de gène correspondantes). La figure affiche également les zones de confiance, DG1 (rouge): délimitée par zéro et coupure de bruit; DG2 (jaune): entre le bruit et la coupure de Youden; et DG3-5: avec des scores supérieurs à la cutologie de Youden.

Ces priorités axées sur le réseau peuvent fonctionner à la fois. Lors du partage d’un composé d’intérêt, l’algorithme peut donner la priorité aux objectifs, en utilisant la similitude pondérée des voisins chimiques aux cibles de candidats initiaux. Et lors de la cible d’intérêt, il peut hiérarchiser les composés, en utilisant des cibles de voisin pharmactable connectées, puis de suivre des liens pondérés vers des inhibiteurs / médicaments candidats. Les scores précumutés pour les composés et les cibles sont utilisés en interne par TDR6 et sont au cœur des transformations de requêtes basées sur réseau.

Visualisations de sous-graphique réseau et mise à niveau de l’interface utilisateur

Le sous-réseau -Grapations pour les composés et les cibles (et leurs scores NDS respectifs) peuvent être parcourues à partir de l’application Web à l’aide d’une drogue ou d’une cible comme point de départ pour obtenir des indices pour les médicaments non testés ou les nouveaux objectifs de pharmactables, respectivement. Grâce à des visualisations récemment développées, les utilisateurs peuvent consulter les quartiers de réseau autour de la drogue et des objectifs dans les pages correspondantes. Les listes d’interactions postées dérivées de réseau peuvent également être explorées au format tabulaire sous la « phargabilité » (pour les cibles cibles) et les sections « cubes connues et prévues » (pour les médicaments).

Ces visualisations sont conduites par d3.js (61) Mise en œuvre des dispositions forcées pour les visualisations de sous-graphiques. Dans le groupe Subgraph Subgraph, les utilisateurs peuvent effectuer des recherches de nœud dans le graphique (identificateurs cible) et basculer la visibilité des cibles sur une espèce par espèce et personnaliser l’opacité des nœuds. Pris ensemble Ces nouvelles fonctionnalités fournissent une visualisation claire et complète du sous-réseau provenant des cibles et des composés, permettant aux utilisateurs de manipuler les graphiques tout en explorant les données.

L’interface utilisateur (UI) et les outils disponibles. Pour la réutilisation de la drogue et la priorisation ciblée ont traversé une amélioration majeure. En premier lieu, l’interface utilisateur a été repensée sous des normes W3C pour atteindre une application plus saine et plus évolutive. Nous avons intégré le bootstrap (https://getbootstrap.com/) et jQuery (https://jquery.com) Cadres dans le développement et la conception de l’application Web TDR6 et dans le front. Fonctionnalité finale. Pour les requêtes de structure composées, nous disposons d’une licence et de la mise en œuvre de l’application de dessin chimique Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Les enregistrements tabulés dans la cible et les pages de pharmacie utilisent désormais le plug-in JavaScript JavaScript DataTable (https://datatables.net) pour créer facilement des paginations, filtrant et trier des fonctionnalités. Enfin, les représentations 2D composées sont désormais générées automatiquement à l’aide d’une implémentation du module JavaScript SmilesDrawer (62).

Disponibilité commerciale des composés

Un aspect important lors de la priorité aux composés pour les essais dans le laboratoire , est leur disponibilité. Dans TDR6, nous affichons maintenant des informations sur la disponibilité commerciale des composés. Nous avons actuellement démarré cette fonctionnalité en reliant MOLPOR (un marché chimique en ligne que des composés sources de fournisseurs majeurs) et montrent aux utilisateurs une indice visuelle sur des pages composées qui donnent une indication rapide de savoir si le composé est en stock ou peut être effectué sur commande. . Étant donné que la disponibilité commerciale des composés est actuellement mise en œuvre dans TDR6 sous la forme de requêtes asynchrones contre Molport, à ce moment-là, cette fonctionnalité n’est disponible que dans le mode de navigation (pas dans les requêtes).Cependant, les utilisateurs peuvent hiérarchiser les composés à l’aide des stratégies de requête disponibles dans TDR6, puis finalisent leurs sélections composées en inspectant les composés manuellement pour une disponibilité commerciale.

Discussion et directions futures

Les nouvelles données , Interface et fonctionnalité de TDR6 fournit aux utilisateurs une navigation et une visualisation améliorées des cibles et des composés.

Le modèle de réseau actuel relie des objectifs par l’affiliation d’entités (protéines) aux concepts d’annotation (domaines PFAM). Celles-ci ont été sélectionnées en fonction de leur grande couverture et de leur facilité de calcul relative. Complétant ces concepts avec d’autres critères importants pour la validation de la cible de médicaments (essentialité, expression dans les étapes de cycle de vie pertinentes) peuvent être effectuées par les utilisateurs ayant des outils et des fonctionnalités fournis par TDR6 mais à l’avenir, ils peuvent être intégrés au modèle de réseau sous-jacent lui-même, à Le moins que certains organismes soient nécessaires à l’évaluation expérimentale de génome.

Plusieurs améliorations clés sont nécessaires pour maintenir les objectifs de TDR pertinents pour la Communauté de scientifiques travaillant sur des maladies tropicales. Intégration des métabolites naturels et la connexion de ces petites molécules à d’autres composés bioactifs par le biais de sous-structures partagées ou d’une similitude chimique sera une mise au point majeure à l’avenir. Cela permettra également de naviguer sur le graphique des tarifs médicaments à l’aide des concepts de réactions biochimiques également, qui connectent naturellement des enzymes non orthologues à travers leurs substrats / produits et cofacteurs partagés.

Enfin, comme déjà mentionné précédemment (13), Il reste encore un écart de curation important qui doit être rempli. De nombreux composés bioactifs ont été testés par la Communauté de chercheurs travaillant dans des maladies tropicales négligées. Pourtant, beaucoup de ces analyses et résultats sont rapportés dans des revues en dehors des journaux de chimie médicinale traditionnels et sont donc manqués par des efforts de garantie importants tels que celui dirigé par Chembl (49). La commission et l’intégration de ces données manquantes (y compris les données négatives!) Devrait être une priorité pour la Communauté, car elle permettrait d’économiser du temps et des ressources précieux.

Données complémentaires

Les données supplémentaires sont disponibles. À Nar en ligne.

Remerciements

Les auteurs souhaitent remercier Matthew Berriman et Magdalena Zarowiecki (Wellcome Trust Sanger Institute) pour le partage des données de génome d’échinococcus pré-libérées et d’annotation pour l’inclusion en TDR Cibles; et Ben Webb et Andrej Sali (Université de Californie San Francisco) pour le calcul des modèles 3D pour les génomes pathogènes de niveau 1 dans les objectifs du TDR. L.u.l., a.b. et s.v. étaient ou sont soutenus par des bourses du Conseil national de la recherche (Conicet, Argentine). A.C. et F.A. Les membres de la carrière de recherche du Conseil national de la recherche (Conicet, Argentine) sont membres. P.m. Voudrais remercier une fraternité de la Commission des subventions universitaires (UGC), de l’Inde.

Financement

GlaxoSmithKline Argentine et l’Agence nationale pour la promotion de la science et de la technologie, de l’Argentine (ANPCYT); Projet de coopération bilatérale indo-Argentine (financement conjoint du Département des Indiens de la science et de la technologie (DST) et du ministère de la Science et de la Technologie argentin (Mincyt). Financement de frais d’accès ouvert: Fondo para la enquêtrice d’investigación Científica y Tecnológica.

Déclaration de conflit d’intérêts. Aucun déclaré déclaré.

Notes

Adresse actuelle: Ariel J Berenstein, Instituto Multidisciplino de Investigaciones en Patologías Pediátricas (IMIP), Conicet-GCBA, Laboratorio de biología moléculaire, División Patología, Hôpital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentine.

Hotez
PJ

,

molyneux
DH

,

Fenwick
a.

,

Kumaresan
j.

,

sachs
SE

,

Sachs
JD

,

SAVIOLI
l.
contrôle des maladies tropicales négligées

.

n. Engl. J. Med.
2007

;

357

:

1018

1027

.

DULLERER
p.

,

olliaro
p.

,

Torreele
e.

,

orbinski
j.

,

Linging
r.

,

Ford
n.
Développement de médicaments pour les maladies négligées: marché déficient et public -Le échec de la politique de santé

.

Lancet Nord am. Ed.
2002

;

359

:

2188

2194

.

hughes
j.

,

rees
s.

,

kalindjian
s.

,

philpott
k.
Principes de la découverte précoce de la drogue

.

fr. J. Pharmacol.
2011

;

162

:

1239

1249

.

Adams
cp

,

brantner
vv
estimation du coût de la nouvelle drogue: est-ce vraiment 802 millions de dollars

.

Santé AFF. (Millwood)

.

2006

;

25

:

420

428

.

wyatt
pg

,

gilbert
ih

,

lisez
kd

,

fairlamb
ah
Validation cible : reliant les propriétés cibles et chimiques au profil de produit souhaité

.

curr. Sommet. Med. Chem.
2011

;

11

:

1275

1283

.

mA

,

brun
ED
REJOISCEMENT DE LA DROIT POUR LA DÉCOUVERTE D’ANTIMICROBIENNE

.

NAT. Microbiol.
2019

;

4

:

565

577

.

hernandez
hw

,

SOEUNG
m.

,

Zorn
km

,

ashoura
n.

,

> Mottin
m.

,

andrade
ch

,

Caffrey
cr

,

de ssiceira-neto
jl

,

ekins
s.
Haute débit et réutilisation de calcul pour les maladies négligées

.

pharm. Res.
2018

;

36

:

27

.

wooller
sk

,

benstead- Hume
g.

,

chen
x.

,

ali
y.

,

perle
fmg
bioinformatique dans la découverte de médicaments traductionnels

.

Biosci. Représentant
2017

;

37

:

DOI: 10.1042 / BSR20160180

.

agüero
f.

,

al -Lazikani
b.

,

aslett
m.

,

berriman
m.

>,

Buckner
fs

,

Campbell
rk

,

carmona
S.

,

Carruthers
im

,

chan
awe

,

chen
f .

et al. .

Priorité à l’échelle génomique des objectifs de médicaments: la base de données TDR cible

.

NAT. Discoud de la drogue révérend.
2008

;

7

:

900

907

.

Crowther
gj

,

Shanmugam
d.

,

carmona
sj

,

doyle
mA

,

Hertz-fowler
c.

,

berriman
m.

,

nwaka
s.

,

ralph
SA

,

ROOS
DS

,

Van Voorhis
wc

et al. .

Identification des objectifs de médicaments attrayants dans des agents pathogènes de maladie négligés à l’aide d’une approche en silico

.

plos négligent. Trop. Dis.
2010

;

4

:

E804

.

jd

,

FilippoVA
ev

,

halavaty
comme

,

Minasov
g.

,

Zhou
y.

,

Dubrovska
i.

,

flores
kj

,

shuvalova
la

,

Ruan
j.

,

el bissati
k.

et al. .

CSGID résout des structures et identifie des phénotypes pour cinq enzymes dans la toxoplasme gondii

.

avant. Cellule. Infecter. Microbiol.
2018

;

8

:

352

.

Shanmugam
d.

,

ralph
SA

,

Carmona
SJ

,

Crowther
GJ

,

Roos
DS

,

Agüero
f.
Caffrey
Cr

,

,

> SELZER
PM
Génomes d’intégration et d’exploitation minière pour découvrir et hiérarchiser de nouvelles cibles thérapeutiques

.

Helminthes parasitaires: cibles, écrans, médicaments et vaccins

.

2012

;

wiley-blackwell
43

59

.

MAGARIÑOS
député

,

,

Carmona
sj

,

Crowther
gj

,

ralph
SA

,

ROOS
DS

,

Shanmugam
d.

,

Van Voorhis
wc

,

AGÜERO
F.
Cibles TDR: une ressource de chimenomologie pour les maladies négligées

.

nucléique. Acides. Res.
2012

;

40

:

D1118

D1127

.

aj

,

Magariños
député

,

chernomoretz
a.

,

Agüero
f.
Une approche réseau multicouche pour guider le repositionnement de la drogue dans des maladies négligées

.

plos négligent. Trop. Dis.
2016

;

10

:

E0004300

.

kim
k.

,

weiss
lm
TOXOPLASMA GONIII: Le modèle Apicomplexan

.

int. J. parasitol.
2004

;

34

:

423

432

.

Sidik
sm

,

HUET
d.

,

ganesan
sm

,

huynh
m.-h.

,

wang
t.

,

nasamu
comme

,

thiru
P.

,

Saeij
jpj

,

CARRUTHERS
VB

,

Niles
JC

et al. .

Un écran de crise de génome à l’échelle du génome de Toxoplasma identifie les gènes apicomplexains essentiels

.

Cell

.

2016

;

166

:

1423

1435

.

Gajria

,

Bahl
a.

,

Brestelli
j.

,

Dommer
j.

,

Fischer
s.

,

Gao
x.

,

Heiges
M.

,

iodice
j.

,

Kissinger
JC

,

Mackey
Aj

et al. .

TOXODB: une ressource intégrée de la base de données de Toxoplasma GONFII

.

acides nucléiques Res.
2007

;

36

:

D553

D556

.

warrenfeltz
s.

,

Basenko
ey

,

accroupie
k.

,

Harb
os

,

,

,

> Kissinger
jc

,

ROOS
DS

,

Shanmugasundram
a.

,

Silva-franco
f.
kollmar
M
EUPATHDB: la ressource de base de données génomique de l’agent pathogène eucaryote

.

Bases de données génomiques eucaryotes

.

2018

;

1757

:

ny
Springer
69

113

.

Sayers
ew

,

Agarwala
r.

,

bolton
ee

,

brister
JR

,

Cancais
k.

,

clark
k.

,

Connor
r.

,

fiorini
n.

,

funk
k.

,

Heurferon
t.

et al. .

Ressources de base de données du Centre national des informations sur la biotechnologie

.

acides nucléiques Res.
2019

;

47

:

D23

D28

.

hertz-fowler
c.

,

> Peacock
CS
Présentation de GENEDB: une base de données générique

.

Tendances parasitol.
2002

;

18

:

465

467

.

boulon
bj

,

rodgers
fh

,

Shafie
m.

,

kersey
PJ

,

Berriman
m.

,

kl
Utilisation de wormbase parasite: une plate-forme intégrée pour explorer les données génomiques Helminthh

.

méthodes mol. Biol.
2018

;

1757

:

471

491

.

lechat
p.

,

Hummel
l.

,

Rousseau
s.

,

Moszer
i.
Génoliste: un environnement intégré pour une analyse comparative des génomes microbiens

.

acides nucléiques Res.
2007

;

36

:

D469

D474

.

kapopoulou
a.

,

Lew
jm

,

cole
st
le portail Mycobrowser: une ressource annotée complète et manuellement pour les génomes mycobactéries

.

tuberculose

.

2011

;

91

:

8

13

.

camacho
c.

,

Coulouris
g.

,

avagyan
v.

,

mA
n.

,

papadopoulos
j.

,

bealer
k.

,

Madden
tl
Blast +: Architecture et applications

.

BMC bioinformatique

.

2009

;

10

:

421

.

jm

,

évêque
MJ
Emboss (la suite logicielle ouverte de la biologie moléculaire européenne)

.

Dictionnaire de bioinformatique et de biologie informatique

.

2004

;

Chichester
JOHN WILEY & SONS, LTD
DOB0206

.

krogh
a.

,

Larsson
b.

,

von heijne
g.

,

Sonnhammer
el
prédire la topologie protéine transmembranaire avec un modèle caché Markov: application pour compléter les génomes

.

j. Mol. Biol.
2001

;

305

:

567

580

.

almagro armenteros
jj

,

tsirigos
kd

,

Sønderby
ck

,

Petersen
tn

,

Winther
o.

,

brunak
s.

,

von heijne
g.

>,

Nielsen
h.
Signalp 5.0 améliore les prédictions de peptide signal à l’aide de réseaux de neurones profonds

.

NAT. Biotechnol.
2019

;

37

:

420

423

.

a.

,

,

martelli
p.

,

Casadio
r.
predgpi: prédicteur GPI-anchor

.

BMC bioinformatique

.

2008

;

9

:

392

.

Moriya
y.

,

itoh
m.

,

okuda
s.

,

yoshizawa
AC

,

Kanehisa
m.
Kaas: une annotation de génome automatique et un serveur de reconstruction de sentiers

.

acides nucléiques Res.
2007

;

35

:

w182

w185

.

chen
f.

,

mockkey
aj

,

stoeckert
cj

JR,

ROOS
DS
Orthomcl-dB: Interroger une collection complète des groupes multi-espèces de groupes ortholog

.

acides nucléiques Res.
2006

;

34

:

D363

D368

.

fischer
s.

,

brunk
BP

,

chen
f.

,

Gao
x.

,

,

,

Harb
OS

,

iodice
JB

,

Shanmugam
d.

,

ROOS
DS

,

stoeckert
CJ

JR

Utilisez Orthomcl pour affecter des protéines aux groupes orthomcl-db ou à Protéomes de grappes dans de nouveaux groupes ortholog

.

Cur Protoc Bioinforma.
2011

;

DOI: 10.1002 / 0471250953.BI0612S35

.

Mitchell
al

,

Attwood
tk

,

babitt
pc

,

blum
m.

,

Bork
p.

,

pont
a.

,

brun
SD

,

Chang
H.-y.

,

el-geali
s.

,

fraser
MI

et al. .

interpro en 2019: amélioration de la couverture, de la classification et de l’accès aux annotations de séquence protéique

.

acides nucléiques Res.
2019

;

47

:

D351

D360

.

Jones
p.

,

binns
d.

,

chang
H.-y.

,

fraser
m.

,

Li
w.

,

mcanulla
c.

,

mcwilliam
H.

,

MASLEN
j.

,

Mitchell
a.

,

NUKA
g.

et al. .

interproques 5: classification des fonctions de protéines de génome d’échelle de génome

.

bioinforma. Oxf. Engl.
2014

;

30

:

1236

1240

.

Burley
sk

,

berman
hm

,

bhikadiya
c.

,

bi
c.

,

> Chen
l.

,

costanzo
ld

,

Christie
c.

,

Duarte
jm

,

Dutta
s.

,

Feng
Z.

et al. .

Banque de données protéiques: l’archive globale unique pour les données de structure macromoléculaire 3D

.

acides nucléiques Res.
2019

;

47

:

D520

D528

.

pieper
u.

,

webb
bm

,

dong
gq

,

Schneidman-duhovny
d.

,

fan
h.

,

kim
sj

,

khuri
n.

,

déversement
yg

,

weinkam
p.

,

hammel
m .

et al. .

modbase, une base de données de modèles de structure de protéines comparatifs annotés et de ressources associées

.

acides nucléiques Res.
2014

;

42

:

D336

D346

.

zhu
l.

,

mok
s.

,

imwong
m.

,

jaidee
a.

,

Russell
b.

,

Nosten
f.

,

jour
np

,

blanc
nj

,

Preiser
PR

,

Bozdech
z.
Nouvelles perspectives dans le transcriptome Plasmodium Vivax en utilisant ARN-SEQ

.

SCI. Représentant
2016

;

6

:

20498

.

Smircich
p.

,

eastman
g.

,

bispo
s.

,

Duhagon
mA

,

Guerra-slompo
EP

,

Garat
b.

,

Goldenberg
S.

,

munroe
DJ

,

dallagiovanna
b.

,

Holetz
F.

et al. .

Le profilage du ribosome révèle le contrôle de traduction en tant que mécanisme clé générant une expression génique différentielle dans Trypanosoma Cruzi

.

BMC Genomics

.

2015

;

16

:

443

.

Laster
e.

,

, >,

RIJPMA
SR

,

van Schaijk
BCL

,

Hoeijmakers
wam

,

> Kensche
pr

,

gresnigt
ms

,

Italiaander
a.

,

MW

,

woestenenk
r.

,

Bousema
t.

et al. .

Analyses transcriptomiques et protéomiques intégrés des gamétocytes P. Falciparum: Insight moléculaire sur les processus spécifiques au sexe et la répression de translationnelle

.

acides nucléiques Res.
2016

;

44

:

6087

6101

.

Otto
TD

,

wilinski
d.

,

assefa
s.

,

keane
tm

,

,

,

> Sarry
LR

,

böhme
u.

,

lemieux
j.

,

Barrell
b.

,

douleur
a.

,

berriman
m.

et al. .

Nouvelles perspectives dans le transcriptome du stade de sang de Plasmodium Falciparum à l’aide d’ARN-SEQ

.

mol. Microbiol.
2010

;

76

:

12

24

.

Otto
TD

,

Böhme
u.

,

jackson
ap

,

Hunt
m.

,

> Franke-fayard
b.

,

Hoeijmakers
wam

,

religiona
aa

>,

Robertson
l.

,

Sanders
m.

,

ogun
SA

et al. .

une évaluation complète des génomes de parasite de paludisme rongeur et expression de gènes

.

BMC Biol.
2014

;

12

:

86

.

g.

,

vembar
ss

,

Baumgarten
s.

,

Ding
s.

,

,

,

,

,

,

Guizetti
j.

,

Bryant
JM

,

Mattei
d.

d. >,

Jensen
ATR

,

Rénia
l.

,

goh
ys

et al. .

Un PFEMP1 spécifique est exprimé dans P. Falciparum Sporozoites et joue un rôle dans l’infection à l’hépatocyte

.

rep.
2018

;

22

:

2951

2963

.

fernandes
mc

,

Dillon
lal

,

Belew
à

,

bravo
HC

,

mosser
dm

,

el-syed
nm
Dual transcriptome Profiling des macrophages humains infectés par Leishmania révèle des signatures de reprogrammation distinctes

.

mbio

.

2016

;

7

:

E00027-16

.

fritz
hm

,

Buchholz
kr

,

chen
x.

,

Durbin-Johnson
b.

,

rocke
DM

,

Conrad
pa

,

Boothroyd
JC
Analyse transcriptomique du développement toxoplasmatique révèle de nombreuses nouvelles fonctions et structures spécifiques aux sporozoïtes et aux oocystes

.

plos un

.

2012

;

7

:

E29998

.

C.-c.

,

,

weber
c.

,

SISMEIRO
o.

,

proux
c.

,

koutero
m.

,

Déloger
m.

,

das
S.

,

Agrahari
m.

,

Dillies
M.-A.

,

Jagla
b.

et al. .

Quantification du bruit stochastique d’épissage et de polyadénylation dans Enttamoeba Histolytica

.

acides nucléiques Res.
2013

;

41

:

1936

1952

.

Siegel
tn

,

hekstra
dr

,

wang
x.

,

DEWELL
s.

,

Cross
gam
Analyse à l’échelle du génome de l’abondance de l’ARNm dans Deux étapes de cycle de vie de trypanosoma brucei et d’identification des sites d’épissage et de polyadénylation

.

acides nucléiques Res.
2010

;

38

:

4946

4957

.

yeoh
lm

,

Goodman
CD

,

Mollard
v.

,

McFadden
gi

,

RALPH
SA
Transcriptomiques comparatifs de gamétocytes féminines et masculines à Plasmodium Berghei et l’évolution du sexe dans les alvéoles

.

BMC Genomics

.

2017

;

18

:

734

.

Hehl
AB

,

BASSO
wu

,

lIppuner
c.

,

ramakrishnan
c.

,

> Okoniewski
m.

,

walker
ra

,

grigg
me

,

Smith
NC

,

déplaçages
p.
L’expansion asexuée de TOXOPLASMA GONFII MEROWOITES est distincte de tachyzoites et implique une expression de familles de gènes non superposées à attacher, envahir et reproduire dans des Enterocytes félines

.

BMC Genomics

.

2015

;

16

:

66

.

bushell
e.

,

gomes
ar

,

Sanderson
t.

,

anar
b.

,

,

,

Girling
g.

,

Herd
c.

,

METCALF

,

modrzynska
k.

,

Schwach
f.

,

Martin
Re

et al. .

Profilage fonctionnel d’un génome de plasmodium révèle une abondance de gènes essentiels

.

Cell

.

2017

;

170

:

260

272

.

mendez
d.

,

gaulton
a.

,

bento
ap

,

Chambers
j.

,

de Veij
m.

,

félix
e.

,

Magariños
député

,

Mosquera
JF

,

MuTowo
p.

,

Nowotka
m .

et al. .

CHEMBL: Vers le dépôt direct de données de bioassay

.

acides nucléiques Res.
2019

;

47

:

d930

D940

.

peña
i.

,

Pilar Manzano
m.

,

Cantizani
j.

,

kessler
a.

a.

,

alonso-padilla
j.

,

bardera
ai

,

alvarez
e .

,

colmenarejo
g.

,

Cotillo
i.

,

Roquero
i.

et al. .

Nouveaux ensembles de composés identifiés à partir d’un dépistage phénotypique à haut débit contre trois parasites kinetoplastides: une ressource ouverte

.

SCI. Représentant
2015

;

5

:

8771

.

Spangenberg
t.

,

BURROWS
jn

,

kowalczyk
p.

,

McDonald
s.

,

Wells
TNC

,

willis
p.
la boîte au paludisme d’accès ouvert: un catalyseur de découverte de médicaments pour les maladies négligées

.

plos un

.

2013

;

8

:

E62906

.

Haider
Assortiment comme un outil de recherche de structure / réaction complémentaire efficace: une approche open-source

.

molécules

.

2010

;

15

:

5079

5092

.

cheng
t.

,

zhao
y.

,

li
x.

,

lin
f.

,

xu
y.

,

zhang
x.

,

li
Y.

,

wang
r.

,

lai
l.
Computation des coefficients de partition d’octanol-eau par Guidant un modèle additif avec des connaissances

.

j. Chem. Inf. Modèle.
2007

;

47

:

2140

2148

.

o’boyle
nm

,

Banck
m.

,

James
ca

,

Morley
c.

,

VANDERMEERSCH
T.

,

HUTCHISON
GR
Ouvrir Babel: une boîte à outils chimique ouverte

.

j. Cheminformatique

.

2011

;

3

:

33

.

SR

,

mcNaught
a.

,

PLetNev
i.

,

stein
s.

,

,

,

,

,

TCHEKHOVSKOI
D.
Inchi, l’identifiant chimique international IUPAC

.

j. Cheminformatique

.

2015

;

7

:

23

.

lipinski
ca

,

Lombardo
f.

,

Dominy
BW

,

feeney
PJ
Expérimental et des approches informatiques pour estimer la solubilité et la perméabilité à la découverte de médicaments et aux paramètres de développement

.

adv. Drogue Deliv. Rév.
2001

;

46

:

3

26

.

congreve
m.

,

carr
r.

,

Murray
c.

,

jhoti
h.
une « règle de trois » pour la découverte de plomb basée sur des fragments

.

Discours de drogue. Aujourd’hui

.

2003

;

8

:

876

877

.

dalke
a.
chimfp – Formats et outils d’empreintes digitales rapides et portables

.

j. Cheminformatique

.

2011

;

3

:

P12

.

rogers
dj

,

tanimoto
TT
Un programme informatique pour les plantes de classification

.

science

.

1960

;

132

:

1115

1118

.

Youden
wj
index pour la note Tests de diagnostic

.

Cancer

.

1950

;

3

:

32

35

.

bottock
m.

,

ongieietsky
v.

,

HEER
j.
Documents pilotés par D3

.

IEEE trans. Vis. Compu. Graphique.
2011

;

17

:

2301

2309

.

probtst
d.

,

REYMOND
J.-L.
SmilesDrawer: analyse et dessin des structures moléculaires codées par des sources à l’aide de JavaScript côté client

.

j. Chem. Inf. Modèle.
2018

;

58

:

1

7

.

© L’auteur (s) 2019. Publié par Oxford University Press pour le compte de la recherche sur les acides nucléiques.
Ceci est un article d’accès ouvert distribué sous les termes de la licence non commerciale de Creative Commons Attribution (

), qui permet une réutilisation, une distribution et une reproduction non commerciales. Dans n’importe quel support, à condition que le travail original soit correctement cité. Pour une réutilisation commerciale, veuillez contacter les [email protected]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *