abstrait
Le volume de données biologiques, chimiques et fonctionnelles déposées dans le domaine public se développe rapidement, grâce au séquençage de la prochaine génération et aux technologies de dépistage hautement automatisées. Ces ensembles de données représentent des ressources précieuses pour la découverte de médicaments, en particulier pour les agents pathogènes de maladie négligés moins étudiés. Pour tirer parti de ces ensembles de données, une intégration de données intelligente et intensive est nécessaire pour guider les inférences de calcul à divers organismes. La TDR cible la ressource de chimiogénomique intègre des données génomiques provenant des agents pathogènes humains et des organismes modèles ainsi que des informations sur les composés bioactifs et leurs activités annotées. Ce rapport met en évidence les dernières mises à jour sur les données et fonctionnalités disponibles dans les objectifs du TDR 6. Sur la base des modèles de réseau chimiogénomique fournissant des liens entre des inhibiteurs et des objectifs, la base de données intègre désormais des priorités cibles axées sur le réseau et de nouvelles visualisations de sous-graphes de réseau affichant la chimie et la cible QuartiersImarchés avec des liens de bioactivité de cible associés. Les données disponibles peuvent être parcourues et interrogées via une nouvelle interface utilisateur, permettant aux utilisateurs d’effectuer des priorités d’objectifs de protéines et d’inhibiteurs de produits chimiques. En tant que tels, les objectifs du TDR facilitent désormais l’enquête sur la réutilisation de médicaments contre des cibles d’agents pathogènes, ce qui peut potentiellement aider à identifier les objectifs candidats aux composés bioactifs avec des cibles auparavant inconnues. Les cibles du TDR sont disponibles à https://tdrtargets.org.
Introduction
Les maladies tropicales négligées (NTD) affectent de manière disproportionnée ~ 15 milliards de personnes à faible revenu et en développement Les pays, où ils constituent une cause de premier plan pour les années de vie perdues au handicap et à la mort prématurée (1). Historiquement, le manque d’implication de l’industrie pharmaceutique, associé à des investissements limités dans les programmes de recherche sur la santé publique dans les pays touchés, a entraîné une lacune de médicaments disponibles pour contrôler efficacement la majorité de ces maladies (2). De plus, les médicaments actuellement utilisés pour traiter ces maladies sont souvent compromis en termes de coût, de difficultés d’administration, d’efficacité, de résistance à la drogue ou de profils de sécurité.
Discovery médicamenteux est un processus fastidieux et coûteux (3 , 4). Pour les NTD en particulier, les programmes de découverte de la drogue doivent survivre suffisamment longtemps grâce à des pénuries de financement omniprésentes pour en faire des essais cliniques ultérieurs (5). Dans ce contexte, une approche stratégique pour la découverte de la drogue de la NTD est le repositionnement de la drogue (6), ce qui peut aider à réduire les coûts en facilitant les approbations réglementaires des premiers essais pour les médicaments qui ont déjà subi une recherche clinique pour d’autres maladies et / ou des indications et ont échoué pour des raisons autres. que la sécurité (6). En outre, si la portée de la réutilisation de médicaments est élargie pour inclure des médicaments et des composés bioactifs de la recherche sur les organismes non humains, il peut également entraîner l’identification d’au moins de nouveaux outils chimiques pour sonder la fonction des cibles et des voies des agents pathogènes humains. Ainsi, en tirant parti des vastes quantités de données provenant de programmes de recherche bien financés sur les maladies humaines et les organismes modèles, le paysage de la découverte de médicaments sur les NTDS obtient un coup de pouce positif (7).
stratégies de calcul devient de plus en plus Indispensable dans la découverte des médicaments traductionnels, tant dans les universités que dans l’industrie pharmaceutique. L’intégration intelligente et intensive des volumes croissants de données générée au cours de toutes les phases de la découverte de médicaments permettent déjà de traiter les principaux défis du processus (8). Depuis son introduction, la base de données TDR cible a été une ressource fiable pour les chercheurs de maladies négligés pour accéder aux données de chimenomologie pour la hiérarchisation des cible de médicaments et la réutilisation de médicaments sur des maladies négligées. Introduit en 2008 (9), cette ressource d’accès ouvert a permis aux chercheurs de trouver de nouvelles cibles de protéines et des inhibiteurs de produits chimiques et de les hiérarchiser pour le développement de médicaments pour les pathogènes de la NTD. Les cibles du TDR utilisent des jeux de données fonctionnels à l’échelle du génome publiquement disponibles afin de permettre aux utilisateurs de trouver et de hiérarchiser les objectifs en fonction de leurs connaissances de la biologie de leur agent d’intérêt et de la nature de la maladie (10,11). Ceci est implémenté par une sélection de cible flexible et basée sur l’utilisateur (à l’aide de critères de filtrage) et du classement (en utilisant une pondération spécifique à des critères) (12,13).
ici, nous décrivons les mises à niveau sur les jeux de données sous-jacents et La fonctionnalité dans la ressource TDR cible, accumulée depuis sa publication précédente en 2012 (13). La nouvelle version de TDR cible (V6.1, TDR6 abrégée dans cet article) intègre des informations génomiques spécifiques à l’agent pathogène avec des données fonctionnelles (par exemple.l’expression, les relations à base d’orthologie, l’essentialité) d’une sélection d’organismes, ainsi que des données de composés bioactifs (structure chimique, propriété et bioactivité / informations cible); Tous peuvent être interrogés et parcourus à travers l’application Web. Toutes les questions peuvent être enregistrées sur une réserve personnelle par les utilisateurs enregistrés et publiées via l’application Web pour maximiser les opportunités de collaboration. Les listes de cibles prioritaires peuvent être exportées pour une analyse hors ligne. Les détails complets de toutes les nouvelles fonctionnalités sont disponibles dans les notes de version (https://tdrtargets.org / Communiqués). Ce rapport présente une procédure normale complète de l’application Web, ses nouvelles fonctionnalités et des exemples visant à illustrer les cas d’utilisation.
Aperçu et organisation des cibles TDR
comme dans les versions précédentes des cibles du TDR, TDR6 est également organisé en deux sections principales: cibles et composés. La section cibles de la base de données contient des données à l’échelle du génome de 20 agents pathogènes humains et permet aux utilisateurs d’exécuter des requêtes et des hiérarchies d’objectifs de protéines basées sur un certain nombre de fonctionnalités et de données pertinentes pour la découverte de médicaments (voir tableau 1). La section Composés de la base de données contient des informations sur > 2 millions de composés bioactifs et permet des requêtes en fonction des propriétés chimiques des composés et de leurs bioactivités annotées (voir tableau 2).
requêtes cibles disponibles dans les cibles TDR
« 0C75667CCE »>
requêtes cibles disponibles dans les cibles TDR
« 0C75667CCE »>
requêtes composées disponibles dans les cibles TDR
requêtes composées disponibles dans les cibles TDR
0C75667CCE « >
nouvelles fonctionnalités de Cibles TDR 6
Nous avons récemment signalé un modèle de réseau intégrateur (14) où tous les ensembles de données à échelle génomique disponibles dans des objectifs de TDR (cibles de protéines), informations chimiques (composés bioactifs) et leurs relations (bioactivité de composés dans Les tests basés sur la cible) ont été liés à un graphique multicouche. Dans TDR6, ce modèle de réseau a été mis à jour en intégrant de nouveaux ensembles de données (décrits ci-dessous). Ce modèle intègre des liens entre des cibles et des composés bioactifs dérivés de la curation manuelle des tests de bioactivité publiés (liens directs entre cibles et composés chimiques), ainsi que des relations calculées (liaisons cibles cibles et des liaisons composés composés) à base d’annotations de protéines (Domaines PFAM, groupes ortholog) et similarité chimique. Un aspect clé de ces liens dans le modèle multicouche-réseau est qu’ils permettent d’explorer et de visualiser rapidement le voisinage autour de cibles sélectionnées et / ou de composés bioactifs. Cela permet aux utilisateurs d’explorer les composés liés aux cibles, d’inspecter le quartier de similarité chimique autour de composés bioactifs et de visualiser ces données de manière conviviale et complète (voir la figure 1).
Modèle de réseau schématique dans les visualisations de TDR6 et de sous-graphique: les pages composées ou cible affichent maintenant une visualisation sous-graphique contenant des objets contenant des objets du réseau de l’entité sélectionnée. Ces graphiques sont construits à partir d’un graphique réseau complexe à trois couches. Un schéma de ce graphique est présenté en haut. Les sous-graphiques cibles et composés sont toujours agencés comme suit: Les nœuds de composés (vert) sont connectés à des cibles (orange = pathogènes; gris = non pathogènes) à travers des bords de bioactivité. Ces liens représentent des résultats positifs (verts), neutres (gris) ou négatifs (rouge) (rouge). Enfin, cible la carte dans un ensemble d’affiliations fonctionnelles (annotations, nœuds bleus). Dans l’exemple, le graphique montre un ensemble d’inhibiteurs connus pour une acyltransférase humaine (15). Ces bioactivités (toutes positives) sont dessinées sous forme de liaisons vertes entre les composés (nœuds verts) et la cible (nœuds gris pour les nœuds non pathogènes, nœuds orange pour agents pathogènes). Le graphique met en évidence les opportunités de réutilisation des acyltransférases helminthe (lignes pointillées, ajoutées manuellement pour cette figure), basée sur des annotations partagées avec la cible humaine pharmactable connue. Le nœud rouge dans la couche de drogue indique le composé sélectionné. Les tailles de nœuds sont déterminées par le nombre de connexions dans le réseau (degré), tandis que les largeurs de liaison de bioactivité (bords) sont liées au nombre cumulé de preuves expérimentales pour une paire cible de médicament donnée (nombre d’essais).
Modèle de réseau schématique dans TDR6 et les visualisations de sous-graphique: Les pages composées ou cible affichent maintenant une visualisation sous-graphique contenant des objets dans le Vicité du réseau de l’entité sélectionnée. Ces graphiques sont construits à partir d’un graphique réseau complexe à trois couches. Un schéma de ce graphique est présenté en haut. Les sous-graphiques cibles et composés sont toujours agencés comme suit: Les nœuds de composés (vert) sont connectés à des cibles (orange = pathogènes; gris = non pathogènes) à travers des bords de bioactivité. Ces liens représentent des résultats positifs (verts), neutres (gris) ou négatifs (rouge) (rouge). Enfin, cible la carte dans un ensemble d’affiliations fonctionnelles (annotations, nœuds bleus). Dans l’exemple, le graphique montre un ensemble d’inhibiteurs connus pour une acyltransférase humaine (15). Ces bioactivités (toutes positives) sont dessinées sous forme de liaisons vertes entre les composés (nœuds verts) et la cible (nœuds gris pour les nœuds non pathogènes, nœuds orange pour agents pathogènes). Le graphique met en évidence les opportunités de réutilisation des acyltransférases helminthe (lignes pointillées, ajoutées manuellement pour cette figure), basée sur des annotations partagées avec la cible humaine pharmactable connue. Le nœud rouge dans la couche de drogue indique le composé sélectionné. Les tailles de nœuds sont déterminées par le nombre de connexions dans le réseau (degré), tandis que les largeurs de liaison de bioactivité (bords) sont liées au nombre cumulé de preuves expérimentales pour une paire de médicaments donnée (nombre d’essais).
Avec ces mises à jour, TDR6 donne maintenant aux utilisateurs les fonctionnalités suivantes: (i) des priorités ciblées sur le génome entiers axées sur le réseau, (ii) l’exploration de la réutilisation de médicaments; et iii) l’exploration des objectifs candidats pour les composés orphelins. Ces cas d’utilisation sont possibles grâce à un certain nombre de fonctionnalités de réseau précalcules telles qu’un nouveau score de réseaux-droguabilité (NDS). En associant une métrique quantitative à des cibles basées sur l’enrichissement des composés bioactifs sur les nœuds de réseau étroitement connectés, ce score facilite la classification des objectifs en groupes de pharmacibilité (DGS), qui sont disponibles pour les utilisateurs des requêtes de base de données.
Le Le modèle de réseau constitue également la base des priorités de la part des réseaux précomptes (NDD) pouvant être interrovisé par les utilisateurs et sont également utilisées en interne par TDR6 pour sélectionner des objectifs connectés et des composés à afficher dans les visualisations de réseau nouvellement développées (voir ci-dessous). Lors du partage d’un composé d’intérêt, TDR6 utilise les priorités précalisées des objectifs candidats pour aider les utilisateurs à la navigation dans la navigation de l’espace cible autour du composé (et inversement à partir d’une cible d’intérêt). En fournissant ces métriques et classements d’enrichissement précalculés, la base de données facilite désormais la découverte de nouvelles associations de cible de médicaments. Outre ces nouveaux NDD précalisés, les utilisateurs peuvent hiérarchiser les objectifs à l’aide des mêmes fonctionnalités que dans les versions précédentes de TDR cibles.
Cette version inclut également plusieurs mises à niveau de données, à savoir l’inclusion de 22 nouveaux génomes (20 nouveaux agents pathogènes et 2 nouveaux organismes modèles) et des mises à jour approfondies des données chimiques et de bioactivité entre autres. L’interface utilisateur améliorée et polyvalente, ainsi que les mises à jour de données renouvellent l’engagement de TDR pour fournir un outil intégré et puissant pour explorer les données génomiques et chimiques dans le contexte de maladies tropicales négligées.
Utilisation de cibles TDR 6
priorités cible de génome entier
Le modèle de réseau (14) est la base du nouveau score de pharmacibilité, qui est une métrique dérivée de réseau liée à l’enrichissement des composés bioactifs pour un cible (NDS, «score de droguabilité du réseau»). Les NDS sont disponibles pour tous les organismes de niveau 1, qui peuvent être interrogés et utilisés pour peser des requêtes pour filtrer (dans ou Out) cibles dans des pipelines de priorités personnalisées définies par l’utilisateur. Comme expliqué plus avant dans les détails de l’intégration du réseau, pour chaque organisme, des objectifs ont été classés en cinq groupes de drogue (DG), du plus bas (DG1) à la notation la plus élevée (DG5), en fonction de leurs performances dans les priorités de réseau.
Comme dans les versions précédentes des cibles TDR, les utilisateurs peuvent combiner différents ensembles de données simplement en exécutant des requêtes individuelles sur différents types de données et en les combinant sur la page d’historique (9, 10,12,13). Ceci est utile lorsque, par exemple, les utilisateurs souhaiteraient inclure des types de données supplémentaires aux priorités axées sur la drogue, telles que celles qui s’appuient sur l’expression de gènes dans des étapes de cycle de vie pertinentes, ou celles fournissant des informations sur la condition physique / la létalité des objectifs (essentiellement).
Par exemple, nous présentons ici un exemple de priorisation utilisant TOXOPLASMA GONDIII comme agent pathogène d’intérêt. T. GONDIII est un parasite apicomplexique souvent utilisé comme modèle pour étudier la biologie sous-jacente à plusieurs maladies humaines et animales (15). La stratégie de recherche est résumée à la figure 2. La requête a été lancée par la recherche de toutes les cibles T. GONDII et filtrant ces objectifs avec des homologues chez l’homme (pour ne sélectionner que des objectifs spécifiques à la parasite). Ensuite, nous avons sélectionné des gènes essentiels candidats basés sur des profils de fitness lors de l’infection de fibroblastes humains (16); et aussi des gènes sélectionnés hautement exprimés en tachyzoites (étape réplique de T. gondii) en interrogant pour les gènes dans le top 80-100 centile de l’abondance de la transcription RNaseq (17). Ces sélections ont été combinées au classement de la droguabilité du réseau. Pour cela, nous avons considéré des gènes dans des groupes de drogue 3, 4 ou 5 (DG ≥ 3) (voir la figure 2). La figure montre toutes les requêtes et leurs résultats comme indiqué dans la page Historique, et les opérations effectuées lors de la combinaison des requêtes (Union, intersection). La liste finale des objectifs classés sur la base de ces critères a été rendue publique et est disponible dans la section cibles TDR des listes publiées.
cible Exemple de priorisation Stratégie pour T. GONDIII. L’image composite montre (a) les termes de la requête utilisées pour trouver T. gondii cibles qui n’ont aucun homologue chez l’homme, qui sont très exprimés dans la phase de tachyzoïte virulente du parasite pendant l’infection cellule humaine, probablement essentielle et probablement pharmactable selon au score de drogue réseau. (B) Résumé des requêtes effectuées à la page « Cugets », indiquant comment ces requêtes apparaissent dans la page « Historique », où elles peuvent être examinées et transformées. Les boutons de gestion des requêtes en ligne permettent des actions sélectionnées (supprimer, renommer, exporter) sur les résultats des résultats.(C) Les combinaisons de requêtes permettent aux utilisateurs d’exécuter un syndicat, intersecter ou soustraire des actions sur les requêtes et les unes des autres. Des exemples d’actions union et intersection sont montrés. (D) Les requêtes peuvent être sauvegardées sur une cachette privée (ma requête) de l’endroit où elles peuvent être renvoyées à l’espace de travail (pour effectuer des opérations de requête supplémentaires) ou partagées publiquement avec d’autres utilisateurs de TDR cible (mes séries de requêtes cibles publiées).
Exemple de priorisation cible Stratégie pour T. GONDIII. L’image composite montre (a) les termes de la requête utilisées pour trouver T. gondii cibles qui n’ont aucun homologue chez l’homme, qui sont très exprimés dans la phase de tachyzoïte virulente du parasite pendant l’infection cellule humaine, probablement essentielle et probablement pharmactable selon au score de drogue réseau. (B) Résumé des requêtes effectuées à la page « Cugets », indiquant comment ces requêtes apparaissent dans la page « Historique », où elles peuvent être examinées et transformées. Les boutons de gestion des requêtes en ligne permettent des actions sélectionnées (supprimer, renommer, exporter) sur les résultats des résultats. (C) Les combinaisons de requêtes permettent aux utilisateurs d’exécuter un syndicat, intersecter ou soustraire des actions sur les requêtes et les unes des autres. Des exemples d’actions union et intersection sont montrés. (D) Les requêtes peuvent être sauvegardées sur une cachette privée (ma requête) de l’endroit où elles peuvent être renvoyées à l’espace de travail (pour effectuer des opérations de requête supplémentaires) ou partagées publiquement avec d’autres utilisateurs de TDR cible (mes séries de requêtes cibles publiées).
Stratégies de réutilisation de médicaments à l’aide de Transformations de requête
La requête de la pharmacibilité dans TDR6 permet aux utilisateurs de sélectionner des cibles d’inhibiteurs / drogues prédites connus ou prédits. Les informations sur les cibles avec des médicaments connus proviennent de la curation de la littérature, alors que les associations d’objectifs prédits (indirectes) avec des inhibiteurs / médicaments sont obtenues grâce à des calculs de similitude ou d’orthologie de séquence (cibles droguées connues) ou par des inférences supportées par le réseau (14). Toutes ces méthodes sont implémentées dans TDR6. Par conséquent, lorsque les utilisateurs filtrent un gène défini sur la droguauté, ils limitent la sélection à des objectifs hautement classés, ce qui devrait fournir une source riche d’opportunités de réutilisation de médicaments.
pour mettre en valeur l’utilité de TDR6 dans cette zone que nous montrons Comment rechercher des médicaments candidats pour réutiliser pour l’échinococcus multiloculoculaire (l’agent causatif de l’échinococcose alvéolaire). Ceci est montré à la figure 3. Le processus est similaire à celui décrit précédemment pour T. GONDIII, mais dans cette stratégie de requête, nous n’avons pas exclu d’homologues humains et ont utilisé C. Elegans Rnai Létasets de données comme proxy pour l’essentialité Nematode. En conséquence, nous avons obtenu une hiérarchisation globale du génome pour E. Multilocularis. Ensuite, appliquez un filtre basé sur une drogue à cette requête, nous avons réduit la sélection de gènes à une poignée de gènes. L’utilisateur peut inspecter manuellement les objectifs sélectionnés pour savoir quels médicaments ont été répertoriés via des associations indirectes. Les pages cibles afficheront tous les composés associés dans la section Droguative, classés en fonction de la source de l’inférence. Pour les déductions axées sur le réseau, le score de chaque composé proposé apparaîtra à la fois en tant que liste et en termes de grade, d’identifier rapidement des candidats prometteurs. Alternativement, pour minimiser l’inspection manuelle, la liste des gènes (c’est-à-dire la requête elle-même) peut être facilement convertie en une liste de médicaments associés en cliquant sur les boutons ‘Convertir cette requête’ en haut des pages Résultats de la requête. Cette fonctionnalité offre un moyen rapide de commencer à créer une bibliothèque de filtrage pour un ensemble d’objectifs. Les transformations de requête peuvent être basées sur les médicaments incrustés (médicaments connus pour un ensemble de cibles), prévus (associations calculées à la drogue) ou les deux. Dans les trois approches, les inhibiteurs / médicaments associés à des cibles droguées connues sont associés de manière transitoire aux gènes de la liste. La figure 3 résume la stratégie de hiérarchisation, la conversion de la requête de la liste des gènes en composés et un exemple de la visualisation de sous-graphique disponible à partir de la page composée d’un hit de réutilisation. Actuellement, ces conversions sont exécutées en arrière-plan et les résultats figurent dans la section Historique du site Web lors de la fin (les utilisateurs sont également alertés par courrier électronique).
Possibilités de réutilisation de médicaments pour E. Multilocularis à l’aide de transformations de requête. Un schéma de hiérarchisation cible d’Echinococcus multiloculoculaire s’appuie sur l’inférence sur l’orthologie et la drogue prédite (DG ≥ 3). A) des requêtes combinées; (B) la liste initiale des objectifs prioritaires. (C) toute liste cible peut être «transformée» dans une liste de leurs médicaments associés, en utilisant l’une des méthodes de liaison des composés disponibles (voir le texte principal). (D) Liste résultante des composés bioactifs. (E) Exemple de visualisation de sous-graphique réseau à partir d’un composé sélectionné, montrant des liens de bioactivité actifs et inactifs. Les composés (nœuds verts) sont connectés à des cibles pathogènes (orange) selon des enregistrements de bioactivité (vert = actif; rouge = inactif, voir le texte principal des seuils d’activité).Les cibles sont à son tour connectées (liaisons grises) aux affiliations fonctionnelles (nœuds bleus). Le rendu des sous-graphiques fournit des conseils visuels sur la manière dont la cible initiale E. Multilocularis est connectée au composé sélectionné dans le réseau.
Possibilités de réutilisation de médicaments pour E. Multilocularis à l’aide de transformations de requête. Un schéma de hiérarchisation cible d’Echinococcus multiloculoculaire s’appuie sur l’inférence sur l’orthologie et la drogue prédite (DG ≥ 3). A) des requêtes combinées; (B) la liste initiale des objectifs prioritaires. (C) toute liste cible peut être «transformée» dans une liste de leurs médicaments associés, en utilisant l’une des méthodes de liaison des composés disponibles (voir le texte principal). (D) Liste résultante des composés bioactifs. (E) Exemple de visualisation de sous-graphique réseau à partir d’un composé sélectionné, montrant des liens de bioactivité actifs et inactifs. Les composés (nœuds verts) sont connectés à des cibles pathogènes (orange) selon des enregistrements de bioactivité (vert = actif; rouge = inactif, voir le texte principal des seuils d’activité). Les cibles sont à son tour connectées (liaisons grises) aux affiliations fonctionnelles (nœuds bleus). Le rendu des sous-graphiques fournit des conseils visuels sur la manière dont la cible initiale E. Multilocularis est connectée au composé sélectionné dans le réseau.
Exploration des composés orphelins
Les activités des composés extraits de la littérature par curation apparaissent sous la forme d’analyses à base de cible (liaison directe vers la cible) ou sous la forme d’essais à base de cellules ou d’organisme entiers. En l’absence d’autres informations, ces derniers classes de tests ne fournissent pas d’indices sur la cible ou le mécanisme d’action des composés. Au cours du processus de mises à jour des données chimiques dans TDR6, nous avons identifié des composés avec des effets phénotypiques rapportés sur les analyses entiers ou les analyses à base de cellules, sur la base de leurs classifications de la chimique. Ces informations ont été utilisées pour identifier les composés « orphelins » qui sont actifs contre un agent pathogène particulier dans les projections primaires ou secondaires à base de cellules, mais pour lesquels il n’y a pas d’essai basé sur la cible.
composés orphelins dans TDR6 peut être Recherche de toute espèce avec des données de dépistage phénotypiques disponibles dans la page Recherche de composés. Cela permet d’obtenir un moyen rapide de tirer parti des données provenant de tests à haut débit, permettant aux utilisateurs de commencer leurs priorités à partir de composés avec une activité connue contre un agent pathogène d’intérêt.
Le modèle réseau intégré dans TDR6 est également utile pour identifier le candidat cibles pour les composés orphelins. Comme décrit dans la publication d’origine (14), le quartier de similarité chimique calculé autour d’un composé orphelin sélectionné peut fournir des liens indirects à une ou plusieurs cibles. En utilisant cette stratégie, nous avons effectué des priorités cibles pour tous les composés orphelins dans TDR6. Ces priorités de composition de réseau précalisées sont disponibles pour tous les organismes pour lesquels des données de criblage phénotypique sont disponibles. Les résumés globaux montrant tous les composés orphelins pour ces organismes sont liés à partir de la page « Résumé des données » (voir https://tdrtargets.org / DataSummary, et cliquez sur l’espèce d’intérêt). Un exemple de hiérarchisation basée sur le composé orpheline pour T. cruzi est illustré à la figure 4. Alors que les priorités à partir d’un seul composé sont disponibles dans chaque page composée.
Exploration des objectifs candidats pour les composés d’orphelins de Trypanosoma Cruzi. L’intrigue résume la hiérarchisation cible axée sur le réseau pour les composés orphelins actifs contre T. Cruzi. Toutes les séquences de codage protéique dans le génome de T. Cruzi (cibles candidates) sont disposées sur l’axe des x. Les points de données de l’intrigue correspondent aux associations de médicaments cible marquées par l’algorithme (marquée tracée sur l’axe des Y). Par exemple, nous avons souligné deux cibles putatives pour deux médicaments différents (comme indiqué dans la page Récapitulatif de données T. Cruzi). Des parcelles similaires sont disponibles en ligne pour les organismes de niveau 1 dans TDR6 (liés à partir de la page de résumé des données).
Exploration des objectifs candidats pour les composés orphelins de Trypanosoma Cruzi. L’intrigue résume la hiérarchisation cible axée sur le réseau pour les composés orphelins actifs contre T. Cruzi. Toutes les séquences de codage protéique dans le génome de T. Cruzi (cibles candidates) sont disposées sur l’axe des x. Les points de données de l’intrigue correspondent aux associations de médicaments cible marquées par l’algorithme (marquée tracée sur l’axe des Y). Par exemple, nous avons souligné deux cibles putatives pour deux médicaments différents (comme indiqué dans la page Récapitulatif de données T. Cruzi). Des parcelles similaires sont disponibles en ligne pour les organismes de niveau 1 de TDR6 (liés à partir de la page Récapitulatif des données).
Fonctionnalité et mises à jour de données
Nouvelles données génomiques dans TDR cible V6.1
Depuis la publication précédente de la base de données TDR cible (13), plusieurs génomes d’agent pathogène ont été ajoutés. Une liste détaillée est fournie dans le tableau 3 ainsi que en ligne sur la page Récapitulatif de données TDR6 (https://tdrtargets.org / DataSummary).
Sommaire de disponibilité des données pour les agents pathogènes de niveau supérieur. Résumé des données cibles disponibles pour les organismes de niveau 1 dans les objectifs de TDR. CD: séquences de codage; PFAM: nombre de protéines avec domaine (s) mappé (s) PFAM; Aller: Nombre de protéines avec des termes de l’ontologie du gène mappé; CE: nombre de protéines avec des chiffres de la Commission d’enzyme mappé (CE); Voies: nombre de protéines mappées sur les cartes de la voie de Kegg; Orthologs: nombre de séquences mappées sur des groupes orthomcl ortholog. Un tableau de récapitulatif de données plus complet est disponible en ligne à https://tdrtargets.org / datasummary
11316
10249
5432
10474
16292
2207
10484
12224
12692
10386
10270
18639
18140
Entamoeba histolytica
95600
35474
18435
87303
Sommaire des données Disponibilité Top pathogènes de niveau. Résumé des données cibles disponibles pour les organismes de niveau 1 dans les cibles TDR. CD: séquences de codage; PFAM: nombre de protéines avec mappée Pfam Domaine (s); GO: nombre de protéines avec des termes cartographiées Gene Ontology; CE: nombre de protéines avec le nombre des enzymes (EC) a cartographié; Pathways: nombre de protéines cartographiées à des cartes de la voie KEGG; Orthologues: nombre de séquences mises en correspondance avec les groupes de OrthoMCL. Une table de données plus complète Résumé est disponible en ligne à https://tdrtargets.org / datasummary
espèces. | CD. | Pfam. | GO. | CE. | Pathways. | Orthologues. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |||||||||
5344 | 3264 | 2631 | 641 | 806 | 5207 | ||||||||||
Toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |||||||||
Chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | |||||||||
Mycobacterium leprae
1630 |
1236 | 929 | 628 | 611 | 1473 | ||||||||||
Mycobacterium tuberculosis | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |||||||||
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |||||||||
Trep Onema pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |||||||||
Wolbachia endosymbiont de B.Malaisi | 588 | 588 | 388 | ||||||||||||
brugia malayie
11316 |
7042 | 6368 | 1278 | 1787 | 6481 | 6481 | 854 | 1965 | 7109 | ||||||
Echinococcus multiloculoculaire
10474 |
6817 | 779 | 758 | ||||||||||||
loa loa (ver oeil) | 1509 071 | 1559 071 | 1539 071 | 679 071 | 15371 | 1539 071 | 1539 071 | 1559 071 | 2207 | 10484 | 2378 | 2178 | 246 | 563 | 4054 |
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||||||||||
Leishmania Major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | 5480 |
1019 | 1264 | 9259 | |||||
TRYPANOSOMA CRUZI
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | Giardia Lambia | 2263 | 2263 | 2735 272 |
3635 |
2235 |
514 |
5977 |
|
|
Trichomonas vaginalis
95600 35474 |
18435 | 843 | CDS. | PFAM. | Go. | CE. | sentiers. | orthoogs. | lasmoodium | 3322 551 | 7166 | Plasmox Vivax | 641 | 606 06 06 06 06 5207 | |
TOXOPLASMA GONIII | 7946 | 4025 | 3795 | 772 | 967 |
598 | 269 | mycobacterium | 1630 | 1236 P2 |
673 | ||||
Mycobaacterium tdulesis page | 1174 | 1174 | 1174 | 1174 | 3287 | 873 | 1002 | 3459 | Trep Onema pallen |
61 33 33 33 33 33 33 | 633 | ||||
Wolbia IndussiABiant de Bmalayi | 805 | 628 | 577 | 308 | 382 | 688 | |||||||||
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | ||||||||||
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | |||||||||||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | ||||||||||
Loa loa (à vis sans fin de l’œil)
16292 |
8071 | 6774 | 1539
2207 10484 |
||||||||||||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | ||||||||||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||||||||||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |||||||||
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | ||||||||||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | ||||||||||
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | |||||||||
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Compte tenu de la diversité des organismes intégrés dans des cibles TDR et, par conséquent, la variété des sources de données nécessaires pour couvrir toutes les génomes; des efforts considérables ont été mis en normalisation des données et l’analyse récupération des informations du génome Ces organismes. La plupart des génomes complets ont été obtenus à partir de EupathDB (18), GenBank (19), GeneDB (20), WormBase Parasite (21), GenoList (22) ou Mycobrowser (23). Une description complète des sources génomiques et données dans le tableau précédent complémentaire S1. Pour mettre à jour les données sur les organismes présents dans la version précédente des cibles TDR gènes codant des protéines de la version actuelle des génomes ont été soit à des gènes existants mappées dans les cibles TDR, ou autrement entrés dans les nouveaux enregistrements. Le mappage algorithme utilise une combinaison de conditions pour suivre des identifiants de gènes dans les rejets et maintenir l’identité des gènes: séquence de mise en correspondance des sommes de contrôle (à l’aide des valeurs de hachage de 128 bits générés par l’algorithme MD5), les noms de gène ou des identificateurs et le souffle (24) SI ou matchs parfaits sont trouvés. Après la mise à jour des enregistrements, le Pipeline calcule à l’aide de propriétés physico-chimiques Pepstats (25), des analyses pour les domaines transmembranaires avec TMHMM (26), des peptides de signal avec SignalP (27) et points d’ancrage glycosylphosphatidylinositol, en utilisant PredGPI (28). L’algorithme rejette toutes les séquences codantes non, dont les plus les pseudogènes, pour éviter des annotations trompeuses et de minimiser les fausses hypothèses au cours des flux de travail de priorisation. La plupart des TDR6, mentionné ci-dessus pour toutes les tâches génome intégration et mise à jour ont été raccourcies dans le flux de travail automatisé pour faciliter les mises à jour plus rapidement dans les prochaines versions. Un schéma de la mise à jour et l’algorithme de tuyau représenté sur la figure précédente complémentaire S1. Le pipeline permet également d’automatiser le calcul des annotations à l’aide ad hoc des stratégies individuelles pour les différentes annotations, en se fondant sur les services Web et les API (apparu dans le service Kaas (29) pour les protéines de cartographie à des voies métaboliques et au nombre CE Classification des enzymes, ou OrthoMCL base de données et un outil (30,31) pour les groupes de cartographie aux protéines. Le pipeline repose également sur le calcul des bases de données installées localement sont apparues les plus InterPro (32), en utilisant InterProScan (33) pour identifier les domaines de protéines (Pfam) et carte termes de vocabulaires contrôlés et classifications (termes GO). des ressources supplémentaires sont apparues plus 3D Structures et modèles structurels ont été extraites de la Protein Data Bank (34) en utilisant les services Web et téléchargés à partir du site FTP Modbase (35), respectivement.
aussi le nombre d’ensembles de données fonctionnels clés ont été intégrés dans le présent communiqué, y compris (i) des ensembles de données transcriptomiques, qui témoignent de l’expression génique dans les stades du cycle de vie ou des conditions expérimentales qui sont pertinente pour la découverte de médicaments (36-47) et (ii) des jeux de données de essentialité proviennent de deux agents pathogènes apicomplexes (P. berghei et T. gondii) (16,48), qui fournissent des informations sur les stratégies vitales ASSIST des priorités.
Mises à jour des données chimiques
Pour les composés bioactifs aussi, les flux de travail de mise à jour des données ont été automatisées pour cette version.La majorité des composés bioactifs ont été récupérés à partir de la libération chimique 24th (49), qui contient des jeux de données supplémentaires tels que ceux des boîtes chimiques spécifiques à pathogènes – des boîtes Kinetoplastid GSK (50), une boîte pathogène MMV (51). Le processus d’intégration commence à partir des descriptions de molécules (2D) au format SDF, à partir desquelles nous avons calculé toutes les empreintes digitales de composition nécessaires (requises pour les recherches de similarité / sous-structure composées) à l’aide de Checkmol (52). Le pipeline calcule également des propriétés chimiques supplémentaires telles que le coefficient de cloison d’octanol / eau de Logp et d’autres descripteurs structurels à l’aide de XLOGP3 (53) et les outils de babélisation ouverts obprrop et OBROTAMER (54). D’autres données pertinentes ont été obtenues ou calculées directement à partir de la structure composée, telle que les identificateurs Inchi et InchikeTy (55) utilisés pour le suivi composé; et d’autres règles standard utilisées dans la chimie médicinale et la découverte de médicaments, telles que la règle de Lipinski de cinq (56 ans) et la règle connexe de trois (57).
Après l’intégration dans des objectifs du TDR, tous les composés ont été soumis à à un tout contre tout la comparaison de la similarité chimique en utilisant Chemfp (58) qui produit des mesures de similarité par paires basées sur l’indice Tanimoto / Distance (59). En outre, nous avons calculé une carte globale (toutes par rapport à toutes) des relations de sous-structure entre les composés de la base de données (X est une sous-structure de Y; Y est une superstructure de x). Sachant que le problème de la recherche de sous-graphes ordinaires maximum entre les molécules est calculé en calcul, nous avons appliqué une approche heuristique pour trouver des sous-structures. L’algorithme obtient d’abord un sous-ensemble de molécules candidates possibles en utilisant des empreintes digitales précédemment calculées. Les candidats doivent avoir des empreintes digitales correspondantes avec la molécule d’objet. Une fois que la liste des candidats est obtenue, la détermination de la sous-structure complète des atomes-atoms est effectuée par paire à l’aide de Matchmol (52). Les données disponibles pour les composés et les requêtes pouvant être exécutées sur chaque type de données sont résumées dans le tableau 2. La distribution de poids moléculaire (MW) et de surface polaire (PSA) pour tous les composés de la base de données est indiquée dans la figure supplémentaire S2.
Curation et intégration des données de bioactivité
Comme avec des composés chimiques, la plupart des bioactivités intégrées aux cibles du TDR proviennent directement des sources de données en amont (par exemple, Chembl). Lors de l’intégration des données de bioactivité, nous avons préservé à la fois l’annotation du test (test de réduction de la motilité par exemple in vitro contre Brugia Malayi Microfiliariae à 10 μm ‘) et la valeur numérique et des unités associées aux activités composées (par exemple, inhibition de 80%’, ‘1.5 μM IC50 ‘, ’10 NM MIC’), qui sont tous des champs interrogeables. De plus, et pour faciliter les requêtes des utilisateurs, les bioactivités signalées ont été utilisées pour grouper des composés dosés dans des classes «actives» ou «inactives». Cependant, pour minimiser l’effet de l’utilisation des limites dures autour des seuils arbitraires et d’augmenter la séparation entre les classifications actives / inactives, nous avons également défini une zone grise indéterminée. Par conséquent, les composés scoring juste en dessous d’un seuil arbitraire ne sont pas considérés comme inactifs à des fins de la requête et de la visualisation.
Tous les types d’activité n’ont toutefois pas été utilisés pour la classification. Malgré les efforts de la normalisation de ces données d’activité, l’interprétation des activités des composés à cette échelle est difficile, car elles dépendent souvent du type de test particulier, des unités signalées et des conditions particulières dans lesquelles chaque test a été effectué. Cependant, un ensemble significatif de types de dosage pourrait être automatiquement classé dans des catégories active / indéterminée / inactives basées sur des seuils d’activité. Pour cela, tous les types de test avec > 100 000 rapports (voir la figure supplémentaire S3 pour une activité par type de test / par tracé de distribution composé) ont été considérés pour l’audit d’activité, bien que seuls des analyses à base de concentration (tels que le CI50, le KI ou la puissance) ont été trouvés suffisamment robustes pour une telle détermination, car des tests basés sur le pourcentage (telles que% activité,% d’activité résiduelle ou d $ inhibition) étaient ambiguës dans les rapports de bioactivité. Les seuils utilisés pour classifier les activités de chaque type de test peuvent être trouvés dans le tableau 4 et la distribution de composés dans ces classes d’activité est résumée à la figure 5.
Types de test et seuils d’activité utilisés pour la détermination des balises d’activité: Seuls les dosages à base de concentration ont été utilisés pour déterminer les étiquettes d’activité. Les activités de déclaration inférieure à la valeur maximale admise pour les positifs ont été considérées comme des interactions actives (+), tandis que celles supérieures à la « valeur ajoutée minimale pour les négatifs » étaient considérées comme inactives (-). Toute activité indiquée entre ces deux valeurs était considérée comme indéterminée (0)
type.
type.
Types de test et seuils d’activité utilisés pour la détermination des balises d’activité: Seuls les dosages à base de concentration ont été utilisés pour déterminer les étiquettes d’activité. Les activités de déclaration inférieure à la valeur maximale admise pour les positifs ont été considérées comme des interactions actives (+), tandis que celles supérieures à la « valeur ajoutée minimale pour les négatifs » étaient considérées comme inactives (-). Toute activité indiquée entre ces deux valeurs était considérée comme indéterminée (0)
type.
type.
Activité Tags Distribution et preuve Mélanges parmi les données: (a) Diagramme de Venn montrant la distribution des valeurs de bioactivité dans l’actif Les classes inactives et indéterminées dans TDR6 (voir le texte principal pour plus de détails).Les intersections comptent des cas où le même médicament a des résultats d’activité différents contre la même cible. Des exemples de ces cas sont fournis dans des panneaux B à F (ID du composé représente des identificateurs TDR6). (B) Activité de C329137 (une hydroxy-benzamidine) contre P. Falciparum Dihydrofolate Dihydrofolate-Thymidylate Synthase. (C) Exemple d’enregistrements positifs pour les inhibiteurs de l’acyltransférase humain. (D) Exemple d’activités négatives et neutres pour les composés triphénylcarbinol et benzohydrol, respectivement. Enfin, les preuves positives (e) et négatives (f) (F) peuvent être mélangées à des preuves indéterminées, comme indiqué pour C2164865 testé contre la cholinéestérase de chevaux et C306882 testé contre le recombinant P. Falciparum Deoxyuridine 5′-TripHosphate Nucléotidide Hydrolase, respectivement.
La libération de la chimiblée de la chimique comporte plus de 15,2 millions de bioactivités rapportées, dont environ 6 millions correspondaient à des relations impliquant des médicaments et des cibles de protéines (protéines monoparentales, familles protéinées et complexes de protéines, de protéines et de complexes protéiques, 93% étant des protéines individuelles). Les autres bioactivités restantes de la base de données ont été rapportées à une grande variété d’objectifs non protéiques, tels que les cellules entières (3,2 m), les organismes entiers (2,2 m), les tissus (83k) et les macromolécules non peptidiques (85k) ou petites molécules (< 100). Celles-ci n’ont pas été utilisées dans la construction de réseau, car le réseau est une protéine (c’est-à-dire cible) centrée. La figure 5 montre également quelques exemples de visualisations de réseau décrivant comment TDR6 affiche ces bioactivités.
Intégration des caractéristiques dérivées du réseau: Drogualisabilité et priorités
Comme mentionné ci-dessus, données génomiques, annotations géniques, Les composés chimiques et les interactions médicamenteurs générés ont été intégrés à un réseau complexe orienté vers une réutilisation de médicaments, comme décrit à Berenstein et al. (14). Le réseau a été utilisé pour calculer un score de dérogation au réseau (NDS), pour toutes les cibles de la priorité (niveau 1) des agents pathogènes. La NDS est liée aux chances de trouver des composés bioactifs à proximité du graphique réseau d’une cible donnée (plage est de 0 à 1). L’algorithme a déjà été décrit en détail (14), mais brièvement, sur la base d’un test de surprésentation des protéines droguées connues annotées, elle calcule une note de pertinence (RS) pour chaque domaine de domaine de domaine PFAM et de catégories de groupe d’orthologie du réseau. Le score NDS pour une cible donnée résulte d’une somme cumulative pondérée sur les RS de toutes les contributions d’affiliation communes au nœud cible et des protéines voisines liées à des composés actifs.
pour faciliter l’interprétation des scores NDS que nous avons effectué une Évaluation statistique Pour identifier les groupes de droguabilité distincts (DG) sur la base de deux types de seuils qui aident à classer les prévisions de la droguabilité dans les zones de confiance. Celles-ci sont illustrées à la figure 6. D’une part, tandis que toutes les cibles de notation non nulles ont une certaine connectivité à des objectifs connus-pharmactables, une LOW NDS suggère que ces connexions ne sont pas pertinentes pour l’évaluation de la toxicomanie. Par conséquent, une coupure de bruit (une base calculée à 5 fois la valeur de 0,25 centile de la distribution complète des NDS) est considérée comme identifiant de faibles cibles de notation. Le deuxième seuil est dérivé de l’indice maximum (60) de Youden (60), qui est calculé comme le score auquel la spécificité et la sensibilité sont optimales (meilleure sensibilité sans compromettre la spécificité, et inversement). Cette valeur ne peut être calculée que pour les agents pathogènes avec des véritables positifs (cibles droguées connues). Un minimum arbitraire de 10 vrais positifs a été considéré comme suffisant pour la détermination de la coupure de Youden. Pour les autres agents pathogènes dépourvus de telles informations, une extrusion de Youden globale a été utilisée (calculée à l’aide de tous les vrais positifs du réseau). Les groupes de pharmacibilité correspondants sont donc les suivants: DG1 pour des cibles avec des valeurs NDS allant de 0 au seuil de bruit; DG2 pour des cibles avec des valeurs NDS allant du seuil de bruit à la coupure de Youden; et les DGS 3, 4 et 5 avec des valeurs NDS 1-, 10- et 100 fois au-dessus de la coupure de Youden. En conséquence, ces derniers groupes font pour les cibles pharmactables les plus susceptibles. La figure 6 montre un exemple statique d’une priorisation axée sur le réseau pour les ulibérans mycobactéries (qui manque de cibles avec des composés connus dans la libération actuelle). Toutes les priorités des organismes prioritaires de TDR cible peuvent être visibles en ligne sur la page de résumé des données pour chaque espèce (voir https://tdrtargets.org / DataSummary, en cliquant sur l’espèce d’intérêt). Dans ce cas, les parcelles en ligne sont interactives et peuvent être zoomées et exportées. Dans les cas où il y a des objectifs avec des composés bioactifs connus pour l’espèce, ceux-ci sont montrés distinctement dans la parcelle.
axé sur le réseau Priorité cible du génome pour les Ucobacterium ulcérans: les objectifs candidats dans le génome de M. Ulcerans ont été classés par leur NDS (score de dérogation au réseau, voir le texte principal).L’intrigue décrit toutes les cibles de génome (dans l’axe X) avec leur score NDS correspondant (dans l’axe Y). Les points rouges correspondent aux cibles classées Top-10, avec des étiquettes indiquant le nom du gène et le produit. Parcourez la priorisation globale du génome du résumé des données, l’utilisateur peut accéder à une page de gène en cliquant dessus dans la parcelle de la priorisation. Un exemple sous-graphique de la famille des gènes EMBA / EDBB / EMBC est indiqué (comme indiqué dans leurs pages de gène correspondantes). La figure affiche également les zones de confiance, DG1 (rouge): délimitée par zéro et coupure de bruit; DG2 (jaune): entre le bruit et la coupure de Youden; et DG3-5: avec des scores supérieurs à la coupure de Youden.
Génome entièrement basé sur le réseau Priorité cible pour les Ulcerans Mycobacterium: les objectifs candidats dans le génome de M. Ulcerans ont été classés par leur NDS (score de dérogation au réseau, voir le texte principal). L’intrigue décrit toutes les cibles de génome (dans l’axe X) avec leur score NDS correspondant (dans l’axe Y). Les points rouges correspondent aux cibles classées Top-10, avec des étiquettes indiquant le nom du gène et le produit. Parcourez la priorisation globale du génome du résumé des données, l’utilisateur peut accéder à une page de gène en cliquant dessus dans la parcelle de la priorisation. Un exemple sous-graphique de la famille des gènes EMBA / EDBB / EMBC est indiqué (comme indiqué dans leurs pages de gène correspondantes). La figure affiche également les zones de confiance, DG1 (rouge): délimitée par zéro et coupure de bruit; DG2 (jaune): entre le bruit et la coupure de Youden; et DG3-5: avec des scores supérieurs à la cutologie de Youden.
Ces priorités axées sur le réseau peuvent fonctionner à la fois. Lors du partage d’un composé d’intérêt, l’algorithme peut donner la priorité aux objectifs, en utilisant la similitude pondérée des voisins chimiques aux cibles de candidats initiaux. Et lors de la cible d’intérêt, il peut hiérarchiser les composés, en utilisant des cibles de voisin pharmactable connectées, puis de suivre des liens pondérés vers des inhibiteurs / médicaments candidats. Les scores précumutés pour les composés et les cibles sont utilisés en interne par TDR6 et sont au cœur des transformations de requêtes basées sur réseau.
Visualisations de sous-graphique réseau et mise à niveau de l’interface utilisateur
Le sous-réseau -Grapations pour les composés et les cibles (et leurs scores NDS respectifs) peuvent être parcourues à partir de l’application Web à l’aide d’une drogue ou d’une cible comme point de départ pour obtenir des indices pour les médicaments non testés ou les nouveaux objectifs de pharmactables, respectivement. Grâce à des visualisations récemment développées, les utilisateurs peuvent consulter les quartiers de réseau autour de la drogue et des objectifs dans les pages correspondantes. Les listes d’interactions postées dérivées de réseau peuvent également être explorées au format tabulaire sous la « phargabilité » (pour les cibles cibles) et les sections « cubes connues et prévues » (pour les médicaments).
Ces visualisations sont conduites par d3.js (61) Mise en œuvre des dispositions forcées pour les visualisations de sous-graphiques. Dans le groupe Subgraph Subgraph, les utilisateurs peuvent effectuer des recherches de nœud dans le graphique (identificateurs cible) et basculer la visibilité des cibles sur une espèce par espèce et personnaliser l’opacité des nœuds. Pris ensemble Ces nouvelles fonctionnalités fournissent une visualisation claire et complète du sous-réseau provenant des cibles et des composés, permettant aux utilisateurs de manipuler les graphiques tout en explorant les données.
L’interface utilisateur (UI) et les outils disponibles. Pour la réutilisation de la drogue et la priorisation ciblée ont traversé une amélioration majeure. En premier lieu, l’interface utilisateur a été repensée sous des normes W3C pour atteindre une application plus saine et plus évolutive. Nous avons intégré le bootstrap (https://getbootstrap.com/) et jQuery (https://jquery.com) Cadres dans le développement et la conception de l’application Web TDR6 et dans le front. Fonctionnalité finale. Pour les requêtes de structure composées, nous disposons d’une licence et de la mise en œuvre de l’application de dessin chimique Marvin JS de Chemaxon (https://chemaxon.com/products/marvin-js). Les enregistrements tabulés dans la cible et les pages de pharmacie utilisent désormais le plug-in JavaScript JavaScript DataTable (https://datatables.net) pour créer facilement des paginations, filtrant et trier des fonctionnalités. Enfin, les représentations 2D composées sont désormais générées automatiquement à l’aide d’une implémentation du module JavaScript SmilesDrawer (62).
Disponibilité commerciale des composés
Un aspect important lors de la priorité aux composés pour les essais dans le laboratoire , est leur disponibilité. Dans TDR6, nous affichons maintenant des informations sur la disponibilité commerciale des composés. Nous avons actuellement démarré cette fonctionnalité en reliant MOLPOR (un marché chimique en ligne que des composés sources de fournisseurs majeurs) et montrent aux utilisateurs une indice visuelle sur des pages composées qui donnent une indication rapide de savoir si le composé est en stock ou peut être effectué sur commande. . Étant donné que la disponibilité commerciale des composés est actuellement mise en œuvre dans TDR6 sous la forme de requêtes asynchrones contre Molport, à ce moment-là, cette fonctionnalité n’est disponible que dans le mode de navigation (pas dans les requêtes).Cependant, les utilisateurs peuvent hiérarchiser les composés à l’aide des stratégies de requête disponibles dans TDR6, puis finalisent leurs sélections composées en inspectant les composés manuellement pour une disponibilité commerciale.
Discussion et directions futures
Les nouvelles données , Interface et fonctionnalité de TDR6 fournit aux utilisateurs une navigation et une visualisation améliorées des cibles et des composés.
Le modèle de réseau actuel relie des objectifs par l’affiliation d’entités (protéines) aux concepts d’annotation (domaines PFAM). Celles-ci ont été sélectionnées en fonction de leur grande couverture et de leur facilité de calcul relative. Complétant ces concepts avec d’autres critères importants pour la validation de la cible de médicaments (essentialité, expression dans les étapes de cycle de vie pertinentes) peuvent être effectuées par les utilisateurs ayant des outils et des fonctionnalités fournis par TDR6 mais à l’avenir, ils peuvent être intégrés au modèle de réseau sous-jacent lui-même, à Le moins que certains organismes soient nécessaires à l’évaluation expérimentale de génome.
Plusieurs améliorations clés sont nécessaires pour maintenir les objectifs de TDR pertinents pour la Communauté de scientifiques travaillant sur des maladies tropicales. Intégration des métabolites naturels et la connexion de ces petites molécules à d’autres composés bioactifs par le biais de sous-structures partagées ou d’une similitude chimique sera une mise au point majeure à l’avenir. Cela permettra également de naviguer sur le graphique des tarifs médicaments à l’aide des concepts de réactions biochimiques également, qui connectent naturellement des enzymes non orthologues à travers leurs substrats / produits et cofacteurs partagés.
Enfin, comme déjà mentionné précédemment (13), Il reste encore un écart de curation important qui doit être rempli. De nombreux composés bioactifs ont été testés par la Communauté de chercheurs travaillant dans des maladies tropicales négligées. Pourtant, beaucoup de ces analyses et résultats sont rapportés dans des revues en dehors des journaux de chimie médicinale traditionnels et sont donc manqués par des efforts de garantie importants tels que celui dirigé par Chembl (49). La commission et l’intégration de ces données manquantes (y compris les données négatives!) Devrait être une priorité pour la Communauté, car elle permettrait d’économiser du temps et des ressources précieux.
Données complémentaires
Les données supplémentaires sont disponibles. À Nar en ligne.
Remerciements
Les auteurs souhaitent remercier Matthew Berriman et Magdalena Zarowiecki (Wellcome Trust Sanger Institute) pour le partage des données de génome d’échinococcus pré-libérées et d’annotation pour l’inclusion en TDR Cibles; et Ben Webb et Andrej Sali (Université de Californie San Francisco) pour le calcul des modèles 3D pour les génomes pathogènes de niveau 1 dans les objectifs du TDR. L.u.l., a.b. et s.v. étaient ou sont soutenus par des bourses du Conseil national de la recherche (Conicet, Argentine). A.C. et F.A. Les membres de la carrière de recherche du Conseil national de la recherche (Conicet, Argentine) sont membres. P.m. Voudrais remercier une fraternité de la Commission des subventions universitaires (UGC), de l’Inde.
Financement
GlaxoSmithKline Argentine et l’Agence nationale pour la promotion de la science et de la technologie, de l’Argentine (ANPCYT); Projet de coopération bilatérale indo-Argentine (financement conjoint du Département des Indiens de la science et de la technologie (DST) et du ministère de la Science et de la Technologie argentin (Mincyt). Financement de frais d’accès ouvert: Fondo para la enquêtrice d’investigación Científica y Tecnológica.
Déclaration de conflit d’intérêts. Aucun déclaré déclaré.
Notes
Adresse actuelle: Ariel J Berenstein, Instituto Multidisciplino de Investigaciones en Patologías Pediátricas (IMIP), Conicet-GCBA, Laboratorio de biología moléculaire, División Patología, Hôpital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentine.
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
,
,
,
,
.
;
:
.
,
,
,
,
.
;
:
.
,
,
,
>,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
.
.
;
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
.
,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
,
.
.
;
:
–
.
,
,
,
,
,
,
.
.
;
:
.
,
.
.
;
.
,
,
,
.
;
:
–
.
,
,
,
,
,
,
>,
.
;
:
–
.
,
,
.
.
;
:
.
,
,
,
,
.
;
:
–
.
,
,
JR,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
,
JR
.
;
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
>,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
,
,
,
,
,
d. >,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
.
;
:
–
.
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
,
,
,
et al. .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
a.
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
.
.
;
:
.
.
.
;
:
–
.
,
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
.
.
;
:
.
,
,
,
.
;
:
–
.
,
,
,
.
.
;
:
–
.
.
.
;
:
.
,
.
.
;
:
–
.
.
.
;
:
–
.
,
,
.
;
:
–
.
,
.
;
:
–
.
), qui permet une réutilisation, une distribution et une reproduction non commerciales. Dans n’importe quel support, à condition que le travail original soit correctement cité. Pour une réutilisation commerciale, veuillez contacter les [email protected]