Resum
El volum de dades biològiques, químiques i funcionals dipositades en el domini públic Està creixent ràpidament, gràcies a la seqüenciació de pròxima generació i tecnologies de cribratge altament automatitzades. Aquests conjunts de dades representen recursos valuosos per a la descoberta de medicaments, especialment per a patògens de malalties menys estudiades. Per aprofitar aquests conjunts de dades, es requereix una integració de dades intel·ligent i intensiva per orientar inferències computacionals a diversos organismes. Els objectius TDR Els recursos químics integrien dades genòmiques de patògens humans i organismes model juntament amb la informació sobre compostos bioactius i les seves activitats anotades. Aquest informe posa de manifest les últimes actualitzacions de les dades i funcionalitats disponibles en els objectius de TDR 6. Basat en models de xarxa químics que proporcionen enllaços entre inhibidors i objectius, la base de dades incorpora ara les prioritzacions de destinacions impulsades per la xarxa, i les noves visualitzacions de subgraps de xarxa que mostren productes químics i objectiu – Barris d’imilitud juntament amb els enllaços associats de bioactivitat compostos compostos associats. Les dades disponibles es poden navegar i es poden consultar a través d’una nova interfície d’usuari, que permet als usuaris realitzar prioritzacions d’objectius de proteïnes i inhibidors químics. Com a tal, els objectius TDR ara faciliten la investigació de les drogues que repurposen els objectius de patògens, que poden ajudar a identificar objectius candidats per a compostos bioactius amb objectius prèviament desconeguts. Els objectius TDR estan disponibles a https://tdrtargets.org.
Introducció
Les malalties tropicals descuidades (NTD) afecten desproporcionadament ~1.500 milions de persones en ingressos baixos i desenvolupats Països, on són una causa líder per a anys de vida perduts a la discapacitat i la mort prematura (1). Històricament, la manca de participació de la indústria farmacèutica, en combinació amb una inversió limitada en programes de recerca en salut pública als països afectats, va suposar una deficiència de medicaments disponibles per controlar eficaçment la majoria d’aquestes malalties (2). A més, les drogues que es fan servir actualment per tractar aquestes malalties es veuen compromeses sovint en termes de costos, dificultats en l’administració, l’eficàcia, la resistència a les drogues o els perfils de seguretat.
Drogues Discovery és un procés que requereix el temps i costós (3 , 4). Per a NTD en particular, els programes de descobriment de drogues han de sobreviure al temps suficient a través de l’escassetat de finançament generalitzat per convertir-lo en assajos clínics posteriors (5). En aquest context, un enfocament estratègic per al descobriment de fàrmacs NTD és reposicionament de drogues (6), que pot ajudar a reduir els costos facilitant les aprovacions reguladores en proves primerenques per a medicaments que ja han experimentat investigacions clíniques per a altres malalties i / o indicacions i ha fallat per motius que la seguretat (6). A més, si l’abast de la republició de drogues s’amplia per incloure medicaments i compostos bioactius de la investigació sobre organismes no humans, també pot conduir a la identificació d’almenys noves eines químiques per sondejar la funció d’objectius i camins en patògens humans. Així, mitjançant l’aprofitament les grans quantitats de dades disponibles a partir de programes de recerca ben finançats sobre malalties humanes i organismes model, el paisatge de descobriment de drogues sobre NTD obté un impuls positiu (7).
Les estratègies computacionals són cada vegada més Essencial en descoberta de medicaments translacionals, tant a l’Acadèmia com a la indústria farmacèutica. La integració intel·ligent i intensiva dels volums creixents de dades generades durant totes les fases de Drogues Descobriment ja permet abordar els reptes clau del procés (8). Des de la seva introducció, la base de dades d’objectius TDR ha estat un recurs fiable per als investigadors de les malalties descuidades per accedir a les dades de química per a la priorització de l’objectiu de drogues i la repassar de drogues sobre malalties descuidades. Introduït el 2008 (9), aquest recurs d’accés obert va permetre als investigadors trobar objectius de proteïnes noves i inhibidors químics i prioritzar-los per ajudar el desenvolupament de medicaments per a patògens NTD. Els objectius TDR fan ús de conjunts de dades funcionals de tot el genoma públicament a tot el que permeten als usuaris trobar i prioritzar els objectius basats en els seus coneixements sobre la biologia del seu patogen d’interès i la naturalesa de la malaltia (10,11). Això s’implementa mitjançant una selecció de destinació flexible i basada en l’usuari (utilitzant criteris de filtratge) i el rànquing (utilitzant ponderació específica de criteris) (12,13).
Aquí descrivim les actualitzacions als conjunts de dades subjacents i Funcionalitat en el recurs d’orientacions TDR, acumulat des de la seva publicació anterior el 2012 (13). El nou llançament d’objectius TDR (V6.1, abreujat TDR6 en aquest document) integra informació genòmica específica de patogen amb dades funcionals (p. Ex.Expressió, relacions basades en ortologia, essencialitat) d’una selecció d’organismes, juntament amb les dades de compostos bioactius (estructura química, propietat i informació de la bioactivitat / objectiu); Tot això es pot consultar i navegar a través de l’aplicació web. Totes les consultes es poden desar a un estabitari personal per usuaris registrats i publicats a través de l’aplicació web per maximitzar les oportunitats de col·laboració. Les llistes prioritzades d’objectius es poden exportar per a una altra anàlisi fora de línia. Els detalls complets de totes les funcions noves es poden trobar a les notes de llançament (https://tdrtargets.org / llançaments). Aquest informe presenta un towthrough complet de l’aplicació web, les seves novetats, i exemples per il·lustrar casos d’ús.
Visió general i organització dels objectius TDR
Com en versions anteriors dels objectius TDR, TDR6 també s’organitza en dues seccions principals: objectius i compostos. La secció d’objectius de la base de dades conté dades de tot el genoma per a 20 patògens humans i permet als usuaris executar consultes i priorització d’objectius de proteïnes basats en diverses funcions i dades rellevants per a la descoberta de drogues (vegeu la taula 1). La secció de compostos de la base de dades conté informació sobre > 2 milions de compostos bioactius, i permet consultes basades en les propietats químiques dels compostos i les seves bioactivitats anotades (vegeu la taula 2).
Consultes d’orientació disponibles en objectius TDR
grup de consulta. | patògens per a les quals hi ha disponibles les dades. | tipus de dades disponibles per consultar. |
---|---|---|
noms & Anotacions | Tots | Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges) |
Característiques de la proteïna | Tots | mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI). |
Informació estructural | Tots | Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase |
expressió gènica | plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii | Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues. |
Informació filogenètica | Tots | Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats. |
essencialitat | C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei | inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model. |
Dades de validació objectiu | Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum | Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats) |
farmacèutica | Tot | Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal) |
assagament | tots | assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC) |
Referències bibliogràfiques | Tots | Objectius de filtre basats en publicacions disponibles |
grup de consulta. | patògens per a les quals hi ha disponibles les dades. | tipus de dades disponibles per consultar. |
---|---|---|
noms & Anotacions | Tots | Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges) |
Característiques de la proteïna | Tots | mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI). |
Informació estructural | Tots | Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase |
expressió gènica | plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii | Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues. |
Informació filogenètica | Tots | Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats. |
essencialitat | C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei | inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model. |
Dades de validació objectiu | Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum | Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats) |
farmacèutica | Tot | Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal) |
assagament | tots | assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC) |
Referències bibliogràfiques | Tots | Objectius de filtre basats en publicacions disponibles |
Consultes d’orientació disponibles en objectius TDR
grup de consulta. | patògens per a les quals hi ha disponibles les dades. | tipus de dades disponibles per consultar. |
---|---|---|
noms & Anotacions | Tots | Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges) |
Característiques de la proteïna | Tots | mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI). |
Informació estructural | Tots | Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase |
expressió gènica | plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii | Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues. |
Informació filogenètica | Tots | Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats. |
essencialitat | C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei | inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model. |
Dades de validació objectiu | Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum | Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats) |
farmacèutica | Tot | Precedent per a una modulació química reeixida de l’activitat o funció de destinació.Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal) |
assagament | tots | assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC) |
Referències bibliogràfiques | Tots | Objectius de filtre basats en publicacions disponibles |
grup de consulta. | patògens per a les quals hi ha disponibles les dades. | tipus de dades disponibles per consultar. |
---|---|---|
noms & Anotacions | Tots | Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges) |
Característiques de la proteïna | Tots | mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI). |
Informació estructural | Tots | Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase |
expressió gènica | plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii | Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues. |
Informació filogenètica | Tots | Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats. |
essencialitat | C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei | inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model. |
Dades de validació objectiu | Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum | Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats) |
farmacèutica | Tot | Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal) |
assagament | tots | assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC) |
Referències bibliogràfiques | Tots | Objectius de filtre basats en publicacions disponibles |
Consult disponibles consultes en objectius tdr
grup de consulta. | tipus de dades disponibles per consultar. |
---|---|
Cerques basades en text | |
Noms & anotacions | noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI |
Propietats químiques | pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski) | fórmula composta | Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N) |
bioactivitat | Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm) |
compostos orfes | cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments) |
compostos amb objectius | trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació |
Cerques basades en estructura | |
semblança composta | Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques | Substructura composta | Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment. |
Consulta grup. | tipus de dades disponibles per consultar. |
---|---|
Cerques basades en text | |
Noms & anotacions | noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI |
Propietats químiques | pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski) | fórmula composta | Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N) |
bioactivitat | Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm) |
compostos orfes | cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments) |
compostos amb objectius | trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació |
Cerques basades en estructura | |
semblança composta | Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques | Substructura composta | Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment. |
Consultes disponibles consultes en objectius tdr
grup de consulta. | tipus de dades disponibles per consultar. |
---|---|
Cerques basades en text | |
Noms & anotacions | noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI |
Propietats químiques | pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski) | fórmula composta | Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N) |
bioactivitat | Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm) |
compostos orfes | cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments) |
compostos amb objectius | trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació |
Cerques basades en estructura | |
semblança composta | Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques | Substructura composta | Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment. |
Consulta grup. | tipus de dades disponibles per consultar. |
---|---|
Cerques basades en text | |
Noms & anotacions | noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI |
Propietats químiques | pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski) | fórmula composta | Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N) |
bioactivitat | Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (p. Ex.IC50 < 5 μm) |
compostos orfes | Cerca de compostos que tenen informes de bioactivitat en l’organisme sencer o assaigs de cèl·lules senceres, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments) |
compostos amb objectius | Trobeu compostos que tinguin informació sobre la informació i el mecanisme d’orientació Assaigs |
Cerques basades en estructura | |
semblança composta | dibuix / pasta Estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques | Substructura composta | Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment. |
noves funcions a TDR Objectius 6
Hem informat recentment un model de xarxa integrador (14) on tots els conjunts de dades a escala de genoma disponibles en objectius TDR (objectius de proteïnes), informació química (compostos bioactius) i les seves relacions (bioactivitat dels compostos) Assaigs basats en l’objectiu) es van vincular en un gràfic multicapa. A TDR6, aquest model de xarxa s’ha actualitzat integrant nous conjunts de dades (descrits a continuació). Aquest model incorpora enllaços entre objectius i compostos bioactius derivats de la curació manual dels assajos de bioactivitat publicats (és a dir, enllaços directes entre objectius i compostos químics), així com de les relacions calculades (enllaços objectiu-blanc i enllaços compostos) basats en les anotacions de proteïnes (Dominis PFAM, grups d’ortòlegs) i similitud química. Un aspecte clau d’aquests enllaços en el model multicapa-xarxa és que permeten l’exploració i la visualització ràpida del barri al voltant dels objectius seleccionats i / o compostos bioactius. Això permet als usuaris explorar compostos vinculats a objectius, inspeccionar el barri de similitud química al voltant de compostos bioactius i visualitzar aquestes dades d’una manera amable i integral (vegeu la figura 1).
Model de xarxa esquemàtica a TDR6 i visualitzacions sub-gràfics: les pàgines compostes o objectiu ara mostren una visualització de subgrafs que conté objectes a la xarxa proximitat de l’entitat seleccionada. Aquests gràfics es construeixen a partir d’un gràfic de xarxa complex de tres capes. Es presenta un esquema d’aquest gràfic a la part superior. Tant els subgrafs de destinació com de compostos sempre es disposen de la manera següent: els nodes compostos (verds) estan connectats a objectius (taronja = patògens grisos = no patògens) a través de les vores de la bioactivitat. Aquests enllaços representen resultats positius (verds), neutres o negatius (gris) o negatius (vermells). Finalment, es dirigeix a un mapa d’afiliacions funcionals (anotacions, nodes blaus). En l’exemple, el gràfic mostra un conjunt d’inhibidors coneguts per a una aciltransferasa humana (15). Aquestes bioactivitats (totes positives) es dibuixen com a enllaços verds entre els compostos (nodes verds) i l’objectiu (nodes grisos per a no patògens, nodes de taronja per patògens). El gràfic ressalta les oportunitats de repugnament per a les aciltransferases de l’helmint (línies traçades, afegides manualment per a aquesta xifra), basades en anotacions compartides amb l’objectiu humà conegut farmacèutic. El node vermell de la capa de drogues indica el compost seleccionat. Les mides del node es determinen pel nombre de connexions a la xarxa (grau), mentre que les amplades d’enllaç de bioactivitat (vores) estan relacionades amb el nombre acumulatiu d’evidències experimentals per a un parell donat de drogues (nombre d’assaigs).
Model de xarxa esquemàtica en visualitzacions TDR6 i sub-gràfic: les pàgines compostes o objectiu ara mostren una visualització de subgrafs que conté objectes a la pàgina Xarxa proximitat de l’entitat seleccionada. Aquests gràfics es construeixen a partir d’un gràfic de xarxa complex de tres capes. Es presenta un esquema d’aquest gràfic a la part superior. Tant els subgrafs de destinació com de compostos sempre es disposen de la manera següent: els nodes compostos (verds) estan connectats a objectius (taronja = patògens grisos = no patògens) a través de les vores de la bioactivitat. Aquests enllaços representen resultats positius (verds), neutres o negatius (gris) o negatius (vermells). Finalment, es dirigeix a un mapa d’afiliacions funcionals (anotacions, nodes blaus). En l’exemple, el gràfic mostra un conjunt d’inhibidors coneguts per a una aciltransferasa humana (15). Aquestes bioactivitats (totes positives) es dibuixen com a enllaços verds entre els compostos (nodes verds) i l’objectiu (nodes grisos per a no patògens, nodes de taronja per patògens). El gràfic ressalta les oportunitats de repugnament per a les aciltransferases de l’helmint (línies traçades, afegides manualment per a aquesta xifra), basades en anotacions compartides amb l’objectiu humà conegut farmacèutic. El node vermell de la capa de drogues indica el compost seleccionat. Les mides del node es determinen pel nombre de connexions a la xarxa (grau), mentre que les amplades d’enllaç de bioactivitat (vores) estan relacionades amb el nombre acumulatiu d’evidències experimentals per a un parell donat de drogues (nombre d’assaigs).
Amb aquestes actualitzacions, TDR6 ara proporciona als usuaris les següents funcionalitats: (i) Dromen les prioritats de la xarxa, (ii) exploració de la república de drogues; i III) l’exploració dels objectius candidats per a compostos orfes. Aquests casos d’ús són possibles per diverses funcions basades en la xarxa precomputades, com ara una nova puntuació de farmàcia farmacèutica (NDS). En associar una mètrica quantitativa a objectius basats en l’enriquiment de compostos bioactius en nodes de xarxa estretament connectats, aquesta puntuació facilita la classificació dels objectius en grups farmacèutics (DGS), que estan disponibles per als usuaris en consultes de bases de dades.
El El model de xarxa és també la base per a les prioritzacions de la xarxa precomputades (NDPS) que es poden consultar pels usuaris i també s’utilitzen internament per TDR6 per seleccionar objectius i compostos connectats per mostrar a les visualitzacions de xarxa recentment desenvolupades (vegeu més avall). En partir d’un compost d’interès TDR6 utilitza les prioritzacions precunalles d’objectius candidats per ajudar els usuaris a la navegació de l’espai objectiu al voltant del compost (i viceversa en començar des d’un objectiu d’interès). Mitjançant la proporció d’aquestes mètriques i classificacions de l’enriquiment precomputat, la base de dades facilita ara el descobriment de noves associacions de destinacions farmacèutiques. A més d’aquests nous NDPs precompuats, els usuaris poden prioritzar els objectius utilitzant la mateixa funcionalitat que en els objectius TDR anteriors.
Aquesta versió també inclou diverses actualitzacions de dades, és a dir, la inclusió de 22 nous genomes (20 nous patògens i 2 nous) Organismes de models), i extenses actualitzacions de dades químiques i de bioactivitat entre d’altres. La interfície d’usuari millorada i versàtil, juntament amb les actualitzacions de dades renoven el compromís d’objectius TDR per proporcionar una eina integrada i poderosa per explorar dades genòmiques i químiques en el context de malalties tropicals descuidades.
utilitzant objectius tdr 6
Prioritzacions de destinacions senceres
El model de xarxa (14) és la base de la nova puntuació farmacèutica, que és una mètrica derivada de la xarxa relacionada amb l’enriquiment en compostos bioactius per a Objectiu donat (NDS, “Partitura de la farmàcia de la xarxa”). Els NDS estan disponibles per a tots els organismes de nivell 1, que es poden consultar i s’utilitzen per pesar les consultes per filtrar (in o out) els objectius de les canonades de priorització personalitzades per l’usuari. Com s’explica encara més en els detalls d’integració de la xarxa, per a cada organisme, es van classificar els objectius en cinc grups farmacèutics (DG), des de la més baixa (DG1) fins a la màxima puntuació (DG5), segons el seu rendiment a les prioritats de la xarxa.
Com en les versions anteriors dels objectius TDR, els usuaris poden combinar diferents conjunts de dades simplement executant consultes individuals en diferents tipus de dades i combinant-los a la pàgina de la història (9,10,12,13). Això és útil quan, per exemple, els usuaris volen incloure tipus de dades addicionals a prioritzacions basades en farmacèutiques, com ara els que confien en l’expressió gènica en les etapes de cicle de vida pertinents, o aquells que proporcionen informació sobre la condició física / letalitat dels objectius (essencialitat).
Com a exemple, presentem un exemple de priorització utilitzant Toxoplasma Gondii com a patogen d’interès. T. Gondii és un paràsit apicomplexan sovint utilitzat com a model per investigar la biologia subjacent a diverses malalties humanes i animals (15). L’estratègia de cerca es resumeix a la figura 2. La consulta es va iniciar buscant tots els objectius T. Gondii i filtrant aquests objectius amb homòlegs en humans (per seleccionar només objectius específics de paràsits). A continuació, vam seleccionar els gens essencials candidats basats en perfils de fitness durant la infecció de fibroblasts humans (16); i també els gens seleccionats altament expressats en taquyzoites (etapa replicativa de T. Gondii) Consultant per a gens en els 80-100 percentils d’abundància de RNaseq Transcript (17). Aquestes seleccions es van combinar amb les classificacions de la xarxa farmacèutica. Per això vam considerar gens en grups de droguerisme 3, 4 o 5 (DG ≥ 3) (vegeu la figura 2). La figura mostra totes les consultes i els seus resultats vistos a la pàgina d’historial, i les operacions realitzades en combinar consultes (unió, intersecció). La llista final d’objectius classificats basats en aquests criteris s’ha realitzat públicament i està disponible a la secció TDR Objectius de llistes publicades.
objectiu Estratègia d’exemple de priorització per a T. Gondii. La imatge composta mostra (a) els termes de consulta que s’utilitzen per trobar els objectius de T. Gondii que no tenen homòlegs en humans, que estan molt expressats a la fase tàcyzoita virulenta del paràsit durant la infecció per cèl·lules humanes, que probablement són essencials i són probablement farmacèutiques segons per netejar la puntuació de farmacèutica. (B) Resum de les consultes realitzades a la pàgina “Objectius”, que mostra com aquestes consultes apareixen a la pàgina “Història”, on es poden revisar i transformar. Els botons de gestió de consultes en línia permeten accions seleccionades (eliminar, canviar el nom, exportació) en els conjunts de resultats.(C) Les combinacions de consultes permeten als usuaris executar la unió, es creuen o resten accions en consultes amb i entre si. Es mostren exemples d’accions de la Unió i la Intersecció. (D) Les consultes es poden desar a un estabal privat (els meus conjunts de consultes) des d’on es poden enviar a l’espai de treball (per realitzar operacions de consulta addicionals) o compartides públicament amb altres usuaris d’objectius TDR (els meus conjunts de consulta de destinació publicada).
Estratègia d’exemple de priorització objectiu per a T. gondii. La imatge composta mostra (a) els termes de consulta que s’utilitzen per trobar els objectius de T. Gondii que no tenen homòlegs en humans, que estan molt expressats a la fase tàcyzoita virulenta del paràsit durant la infecció per cèl·lules humanes, que probablement són essencials i són probablement farmacèutiques segons per netejar la puntuació de farmacèutica. (B) Resum de les consultes realitzades a la pàgina “Objectius”, que mostra com aquestes consultes apareixen a la pàgina “Història”, on es poden revisar i transformar. Els botons de gestió de consultes en línia permeten accions seleccionades (eliminar, canviar el nom, exportació) en els conjunts de resultats. (C) Les combinacions de consultes permeten als usuaris executar la unió, es creuen o resten accions en consultes amb i entre si. Es mostren exemples d’accions de la Unió i la Intersecció. . / p>
estratègies de reputuració de medicaments mitjançant transformacions de consulta
La consulta farmacèutica a TDR6 permet als usuaris seleccionar objectius amb inhibidors / medicaments previstos o previstos. La informació sobre objectius amb fàrmacs coneguts provenen de la curació de literatura, mentre que les associacions preditades (indirectes) d’objectius amb inhibidors / medicaments s’obtenen a través de càlculs de similitud de seqüència o ortologia (a objectius farmacèutics coneguts), o mitjançant inferències compatibles amb la xarxa (14). Tots aquests mètodes s’implementen a TDR6. Per tant, quan els usuaris filtren un conjunt de gens basats en la farmacèutica, limiten la selecció a objectius altament classificats, que haurien de proporcionar una font rica de les oportunitats de republiment de drogues.
Per mostrar la utilitat de TDR6 en aquesta àrea, mostrem Com buscar medicaments candidats per a republicar per a Echinococcus multilocularis (l’agent causal de l’equinococcosi alveolar). Això es mostra a la figura 3. El procés és similar al que es descriu anteriorment per a T. Gondii, però en aquesta estratègia de consulta no vam descartar homòlegs humans, i han utilitzat els conjunts de dades de letalitat C. Elegans RNAi com a proxy per a la essencialitat de nematode. Com a resultat, vam obtenir una priorització sencera del genoma per a E. Multilocularis. A continuació, aplicant un filtre basat en farmacèutic a aquesta consulta, hem reduït la selecció gènica a un grapat de gens. L’usuari pot inspeccionar manualment els objectius seleccionats per esbrinar quins medicaments es van enumerar a través d’associacions indirectes. Les pàgines d’orientació mostraran tots els compostos associats a la secció de farmacèutica, classificats segons la font de la inferència. Per a inferències impulsades per xarxa, la puntuació per a cada compost proposat apareixerà tant com a llista com a parcel·la de rang, per identificar ràpidament els candidats prometedors. Alternativament, per minimitzar la inspecció manual, la llista de gens (és a dir, la mateixa consulta) es pot convertir fàcilment en una llista de medicaments associats fent clic a “Convertir aquests botons d’aquesta consulta” a la part superior de les pàgines de resultats de consulta. Aquesta funcionalitat proporciona una forma ràpida de començar a crear una biblioteca de projecció per a un conjunt d’objectius. Les transformacions de la consulta es poden basar en els medicaments curats (coneguts per a un establiment d’objectius), previstes (associacions computades a medicaments) o ambdues. En els tres enfocaments, els inhibidors / medicaments associats amb objectius coneguts farmacèutics estan associats de manera transitòria als gens de la llista. Figura 3 Resumeix l’estratègia de priorització, la conversió de consultes de la llista de gens als compostos, i un exemple de la visualització del sub-gràfic disponible a la pàgina composta d’un èxit de republicació. Actualment, aquestes conversions s’executen en el fons i els resultats apareixen a la secció Història del lloc web quan es fa (els usuaris també estan alerts per correu electrònic).
Repurposant de drogues per E. Multilocularis mitjançant transformacions de consultes. Un esquema de priorització d’orientació per a Echinococcus multiloculars que depenen de la inferència d’ortologia i de la drogositat prevista (DG ≥ 3). (A) consultes combinades; (B) Llista inicial d’objectius prioritzats. (C) Qualsevol llista d’orientació es pot “transformar” en una llista dels seus medicaments associats, utilitzant qualsevol dels mètodes d’enllaços de compostos disponibles (vegeu el text principal). (D) Llista resultant de compostos bioactius. (E) Exemple de visualització de sub-gràfics de xarxa d’un compost seleccionat, que mostra enllaços de bioactivitat actius i inactius. Els compostos (nodes verds) estan connectats a objectius patògens (taronja) segons els registres de bioactivitat (verd = actiu; vermell = inactiu, vegeu el text principal per a llindars d’activitat). Els objectius, al seu torn, estan connectats (enllaços grisos) a les afiliacions funcionals (nodes blaus). La representació del sub-gràfic proporciona consells visuals sobre com es connecta l’objectiu inicial de l’E. Multilocularis amb el compost seleccionat a la xarxa.
Exploració de compostos orfes
p> Les activitats de compostos extrets de la literatura per curació apareixen en forma d’assaigs basats en l’objectiu (enllaç directe a l’objectiu) o en forma d’assaigs basats en cèl·lules o organisme sencer. En absència d’una altra informació, aquestes últimes classes d’assaigs no proporcionen pistes sobre l’objectiu o el mecanisme d’acció dels compostos. Durant el procés d’actualitzacions de dades químiques a TDR6, vam identificar compostos amb efectes fenotípics reportats sobre l’organisme sencer o els assajos basats en cèl·lules, basades en les seves classificacions de Chembl. Aquesta informació es va utilitzar per identificar compostos “orfes” que estan actius contra un patogen particular en les projeccions primàries o secundàries basades en cel·les, però per a les quals no hi ha assaig basat en l’objectiu.
Compostos orfes a TDR6 poden ser Cercat per a qualsevol espècie amb dades de detecció fenotípica disponible, dins de la pàgina de cerca de compostos. Això permet una forma ràpida d’aprofitar les dades d’assaigs d’alt rendiment, permetent als usuaris iniciar les seves prioritzacions de compostos amb activitat coneguda contra un patogen d’interès.
El model de xarxa integrat a TDR6 també és útil per identificar el candidat Objectius per a compostos orfes. Com es descriu a la publicació original (14), el barri de similitud química calculada al voltant d’un compost orfe seleccionat pot proporcionar enllaços indirectes a un o més objectius. Mitjançant aquesta estratègia hem realitzat prioritzacions d’orientació per a tots els compostos orfes de TDR6. Aquestes prioritzacions de compostos impulsades per la xarxa precomputades estan disponibles per a tots els organismes per als quals hi ha disponibles dades de detecció de fenotípic. Resums globals que mostren tots els compostos orfes d’aquests organismes estan vinculats a la pàgina “Resum de dades” (vegeu https://tdrtargets.org / DataSummary, i feu clic a l’espècie d’interès). Un exemple de priorització basada en compostos orfes per a T. Cruzi es mostra a la figura 4. Mentre que les prioritzacions a partir d’un sol compost estan disponibles a cada pàgina composta.
Exploració d’objectius candidats per a compostos orfes de trypanosoma Cruzi. La trama resumeix la priorització d’orientació impulsada per la xarxa per a compostos orfes actius contra T. Cruzi. Totes les seqüències de codificació de proteïnes en el genoma de T. Cruzi (objectius candidats) estan disposats a l’eix X. Els punts de dades de la parcel·la corresponen a associacions de medicaments destinataris anotats per l’algorisme (puntuació traçat a l’eix Y). Com a exemple, vam destacar dos objectius posatius per a dos medicaments diferents (tal com es mostra a la pàgina Resum de dades T. Cruzi). Parcel·les similars estan disponibles en línia per a organismes de nivell 1 a TDR6 (enllaçat a partir de la pàgina Resum de dades).
Exploració d’objectius candidats per a compostos orfes de tripanosoma Cruzi. La trama resumeix la priorització d’orientació impulsada per la xarxa per a compostos orfes actius contra T. Cruzi. Totes les seqüències de codificació de proteïnes en el genoma de T. Cruzi (objectius candidats) estan disposats a l’eix X. Els punts de dades de la parcel·la corresponen a associacions de medicaments destinataris anotats per l’algorisme (puntuació traçat a l’eix Y). Com a exemple, vam destacar dos objectius posatius per a dos medicaments diferents (tal com es mostra a la pàgina Resum de dades T. Cruzi). Les parcel·les similars estan disponibles en línia per a organismes de nivell 1 a TDR6 (enllaçat des de la pàgina Resum de dades).
Actualitzacions de funcionalitats i dades
noves dades genòmiques a Objectius TDR v6.1
Des de la publicació anterior de la base de dades de dits TDR (13), s’han afegit diversos genomes de patogen. Es proporciona una llista detallada a la taula 3, així com en línia a la pàgina de resum de dades TDR6 (https://tdrtargets.org / DataSummary).
Resum de disponibilitat de dades per a patògens de nivell superior. Resum de les dades d’orientació disponibles per a organismes de nivell 1 en objectius TDR. CD: seqüències de codificació; PFAM: nombre de proteïnes amb domini pfam mapat; Aneu: Nombre de proteïnes amb termes d’ontologia de gens mapats; CE: nombre de proteïnes amb números de la Comissió d’Enzims mapats (CE); Camins: nombre de proteïnes mapes a mapes de camins de Kegg; Ortòlegs: nombre de seqüències mapades a grups d’ortòlegs orthomcl. Una taula de resum de dades més completa està disponible en línia a https://tdrtargets.org / DataSummary
espècies. | CDs. | pfam. | go. | ec. | cames. | orthologs. | |
---|---|---|---|---|---|---|---|
plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |
Plasmodium vivax | 5344 | 3264 | 2631 | 641 | 806 | 5207 | |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |
chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | |
mycobacterium leprae | 1630 | 1236 | 929 | 628 | 611 | 1473 | |
mycobacterium tuberculosi | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |
mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |
Trep Onema Pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |
wolbachia endosimbiont de b. malai | 805 | 628 | 577 | 308 | 382 | 688 | |
Brugia malayi | 11316 | 7042 | 6368 | 1278 | 1787 | 8424 | |
Echinococcus granulosus | 10249 | 6481 | 5432 | 854 | 1965 | 7109 | |
Echinococcus multilocularis | 10474 | 6817 | 5768 | 878 | 2079 | 7539 | |
loa loa (cuc d’ulls) | 16292 | 8071 | 6774 | 1539 | 2207 | 10484 | |
onchocerca volvulus | 12224 | 3248 | 2178 | 246 | 563 | 4054 | |
esquistosoma mansoni | 12692 | 7818 | 7384 | 1218 | 1649 | 10386 | |
leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |
Trypanosoma brucei | 10270 | 5665 | 5482 | 1019 | 1264 | 9259 | |
trypanosoma cruzi | 18639 | 9908 | 8572 | 1495 | 1735 | 18140 | |
Entamoeba histolytica | 8211 | 4920 | 4087 | 645 | 1094 | 7692 | |
giardia lambia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | |
trichomonas vaginalis | 95600 | 35474 | 18435 | 843 | 1366 | 87303 |
espècies. | cds. | pfam. | go. | ec. | cames. | orthologs. | |
---|---|---|---|---|---|---|---|
plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |
Plasmodium vivax | 5344 | 3264 | 2631 | 641 | 806 | 5207 | |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |
chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | |
mycobacterium leprae | 1630 | 1236 | 929 | 628 | 611 | 1473 | |
mycobacterium tuberculosi | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |
mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |
Trep Onema Pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |
wolbachia endosimbiont de B.malayi | 805 | 628 | 577 | 308 | 382 | 688 | |
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | ||
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | |||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | ||
Lloa Lloa (cuc ull)
16292 |
8071 | 6774 | 1539
2207 10484 |
||||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | ||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | ||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | ||
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | |
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87.303 |
Resum de dades de disponibilitat per als millors agents patògens de nivell. Resum de les dades de destinació disponibles per al Nivell 1 organismes en Targets TDX. CDs: seqüències de codificació; PFAM: nombre de proteïnes amb domini de PFAM assignada (s); GO: nombre de proteïnes amb termes de ontologia de gens assignades; CE: nombre de proteïnes amb els números de la Comissió d’Enzims (CE) assignades; Pathways: nombre de proteïnes correlacionats amb mapes KEGG via; Orthologs: nombre de seqüències assignades a grups OrthoMCL ortólogo. Una taula de dades resum més complet està disponible en línia a https://tdrtargets.org / datasummary
Espècies. | CD. | PFAM. | GO. | CE. | Camins. | Orthologs. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | |||||||||
5344 | 3264 | 2631 | 641 | 806 | 5207 | ||||||||||
Toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | |||||||||
Chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | |||||||||
Mycobacterium leprae
1630 |
1236 | 929 | 628 | 611 | 1473 | ||||||||||
Mycobacterium tuberculosi | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | |||||||||
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | |||||||||
Trep ONEMA pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | |||||||||
Wolbachia endosymbiont de B.Malai | 588 | 588 | 388 | ||||||||||||
Brugia Malai
11316 |
7042 | 6368 | 1278 | 1787 | 6481 | 6481 | 854 | 1965 | 7109 | ||||||
Echinococcus multilocularis
10474 |
6817 | 779 | 758 | ||||||||||||
Loa Loa (cuc d’ulls) | 1509 071 | 1559 071 | 1539 071 | 679 071 | 15371 | 1539 071 | 1539 071 | 1559 071 | 2207 | 10484 | 2378 | 2178 | 246 | 563 | 4054 |
esquistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||||||||||
leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | 5480 |
1019 | 1264 | 9259 | |||||
trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | giardia lambia | 2263 | 2263 | 2735 272 |
3635 |
2235 |
514 |
5977 |
|
|
trichomonas vaginalis
95600 35474 |
18435 | 843 | CDs. | pfam. | go. | ec. | patins. | ortoogs. | lasmoodium | 3322 551 | 7166 | plasmox vivax | 641 | 606 06 06 06 06 5207 | |
toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 |
598 | 269 | tepne | mycobacterium | 1630 | 1236 p2 |
673 | |||
mycobaacterium tdulesis pàgina | 1174 | 1174 | 1174 | 1174 | 3287 | 873 | 1002 | 3459 | |||||||
Trep Onema Pallven |
61 33 33 33 33 33 33 | 633 | |||||||||||||
WOLBIA INDUSSIABIANT DE Bmalayi | 805 | 628 | 577 | 308 | 382 | 688 | |||||||||
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | ||||||||||
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | |||||||||||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | ||||||||||
Lloa Lloa (cuc ull)
16292 |
8071 | 6774 | 1539
2207 10484 |
||||||||||||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | ||||||||||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
|||||||||||
Leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | |||||||||
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | ||||||||||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
|||||||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | ||||||||||
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | |||||||||
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87.303 |
Atesa la diversitat d’organismes integrat en objectius TDX i, en conseqüència, la varietat de fonts de dades necessària per a cobrir tota la genomes; esforç substancial s’ha posat en l’estandardització de les dades d’anàlisi i recuperació d’informació a partir de l’genoma d’aquests organismes. La majoria dels genomes complets EupathDB es van obtenir a partir de (18), GenBank (19), GeneDB (20), Wormbase paràsit (21), GenoList (22) o Mycobrowser (23). Una descripció completa de les fonts de l’genoma i donat en anterior quadre complementari S1. Per actualitzar les dades dels organismes presents en la versió anterior dels objectius de TDX de codificació de proteïnes dels gens de la versió actual dels genomes o bé s’assignen als gens existents a TDX Targets, o en cas contrari entrar els nous registres. El mapatge algoritme utilitza una combinació de condicions per a realitzar un seguiment identificadors de gens a través de publicacions i mantenir la identitat de gens: les sumes de comprovació de seqüència coincident (mitjançant valors de 128 bits Hash generats pel MD5 algoritme), Gene noms o identificadors i BLAST (24) IF o coincidències perfectes es troben. Després d’actualitzar els registres, el Pipeline calcula les propietats fisicoquímiques utilitzant Pepstats (25), exploracions per a dominis transmembrana amb TMHMM (26), pèptids de senyal amb SignalP (27), i glicosilfosfatidilinositol Els punts d’ancoratge, utilitzant PredGPI (28). L’algoritme rebutja totes les seqüències no codificants, el més aviat qualsevol pseudogens, per tal de no confondre les anotacions i minimitzar les falses suposicions durant els fluxos de treball de priorització. La major part de TDR6, esmentat anteriorment totes les tasques per a la integració i actualització genoma s’han embolicat en el flux de treball automatitzat per facilitar el ràpid actualitzacions en futures versions. Un esquema de l’actualització i Pipeline algoritme mostrat en l’anterior Figura complementari S1. L’oleoducte també automatitza el càlcul d’anotacions usant estratègies individuals ad hoc per a diferents anotacions, confiant en els serveis web i APIs (aparegut en el Kaas (29) Servei de proteïnes de mapatge a vies metabòliques i a el gran nombre de classificació CE, d’enzims, o el OrthoMCL base de dades i eina (30,31) per als grups de mapeig ortholog a les proteïnes. el Pipeline també es basa en el càlcul contra bases de dades instal·lades localment van aparèixer més iNTERPRO (32), utilitzant InterProScan (33) per identificar dominis de proteïnes (PFAM) i el mapa de termes als vocabularis controlats i les classificacions (GO). els recursos addicionals van aparèixer més 3D estructures i models estructurals van ser recuperats de la Protein Data Bank (34) usant serveis web i descarregar-se de el lloc MODBASE FTP (35), respectivament.
també el nombre de conjunts de dades funcionals clau es van integrar en aquesta versió, incloent (i) els conjunts de dades transcriptomic que proporcionen proves de l’expressió gènica en etapes de el cicle de vida o condicions experimentals que són rellevant per descobriment de fàrmacs (36-47) i (ii) essencialitat conjunts de dades deriven de dues patògens Apicomplexan (P. berghei i T. gondii) (16,48), que proporcionen informació a Estratègies vitals ASSIST priorització.
Actualitzacions de les dades químiques
Per als compostos bioactius també, els fluxos de treball d’actualització de dades s’han automatitzat per a aquesta versió.La majoria dels compostos bioactius es van recuperar de Chembl 24th Allow (49), que conté alguns conjunts de dades addicionals, com ara les de caixes químiques específiques de patogen: caixes GSK Kinetoplastid (50), caixa de patogen MMV (51). El procés d’integració comença a partir de les descripcions de molècules (2D) en format SDF, des del qual calculem totes les empremtes dactilars compostes necessàries (necessàries per a cerques de similitud de compostos / subestructures) mitjançant Checkmol (52). El gasoducte també calcula propietats químiques addicionals, com ara el coeficient de partició d’octanol / aigua de logple i altres descriptors estructurals que utilitzen XLOGP3 (53) i les eines Open Babel Obprop i Obrotamer (54). Es van obtenir o calcular altres dades rellevants directament des de l’estructura composta, com ara els identificadors INCHI i INCHIKEY (55) per al seguiment de compostos; i altres regles normals de polze utilitzades en la química medicinals i la descoberta de drogues, com la regla de Lipinski de cinc (56) i la regla relacionada de tres (57).
Després d’integració en objectius TDR, tots els compostos eren subjectes a tots els vs Càlcul de comparació de similituds químics mitjançant Chemfp (58) que produeix mesures de similitud de parell basades en l’índex / distància de Tanimoto (59). A més, hem calculat un mapa global (tots versus tots) de les relacions de subestructures entre compostos a la base de dades (X és una subestructura de Y; Y és una superestructura de X). Sabent que el problema de trobar els subgrafs més comuns entre molècules és computacionalment dur, vam aplicar un enfocament heurístic per trobar subestructures. L’algorisme primer obté un subconjunt de possibles molècules candidatures fent ús de les empremtes digitals calculades anteriorment. Els candidats han d’haver coincidint amb les empremtes dactilars amb la molècula de l’assignatura. Una vegada que s’obté una llista de candidats, la determinació de subestructures d’àtoms plena-by-àtom es fa mitjançant matchmol (52). Les dades disponibles per a compostos i les consultes que es poden executar en cada tipus de dades es resumeixen a la taula 2. El pes molecular (MW) i la distribució de superfície polar (PSA) per a tots els compostos de la base de dades es mostra a la figura complementària S2.
Curació i integració de dades de bioactivitat
Com amb compostos químics, la majoria de bioactivitats integrades en objectius TDR provenen directament de les fonts de dades ascendents (per exemple, Chembl). En integrar les dades de la bioactivitat, es va conservar tant l’anotació de l’assaig (per exemple, ‘assaig de reducció de la motilitat in vitro contra Brugia Malayi microfilariae a 10 μm’) i el valor numèric i unitats associades a activitats compostes (per exemple, ‘80% inhibició ‘,’ 1,5 μM IC50 ‘, ’10 Nm Mic’), que són tots els camps de cerca. A més, i per facilitar les consultes d’usuaris, les bioactivitats reportades es van utilitzar per agrupar els compostos assajos a les classes “actives” o “inactives”. No obstant això, per minimitzar l’efecte d’utilitzar fronteres dures al voltant dels llindars arbitraris i augmentar la separació entre classificacions actives / inactives, també definim una zona grisa indeterminada. Per tant, els compostos que anoten just per sota d’un llindar arbitrari no es consideren inactius per a la consulta i la visualització.
No tots els tipus d’activitat van ser susceptibles a la classificació, però. Malgrat els esforços en la normalització d’aquestes dades d’activitat, la interpretació de les activitats de compostos a aquesta escala és difícil, ja que sovint depenen del tipus d’assaig particular, les unitats reportades, i les condicions particulars en què es va dur a terme cada assaig. No obstant això, un conjunt significatiu de tipus d’assaig es podria classificar automàticament en categories actives / indeterminades / inactives basades en llindars d’activitat. Per a això, tots els tipus d’assaig amb > 100.000 informes (vegeu la figura complementària S3 per a una activitat per tipus d’assaig / per parcel·la de distribució composta) es van considerar per a l’auditoria d’activitat, encara que només es troben assajos de concentració basats (com ara IC50, KI o la potència) es van trobar prou robustes per a aquesta determinació, ja que els assajos basats en percentatge (com ara% activitat,% de l’activitat residual o la inhibició $) eren ambigus en informes de bioactivitat. Els llindars que s’utilitzen per classificar les activitats de cada tipus d’assaig es poden trobar a la taula 4, i la distribució de compostos en aquestes classes d’activitat es resumeix a la figura 5.
Tipus d’assaig i llindars d’activitat utilitzats per a la determinació de l’etiqueta d’activitat: només es van utilitzar assaigs basats en la concentració per determinar les etiquetes d’activitat. Es van considerar que les activitats que es presenten menys del valor admesos màxim per als positius (+) es consideraven interaccions actives (+), mentre que les més grans que el “valor mínim admès per a negatius” es consideraven inactius (-). Qualsevol activitat que es va informar entre aquests dos valors es va considerar com a indeterminat (0)
tipus d’assaig. | unitat estàndard. | Valor màxim admès per a actius. | un valor mínim admès per inactives. |
---|---|---|---|
AC50 | nm | 20000 | 100000 |
ec50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potència | nm | 20000 | 100000 |
assaig tipus. |
unitat estàndard. | Valor màxim admès per a actius. | un valor mínim admès per inactives. |
---|---|---|---|
AC50 | nm | 20000 | 100000 |
ec50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potència | nm | 20000 | 100000 |
Tipus d’assaig i llindars d’activitat utilitzats per a la determinació de l’etiqueta d’activitat: només es van utilitzar assaigs basats en la concentració per determinar les etiquetes d’activitat. Es van considerar que les activitats que es presenten menys del valor admesos màxim per als positius (+) es consideraven interaccions actives (+), mentre que les més grans que el “valor mínim admès per a negatius” es consideraven inactius (-). Qualsevol activitat que es va informar entre aquests dos valors es va considerar com a indeterminat (0)
tipus d’assaig. | unitat estàndard. | Valor màxim admès per a actius. | un valor mínim admès per inactives. |
---|---|---|---|
AC50 | nm | 20000 | 100000 |
ec50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potència | nm | 20000 | 100000 |
assaig tipus. |
unitat estàndard. | Valor màxim admès per a actius. | un valor mínim admès per inactives. |
---|---|---|---|
AC50 | nm | 20000 | 100000 |
ec50 | nm | 20000 | 100000 |
ic50 | nm | 20000 | 100000 |
ic50 | ug ml-1 | 15 | 50 |
kd | nm | 20000 | 100000 |
ki | nm | 20000 | 100000 |
potència | nm | 20000 | 100000 |
Etiquetes d’activitat Distribució i proves Mescles entre les dades: (a) Diagrama de Venn que mostra la distribució de valors de bioactivitat en les classes actives, inactives i indeterminades a TDR6 (vegeu el text principal per obtenir més informació) . Les interseccions compten casos en què el mateix medicament té diferents resultats d’activitat contra el mateix objectiu. Exemples d’aquests casos es proporcionen als panells B a través de F (IDs compostos representen els identificadors TDR6). (B) Activitat de C329137 (una hidroxi-benzamidina) contra P. falciparum bifuncional dihidrofolat reductasa-thymidylate sinthasa. (C) Exemple de registres positius per a inhibidors d’aciltransferasa humana. (D) Exemple d’activitats negatives i neutres per a compostos triphenylelarbinol i benzohidrol, respectivament. Finalment, les proves positives (E) i negatives (F) es poden barrejar amb proves indeterminades, com es mostra per a C2164865 provat contra el cavall Cholinesterasa i C306882 Provat contra P. Recombinant Falciparum deoxiurididina 5′-trifosfat hidrolasa de nucleòtids, respectivament.
Etiquetes d’activitat Distribució i proves Mescles entre dades: (a) Venn diagrama que mostra la distribució de valors de bioactivitat en l’actiu , classes inactives i indeterminades a TDR6 (vegeu el text principal per obtenir més informació).Les interseccions compten casos en què el mateix medicament té diferents resultats d’activitat contra el mateix objectiu. Exemples d’aquests casos es proporcionen als panells B a través de F (IDs compostos representen els identificadors TDR6). (B) Activitat de C329137 (una hidroxi-benzamidina) contra P. falciparum bifuncional dihidrofolat reductasa-thymidylate sinthasa. (C) Exemple de registres positius per a inhibidors d’aciltransferasa humana. (D) Exemple d’activitats negatives i neutres per a compostos triphenylelarbinol i benzohidrol, respectivament. Finalment, les proves positives (E) i negatives (F) es poden barrejar amb proves indeterminades, com es mostra per a C2164865 provat contra el cavall Cholinesterasa i C306882 Provat contra P. Recombinant Falciparum deoxiurididina 5′-trifosfat hidrolasa de nucleòtids, respectivament.
El tret de l’alliberament de Chembl 24 compta amb més de 15,2 milions de bioactivitats reportades, de les quals només uns 6 milions corresponen a relacions que impliquen medicaments i objectius de proteïnes (ja sigui proteïnes úniques, famílies de proteïnes i complexos de proteïnes, amb ~ 93% sent proteïnes individuals). Altres bioactivitats restants de la base de dades eren informes per a una gran varietat d’objectius no proteïnes, com ara les cèl·lules senceres (3,6 m), els organismes sencers (2,2 m), els teixits (83k) i les macromolècules no pèptídiques (85K) o Molècules petites (< 100). Aquests no s’utilitzaven en la construcció de xarxes, ja que la xarxa és de proteïna (I.E. objectiu) Centric. La figura 5 també mostra una mica de visualitzacions de xarxa que representen com TDR6 mostra aquestes bioactivitats.
Integració de característiques derivades de la xarxa: farmacèutica i prioritzacions
Com es va esmentar anteriorment, les dades genòmiques, les anotacions genòmiques, Els compostos químics i les interaccions de medicaments generals es van integrar en una xarxa complexa orientada a republir les drogues, tal com es descriu a Berenstein et al. (14). La xarxa es va utilitzar per calcular una partitura de farmàcia de xarxa (NDS), per a tots els objectius en patògens prioritaris (Tier 1). El NDS està relacionat amb la possibilitat de trobar compostos bioactius a la proximitat del gràfic de xarxa d’un objectiu donat (el rang és de 0 a 1). L’algorisme ha estat descrit anteriorment en detall (14), però breument, basat en una prova de sobre-representació de les proteïnes farmacèutiques conegudes anotades, calcula una puntuació de rellevància (RS) per a cada grup de domini PFAM i categories del grup ortològic de la xarxa. La puntuació NDS per a un objectiu donat resultats d’una suma acumulada ponderada sobre els RS de totes les contribucions d’afiliació comunes al node de destinació, i proteïnes veïnes vinculades a compostos actius.
Per facilitar la interpretació de les puntuacions NDS Hem realitzat un Avaluació estadística per identificar diferents grups farmacèutics (DG) basats en dos tipus de llindars que ajuden a classificar les prediccions farmacèutiques en zones de confiança. Aquests s’il·lustren a la figura 6. D’una banda, mentre que tots els objectius de puntuació no zero tenen algun grau de connectivitat a objectius coneguts farmacèutics, un ND baix suggereix que aquestes connexions no són rellevants per a l’avaluació farmacèutica. Per tant, es considera que es considera un tall de soroll (una línia de base calculada com 5 vegades el valor de 0,25 percentil a partir de la distribució completa de NDS) identificar objectius de baixa puntuació. El segon llindar es deriva de l’índex màxim de Younden (60), que es calcula com a puntuació en què tant l’especificitat com la sensibilitat són òptimes (la millor sensibilitat sense comprometre l’especificitat i viceversa). Aquest valor només es pot calcular per patògens amb veritables positius (objectius coneguts farmacèutics). Un mínim arbitrari de 10 veritables positius es va considerar suficient per a la determinació de tall. Per a altres patògens que no tinguessin aquesta informació, es va utilitzar un tall global que es va utilitzar (calculat utilitzant tots els veritables positius a la xarxa). Els grups farmacèutics corresponents són, per tant, DG1 per a objectius amb valors NDS que van des de 0 fins al llindar de soroll; DG2 per a objectius amb valors NDS que van des del llindar de soroll fins al tall de Youden; i DGS 3, 4 i 5 amb valors NDS que són de 1-, de 10 i 100 vegades per sobre de la retallada de Youden. En conseqüència, aquests últims grups fan dels objectius més afectats farmacèutics. La figura 6 mostra un exemple estàtic d’una priorització impulsada per la xarxa per a Mycobacterium Ulcerans (que no té objectius amb compostos coneguts en el llançament actual). Totes les prioritzacions dels orientacions TDR Organismes de prioritat es poden veure en línia a la pàgina Resum de dades per a cada espècie (vegeu https://tdrtargets.org / DataSummary, fent clic a les espècies d’interès). En aquest cas, les parcel·les en línia són interactives i es poden ampliar i exportar. En els casos en què hi ha objectius amb compostos bioactius coneguts per a l’espècie, es mostren distintivament a la trama.
sencer impulsat per la xarxa Priorització de l’objectiu del genoma per a Mycobacterium Ulcerans: els objectius candidats al genoma de M. Ulccesans van ser classificats pel seu NDS (Parcurs de la farmàcia de la xarxa, vegeu el text principal).La trama mostra tots els objectius del genoma (en l’eix X) juntament amb la seva puntuació NDS corresponent (a l’eix Y). Els punts vermells corresponen als objectius de primer nivell superior, amb etiquetes que indiquen el nom i el producte del gen. Visualització de la priorització sencera del genoma des del resum de dades, l’usuari pot accedir a una pàgina de gens fent clic sobre ell en la trama de priorització. Es mostra un exemple de subgraf de la família Emba / Embc Gene (tal com es veu en les seves pàgines de gens corresponents). La figura també mostra zones de confiança, DG1 (vermell): delimitat per un tall zero i de soroll; DG2 (groc): entre el soroll i el tall de tuden; i DG3-5: amb les puntuacions més altes que el tall de tuden.
Genoma sencer conduït a la xarxa Priorització d’orientació per a Mycobacterium Ulcerans: els objectius candidats al genoma M. Ulcercans van ser classificats pel seu NDS (Parcurs de la farmàcia de la xarxa, vegeu el text principal). La trama mostra tots els objectius del genoma (en l’eix X) juntament amb la seva puntuació NDS corresponent (a l’eix Y). Els punts vermells corresponen als objectius de primer nivell superior, amb etiquetes que indiquen el nom i el producte del gen. Visualització de la priorització sencera del genoma des del resum de dades, l’usuari pot accedir a una pàgina de gens fent clic sobre ell en la trama de priorització. Es mostra un exemple de subgraf de la família Emba / Embc Gene (tal com es veu en les seves pàgines de gens corresponents). La figura també mostra zones de confiança, DG1 (vermell): delimitat per un tall zero i de soroll; DG2 (groc): entre el soroll i el tall de tuden; i DG3-5: amb puntuacions més altes que el tall de tuden.
Aquestes prioritats impulsades per la xarxa poden treballar ambdós sentits. En partir d’un compost d’interès, l’algorisme pot prioritzar els objectius, utilitzant la similitud ponderada dels veïns químics a objectius inicials candidats. I quan a partir de l’objectiu d’interès, pot prioritzar els compostos, utilitzant objectius de veïns connectats i després seguint enllaços ponderats a inhibidors / medicaments candidats. Les puntuacions precomputades per a compostos i per a objectius s’utilitzen internament per TDR6 i es troben al nucli de transformacions de consultes basades en xarxa.
Xarxa de visualitzacions de sub-gràfics i actualització d’interfície d’usuari
La xarxa sub -Graphs per a tots dos compostos i objectius (i les seves respectives puntuacions NDS) es poden navegar des de l’aplicació web mitjançant un medicament o un objectiu com a punt de partida per obtenir consells per a drogues no provades o objectius nous farmacèutics, respectivament. A través de visualitzacions recentment desenvolupades, els usuaris poden consultar els barris de xarxa al voltant de drogues i objectius a les pàgines corresponents. Les llistes d’interaccions posatives derivades de la xarxa també es poden explorar en format tabular sota la “farmacèutica” (per a objectius) i les seccions “conegudes i previstes” (per a medicaments).
Aquestes visualitzacions són impulsades per d3.js (61) Implementació de dissenys forçosos per a visualitzacions sub-gràfiques. Dins del tauler de subgrap de D3, els usuaris poden realitzar cerques de node dins del gràfic (identificadors d’orientació), així com canviar la visibilitat dels objectius en una espècie de manera d’espècies, i personalitzar l’opacitat dels nodes. En conjunt, aquestes noves funcions proporcionen una visualització clara i completa de la competència sub-xarxa d’objectius i compostos, que permet als usuaris manipular els gràfics durant l’exploració de les dades.
La interfície d’usuari (UI) i les eines disponibles Per a la republició de drogues i la priorització d’orientació ha passat per una actualització important. En primer lloc, la IU ha estat redissenyada sota els estàndards W3C per aconseguir una aplicació més sana i escalable. Hem integrat el bootStrap (https://getbootstrap.com/) i jQuery (https://jquery.com) marcs en el desenvolupament i disseny de l’aplicació web TDR6 i al front- Funcionalitat final. Per a consultes d’estructura composta que hem llicenciat i implementat l’aplicació de dibuix química de Marvin JS de Chaxon (https://chemaxon.com/products/marvin-js). Els registres tabulats dins de les pàgines d’orientació i drogues ara utilitzen el connector Jupascript javascript javascript (https://datatables.net) per crear fàcilment paginacions, filtratge i funcionalitats de classificació. Finalment, les representacions de compost 2D ara es generen automàticament mitjançant una implementació del mòdul JavaScript de SmilesDrawer (62).
Disponibilitat comercial de compostos
Un aspecte important en prioritzar compostos per provar al laboratori , és la seva disponibilitat. A TDR6 ara mostrem informació sobre la disponibilitat comercial de compostos. Actualment hem començat aquesta funció enllaçar amb Molport (un mercat en línia químic que fonts de compostos dels principals proveïdors) i mostrar als usuaris una pista visual a les pàgines compostes que donen una indicació ràpida de si el compost està en estoc o es pot fer a la comanda . Com que la disponibilitat comercial de compostos està actualment implementada a TDR6 en forma de consultes asíncrones contra la MOLPORT, en aquest moment aquesta característica només està disponible en mode de navegació (no en consultes).Tanmateix, els usuaris poden prioritzar els compostos utilitzant qualsevol de les estratègies de consulta disponibles a TDR6 i després finalitzar les seleccions compostes mitjançant la inspecció de compostos manualment per a la disponibilitat comercial.
Discussió i instruccions futures
Les noves dades , la interfície i la funcionalitat de TDR6 proporciona als usuaris la millora de la navegació i la visualització d’objectius i compostos.
El model de xarxa actual connecta els objectius mitjançant l’afiliació de les entitats (proteïnes) als conceptes d’anotació (dominis PFAM, grups d’ortòlegs). Aquests s’han seleccionat en funció de la seva àmplia cobertura i facilitat de càlcul. Complementant aquests conceptes amb altres criteris importants per a la validació de l’objectiu de drogues (essencialitat, expressió en etapes de cicle de vida rellevants) es poden fer pels usuaris amb les eines i funcionalitats proporcionades per TDR6, però en el futur es poden construir al model de xarxa subjacent, a Menys per a alguns organismes susceptibles a l’avaluació experimental de tot el genoma.
Es necessiten diverses millores clau per mantenir els objectius tdr pertinents per a la comunitat de científics que treballen en malalties tropicals. La integració de metabòlits naturals i la connexió d’aquestes petites molècules a altres compostos bioactius a través de subestructures compartides o per similitud química serà un enfocament important en el futur. Això permetrà navegar pel gràfic d’objectius de drogues mitjançant els conceptes de reaccions bioquímiques, que també connecten naturalment enzims no ortòlegs a través dels seus substrats / productes compartits i els cofactors.
Finalment, com ja es va esmentar abans (13), Encara hi ha una gran bretxa de curació que cal omplir. Molts compostos bioactius han estat provats per la comunitat d’investigadors que treballen en malalties tropicals descuidades. No obstant això, molts d’aquests assajos i resultats es reporten a les revistes fora de les revistes principals de la química medicinals i, per tant, es perden per grans esforços de curació com el liderat per Chembl (49). La curació i la integració d’aquestes dades que falten (incloses les dades negatives!) Haurien de ser una prioritat per a la comunitat, ja que estalviaria temps i recursos valuosos.
Dades complementàries
Les dades complementàries estan disponibles a Nar Online.
Agraïments
Els autors volen donar les gràcies a Matthew Berriman i Magdalena Zarowiecki (Wellcome Trust Sanger Institute) per compartir l’alliberament de la publicació de Echinococcus de dades i anotació per a la inclusió a TDR Objectius; i Ben Webb i Andrej Sali (Universitat de Califòrnia San Francisco) per al càlcul de models 3D per a genomes de patògens de nivell 1 en objectius TDR. L.U.L., A.B. i s.v. eren o estan recolzats per beques del Consell Nacional de Recerca (Conici, Argentina). A.C. i F.a. són membres de la Carrera de Recerca del Consell Nacional de Recerca (Conici, Argentina). P.m. Voldria reconèixer una beca de la Comissió de Beques Universitàries (UGC), Índia.
Finançament
Glaxosmithkline Argentina i l’Agència Nacional per a la Promoció de la Ciència i la Tecnologia, Argentina (ANPCYT); Projecte de cooperació bilateral indo-argentina (finançament conjunt del Departament de Ciència i Tecnologia de l’Índia (DST) i el Ministeri de Ciència i Tecnologia Argentina (MINCYT). Finançament per a l’accés obert: Fondo para la Investigación Científica i Tecnològica.
Conflicte de declaració d’interès. Cap declara.
notes
Adreça actual: Ariel J Berenstein, Institut Multidisciplinari d’Investigacions en Patologies Pediátricas (IMIPP), Conici-GCBA, Laboratori de Biologia Molecular, Divisió Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.
,
,
,
div> j.
,
,
,
.
;
:
–
.
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
,
,
,
;
:
.
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
.
.
;
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
.
,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
.
;
:
–
.
,
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
,
.
.
;
:
–
.
,
,
,
,
,
,
.
.
;
:
.
,
.
.
;
.
,
,
,
.
;
:
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
.
.
;
:
.
,
,
,
,
.
;
:
–
.
,
,
jr,
.
;
:
–
.
,
,
,
,
,
,
,
,
jr
.
;
.
,
,
,
,
,
,
,
,
div> Mi
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
.
;
:
–
.
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
,
,
,
,
et al. .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al. .
.
;
:
.
,
,
,
,
,
.
.
;
:
.
.
.
;
:
–
.
,
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
,
,
,
,
.
.
;
:
.
,
,
,
.
;
:
–
.
,
,
,
.
.
;
:
–
.
.
.
;
:
.
,
.
.
;
:
–
.
Índex
.
.
;
:
–
.
,
,
.
;
:
–
.
,
.
;
:
–
.