TDR Objectius 6: Descobriment de drogues de conducció per a patògens humans mitjançant integració de dades químiques intensives

Resum

El volum de dades biològiques, químiques i funcionals dipositades en el domini públic Està creixent ràpidament, gràcies a la seqüenciació de pròxima generació i tecnologies de cribratge altament automatitzades. Aquests conjunts de dades representen recursos valuosos per a la descoberta de medicaments, especialment per a patògens de malalties menys estudiades. Per aprofitar aquests conjunts de dades, es requereix una integració de dades intel·ligent i intensiva per orientar inferències computacionals a diversos organismes. Els objectius TDR Els recursos químics integrien dades genòmiques de patògens humans i organismes model juntament amb la informació sobre compostos bioactius i les seves activitats anotades. Aquest informe posa de manifest les últimes actualitzacions de les dades i funcionalitats disponibles en els objectius de TDR 6. Basat en models de xarxa químics que proporcionen enllaços entre inhibidors i objectius, la base de dades incorpora ara les prioritzacions de destinacions impulsades per la xarxa, i les noves visualitzacions de subgraps de xarxa que mostren productes químics i objectiu – Barris d’imilitud juntament amb els enllaços associats de bioactivitat compostos compostos associats. Les dades disponibles es poden navegar i es poden consultar a través d’una nova interfície d’usuari, que permet als usuaris realitzar prioritzacions d’objectius de proteïnes i inhibidors químics. Com a tal, els objectius TDR ara faciliten la investigació de les drogues que repurposen els objectius de patògens, que poden ajudar a identificar objectius candidats per a compostos bioactius amb objectius prèviament desconeguts. Els objectius TDR estan disponibles a https://tdrtargets.org.

Introducció

Les malalties tropicals descuidades (NTD) afecten desproporcionadament ~1.500 milions de persones en ingressos baixos i desenvolupats Països, on són una causa líder per a anys de vida perduts a la discapacitat i la mort prematura (1). Històricament, la manca de participació de la indústria farmacèutica, en combinació amb una inversió limitada en programes de recerca en salut pública als països afectats, va suposar una deficiència de medicaments disponibles per controlar eficaçment la majoria d’aquestes malalties (2). A més, les drogues que es fan servir actualment per tractar aquestes malalties es veuen compromeses sovint en termes de costos, dificultats en l’administració, l’eficàcia, la resistència a les drogues o els perfils de seguretat.

Drogues Discovery és un procés que requereix el temps i costós (3 , 4). Per a NTD en particular, els programes de descobriment de drogues han de sobreviure al temps suficient a través de l’escassetat de finançament generalitzat per convertir-lo en assajos clínics posteriors (5). En aquest context, un enfocament estratègic per al descobriment de fàrmacs NTD és reposicionament de drogues (6), que pot ajudar a reduir els costos facilitant les aprovacions reguladores en proves primerenques per a medicaments que ja han experimentat investigacions clíniques per a altres malalties i / o indicacions i ha fallat per motius que la seguretat (6). A més, si l’abast de la republició de drogues s’amplia per incloure medicaments i compostos bioactius de la investigació sobre organismes no humans, també pot conduir a la identificació d’almenys noves eines químiques per sondejar la funció d’objectius i camins en patògens humans. Així, mitjançant l’aprofitament les grans quantitats de dades disponibles a partir de programes de recerca ben finançats sobre malalties humanes i organismes model, el paisatge de descobriment de drogues sobre NTD obté un impuls positiu (7).

Les estratègies computacionals són cada vegada més Essencial en descoberta de medicaments translacionals, tant a l’Acadèmia com a la indústria farmacèutica. La integració intel·ligent i intensiva dels volums creixents de dades generades durant totes les fases de Drogues Descobriment ja permet abordar els reptes clau del procés (8). Des de la seva introducció, la base de dades d’objectius TDR ha estat un recurs fiable per als investigadors de les malalties descuidades per accedir a les dades de química per a la priorització de l’objectiu de drogues i la repassar de drogues sobre malalties descuidades. Introduït el 2008 (9), aquest recurs d’accés obert va permetre als investigadors trobar objectius de proteïnes noves i inhibidors químics i prioritzar-los per ajudar el desenvolupament de medicaments per a patògens NTD. Els objectius TDR fan ús de conjunts de dades funcionals de tot el genoma públicament a tot el que permeten als usuaris trobar i prioritzar els objectius basats en els seus coneixements sobre la biologia del seu patogen d’interès i la naturalesa de la malaltia (10,11). Això s’implementa mitjançant una selecció de destinació flexible i basada en l’usuari (utilitzant criteris de filtratge) i el rànquing (utilitzant ponderació específica de criteris) (12,13).

Aquí descrivim les actualitzacions als conjunts de dades subjacents i Funcionalitat en el recurs d’orientacions TDR, acumulat des de la seva publicació anterior el 2012 (13). El nou llançament d’objectius TDR (V6.1, abreujat TDR6 en aquest document) integra informació genòmica específica de patogen amb dades funcionals (p. Ex.Expressió, relacions basades en ortologia, essencialitat) d’una selecció d’organismes, juntament amb les dades de compostos bioactius (estructura química, propietat i informació de la bioactivitat / objectiu); Tot això es pot consultar i navegar a través de l’aplicació web. Totes les consultes es poden desar a un estabitari personal per usuaris registrats i publicats a través de l’aplicació web per maximitzar les oportunitats de col·laboració. Les llistes prioritzades d’objectius es poden exportar per a una altra anàlisi fora de línia. Els detalls complets de totes les funcions noves es poden trobar a les notes de llançament (https://tdrtargets.org / llançaments). Aquest informe presenta un towthrough complet de l’aplicació web, les seves novetats, i exemples per il·lustrar casos d’ús.

Visió general i organització dels objectius TDR

Com en versions anteriors dels objectius TDR, TDR6 també s’organitza en dues seccions principals: objectius i compostos. La secció d’objectius de la base de dades conté dades de tot el genoma per a 20 patògens humans i permet als usuaris executar consultes i priorització d’objectius de proteïnes basats en diverses funcions i dades rellevants per a la descoberta de drogues (vegeu la taula 1). La secció de compostos de la base de dades conté informació sobre > 2 milions de compostos bioactius, i permet consultes basades en les propietats químiques dels compostos i les seves bioactivitats anotades (vegeu la taula 2).

Taula 1.

Consultes d’orientació disponibles en objectius TDR

grup de consulta. patògens per a les quals hi ha disponibles les dades. tipus de dades disponibles per consultar.
noms & Anotacions Tots Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna Tots mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural Tots Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica Tots Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica Tot Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament tots assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques Tots Objectius de filtre basats en publicacions disponibles
grup de consulta. patògens per a les quals hi ha disponibles les dades. tipus de dades disponibles per consultar.
noms & Anotacions Tots Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna Tots mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural Tots Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica Tots Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica Tot Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament tots assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques Tots Objectius de filtre basats en publicacions disponibles

taula 1 .

Consultes d’orientació disponibles en objectius TDR

grup de consulta. patògens per a les quals hi ha disponibles les dades. tipus de dades disponibles per consultar.
noms & Anotacions Tots Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna Tots mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural Tots Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica Tots Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica Tot Precedent per a una modulació química reeixida de l’activitat o funció de destinació.Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament tots assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques Tots Objectius de filtre basats en publicacions disponibles
grup de consulta. patògens per a les quals hi ha disponibles les dades. tipus de dades disponibles per consultar.
noms & Anotacions Tots Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna Tots mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural Tots Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica Tots Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica Tot Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament tots assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques Tots Objectius de filtre basats en publicacions disponibles

taula 2 .

Consult disponibles consultes en objectius tdr

grup de consulta. tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm)
compostos orfes cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació
Cerques basades en estructura
semblança composta Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.
Consulta grup. tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm)
compostos orfes cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació
Cerques basades en estructura
semblança composta Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.

Taula 2.

Consultes disponibles consultes en objectius tdr

grup de consulta. tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm)
compostos orfes cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació
Cerques basades en estructura
semblança composta Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.
Consulta grup. tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (p. Ex.IC50 < 5 μm)
compostos orfes Cerca de compostos que tenen informes de bioactivitat en l’organisme sencer o assaigs de cèl·lules senceres, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius Trobeu compostos que tinguin informació sobre la informació i el mecanisme d’orientació Assaigs
Cerques basades en estructura
semblança composta dibuix / pasta Estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.

noves funcions a TDR Objectius 6

Hem informat recentment un model de xarxa integrador (14) on tots els conjunts de dades a escala de genoma disponibles en objectius TDR (objectius de proteïnes), informació química (compostos bioactius) i les seves relacions (bioactivitat dels compostos) Assaigs basats en l’objectiu) es van vincular en un gràfic multicapa. A TDR6, aquest model de xarxa s’ha actualitzat integrant nous conjunts de dades (descrits a continuació). Aquest model incorpora enllaços entre objectius i compostos bioactius derivats de la curació manual dels assajos de bioactivitat publicats (és a dir, enllaços directes entre objectius i compostos químics), així com de les relacions calculades (enllaços objectiu-blanc i enllaços compostos) basats en les anotacions de proteïnes (Dominis PFAM, grups d’ortòlegs) i similitud química. Un aspecte clau d’aquests enllaços en el model multicapa-xarxa és que permeten l’exploració i la visualització ràpida del barri al voltant dels objectius seleccionats i / o compostos bioactius. Això permet als usuaris explorar compostos vinculats a objectius, inspeccionar el barri de similitud química al voltant de compostos bioactius i visualitzar aquestes dades d’una manera amable i integral (vegeu la figura 1).

figura 1.

Model de xarxa esquemàtica a TDR6 i visualitzacions sub-gràfics: les pàgines compostes o objectiu ara mostren una visualització de subgrafs que conté objectes a la xarxa proximitat de l’entitat seleccionada. Aquests gràfics es construeixen a partir d’un gràfic de xarxa complex de tres capes. Es presenta un esquema d’aquest gràfic a la part superior. Tant els subgrafs de destinació com de compostos sempre es disposen de la manera següent: els nodes compostos (verds) estan connectats a objectius (taronja = patògens grisos = no patògens) a través de les vores de la bioactivitat. Aquests enllaços representen resultats positius (verds), neutres o negatius (gris) o negatius (vermells). Finalment, es dirigeix a un mapa d’afiliacions funcionals (anotacions, nodes blaus). En l’exemple, el gràfic mostra un conjunt d’inhibidors coneguts per a una aciltransferasa humana (15). Aquestes bioactivitats (totes positives) es dibuixen com a enllaços verds entre els compostos (nodes verds) i l’objectiu (nodes grisos per a no patògens, nodes de taronja per patògens). El gràfic ressalta les oportunitats de repugnament per a les aciltransferases de l’helmint (línies traçades, afegides manualment per a aquesta xifra), basades en anotacions compartides amb l’objectiu humà conegut farmacèutic. El node vermell de la capa de drogues indica el compost seleccionat. Les mides del node es determinen pel nombre de connexions a la xarxa (grau), mentre que les amplades d’enllaç de bioactivitat (vores) estan relacionades amb el nombre acumulatiu d’evidències experimentals per a un parell donat de drogues (nombre d’assaigs).

Figura 1.

Model de xarxa esquemàtica en visualitzacions TDR6 i sub-gràfic: les pàgines compostes o objectiu ara mostren una visualització de subgrafs que conté objectes a la pàgina Xarxa proximitat de l’entitat seleccionada. Aquests gràfics es construeixen a partir d’un gràfic de xarxa complex de tres capes. Es presenta un esquema d’aquest gràfic a la part superior. Tant els subgrafs de destinació com de compostos sempre es disposen de la manera següent: els nodes compostos (verds) estan connectats a objectius (taronja = patògens grisos = no patògens) a través de les vores de la bioactivitat. Aquests enllaços representen resultats positius (verds), neutres o negatius (gris) o negatius (vermells). Finalment, es dirigeix a un mapa d’afiliacions funcionals (anotacions, nodes blaus). En l’exemple, el gràfic mostra un conjunt d’inhibidors coneguts per a una aciltransferasa humana (15). Aquestes bioactivitats (totes positives) es dibuixen com a enllaços verds entre els compostos (nodes verds) i l’objectiu (nodes grisos per a no patògens, nodes de taronja per patògens). El gràfic ressalta les oportunitats de repugnament per a les aciltransferases de l’helmint (línies traçades, afegides manualment per a aquesta xifra), basades en anotacions compartides amb l’objectiu humà conegut farmacèutic. El node vermell de la capa de drogues indica el compost seleccionat. Les mides del node es determinen pel nombre de connexions a la xarxa (grau), mentre que les amplades d’enllaç de bioactivitat (vores) estan relacionades amb el nombre acumulatiu d’evidències experimentals per a un parell donat de drogues (nombre d’assaigs).

Amb aquestes actualitzacions, TDR6 ara proporciona als usuaris les següents funcionalitats: (i) Dromen les prioritats de la xarxa, (ii) exploració de la república de drogues; i III) l’exploració dels objectius candidats per a compostos orfes. Aquests casos d’ús són possibles per diverses funcions basades en la xarxa precomputades, com ara una nova puntuació de farmàcia farmacèutica (NDS). En associar una mètrica quantitativa a objectius basats en l’enriquiment de compostos bioactius en nodes de xarxa estretament connectats, aquesta puntuació facilita la classificació dels objectius en grups farmacèutics (DGS), que estan disponibles per als usuaris en consultes de bases de dades.

El El model de xarxa és també la base per a les prioritzacions de la xarxa precomputades (NDPS) que es poden consultar pels usuaris i també s’utilitzen internament per TDR6 per seleccionar objectius i compostos connectats per mostrar a les visualitzacions de xarxa recentment desenvolupades (vegeu més avall). En partir d’un compost d’interès TDR6 utilitza les prioritzacions precunalles d’objectius candidats per ajudar els usuaris a la navegació de l’espai objectiu al voltant del compost (i viceversa en començar des d’un objectiu d’interès). Mitjançant la proporció d’aquestes mètriques i classificacions de l’enriquiment precomputat, la base de dades facilita ara el descobriment de noves associacions de destinacions farmacèutiques. A més d’aquests nous NDPs precompuats, els usuaris poden prioritzar els objectius utilitzant la mateixa funcionalitat que en els objectius TDR anteriors.

Aquesta versió també inclou diverses actualitzacions de dades, és a dir, la inclusió de 22 nous genomes (20 nous patògens i 2 nous) Organismes de models), i extenses actualitzacions de dades químiques i de bioactivitat entre d’altres. La interfície d’usuari millorada i versàtil, juntament amb les actualitzacions de dades renoven el compromís d’objectius TDR per proporcionar una eina integrada i poderosa per explorar dades genòmiques i químiques en el context de malalties tropicals descuidades.

utilitzant objectius tdr 6

Prioritzacions de destinacions senceres

El model de xarxa (14) és la base de la nova puntuació farmacèutica, que és una mètrica derivada de la xarxa relacionada amb l’enriquiment en compostos bioactius per a Objectiu donat (NDS, “Partitura de la farmàcia de la xarxa”). Els NDS estan disponibles per a tots els organismes de nivell 1, que es poden consultar i s’utilitzen per pesar les consultes per filtrar (in o out) els objectius de les canonades de priorització personalitzades per l’usuari. Com s’explica encara més en els detalls d’integració de la xarxa, per a cada organisme, es van classificar els objectius en cinc grups farmacèutics (DG), des de la més baixa (DG1) fins a la màxima puntuació (DG5), segons el seu rendiment a les prioritats de la xarxa.

Com en les versions anteriors dels objectius TDR, els usuaris poden combinar diferents conjunts de dades simplement executant consultes individuals en diferents tipus de dades i combinant-los a la pàgina de la història (9,10,12,13). Això és útil quan, per exemple, els usuaris volen incloure tipus de dades addicionals a prioritzacions basades en farmacèutiques, com ara els que confien en l’expressió gènica en les etapes de cicle de vida pertinents, o aquells que proporcionen informació sobre la condició física / letalitat dels objectius (essencialitat).

Com a exemple, presentem un exemple de priorització utilitzant Toxoplasma Gondii com a patogen d’interès. T. Gondii és un paràsit apicomplexan sovint utilitzat com a model per investigar la biologia subjacent a diverses malalties humanes i animals (15). L’estratègia de cerca es resumeix a la figura 2. La consulta es va iniciar buscant tots els objectius T. Gondii i filtrant aquests objectius amb homòlegs en humans (per seleccionar només objectius específics de paràsits). A continuació, vam seleccionar els gens essencials candidats basats en perfils de fitness durant la infecció de fibroblasts humans (16); i també els gens seleccionats altament expressats en taquyzoites (etapa replicativa de T. Gondii) Consultant per a gens en els 80-100 percentils d’abundància de RNaseq Transcript (17). Aquestes seleccions es van combinar amb les classificacions de la xarxa farmacèutica. Per això vam considerar gens en grups de droguerisme 3, 4 o 5 (DG ≥ 3) (vegeu la figura 2). La figura mostra totes les consultes i els seus resultats vistos a la pàgina d’historial, i les operacions realitzades en combinar consultes (unió, intersecció). La llista final d’objectius classificats basats en aquests criteris s’ha realitzat públicament i està disponible a la secció TDR Objectius de llistes publicades.

Figura 2.

objectiu Estratègia d’exemple de priorització per a T. Gondii. La imatge composta mostra (a) els termes de consulta que s’utilitzen per trobar els objectius de T. Gondii que no tenen homòlegs en humans, que estan molt expressats a la fase tàcyzoita virulenta del paràsit durant la infecció per cèl·lules humanes, que probablement són essencials i són probablement farmacèutiques segons per netejar la puntuació de farmacèutica. (B) Resum de les consultes realitzades a la pàgina “Objectius”, que mostra com aquestes consultes apareixen a la pàgina “Història”, on es poden revisar i transformar. Els botons de gestió de consultes en línia permeten accions seleccionades (eliminar, canviar el nom, exportació) en els conjunts de resultats.(C) Les combinacions de consultes permeten als usuaris executar la unió, es creuen o resten accions en consultes amb i entre si. Es mostren exemples d’accions de la Unió i la Intersecció. (D) Les consultes es poden desar a un estabal privat (els meus conjunts de consultes) des d’on es poden enviar a l’espai de treball (per realitzar operacions de consulta addicionals) o compartides públicament amb altres usuaris d’objectius TDR (els meus conjunts de consulta de destinació publicada).

figura 2.

Estratègia d’exemple de priorització objectiu per a T. gondii. La imatge composta mostra (a) els termes de consulta que s’utilitzen per trobar els objectius de T. Gondii que no tenen homòlegs en humans, que estan molt expressats a la fase tàcyzoita virulenta del paràsit durant la infecció per cèl·lules humanes, que probablement són essencials i són probablement farmacèutiques segons per netejar la puntuació de farmacèutica. (B) Resum de les consultes realitzades a la pàgina “Objectius”, que mostra com aquestes consultes apareixen a la pàgina “Història”, on es poden revisar i transformar. Els botons de gestió de consultes en línia permeten accions seleccionades (eliminar, canviar el nom, exportació) en els conjunts de resultats. (C) Les combinacions de consultes permeten als usuaris executar la unió, es creuen o resten accions en consultes amb i entre si. Es mostren exemples d’accions de la Unió i la Intersecció. . / p>

estratègies de reputuració de medicaments mitjançant transformacions de consulta

La consulta farmacèutica a TDR6 permet als usuaris seleccionar objectius amb inhibidors / medicaments previstos o previstos. La informació sobre objectius amb fàrmacs coneguts provenen de la curació de literatura, mentre que les associacions preditades (indirectes) d’objectius amb inhibidors / medicaments s’obtenen a través de càlculs de similitud de seqüència o ortologia (a objectius farmacèutics coneguts), o mitjançant inferències compatibles amb la xarxa (14). Tots aquests mètodes s’implementen a TDR6. Per tant, quan els usuaris filtren un conjunt de gens basats en la farmacèutica, limiten la selecció a objectius altament classificats, que haurien de proporcionar una font rica de les oportunitats de republiment de drogues.

Per mostrar la utilitat de TDR6 en aquesta àrea, mostrem Com buscar medicaments candidats per a republicar per a Echinococcus multilocularis (l’agent causal de l’equinococcosi alveolar). Això es mostra a la figura 3. El procés és similar al que es descriu anteriorment per a T. Gondii, però en aquesta estratègia de consulta no vam descartar homòlegs humans, i han utilitzat els conjunts de dades de letalitat C. Elegans RNAi com a proxy per a la essencialitat de nematode. Com a resultat, vam obtenir una priorització sencera del genoma per a E. Multilocularis. A continuació, aplicant un filtre basat en farmacèutic a aquesta consulta, hem reduït la selecció gènica a un grapat de gens. L’usuari pot inspeccionar manualment els objectius seleccionats per esbrinar quins medicaments es van enumerar a través d’associacions indirectes. Les pàgines d’orientació mostraran tots els compostos associats a la secció de farmacèutica, classificats segons la font de la inferència. Per a inferències impulsades per xarxa, la puntuació per a cada compost proposat apareixerà tant com a llista com a parcel·la de rang, per identificar ràpidament els candidats prometedors. Alternativament, per minimitzar la inspecció manual, la llista de gens (és a dir, la mateixa consulta) es pot convertir fàcilment en una llista de medicaments associats fent clic a “Convertir aquests botons d’aquesta consulta” a la part superior de les pàgines de resultats de consulta. Aquesta funcionalitat proporciona una forma ràpida de començar a crear una biblioteca de projecció per a un conjunt d’objectius. Les transformacions de la consulta es poden basar en els medicaments curats (coneguts per a un establiment d’objectius), previstes (associacions computades a medicaments) o ambdues. En els tres enfocaments, els inhibidors / medicaments associats amb objectius coneguts farmacèutics estan associats de manera transitòria als gens de la llista. Figura 3 Resumeix l’estratègia de priorització, la conversió de consultes de la llista de gens als compostos, i un exemple de la visualització del sub-gràfic disponible a la pàgina composta d’un èxit de republicació. Actualment, aquestes conversions s’executen en el fons i els resultats apareixen a la secció Història del lloc web quan es fa (els usuaris també estan alerts per correu electrònic).

figura 3.
P> Repurposant les drogues per a E. Multilocularis mitjançant transformacions de consultes. Un esquema de priorització d’orientació per a Echinococcus multiloculars que depenen de la inferència d’ortologia i de la drogositat prevista (DG ≥ 3). (A) consultes combinades; (B) Llista inicial d’objectius prioritzats. (C) Qualsevol llista d’orientació es pot “transformar” en una llista dels seus medicaments associats, utilitzant qualsevol dels mètodes d’enllaços de compostos disponibles (vegeu el text principal). (D) Llista resultant de compostos bioactius. (E) Exemple de visualització de sub-gràfics de xarxa d’un compost seleccionat, que mostra enllaços de bioactivitat actius i inactius. Els compostos (nodes verds) estan connectats a objectius patògens (taronja) segons els registres de bioactivitat (verd = actiu; vermell = inactiu, vegeu el text principal per a llindars d’activitat).Els objectius, al seu torn, estan connectats (enllaços grisos) a les afiliacions funcionals (nodes blaus). La prestació de sub-grafs proporciona consells visuals sobre com es connecta l’objectiu inicial de l’E. Multilocularis amb el compost seleccionat a la xarxa.

figura 3.

Repurposant de drogues per E. Multilocularis mitjançant transformacions de consultes. Un esquema de priorització d’orientació per a Echinococcus multiloculars que depenen de la inferència d’ortologia i de la drogositat prevista (DG ≥ 3). (A) consultes combinades; (B) Llista inicial d’objectius prioritzats. (C) Qualsevol llista d’orientació es pot “transformar” en una llista dels seus medicaments associats, utilitzant qualsevol dels mètodes d’enllaços de compostos disponibles (vegeu el text principal). (D) Llista resultant de compostos bioactius. (E) Exemple de visualització de sub-gràfics de xarxa d’un compost seleccionat, que mostra enllaços de bioactivitat actius i inactius. Els compostos (nodes verds) estan connectats a objectius patògens (taronja) segons els registres de bioactivitat (verd = actiu; vermell = inactiu, vegeu el text principal per a llindars d’activitat). Els objectius, al seu torn, estan connectats (enllaços grisos) a les afiliacions funcionals (nodes blaus). La representació del sub-gràfic proporciona consells visuals sobre com es connecta l’objectiu inicial de l’E. Multilocularis amb el compost seleccionat a la xarxa.

Exploració de compostos orfes

p> Les activitats de compostos extrets de la literatura per curació apareixen en forma d’assaigs basats en l’objectiu (enllaç directe a l’objectiu) o en forma d’assaigs basats en cèl·lules o organisme sencer. En absència d’una altra informació, aquestes últimes classes d’assaigs no proporcionen pistes sobre l’objectiu o el mecanisme d’acció dels compostos. Durant el procés d’actualitzacions de dades químiques a TDR6, vam identificar compostos amb efectes fenotípics reportats sobre l’organisme sencer o els assajos basats en cèl·lules, basades en les seves classificacions de Chembl. Aquesta informació es va utilitzar per identificar compostos “orfes” que estan actius contra un patogen particular en les projeccions primàries o secundàries basades en cel·les, però per a les quals no hi ha assaig basat en l’objectiu.

Compostos orfes a TDR6 poden ser Cercat per a qualsevol espècie amb dades de detecció fenotípica disponible, dins de la pàgina de cerca de compostos. Això permet una forma ràpida d’aprofitar les dades d’assaigs d’alt rendiment, permetent als usuaris iniciar les seves prioritzacions de compostos amb activitat coneguda contra un patogen d’interès.

El model de xarxa integrat a TDR6 també és útil per identificar el candidat Objectius per a compostos orfes. Com es descriu a la publicació original (14), el barri de similitud química calculada al voltant d’un compost orfe seleccionat pot proporcionar enllaços indirectes a un o més objectius. Mitjançant aquesta estratègia hem realitzat prioritzacions d’orientació per a tots els compostos orfes de TDR6. Aquestes prioritzacions de compostos impulsades per la xarxa precomputades estan disponibles per a tots els organismes per als quals hi ha disponibles dades de detecció de fenotípic. Resums globals que mostren tots els compostos orfes d’aquests organismes estan vinculats a la pàgina “Resum de dades” (vegeu https://tdrtargets.org / DataSummary, i feu clic a l’espècie d’interès). Un exemple de priorització basada en compostos orfes per a T. Cruzi es mostra a la figura 4. Mentre que les prioritzacions a partir d’un sol compost estan disponibles a cada pàgina composta.

figura 4.

Exploració d’objectius candidats per a compostos orfes de trypanosoma Cruzi. La trama resumeix la priorització d’orientació impulsada per la xarxa per a compostos orfes actius contra T. Cruzi. Totes les seqüències de codificació de proteïnes en el genoma de T. Cruzi (objectius candidats) estan disposats a l’eix X. Els punts de dades de la parcel·la corresponen a associacions de medicaments destinataris anotats per l’algorisme (puntuació traçat a l’eix Y). Com a exemple, vam destacar dos objectius posatius per a dos medicaments diferents (tal com es mostra a la pàgina Resum de dades T. Cruzi). Parcel·les similars estan disponibles en línia per a organismes de nivell 1 a TDR6 (enllaçat a partir de la pàgina Resum de dades).

figura 4.

Exploració d’objectius candidats per a compostos orfes de tripanosoma Cruzi. La trama resumeix la priorització d’orientació impulsada per la xarxa per a compostos orfes actius contra T. Cruzi. Totes les seqüències de codificació de proteïnes en el genoma de T. Cruzi (objectius candidats) estan disposats a l’eix X. Els punts de dades de la parcel·la corresponen a associacions de medicaments destinataris anotats per l’algorisme (puntuació traçat a l’eix Y). Com a exemple, vam destacar dos objectius posatius per a dos medicaments diferents (tal com es mostra a la pàgina Resum de dades T. Cruzi). Les parcel·les similars estan disponibles en línia per a organismes de nivell 1 a TDR6 (enllaçat des de la pàgina Resum de dades).

Actualitzacions de funcionalitats i dades

noves dades genòmiques a Objectius TDR v6.1

Des de la publicació anterior de la base de dades de dits TDR (13), s’han afegit diversos genomes de patogen. Es proporciona una llista detallada a la taula 3, així com en línia a la pàgina de resum de dades TDR6 (https://tdrtargets.org / DataSummary).

taula 3 .

Resum de disponibilitat de dades per a patògens de nivell superior. Resum de les dades d’orientació disponibles per a organismes de nivell 1 en objectius TDR. CD: seqüències de codificació; PFAM: nombre de proteïnes amb domini pfam mapat; Aneu: Nombre de proteïnes amb termes d’ontologia de gens mapats; CE: nombre de proteïnes amb números de la Comissió d’Enzims mapats (CE); Camins: nombre de proteïnes mapes a mapes de camins de Kegg; Ortòlegs: nombre de seqüències mapades a grups d’ortòlegs orthomcl. Una taula de resum de dades més completa està disponible en línia a https://tdrtargets.org / DataSummary

espècies. CDs. pfam. go. ec. cames. orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166
Plasmodium vivax 5344 3264 2631 641 806 5207
toxoplasma gondii 7946 4025 3795 772 967 6764
chlamydia trachomatis 887 704 598 269 357 645
mycobacterium leprae 1630 1236 929 628 611 1473
mycobacterium tuberculosi 4004 2934 2001 1174 1145 3287
mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep Onema Pallidum 1036 791 634 221 335 733
wolbachia endosimbiont de b. malai 805 628 577 308 382 688
Brugia malayi 11316 7042 6368 1278 1787 8424
Echinococcus granulosus 10249 6481 5432 854 1965 7109
Echinococcus multilocularis 10474 6817 5768 878 2079 7539
loa loa (cuc d’ulls) 16292 8071 6774 1539 2207 10484
onchocerca volvulus 12224 3248 2178 246 563 4054
esquistosoma mansoni 12692 7818 7384 1218 1649 10386
leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei 10270 5665 5482 1019 1264 9259
trypanosoma cruzi 18639 9908 8572 1495 1735 18140
Entamoeba histolytica 8211 4920 4087 645 1094 7692
giardia lambia 9665 2726 2263 326 514 5977
trichomonas vaginalis 95600 35474 18435 843 1366 87303

5432

Entamoeba histolytica

espècies. cds. pfam. go. ec. cames. orthologs.
plasmodium falciparum 5349 3322 3551 750 1083 5166
Plasmodium vivax 5344 3264 2631 641 806 5207
toxoplasma gondii 7946 4025 3795 772 967 6764
chlamydia trachomatis 887 704 598 269 357 645
mycobacterium leprae 1630 1236 929 628 611 1473
mycobacterium tuberculosi 4004 2934 2001 1174 1145 3287
mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep Onema Pallidum 1036 791 634 221 335 733
wolbachia endosimbiont de B.malayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Lloa Lloa (cuc ull)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87.303

Taula 3.

Resum de dades de disponibilitat per als millors agents patògens de nivell. Resum de les dades de destinació disponibles per al Nivell 1 organismes en Targets TDX. CDs: seqüències de codificació; PFAM: nombre de proteïnes amb domini de PFAM assignada (s); GO: nombre de proteïnes amb termes de ontologia de gens assignades; CE: nombre de proteïnes amb els números de la Comissió d’Enzims (CE) assignades; Pathways: nombre de proteïnes correlacionats amb mapes KEGG via; Orthologs: nombre de seqüències assignades a grups OrthoMCL ortólogo. Una taula de dades resum més complet està disponible en línia a https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071


Entamoeba histolytica


3c34827 “ iv id =” 0b01674e “”.


v id = “29971a56991”

5344

2631

887 87 04 04 04 04


mycobaacterium 6678 678 678 678 678


5432

Entamoeba histolytica

Espècies. CD. PFAM. GO. CE. Camins. Orthologs.
Plasmodium falciparum 5349 3322 3551 750 1083 5166
5344 3264 2631 641 806 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764
Chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae

1630

1236 929 628 611 1473
Mycobacterium tuberculosi 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep ONEMA pallidum 1036 791 634 221 335 733
Wolbachia endosymbiont de B.Malai 588 588 388
Brugia Malai

11316

7042 6368 1278 1787 6481 6481 854 1965 7109
Echinococcus multilocularis

10474

6817 779 758
Loa Loa (cuc d’ulls) 1509 071 1559 071 1539 071 679 071 15371 1539 071 1539 071 1559 071 2207 10484 2378 2178 246 563 4054
esquistosoma mansoni

12692

7818 7384 1218 1649

10386

leishmania major 8280 4641 4415 1067 1162 8250 5480 5482 1019 1264 9259
trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
giardia lambia 2263 2263 2735 363

272 3635 363 2235 363 514 5977
trichomonas vaginalis

95600

35474

18435 843 CDs. pfam. go. ec. patins. ortoogs.
lasmoodium 3322 551 7166 plasmox vivax 641 606 06 06 06 06 5207
toxoplasma gondii 7946 4025 3795 772 967 6764 598 269 tepne mycobacterium 1630 1236 p2 673 673
mycobaacterium tdulesis pàgina 1174 1174 1174 1174 3287 873 1002 3459
Trep Onema Pallven 1036 61 33 33 33 33 33 33 633
WOLBIA INDUSSIABIANT DE Bmalayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Lloa Lloa (cuc ull)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania major 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87.303

Atesa la diversitat d’organismes integrat en objectius TDX i, en conseqüència, la varietat de fonts de dades necessària per a cobrir tota la genomes; esforç substancial s’ha posat en l’estandardització de les dades d’anàlisi i recuperació d’informació a partir de l’genoma d’aquests organismes. La majoria dels genomes complets EupathDB es van obtenir a partir de (18), GenBank (19), GeneDB (20), Wormbase paràsit (21), GenoList (22) o Mycobrowser (23). Una descripció completa de les fonts de l’genoma i donat en anterior quadre complementari S1. Per actualitzar les dades dels organismes presents en la versió anterior dels objectius de TDX de codificació de proteïnes dels gens de la versió actual dels genomes o bé s’assignen als gens existents a TDX Targets, o en cas contrari entrar els nous registres. El mapatge algoritme utilitza una combinació de condicions per a realitzar un seguiment identificadors de gens a través de publicacions i mantenir la identitat de gens: les sumes de comprovació de seqüència coincident (mitjançant valors de 128 bits Hash generats pel MD5 algoritme), Gene noms o identificadors i BLAST (24) IF o coincidències perfectes es troben. Després d’actualitzar els registres, el Pipeline calcula les propietats fisicoquímiques utilitzant Pepstats (25), exploracions per a dominis transmembrana amb TMHMM (26), pèptids de senyal amb SignalP (27), i glicosilfosfatidilinositol Els punts d’ancoratge, utilitzant PredGPI (28). L’algoritme rebutja totes les seqüències no codificants, el més aviat qualsevol pseudogens, per tal de no confondre les anotacions i minimitzar les falses suposicions durant els fluxos de treball de priorització. La major part de TDR6, esmentat anteriorment totes les tasques per a la integració i actualització genoma s’han embolicat en el flux de treball automatitzat per facilitar el ràpid actualitzacions en futures versions. Un esquema de l’actualització i Pipeline algoritme mostrat en l’anterior Figura complementari S1. L’oleoducte també automatitza el càlcul d’anotacions usant estratègies individuals ad hoc per a diferents anotacions, confiant en els serveis web i APIs (aparegut en el Kaas (29) Servei de proteïnes de mapatge a vies metabòliques i a el gran nombre de classificació CE, d’enzims, o el OrthoMCL base de dades i eina (30,31) per als grups de mapeig ortholog a les proteïnes. el Pipeline també es basa en el càlcul contra bases de dades instal·lades localment van aparèixer més iNTERPRO (32), utilitzant InterProScan (33) per identificar dominis de proteïnes (PFAM) i el mapa de termes als vocabularis controlats i les classificacions (GO). els recursos addicionals van aparèixer més 3D estructures i models estructurals van ser recuperats de la Protein Data Bank (34) usant serveis web i descarregar-se de el lloc MODBASE FTP (35), respectivament.

també el nombre de conjunts de dades funcionals clau es van integrar en aquesta versió, incloent (i) els conjunts de dades transcriptomic que proporcionen proves de l’expressió gènica en etapes de el cicle de vida o condicions experimentals que són rellevant per descobriment de fàrmacs (36-47) i (ii) essencialitat conjunts de dades deriven de dues patògens Apicomplexan (P. berghei i T. gondii) (16,48), que proporcionen informació a Estratègies vitals ASSIST priorització.

Actualitzacions de les dades químiques

Per als compostos bioactius també, els fluxos de treball d’actualització de dades s’han automatitzat per a aquesta versió.La majoria dels compostos bioactius es van recuperar de Chembl 24th Allow (49), que conté alguns conjunts de dades addicionals, com ara les de caixes químiques específiques de patogen: caixes GSK Kinetoplastid (50), caixa de patogen MMV (51). El procés d’integració comença a partir de les descripcions de molècules (2D) en format SDF, des del qual calculem totes les empremtes dactilars compostes necessàries (necessàries per a cerques de similitud de compostos / subestructures) mitjançant Checkmol (52). El gasoducte també calcula propietats químiques addicionals, com ara el coeficient de partició d’octanol / aigua de logple i altres descriptors estructurals que utilitzen XLOGP3 (53) i les eines Open Babel Obprop i Obrotamer (54). Es van obtenir o calcular altres dades rellevants directament des de l’estructura composta, com ara els identificadors INCHI i INCHIKEY (55) per al seguiment de compostos; i altres regles normals de polze utilitzades en la química medicinals i la descoberta de drogues, com la regla de Lipinski de cinc (56) i la regla relacionada de tres (57).

Després d’integració en objectius TDR, tots els compostos eren subjectes a tots els vs Càlcul de comparació de similituds químics mitjançant Chemfp (58) que produeix mesures de similitud de parell basades en l’índex / distància de Tanimoto (59). A més, hem calculat un mapa global (tots versus tots) de les relacions de subestructures entre compostos a la base de dades (X és una subestructura de Y; Y és una superestructura de X). Sabent que el problema de trobar els subgrafs més comuns entre molècules és computacionalment dur, vam aplicar un enfocament heurístic per trobar subestructures. L’algorisme primer obté un subconjunt de possibles molècules candidatures fent ús de les empremtes digitals calculades anteriorment. Els candidats han d’haver coincidint amb les empremtes dactilars amb la molècula de l’assignatura. Una vegada que s’obté una llista de candidats, la determinació de subestructures d’àtoms plena-by-àtom es fa mitjançant matchmol (52). Les dades disponibles per a compostos i les consultes que es poden executar en cada tipus de dades es resumeixen a la taula 2. El pes molecular (MW) i la distribució de superfície polar (PSA) per a tots els compostos de la base de dades es mostra a la figura complementària S2.

Curació i integració de dades de bioactivitat

Com amb compostos químics, la majoria de bioactivitats integrades en objectius TDR provenen directament de les fonts de dades ascendents (per exemple, Chembl). En integrar les dades de la bioactivitat, es va conservar tant l’anotació de l’assaig (per exemple, ‘assaig de reducció de la motilitat in vitro contra Brugia Malayi microfilariae a 10 μm’) i el valor numèric i unitats associades a activitats compostes (per exemple, ‘80% inhibició ‘,’ 1,5 μM IC50 ‘, ’10 Nm Mic’), que són tots els camps de cerca. A més, i per facilitar les consultes d’usuaris, les bioactivitats reportades es van utilitzar per agrupar els compostos assajos a les classes “actives” o “inactives”. No obstant això, per minimitzar l’efecte d’utilitzar fronteres dures al voltant dels llindars arbitraris i augmentar la separació entre classificacions actives / inactives, també definim una zona grisa indeterminada. Per tant, els compostos que anoten just per sota d’un llindar arbitrari no es consideren inactius per a la consulta i la visualització.

No tots els tipus d’activitat van ser susceptibles a la classificació, però. Malgrat els esforços en la normalització d’aquestes dades d’activitat, la interpretació de les activitats de compostos a aquesta escala és difícil, ja que sovint depenen del tipus d’assaig particular, les unitats reportades, i les condicions particulars en què es va dur a terme cada assaig. No obstant això, un conjunt significatiu de tipus d’assaig es podria classificar automàticament en categories actives / indeterminades / inactives basades en llindars d’activitat. Per a això, tots els tipus d’assaig amb > 100.000 informes (vegeu la figura complementària S3 per a una activitat per tipus d’assaig / per parcel·la de distribució composta) es van considerar per a l’auditoria d’activitat, encara que només es troben assajos de concentració basats (com ara IC50, KI o la potència) es van trobar prou robustes per a aquesta determinació, ja que els assajos basats en percentatge (com ara% activitat,% de l’activitat residual o la inhibició $) eren ambigus en informes de bioactivitat. Els llindars que s’utilitzen per classificar les activitats de cada tipus d’assaig es poden trobar a la taula 4, i la distribució de compostos en aquestes classes d’activitat es resumeix a la figura 5.

Taula 4. Div>

Tipus d’assaig i llindars d’activitat utilitzats per a la determinació de l’etiqueta d’activitat: només es van utilitzar assaigs basats en la concentració per determinar les etiquetes d’activitat. Es van considerar que les activitats que es presenten menys del valor admesos màxim per als positius (+) es consideraven interaccions actives (+), mentre que les més grans que el “valor mínim admès per a negatius” es consideraven inactius (-). Qualsevol activitat que es va informar entre aquests dos valors es va considerar com a indeterminat (0)

tipus d’assaig. unitat estàndard. Valor màxim admès per a actius. un valor mínim admès per inactives.
AC50 nm 20000 100000
ec50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potència nm 20000 100000
assaig
tipus.
unitat estàndard. Valor màxim admès per a actius. un valor mínim admès per inactives.
AC50 nm 20000 100000
ec50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potència nm 20000 100000

Taula 4.

Tipus d’assaig i llindars d’activitat utilitzats per a la determinació de l’etiqueta d’activitat: només es van utilitzar assaigs basats en la concentració per determinar les etiquetes d’activitat. Es van considerar que les activitats que es presenten menys del valor admesos màxim per als positius (+) es consideraven interaccions actives (+), mentre que les més grans que el “valor mínim admès per a negatius” es consideraven inactius (-). Qualsevol activitat que es va informar entre aquests dos valors es va considerar com a indeterminat (0)

tipus d’assaig. unitat estàndard. Valor màxim admès per a actius. un valor mínim admès per inactives.
AC50 nm 20000 100000
ec50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potència nm 20000 100000
assaig
tipus.
unitat estàndard. Valor màxim admès per a actius. un valor mínim admès per inactives.
AC50 nm 20000 100000
ec50 nm 20000 100000
ic50 nm 20000 100000
ic50 ug ml-1 15 50
kd nm 20000 100000
ki nm 20000 100000
potència nm 20000 100000

Figura 5.

Etiquetes d’activitat Distribució i proves Mescles entre les dades: (a) Diagrama de Venn que mostra la distribució de valors de bioactivitat en les classes actives, inactives i indeterminades a TDR6 (vegeu el text principal per obtenir més informació) . Les interseccions compten casos en què el mateix medicament té diferents resultats d’activitat contra el mateix objectiu. Exemples d’aquests casos es proporcionen als panells B a través de F (IDs compostos representen els identificadors TDR6). (B) Activitat de C329137 (una hidroxi-benzamidina) contra P. falciparum bifuncional dihidrofolat reductasa-thymidylate sinthasa. (C) Exemple de registres positius per a inhibidors d’aciltransferasa humana. (D) Exemple d’activitats negatives i neutres per a compostos triphenylelarbinol i benzohidrol, respectivament. Finalment, les proves positives (E) i negatives (F) es poden barrejar amb proves indeterminades, com es mostra per a C2164865 provat contra el cavall Cholinesterasa i C306882 Provat contra P. Recombinant Falciparum deoxiurididina 5′-trifosfat hidrolasa de nucleòtids, respectivament.

Figura 5.

Etiquetes d’activitat Distribució i proves Mescles entre dades: (a) Venn diagrama que mostra la distribució de valors de bioactivitat en l’actiu , classes inactives i indeterminades a TDR6 (vegeu el text principal per obtenir més informació).Les interseccions compten casos en què el mateix medicament té diferents resultats d’activitat contra el mateix objectiu. Exemples d’aquests casos es proporcionen als panells B a través de F (IDs compostos representen els identificadors TDR6). (B) Activitat de C329137 (una hidroxi-benzamidina) contra P. falciparum bifuncional dihidrofolat reductasa-thymidylate sinthasa. (C) Exemple de registres positius per a inhibidors d’aciltransferasa humana. (D) Exemple d’activitats negatives i neutres per a compostos triphenylelarbinol i benzohidrol, respectivament. Finalment, les proves positives (E) i negatives (F) es poden barrejar amb proves indeterminades, com es mostra per a C2164865 provat contra el cavall Cholinesterasa i C306882 Provat contra P. Recombinant Falciparum deoxiurididina 5′-trifosfat hidrolasa de nucleòtids, respectivament.

El tret de l’alliberament de Chembl 24 compta amb més de 15,2 milions de bioactivitats reportades, de les quals només uns 6 milions corresponen a relacions que impliquen medicaments i objectius de proteïnes (ja sigui proteïnes úniques, famílies de proteïnes i complexos de proteïnes, amb ~ 93% sent proteïnes individuals). Altres bioactivitats restants de la base de dades eren informes per a una gran varietat d’objectius no proteïnes, com ara les cèl·lules senceres (3,6 m), els organismes sencers (2,2 m), els teixits (83k) i les macromolècules no pèptídiques (85K) o Molècules petites (< 100). Aquests no s’utilitzaven en la construcció de xarxes, ja que la xarxa és de proteïna (I.E. objectiu) Centric. La figura 5 també mostra una mica de visualitzacions de xarxa que representen com TDR6 mostra aquestes bioactivitats.

Integració de característiques derivades de la xarxa: farmacèutica i prioritzacions

Com es va esmentar anteriorment, les dades genòmiques, les anotacions genòmiques, Els compostos químics i les interaccions de medicaments generals es van integrar en una xarxa complexa orientada a republir les drogues, tal com es descriu a Berenstein et al. (14). La xarxa es va utilitzar per calcular una partitura de farmàcia de xarxa (NDS), per a tots els objectius en patògens prioritaris (Tier 1). El NDS està relacionat amb la possibilitat de trobar compostos bioactius a la proximitat del gràfic de xarxa d’un objectiu donat (el rang és de 0 a 1). L’algorisme ha estat descrit anteriorment en detall (14), però breument, basat en una prova de sobre-representació de les proteïnes farmacèutiques conegudes anotades, calcula una puntuació de rellevància (RS) per a cada grup de domini PFAM i categories del grup ortològic de la xarxa. La puntuació NDS per a un objectiu donat resultats d’una suma acumulada ponderada sobre els RS de totes les contribucions d’afiliació comunes al node de destinació, i proteïnes veïnes vinculades a compostos actius.

Per facilitar la interpretació de les puntuacions NDS Hem realitzat un Avaluació estadística per identificar diferents grups farmacèutics (DG) basats en dos tipus de llindars que ajuden a classificar les prediccions farmacèutiques en zones de confiança. Aquests s’il·lustren a la figura 6. D’una banda, mentre que tots els objectius de puntuació no zero tenen algun grau de connectivitat a objectius coneguts farmacèutics, un ND baix suggereix que aquestes connexions no són rellevants per a l’avaluació farmacèutica. Per tant, es considera que es considera un tall de soroll (una línia de base calculada com 5 vegades el valor de 0,25 percentil a partir de la distribució completa de NDS) identificar objectius de baixa puntuació. El segon llindar es deriva de l’índex màxim de Younden (60), que es calcula com a puntuació en què tant l’especificitat com la sensibilitat són òptimes (la millor sensibilitat sense comprometre l’especificitat i viceversa). Aquest valor només es pot calcular per patògens amb veritables positius (objectius coneguts farmacèutics). Un mínim arbitrari de 10 veritables positius es va considerar suficient per a la determinació de tall. Per a altres patògens que no tinguessin aquesta informació, es va utilitzar un tall global que es va utilitzar (calculat utilitzant tots els veritables positius a la xarxa). Els grups farmacèutics corresponents són, per tant, DG1 per a objectius amb valors NDS que van des de 0 fins al llindar de soroll; DG2 per a objectius amb valors NDS que van des del llindar de soroll fins al tall de Youden; i DGS 3, 4 i 5 amb valors NDS que són de 1-, de 10 i 100 vegades per sobre de la retallada de Youden. En conseqüència, aquests últims grups fan dels objectius més afectats farmacèutics. La figura 6 mostra un exemple estàtic d’una priorització impulsada per la xarxa per a Mycobacterium Ulcerans (que no té objectius amb compostos coneguts en el llançament actual). Totes les prioritzacions dels orientacions TDR Organismes de prioritat es poden veure en línia a la pàgina Resum de dades per a cada espècie (vegeu https://tdrtargets.org / DataSummary, fent clic a les espècies d’interès). En aquest cas, les parcel·les en línia són interactives i es poden ampliar i exportar. En els casos en què hi ha objectius amb compostos bioactius coneguts per a l’espècie, es mostren distintivament a la trama.

Figura 6.

sencer impulsat per la xarxa Priorització de l’objectiu del genoma per a Mycobacterium Ulcerans: els objectius candidats al genoma de M. Ulccesans van ser classificats pel seu NDS (Parcurs de la farmàcia de la xarxa, vegeu el text principal).La trama mostra tots els objectius del genoma (en l’eix X) juntament amb la seva puntuació NDS corresponent (a l’eix Y). Els punts vermells corresponen als objectius de primer nivell superior, amb etiquetes que indiquen el nom i el producte del gen. Visualització de la priorització sencera del genoma des del resum de dades, l’usuari pot accedir a una pàgina de gens fent clic sobre ell en la trama de priorització. Es mostra un exemple de subgraf de la família Emba / Embc Gene (tal com es veu en les seves pàgines de gens corresponents). La figura també mostra zones de confiança, DG1 (vermell): delimitat per un tall zero i de soroll; DG2 (groc): entre el soroll i el tall de tuden; i DG3-5: amb les puntuacions més altes que el tall de tuden.

Figura 6.

Genoma sencer conduït a la xarxa Priorització d’orientació per a Mycobacterium Ulcerans: els objectius candidats al genoma M. Ulcercans van ser classificats pel seu NDS (Parcurs de la farmàcia de la xarxa, vegeu el text principal). La trama mostra tots els objectius del genoma (en l’eix X) juntament amb la seva puntuació NDS corresponent (a l’eix Y). Els punts vermells corresponen als objectius de primer nivell superior, amb etiquetes que indiquen el nom i el producte del gen. Visualització de la priorització sencera del genoma des del resum de dades, l’usuari pot accedir a una pàgina de gens fent clic sobre ell en la trama de priorització. Es mostra un exemple de subgraf de la família Emba / Embc Gene (tal com es veu en les seves pàgines de gens corresponents). La figura també mostra zones de confiança, DG1 (vermell): delimitat per un tall zero i de soroll; DG2 (groc): entre el soroll i el tall de tuden; i DG3-5: amb puntuacions més altes que el tall de tuden.

Aquestes prioritats impulsades per la xarxa poden treballar ambdós sentits. En partir d’un compost d’interès, l’algorisme pot prioritzar els objectius, utilitzant la similitud ponderada dels veïns químics a objectius inicials candidats. I quan a partir de l’objectiu d’interès, pot prioritzar els compostos, utilitzant objectius de veïns connectats i després seguint enllaços ponderats a inhibidors / medicaments candidats. Les puntuacions precomputades per a compostos i per a objectius s’utilitzen internament per TDR6 i es troben al nucli de transformacions de consultes basades en xarxa.

Xarxa de visualitzacions de sub-gràfics i actualització d’interfície d’usuari

La xarxa sub -Graphs per a tots dos compostos i objectius (i les seves respectives puntuacions NDS) es poden navegar des de l’aplicació web mitjançant un medicament o un objectiu com a punt de partida per obtenir consells per a drogues no provades o objectius nous farmacèutics, respectivament. A través de visualitzacions recentment desenvolupades, els usuaris poden consultar els barris de xarxa al voltant de drogues i objectius a les pàgines corresponents. Les llistes d’interaccions posatives derivades de la xarxa també es poden explorar en format tabular sota la “farmacèutica” (per a objectius) i les seccions “conegudes i previstes” (per a medicaments).

Aquestes visualitzacions són impulsades per d3.js (61) Implementació de dissenys forçosos per a visualitzacions sub-gràfiques. Dins del tauler de subgrap de D3, els usuaris poden realitzar cerques de node dins del gràfic (identificadors d’orientació), així com canviar la visibilitat dels objectius en una espècie de manera d’espècies, i personalitzar l’opacitat dels nodes. En conjunt, aquestes noves funcions proporcionen una visualització clara i completa de la competència sub-xarxa d’objectius i compostos, que permet als usuaris manipular els gràfics durant l’exploració de les dades.

La interfície d’usuari (UI) i les eines disponibles Per a la republició de drogues i la priorització d’orientació ha passat per una actualització important. En primer lloc, la IU ha estat redissenyada sota els estàndards W3C per aconseguir una aplicació més sana i escalable. Hem integrat el bootStrap (https://getbootstrap.com/) i jQuery (https://jquery.com) marcs en el desenvolupament i disseny de l’aplicació web TDR6 i al front- Funcionalitat final. Per a consultes d’estructura composta que hem llicenciat i implementat l’aplicació de dibuix química de Marvin JS de Chaxon (https://chemaxon.com/products/marvin-js). Els registres tabulats dins de les pàgines d’orientació i drogues ara utilitzen el connector Jupascript javascript javascript (https://datatables.net) per crear fàcilment paginacions, filtratge i funcionalitats de classificació. Finalment, les representacions de compost 2D ara es generen automàticament mitjançant una implementació del mòdul JavaScript de SmilesDrawer (62).

Disponibilitat comercial de compostos

Un aspecte important en prioritzar compostos per provar al laboratori , és la seva disponibilitat. A TDR6 ara mostrem informació sobre la disponibilitat comercial de compostos. Actualment hem començat aquesta funció enllaçar amb Molport (un mercat en línia químic que fonts de compostos dels principals proveïdors) i mostrar als usuaris una pista visual a les pàgines compostes que donen una indicació ràpida de si el compost està en estoc o es pot fer a la comanda . Com que la disponibilitat comercial de compostos està actualment implementada a TDR6 en forma de consultes asíncrones contra la MOLPORT, en aquest moment aquesta característica només està disponible en mode de navegació (no en consultes).Tanmateix, els usuaris poden prioritzar els compostos utilitzant qualsevol de les estratègies de consulta disponibles a TDR6 i després finalitzar les seleccions compostes mitjançant la inspecció de compostos manualment per a la disponibilitat comercial.

Discussió i instruccions futures

Les noves dades , la interfície i la funcionalitat de TDR6 proporciona als usuaris la millora de la navegació i la visualització d’objectius i compostos.

El model de xarxa actual connecta els objectius mitjançant l’afiliació de les entitats (proteïnes) als conceptes d’anotació (dominis PFAM, grups d’ortòlegs). Aquests s’han seleccionat en funció de la seva àmplia cobertura i facilitat de càlcul. Complementant aquests conceptes amb altres criteris importants per a la validació de l’objectiu de drogues (essencialitat, expressió en etapes de cicle de vida rellevants) es poden fer pels usuaris amb les eines i funcionalitats proporcionades per TDR6, però en el futur es poden construir al model de xarxa subjacent, a Menys per a alguns organismes susceptibles a l’avaluació experimental de tot el genoma.

Es necessiten diverses millores clau per mantenir els objectius tdr pertinents per a la comunitat de científics que treballen en malalties tropicals. La integració de metabòlits naturals i la connexió d’aquestes petites molècules a altres compostos bioactius a través de subestructures compartides o per similitud química serà un enfocament important en el futur. Això permetrà navegar pel gràfic d’objectius de drogues mitjançant els conceptes de reaccions bioquímiques, que també connecten naturalment enzims no ortòlegs a través dels seus substrats / productes compartits i els cofactors.

Finalment, com ja es va esmentar abans (13), Encara hi ha una gran bretxa de curació que cal omplir. Molts compostos bioactius han estat provats per la comunitat d’investigadors que treballen en malalties tropicals descuidades. No obstant això, molts d’aquests assajos i resultats es reporten a les revistes fora de les revistes principals de la química medicinals i, per tant, es perden per grans esforços de curació com el liderat per Chembl (49). La curació i la integració d’aquestes dades que falten (incloses les dades negatives!) Haurien de ser una prioritat per a la comunitat, ja que estalviaria temps i recursos valuosos.

Dades complementàries

Les dades complementàries estan disponibles a Nar Online.

Agraïments

Els autors volen donar les gràcies a Matthew Berriman i Magdalena Zarowiecki (Wellcome Trust Sanger Institute) per compartir l’alliberament de la publicació de Echinococcus de dades i anotació per a la inclusió a TDR Objectius; i Ben Webb i Andrej Sali (Universitat de Califòrnia San Francisco) per al càlcul de models 3D per a genomes de patògens de nivell 1 en objectius TDR. L.U.L., A.B. i s.v. eren o estan recolzats per beques del Consell Nacional de Recerca (Conici, Argentina). A.C. i F.a. són membres de la Carrera de Recerca del Consell Nacional de Recerca (Conici, Argentina). P.m. Voldria reconèixer una beca de la Comissió de Beques Universitàries (UGC), Índia.

Finançament

Glaxosmithkline Argentina i l’Agència Nacional per a la Promoció de la Ciència i la Tecnologia, Argentina (ANPCYT); Projecte de cooperació bilateral indo-argentina (finançament conjunt del Departament de Ciència i Tecnologia de l’Índia (DST) i el Ministeri de Ciència i Tecnologia Argentina (MINCYT). Finançament per a l’accés obert: Fondo para la Investigación Científica i Tecnològica.

Conflicte de declaració d’interès. Cap declara.

notes

Adreça actual: Ariel J Berenstein, Institut Multidisciplinari d’Investigacions en Patologies Pediátricas (IMIPP), Conici-GCBA, Laboratori de Biologia Molecular, Divisió Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

hotez
PJ

,

molyneux
dh

,

fenwick
a.

,

kumaresan

div> j.

,

Sachs
se

,

Sachs
jd

,

savioli
l.
Control de malalties tropicals descuidats

.

n. Engl. J. med.
2007

;

357

:

1018

1027

.

Trouillera
p.

,

Olliaro
p.

,

Torreele
e.

,

orbinski
j.

,

Laing
r.

,

Ford
n.
Desenvolupament de medicaments per a malalties descuidades: un mercat deficient i un públic -La fracàs de la política de la salut

.

Lancet North Am. Ed.
2002

;

359

:

2188

2194

.

hughes
j.

,

rees
s.

,

kalindjian
s.

,

philpott
k.
Principis del descobriment de medicaments anticipats

.

br. J. Farmacol.
2011

;

162

:

1239

1249

.

Adams
cp

,

brantner
vv
Estimar el cost del nou desenvolupament de medicaments: és realment 802 milions de dòlars

.

salut aff. (Millwood)

.

2006

;

25

:

420

428

.

wyatt
pg

,

gilbert
ih

,

lectura
kd

,

fairlamb
ah
validació objectiu : Enllaçar les propietats de destinació i química al perfil de producte desitjat

.

curr. Superior. Med. Chem.
2011

;

11

:

1275

1283

.

farha
ma

,

marró
ed
Repurposació de drogues per a descobriment antimicrobians

.

Nat. Microbiol.
2019

;

4

:

565

577

.

hernandez
hw

,

soeung
m.

,

zorn
km

,

ashoura
n.

,

Mottin
m.

,

andrade
ch

,

cafrey
cr
de siqueira-neto
jl

,

ekins
s.
elevat rendiment i reportiment computacional per a malalties descuidades

.

Pharm. Res.
2018

;

36

:

27

.

woóller
sk

,

submarí Hume
g.

,

chen
x.

,

ali
y.

,

perla
fmg
bioinformàtica en descoberta de medicaments translacionals

.

Biosci. Rep.
2017

;

37

:

doi: 10.1042 / bsr20160180

.

Agüero
f.

,

al -Lazikani
b.

,

aslett
m.

,

berriman
m.

,

buckner
fs

,

campbell
rk

,

carmona
s.

,

carruters
im

,

chan
Awe

,

chen
f .

et al. .

Priorització a escala genòmica dels objectius de drogues: la base de dades de dits TDR

.

Nat. Rev. Discov Discov.
2008

;

7

:

900

907

.

custher
gj

,

shanmugam
d.

,

carmona
sj

,

doyle
ma

,

Hertz-Fowler
c.

,

berriman
m.

,

nwaka
s.

,

Ralph
sa

,

roos
ds

,

Van voorhis
wc

et al. .

Identificació d’objectius atractius de drogues en patògens negligents-malaltia utilitzant un enfocament de silico

.

plos negres. Trop. Dis.
2010

;

4

:

e804

.

lykins
jd

,

filipva
eV

,

halavaty
com

,

minasov
g.

,

Zhou
y.

,

Dubrovska
i.

,

flores
kj

,

Shuvalova
la

,

ruan
j.

,

el bissati
k.

et al. .

CSGID resol les estructures i identifica fenotips per a cinc enzims a Toxoplasma gondii

.

frontal. Cel·la. Infectar. Microbiol.
2018

;

8

:

352

.

shanmugam
d.

,

Ralph
sa

,

carmona
sj

,

custher
gj

,

Roos
ds

,

agüero
f.
cafrey
cr

,

Selzer
PM
Integració i mineria de genomes d’helmini per descobrir i prioritzar nous objectius terapèutics

.

Helminths paràsits: objectius, pantalles, drogues i vacunes

.

2012

;

wiley-blackwell
43

59

.

magariños
mp

,

carmona
sj

,

custher
gj

,

ralph
sa

,

roos
ds

,

shanmugam
d.

,

Van voorhis
wc

,

Agüero
f.
TDR Objectius: Un recurs químic per a malalties descuidades

.

nucleic. Àcids. Res.
2012

;

40

:

D1118

D1127

.

berenstein
AJ

,

magariños
mp

,

chernomoretz
a.

,

agüero
f.
Un enfocament de xarxa multicapa per al reposicionament de fàrmacs de guiatge en malalties descuidades

.

plos negres. Trop. Dis.
2016

;

10

:

e0004300

.

kim
k.

,

weiss
lm
toxoplasma gondii: el model apicomplexe

.

int. J. Parasitol.
2004

;

34

:

423

432

.

sidik
sm

,

huet
d.

,

ganesan
sm

,

huynh
m.-h.

,

wang
t.

,

nasamu
com

,

trenta
P.

,

saeij
jpj

,

carruthers
vb

,

niles
jc

et al. .

Una pantalla Genome-Wide Cristpr a Toxoplasma identifica els gens essencials apicomplexians

.

cel·lular

.

2016

;

166

:

1423

1435

.

gajria
b.

,

bahl
a.

,

brestelli
j.

,

Dommer
j.

,

Fischer
s.

,

GAO
x.

,

heiges
M.

,

iodice
j.

,

kissinger
jc

,

Mackey
AJ

et al. .

Toxodb: un recurs integrat de base de dades Toxoplasma Gondii

.

àcids nucleics res.
2007

;

36

:

d553

D556

.

warrenfeltz
s.

,

basenko
ey

,

Crouch
k.

,

harb
os

,

Kissinger
jc

,

roos
ds

,

shanmugasundram
a.

,

Silva-franquista
f.
kollmar
m
Eupathdb: el recurs de la base de dades de la base de dades de Genòmica eucariòtica

.

Bases de dades genòmiques eucariotes

.

2018

;

1757

:

ny
springer
69

113

.

dirers
ew

,

agarwala
r.

,

bolton
ee

,

bristre
jr

,

Canese
k.

,

Clark
k.

,

Connor
r.

,

fiorini
n.

,

funk
k.

,

hefferon
t.

et al. .

Recursos de base de dades del Centre Nacional d’Informació de Biotecnologia

.

àcids nucleics res.
2019

;

47

:

D23

D28

.

hertz-fowler
c.

,

Peacock
cs
Introducció de Genedb: una base de dades genèrica

.

Trends parasitol.
2002

;

18

:

465

467

.

bolt
bj

,

rodgers
FH

,

shafie
m.

,

kersey
pj

,

Berriman
m.

,

Howe
kl
Ús de wormbase paràsit: una plataforma integrada per explorar les dades genòmiques de helminth

.

Mètodes MOL. BIOL.
2018

;

1757

:

471

491

.

lechat
p.

,

Hummel
l.

,

rousseau
s.

,

moszer
i.
genolista: un entorn integrat per a l’anàlisi comparativa de genomes microbians

.

àcids nucleics res.
2007

;

36

:

D469

d474

.

kapopoulou
a.

,

lew
jm

,

cole
st
El portal mycobrowser: un recurs complet i anotat manualment per a genomes micobacteris

.

tuberculosi

.

2011

;

91

:

8

13

.

camacho
c.

,

coulouris
g.

,

avagyan
v.

,

ma
n.

,

papadopoulos
j.

,

bealer
k.

,

madden
tl
Blast +: Arquitectura i aplicacions

.

bmc bioinformàtica

.

2009

;

10

:

421

.

hancock
jm

,

bisbe
mj
Emboss (la suite de programari de biologia molecular europea)

.

Diccionari de bioinformàtica i biologia computacional

.

2004

;

Chichester
John wiley & sons, ltd
DOB0206

.

krogh
a.

,

Larsson
b.

,

von heijne
g.

,

sonnhammer
el
Predicció topologia de proteïnes transmembrana amb un model MARKOV ocult: aplicació per completar els genomes

.

j. Mol. BIOL.
2001

;

305

:

567

580

.

almagro armenteros
jj

,

tsirigos
kd

,

sønderby
ck

,

petersen
tn

,

WINTHER
o.

,

brunak
s.

,

von heijne
g.

,

nielsen
h.
Signalp 5.0 millora les prediccions del pèptid de senyal mitjançant xarxes neuronals profundes

.

Nat. Biotecnol.
2019

;

37

:

420

423

.

pierleoni
a.

,

Martelli
p.

,

Casadio
r.
predgpi: un predictor GPI-àncora

.

bmc bioinformàtica

.

2008

;

9

:

392

.

moriya
y.

,

itoh
m.

,

Okuda
s.

,

yoshizawa
AC

,

kanehisa
m.
kaas: un servidor de reconstrucció automàtica d’anotació i reconstrucció de ruta

.

àcids nucleics res.
2007

;

35

:

w182

w185

.

chen
f.

,

Mackey
AJ

,

stoeckert
cj

jr,

roos
ds
Orthomcl-DB: Consultar una col·lecció global multi-espècie de grups d’ortòlegs

.

àcids nucleics res.
2006

;

34

:

d363

d368

.

fischer
s.

,

brunk
bp

,

chen
f.

,

GAO
x.

,

HARB
os

,

iodice
jb

,

shanmugam
d.

,

Roos
DS

,

stoeckert
cj

jr

utilitzant orthomcl per assignar proteïnes als grups orthomcl-db o Proteomes de clústers en grups d’ortòlegs nous

.

Curr Protoc bioinforma.
2011

;

doi: 10.1002 / 0471250953.bi0612s35

.

mitchell
al

,

attwood
tk

,

babitt
PC

,

blum
m.

,

Bork
p.

,

pont
a.

,

marró
sd
chang
h.-y.

,

el-gebali
s.

,

fraser

div> Mi

et al. .

Interpro el 2019: millorant la cobertura, la classificació i l’accés a les anotacions de seqüència de proteïnes

.

àcids nucleics res.
2019

;

47

:

d351

d360

.

jones
p.

,

binns
d.

,

chang
h.-y.

,

fraser
m.

,

li
w.

,

mcanulla
c.

,

mcwilliam
H.

,

maslen
j.

,

Mitchell
a.

,

nuka
g.

et al. .

Interproscan 5: Classificació de funcions de proteïna a escala genòmica

.

bioinforma. OXF. Engl.
2014

;

30

:

1236

1240

.

burley
sk

,

berman
hm

,

bhikadiya
c.

,

bi
c.

,

Chen
l.

,

costanzo
ld

,

christie
c.

,

Duarte
jm

,

Dutta
s.

,

feng
z.

et al. .

Banc de dades de proteïnes: l’únic arxiu global per a les dades de l’estructura macromolecular 3D

.

àcids nucleics res.
2019

;

47

:

d520

D528

.

pieper
u.

,

webb
bm

,

dong
gq

,

schneidman-duhovny
d.

,

ventilador
h.

,

kim
sj

,

khuri
n.

,

vessament
yg

,

weinkam
p.

,

hammel
m .

et al. .

Modbase, una base de dades de models d’estructura de proteïna comparativa anotada i recursos associats

.

Acids nucleics res.
2014

;

42

:

d336

d346

.

zhu
l.

,

mok
s.

,

imwong
m.

,

jaidee
a.

,

Russell
b.

,

nosten
f.

,

Dia
np

,

blanc
nj

,

Preiser
pr

,

bozdech
z.
noves idees sobre el transcriptoma de Plasmodium vivax utilitzant RNA-seq

.

sci. Rep.
2016

;

6

:

20498

.

smcich
p.

,

Eastman
g.

,

bispo
s.

,

Duhagon
ma

,

Guerra-Slompo
ep

,

garat
b.

,

goldenberg
s.

,

Munroe
dj

,

dallagiovanna
b.

,

holetz
F.

et al. .

El perfilat ribosoma revela el control de traducció com a mecanisme clau que genera una expressió genètica diferencial en trypanosoma cruzi

.

bmc genomics

.

2015

;

16

:

443

.

lasonder
e.

,

rijpma
sr

,

Van Schaijk
bcl

,

Hoeijmakers
wam

,

Kensche
pr

,

gresnigt
ms

,

italiaander
a.

,

vos
mw

,

woesttenenk
r.

,

bousema
t.

et al. .

Transcripció integrada i anàlisis de proteòmiques de P. Falciparum Gametòcits: comprensió molecular en processos específics de sexe i repressió translacional

.

àcids nucleics res.
2016

;

44

:

6087

6101

.

otto
td

,

wilinski
d.

,

assefa
s.

,

keane
tm

,

Sarry
LR

,

böhme
u.

,

lemieux
j.

,

Barrell
b.

,

dolor
a.

,

berriman
m.

et al. .

Noves idees sobre el transcriptoma de la fase sanguínia de Plasmodium falciparum mitjançant RNA-seq

.

mol. Microbiol.
2010

;

76

:

12

24

.

otto
td

,

böhme
u.

,

jackson
ap

,

caça
m.

,

Franke-Fayard
b.

,

Hoeijmakers
wam

,

religia
AA

,

robertson
l.

,

Sanders
m.

,

ogun
sa

et al. .

Una avaluació integral dels genomes de paràsits de paràsits de malària de rosegadors i expressió gènica

.

bmc biol.
2014

;

12

:

86

.

zanghì
g.

,

vembar
ss

,

baumgarten
s.

,

ding
s.

,

guizetti
j.

,

bryant
jm

,

mattei
d.

,

jensen
ATR

,

rènnia
l.

,

goh
ys

et al. .

Un PFEMP1 específic s’expressa en P. Falciparum Sporozoites i juga un paper en la infecció per hepatocite

.

representant cel·lular
2018

;

22

:

2951

2963

.

fernandes
mc

,

Dillon
LAL

,

Belew
a

,

bravo
hc

,

mosser
dm

,

el-syed
nm
El perfil de transcriptomes dual de Macròfags humans infectats per Leishmania revela diferents signatures de reprogramació

.

mbio

.

2016

;

7

:

e00027-16

.

fritz
hm

,

buchholz
kr

,

chen
x.

,

Durbin-johnson
b.

,

rocke
dm

,

conrad
pa

,

boothotroyd
jc
L’anàlisi transcriptòmica del desenvolupament de Toxoplasma revela moltes funcions i estructures específiques específiques d’esporozoites i oocistes

.

plos un

.

2012

;

7

:

e29998

.

hon
c.-c.

,

weber
c.

,

sismeiro
o.

,

Proux
c.

,

koutero
m.

,

deloger
m.

,

das
S.

,

Agrahari
m.

,

Dillies
M.-a.

,

jagla
b.

et al. .

Quantificació de soroll estocàstic de splicing i poliadenilació en Entamoeba histolytica

.

Acids nucleics res.
2013

;

41

:

1936

1952

.

siegel
tn

,

hekstra
dr

,

wang
x.

,

Dewell
s.

,

creu
gota
anàlisi genòmica de l’abundància de l’ARNm. Dues etapes del cicle de vida del Trypanosoma Brucei i la identificació de llocs de splicing i poliadenilació

.

àcids nucleics res.
2010

;

38

:

4946

4957

.

yeoh
lm

,

bonman
cd

,

MOLLARD
v.

,

mcfadden
gi

,

Ralph
sa
Transcriptomàtica comparativa de gametòcits femenins i masculins a Plasmodium Berghei i l’evolució del sexe en alveola

.

bmc genomics

.

2017

;

18

:

734

.

hehl
ab

,

basso
wu

,

lippuner
c.

,

Ramakrishnan
c.

,

Okoniewski
m.

,

walker
ra

,

grigg
me

,

smith
nc

,

es deplazes
p.
expansió asexual de toxoplasma gondii merozoites és diferent de taquyzoites i implica expressió de famílies de gens no superposades per adjuntar, envair i replicar dins dels enteròcits felins

.

bmc genomics

.

2015

;

16

:

66

.

bushell
e.

,

gomes
ar

,

sanderson
t.

,

anar
b.

,

Noia
g.

,

ramat
c.

,

metcalf
t.

,

modrzynska
k.

,

schwach
f.

,

Martin
Re

et al. .

El perfil funcional d’un genoma de plasmodium revela una gran quantitat de gens essencials

.

cel·lular

.

2017

;

170

:

260

272

.

mendez
d.

,

gaulton
a.

,

bento
ap

,

quambres
j.

,

de veij
m.

,

félix
e.

,

magariños
mp

,

mosquera
jf

,

mutowo
p.

,

Nowotka
m .

et al. .

Chembl: cap a la deposició directa de les dades bioassays

.

àcids nucleics res.
2019

;

47

:

D930

D940

.

peña
i.

,

pilar Manzano
m.

,

canizani
j.

,

kessler
a.

,

Alonso-Padilla
j.

,

bardera
ai

,

Álvarez
e .

,

colmenarejo
g.

,

cotillo
i.

,

roquero
i.

et al. .

nous conjunts de compostos identificats a partir de la projecció de fenotips d’alta rendiment contra tres paràsits de kinetoplastid: un recurs obert

.

sci. Rep.
2015

;

5

:

8771

.

spangenberg
t.

,

Burrows
jn

,

kowalczyk
p.

,

mcdonald
s.

,

Wells
tnc

,

willis
p.
Accés obert Caixa de malària: un catalitzador de descobriment de drogues per a malalties descuidades

.

plos un

.

2013

;

8

:

e62906

.

Haider
n.
patró de funcionalitat Coincidència com a eina de cerca d’estructura / reacció complementària eficient: un enfocament de codi obert

.

Molècules

.

2010

;

15

:

5079

5092

.

cheng
t.

,

zhao
y.

,

li
x.

,

lin
f.

,

xu
y.

,

zhang
x.

,

li
Y.

,

wang
r.

,

lai
l.
càlcul de coeficients de partició d’octanol-aigua Guiar un model additiu amb coneixements

.

j. Quim de química. Inf. Model.
2007

;

47

:

2140

2148

.

o’boyle
nm

,

Banck
m.

,

james
ca

,

morley
c.

,

vandermeersch
t.

,

hutchison
gr
Open babel: una caixa d’eines de química oberta

.

j. Quiminformàtica

.

2011

;

3

:

33

.

heller
sr

,

McNaught
a.

,

pletnev
i.

,

stein
s.

,

tchekhovskoi
d.
Inchi, l’identificador químic internacional IUPAC

.

j. Quiminformàtica

.

2015

;

7

:

23

.

lipinski
ca

,

lombardo
f.

,

Dominy
bw

,

feeney
pj
experimental i enfocaments computacionals per estimar la solubilitat i la permeabilitat en la distribució de drogues i la configuració de desenvolupament

.

adv. Delive Deliv. Rev.
2001

;

46

:

3

26

.

congreu
m.

,

carr
r.

,

murray
c.

,

jhoti
h.
una ‘regla de tres’ per a descobriment de plom basat en fragments

.

Discov de drogues. Avui

.

2003

;

8

:

876

877

.

dalke
a.
Chemfp – Formats i eines d’empremtes digitals ràpides i portàtils

.

j. Quiminformàtica

.

2011

;

3

:

p12

.

rogers
dj

,

Tanimoto
tt
un programa informàtic per classificar les plantes

.

ciència

.

1960

;

132

:

1115

1118

.

youden
wj

Índex

Índex de qualificació Proves de diagnòstic

.

càncer

.

1950

;

3

:

32

35

.

bostock
m.

,

ogievetsky
v.

,

heer
j.
D3 Documents basats en dades

.

IEEE trans. Respecte. Citar. Gràfic.
2011

;

17

:

2301

2309

.

probst
d.

,

reymond
j.-l.
SmilesDrawer: analitzar i dibuixar estructures moleculars codificades per somriures utilitzant JavaScript al costat del client

.

j. Quim de química. Inf. Model.
2018

;

58

:

1

7

.

© l’autor (s) 2019. Publicat per Oxford University Press en nom de la investigació dels àcids nucleics.
Aquest és un article d’accés obert distribuït en virtut dels termes de la llicència de Creative Commons Attribution no comercial (http://creativecommons.org/licenses/by-nc/4.0/), que permet la reutilització, la distribució i la reproducció no comercials En qualsevol mitjà, sempre que el treball original sigui citat correctament. Per a la reutilització comercial, poseu-vos en contacte amb [email protected]

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *