Objectius de TDR 6: Disculpació de drogues de conducció per a patògens humans mitjançant la integració de dades químiques intensives | Investigació dels àcids nucleics

Resum

El volum de dades biològiques, químiques i funcionals dipositades en el domini públic Està creixent ràpidament, gràcies a la seqüenciació de pròxima generació i tecnologies de cribratge altament automatitzades. Aquests conjunts de dades representen recursos valuosos per a la descoberta de medicaments, especialment per a patògens de malalties menys estudiades. Per aprofitar aquests conjunts de dades, es requereix una integració de dades intel·ligent i intensiva per orientar inferències computacionals a diversos organismes. Els objectius TDR Els recursos químics integrien dades genòmiques de patògens humans i organismes model juntament amb la informació sobre compostos bioactius i les seves activitats anotades. Aquest informe posa de manifest les últimes actualitzacions de les dades i funcionalitats disponibles en els objectius de TDR 6. Basat en models de xarxa químics que proporcionen enllaços entre inhibidors i objectius, la base de dades incorpora ara les prioritzacions de destinacions impulsades per la xarxa, i les noves visualitzacions de subgraps de xarxa que mostren productes químics i objectiu – Barris d’imilitud juntament amb els enllaços associats de bioactivitat compostos compostos associats. Les dades disponibles es poden navegar i es poden consultar a través d’una nova interfície d’usuari, que permet als usuaris realitzar prioritzacions d’objectius de proteïnes i inhibidors químics. Com a tal, els objectius TDR ara faciliten la investigació de les drogues que repurposen els objectius de patògens, que poden ajudar a identificar objectius candidats per a compostos bioactius amb objectius prèviament desconeguts. Els objectius TDR estan disponibles a https://tdrtargets.org.

Introducció

Les malalties tropicals descuidades (NTD) afecten desproporcionadament ~1.500 milions de persones en ingressos baixos i desenvolupats Països, on són una causa líder per a anys de vida perduts a la discapacitat i la mort prematura (1). Històricament, la manca de participació de la indústria farmacèutica, en combinació amb una inversió limitada en programes de recerca en salut pública als països afectats, va suposar una deficiència de medicaments disponibles per controlar eficaçment la majoria d’aquestes malalties (2). A més, les drogues que es fan servir actualment per tractar aquestes malalties es veuen compromeses sovint en termes de costos, dificultats en l’administració, l’eficàcia, la resistència a les drogues o els perfils de seguretat.

Drogues Discovery és un procés que requereix el temps i costós (3 , 4). Per a NTD en particular, els programes de descobriment de drogues han de sobreviure al temps suficient a través de l’escassetat de finançament generalitzat per convertir-lo en assajos clínics posteriors (5). En aquest context, un enfocament estratègic per al descobriment de fàrmacs NTD és reposicionament de drogues (6), que pot ajudar a reduir els costos facilitant les aprovacions reguladores en proves primerenques per a medicaments que ja han experimentat investigacions clíniques per a altres malalties i / o indicacions i ha fallat per motius que la seguretat (6). A més, si l’abast de la republició de drogues s’amplia per incloure medicaments i compostos bioactius de la investigació sobre organismes no humans, també pot conduir a la identificació d’almenys noves eines químiques per sondejar la funció d’objectius i camins en patògens humans. Així, mitjançant l’aprofitament les grans quantitats de dades disponibles a partir de programes de recerca ben finançats sobre malalties humanes i organismes model, el paisatge de descobriment de drogues sobre NTD obté un impuls positiu (7).

Les estratègies computacionals són cada vegada més Essencial en descoberta de medicaments translacionals, tant a l’Acadèmia com a la indústria farmacèutica. La integració intel·ligent i intensiva dels volums creixents de dades generades durant totes les fases de Drogues Descobriment ja permet abordar els reptes clau del procés (8). Des de la seva introducció, la base de dades d’objectius TDR ha estat un recurs fiable per als investigadors de les malalties descuidades per accedir a les dades de química per a la priorització de l’objectiu de drogues i la repassar de drogues sobre malalties descuidades. Introduït el 2008 (9), aquest recurs d’accés obert va permetre als investigadors trobar objectius de proteïnes noves i inhibidors químics i prioritzar-los per ajudar el desenvolupament de medicaments per a patògens NTD. Els objectius TDR fan ús de conjunts de dades funcionals de tot el genoma públicament a tot el que permeten als usuaris trobar i prioritzar els objectius basats en els seus coneixements sobre la biologia del seu patogen d’interès i la naturalesa de la malaltia (10,11). Això s’implementa mitjançant una selecció de destinació flexible i basada en l’usuari (utilitzant criteris de filtratge) i el rànquing (utilitzant ponderació específica de criteris) (12,13).

Aquí descrivim les actualitzacions als conjunts de dades subjacents i Funcionalitat en el recurs d’orientacions TDR, acumulat des de la seva publicació anterior el 2012 (13). El nou llançament d’objectius TDR (V6.1, abreujat TDR6 en aquest document) integra informació genòmica específica de patogen amb dades funcionals (p. Ex.Expressió, relacions basades en ortologia, essencialitat) d’una selecció d’organismes, juntament amb les dades de compostos bioactius (estructura química, propietat i informació de la bioactivitat / objectiu); Tot això es pot consultar i navegar a través de l’aplicació web. Totes les consultes es poden desar a un estabitari personal per usuaris registrats i publicats a través de l’aplicació web per maximitzar les oportunitats de col·laboració. Les llistes prioritzades d’objectius es poden exportar per a una altra anàlisi fora de línia. Els detalls complets de totes les funcions noves es poden trobar a les notes de llançament (https://tdrtargets.org / llançaments). Aquest informe presenta un towthrough complet de l’aplicació web, les seves novetats, i exemples per il·lustrar casos d’ús.

Visió general i organització dels objectius TDR

Com en versions anteriors dels objectius TDR, TDR6 també s’organitza en dues seccions principals: objectius i compostos. La secció d’objectius de la base de dades conté dades de tot el genoma per a 20 patògens humans i permet als usuaris executar consultes i priorització d’objectius de proteïnes basats en diverses funcions i dades rellevants per a la descoberta de drogues (vegeu la taula 1). La secció de compostos de la base de dades conté informació sobre > 2 milions de compostos bioactius, i permet consultes basades en les propietats químiques dels compostos i les seves bioactivitats anotades (vegeu la taula 2).

Taula 1.

Consultes d’orientació disponibles en objectius TDR

grup de consulta.	patògens per a les quals hi ha disponibles les dades.	tipus de dades disponibles per consultar.
noms & Anotacions	Tots	Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna	Tots	mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural	Tots	Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica	plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii	Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica	Tots	Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat	C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei	inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu	Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum	Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica	Tot	Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament	tots	assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques	Tots	Objectius de filtre basats en publicacions disponibles

grup de consulta.	patògens per a les quals hi ha disponibles les dades.	tipus de dades disponibles per consultar.
noms & Anotacions	Tots	Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna	Tots	mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural	Tots	Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica	plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii	Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica	Tots	Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat	C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei	inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu	Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum	Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica	Tot	Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament	tots	assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques	Tots	Objectius de filtre basats en publicacions disponibles

taula 1 .

Consultes d’orientació disponibles en objectius TDR

grup de consulta.	patògens per a les quals hi ha disponibles les dades.	tipus de dades disponibles per consultar.
noms & Anotacions	Tots	Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna	Tots	mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural	Tots	Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica	plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii	Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica	Tots	Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat	C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei	inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu	Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum	Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica	Tot	Precedent per a una modulació química reeixida de l’activitat o funció de destinació.Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament	tots	assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques	Tots	Objectius de filtre basats en publicacions disponibles

grup de consulta.	patògens per a les quals hi ha disponibles les dades.	tipus de dades disponibles per consultar.
noms & Anotacions	Tots	Identificadors de gens i anotacions funcionals (números EC, GO Termes, Dominis PFAM, mapes metabòlics mapatges)
Característiques de la proteïna	Tots	mw, punt isoelèctric, presència de pèptids de senyal previst, segments de membrana trans-membrana i ancoratges glicosilfosphatidelinositol (GPI).
Informació estructural	Tots	Disponibilitat d’estructures 3D en PDB; Disponibilitat de models estructurals a Modbase
expressió gènica	plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculosi; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma Gondii	Dades d’expressió gènica de les etapes de cicle de vida patògen i / o condicions experimentals que són rellevants per al descobriment de drogues.
Informació filogenètica	Tots	Objectius de filtre mitjançant “present / absent” simplificat en altres criteris d’espècies, basats en la informació del grup Ortolog . Inclou organismes model (humans) i altres patògens relacionats.
essencialitat	C. Elegans (model per a helminths); E. coli (model per a bacteris); S. Cerevisiae (model per a patògens eucariotes); Trypanosoma Brucei; Mycobacterium tuberculosi; Toxoplasma gondii; Plasmodium Berghei	inferència d’ortologia de l’essencialitat dels gens en les etapes del cicle de vida i / o condicions experimentals rellevants per a la descoberta de drogues. Integrat des de la interrupció del gen genoma seleccionat (E.G. Transposon, Crispr / CAS) i Knockdown (E.G. RNAI) de conjunt de dades en patògens i organismes model.
Dades de validació objectiu	Schistosoma Mansoni; Leishmania Major; Trypanosoma cruzi; Trypanosoma Brucei; Mycobacterium leprae; Mycobacterium tuberculosi; Plasmodium Falciparum	Dades curades manualment a les credencials de validació de destinacions (fenotips genètics, químics i / o farmacològics, observats)
farmacèutica	Tot	Precedent per a una modulació química reeixida de l’activitat o funció de destinació. Es va resumir en una puntuació de farmàcia calculada al model de xarxa (vegeu el text principal)
assagament	tots	assajos bioquímics disponibles per a proteïnes Objectius (mapping basats en números EC)
Referències bibliogràfiques	Tots	Objectius de filtre basats en publicacions disponibles

taula 2 .

Consult disponibles consultes en objectius tdr

grup de consulta.	tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions	noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques	pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta	Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat	Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm)
compostos orfes	cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius	trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació
Cerques basades en estructura
semblança composta	Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta	Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.

Consulta grup.	tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions	noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques	pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta	Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat	Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm)
compostos orfes	cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius	trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació
Cerques basades en estructura
semblança composta	Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta	Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.

Taula 2.

Consultes disponibles consultes en objectius tdr

grup de consulta.	tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions	noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques	pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta	Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat	Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (per exemple, IC50 < 5 μm)
compostos orfes	cerca de compostos que tenen informes de bioactivitat en assajos sencers o cel·lulars, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius	trobar Compostos que tinguin assajos basats en la informació i mecanisme d’orientació
Cerques basades en estructura
semblança composta	Dibuixar / enganxar l’estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta	Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.

Consulta grup.	tipus de dades disponibles per consultar.
Cerques basades en text
Noms & anotacions	noms compostos o sinònims; Identificadors de bases de dades (p. Ex., Chembl, Pubchem); Identificadors de clau INCHI i INCHI
Propietats químiques	pes molecular; Inici de l’octanol / coeficient de partició d’aigua; Nombre de donants i acceptors, nombre de bons flexibles i nombre de ro5 coincidents (Lipinski)
fórmula composta	Cerca per compostos que contenen un número específic ( per exemple 3) d’àtoms definits (per exemple, CL, F, BR, N)
bioactivitat	Cerca de text en descripcions d’assaig; Cerca numèrica de valors en Assaigs (p. Ex.IC50 < 5 μm)
compostos orfes	Cerca de compostos que tenen informes de bioactivitat en l’organisme sencer o assaigs de cèl·lules senceres, però no tenen informació de destinació i mecanisme (orfes inhibidors / medicaments)
compostos amb objectius	Trobeu compostos que tinguin informació sobre la informació i el mecanisme d’orientació Assaigs
Cerques basades en estructura
semblança composta	dibuix / pasta Estructura de compost o fragment 2D i cercar compostos similars. La cerca es basa en la concordança de les empremtes digitals químiques
Substructura composta	Draw / paste compost o fragment estructura 2D i cerca de compostos a la base de dades que conté la consulta Fragment.

noves funcions a TDR Objectius 6

Hem informat recentment un model de xarxa integrador (14) on tots els conjunts de dades a escala de genoma disponibles en objectius TDR (objectius de proteïnes), informació química (compostos bioactius) i les seves relacions (bioactivitat dels compostos) Assaigs basats en l’objectiu) es van vincular en un gràfic multicapa. A TDR6, aquest model de xarxa s’ha actualitzat integrant nous conjunts de dades (descrits a continuació). Aquest model incorpora enllaços entre objectius i compostos bioactius derivats de la curació manual dels assajos de bioactivitat publicats (és a dir, enllaços directes entre objectius i compostos químics), així com de les relacions calculades (enllaços objectiu-blanc i enllaços compostos) basats en les anotacions de proteïnes (Dominis PFAM, grups d’ortòlegs) i similitud química. Un aspecte clau d’aquests enllaços en el model multicapa-xarxa és que permeten l’exploració i la visualització ràpida del barri al voltant dels objectius seleccionats i / o compostos bioactius. Això permet als usuaris explorar compostos vinculats a objectius, inspeccionar el barri de similitud química al voltant de compostos bioactius i visualitzar aquestes dades d’una manera amable i integral (vegeu la figura 1).

figura 1.

Model de xarxa esquemàtica a TDR6 i visualitzacions sub-gràfics: les pàgines compostes o objectiu ara mostren una visualització de subgrafs que conté objectes a la xarxa proximitat de l’entitat seleccionada. Aquests gràfics es construeixen a partir d’un gràfic de xarxa complex de tres capes. Es presenta un esquema d’aquest gràfic a la part superior. Tant els subgrafs de destinació com de compostos sempre es disposen de la manera següent: els nodes compostos (verds) estan connectats a objectius (taronja = patògens grisos = no patògens) a través de les vores de la bioactivitat. Aquests enllaços representen resultats positius (verds), neutres o negatius (gris) o negatius (vermells). Finalment, es dirigeix a un mapa d’afiliacions funcionals (anotacions, nodes blaus). En l’exemple, el gràfic mostra un conjunt d’inhibidors coneguts per a una aciltransferasa humana (15). Aquestes bioactivitats (totes positives) es dibuixen com a enllaços verds entre els compostos (nodes verds) i l’objectiu (nodes grisos per a no patògens, nodes de taronja per patògens). El gràfic ressalta les oportunitats de repugnament per a les aciltransferases de l’helmint (línies traçades, afegides manualment per a aquesta xifra), basades en anotacions compartides amb l’objectiu humà conegut farmacèutic. El node vermell de la capa de drogues indica el compost seleccionat. Les mides del node es determinen pel nombre de connexions a la xarxa (grau), mentre que les amplades d’enllaç de bioactivitat (vores) estan relacionades amb el nombre acumulatiu d’evidències experimentals per a un parell donat de drogues (nombre d’assaigs).

Figura 1.

Model de xarxa esquemàtica en visualitzacions TDR6 i sub-gràfic: les pàgines compostes o objectiu ara mostren una visualització de subgrafs que conté objectes a la pàgina Xarxa proximitat de l’entitat seleccionada. Aquests gràfics es construeixen a partir d’un gràfic de xarxa complex de tres capes. Es presenta un esquema d’aquest gràfic a la part superior. Tant els subgrafs de destinació com de compostos sempre es disposen de la manera següent: els nodes compostos (verds) estan connectats a objectius (taronja = patògens grisos = no patògens) a través de les vores de la bioactivitat. Aquests enllaços representen resultats positius (verds), neutres o negatius (gris) o negatius (vermells). Finalment, es dirigeix a un mapa d’afiliacions funcionals (anotacions, nodes blaus). En l’exemple, el gràfic mostra un conjunt d’inhibidors coneguts per a una aciltransferasa humana (15). Aquestes bioactivitats (totes positives) es dibuixen com a enllaços verds entre els compostos (nodes verds) i l’objectiu (nodes grisos per a no patògens, nodes de taronja per patògens). El gràfic ressalta les oportunitats de repugnament per a les aciltransferases de l’helmint (línies traçades, afegides manualment per a aquesta xifra), basades en anotacions compartides amb l’objectiu humà conegut farmacèutic. El node vermell de la capa de drogues indica el compost seleccionat. Les mides del node es determinen pel nombre de connexions a la xarxa (grau), mentre que les amplades d’enllaç de bioactivitat (vores) estan relacionades amb el nombre acumulatiu d’evidències experimentals per a un parell donat de drogues (nombre d’assaigs).

Amb aquestes actualitzacions, TDR6 ara proporciona als usuaris les següents funcionalitats: (i) Dromen les prioritats de la xarxa, (ii) exploració de la república de drogues; i III) l’exploració dels objectius candidats per a compostos orfes. Aquests casos d’ús són possibles per diverses funcions basades en la xarxa precomputades, com ara una nova puntuació de farmàcia farmacèutica (NDS). En associar una mètrica quantitativa a objectius basats en l’enriquiment de compostos bioactius en nodes de xarxa estretament connectats, aquesta puntuació facilita la classificació dels objectius en grups farmacèutics (DGS), que estan disponibles per als usuaris en consultes de bases de dades.

El El model de xarxa és també la base per a les prioritzacions de la xarxa precomputades (NDPS) que es poden consultar pels usuaris i també s’utilitzen internament per TDR6 per seleccionar objectius i compostos connectats per mostrar a les visualitzacions de xarxa recentment desenvolupades (vegeu més avall). En partir d’un compost d’interès TDR6 utilitza les prioritzacions precunalles d’objectius candidats per ajudar els usuaris a la navegació de l’espai objectiu al voltant del compost (i viceversa en començar des d’un objectiu d’interès). Mitjançant la proporció d’aquestes mètriques i classificacions de l’enriquiment precomputat, la base de dades facilita ara el descobriment de noves associacions de destinacions farmacèutiques. A més d’aquests nous NDPs precompuats, els usuaris poden prioritzar els objectius utilitzant la mateixa funcionalitat que en els objectius TDR anteriors.

Aquesta versió també inclou diverses actualitzacions de dades, és a dir, la inclusió de 22 nous genomes (20 nous patògens i 2 nous) Organismes de models), i extenses actualitzacions de dades químiques i de bioactivitat entre d’altres. La interfície d’usuari millorada i versàtil, juntament amb les actualitzacions de dades renoven el compromís d’objectius TDR per proporcionar una eina integrada i poderosa per explorar dades genòmiques i químiques en el context de malalties tropicals descuidades.

utilitzant objectius tdr 6

Prioritzacions de destinacions senceres

El model de xarxa (14) és la base de la nova puntuació farmacèutica, que és una mètrica derivada de la xarxa relacionada amb l’enriquiment en compostos bioactius per a Objectiu donat (NDS, “Partitura de la farmàcia de la xarxa”). Els NDS estan disponibles per a tots els organismes de nivell 1, que es poden consultar i s’utilitzen per pesar les consultes per filtrar (in o out) els objectius de les canonades de priorització personalitzades per l’usuari. Com s’explica encara més en els detalls d’integració de la xarxa, per a cada organisme, es van classificar els objectius en cinc grups farmacèutics (DG), des de la més baixa (DG1) fins a la màxima puntuació (DG5), segons el seu rendiment a les prioritats de la xarxa.

Com en les versions anteriors dels objectius TDR, els usuaris poden combinar diferents conjunts de dades simplement executant consultes individuals en diferents tipus de dades i combinant-los a la pàgina de la història (9,10,12,13). Això és útil quan, per exemple, els usuaris volen incloure tipus de dades addicionals a prioritzacions basades en farmacèutiques, com ara els que confien en l’expressió gènica en les etapes de cicle de vida pertinents, o aquells que proporcionen informació sobre la condició física / letalitat dels objectius (essencialitat).

Com a exemple, presentem un exemple de priorització utilitzant Toxoplasma Gondii com a patogen d’interès. T. Gondii és un paràsit apicomplexan sovint utilitzat com a model per investigar la biologia subjacent a diverses malalties humanes i animals (15). L’estratègia de cerca es resumeix a la figura 2. La consulta es va iniciar buscant tots els objectius T. Gondii i filtrant aquests objectius amb homòlegs en humans (per seleccionar només objectius específics de paràsits). A continuació, vam seleccionar els gens essencials candidats basats en perfils de fitness durant la infecció de fibroblasts humans (16); i també els gens seleccionats altament expressats en taquyzoites (etapa replicativa de T. Gondii) Consultant per a gens en els 80-100 percentils d’abundància de RNaseq Transcript (17). Aquestes seleccions es van combinar amb les classificacions de la xarxa farmacèutica. Per això vam considerar gens en grups de droguerisme 3, 4 o 5 (DG ≥ 3) (vegeu la figura 2). La figura mostra totes les consultes i els seus resultats vistos a la pàgina d’historial, i les operacions realitzades en combinar consultes (unió, intersecció). La llista final d’objectius classificats basats en aquests criteris s’ha realitzat públicament i està disponible a la secció TDR Objectius de llistes publicades.

Figura 2.

objectiu Estratègia d’exemple de priorització per a T. Gondii. La imatge composta mostra (a) els termes de consulta que s’utilitzen per trobar els objectius de T. Gondii que no tenen homòlegs en humans, que estan molt expressats a la fase tàcyzoita virulenta del paràsit durant la infecció per cèl·lules humanes, que probablement són essencials i són probablement farmacèutiques segons per netejar la puntuació de farmacèutica. (B) Resum de les consultes realitzades a la pàgina “Objectius”, que mostra com aquestes consultes apareixen a la pàgina “Història”, on es poden revisar i transformar. Els botons de gestió de consultes en línia permeten accions seleccionades (eliminar, canviar el nom, exportació) en els conjunts de resultats.(C) Les combinacions de consultes permeten als usuaris executar la unió, es creuen o resten accions en consultes amb i entre si. Es mostren exemples d’accions de la Unió i la Intersecció. (D) Les consultes es poden desar a un estabal privat (els meus conjunts de consultes) des d’on es poden enviar a l’espai de treball (per realitzar operacions de consulta addicionals) o compartides públicament amb altres usuaris d’objectius TDR (els meus conjunts de consulta de destinació publicada).

figura 2.

Estratègia d’exemple de priorització objectiu per a T. gondii. La imatge composta mostra (a) els termes de consulta que s’utilitzen per trobar els objectius de T. Gondii que no tenen homòlegs en humans, que estan molt expressats a la fase tàcyzoita virulenta del paràsit durant la infecció per cèl·lules humanes, que probablement són essencials i són probablement farmacèutiques segons per netejar la puntuació de farmacèutica. (B) Resum de les consultes realitzades a la pàgina “Objectius”, que mostra com aquestes consultes apareixen a la pàgina “Història”, on es poden revisar i transformar. Els botons de gestió de consultes en línia permeten accions seleccionades (eliminar, canviar el nom, exportació) en els conjunts de resultats. (C) Les combinacions de consultes permeten als usuaris executar la unió, es creuen o resten accions en consultes amb i entre si. Es mostren exemples d’accions de la Unió i la Intersecció. . / p>

estratègies de reputuració de medicaments mitjançant transformacions de consulta

La consulta farmacèutica a TDR6 permet als usuaris seleccionar objectius amb inhibidors / medicaments previstos o previstos. La informació sobre objectius amb fàrmacs coneguts provenen de la curació de literatura, mentre que les associacions preditades (indirectes) d’objectius amb inhibidors / medicaments s’obtenen a través de càlculs de similitud de seqüència o ortologia (a objectius farmacèutics coneguts), o mitjançant inferències compatibles amb la xarxa (14). Tots aquests mètodes s’implementen a TDR6. Per tant, quan els usuaris filtren un conjunt de gens basats en la farmacèutica, limiten la selecció a objectius altament classificats, que haurien de proporcionar una font rica de les oportunitats de republiment de drogues.

Per mostrar la utilitat de TDR6 en aquesta àrea, mostrem Com buscar medicaments candidats per a republicar per a Echinococcus multilocularis (l’agent causal de l’equinococcosi alveolar). Això es mostra a la figura 3. El procés és similar al que es descriu anteriorment per a T. Gondii, però en aquesta estratègia de consulta no vam descartar homòlegs humans, i han utilitzat els conjunts de dades de letalitat C. Elegans RNAi com a proxy per a la essencialitat de nematode. Com a resultat, vam obtenir una priorització sencera del genoma per a E. Multilocularis. A continuació, aplicant un filtre basat en farmacèutic a aquesta consulta, hem reduït la selecció gènica a un grapat de gens. L’usuari pot inspeccionar manualment els objectius seleccionats per esbrinar quins medicaments es van enumerar a través d’associacions indirectes. Les pàgines d’orientació mostraran tots els compostos associats a la secció de farmacèutica, classificats segons la font de la inferència. Per a inferències impulsades per xarxa, la puntuació per a cada compost proposat apareixerà tant com a llista com a parcel·la de rang, per identificar ràpidament els candidats prometedors. Alternativament, per minimitzar la inspecció manual, la llista de gens (és a dir, la mateixa consulta) es pot convertir fàcilment en una llista de medicaments associats fent clic a “Convertir aquests botons d’aquesta consulta” a la part superior de les pàgines de resultats de consulta. Aquesta funcionalitat proporciona una forma ràpida de començar a crear una biblioteca de projecció per a un conjunt d’objectius. Les transformacions de la consulta es poden basar en els medicaments curats (coneguts per a un establiment d’objectius), previstes (associacions computades a medicaments) o ambdues. En els tres enfocaments, els inhibidors / medicaments associats amb objectius coneguts farmacèutics estan associats de manera transitòria als gens de la llista. Figura 3 Resumeix l’estratègia de priorització, la conversió de consultes de la llista de gens als compostos, i un exemple de la visualització del sub-gràfic disponible a la pàgina composta d’un èxit de republicació. Actualment, aquestes conversions s’executen en el fons i els resultats apareixen a la secció Història del lloc web quan es fa (els usuaris també estan alerts per correu electrònic).

figura 3.

P> Repurposant les drogues per a E. Multilocularis mitjançant transformacions de consultes. Un esquema de priorització d’orientació per a Echinococcus multiloculars que depenen de la inferència d’ortologia i de la drogositat prevista (DG ≥ 3). (A) consultes combinades; (B) Llista inicial d’objectius prioritzats. (C) Qualsevol llista d’orientació es pot “transformar” en una llista dels seus medicaments associats, utilitzant qualsevol dels mètodes d’enllaços de compostos disponibles (vegeu el text principal). (D) Llista resultant de compostos bioactius. (E) Exemple de visualització de sub-gràfics de xarxa d’un compost seleccionat, que mostra enllaços de bioactivitat actius i inactius. Els compostos (nodes verds) estan connectats a objectius patògens (taronja) segons els registres de bioactivitat (verd = actiu; vermell = inactiu, vegeu el text principal per a llindars d’activitat).Els objectius, al seu torn, estan connectats (enllaços grisos) a les afiliacions funcionals (nodes blaus). La prestació de sub-grafs proporciona consells visuals sobre com es connecta l’objectiu inicial de l’E. Multilocularis amb el compost seleccionat a la xarxa.

figura 3.

Repurposant de drogues per E. Multilocularis mitjançant transformacions de consultes. Un esquema de priorització d’orientació per a Echinococcus multiloculars que depenen de la inferència d’ortologia i de la drogositat prevista (DG ≥ 3). (A) consultes combinades; (B) Llista inicial d’objectius prioritzats. (C) Qualsevol llista d’orientació es pot “transformar” en una llista dels seus medicaments associats, utilitzant qualsevol dels mètodes d’enllaços de compostos disponibles (vegeu el text principal). (D) Llista resultant de compostos bioactius. (E) Exemple de visualització de sub-gràfics de xarxa d’un compost seleccionat, que mostra enllaços de bioactivitat actius i inactius. Els compostos (nodes verds) estan connectats a objectius patògens (taronja) segons els registres de bioactivitat (verd = actiu; vermell = inactiu, vegeu el text principal per a llindars d’activitat). Els objectius, al seu torn, estan connectats (enllaços grisos) a les afiliacions funcionals (nodes blaus). La representació del sub-gràfic proporciona consells visuals sobre com es connecta l’objectiu inicial de l’E. Multilocularis amb el compost seleccionat a la xarxa.

Exploració de compostos orfes

p> Les activitats de compostos extrets de la literatura per curació apareixen en forma d’assaigs basats en l’objectiu (enllaç directe a l’objectiu) o en forma d’assaigs basats en cèl·lules o organisme sencer. En absència d’una altra informació, aquestes últimes classes d’assaigs no proporcionen pistes sobre l’objectiu o el mecanisme d’acció dels compostos. Durant el procés d’actualitzacions de dades químiques a TDR6, vam identificar compostos amb efectes fenotípics reportats sobre l’organisme sencer o els assajos basats en cèl·lules, basades en les seves classificacions de Chembl. Aquesta informació es va utilitzar per identificar compostos “orfes” que estan actius contra un patogen particular en les projeccions primàries o secundàries basades en cel·les, però per a les quals no hi ha assaig basat en l’objectiu.

Compostos orfes a TDR6 poden ser Cercat per a qualsevol espècie amb dades de detecció fenotípica disponible, dins de la pàgina de cerca de compostos. Això permet una forma ràpida d’aprofitar les dades d’assaigs d’alt rendiment, permetent als usuaris iniciar les seves prioritzacions de compostos amb activitat coneguda contra un patogen d’interès.

El model de xarxa integrat a TDR6 també és útil per identificar el candidat Objectius per a compostos orfes. Com es descriu a la publicació original (14), el barri de similitud química calculada al voltant d’un compost orfe seleccionat pot proporcionar enllaços indirectes a un o més objectius. Mitjançant aquesta estratègia hem realitzat prioritzacions d’orientació per a tots els compostos orfes de TDR6. Aquestes prioritzacions de compostos impulsades per la xarxa precomputades estan disponibles per a tots els organismes per als quals hi ha disponibles dades de detecció de fenotípic. Resums globals que mostren tots els compostos orfes d’aquests organismes estan vinculats a la pàgina “Resum de dades” (vegeu https://tdrtargets.org / DataSummary, i feu clic a l’espècie d’interès). Un exemple de priorització basada en compostos orfes per a T. Cruzi es mostra a la figura 4. Mentre que les prioritzacions a partir d’un sol compost estan disponibles a cada pàgina composta.

figura 4.

Exploració d’objectius candidats per a compostos orfes de trypanosoma Cruzi. La trama resumeix la priorització d’orientació impulsada per la xarxa per a compostos orfes actius contra T. Cruzi. Totes les seqüències de codificació de proteïnes en el genoma de T. Cruzi (objectius candidats) estan disposats a l’eix X. Els punts de dades de la parcel·la corresponen a associacions de medicaments destinataris anotats per l’algorisme (puntuació traçat a l’eix Y). Com a exemple, vam destacar dos objectius posatius per a dos medicaments diferents (tal com es mostra a la pàgina Resum de dades T. Cruzi). Parcel·les similars estan disponibles en línia per a organismes de nivell 1 a TDR6 (enllaçat a partir de la pàgina Resum de dades).

figura 4.

Exploració d’objectius candidats per a compostos orfes de tripanosoma Cruzi. La trama resumeix la priorització d’orientació impulsada per la xarxa per a compostos orfes actius contra T. Cruzi. Totes les seqüències de codificació de proteïnes en el genoma de T. Cruzi (objectius candidats) estan disposats a l’eix X. Els punts de dades de la parcel·la corresponen a associacions de medicaments destinataris anotats per l’algorisme (puntuació traçat a l’eix Y). Com a exemple, vam destacar dos objectius posatius per a dos medicaments diferents (tal com es mostra a la pàgina Resum de dades T. Cruzi). Les parcel·les similars estan disponibles en línia per a organismes de nivell 1 a TDR6 (enllaçat des de la pàgina Resum de dades).

Actualitzacions de funcionalitats i dades

noves dades genòmiques a Objectius TDR v6.1

Des de la publicació anterior de la base de dades de dits TDR (13), s’han afegit diversos genomes de patogen. Es proporciona una llista detallada a la taula 3, així com en línia a la pàgina de resum de dades TDR6 (https://tdrtargets.org / DataSummary).

taula 3 .

Resum de disponibilitat de dades per a patògens de nivell superior. Resum de les dades d’orientació disponibles per a organismes de nivell 1 en objectius TDR. CD: seqüències de codificació; PFAM: nombre de proteïnes amb domini pfam mapat; Aneu: Nombre de proteïnes amb termes d’ontologia de gens mapats; CE: nombre de proteïnes amb números de la Comissió d’Enzims mapats (CE); Camins: nombre de proteïnes mapes a mapes de camins de Kegg; Ortòlegs: nombre de seqüències mapades a grups d’ortòlegs orthomcl. Una taula de resum de dades més completa està disponible en línia a https://tdrtargets.org / DataSummary

espècies.	CDs.	pfam.	go.	ec.	cames.	orthologs.
plasmodium falciparum	5349		3322	3551	750	1083	5166
Plasmodium vivax	5344	3264	2631	641	806	5207
toxoplasma gondii	7946	4025	3795	772	967	6764
chlamydia trachomatis	887	704	598	269	357	645
mycobacterium leprae	1630	1236	929	628	611	1473
mycobacterium tuberculosi	4004	2934	2001	1174	1145	3287
mycobacterium ulcerans	4232	3602	2578	873	1002	3459
Trep Onema Pallidum	1036	791	634	221	335	733
wolbachia endosimbiont de b. malai	805	628	577	308	382	688
Brugia malayi	11316	7042	6368	1278	1787	8424
Echinococcus granulosus	10249	6481	5432	854	1965	7109
Echinococcus multilocularis	10474	6817	5768	878	2079	7539
loa loa (cuc d’ulls)	16292	8071	6774	1539	2207	10484
onchocerca volvulus	12224	3248	2178	246	563	4054
esquistosoma mansoni	12692	7818	7384	1218	1649	10386
leishmania major	8280	4641	4415	1067	1162	8250
Trypanosoma brucei	10270	5665	5482	1019	1264	9259
trypanosoma cruzi	18639	9908	8572	1495		1735	18140
Entamoeba histolytica	8211	4920	4087	645	1094	7692
giardia lambia	9665	2726	2263	326	514	5977
trichomonas vaginalis	95600	35474	18435	843	1366	87303

5432

Entamoeba histolytica

espècies.	cds.	pfam.	go.	ec.	cames.	orthologs.
plasmodium falciparum	5349		3322	3551	750	1083	5166
Plasmodium vivax	5344	3264	2631	641	806	5207
toxoplasma gondii	7946	4025	3795	772	967	6764
chlamydia trachomatis	887	704	598	269	357	645
mycobacterium leprae	1630	1236	929	628	611	1473
mycobacterium tuberculosi	4004	2934	2001	1174	1145	3287
mycobacterium ulcerans	4232	3602	2578	873	1002	3459
Trep Onema Pallidum	1036	791	634	221	335	733
wolbachia endosimbiont de B.malayi	805	628	577	308	382	688
Brugia malayi 11316	7042	6368	1278	1787	8424
Echinococcus granulosus 10249	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	5768	878	2079	7539
Lloa Lloa (cuc ull) 16292	8071	6774	1539 2207 10484
Onchocerca volvulus 12224	3248	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania major	8280	4641	4415	1067	1162	8250
Trypanosoma brucei 10270	5665	5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia lamblia	9665	2726	2263	326	514	5977
Trichomonas vaginalis 95600 35474 18435	843	1366 87.303

Taula 3.

Resum de dades de disponibilitat per als millors agents patògens de nivell. Resum de les dades de destinació disponibles per al Nivell 1 organismes en Targets TDX. CDs: seqüències de codificació; PFAM: nombre de proteïnes amb domini de PFAM assignada (s); GO: nombre de proteïnes amb termes de ontologia de gens assignades; CE: nombre de proteïnes amb els números de la Comissió d’Enzims (CE) assignades; Pathways: nombre de proteïnes correlacionats amb mapes KEGG via; Orthologs: nombre de seqüències assignades a grups OrthoMCL ortólogo. Una taula de dades resum més complet està disponible en línia a https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071

Entamoeba histolytica

3c34827 “ iv id =” 0b01674e “”.

v id = “29971a56991”

5344

2631

887 87 04 04 04 04

mycobaacterium 6678 678 678 678 678

5432

Entamoeba histolytica

Espècies.	CD.	PFAM.	GO.	CE.	Camins.	Orthologs.
Plasmodium falciparum	5349	3322	3551	750	1083	5166
5344	3264	2631	641	806	5207
Toxoplasma gondii	7946	4025	3795	772	967	6764
Chlamydia trachomatis	887	704	598	269	357	645
Mycobacterium leprae 1630	1236	929	628	611	1473
Mycobacterium tuberculosi	4004	2934	2001	1174	1145	3287
Mycobacterium ulcerans	4232	3602	2578	873	1002	3459
Trep ONEMA pallidum	1036	791	634	221	335	733
Wolbachia endosymbiont de B.Malai	588	588	388
Brugia Malai 11316	7042	6368	1278	1787	6481	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	779	758
Loa Loa (cuc d’ulls)	1509 071	1559 071	1539 071	679 071	15371	1539 071	1539 071	1559 071	2207	10484	2378	2178	246	563	4054
esquistosoma mansoni 12692	7818	7384	1218	1649 10386
leishmania major	8280	4641	4415	1067	1162	8250			5480 5482	1019	1264	9259
trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
giardia lambia	2263	2263	2735 363	272	3635 363	2235 363	514	5977
trichomonas vaginalis 95600 35474	18435	843	CDs.	pfam.	go.	ec.	patins.	ortoogs.
lasmoodium	3322 551						7166	plasmox vivax	641	606 06 06 06 06 5207
toxoplasma gondii	7946	4025	3795	772		967 6764	598	269	tepne	mycobacterium	1630	1236 p2 673	673
mycobaacterium tdulesis pàgina	1174	1174	1174	1174	3287	873	1002	3459
Trep Onema Pallven 1036	61 33 33 33 33 33 33	633
WOLBIA INDUSSIABIANT DE Bmalayi	805	628	577	308	382	688
Brugia malayi 11316	7042	6368	1278	1787	8424
Echinococcus granulosus 10249	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	5768	878	2079	7539
Lloa Lloa (cuc ull) 16292	8071	6774	1539 2207 10484
Onchocerca volvulus 12224	3248	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania major	8280	4641	4415	1067	1162	8250
Trypanosoma brucei 10270	5665	5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia lamblia	9665	2726	2263	326	514	5977
Trichomonas vaginalis 95600 35474 18435	843	1366 87.303

Atesa la diversitat d’organismes integrat en objectius TDX i, en conseqüència, la varietat de fonts de dades necessària per a cobrir tota la genomes; esforç substancial s’ha posat en l’estandardització de les dades d’anàlisi i recuperació d’informació a partir de l’genoma d’aquests organismes. La majoria dels genomes complets EupathDB es van obtenir a partir de (18), GenBank (19), GeneDB (20), Wormbase paràsit (21), GenoList (22) o Mycobrowser (23). Una descripció completa de les fonts de l’genoma i donat en anterior quadre complementari S1. Per actualitzar les dades dels organismes presents en la versió anterior dels objectius de TDX de codificació de proteïnes dels gens de la versió actual dels genomes o bé s’assignen als gens existents a TDX Targets, o en cas contrari entrar els nous registres. El mapatge algoritme utilitza una combinació de condicions per a realitzar un seguiment identificadors de gens a través de publicacions i mantenir la identitat de gens: les sumes de comprovació de seqüència coincident (mitjançant valors de 128 bits Hash generats pel MD5 algoritme), Gene noms o identificadors i BLAST (24) IF o coincidències perfectes es troben. Després d’actualitzar els registres, el Pipeline calcula les propietats fisicoquímiques utilitzant Pepstats (25), exploracions per a dominis transmembrana amb TMHMM (26), pèptids de senyal amb SignalP (27), i glicosilfosfatidilinositol Els punts d’ancoratge, utilitzant PredGPI (28). L’algoritme rebutja totes les seqüències no codificants, el més aviat qualsevol pseudogens, per tal de no confondre les anotacions i minimitzar les falses suposicions durant els fluxos de treball de priorització. La major part de TDR6, esmentat anteriorment totes les tasques per a la integració i actualització genoma s’han embolicat en el flux de treball automatitzat per facilitar el ràpid actualitzacions en futures versions. Un esquema de l’actualització i Pipeline algoritme mostrat en l’anterior Figura complementari S1. L’oleoducte també automatitza el càlcul d’anotacions usant estratègies individuals ad hoc per a diferents anotacions, confiant en els serveis web i APIs (aparegut en el Kaas (29) Servei de proteïnes de mapatge a vies metabòliques i a el gran nombre de classificació CE, d’enzims, o el OrthoMCL base de dades i eina (30,31) per als grups de mapeig ortholog a les proteïnes. el Pipeline també es basa en el càlcul contra bases de dades instal·lades localment van aparèixer més iNTERPRO (32), utilitzant InterProScan (33) per identificar dominis de proteïnes (PFAM) i el mapa de termes als vocabularis controlats i les classificacions (GO). els recursos addicionals van aparèixer més 3D estructures i models estructurals van ser recuperats de la Protein Data Bank (34) usant serveis web i descarregar-se de el lloc MODBASE FTP (35), respectivament.

també el nombre de conjunts de dades funcionals clau es van integrar en aquesta versió, incloent (i) els conjunts de dades transcriptomic que proporcionen proves de l’expressió gènica en etapes de el cicle de vida o condicions experimentals que són rellevant per descobriment de fàrmacs (36-47) i (ii) essencialitat conjunts de dades deriven de dues patògens Apicomplexan (P. berghei i T. gondii) (16,48), que proporcionen informació a Estratègies vitals ASSIST priorització.

Actualitzacions de les dades químiques

Per als compostos bioactius també, els fluxos de treball d’actualització de dades s’han automatitzat per a aquesta versió.La majoria dels compostos bioactius es van recuperar de Chembl 24th Allow (49), que conté alguns conjunts de dades addicionals, com ara les de caixes químiques específiques de patogen: caixes GSK Kinetoplastid (50), caixa de patogen MMV (51). El procés d’integració comença a partir de les descripcions de molècules (2D) en format SDF, des del qual calculem totes les empremtes dactilars compostes necessàries (necessàries per a cerques de similitud de compostos / subestructures) mitjançant Checkmol (52). El gasoducte també calcula propietats químiques addicionals, com ara el coeficient de partició d’octanol / aigua de logple i altres descriptors estructurals que utilitzen XLOGP3 (53) i les eines Open Babel Obprop i Obrotamer (54). Es van obtenir o calcular altres dades rellevants directament des de l’estructura composta, com ara els identificadors INCHI i INCHIKEY (55) per al seguiment de compostos; i altres regles normals de polze utilitzades en la química medicinals i la descoberta de drogues, com la regla de Lipinski de cinc (56) i la regla relacionada de tres (57).

Després d’integració en objectius TDR, tots els compostos eren subjectes a tots els vs Càlcul de comparació de similituds químics mitjançant Chemfp (58) que produeix mesures de similitud de parell basades en l’índex / distància de Tanimoto (59). A més, hem calculat un mapa global (tots versus tots) de les relacions de subestructures entre compostos a la base de dades (X és una subestructura de Y; Y és una superestructura de X). Sabent que el problema de trobar els subgrafs més comuns entre molècules és computacionalment dur, vam aplicar un enfocament heurístic per trobar subestructures. L’algorisme primer obté un subconjunt de possibles molècules candidatures fent ús de les empremtes digitals calculades anteriorment. Els candidats han d’haver coincidint amb les empremtes dactilars amb la molècula de l’assignatura. Una vegada que s’obté una llista de candidats, la determinació de subestructures d’àtoms plena-by-àtom es fa mitjançant matchmol (52). Les dades disponibles per a compostos i les consultes que es poden executar en cada tipus de dades es resumeixen a la taula 2. El pes molecular (MW) i la distribució de superfície polar (PSA) per a tots els compostos de la base de dades es mostra a la figura complementària S2.

Curació i integració de dades de bioactivitat

Com amb compostos químics, la majoria de bioactivitats integrades en objectius TDR provenen directament de les fonts de dades ascendents (per exemple, Chembl). En integrar les dades de la bioactivitat, es va conservar tant l’anotació de l’assaig (per exemple, ‘assaig de reducció de la motilitat in vitro contra Brugia Malayi microfilariae a 10 μm’) i el valor numèric i unitats associades a activitats compostes (per exemple, ‘80% inhibició ‘,’ 1,5 μM IC50 ‘, ’10 Nm Mic’), que són tots els camps de cerca. A més, i per facilitar les consultes d’usuaris, les bioactivitats reportades es van utilitzar per agrupar els compostos assajos a les classes “actives” o “inactives”. No obstant això, per minimitzar l’efecte d’utilitzar fronteres dures al voltant dels llindars arbitraris i augmentar la separació entre classificacions actives / inactives, també definim una zona grisa indeterminada. Per tant, els compostos que anoten just per sota d’un llindar arbitrari no es consideren inactius per a la consulta i la visualització.

No tots els tipus d’activitat van ser susceptibles a la classificació, però. Malgrat els esforços en la normalització d’aquestes dades d’activitat, la interpretació de les activitats de compostos a aquesta escala és difícil, ja que sovint depenen del tipus d’assaig particular, les unitats reportades, i les condicions particulars en què es va dur a terme cada assaig. No obstant això, un conjunt significatiu de tipus d’assaig es podria classificar automàticament en categories actives / indeterminades / inactives basades en llindars d’activitat. Per a això, tots els tipus d’assaig amb > 100.000 informes (vegeu la figura complementària S3 per a una activitat per tipus d’assaig / per parcel·la de distribució composta) es van considerar per a l’auditoria d’activitat, encara que només es troben assajos de concentració basats (com ara IC50, KI o la potència) es van trobar prou robustes per a aquesta determinació, ja que els assajos basats en percentatge (com ara% activitat,% de l’activitat residual o la inhibició $) eren ambigus en informes de bioactivitat. Els llindars que s’utilitzen per classificar les activitats de cada tipus d’assaig es poden trobar a la taula 4, i la distribució de compostos en aquestes classes d’activitat es resumeix a la figura 5.

Taula 4. Div>

Tipus d’assaig i llindars d’activitat utilitzats per a la determinació de l’etiqueta d’activitat: només es van utilitzar assaigs basats en la concentració per determinar les etiquetes d’activitat. Es van considerar que les activitats que es presenten menys del valor admesos màxim per als positius (+) es consideraven interaccions actives (+), mentre que les més grans que el “valor mínim admès per a negatius” es consideraven inactius (-). Qualsevol activitat que es va informar entre aquests dos valors es va considerar com a indeterminat (0)

tipus d’assaig.	unitat estàndard.	Valor màxim admès per a actius.	un valor mínim admès per inactives.
AC50	nm	20000	100000
ec50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potència	nm	20000	100000

assaig tipus.	unitat estàndard.	Valor màxim admès per a actius.	un valor mínim admès per inactives.
AC50	nm	20000	100000
ec50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potència	nm	20000	100000

Taula 4.

tipus d’assaig.	unitat estàndard.	Valor màxim admès per a actius.	un valor mínim admès per inactives.
AC50	nm	20000	100000
ec50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potència	nm	20000	100000

assaig tipus.	unitat estàndard.	Valor màxim admès per a actius.	un valor mínim admès per inactives.
AC50	nm	20000	100000
ec50	nm	20000	100000
ic50	nm	20000	100000
ic50	ug ml-1	15	50
kd	nm	20000	100000
ki	nm	20000	100000
potència	nm	20000	100000

Figura 5.

Etiquetes d’activitat Distribució i proves Mescles entre les dades: (a) Diagrama de Venn que mostra la distribució de valors de bioactivitat en les classes actives, inactives i indeterminades a TDR6 (vegeu el text principal per obtenir més informació) . Les interseccions compten casos en què el mateix medicament té diferents resultats d’activitat contra el mateix objectiu. Exemples d’aquests casos es proporcionen als panells B a través de F (IDs compostos representen els identificadors TDR6). (B) Activitat de C329137 (una hidroxi-benzamidina) contra P. falciparum bifuncional dihidrofolat reductasa-thymidylate sinthasa. (C) Exemple de registres positius per a inhibidors d’aciltransferasa humana. (D) Exemple d’activitats negatives i neutres per a compostos triphenylelarbinol i benzohidrol, respectivament. Finalment, les proves positives (E) i negatives (F) es poden barrejar amb proves indeterminades, com es mostra per a C2164865 provat contra el cavall Cholinesterasa i C306882 Provat contra P. Recombinant Falciparum deoxiurididina 5′-trifosfat hidrolasa de nucleòtids, respectivament.

Figura 5.

Etiquetes d’activitat Distribució i proves Mescles entre dades: (a) Venn diagrama que mostra la distribució de valors de bioactivitat en l’actiu , classes inactives i indeterminades a TDR6 (vegeu el text principal per obtenir més informació).Les interseccions compten casos en què el mateix medicament té diferents resultats d’activitat contra el mateix objectiu. Exemples d’aquests casos es proporcionen als panells B a través de F (IDs compostos representen els identificadors TDR6). (B) Activitat de C329137 (una hidroxi-benzamidina) contra P. falciparum bifuncional dihidrofolat reductasa-thymidylate sinthasa. (C) Exemple de registres positius per a inhibidors d’aciltransferasa humana. (D) Exemple d’activitats negatives i neutres per a compostos triphenylelarbinol i benzohidrol, respectivament. Finalment, les proves positives (E) i negatives (F) es poden barrejar amb proves indeterminades, com es mostra per a C2164865 provat contra el cavall Cholinesterasa i C306882 Provat contra P. Recombinant Falciparum deoxiurididina 5′-trifosfat hidrolasa de nucleòtids, respectivament.

El tret de l’alliberament de Chembl 24 compta amb més de 15,2 milions de bioactivitats reportades, de les quals només uns 6 milions corresponen a relacions que impliquen medicaments i objectius de proteïnes (ja sigui proteïnes úniques, famílies de proteïnes i complexos de proteïnes, amb ~ 93% sent proteïnes individuals). Altres bioactivitats restants de la base de dades eren informes per a una gran varietat d’objectius no proteïnes, com ara les cèl·lules senceres (3,6 m), els organismes sencers (2,2 m), els teixits (83k) i les macromolècules no pèptídiques (85K) o Molècules petites (< 100). Aquests no s’utilitzaven en la construcció de xarxes, ja que la xarxa és de proteïna (I.E. objectiu) Centric. La figura 5 també mostra una mica de visualitzacions de xarxa que representen com TDR6 mostra aquestes bioactivitats.

Integració de característiques derivades de la xarxa: farmacèutica i prioritzacions

Com es va esmentar anteriorment, les dades genòmiques, les anotacions genòmiques, Els compostos químics i les interaccions de medicaments generals es van integrar en una xarxa complexa orientada a republir les drogues, tal com es descriu a Berenstein et al. (14). La xarxa es va utilitzar per calcular una partitura de farmàcia de xarxa (NDS), per a tots els objectius en patògens prioritaris (Tier 1). El NDS està relacionat amb la possibilitat de trobar compostos bioactius a la proximitat del gràfic de xarxa d’un objectiu donat (el rang és de 0 a 1). L’algorisme ha estat descrit anteriorment en detall (14), però breument, basat en una prova de sobre-representació de les proteïnes farmacèutiques conegudes anotades, calcula una puntuació de rellevància (RS) per a cada grup de domini PFAM i categories del grup ortològic de la xarxa. La puntuació NDS per a un objectiu donat resultats d’una suma acumulada ponderada sobre els RS de totes les contribucions d’afiliació comunes al node de destinació, i proteïnes veïnes vinculades a compostos actius.

Per facilitar la interpretació de les puntuacions NDS Hem realitzat un Avaluació estadística per identificar diferents grups farmacèutics (DG) basats en dos tipus de llindars que ajuden a classificar les prediccions farmacèutiques en zones de confiança. Aquests s’il·lustren a la figura 6. D’una banda, mentre que tots els objectius de puntuació no zero tenen algun grau de connectivitat a objectius coneguts farmacèutics, un ND baix suggereix que aquestes connexions no són rellevants per a l’avaluació farmacèutica. Per tant, es considera que es considera un tall de soroll (una línia de base calculada com 5 vegades el valor de 0,25 percentil a partir de la distribució completa de NDS) identificar objectius de baixa puntuació. El segon llindar es deriva de l’índex màxim de Younden (60), que es calcula com a puntuació en què tant l’especificitat com la sensibilitat són òptimes (la millor sensibilitat sense comprometre l’especificitat i viceversa). Aquest valor només es pot calcular per patògens amb veritables positius (objectius coneguts farmacèutics). Un mínim arbitrari de 10 veritables positius es va considerar suficient per a la determinació de tall. Per a altres patògens que no tinguessin aquesta informació, es va utilitzar un tall global que es va utilitzar (calculat utilitzant tots els veritables positius a la xarxa). Els grups farmacèutics corresponents són, per tant, DG1 per a objectius amb valors NDS que van des de 0 fins al llindar de soroll; DG2 per a objectius amb valors NDS que van des del llindar de soroll fins al tall de Youden; i DGS 3, 4 i 5 amb valors NDS que són de 1-, de 10 i 100 vegades per sobre de la retallada de Youden. En conseqüència, aquests últims grups fan dels objectius més afectats farmacèutics. La figura 6 mostra un exemple estàtic d’una priorització impulsada per la xarxa per a Mycobacterium Ulcerans (que no té objectius amb compostos coneguts en el llançament actual). Totes les prioritzacions dels orientacions TDR Organismes de prioritat es poden veure en línia a la pàgina Resum de dades per a cada espècie (vegeu https://tdrtargets.org / DataSummary, fent clic a les espècies d’interès). En aquest cas, les parcel·les en línia són interactives i es poden ampliar i exportar. En els casos en què hi ha objectius amb compostos bioactius coneguts per a l’espècie, es mostren distintivament a la trama.

Figura 6.

sencer impulsat per la xarxa Priorització de l’objectiu del genoma per a Mycobacterium Ulcerans: els objectius candidats al genoma de M. Ulccesans van ser classificats pel seu NDS (Parcurs de la farmàcia de la xarxa, vegeu el text principal).La trama mostra tots els objectius del genoma (en l’eix X) juntament amb la seva puntuació NDS corresponent (a l’eix Y). Els punts vermells corresponen als objectius de primer nivell superior, amb etiquetes que indiquen el nom i el producte del gen. Visualització de la priorització sencera del genoma des del resum de dades, l’usuari pot accedir a una pàgina de gens fent clic sobre ell en la trama de priorització. Es mostra un exemple de subgraf de la família Emba / Embc Gene (tal com es veu en les seves pàgines de gens corresponents). La figura també mostra zones de confiança, DG1 (vermell): delimitat per un tall zero i de soroll; DG2 (groc): entre el soroll i el tall de tuden; i DG3-5: amb les puntuacions més altes que el tall de tuden.

Figura 6.

Genoma sencer conduït a la xarxa Priorització d’orientació per a Mycobacterium Ulcerans: els objectius candidats al genoma M. Ulcercans van ser classificats pel seu NDS (Parcurs de la farmàcia de la xarxa, vegeu el text principal). La trama mostra tots els objectius del genoma (en l’eix X) juntament amb la seva puntuació NDS corresponent (a l’eix Y). Els punts vermells corresponen als objectius de primer nivell superior, amb etiquetes que indiquen el nom i el producte del gen. Visualització de la priorització sencera del genoma des del resum de dades, l’usuari pot accedir a una pàgina de gens fent clic sobre ell en la trama de priorització. Es mostra un exemple de subgraf de la família Emba / Embc Gene (tal com es veu en les seves pàgines de gens corresponents). La figura també mostra zones de confiança, DG1 (vermell): delimitat per un tall zero i de soroll; DG2 (groc): entre el soroll i el tall de tuden; i DG3-5: amb puntuacions més altes que el tall de tuden.

Aquestes prioritats impulsades per la xarxa poden treballar ambdós sentits. En partir d’un compost d’interès, l’algorisme pot prioritzar els objectius, utilitzant la similitud ponderada dels veïns químics a objectius inicials candidats. I quan a partir de l’objectiu d’interès, pot prioritzar els compostos, utilitzant objectius de veïns connectats i després seguint enllaços ponderats a inhibidors / medicaments candidats. Les puntuacions precomputades per a compostos i per a objectius s’utilitzen internament per TDR6 i es troben al nucli de transformacions de consultes basades en xarxa.

Xarxa de visualitzacions de sub-gràfics i actualització d’interfície d’usuari

La xarxa sub -Graphs per a tots dos compostos i objectius (i les seves respectives puntuacions NDS) es poden navegar des de l’aplicació web mitjançant un medicament o un objectiu com a punt de partida per obtenir consells per a drogues no provades o objectius nous farmacèutics, respectivament. A través de visualitzacions recentment desenvolupades, els usuaris poden consultar els barris de xarxa al voltant de drogues i objectius a les pàgines corresponents. Les llistes d’interaccions posatives derivades de la xarxa també es poden explorar en format tabular sota la “farmacèutica” (per a objectius) i les seccions “conegudes i previstes” (per a medicaments).

Aquestes visualitzacions són impulsades per d3.js (61) Implementació de dissenys forçosos per a visualitzacions sub-gràfiques. Dins del tauler de subgrap de D3, els usuaris poden realitzar cerques de node dins del gràfic (identificadors d’orientació), així com canviar la visibilitat dels objectius en una espècie de manera d’espècies, i personalitzar l’opacitat dels nodes. En conjunt, aquestes noves funcions proporcionen una visualització clara i completa de la competència sub-xarxa d’objectius i compostos, que permet als usuaris manipular els gràfics durant l’exploració de les dades.

La interfície d’usuari (UI) i les eines disponibles Per a la republició de drogues i la priorització d’orientació ha passat per una actualització important. En primer lloc, la IU ha estat redissenyada sota els estàndards W3C per aconseguir una aplicació més sana i escalable. Hem integrat el bootStrap (https://getbootstrap.com/) i jQuery (https://jquery.com) marcs en el desenvolupament i disseny de l’aplicació web TDR6 i al front- Funcionalitat final. Per a consultes d’estructura composta que hem llicenciat i implementat l’aplicació de dibuix química de Marvin JS de Chaxon (https://chemaxon.com/products/marvin-js). Els registres tabulats dins de les pàgines d’orientació i drogues ara utilitzen el connector Jupascript javascript javascript (https://datatables.net) per crear fàcilment paginacions, filtratge i funcionalitats de classificació. Finalment, les representacions de compost 2D ara es generen automàticament mitjançant una implementació del mòdul JavaScript de SmilesDrawer (62).

Disponibilitat comercial de compostos

Un aspecte important en prioritzar compostos per provar al laboratori , és la seva disponibilitat. A TDR6 ara mostrem informació sobre la disponibilitat comercial de compostos. Actualment hem començat aquesta funció enllaçar amb Molport (un mercat en línia químic que fonts de compostos dels principals proveïdors) i mostrar als usuaris una pista visual a les pàgines compostes que donen una indicació ràpida de si el compost està en estoc o es pot fer a la comanda . Com que la disponibilitat comercial de compostos està actualment implementada a TDR6 en forma de consultes asíncrones contra la MOLPORT, en aquest moment aquesta característica només està disponible en mode de navegació (no en consultes).Tanmateix, els usuaris poden prioritzar els compostos utilitzant qualsevol de les estratègies de consulta disponibles a TDR6 i després finalitzar les seleccions compostes mitjançant la inspecció de compostos manualment per a la disponibilitat comercial.

Discussió i instruccions futures

Les noves dades , la interfície i la funcionalitat de TDR6 proporciona als usuaris la millora de la navegació i la visualització d’objectius i compostos.

El model de xarxa actual connecta els objectius mitjançant l’afiliació de les entitats (proteïnes) als conceptes d’anotació (dominis PFAM, grups d’ortòlegs). Aquests s’han seleccionat en funció de la seva àmplia cobertura i facilitat de càlcul. Complementant aquests conceptes amb altres criteris importants per a la validació de l’objectiu de drogues (essencialitat, expressió en etapes de cicle de vida rellevants) es poden fer pels usuaris amb les eines i funcionalitats proporcionades per TDR6, però en el futur es poden construir al model de xarxa subjacent, a Menys per a alguns organismes susceptibles a l’avaluació experimental de tot el genoma.

Es necessiten diverses millores clau per mantenir els objectius tdr pertinents per a la comunitat de científics que treballen en malalties tropicals. La integració de metabòlits naturals i la connexió d’aquestes petites molècules a altres compostos bioactius a través de subestructures compartides o per similitud química serà un enfocament important en el futur. Això permetrà navegar pel gràfic d’objectius de drogues mitjançant els conceptes de reaccions bioquímiques, que també connecten naturalment enzims no ortòlegs a través dels seus substrats / productes compartits i els cofactors.

Finalment, com ja es va esmentar abans (13), Encara hi ha una gran bretxa de curació que cal omplir. Molts compostos bioactius han estat provats per la comunitat d’investigadors que treballen en malalties tropicals descuidades. No obstant això, molts d’aquests assajos i resultats es reporten a les revistes fora de les revistes principals de la química medicinals i, per tant, es perden per grans esforços de curació com el liderat per Chembl (49). La curació i la integració d’aquestes dades que falten (incloses les dades negatives!) Haurien de ser una prioritat per a la comunitat, ja que estalviaria temps i recursos valuosos.

Dades complementàries

Les dades complementàries estan disponibles a Nar Online.

Agraïments

Els autors volen donar les gràcies a Matthew Berriman i Magdalena Zarowiecki (Wellcome Trust Sanger Institute) per compartir l’alliberament de la publicació de Echinococcus de dades i anotació per a la inclusió a TDR Objectius; i Ben Webb i Andrej Sali (Universitat de Califòrnia San Francisco) per al càlcul de models 3D per a genomes de patògens de nivell 1 en objectius TDR. L.U.L., A.B. i s.v. eren o estan recolzats per beques del Consell Nacional de Recerca (Conici, Argentina). A.C. i F.a. són membres de la Carrera de Recerca del Consell Nacional de Recerca (Conici, Argentina). P.m. Voldria reconèixer una beca de la Comissió de Beques Universitàries (UGC), Índia.

Finançament

Glaxosmithkline Argentina i l’Agència Nacional per a la Promoció de la Ciència i la Tecnologia, Argentina (ANPCYT); Projecte de cooperació bilateral indo-argentina (finançament conjunt del Departament de Ciència i Tecnologia de l’Índia (DST) i el Ministeri de Ciència i Tecnologia Argentina (MINCYT). Finançament per a l’accés obert: Fondo para la Investigación Científica i Tecnològica.

Conflicte de declaració d’interès. Cap declara.

notes

Adreça actual: Ariel J Berenstein, Institut Multidisciplinari d’Investigacions en Patologies Pediátricas (IMIPP), Conici-GCBA, Laboratori de Biologia Molecular, Divisió Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

hotez

molyneux

fenwick

kumaresan

div> j.

Sachs

savioli

Control de malalties tropicals descuidats

n. Engl. J. med.

2007

;

357

1018

–

1027

Trouillera

Olliaro

Torreele

orbinski

Laing

Ford

Desenvolupament de medicaments per a malalties descuidades: un mercat deficient i un públic -La fracàs de la política de la salut

Lancet North Am. Ed.

2002

;

359

2188

–

2194

hughes

rees

kalindjian

philpott

Principis del descobriment de medicaments anticipats

br. J. Farmacol.

2011

;

162

1239

–

1249

Adams

brantner

Estimar el cost del nou desenvolupament de medicaments: és realment 802 milions de dòlars

salut aff. (Millwood)

2006

;

420

–

428

wyatt

gilbert

lectura

fairlamb

validació objectiu : Enllaçar les propietats de destinació i química al perfil de producte desitjat

curr. Superior. Med. Chem.

2011

;

1275

–

1283

farha

marró

Repurposació de drogues per a descobriment antimicrobians

Nat. Microbiol.

2019

;

565

–

577

hernandez

soeung

zorn

ashoura

Mottin

andrade

cafrey

de siqueira-neto

ekins

elevat rendiment i reportiment computacional per a malalties descuidades

Pharm. Res.

2018

;

woóller

submarí Hume

chen

ali

perla

fmg

bioinformàtica en descoberta de medicaments translacionals

Biosci. Rep.

2017

;

doi: 10.1042 / bsr20160180

Agüero

al -Lazikani

aslett

berriman

buckner

campbell

carmona

carruters

chan

Awe

chen

f .

et al. .

Priorització a escala genòmica dels objectius de drogues: la base de dades de dits TDR

Nat. Rev. Discov Discov.

2008

;

900

–

907

custher

shanmugam

carmona

doyle

Hertz-Fowler

berriman

nwaka

Ralph

roos

Van voorhis

et al. .

Identificació d’objectius atractius de drogues en patògens negligents-malaltia utilitzant un enfocament de silico

plos negres. Trop. Dis.

2010

;

e804

lykins

filipva

halavaty

com

minasov

Zhou

Dubrovska

flores

Shuvalova

ruan

el bissati

et al. .

CSGID resol les estructures i identifica fenotips per a cinc enzims a Toxoplasma gondii

frontal. Cel·la. Infectar. Microbiol.

2018

;

352

shanmugam

Ralph

carmona

custher

Roos

agüero

cafrey

Selzer

Integració i mineria de genomes d’helmini per descobrir i prioritzar nous objectius terapèutics

Helminths paràsits: objectius, pantalles, drogues i vacunes

2012

;

wiley-blackwell

–

magariños

carmona

custher

ralph

roos

shanmugam

Van voorhis

Agüero

TDR Objectius: Un recurs químic per a malalties descuidades

nucleic. Àcids. Res.

2012

;

D1118

–

D1127

berenstein

magariños

chernomoretz

agüero

Un enfocament de xarxa multicapa per al reposicionament de fàrmacs de guiatge en malalties descuidades

plos negres. Trop. Dis.

2016

;

e0004300

kim

weiss

toxoplasma gondii: el model apicomplexe

int. J. Parasitol.

2004

;

423

–

432

sidik

huet

ganesan

huynh

m.-h.

wang

nasamu

com

trenta

saeij

jpj

carruthers

niles

et al. .

Una pantalla Genome-Wide Cristpr a Toxoplasma identifica els gens essencials apicomplexians

cel·lular

2016

;

166

1423

–

1435

gajria

bahl

brestelli

Dommer

Fischer

GAO

heiges

iodice

kissinger

Mackey

et al. .

Toxodb: un recurs integrat de base de dades Toxoplasma Gondii

àcids nucleics res.

2007

;

d553

–

D556

warrenfeltz

basenko

Crouch

harb

Kissinger

roos

shanmugasundram

Silva-franquista

kollmar

Eupathdb: el recurs de la base de dades de la base de dades de Genòmica eucariòtica

Bases de dades genòmiques eucariotes

2018

;

1757

springer

–

113

dirers

agarwala

bolton

bristre

Canese

Clark

Connor

fiorini

funk

hefferon

et al. .

Recursos de base de dades del Centre Nacional d’Informació de Biotecnologia

àcids nucleics res.

2019

;

D23

–

D28

hertz-fowler

Peacock

Introducció de Genedb: una base de dades genèrica

Trends parasitol.

2002

;

465

–

467

bolt

rodgers

shafie

kersey

Berriman

Howe

Ús de wormbase paràsit: una plataforma integrada per explorar les dades genòmiques de helminth

Mètodes MOL. BIOL.

2018

;

1757

471

–

491

lechat

Hummel

rousseau

moszer

genolista: un entorn integrat per a l’anàlisi comparativa de genomes microbians

àcids nucleics res.

2007

;

D469

–

d474

kapopoulou

lew

cole

El portal mycobrowser: un recurs complet i anotat manualment per a genomes micobacteris

tuberculosi

2011

;

–

camacho

coulouris

avagyan

papadopoulos

bealer

madden

Blast +: Arquitectura i aplicacions

bmc bioinformàtica

2009

;

421

hancock

bisbe

Emboss (la suite de programari de biologia molecular europea)

Diccionari de bioinformàtica i biologia computacional

2004

;

Chichester

John wiley & sons, ltd

DOB0206

krogh

Larsson

von heijne

sonnhammer

Predicció topologia de proteïnes transmembrana amb un model MARKOV ocult: aplicació per completar els genomes

j. Mol. BIOL.

2001

;

305

567

–

580

almagro armenteros

tsirigos

sønderby

petersen

WINTHER

brunak

von heijne

nielsen

Signalp 5.0 millora les prediccions del pèptid de senyal mitjançant xarxes neuronals profundes

Nat. Biotecnol.

2019

;

420

–

423

pierleoni

Martelli

Casadio

predgpi: un predictor GPI-àncora

bmc bioinformàtica

2008

;

392

moriya

itoh

Okuda

yoshizawa

kanehisa

kaas: un servidor de reconstrucció automàtica d’anotació i reconstrucció de ruta

àcids nucleics res.

2007

;

w182

–

w185

chen

Mackey

stoeckert

jr,

roos

Orthomcl-DB: Consultar una col·lecció global multi-espècie de grups d’ortòlegs

àcids nucleics res.

2006

;

d363

–

d368

fischer

brunk

chen

GAO

HARB

iodice

shanmugam

Roos

stoeckert

utilitzant orthomcl per assignar proteïnes als grups orthomcl-db o Proteomes de clústers en grups d’ortòlegs nous

Curr Protoc bioinforma.

2011

;

doi: 10.1002 / 0471250953.bi0612s35

mitchell

attwood

babitt

blum

Bork

pont

marró

chang

h.-y.

el-gebali

fraser

div> Mi

et al. .

Interpro el 2019: millorant la cobertura, la classificació i l’accés a les anotacions de seqüència de proteïnes

àcids nucleics res.

2019

;

d351

–

d360

jones

binns

chang

h.-y.

fraser

mcanulla

mcwilliam

maslen

Mitchell

nuka

et al. .

Interproscan 5: Classificació de funcions de proteïna a escala genòmica

bioinforma. OXF. Engl.

2014

;

1236

–

1240

burley

berman

bhikadiya

Chen

costanzo

christie

Duarte

Dutta

feng

et al. .

Banc de dades de proteïnes: l’únic arxiu global per a les dades de l’estructura macromolecular 3D

àcids nucleics res.

2019

;

d520

–

D528

pieper

webb

dong

schneidman-duhovny

ventilador

kim

khuri

vessament

weinkam

hammel

m .

et al. .

Modbase, una base de dades de models d’estructura de proteïna comparativa anotada i recursos associats

Acids nucleics res.

2014

;

d336

–

d346

zhu

mok

imwong

jaidee

Russell

nosten

Dia

blanc

Preiser

bozdech

noves idees sobre el transcriptoma de Plasmodium vivax utilitzant RNA-seq

sci. Rep.

2016

;

20498

smcich

Eastman

bispo

Duhagon

Guerra-Slompo

garat

goldenberg

Munroe

dallagiovanna

holetz

et al. .

El perfilat ribosoma revela el control de traducció com a mecanisme clau que genera una expressió genètica diferencial en trypanosoma cruzi

bmc genomics

2015

;

443

lasonder

rijpma

Van Schaijk

bcl

Hoeijmakers

wam

Kensche

gresnigt

italiaander

vos

woesttenenk

bousema

et al. .

Transcripció integrada i anàlisis de proteòmiques de P. Falciparum Gametòcits: comprensió molecular en processos específics de sexe i repressió translacional

àcids nucleics res.

2016

;

6087

–

6101

otto

wilinski

assefa

keane

Sarry

böhme

lemieux

Barrell

dolor

berriman

et al. .

Noves idees sobre el transcriptoma de la fase sanguínia de Plasmodium falciparum mitjançant RNA-seq

mol. Microbiol.

2010

;

–

otto

böhme

jackson

caça

Franke-Fayard

Hoeijmakers

wam

religia

robertson

Sanders

ogun

et al. .

Una avaluació integral dels genomes de paràsits de paràsits de malària de rosegadors i expressió gènica

bmc biol.

2014

;

zanghì

vembar

baumgarten

ding

guizetti

bryant

mattei

jensen

ATR

rènnia

goh

et al. .

Un PFEMP1 específic s’expressa en P. Falciparum Sporozoites i juga un paper en la infecció per hepatocite

representant cel·lular

2018

;

2951

–

2963

fernandes

Dillon

LAL

Belew

bravo

mosser

el-syed

El perfil de transcriptomes dual de Macròfags humans infectats per Leishmania revela diferents signatures de reprogramació

mbio

2016

;

e00027-16

fritz

buchholz

chen

Durbin-johnson

rocke

conrad

boothotroyd

L’anàlisi transcriptòmica del desenvolupament de Toxoplasma revela moltes funcions i estructures específiques específiques d’esporozoites i oocistes

plos un

2012

;

e29998

hon

c.-c.

weber

sismeiro

Proux

koutero

deloger

das

Agrahari

Dillies

M.-a.

jagla

et al. .

Quantificació de soroll estocàstic de splicing i poliadenilació en Entamoeba histolytica

Acids nucleics res.

2013

;

1936

–

1952

siegel

hekstra

wang

Dewell

creu

gota

anàlisi genòmica de l’abundància de l’ARNm. Dues etapes del cicle de vida del Trypanosoma Brucei i la identificació de llocs de splicing i poliadenilació

àcids nucleics res.

2010

;

4946

–

4957

yeoh

bonman

MOLLARD

mcfadden

Ralph

Transcriptomàtica comparativa de gametòcits femenins i masculins a Plasmodium Berghei i l’evolució del sexe en alveola

bmc genomics

2017

;

734

hehl

basso

lippuner

Ramakrishnan

Okoniewski

walker

grigg

smith

es deplazes

expansió asexual de toxoplasma gondii merozoites és diferent de taquyzoites i implica expressió de famílies de gens no superposades per adjuntar, envair i replicar dins dels enteròcits felins

bmc genomics

2015

;

bushell

gomes

sanderson

anar

Noia

ramat

metcalf

modrzynska

schwach

Martin

et al. .

El perfil funcional d’un genoma de plasmodium revela una gran quantitat de gens essencials

cel·lular

2017

;

170

260

–

272

mendez

gaulton

bento

quambres

de veij

félix

magariños

mosquera

mutowo

Nowotka

m .

et al. .

Chembl: cap a la deposició directa de les dades bioassays

àcids nucleics res.

2019

;

D930

–

D940

peña

pilar Manzano

canizani

kessler

Alonso-Padilla

bardera

Álvarez

e .

colmenarejo

cotillo

roquero

et al. .

nous conjunts de compostos identificats a partir de la projecció de fenotips d’alta rendiment contra tres paràsits de kinetoplastid: un recurs obert

sci. Rep.

2015

;

8771

spangenberg

Burrows

kowalczyk

mcdonald

Wells

tnc

willis

Accés obert Caixa de malària: un catalitzador de descobriment de drogues per a malalties descuidades

plos un

2013

;

e62906

Haider

patró de funcionalitat Coincidència com a eina de cerca d’estructura / reacció complementària eficient: un enfocament de codi obert

Molècules

2010

;

5079

–

5092

cheng

zhao

lin

zhang

wang

lai

càlcul de coeficients de partició d’octanol-aigua Guiar un model additiu amb coneixements

j. Quim de química. Inf. Model.

2007

;

2140

–

2148

o’boyle

Banck

james

morley

vandermeersch

hutchison

Open babel: una caixa d’eines de química oberta

j. Quiminformàtica

2011

;

heller

McNaught

pletnev

stein

tchekhovskoi

Inchi, l’identificador químic internacional IUPAC

j. Quiminformàtica

2015

;

lipinski

lombardo

Dominy

feeney

experimental i enfocaments computacionals per estimar la solubilitat i la permeabilitat en la distribució de drogues i la configuració de desenvolupament

adv. Delive Deliv. Rev.

2001

;

–

congreu

carr

murray

jhoti

una ‘regla de tres’ per a descobriment de plom basat en fragments

Discov de drogues. Avui

2003

;

876

–

877

dalke

Chemfp – Formats i eines d’empremtes digitals ràpides i portàtils

j. Quiminformàtica

2011

;

p12

rogers

Tanimoto

un programa informàtic per classificar les plantes

ciència

1960

;

132

1115

–

1118

youden

Índex

Índex de qualificació Proves de diagnòstic

càncer

1950

;

–

bostock

ogievetsky

heer

D3 Documents basats en dades

IEEE trans. Respecte. Citar. Gràfic.

2011

;

2301

–

2309

probst

reymond

j.-l.

SmilesDrawer: analitzar i dibuixar estructures moleculars codificades per somriures utilitzant JavaScript al costat del client

j. Quim de química. Inf. Model.

2018

;

–

Aquest és un article d’accés obert distribuït en virtut dels termes de la llicència de Creative Commons Attribution no comercial (http://creativecommons.org/licenses/by-nc/4.0/), que permet la reutilització, la distribució i la reproducció no comercials En qualsevol mitjà, sempre que el treball original sigui citat correctament. Per a la reutilització comercial, poseu-vos en contacte amb [email protected]

TDR Objectius 6: Descobriment de drogues de conducció per a patògens humans mitjançant integració de dades químiques intensives

Resum

Introducció

Visió general i organització dels objectius TDR

noves funcions a TDR Objectius 6

utilitzant objectius tdr 6

Prioritzacions de destinacions senceres

estratègies de reputuració de medicaments mitjançant transformacions de consulta

Exploració de compostos orfes

Actualitzacions de funcionalitats i dades

noves dades genòmiques a Objectius TDR v6.1

Actualitzacions de les dades químiques

Curació i integració de dades de bioactivitat

Integració de característiques derivades de la xarxa: farmacèutica i prioritzacions

Xarxa de visualitzacions de sub-gràfics i actualització d’interfície d’usuari

Disponibilitat comercial de compostos

Discussió i instruccions futures

Dades complementàries

Agraïments

Finançament

notes

Deixa un comentari Cancel·la les respostes