TDR Targets 6: Driving Drug Discovery per i patogeni umani attraverso integrazione dei dati chemogenomiche intensivi

Astratto

Il volume dei dati biologici, chimici e funzionali depositati nel pubblico dominio Sta crescendo rapidamente, grazie al sequenziamento di prossima generazione e alle tecnologie di screening altamente automatizzate. Questi set di dati rappresentano risorse inestimabili per la scoperta di farmaci, in particolare per i patogeni di malattie trascurati meno studiati. Per sfruttare questi set di dati, l’integrazione dei dati intelligenti e intensive è necessaria per guidare inferenze computazionali attraverso diversi organismi. Il TDR target chemogenomics Resource integra dati genomici da agenti patogeni umani e organismi del modello insieme alle informazioni sui composti bioattivi e dalle loro attività annotate. Questo rapporto evidenzia gli ultimi aggiornamenti sui dati e le funzionalità disponibili negli obiettivi TDR 6. Basati su modelli di rete chemogenomica che forniscono collegamenti tra inibitori e obiettivi, il database ora incorpora le priorità di destinazione guidata da rete e nuove visualizzazioni dei sottografi di rete che visualizzano chimico e target – Quartieri della contestazione insieme ai collegamenti di bioattività composti obiettivi associati. I dati disponibili possono essere sfogliati e interrogati attraverso una nuova interfaccia utente, che consentono agli utenti di eseguire le priorità degli obiettivi proteici e degli inibitori chimici. In quanto tali, gli obiettivi TDR ora facilitano l’indagine sul recupero dei farmaci contro gli obiettivi di patogeno, che può potenzialmente aiutare a identificare gli obiettivi candidati per composti bioattivi con obiettivi precedentemente sconosciuti. TDR Targets è disponibile su https://tdrtargets.org.

INTRODUZIONE

Le malattie tropicali trascurate (NTD) influenzano sproporzionatamente ~ 0,5 miliardi di persone in basso reddito e sviluppo Paesi, dove sono una causa principale per gli anni di vita persi per la disabilità e la morte prematura (1). Storicamente, la mancanza di coinvolgimento dell’industria farmaceutica, in combinazione con investimenti limitati nei programmi di ricerca sulla salute pubblica nei paesi colpiti, ha comportato una carenza di farmaci disponibili per controllare efficacemente la maggioranza di tali malattie (2). Inoltre, i farmaci attualmente in uso per trattare queste malattie sono spesso compromessi in termini di costi, difficoltà in amministrazione, efficacia, resistenza alla droga o profili di sicurezza.

Drug Scoperta è un processo che richiede tempo e costoso (3 , 4). Per NTDS in particolare, i programmi di scoperta dei farmaci devono sopravvivere abbastanza a lungo attraverso la carenza di finanziamento pervasive per renderlo in successive studi clinici (5). In questo contesto, un approccio strategico per la scoperta del farmaco NTD è il riposizionamento del farmaco (6), che può aiutare a ridurre i costi facilitando le approvazioni normative nelle prove iniziali per i farmaci che hanno già subito una ricerca clinica per altre malattie e / o indicazioni e fallì per ragioni altrimenti della sicurezza (6). Inoltre, se la portata del recupero dei farmaci è ampliata per includere droghe e composti bioattivi dalla ricerca su organismi non umani, può anche portare all’identificazione di almeno nuovi strumenti chimici per la sondazione della funzione degli obiettivi e dei percorsi nei patogeni umani. Pertanto, sfruttando le vaste quantità di dati disponibili da programmi di ricerca ben finanziati sulle malattie umane e sugli organismi del modello, il paesaggio della scoperta dei farmaci su NTDS ottiene un aumento positivo (7).

Le strategie computazionali stanno diventando sempre più Essenziale nella scoperta del farmaco traslazionale, sia nell’Academia che nell’industria farmaceutica. Integrazione intelligente e intensiva dei crescenti volumi di dati generati durante tutte le fasi della scoperta del farmaco sta già abilitando le sfide chiave del processo da affrontare (8). Dalla sua introduzione, il database TDR target è stato una risorsa affidabile per i ricercatori di malattie trascurati per accedere ai dati chemogenomici per la priorità del target di farmaci e il recupero di farmaci su malattie trascurate. Introdotto nel 2008 (9), questa risorsa di accesso aperta ha permesso ai ricercatori di trovare nuovi obiettivi di proteine e inibitori chimici, e neannalizzali per aiutare lo sviluppo di farmaci per i patogeni NTD. I target TDR utilizzano set di dati funzionali del genoma disponibile pubblicamente per consentire agli utenti di trovare e dare la priorità agli obiettivi in base alla loro conoscenza della biologia del loro patogeno di interesse e della natura della malattia (10,11). Questo è implementato da una selezione di destinazione flessibile, basata sull’utente (utilizzando criteri di filtraggio) e classifica (utilizzando la ponderazione specifica dei criteri) (12,13).

Qui, descriviamo gli aggiornamenti ai set di dati sottostanti e La funzionalità nel TDR target risorse, accumulata dalla sua precedente pubblicazione nel 2012 (13). La nuova versione TDR TARSE (V6.1, ABBREVIATA TDR6 in questo documento) integra le informazioni genomiche specifiche patogeni con dati funzionali (ad es.espressione, relazioni a base di ortologia, essenziali) da una selezione di organismi, insieme ai dati dei composti bioattivi (struttura chimica, proprietà e bioattività / informazioni target); Tutto ciò può essere interrogato e sfogliato attraverso l’applicazione web. Tutte le query possono essere salvate in uno scorta personale da parte degli utenti registrati e pubblicato attraverso l’applicazione Web per massimizzare le opportunità di collaborazione. Gli elenchi prioritari degli obiettivi possono essere esportati per ulteriori analisi off-line. I dettagli completi di tutte le nuove funzionalità sono disponibili nelle note di rilascio (https://tdrtargets.org / rilasci). Questo rapporto presenta una procedura dettagliata completa dell’applicazione Web, delle sue nuove funzionalità ed esempi per illustrare i casi di utilizzo.

Panoramica e organizzazione degli obiettivi TDR

Come nelle uscite precedenti di TDR, TDR6 è anche organizzato in due sezioni principali: obiettivi e composti. La sezione Targets del database contiene dati a livello di genoma per 20 agenti patogeni umani e consente agli utenti di eseguire query e le priorità delle priorità degli obiettivi proteici basati su una serie di funzionalità e dati rilevanti per la scoperta dei farmaci (vedere la tabella 1). La sezione Compostazioni del database contiene informazioni su > 2 milioni di composti bioattivi e consente le query in base alle proprietà chimiche dei composti e dalle loro bioattività annotate (cfr. Tabella 2).

tabella 1.

Disponibile query di destinazione in TDR Targets

Gruppo di query. Atogeni per i quali sono disponibili i dati. Tipi di dati disponibili per la query.
Nomi & Annotazioni Tutti i dati Identificatori geni e annotazioni funzionali (numeri CE, GO Termini, domini PFAM, Mapping per via metabolica)
Caratteristiche delle proteine Tutto MW, punto Isoelectrico, presenza di ancore di peptidi del segnale previsto, segmenti trans-membrane e ancore gycosilfosfatidylinositolo (GPI).
Informazioni strutturali Tutto Disponibilità di strutture 3D in PDB; Disponibilità di modelli strutturali in ModBase
Espressione genica Plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Tubercolosi mycobacterium; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma GONDII DATI DI ESPRESSIONE GENI DA PATOGLIE DI GENITA DI VITA PATENTI E / O CONDIZIONI SERIMENTALI PERSONALI PERSONALIZZATE PER LA RECORDY DERCORD.
Informazioni filogenetiche Tutto Tutti i bersagli del filtro usando semplificati “presenti / assenti” in altri criteri di specie, in base alle informazioni del Gruppo Orthollog . Include organismi modelli (umani) e altri agenti patogeni correlati.
essenzialità c. elegans (modello per elminths); E. coli (modello per batteri); S. Cerevisiae (modello per agenti patogeni eucariotici); Trypanosoma Brucei; Tubercolosi mycobacterium; Toxoplasma gondii; Plasmodium Berghei Inferenza basata su ortologia dell’essenzialità dei geni nelle fasi del ciclo di vita e / o condizioni sperimentali rilevanti per la scoperta della droga. Integrato da un’interruzione del gene del genoma selezionato (ad esempio Transposson, CRISPR / CAS) e Knockdown (E.G. RNAi) Datasetti in agenti patogeni e organismi del modello.
Dati di convalida target schistosoma mansoni; Leishmania maggiore; Tripanosoma cruzi; Trypanosoma Brucei; Mycobacterium lepae; Tubercolosi mycobacterium; Plasmodium falciparum dati curati manualmente sulle credenziali di convalida target (fenotipi genetici, chimici e / o farmacologici, osservi)
druggability Tutto Precedente per la modulazione chimica riuscita dell’attività o della funzione di destinazione. Riassunto in un punteggio di drogabilità calcolato dal modello di rete (vedere il testo principale)
Assasabilità Tutto Avandimenti Biochimici disponibili per proteine Targets (mappatura basata sui numeri EC)
Riferimenti bibliografici Tutto Target del filtro basato su pubblicazioni disponibili
Gruppo di query. Atogeni per i quali sono disponibili i dati. Tipi di dati disponibili per la query.
Nomi & Annotazioni Tutti i dati Identificatori geni e annotazioni funzionali (numeri CE, GO Termini, domini PFAM, Mapping per via metabolica)
Caratteristiche delle proteine Tutto MW, punto Isoelectrico, presenza di ancore di peptidi del segnale previsto, segmenti trans-membrane e ancore gycosilfosfatidylinositolo (GPI).
Informazioni strutturali Tutto Disponibilità di strutture 3D in PDB; Disponibilità di modelli strutturali in ModBase
Espressione genica Plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Tubercolosi mycobacterium; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma GONDII DATI DI ESPRESSIONE GENI DA PATOGLIE DI GENITA DI VITA PATENTI E / O CONDIZIONI SERIMENTALI PERSONALI PERSONALIZZATE PER LA RECORDY DERCORD.
Informazioni filogenetiche Tutto Tutti i bersagli del filtro usando semplificati “presenti / assenti” in altri criteri di specie, in base alle informazioni del Gruppo Orthollog . Include organismi modelli (umani) e altri agenti patogeni correlati.
essenzialità c. elegans (modello per elminths); E. coli (modello per batteri); S. Cerevisiae (modello per agenti patogeni eucariotici); Trypanosoma Brucei; Tubercolosi mycobacterium; Toxoplasma gondii; Plasmodium Berghei Inferenza basata su ortologia dell’essenzialità dei geni nelle fasi del ciclo di vita e / o condizioni sperimentali rilevanti per la scoperta della droga. Integrato da un’interruzione del gene del genoma selezionato (ad esempio Transposson, CRISPR / CAS) e Knockdown (E.G. RNAi) Datasetti in agenti patogeni e organismi del modello.
Dati di convalida target schistosoma mansoni; Leishmania maggiore; Tripanosoma cruzi; Trypanosoma Brucei; Mycobacterium lepae; Tubercolosi mycobacterium; Plasmodium falciparum dati curati manualmente sulle credenziali di convalida target (fenotipi genetici, chimici e / o farmacologici, osservi)
druggability Tutto Precedente per la modulazione chimica riuscita dell’attività o della funzione di destinazione. Riassunto in un punteggio di drogabilità calcolato dal modello di rete (vedere il testo principale)
Assasabilità Tutto Avandimenti Biochimici disponibili per proteine Targets (mappatura basata sui numeri EC)
Riferimenti bibliografici Tutto Target del filtro basato su pubblicazioni disponibili

Tabella 1 .

Query di destinazione disponibile in TDR Targets

gruppo di query. Atogeni per i quali sono disponibili i dati. Tipi di dati disponibili per la query.
Nomi & Annotazioni Tutti i dati Identificatori geni e annotazioni funzionali (numeri CE, GO Termini, domini PFAM, Mapping per via metabolica)
Caratteristiche delle proteine Tutto MW, punto Isoelectrico, presenza di ancore di peptidi del segnale previsto, segmenti trans-membrane e ancore gycosilfosfatidylinositolo (GPI).
Informazioni strutturali Tutto Disponibilità di strutture 3D in PDB; Disponibilità di modelli strutturali in ModBase
Espressione genica Plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Tubercolosi mycobacterium; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma GONDII DATI DI ESPRESSIONE GENI DA PATOGLIE DI GENITA DI VITA PATENTI E / O CONDIZIONI SERIMENTALI PERSONALI PERSONALIZZATE PER LA RECORDY DERCORD.
Informazioni filogenetiche Tutto Tutti i bersagli del filtro usando semplificati “presenti / assenti” in altri criteri di specie, in base alle informazioni del Gruppo Orthollog . Include organismi modelli (umani) e altri agenti patogeni correlati.
essenzialità c. elegans (modello per elminths); E. coli (modello per batteri); S. Cerevisiae (modello per agenti patogeni eucariotici); Trypanosoma Brucei; Tubercolosi mycobacterium; Toxoplasma gondii; Plasmodium Berghei Inferenza basata su ortologia dell’essenzialità dei geni nelle fasi del ciclo di vita e / o condizioni sperimentali rilevanti per la scoperta della droga. Integrato da un’interruzione del gene del genoma selezionato (ad esempio Transposson, CRISPR / CAS) e Knockdown (E.G. RNAi) Datasetti in agenti patogeni e organismi del modello.
Dati di convalida target schistosoma mansoni; Leishmania maggiore; Tripanosoma cruzi; Trypanosoma Brucei; Mycobacterium lepae; Tubercolosi mycobacterium; Plasmodium falciparum dati curati manualmente sulle credenziali di convalida target (fenotipi genetici, chimici e / o farmacologici, osservi)
druggability Tutto Precedente per la modulazione chimica riuscita dell’attività o della funzione di destinazione.Riassunto in un punteggio di drogabilità calcolato dal modello di rete (vedere il testo principale)
Assasabilità Tutto Avandimenti Biochimici disponibili per proteine Targets (mappatura basata sui numeri EC)
Riferimenti bibliografici Tutto Target del filtro basato su pubblicazioni disponibili
Gruppo di query. Atogeni per i quali sono disponibili i dati. Tipi di dati disponibili per la query.
Nomi & Annotazioni Tutti i dati Identificatori geni e annotazioni funzionali (numeri CE, GO Termini, domini PFAM, Mapping per via metabolica)
Caratteristiche delle proteine Tutto MW, punto Isoelectrico, presenza di ancore di peptidi del segnale previsto, segmenti trans-membrane e ancore gycosilfosfatidylinositolo (GPI).
Informazioni strutturali Tutto Disponibilità di strutture 3D in PDB; Disponibilità di modelli strutturali in ModBase
Espressione genica Plasmodium spp.; Leishmania spp.; Trypanosoma spp.; Tubercolosi mycobacterium; Echinococcus multilocularis; Entamoeba histolytica; Toxoplasma GONDII DATI DI ESPRESSIONE GENI DA PATOGLIE DI GENITA DI VITA PATENTI E / O CONDIZIONI SERIMENTALI PERSONALI PERSONALIZZATE PER LA RECORDY DERCORD.
Informazioni filogenetiche Tutto Tutti i bersagli del filtro usando semplificati “presenti / assenti” in altri criteri di specie, in base alle informazioni del Gruppo Orthollog . Include organismi modelli (umani) e altri agenti patogeni correlati.
essenzialità c. elegans (modello per elminths); E. coli (modello per batteri); S. Cerevisiae (modello per agenti patogeni eucariotici); Trypanosoma Brucei; Tubercolosi mycobacterium; Toxoplasma gondii; Plasmodium Berghei Inferenza basata su ortologia dell’essenzialità dei geni nelle fasi del ciclo di vita e / o condizioni sperimentali rilevanti per la scoperta della droga. Integrato da un’interruzione del gene del genoma selezionato (ad esempio Transposson, CRISPR / CAS) e Knockdown (E.G. RNAi) Datasetti in agenti patogeni e organismi del modello.
Dati di convalida target schistosoma mansoni; Leishmania maggiore; Tripanosoma cruzi; Trypanosoma Brucei; Mycobacterium lepae; Tubercolosi mycobacterium; Plasmodium falciparum dati curati manualmente sulle credenziali di convalida target (fenotipi genetici, chimici e / o farmacologici, osservi)
druggability Tutto Precedente per la modulazione chimica riuscita dell’attività o della funzione di destinazione. Riassunto in un punteggio di drogabilità calcolato dal modello di rete (vedere il testo principale)
Assasabilità Tutto Avandimenti Biochimici disponibili per proteine Targets (mappatura basata sui numeri EC)
Riferimenti bibliografici Tutto Target del filtro basato su pubblicazioni disponibili

Tabella 2 .

Interrogazioni composte disponibili in TDR Targets

gruppo di query. Tipi di dati disponibili per la query.
Ricerche basate su testo
Nomi & Annotazioni nomi composti o sinonimi; Identificatori del database (ad es. Chembl, Pubchem); Identificatori chiave Inchi e Inchi
Proprietà chimiche peso molecolare; Coefficiente di partizione di ottanolo / coefficiente d’acqua del logp; Numero di donatori H e accettatori, numero di legami flessibili e numero di corrispondenti RO5 (Lipinski)
formula composta Ricerca per composti contenenti un numero specifico ( ad es. 3) di atomi definiti (ad es. cl, f, br, n)
bioattività ricerca testo sulle descrizioni del test; Ricerca numerica per valori in analisi (ad es. IC50 < 5 μm)
composti orfani Cerca composti che hanno rapporti di bioattività in organismi integrali o analisi integrali, ma mancano informazioni di destinazione e meccanismo (orfani inibitori / farmaci)
composti con bersagli Trova Composti con informazioni di destinazione e analisi basati sui meccanismi
Ricerche basate sulla struttura
somiglianza composta Draw / Incollo composto o frammento 2D Struttura e ricerca di composti simili. La ricerca è basata sulla corrispondenza di impronte digitali chimiche
sottostruttura composta draw / paste compost o framment 2d Struttura e ricerca di composti nel database che contengono la query frammento.
Gruppo di query. Tipi di dati disponibili per la query.
Ricerche basate su testo
Nomi & Annotazioni nomi composti o sinonimi; Identificatori del database (ad es. Chembl, Pubchem); Identificatori chiave Inchi e Inchi
Proprietà chimiche peso molecolare; Coefficiente di partizione di ottanolo / coefficiente d’acqua del logp; Numero di donatori H e accettatori, numero di legami flessibili e numero di corrispondenti RO5 (Lipinski)
formula composta Ricerca per composti contenenti un numero specifico ( ad es. 3) di atomi definiti (ad es. cl, f, br, n)
bioattività ricerca testo sulle descrizioni del test; Ricerca numerica per valori in analisi (ad es. IC50 < 5 μm)
composti orfani Cerca composti che hanno rapporti di bioattività in organismi integrali o analisi integrali, ma mancano informazioni di destinazione e meccanismo (orfani inibitori / farmaci)
composti con bersagli Trova Composti con informazioni di destinazione e analisi basati sui meccanismi
Ricerche basate sulla struttura
somiglianza composta Draw / Incollo composto o frammento 2D Struttura e ricerca di composti simili. La ricerca è basata sulla corrispondenza di impronte digitali chimiche
sottostruttura composta draw / paste compost o framment 2d Struttura e ricerca di composti nel database che contengono la query frammento.

Tabella 2.

Interrogazioni composte disponibili in TDR Targets

Gruppo di query. Tipi di dati disponibili per la query.
Ricerche basate su testo
Nomi & Annotazioni nomi composti o sinonimi; Identificatori del database (ad es. Chembl, Pubchem); Identificatori chiave Inchi e Inchi
Proprietà chimiche peso molecolare; Coefficiente di partizione di ottanolo / coefficiente d’acqua del logp; Numero di donatori H e accettatori, numero di legami flessibili e numero di corrispondenti RO5 (Lipinski)
formula composta Ricerca per composti contenenti un numero specifico ( ad es. 3) di atomi definiti (ad es. cl, f, br, n)
bioattività ricerca testo sulle descrizioni del test; Ricerca numerica per valori in analisi (ad es. IC50 < 5 μm)
composti orfani Cerca composti che hanno rapporti di bioattività in organismi integrali o analisi integrali, ma mancano informazioni di destinazione e meccanismo (orfani inibitori / farmaci)
composti con bersagli Trova Composti con informazioni di destinazione e analisi basati sui meccanismi
Ricerche basate sulla struttura
somiglianza composta Draw / Incollo composto o frammento 2D Struttura e ricerca di composti simili. La ricerca è basata sulla corrispondenza di impronte digitali chimiche
sottostruttura composta draw / paste compost o framment 2d Struttura e ricerca di composti nel database che contengono la query frammento.
Gruppo di query. Tipi di dati disponibili per la query.
Ricerche basate su testo
Nomi & Annotazioni nomi composti o sinonimi; Identificatori del database (ad es. Chembl, Pubchem); Identificatori chiave Inchi e Inchi
Proprietà chimiche peso molecolare; Coefficiente di partizione di ottanolo / coefficiente d’acqua del logp; Numero di donatori H e accettatori, numero di legami flessibili e numero di corrispondenti RO5 (Lipinski)
formula composta Ricerca per composti contenenti un numero specifico ( ad es. 3) di atomi definiti (ad es. cl, f, br, n)
bioattività ricerca testo sulle descrizioni del test; Ricerca numerica per valori nei saggi (ad es.IC50 < 5 μm)
composti orfani cerca composti che hanno rapporti di bioattività in organismo intero o analisi di celle interi ma mancano di informazioni di destinazione e meccanismo (orfani inibitori / farmaci)
composti con target Trova composti che hanno informazioni di destinazione e meccanismo basato ASSAYS
Ricerche basate sulla struttura
AMMESSIONE AMMESSIONE Disegna / Incolla Composto o frammento struttura 2D e ricerca di composti simili. La ricerca è basata sulla corrispondenza di impronte digitali chimiche
sottostruttura composta draw / paste compost o framment 2d Struttura e ricerca di composti nel database che contengono la query frammento.

Nuove funzionalità in TDR Targets 6

Abbiamo recentemente riportato un modello di rete integrativo (14) in cui tutti i set di dati sulla scala genome disponibili negli obiettivi TDR (obiettivi proteici), informazioni chimiche (composti bioattivi) e le loro relazioni (bioattività dei composti in I saggi basati su target) sono stati collegati a un grafico multistrato. In TDR6, questo modello di rete è stato aggiornato integrando nuovi set di dati (descritti di seguito). Questo modello incorpora collegamenti tra obiettivi e composti bioattivi derivati dalla cura manuale dei saggi di bioattività pubblicati (cioè collegamenti diretti tra obiettivi e composti chimici), nonché da relazioni calcolate (collegamenti target-target e collegamenti composti composti) basati sulle annotazioni proteiche (Domini PFAM, gruppi ortholog) e somiglianza chimica. Un aspetto chiave di questi collegamenti nel modello multistrato-rete è che consentono l’esplorazione e la visualizzazione rapida del vicinato attorno agli obiettivi selezionati e / o ai composti bioattivi. Ciò consente agli utenti di esplorare composti collegati ai bersagli, ispezionare il quartiere di somiglianza chimica attorno a composti bioattivi e visualizza questi dati in un modo user friendly e completo (vedere la figura 1).

Figura 1.

Modello di rete schematico in TDR6 e Visualizzazione dei sotto-grafico: le pagine composte o di destinazione ora visualizzano una visualizzazione sottogramma contenente oggetti nella vicinanza alla rete dell’entità selezionata. Questi grafici sono costruiti da un grafico di rete complesso a tre strati. Uno schema di questo grafico è presentato in cima. Sia i sottografi di destinazione che composto sono sempre disposti come segue: i nodi composti (verde) sono collegati agli obiettivi (arancione = agenti patogeni; grigio = non agenti patogeni) attraverso bordi di bioattività. Questi collegamenti raffigurano risultati positivi (verdi), neutri (grigi) o negativi (rossi). Infine, bersagli mappa su una serie di affiliazioni funzionali (annotazioni, nodi blu). Nell’esempio, il grafico mostra una serie di inibitori noti per un aciltransferasi umano (15). Queste bioattività (tutte positive) sono disegnate come collegamenti verdi tra i composti (nodi verdi) e il bersaglio (nodi grigi per non agenti patogeni, nodi arancioni per agenti patogeni). Il grafico evidenzia le opportunità di ripristino delle acytransferasi di Helminth (linee tratteggiate, aggiunte manualmente per questa figura), basate su annotazioni condivise con il bersaglio umano noto drogabile. Il nodo rosso nel livello del farmaco indica il composto selezionato. Le dimensioni del nodo sono determinate dal numero di connessioni nella rete (grado), mentre le larghezze di collegamento della bioattività (bordi) sono correlate al numero cumulativo di prove sperimentali per una determinata coppia di destinazione (numero di analisi).

figura 1.

Modello di rete schematico nelle visualizzazioni TDR6 e sotto-grafico: le pagine composte o di destinazione ora visualizzano una visualizzazione sottogramma contenente oggetti nel Vicinanza di rete dell’entità selezionata. Questi grafici sono costruiti da un grafico di rete complesso a tre strati. Uno schema di questo grafico è presentato in cima. Sia i sottografi di destinazione che composto sono sempre disposti come segue: i nodi composti (verde) sono collegati agli obiettivi (arancione = agenti patogeni; grigio = non agenti patogeni) attraverso bordi di bioattività. Questi collegamenti raffigurano risultati positivi (verdi), neutri (grigi) o negativi (rossi). Infine, bersagli mappa su una serie di affiliazioni funzionali (annotazioni, nodi blu). Nell’esempio, il grafico mostra una serie di inibitori noti per un aciltransferasi umano (15). Queste bioattività (tutte positive) sono disegnate come collegamenti verdi tra i composti (nodi verdi) e il bersaglio (nodi grigi per non agenti patogeni, nodi arancioni per agenti patogeni). Il grafico evidenzia le opportunità di ripristino delle acytransferasi di Helminth (linee tratteggiate, aggiunte manualmente per questa figura), basate su annotazioni condivise con il bersaglio umano noto drogabile. Il nodo rosso nel livello del farmaco indica il composto selezionato. Le dimensioni del nodo sono determinate dal numero di connessioni nella rete (laurea), mentre le larghezze di collegamento BIOACTIVITY (bordi) sono correlate al numero cumulativo di prove sperimentali per una determinata coppia di destinazione (numero di analisi).

Con questi aggiornamenti, TDR6 ora offre agli utenti le seguenti funzionalità: (i) le priorità destinate al genoma guidate di rete, (ii) esplorazione del recupero dei farmaci; e III) l’esplorazione dei bersagli candidati per i composti orfani. Questi casi di utilizzo sono possibili da un certo numero di funzionalità basate su rete precomputa come un nuovo punteggio di drogabilità della rete (NDS). Associando una metrica quantitativa agli obiettivi basati sull’arricchimento dei composti bioattivi sui nodi di rete strettamente collegati, questo punteggio facilita la classificazione degli obiettivi in gruppi di drogabilità (DGS), che sono disponibili per gli utenti nelle query del database.

il Il modello di rete è anche la base per le priorità guidate da rete prevocizzate (NDP) che possono essere interrogate dagli utenti e sono utilizzate anche internamente da TDR6 per selezionare obiettivi e composti collegati per la visualizzazione nelle visualizzazioni di rete appena sviluppate (vedi sotto). Quando si inizia da un composto di interesse TDR6 utilizza le priorità precomposte delle priorità dei bersagli candidati per aiutare gli utenti nella navigazione dello spazio bersaglio attorno al composto (e viceversa quando si inizia da un obiettivo di interesse). Fornendo queste metriche di arricchimento precommuta e classifiche del database del database ora facilita la scoperta di nuove associazioni di target di farmaci. Oltre a questi nuovi ndps precomputuiti, gli utenti possono dare la priorità agli obiettivi utilizzando le stesse funzionalità dei precedenti target dei target TDR.

Questa versione include anche diversi aggiornamenti di dati, vale a dire l’inclusione di 22 nuovi genomi (20 nuovi patogeni e 2 nuovi Model Organismi) e ampi aggiornamenti a dati chimici e bioattività tra gli altri. L’interfaccia utente migliorata e versatile, unitamente agli aggiornamenti dei dati Rinnova l’impegno degli obiettivi del TDR per fornire uno strumento integrato e potente per esplorare i dati genomici e chimici nel contesto delle malattie tropicali trascurate.

usando TDR Targets 6

Priorizzazioni target integrali

Il modello di rete (14) è la base per il nuovo punteggio della drogabilità, che è una metrica derivata dalla rete che è correlata all’arricchimento nei composti bioattivi per A Dato il target (NDS, “Punteggio della drogabilità della rete”). NDSS sono disponibili per tutti gli organismi di Tier 1, che possono essere interrogati e utilizzati per il peso delle query per filtrare gli obiettivi (in o verso l’uscita) nelle condotte di priorità personalizzate definite dall’utente. Come ulteriormente spiegato nei dettagli dell’integrazione della rete, per ogni organismo, gli obiettivi sono stati classificati in cinque gruppi di drogabilità (DG), dal più basso (DG1) al punteggio più basso (DG5), in base alle loro prestazioni nelle priorità della rete.

Come nelle versioni precedenti degli obiettivi TDR, gli utenti possono combinare diversi set di dati semplicemente eseguendo singole query su diversi tipi di dati e combinandoli nella pagina della cronologia (9,10,12,13). Ciò è utile quando, ad esempio, gli utenti vorrebbero includere ulteriori tipi di dati alle priorità basate sulla drogabilità, come quelle che si affidano all’espressione genica nelle fasi del ciclo di vita pertinenti, o quelle che forniscono informazioni sul fitness / letalità degli obiettivi (essenziali).

Ad esempio, presentiamo qui un esempio di prioritizzazione utilizzando Toxoplasma Gondii come agente patogeno di interesse. T. Gondiii è un parassita apicomplexan spesso usato come modello per indagare sulla biologia sottostante diverse malattie umane e animali (15). La strategia di ricerca è riassunta nella figura 2. La query è stata avviata cercando tutti gli obiettivi di Gondiii e filtrando tali obiettivi con omologhi nell’uomo (per selezionare solo obiettivi specifici per parassiti). Successivamente, abbiamo selezionato i geni essenziali candidati basati sui profili di forma fisica durante l’infezione dei fibroblasti umani (16); E anche geni selezionati altamente espressi nei tachiti (stadio replicativo di T. Gondiii) interrogando per i geni nel Top 80-100 percentile per abbondanza della trascrizione rnaseq (17). Queste selezioni sono state combinate con le classifiche della drogabilità della rete. Per questo abbiamo considerato geni nei gruppi di drogabilità 3, 4 o 5 (DG ≥ 3) (vedere la figura 2). La figura mostra tutte le query e i loro risultati come si vede nella pagina Storia e le operazioni eseguite durante la combinazione di query (Unione, Intersezione). L’elenco finale degli obiettivi classificati in base a questi criteri è stato reso pubblico ed è disponibile nella sezione TDR Target degli elenchi pubblicati.

figura 2.

bersaglio Strategia di esempio di priorità per T. Gondii. L’immagine composita mostra (a) i termini della query utilizzati per trovare obiettivi di T. Gondiii che non hanno omologhi negli esseri umani, che sono altamente espressi nella fase di tachyzoite virulenta del parassita durante l’infezione cellulare umana, che probabilmente sono essenziali e sono probabilmente drogabili secondo al punteggio della drogabilità della rete. (B) Riepilogo delle query eseguite nella pagina “Targets”, che mostra come queste query appaiono nella pagina “Storia”, dove possono essere rivista e trasformate. I pulsanti di gestione della query in linea consentono azioni selezionate (rimuovere, rinominare, esportazione) su set di risultati.(C) Le combinazioni di query consentono agli utenti di eseguire un’unione, intersecare o sottrarre azioni sulle query con l’una dall’altra. Sono mostrati esempi di azioni dell’Unione e di intersezione. (D) Le query possono essere salvate in uno scorta privata (i set di query) da dove possono essere inviati indietro all’area di lavoro (per eseguire ulteriori operazioni di query) o condivisa pubblicamente con altri utenti TDR Targets (i miei set di query di destinazione pubblicati).

figura 2.

Priorità target Strategia di esempio per T. Gondii. L’immagine composita mostra (a) i termini della query utilizzati per trovare obiettivi di T. Gondiii che non hanno omologhi negli esseri umani, che sono altamente espressi nella fase di tachyzoite virulenta del parassita durante l’infezione cellulare umana, che probabilmente sono essenziali e sono probabilmente drogabili secondo al punteggio della drogabilità della rete. (B) Riepilogo delle query eseguite nella pagina “Targets”, che mostra come queste query appaiono nella pagina “Storia”, dove possono essere rivista e trasformate. I pulsanti di gestione della query in linea consentono azioni selezionate (rimuovere, rinominare, esportazione) su set di risultati. (C) Le combinazioni di query consentono agli utenti di eseguire un’unione, intersecare o sottrarre azioni sulle query con l’una dall’altra. Sono mostrati esempi di azioni dell’Unione e di intersezione. (D) Le query possono essere salvate in uno scorta privata (i set di query) da dove possono essere inviati indietro all’area di lavoro (per eseguire ulteriori operazioni di query) o condivisa pubblicamente con altri utenti TDR Targets (i miei set di query di destinazione pubblicati).

Strategie di ripristino dei farmaci utilizzando le trasformazioni di query

La query della drogabilità in TDR6 consente agli utenti di selezionare obiettivi con inibitori / farmaci noti o previsti. Le informazioni sugli obiettivi con farmaci noti provengono dalla cura della letteratura, mentre le associazioni previste (indirette) di obiettivi con inibitori / farmaci sono ottenuti attraverso calcoli di somiglianza sequenza o ortologia (a destinati drogabili noti) o attraverso inferenze supportate dalla rete (14). Tutti questi metodi sono implementati in TDR6. Quindi, quando gli utenti filtrano un set di gene basato sulla drogabilità, limitano la selezione di obiettivi altamente classificati, che dovrebbero fornire una ricca fonte di opportunità di ripristino dei farmaci.

per mostrare l’utilità di TDR6 in quest’area ci mostriamo Come cercare farmaci candidati per il ripristino di Echinococcus multilocularis (l’agente causale di echinococcosi alveolare). Ciò è mostrato nella figura 3. Il processo è simile a quello descritto in precedenza per T. Gondii, ma in questa strategia di query non abbiamo escluso gli omologhi umani e hanno utilizzato C. Elegans RNAi Dettaglioni dei dati di letalità come proxy per l’essenzialità nematode. Di conseguenza, abbiamo ottenuto una priorità del genoma per E. Multilocularis. Successivamente, applicando un filtro basato sulla drogabilità a questa query, abbiamo ristretto la selezione del gene a una manciata di geni. L’utente può ispezionare manualmente i bersagli selezionati per scoprire quali farmaci sono stati elencati attraverso associazioni indirette. Le pagine di destinazione visualizzeranno tutti i composti associati nella sezione della drogabilità, classificati in base alla fonte dell’inferenza. Per le inferenze guidate dalla rete, il punteggio per ogni composto proposto apparirà sia come elenco che come una trama di rango, per identificare rapidamente i candidati promettenti. In alternativa, per ridurre al minimo l’ispezione manuale, l’elenco dei geni (I.e. La query stessa) può essere facilmente convertita in un elenco di farmaci associati facendo clic sui pulsanti “Converti questo query” nella parte superiore delle pagine dei risultati della query. Questa funzionalità fornisce un modo rapido per iniziare a creare una libreria di screening per una serie di obiettivi. Le trasformazioni delle query possono essere basate su curate (farmaci noti per un set di obiettivi), previsto (associazioni calcolate ai farmaci) o entrambi. In tutti e tre gli approcci, gli inibitori / i farmaci associati a noti target drogabili sono associati transititivamente ai geni nell’elenco. La figura 3 riassume la strategia di prioritizzazione, la conversione della query dell’elenco geni ai composti e un esempio della visualizzazione del sotto-grafico disponibile dalla pagina composta di un colpo di ripresa. Attualmente queste conversioni vengono eseguite in background e i risultati vengono visualizzati nella sezione cronologia del sito Web quando eseguiti (gli utenti sono anche avvisati via e-mail).

figura 3.

Opportunità di ripristino dei farmaci per E. Multilocularis utilizzando le trasformazioni di query. Un regime di prioritizzazione target per Echinococcus multilocularis che si basano sull’inferenza basata sulla ortologia e sulla drogabilità prevista (DG ≥ 3). A) query combinate; (B) Elenco iniziale di obiettivi prioritari. (C) Qualsiasi elenco di destinazione può essere “trasformato” in un elenco dei loro farmaci associati, utilizzando uno dei metodi di collegamento composti disponibili (vedere il testo principale). (D) Elenco risultante dei composti bioattivi. (E) Esempio di visualizzazione del sotto-grafico della rete da un composto selezionato, che mostra collegamenti di bioattività attivi e inattivi. I composti (nodi verdi) sono collegati agli obiettivi di patogeno (arancione) in base ai record di bioattività (verde = attivo; rosso = rosso = inattivo, vedere il testo principale per le soglie di attività).I bersagli, a loro volta, sono collegati (collegamenti grigi) alle affiliazioni funzionali (nodi blu). Il rendering del sotto-grafico fornisce suggerimenti visivi su come il target iniziale E. multilocularis è collegato con il composto selezionato nella rete.

figura 3.

Ricarica di droghe Opportunità per E. Multilocularis utilizzando le trasformazioni di query. Un regime di prioritizzazione target per Echinococcus multilocularis che si basano sull’inferenza basata sulla ortologia e sulla drogabilità prevista (DG ≥ 3). A) query combinate; (B) Elenco iniziale di obiettivi prioritari. (C) Qualsiasi elenco di destinazione può essere “trasformato” in un elenco dei loro farmaci associati, utilizzando uno dei metodi di collegamento composti disponibili (vedere il testo principale). (D) Elenco risultante dei composti bioattivi. (E) Esempio di visualizzazione del sotto-grafico della rete da un composto selezionato, che mostra collegamenti di bioattività attivi e inattivi. I composti (nodi verdi) sono collegati agli obiettivi di patogeno (arancione) in base ai record di bioattività (verde = attivo; rosso = rosso = inattivo, vedere il testo principale per le soglie di attività). I bersagli, a loro volta, sono collegati (collegamenti grigi) alle affiliazioni funzionali (nodi blu). Il rendering del sotto-grafico fornisce suggerimenti visivi su come il target iniziale E. Multilocularis è collegato con il composto selezionato nella rete.

Esplorazione dei composti orfani

Le attività dei composti estratti dalla letteratura mediante la curazione vengono visualizzate sotto forma di analisi basati su target (collegamento diretto al target) o sotto forma di analisi basati su cellule o organismi. In assenza di altre informazioni queste ultime classi di analisi non forniscono indizi al bersaglio o al meccanismo di azione dei composti. Durante il processo di aggiornamenti dei dati chimici in TDR6, abbiamo identificato composti con effetti fenotipici riportati su organismi interi o saggi basati su cellule, in base alle loro classificazioni chimb. Questa informazione è stata utilizzata per identificare composti “orfani” attivi contro un particolare patogeno nelle proiezioni primarie o secondarie basate su cellule, ma per i quali non vi è alcun dosaggio basato su target.

Composti orfani in TDR6 possono essere Ricerca di eventuali specie con dati di screening fenotipici disponibili, all’interno della pagina di ricerca dei composti. Ciò consente un modo rapido di sfruttare i dati dai saggi ad alta velocità, consentendo agli utenti di avviare le loro priorità dai composti con attività note contro un patogeno di interesse.

Il modello di rete integrato in TDR6 è anche utile per identificare anche il candidato obiettivi per composti orfani. Come descritto nella pubblicazione originale (14), il quartiere di somiglianza chimica calcolata attorno a un composto orfano selezionato può fornire collegamenti indiretti a uno o più bersagli. Usando questa strategia abbiamo eseguito le priorità target per tutti i composti orfani in TDR6. Queste priorità composte a base di rete prevocizzate sono disponibili per tutti gli organismi per i quali è disponibile i dati di screening fenotipici. I riassunti globali che mostrano tutti i composti orfani per questi organismi sono collegati dalla pagina “Riepilogo dei dati” (vedere https://tdrtargets.org / DataSummary e clicca sulla specie di interessi). Un esempio di priorità basata su composto orfano per T. Cruzi è mostrato in figura 4. considerando che le priorità che iniziano da un singolo composto sono disponibili in ciascuna pagina composta.

figura 4.

Esplorazione degli obiettivi candidati per i composti orfani cruzi del tripanosoma. La trama riassume la priorità target guidata dalla rete per composti orfani attivi contro T. cruzi. Tutte le sequenze di codifica delle proteine nel genoma di T. cruzi (obiettivi candidati) sono disposti sull’asse X. I punti dati nella trama corrispondono alle associazioni target-drogati segnate dall’algoritmo (punteggio tracciato sull’asse y). Ad esempio, abbiamo evidenziato due bersagli Putativi per due farmaci diversi (come visualizzato nella pagina Riepilogo dei dati T. Cruzi). I grafici simili sono disponibili online per gli organismi di Tier 1 in TDR6 (collegati dalla pagina di riepilogo dei dati).

figura 4.

Esplorazione degli obiettivi candidati per i composti orfani cruzi di Trypanosoma. La trama riassume la priorità target guidata dalla rete per composti orfani attivi contro T. cruzi. Tutte le sequenze di codifica delle proteine nel genoma di T. cruzi (obiettivi candidati) sono disposti sull’asse X. I punti dati nella trama corrispondono alle associazioni target-drogati segnate dall’algoritmo (punteggio tracciato sull’asse y). Ad esempio, abbiamo evidenziato due bersagli Putativi per due farmaci diversi (come visualizzato nella pagina Riepilogo dei dati T. Cruzi). I grafici simili sono disponibili online per gli organismi di Tier 1 in TDR6 (collegati dalla pagina di riepilogo dei dati).

funzionalità e aggiornamenti dei dati

nuovi dati genomici in TDR Targets V6.1

Poiché la pubblicazione precedente del TDR target è stata aggiunta il database (13), sono stati aggiunti diversi genomi patogeni. Un elenco dettagliato è fornito nella tabella 3 così come online sulla pagina di riepilogo dei dati TDR6 (https://tdrtargets.org / DataSummary).

Tabella 3 .

Riepilogo delle disponibilità dei dati per i top tier patogeni. Riepilogo dei dati target disponibili per gli organismi TIER 1 in TDR Targets. CD: sequenze di codifica; Pfam: numero di proteine con dominio PFAM mappato / i; Vai: numero di proteine con termini di ontologia genica mappati; CE: numero di proteine con numeri (CE) della Commissione Enzyme (CE); Percorsi: numero di proteine mappate alle mappe del percorso Kegg; Orthologs: numero di sequenze mappate a gruppi orthomcl orthollog. Una tabella di riepilogo dei dati più completa è disponibile online su https://tdrtargets.org / datasummary

Specie. CD. PFAM. Vai. CE. Percorsi. Orthologs.
Plasmodium falciparum 5349 3322 3551 750 750 1083 5166
Plasmodium vivax 5344 3264 2631 641 806 5207
TOXOPLASMA GONDII 7946 4025 3795 772 967 6764
chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae 1630 1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
mycobacterium ulcerans 4232 3602 2578 873 1002 3459
TREP onema pallidum 1036 791 634 221 335 733
Wolbachia Endosymbiont di B. Malyi 805 628 577 308 382 688
BRUGIA MAYI 11316 7042 6368 1278 1787 8424
echinococcus granulosus 10249 6481 5432 854 1965 7109
echinococcus multilocularis 10474 6817 5768 878 2079 7539
Loa Loa (Eye worm) 16292 8071 6774 1539 2207 10484
Onchocerca Volvolus 12224 3248 2178 246 563 4054
schistosoma mansoni 12692 7818 7384 1218 1649 10386
leishmania maggiore 8280 4641 4415 1067 1162 8250
TRYPANOSOMA BRUZEI 10270 5665 5482 1019 1264 9259
Trypanosoma cruzi 18639 9908 8572 1495 1735 18140
Entamoeba histolytica 8211 4920 4087 645 1094 7692
Giardia LAMBLIA 9665 2726 2263 326 514 5977
Trichomonas vaginalis 95600 35474 18435 843 1366 87303

5432

Entamoeba histolytica

Specie. CD. PFAM. Vai. CE. Percorsi. Orthologs.
Plasmodium falciparum 5349 3322 3551 750 750 1083 5166
Plasmodium vivax 5344 3264 2631 641 806 5207
TOXOPLASMA GONDII 7946 4025 3795 772 967 6764
chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae 1630 1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
mycobacterium ulcerans 4232 3602 2578 873 1002 3459
TREP onema pallidum 1036 791 634 221 335 733
wolbachia endosymbiont di B.malayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (verme occhio)

16292

8071 6774 1539

2207

10484

Onchocerca volvolo

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania importante 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Tabella 3.

dati di sintesi disponibilità per i migliori agenti patogeni livello. Sintesi di dati di bersagli disponibili per Tier 1 organismi in Obiettivi TDR. CD: sequenze codificanti; Pfam: numero di proteine con Pfam Domain (s) Mappato; GO: numero di proteine con termini Gene Ontology mappate; CE: numero di proteine con i numeri mappate Enzyme (CE); Percorsi: numero di proteine mappate alle mappe pathway KEGG; Ortologhi: numero di sequenze mappate a gruppi OrthoMCL ortholog. Una tabella più completa sintesi dei dati è disponibile online all’indirizzo https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

5432

16392 071


Entamoeba histolytica


3C34827 ” 3C34827″ IV ID = “0B01674E” “DV Id = “0b01674e.


v id = “29971A56991”

5344

2631

887 87 04 04 04 04

Tepne


mycobacterium 6678 678 678 678 678


5432

Entamoeba histolytica

Specie. CD. Pfam. GO. CE. Percorsi. ortologhi.
Plasmodium falciparum 5349 3322 3551 750 1083 5166
5344 3264 2631 641 806 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764
Chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae

1630

1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
Trep ONEMA pallidum 1036 791 634 221 335 733
Wolbachia endosimbionte di B.MAYI 588 588 388
BRUGIA Malyi

11316

7042 6368 1278 1787 6481 6481 854 1965 7109
Echinococcus multilocularis

10474

6817 779 758
Loa Loa (Eye Worm) 1509 071 1559 071 1539 071 679 071 15371 1539 071 1539 071 1559 071 2207 10484 2378 2178 246 563 4054
Schistosoma Mansoni

12692

7818 7384 1218 1649

10386

leishmania maggiore 8280 4641 4415 1067 1162 8250 5480 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lambia 2263 2263 2735 363

272 272 3635 363 2235 363 514 5977
Trichomonas vaginalis

95600

35474

18435 843 cds. pfam. vai. CE. percorsi. orthoogs.
lasmoodio 3322 551 7166 Plasmox VIVAX 641 606 06 06 06 06 5207
toxoplasma gondiii 7946 4025 3795 772 967 6764 598 269 mycobacterium 1630 1236 P2 673 673
mycobacterium tduleis Page 1174 1174 1174 1174 3287 873 1002 3459
Trep. Onema palvenven 1036 61 33 33 33 33 33 33 633
Wolbia Indussabiant di Bmalayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (verme occhio)

16292

8071 6774 1539

2207

10484

Onchocerca volvolo

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania importante 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Data la diversità degli organismi integrata in obiettivi TDR e, di conseguenza, la varietà di sorgenti di dati necessari a coprire tutte le genomi; notevole sforzo è stato messo in standardizzazione dei dati analisi e recupero di informazioni dal genoma Questi organismi. La maggior parte del genoma completo EupathDB sono stati ottenuti da (18), GenBank (19), GeneDB (20), Wormbase parassita (21), GenoList (22) o Mycobrowser (23). Una descrizione completa delle fonti genoma e fornite in precedente complementare Tabella S1. Per aggiornare i dati per organismi presenti nella versione precedente di obiettivi TDR geni codificanti proteine dalla versione corrente di genomi erano o mappata a geni esistenti negli obiettivi TDR, o in altro modo sono entrati i nuovi record. La mappatura algoritmo utilizza una combinazione di condizioni per tracciare identificatori Gene attraverso stampa e mantenere l’identità dei geni: checksum sequenza di corrispondenza (utilizzando i valori a 128 bit hash generati dall’algoritmo MD5), nomi di Gene o gli identificatori e Blast (24) IF o partite perfette si trovano. Dopo l’aggiornamento dei record, il Pipeline calcola proprietà fisico utilizzando Pepstats (25), scansioni per i domini transmembrana con TMHMM (26), peptidi segnale con SignalP (27), e glicosilfosfatidilinositolo punti di ancoraggio, utilizzando PredGPI (28). L’algoritmo respinge tutte le sequenze non codificanti, il più eventuali pseudogeni, per evitare le annotazioni fuorviante e riducendo al minimo i falsi presupposti durante i flussi di lavoro di definizione delle priorità. La maggior parte di TDR6, di cui sopra tutte le attività per l’integrazione del genoma e l’aggiornamento sono stato avvolto nel flusso di lavoro automatizzato per facilitare il più velocemente gli aggiornamenti nelle versioni future. Uno schema dell’aggiornamento e Algorithm Pipeline mostrato nella precedente figura complementare S1. La Pipeline automatizza anche il calcolo delle annotazioni utilizzando ad hoc strategie individuali per diverse annotazioni, basandosi su Web Services e API (apparso nel Kaas (29) Servizio per le proteine di mappatura per metaboliche Percorsi e all’elevato numero CE Classificazione degli enzimi, o OrthoMCL database e strumento (30,31) per i gruppi di mappatura ortologo alle proteine. Il Pipeline si basa anche su calcolo contro apparso database installati localmente più InterPro (32), utilizzando InterProScan (33) per identificare domini proteici (Pfam) e mappare termini di vocabolari controllati e classificazioni (termini GO). risorse aggiuntive sono apparsi più in 3D strutture e modelli strutturali sono stati recuperati dalla Protein Data Bank (34) utilizzando i servizi web e scaricabili dal sito Modbase FTP (35), rispettivamente.

anche il numero di gruppi di dati chiave funzionali sono stati integrati in questa versione, tra (i) gruppi di dati trascrittomiche che forniscono evidenza di espressione genica in fase di ciclo vitale o condizioni sperimentali che sono rilevanti per la Drug Discovery (36-47) e (ii) i set di dati essenzialità derivati da due agenti patogeni Apicomplexa (P. berghei e T. gondii) (16,48), che forniscono informazioni alle strategie vitali ASSIST priorità.

Aggiornamenti di dati chimico

Per i composti bioattivi anche, i flussi di lavoro di aggiornamento dei dati sono state automatizzate per questa versione.La maggior parte dei composti bioattivi è stata recuperata da Chembl 24th Release (49), che contiene alcuni set di dati aggiuntivi come quelli delle scatole chimiche specifiche dell’agente patogeno – scatole KinetoplastId GSK (50), scatola patogeno MMV (51). Il processo di integrazione inizia dalle descrizioni delle molecole (2D) nel formato SDF, da cui abbiamo calcolato tutte le imballate composte necessarie (necessarie per ricerche di somiglianza / sottostruttura composte) utilizzando il checkmol (52). La pipeline calcola anche ulteriori proprietà chimiche come il coefficiente di partizione di ottanolo / acqua del logp e altri descrittori strutturali utilizzando XLOGP3 (53) e gli Open Babel Tools ObProp e Obrotamer (54). Altri dati rilevanti sono stati ottenuti o calcolati direttamente dalla struttura composta, come gli identificatori Inchi e Inviewikey (55) utilizzati per il monitoraggio composto; e altre regole standard del pollice utilizzate nella chimica medicinale e nella scoperta del farmaco medicinale, come la regola Lipinski di cinque (56) e la relativa regola dei tre (57).

Dopo l’integrazione in TDR bersagli, tutti i composti erano soggetti Per tutto il calcolo del confronto della somiglianza della somiglianza chimica utilizzando ChemFP (58) che produce misurazioni di somiglianza a coppie in base al Tanimoto Indice / Distanza (59). Inoltre, abbiamo calcolato una mappa globale (tutto controllata) delle relazioni di sottostruttura tra composti nel database (X è una sottostruttura di y; y è una sovrastruttura di x). Sapendo che il problema della ricerca di massimo sottogruppi comuni tra le molecole è computazionalmente difficile, abbiamo applicato un approccio euristico per trovare le sottostrutture. L’algoritmo ottiene per la prima volta un sottoinsieme di possibili molecole candidate facendo uso di impronte digitali precedentemente calcolate. I candidati devono avere le impronte digitali corrispondenti con la molecola del soggetto. Una volta ottenuto un elenco di candidati, la determinazione della sottostruttura Atom Atom-By-Atom a coppie viene eseguita utilizzando MatchMol (52). I dati disponibili per composti e query che possono essere eseguiti su ciascun tipo di dati sono riepilogati nella tabella 2. La distribuzione del peso molecolare (MW) e della superficie polare (PSA) per tutti i composti nel database è mostrata nella figura supplementare S2.

Curazione e integrazione dei dati di bioattività

Come con composti chimici, la maggior parte delle bioattività integrate negli obiettivi TDR viene direttamente da fonti di dati a monte (ad es. Chembl). Quando si integra i dati della bioattività, abbiamo conservato sia l’annotazione del dosaggio (ad es. “Assistenza di riduzione della motilità in vitro contro Brugia Malayi microfilaria a 10 μm”) e il valore numerico e le unità associate alle attività composte (ad esempio l’inibizione del ‘80% ‘,’ 1.5 μm IC50 ‘, ’10 nm mic’), che sono tutti campi ricercabili. Inoltre, e per facilitare le query degli utenti, le bioattività riportate sono state utilizzate per raggruppare composti pregiati in classi “attivi” o “inattive”. Tuttavia, per ridurre al minimo l’effetto dell’uso dei confini duri attorno alle soglie arbitrarie e ad aumentare la separazione tra classificazioni attive / inattive, abbiamo anche definito un’area grigia indeterminata. Quindi, i composti segnamono appena al di sotto di una soglia arbitraria non sono considerati inattivi per scopi di query e di visualizzazione.

Non tutti i tipi di attività sono stati suscettibili di classificazione, però. Nonostante gli sforzi nella standardizzazione di questi dati di attività, interpretando le attività dei composti a questa scala è difficile, poiché dipendono spesso dal tipo di saggio particolare, riportati le unità e le particolari condizioni in cui ciascun dosaggio è stato condotto. Tuttavia, una serie significativa di tipi di analisi potrebbe essere automaticamente classificata in categorie attive / indeterminate / inattive in base alle soglie di attività. Per questo, tutti i tipi di dosaggio con > 100 000 report (consultare la figura supplementare S3 per un’attività per tipo di analisi / per grafico di distribuzione composto) sono stati considerati per l’auditing delle attività, anche se solo i test a base di concentrazione (come IC50, Ki o Potency) sono stati trovati abbastanza robusti per tale determinazione, poiché i test percentuali (come l’attività%, l’attività residua% o l’inibizione di $) erano ambigui nei rapporti di bioattività. Le soglie utilizzate per classificare le attività per ciascun tipo di test possono essere trovate nella Tabella 4, e la distribuzione di composti in queste classi di attività è riassunta nella figura 5.

tabella 4.

>

Tipi di analisi e soglie di attività utilizzate per la determinazione del tag di attività: solo i saggi a base di concentrazione sono stati utilizzati per determinare i tag di attività. Le attività che segnalano meno del valore massimo ammesso per i positivi sono state considerate interazioni attive (+), mentre quelle superiori al “valore minimo ammesso per i negativi” sono state considerate inattive (-). Qualsiasi attività riportata tra questi due valori è stata considerata come indeterminata (0)

Assay
Tipo.
unità standard
.
Valore massimo ammesso per Actives. Valore ammesso minimo per inattivi.
AC50 nm 20000 100000
EC50 NM 20000 100000
ic50 nm 20000 100000
IC50 UG ML-1 15 50
KD NM 20000 100000
ki nm 20000 100000
potenza nm 20000 100000
Dosay
Tipo.
unità standard
.
Valore massimo ammesso per Actives. Valore ammesso minimo per inattivi.
AC50 nm 20000 100000
EC50 NM 20000 100000
ic50 nm 20000 100000
IC50 UG ML-1 15 50
KD NM 20000 100000
ki nm 20000 100000
potenza nm 20000 100000

Tabella 4.

Tipi di dosaggio e soglie di attività utilizzate per la determinazione del tag di attività: solo i saggi a base di concentrazione sono stati utilizzati per determinare i tag di attività. Le attività che segnalano meno del valore massimo ammesso per i positivi sono state considerate interazioni attive (+), mentre quelle superiori al “valore minimo ammesso per i negativi” sono state considerate inattive (-). Qualsiasi attività riportata tra questi due valori è stata considerata come indeterminata (0)

Assay
Tipo.
unità standard
.
Valore massimo ammesso per Actives. Valore ammesso minimo per inattivi.
AC50 nm 20000 100000
EC50 NM 20000 100000
ic50 nm 20000 100000
IC50 UG ML-1 15 50
KD NM 20000 100000
ki nm 20000 100000
potenza nm 20000 100000
Dosay
Tipo.
unità standard
.
Valore massimo ammesso per Actives. Valore ammesso minimo per inattivi.
AC50 nm 20000 100000
EC50 NM 20000 100000
ic50 nm 20000 100000
IC50 UG ML-1 15 50
KD NM 20000 100000
ki nm 20000 100000
potenza nm 20000 100000

Figura 5.

Attività Tags Distribuzione e miscele di prova tra i dati: (a) Diagramma di Venn che mostra la distribuzione dei valori di bioattività nelle classi attive, inattive e indeterminate in TDR6 (vedere il testo principale per i dettagli) . Intersezione contano casi in cui lo stesso farmaco ha diversi risultati di attività contro lo stesso obiettivo. Esempi di questi casi sono forniti nei pannelli B attraverso F (ID composti rappresentano gli identificatori TDR6). (B) Attività della C329137 (un’idrossia-benzamidina) contro P. Falciparum Bifunctional diidrofolato Reductase-Thymidiylate SynThase. (C) Esempio di record positivi per gli inibitori umani dell’aciltransferasi. (D) Esempio di attività negative e neutrali per composti trifenilcarbinolo e benzoidrolo, rispettivamente. Infine, sia le prove positive (E) che negative (f) possono essere miscelate con prove indeterminate, come mostrato per c2164865 testate contro la cholinesterasi di cavallo e C306882 testate contro la ricombinante P. Falciparum Deoxyuridina 5′-triphosfato nucleotidica, rispettivamente.

figura 5.

Attività Tag Distribuzione e miscele di prova tra i dati: (a) Diagramma di Venn che mostra la distribuzione dei valori di bioattività in Attivo , classi inattive e indeterminate in TDR6 (vedere il testo principale per i dettagli).Intersezione contano casi in cui lo stesso farmaco ha diversi risultati di attività contro lo stesso obiettivo. Esempi di questi casi sono forniti nei pannelli B attraverso F (ID composti rappresentano gli identificatori TDR6). (B) Attività della C329137 (un’idrossia-benzamidina) contro P. Falciparum Bifunctional diidrofolato Reductase-Thymidiylate SynThase. (C) Esempio di record positivi per gli inibitori umani dell’aciltransferasi. (D) Esempio di attività negative e neutrali per composti trifenilcarbinolo e benzoidrolo, rispettivamente. Infine, sia le prove positive (E) che negative (f) possono essere miscelate con prove indeterminate, come mostrato per c2164865 testate contro la cholinesterasi di cavallo e C306882 testate contro la ricombinante P. Falciparum Deoxyuridina 5′-triphosfato nucleotidica, rispettivamente.

The Chembl 24th release conteggi con oltre 15,2 milioni di bioattività segnalate, di cui solo circa 6 milioni corrispondano alle relazioni che coinvolgono droghe e obiettivi di proteine (proteine singole, famiglie di proteine e complessi proteici, con ~ Il 93% è proteine singole). Altre bioattività rimanenti nel database sono state report per un’ampia varietà di obiettivi non proteici, come cellule integrali (3,6 m), organismi interi (2,2 m), tessuti (83k) e macromolecole non peptidiche (85k) o Piccole molecole (< 100). Questi non sono stati utilizzati nella costruzione di rete, perché la rete è proteina (cioè obiettivo) centrica. La figura 5 mostra anche alcune visualizzazioni di rete di esempio che descrivono come TDR6 visualizza queste bioattività.

Integrazione delle caratteristiche derivate dalla rete: Drugetability e priorità

Come menzionato sopra, i dati genomici, le annotazioni geni, I composti chimici e le interazioni gene-farmaco-farmaco sono state integrate in una complessa rete orientata al recupero di farmaci, come descritto a Berenstein et al. (14). La rete è stata utilizzata per calcolare un punteggio di drogabilità di rete (NDS), per tutti gli obiettivi in Priority (Tier 1) Pathogens. Il NDS è correlato alla possibilità di trovare composti bioattivi nelle immediate vicinanze del grafico di rete di un dato bersaglio (intervallo è da 0 a 1). L’algoritmo è stato precedentemente descritto in dettaglio (14), ma brevemente, sulla base di un test eccessivamente rappresentativo di proteine drogabili noti annotate, calcola un punteggio di pertinenza (RS) per ogni dominio PFAM e categorie di gruppi di ortologia della rete. Il punteggio NDS per un dato target risulta da una somma cumulativa ponderata sulle Rs di tutti i contributi di affiliazione comuni al nodo di destinazione e le proteine vicine collegate a composti attivi.

Per facilitare l’interpretazione dei punteggi NDS che abbiamo eseguito un interpretazione dei punteggi NDS Valutazione statistica per identificare i gruppi distinti della drogabilità (DG) in base a due tipi di soglie che aiutano a classificare le previsioni della drogabilità in zone di confidenza. Questi sono illustrati nella figura 6. Da una parte, mentre tutti i bersagli di punteggio non zero hanno un certo grado di connettività a obiettivi noti-drogabili, un basso NDS suggerisce tali connessioni non sono rilevanti per la valutazione della drogabilità. Quindi, un rumore-cutoff (una base di base calcolata come 5 volte il valore di 0,25 percentile dalla completa distribuzione NDS) è considerata per identificare i bassi bersagli di punteggio. La seconda soglia deriva dall’indice generale J di Youden (60), che viene calcolato come punteggio in cui sia la specificità che la sensibilità sono ottimali (la migliore sensibilità senza compromettere la specificità e viceversa). Questo valore può essere calcolato solo per i patogeni con veri positivi (bersagli farmacologici noti). Un minimo arbitrario di 10 veri positivi è stato considerato sufficiente per la determinazione del taglio di Youden. Per altri patogeni privi di tali informazioni, è stato utilizzato un taglio globale di Youden (calcolato utilizzando tutti i veri positivi nella rete). I corrispondenti gruppi di drogabilità sono quindi: DG1 per obiettivi con valori NDS che vanno da 0 alla soglia del rumore; DG2 per obiettivi con valori NDS che vanno dalla soglia del rumore al taglio di Yoverden; e DGS 3, 4 e 5 con valori NDS che sono 1, 10 e 100 volte sopra il cut-off di Youden. Di conseguenza, questi ultimi gruppi formano i bersagli più probabili drogabili. La figura 6 mostra un esempio statico di una priorità guidata da rete per ulcerazioni di mycobacterium (che manca di obiettivi con composti noti nella versione corrente). Tutte le priorità per TDR di destinazione gli organismi prioritari possono essere visualizzati online nella pagina di riepilogo dei dati per ogni specie (vedere https://tdrtargets.org / DataSummary, facendo clic sulla specie di interessi). In questo caso, i grafici online sono interattivi e possono essere ingranditi ed esportati. Nei casi in cui ci sono obiettivi con composti bioattivi noti per le specie, questi sono mostrati distintamente nella trama.

figura 6.

Driven a rete Genoma Target Priorità per i mycobacterium Ulcesans: obiettivi candidati nel genoma di M. Ulcesans sono stati classificati dal loro NDS (Punteggio della drogabilità della rete, vedere il testo principale).La trama raffigura tutti gli obiettivi del genoma (nell’asse x) insieme al loro corrispondente punteggio NDS (nell’asse Y). I punti rossi corrispondono ai bersagli classificati Top-10, con etichette che indicano il nome del geno e il prodotto. Esplorando la priorità del genoma navigazione dal riepilogo dei dati, l’utente può accedere a una pagina Gene facendo clic su di esso nella trama di prioritizzazione. Un esempio di sottogramma da Famiglia Gene EMBA / EMBB / EMBC è mostrata (visto nelle loro corrispondenti pagine geni). La figura visualizza anche zone di confidenza, DG1 (ROSSO): delimitata da zero e tagliato a rumore; DG2 (Giallo): tra il rumore e il taglio di Youden; e DG3-5: con punteggi superiori al taglio di Youden.

figura 6.

interi-genoma guidato da rete Priorità target per i mycobacterium Ulcesans: I bersagli candidati nel genoma di M. Ulcesans sono stati classificati dal loro NDS (Punteggio della drogabilità della rete, vedere il testo principale). La trama raffigura tutti gli obiettivi del genoma (nell’asse x) insieme al loro corrispondente punteggio NDS (nell’asse Y). I punti rossi corrispondono ai bersagli classificati Top-10, con etichette che indicano il nome del geno e il prodotto. Esplorando la priorità del genoma navigazione dal riepilogo dei dati, l’utente può accedere a una pagina Gene facendo clic su di esso nella trama di prioritizzazione. Un esempio di sottogramma da Famiglia Gene EMBA / EMBB / EMBC è mostrata (visto nelle loro corrispondenti pagine geni). La figura visualizza anche zone di confidenza, DG1 (ROSSO): delimitata da zero e tagliato a rumore; DG2 (Giallo): tra il rumore e il taglio di Youden; e DG3-5: con punteggi superiori al taglio di Youden.

Queste priorità guidate dalla rete possono funzionare in entrambi i modi. Quando si inizia da un composto di interesse, l’algoritmo può dare la priorità ai bersagli, utilizzando la somiglianza ponderata dei vicini chimici agli obiettivi iniziali candidati. E quando si inizia dal bersaglio di interesse, può dare la priorità ai composti, utilizzando obiettivi del vicino drogabile collegati e quindi seguire i collegamenti ponderati agli inibitori / farmaci candidati. I punteggi precomputici per i composti e per gli obiettivi vengono utilizzati internamente da TDR6 e sono al centro delle trasformazioni di query basate sulla rete.

Visualizzazione di sottoprizzazione della rete e aggiornamento dell’interfaccia utente

la rete sub -Graphs per composti e bersagli (e i loro rispettivi punteggi NDS) possono essere sfogliati dall’applicazione Web utilizzando un farmaco o un bersaglio come punto di partenza per ottenere suggerimenti per droghe non testate o nuovi target drogabili, rispettivamente. Attraverso le visualizzazioni di nuova concezione gli utenti possono controllare i quartieri di rete attorno alle droghe e agli obiettivi nelle pagine corrispondenti. Le liste di interazioni Putative derivate dalla rete possono anche essere esplorate in formato tabellare sotto la “drogabilità” (per gli obiettivi) e le sezioni “conosciute e previste” (per farmaci).

Queste visualizzazioni sono guidate da D3.js (61) Implementazione dei layout forzati per le visualizzazioni secondarie. All’interno del pannello del sottografo D3, gli utenti possono eseguire ricerche di nodi all’interno del grafico (identificatori di destinazione), oltre a sfuggire alla visibilità degli obiettivi su una specie per specie, e personalizzare l’opacità dei nodi. Presi insieme Queste nuove funzionalità offrono una visualizzazione chiara e completa delle vicinanze della sub-rete di obiettivi e composti, consentendo agli utenti di manipolare i grafici mentre esplora i dati.

L’interfaccia utente (UI) e gli strumenti disponibili Per il recupero di farmaci e la priorità target hanno attraversato un importante aggiornamento. In primo luogo, l’UI è stato ridisegnato sotto gli standard W3C per ottenere un’applicazione più sana e più scalabile. Abbiamo integrato il bootstrap (https://getbootstrap.com/) e jquery (https://jquery.com) frameworks nello sviluppo e nel design dell’applicazione Web TDR6 e nella parte anteriore- Funzionalità finale. Per le query della struttura composta abbiamo autorizzato e implementato l’applicazione di disegno chimico Marvin JS da Chemaxon (https://chemaxon.com/products/marvin-js). I record tabulati all’interno delle pagine target e della droga ora utilizzano il plugin JQuery JQuery JavaScript DataTable (https://datatables.net) per creare facilmente pagine, filtraggio e ordinamento delle funzionalità. Infine, le rappresentazioni 2D composte vengono ora generate automaticamente utilizzando un’implementazione del modulo JavaScript SmileDrawer (62).

Disponibilità commerciale di composti

Un aspetto importante durante la priorità ai composti per il test in laboratorio , è la loro disponibilità. In TDR6 stiamo ora visualizzando informazioni sulla disponibilità commerciale dei composti. Attualmente abbiamo iniziato questa funzione collegando con Molport (un mercato chimico online che foncia le fonti composta dai principali fornitori) e mostrano agli utenti un indizio visivo sulle pagine composte che danno un’indicazione rapida del fatto che il composto sia in magazzino o può essere effettuato su ordinazione . Poiché la disponibilità commerciale di composti è attualmente implementata in TDR6 sotto forma di query asincroni contro Molport, in questo momento questa funzione è disponibile solo in modalità di navigazione (non in query).Tuttavia, gli utenti possono dare la priorità agli composti utilizzando una qualsiasi delle strategie di query disponibili in TDR6 e quindi finalizza le loro selezioni composte ispezionando manualmente i composti per la disponibilità commerciale.

Discussione e direzioni future

I nuovi dati , Interfaccia e funzionalità di TDR6 forniscono agli utenti la navigazione e la visualizzazione migliorate di obiettivi e composti.

Il modello di rete corrente collega obiettivi attraverso l’affiliazione di entità (proteine) ai concetti di annotazione (domini Pfam, gruppi ortholog). Questi sono stati selezionati in base alla loro ampia copertura e alla relativa facilità di calcolo. Complemendo questi concetti con altri criteri importanti per la convalida del target della droga (essenzialità, l’espressione nelle fasi del ciclo di vita pertinenti) può essere effettuata dagli utenti con gli strumenti e la funzionalità forniti da TDR6 ma in futuro possono essere integrati nel modello di rete sottostante, a minimo per alcuni organismi suscettibili di valutazione sperimentale a livello di genoma.

Diversi miglioramenti chiave sono necessari per tenere gli obiettivi TDR pertinenti per la Comunità degli scienziati che lavorano alle malattie tropicali. L’integrazione dei metaboliti naturali e il collegamento di queste piccole molecole ad altri composti bioattivi attraverso sottostrutture condivise o con somiglianza chimica sarà una maggiore attenzione al futuro. Ciò consentirà di navigare il grafico dei bersagli farmacologici utilizzando anche i concetti di reazioni biochimiche, che collegano naturalmente gli enzimi non ortologici attraverso i loro substrati / prodotti e cofattori condivisi.

infine, come già menzionato prima (13), C’è ancora un grande divario di cura che deve essere riempito. Molti composti bioattivi sono stati testati dalla Comunità dei ricercatori che lavorano in malattie tropicali trascurate. Eppure molti di questi test e risultati sono riportati in riviste al di fuori delle riviste di chimica medicinale mainstream e quindi sono persi da grandi sforzi di cura come quello guidato da Chembl (49). La curazione e l’integrazione di questi dati mancanti (compresi i dati negativi!) Dovrebbero essere una priorità per la Comunità, in quanto salvare tempo e risorse preziose.

Dati supplementari

I dati supplementari sono disponibili A NAR Online.

RICONOSCIMENTI

Gli autori vorrebbero ringraziare Matthew Berriman e Magdalena Zarowiecki (Wellcome Trust Sanger Institute) per la condivisione di dati di pre-rilascio di Echinococcus e annotazione del genoma per l’inclusione in TDR Obiettivi; e Ben Webb e Andrej Sali (Università della California San Francisco) per il calcolo dei modelli 3D per il TIER 1 Genomi patogeni negli obiettivi TDR. L.U.L., A.B. e s.v. erano o sono supportati da Boyship del Consiglio Nazionale della ricerca (Conicet, Argentina). A.C. e F.A. sono membri della carriera di ricerca del Consiglio Nazionale della ricerca (Conicet, Argentina). P.M. vorrebbe riconoscere una comunione dalla commissione di sovvenzioni universitarie (UGC), in India.

Finanziamento

Glaxosmithkline Argentina e l’agenzia nazionale per la promozione della scienza e della tecnologia, Argentina (Anpcyt); Progetto di cooperazione bilaterale indo-argentina (finanziamento congiunto del Dipartimento indiano della Scienza e della tecnologia (DST) e del Ministero della Scienza e della Tecnologia Argentina (Mincyt). Finanziamento per accuse di accesso aperto: Fondo Para La Investigación Científica Y Tecnológica.

Conflitto di iscrizione interesse. Nessuno dichiarato.

Note

Indirizzo attuale: Ariel J Berenstein, Instituto Multidisciplinario De Investigaciones en Patologías Pediáttricas (IMPP), Conicet-GCBA, Laboratorio de Biología molecolare, División Patología, Hospital de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

hotez
Pj

,

molyneux
dh

,

fenwick
a.

,

kumaresan
j.

,

sachs
se

,

sachs
jd

,

savili
l.
Controllo delle malattie tropicali trascurate

.

n. engl. J. med.
2007

;

357

:

1018

1027

.

umiller
p.

,

olliaro
p.

,

torreele
e.

,

orbinski
j.

,

laing
r.

,

guado
n.
sviluppo di farmaci per malattie trascurate: un mercato carente e un pubblico -Sessore della politica health

.

lancet nord am. Ed.
2002

;

359

:

2188

2194

.

hughes
j.

,

rees
s.

,

kalindjian
s

,

philpott
k.
Principi di scoperta anticipata del farmaco

.

br. J. PHARMACOL.
2011

;

162

:

1239

1249

.

adams
cp

,

Brantner
vv
Stima il costo del nuovo sviluppo di farmaci: è davvero $ 802 milioni

.

AFF. (Millwood)

.

2006

;

25

:

420

428

.

wyatt
pg

,

gilbert
ih

,

Leggi
kd

,

Fairlamb
ah
convalida target : Collegamento di proprietà target e chimiche al profilo del prodotto desiderato

.

curr. Superiore. Med. Chem.
2011

;

11

:

1275

1283

.

farha
ma

,

marrone
ed
Ricerca di farmaci per la scoperta antimicrobica

.

nat. Microbiol.
2019

;

4

:

565

577

.

hernandez
hw

,

Soeung
m.

,

Zorn
km

,

ashoura
n.

,

Mottin
m.

,

andrade
ch

,

caffrey
cr

,

de silira-neto
jl

,

Ekins
s
high throughput e computazioni di recupero per malattie trascurate

.

Pharm. Res.
2018

;

36

:

27

.

wooller
sk

,

benstead- Hume
g.

,

chen
x.

,

ali
y.

,

Pearl
fmg
bioinformatica nella scoperta di farmaci traslazionali

.

bioshi. REP.
2017

;

37

:

doi: 10.1042 / bsr20160180

.

agüero
f.

,

al -Lazikani
b.

,

Aslett
m.

,

Berriman
m.

,

Buckner
fs

,

campbell
rk

,

carmona
s.

,

Carruthers
im

,

chan
awe

,

chen
f .

et al. .

Bilancia genomica Prioritazione dei bersagli farmacologici: il TDR indica il database

.

nat. Rev. Drug Discov.
2008

;

7

:

900

907

.

crowther
gj

,

shanmugam
d.

,

carmona
sj

,

doyle
mA

,

Hertz-fowler
c.

,

Berriman
m.

,

nwaka
s

,

ralph
sa

,

roos
ds

,

van voorhis
wc

et al. .

Identificazione di bersagli farmaco attraenti in agenti patogeni della malattia trascurata che utilizzano un approccio in silico

.

Plos nebl. Trop. Dis.
2010

;

4

:

E804

.

lykins
jd

,

filippova
ev

,

halavaty
come

,

minasov
g.

,

Zhou
y.

,

dubrovska
i.

,

flores
kj

,

shuvalova
la

,

ruan
j.

,

el bissati
k.

et al. .

csgid risolve le strutture e identifica i fenotipi per cinque enzimi in toxoplasma gondii

.

anteriore. Cellula. Infettare. Microbiol.
2018

;

8

:

352

.

shanmugam
d.

,

ralph
sa

,

carmona
sj

,

crowther
gj

,

Roos
ds

,

agüero
f.
caffrey
cr

,

Selzer
PM
Integrando e minerario Genomi di Helminth per scoprire e prioritizzare nuovi target terapeutici

.

Elminti parassiti: obiettivi, schermi, droghe e vaccini

.

2012

;

wiley-blackwell
43

59

.

magariños
mp

,

carmona
sj

,

crowtherwher
gj

,

ralph
sa

,

roos
ds

,

shanmugam
d.

,

van voorhis
wc

,

Agüero
f.
TDR Targets: una risorsa chemogenomica per malattie trascurate

.

nucleico. Acidi. Res.
2012

;

40

:

D1118

D1127

.

berenstein
aj

,

magariños
mp

,

chenomoretz
a.

,

agüero
f.
Un approccio di rete multistrato per guidare il riposizionamento dei farmaci nelle malattie trascurate

.

Plos nebl. Trop. Dis.
2016

;

10

:

E0004300

.

kim
k.

,

weiss
lm
toxoplasma gondii: il modello apicomplexan

.

int. J. parassitolo.
2004

;

34

:

423

432

.

sidik
sm

,

huet
d.

,

ganesan
sm

,

huynh
m.-h.

,

wang
t.

,

nasamu
come

,

thiru
P. / Div>,

saeij
jpj

,

carruthers
vb

,

nile
jc

et al. .

Una schermata CRISPR a livello di genoma in Toxoplasma identifica i geni di Apicomplexan essenziali

.

cella

.

2016

;

166

:

1423

1435

.

gajria
b.

,

bahl
a.

,

brestelli
j.

,

Dommer
j.

,

Fischer
s

,

gao
x.

,

heiges
m.

,

iodice
j.

,

kissinger
jc

,

Mackey
AJ

et al. .

TOXODB: una risorsa del database Gondii Toxoplasma integrata

.

acidi nucleici res.
2007

;

36

:

d553

d556

.

warrenfeltz
s.

,

basenko
ey

,

crouch
k.

,

harb
OS

,

Kissinger
jc

,

roos
ds

,

shanmugasundram
a.

,

Silva-Franco
f.
kollmar
m
eupathdb: la risorsa del database di eucariotic patogeno genomica

.

Database genomici eucariotici

.

2018

;

1757

:

ny
springer
69

113

.

sayers
ew

,

agarwala
r.

,

bolton
ee

,

Brister
jr

,

Canase
k.

,

clark
k.

,

connor
r.
Fiorini
n.

,

funk
k.

,

hefferon
t.

et al. .

Risorse del database del Centro nazionale per informazioni sulla biotecnologia

.

acidi nucleici res.
2019

;

47

:

D23

D28

.

hertz-fowler
c.

,

Peacock
cs
Presentazione GENEDB: un database generico

.

tendenze parassilo.
2002

;

18

:

465

467

.

bullone
bj

,

rodgers
fh

,

shafie
m.

,

kersey
pj

,

Berriman
m.

,

howe
kl
utilizzando il parassita wormbase: una piattaforma integrata per esplorare i dati genomici di Helminth

.

Metodi mol. BIOL.
2018

;

1757

:

471

491

.

lechat
p.

,

hummel
l.

,

rousseau
s.

,

moszer
i.
Genolist: un ambiente integrato per analisi comparativa dei genomi microbici

.

acidi nucleici res.
2007

;

36

:

d469

d474

.

kapopoulou
a.

,

lew
jm

,

cole
st
il portale mycobrowser: una risorsa completa e annotata manualmente per i genomi mycobatteri

.

tubercolosi

.

2011

;

91

:

8

13

.

cameracho
c.

,

coulouris
g.

,

avagyan
v.

,

m ma
n.

,

papadopoulos
j.

,

boaler
k.

,

madden
tl
BLAST +: architettura e applicazioni

.

BIOINFORMATICE BMC

.

2009

;

10

:

421

.

hancock
jm

,

Bishop
mj
gomboss (la Biologia europea Biologia Apri Software Suite)

.

dizionario di bioinformatica e biologia computazionale

.

2004

;

chichester
john wiley & figli, ltd
dob0206

.

krogh
a.

,

larsson
b.

,

von heijne
g.

,

sonnhammer
el
PREDICT Topologia proteica transmembrana con un modello Markov nascosto: applicazione per completare i genomi

.

j. Mol. BIOL.
2001

;

305

:

567

580

.

almagro armeneros
jj

,

tsirigos
kd

,

sønderby
ck

,

petersen
tn

,

Winther
o.

,

brunak
s.

,

von heijne
g.

,

nielsen
h.
Signalp 5.0 migliora le previsioni del peptide del segnale usando reti neurali profonde

.

nat. Biotecnolo.
2019

;

37

:

420

423

.

pierleoni
a.

,

martelli
p.

,

Casadio
r.
predgpi: un predittore GPI-Anchor

.

BIOINFORMATICE BMC

.

2008

;

9

:

392

.

moriya
y.

,

itoh
m.

,

okuda
s.

,

yoshizawa
ac

,

Kanehisa
m.
kaas: un annotazione automatica del genoma e il server di ricostruzione del percorso

.

acidi nucleici res.
2007

;

35

:

w182

w185

.

chen
f.

,

Mackey
aj

,

stoeckert
cj

jr,

roos
ds
Orthomcl-DB: interrogare una collezione multi-specie completa di gruppi ortholog

.

acidi nucleici res.
2006

;

34

:

D363

D368

.

fischer
s

,

Brounk
bp

,

chen
f.

,

gao
x.

,

Harb
OS

,

IODICE
JB

,

Shanmugam
d.

,

roos
ds

,

stoeckert
cj

jr

usando l’orthomcl per assegnare proteine a gruppi orthomcl-db o a Protea di cluster in nuovi gruppi ortholog

.

curr prooc bioinforma.
2011

;

DOI: 10.1002 / 0471250953.BI0612S35

.

mitchell
al

,

Attwood
tk

,

babbitt
pc

,

Blum
m.

,

Bork
p.

,

bridge
a.

,

marrone
sd

,

chang
h.-y.

,

el-gebali
s

,

fraser
MI

et al. .

Interpro nel 2019: migliorare la copertura, la classificazione e l’accesso alle annotazioni di sequenze di proteine

.

acidi nucleici res.
2019

;

47

:

D351

D360

.

jones
p.

,

binns
d.

,

chang
h.-y.

,

fraser
m.

,

li
w.

,

mcanulla
c.

,

mcwilliam
H.

,

maslen
j.

,

mitchell
a.

,

nuka div. >

g.

et al. .

Interproscan 5: Classificazione della funzione proteica della scala del genoma

.

bioinforma. Oxf. ENGL.
2014

;

30

:

1236

1240

.

burley
sk

,

berman
hm

,

bhikadiya
c.

,

bi
c.

,

Chen
l.

,

costanzo
ld

,

Christie
c.
Duarte
jm

,

dutta
s

,

feng
z.

et al. .

Banca dati proteica: il singolo archivio globale per i dati della struttura macromolecolare 3D

.

acidi nucleici res.
2019

;

47

:

D520

D528

.

Pieper
u.

,

webb
bm

,

dong
gq

,

schneidman-duhovny
d.

,

fan
h.

,

kim
sj

,

khuri
n.

,

Spill
yg

,

weinkam
p.

,

hammel
m .

et al. .

ModBase, un database di modelli di struttura proteica comparativa annotata e risorse associate

.

acidi nucleici res.
2014

;

42

:

D336

D346

.

zhu
l.

,

mok
s.

,

imwong
m.

,

jachee
a.

,

russell
b.

,

nosten
f.

,

giorno
np

,

bianco
nj

,

preiser
pr

,

bozdech
z.
nuove intuizioni nel trascrittoma del plasmodium vivax usando RNA-Seq

.

SCI. Rappresentante
2016

;

6

:

20498

.

smircich
p.

,

Eastman
G.

,

BISPO
S.

,

DUHAGON
MA

,

Guerra-Slompo
ep

,

garat
b.

,

Goldenberg
s.

,

munroe
dj

,

Dallagiovanna
b.

,

beatz
F.

et al. .

profilazione ribosoma rivela il controllo della traduzione come meccanismo chiave che genera espressione genica differenziale nel tripanosoma cruzi

.

BMC Genomics

.

2015

;

16

:

443

.

lasonde
e.

,

rijpma
sr

,

van schaijk
bcl

,

hoeijmakers
wam

,

Kensche
Pr

,

Gresnigt
ms

,

italiaander
a.

,

vos
mw

,

woestenenk
r.

,

bousema
t.

et al. .

Analisi integrate e proteomiche e proteomiche di Gametociti P. Falciparum: intuizione molecolare dei processi specifici del sesso e della repressione del traduttore

.

acidi nucleici res.
2016

;

44

:

6087

6101

.

Otto
td

,

wilinski
d.

,

Assefa
s.

,

keane
tm

,

Sarry
lr

,

Böhme
u.

,

lemieux
j.

,

barrell
b.

,

dolore
a.

,

berriman
m.

et al. .

Nuove approfondimenti nel trascrittoma di stadio sanguigna di Plasmodium falciparum usando RNA-Seq

.

mol. Microbiol.
2010

;

76

:

12

24

.

Otto
td

,

böhme
u.

,

jackson
ap

,

hunt
m.

,

Franke-Fayard
b.

,

hoeijmakers
wam

,

religna
AA

,

robertson
l.

,

sanders
m.

,

ogun
sa

et al. .

Una valutazione completa del roditore Genomi di parassita di malaria e espressione genica

.

BMC BIOL.
2014

;

12

:

86

.

zanghì
g.

,

vembar
ss

,

baumgarten
s

,

ding
s.

,

Guizetti
j.

,

Bryant
jm

,

mattei
d.

,

Jensen
atr

,

rénia
l.

,

goh
ys

et al. .

Un PFEMP1 specifico è espresso in P. Falciparum Sporozoiti e svolge un ruolo nell’infezione da epatociti

.

REP.
2018

;

22

:

2951

2963

.

fernandes
mc

,

Dillon
LAL

,

BELLEW
AT

,

BRAVO
HC

,

MOSSER
dm

,

el-sayed
nm
Dual Transcriptome Profiling of Leishmania-infettato macrofagi umani rivela distinti firme di riprogrammazione

.

mbio

.

2016

;

7

:

E00027-16

.

fritz
hm

,

buchholz
kr

,

chen
x.

,

Durbin-johnson
b.

,

rocke
dm

,

conrad
pa

,

boothroyd
jc
L’analisi transcriptomica dello sviluppo toxoplasma rivela molte nuove funzioni e strutture specifiche per sporozoiti e oocisti

.

Plos one

.

2012

;

7

:

E29998

.

hon
c.-c.

,

weber
c.

,

sismeiro
o.

,

Proox
c.

,

kouetero
m.

,

deloger
m.

,

das
S.

,

agrahari
m.

,

Dillies
m.-a.

,

jagla
b.

et al. .

quantificazione del rumore stocastico di splicing e poliadenilazione in Entamoeba histolytica

.

acidi nucleici res.
2013

;

41

:

1936

1952

.

siegel
tn

,

hekstra
DR

,

Wang
x.

,

dewell
s.

,

croce
gam
analisi del genoma-ampia dell’ammana abbondanza Due fasi a ciclo di vita del tripanosoma Brucei e identificazione dei siti di splicing e poliadenilazione

.

acidi nucleici res.
2010

;

38

:

4946

4957

.

yeoh
lm

,

goodman
cd

,

Mollard
v.

,

mcfadden
gi

,

Ralph
sa
Transcrittomica comparativa dei gametociti femminili e maschili in Plasmodium Berghei e l’evoluzione del sesso in alveolati

.

BMC Genomics

.

2017

;

18

:

734

.

hehl
ab

,

basso
wu

,

lippuner
c.

,

makrishnan
c.

,

Okoniewski
m.

,

walker
ra

,

grigg
me

,

smith
nc

,

deplazes
p.
asessual espansione di tossoplasma gondii merozoiti è distinta dai tachiti e comporta espressione di famiglie geniche non sovrapposte da allegare, invadere e replicare all’interno di enterocytes felini

.

BMC Genomics

.

2015

;

16

:

66

.

Bushell
e.

,

Gomes
ar

,

sanderson
t.

,

anar
b.

,

giring
g.

,

gregge
c.

,

metcalf
t.

,

modrzynska
k.

,

schwach
f.

,

Martin
Re

et al. .

La profilazione funzionale di un genoma plasmodium rivela un’abbondanza di geni essenziali

.

cella

.

2017

;

170

:

260

272

.

mendez
d.

,

gaulton
a.

,

bento
ap

,

chambers
j.

,

de veij
m.

,

félix
e.

,

magariños
mp

,

mosquera
jf

,

mutowo
p.

,

Nowska
m .

et al. .

Chembl: verso la deposizione diretta dei dati bioassay

.

acidi nucleici res.
2019

;

47

:

D930

D940

.

peña
i.

,

pilar Manzano
m.

,

cantizani
j.

,

kessler
a.

,

alonso-padilla
j.

,

bardera
ai

,

alvarez
e .

,

Colmenarejo
g.

,

cotillo
i.

,

roquero
i.

et al. .

Nuovi set composti identificati da uno screening fenotipico ad alto throughput contro tre parassiti kinetoplastid: una risorsa aperta

.

SCI. Rappresentante
2015

;

5

:

8771

.

spangenberg
t.

,

Burrows
jn

,

kowalczyk
p.

,

mcdonald
s.

,

wells
tnc

,

willis
p.
la scatola della malaria di accesso aperto: un catalizzatore di scoperta di farmaci per malattie trascurate

.

Plos one

.

2013

;

8

:

E62906

.

haider
n.
funzionalità Abbinamenti come un efficiente strumento complementare / strumento di ricerca di reazione: un approccio open source

.

molecole

.

2010

;

15

:

5079

5092

.

cheng
t.

,

zhao
y.

,

li
x.

,

lin
f.

,

xu
y.

,

zhang
x.

,

li
y.

,

wang
r.

,

lai
l
calcolo di coefficienti di partizione d’acqua ottanolo Guidare un modello additivo con la conoscenza

.

j. Chem. INF. Modello.
2007

;

47

:

2140

2148

.

o’boyle
nm

,

Banck
m.

,

james
ca

,

morley
c.

,

vandermeersch
t.

,

hutchison
gr
aperto babel: una casella utensile chimica aperta

.

j. Cheminformatics

.

2011

;

3

:

33

.

heller
sr

,

mcNaught
a.

,

pletnev
i.

,

stein
s.

,

tchekhovskoi
d.
Inchi, l’identificatore chimico internazionale IUPAC

.

j. Cheminformatics

.

2015

;

7

:

23

.

lipinski
ca

,

lombardo
f.

,

Dominy
bw

,

feeney
PJ
sperimentale e approcci computazionali per stimare la solubilità e la permeabilità nelle impostazioni di scoperta e sviluppo del farmaco

.

adv. Drug Deliv. Rev.
2001

;

46

:

3

26

.

congreve
m.

,

carr
r.

,

murray
c.

,

jhoti
h.
a ‘Regola dei tre’ per la scoperta del lead basata sul frammento

.

Drug Discov. Oggi

.

2003

;

8

:

876

877

.

dyke
a.
chemifp – Formati e strumenti di impronte digitali veloci e portatili

.

j. Cheminformatics

.

2011

;

3

:

P12

.

rogers
dj

,

tanimoto
TT
un programma per computer per la classificazione delle piante

.

Scienza

.

1960

;

132

:

1115

1118

.

youden
wj
indice per il rating Test diagnostici

.

Cancro

.

1950

;

3

:

32

35

.

bostock
m.

,

ogievetsky
v.

,

heer
j.
D3 D3 Documenti guidati da dati

.

IEEE TRANS. Vis. Computer. Grafico.
2011

;

17

:

2301

2309

.

probst
d.

,

reymond
j.-l.
Smilesdrawer: analizzare e disegnare strutture molecolari codificate con sorrisi utilizzando il lato client javascript

.

j. Chem. INF. Modello.
2018

;

58

:

1

7

.

© The Autore / i 2019. Pubblicato da Oxford University Press On Behalf of Nucleic Acids Research.
Questo è un articolo di accesso aperto distribuito sotto i termini della licenza Creative Commons Attribuzione non commerciale (http://creativecommons.org/licenses/by-nc/4.0/), che consente il riutilizzo, la distribuzione e la riproduzione non commerciali In qualsiasi mezzo, a condizione che il lavoro originale sia correttamente citato. Per riutilizzo commerciale, si prega di contattare [email protected]

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *