Obiectivele TDR 6: Discovery de droguri pentru agenții patogeni umani prin integrarea intensivă a datelor chimiogenomice Cercetarea acizilor nucleici

Rezumat

Volumul de date biologice, chimice și funcționale depuse în domeniul public crește rapid, datorită secvențării generațiilor următoare și tehnologiilor de screening foarte automatizate. Aceste seturi de date reprezintă resurse neprețuite pentru descoperirea de droguri, în special pentru agenții patogeni de boală neglijați mai puțin studiați. Pentru a mobiliza aceste seturi de date, integrarea inteligentă și cea intensă a datelor este necesară pentru a ghida inferențele computaționale în diferite organisme. Resursele TDR vizează resursele genomice integrează datele genomice de la agenții patogeni umani și organismele model, împreună cu informații despre compușii bioactivi și activitățile lor adnotate. Acest raport evidențiază cele mai recente actualizări privind datele și funcționalitățile disponibile în țintele TDR 6. Pe baza modelelor de rețea chimiogenomică care oferă legături între inhibitori și ținte, baza de date încorporează acum prioritizări țintă bazate pe rețea și noi vizualizări ale subprafilor de rețea care prezintă chimic- și țintă – cartierelor similare, împreună cu legăturile de bioactivitate țintă asociate. Datele disponibile pot fi navigate și interogate printr-o nouă interfață de utilizator, care permit utilizatorilor să efectueze prioritizări ale țintelor de proteine și de inhibitori chimici. Ca atare, obiectivele TDR facilitează acum investigația privind reproșarea medicamentelor împotriva țintelor patogene, care pot contribui la identificarea țintelor candidate pentru compușii bioactivi cu obiective necunoscute anterior. Obiectivele TDR sunt disponibile la IV id = „C0600C5841” .

Boli tropicale neglijate (NTD) afectează în mod disproporționat ~ 1,5 miliarde de persoane în venituri mici și în curs de dezvoltare Țări, unde sunt o cauză principală pentru viața de viață pierdută de handicap și moarte prematură (1). Din punct de vedere istoric, lipsa de implicare din industria farmaceutică, în combinație cu investiții limitate în programele de cercetare în domeniul sănătății publice din țările afectate, a dus la o deficiență a medicamentelor disponibile pentru a controla în mod eficient majoritatea acestor boli (2). În plus, medicamentele care figurează în prezent pentru a trata aceste boli sunt adesea compromise în ceea ce privește costurile, dificultățile în administrare, eficacitatea, rezistența la medicament sau profilele de siguranță.

Discovery-ul de droguri este un proces consumator de timp și costisitor (3 , 4). Pentru NTDS, în special, programele de descoperire a medicamentelor trebuie să supraviețuiască suficient de mult prin lipsuri de finanțare pervazivă pentru ao face în studiile clinice ulterioare (5). În acest context, o abordare strategică pentru descoperirea de droguri NTD este repoziționarea medicamentelor (6), care poate contribui la reducerea costurilor prin facilitarea aprobărilor de reglementare la studiile timpurii pentru medicamente care au suferit deja cercetări clinice pentru alte boli și / sau indicații și au eșuat din alte motive decât siguranța (6). În plus, în cazul în care domeniul de reproșare a medicamentelor este extins pentru a include medicamente și compuși bioactivi din cercetarea organismelor neumane, acesta poate duce, de asemenea, la identificarea cel puțin noi instrumente chimice pentru probarea funcției țintelor și căilor în agenții patogeni umani. Astfel, prin utilizarea cantităților vastă de date disponibile din programele de cercetare bine finanțate privind bolile umane și organismele modelului, peisajul de descoperire a medicamentului pe NTDS primește un impuls pozitiv (7).

Strategiile computaționale devin din ce în ce mai mult esențială în descoperirea de droguri translațională, atât în mediul academic, cât și în industria farmaceutică. Integrarea inteligentă, intensivă a volumelor crescânde de date generate în toate fazele descoperirii de droguri, permițând deja provocărilor cheie ale procesului care urmează să fie abordat (8). De la introducerea sa, baza de date TDR vizează o resursă fiabilă pentru cercetătorii de boli neglijate pentru a accesa datele de chemogenomice pentru prioritizarea țintă a drogurilor și reproșarea medicamentelor asupra bolilor neglijate. Introdus în 2008 (9), această resursă de acces deschis a permis cercetătorilor să găsească obiective noi de proteine și inhibitori chimici și să le prioritizeze pentru a ajuta la dezvoltarea de droguri pentru agenții patogeni NTD. Obiectivele TDR utilizează seturile de date funcționale la nivel de genom general disponibile pentru a permite utilizatorilor să găsească și să prioritizeze țintele pe baza cunoștințelor lor despre biologia patogenului lor de interes și natura bolii (10,11). Acest lucru este implementat de o selecție țintă flexibilă (utilizând criterii de filtrare) și clasament (utilizând ponderarea specifică a criteriilor) (12,13).

Aici, descriem actualizările la seturile de date subiacente și Funcționalitatea în obiectivele TDR, acumulate de la publicarea sa anterioară în 2012 (13). Noul obiectiv TDR eliberat (v6.1, abreviat TDR6 în această lucrare) integrează informațiile genomice specifice patogene cu date funcționale (de exemplu,Expresie, relații bazate pe ortologie, esențiale) dintr-o selecție de organisme, împreună cu datele compușilor bioactivi (structura chimică, proprietatea și bioactivitatea / informațiile țintă); Toate acestea pot fi interogate și navigate prin aplicația web. Toate interogările pot fi salvate către un stash personal de către utilizatorii înregistrați și publicați prin aplicația web pentru a maximiza oportunitățile de colaborare. Listele prioritare de obiective pot fi exportate pentru o analiză suplimentară în afara liniei. Detaliile complete ale tuturor caracteristicilor noi pot fi găsite în notele de lansare (https://tdrtargets.org / versiuni). Acest raport prezintă o plimbare completă a aplicației web, a caracteristicilor sale noi și exemplelor de ilustrare a cazurilor de utilizare.

Prezentare generală și organizarea țintelor TDR

Ca și în versiunile anterioare ale obiectivelor TDR, TDR6 este, de asemenea, organizată în două secțiuni principale: ținte și compuși. Secțiunea Obiective a bazei de date conține date genomice pentru 20 de agenți patogeni umani și permite utilizatorilor să ruleze interogări și prioritizări ale țintelor de proteine pe baza unui număr de caracteristici și date relevante pentru descoperirea medicamentului (a se vedea tabelul 1). Secțiunea compușilor din baza de date conține informații despre > 2 milioane de compuși bioactivi și permite interogări pe baza proprietăților chimice ale compușilor și a bioactivităților lor adnotate (vezi Tabelul 2).

Tabelul 1.

Interogările țintă disponibile în țintele TDR

interogare grup.	patogeni pentru care sunt disponibile date.	tipuri de date disponibile pentru interogare.
nume & Adnotări	Toate	Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică)
Caracteristicile proteinelor	Toate	MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI).
Informații structurale	Toate	Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase
Expresia genei	PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII	Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului.
Informații filogenetice	Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați.
esențial	C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei	Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model.
Validarea țintă Date	Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum	Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii)
drugglabil	Toate	Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal)
tezay	Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE)
Referințe bibliografice	Toate obiectivele de filtrare pe baza publicațiilor disponibile

div id = „

interogare grup. patogeni pentru care sunt disponibile date. tipuri de date disponibile pentru interogare.

iv id = „05d81063d3”

nume Adnotări Toate Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică) Caracteristicile proteinelor Toate MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI). Informații structurale Toate Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase Expresia genei PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului. Informații filogenetice Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați. esențial C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model. Validarea țintă Date Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii) drugglabil Toate Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal) tezay Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE) Referințe bibliografice Toate obiectivele de filtrare pe baza publicațiilor disponibile

Tabelul 1 .

Interogările țintă disponibile în țintele TDR

Grupul de interogare.	patogeni pentru care sunt disponibile date.	tipuri de date disponibile pentru interogare.
nume & Adnotări	Toate	Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică)
Caracteristicile proteinelor	Toate	MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI).
Informații structurale	Toate	Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase
Expresia genei	PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII	Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului.
Informații filogenetice	Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați.
esențial	C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei	Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model.
Validarea țintă Date	Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum	Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii)
drugglabil	Toate	Precedent pentru modularea chimică reușită a activității sau funcției țintă.Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal)
tezay	Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE)
Referințe bibliografice	Toate obiectivele de filtrare pe baza publicațiilor disponibile

div id = „

interogare grup. patogeni pentru care sunt disponibile date. tipuri de date disponibile pentru interogare. nume & Adnotări Toate Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică) Caracteristicile proteinelor Toate MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI). Informații structurale Toate Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase Expresia genei PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului. Informații filogenetice Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați. esențial C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model. Validarea țintă Date Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii) drugglabil Toate Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal) tezay Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE) Referințe bibliografice Toate obiectivele de filtrare pe baza publicațiilor disponibile

Tabelul 2 .

interogări compuse disponibile în țintele TDR

iv id = „05d81063d3”

Bioactivitate

Grupul de interogare.	tipuri de date disponibile pentru interogare.
Căutări bazate pe text
nume & adnotări	nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI
Proprietăți chimice	Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski)
Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N)	Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm)
Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane)
Compuși cu ținte	Găsiți Compușii care au teste de informare și mecanism țintă
Căutări pe bază de structură
similitudine compus	Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice
Structura compusă	Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.

div id = „1B01F6074E”

interogare grup. tipuri de date disponibile pentru interogare.

iv id = „05d81063d3”

Căutări bazate pe text nume & adnotări nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI Proprietăți chimice Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski) Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N)

Bioactivitate

Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm) Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane) Compuși cu ținte Găsiți Compușii care au teste de informare și mecanism țintă Căutări pe bază de structură similitudine compus Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice Structura compusă Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.

Tabelul 2.

Interogările compuse disponibile în țintele TDR

Grupul de interogare.

iv id = „05d81063d3”

Bioactivitate

tipuri de date disponibile pentru interogare.
Căutări bazate pe text
nume & adnotări	nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI
Proprietăți chimice	Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski)
Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N)	Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm)
Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane)
Compuși cu ținte	Găsiți Compușii care au teste de informare și mecanism țintă
Căutări pe bază de structură
similitudine compus	Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice
Structura compusă	Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.

div id = „1B01F6074E”

interogare grup. tipuri de date disponibile pentru interogare.

iv id = „05d81063d3”

Bioactivitate

Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu,IC50 < 5 μm) Orfan Căutarea compușilor care au rapoarte de bioactivitate în întregul organism sau testele întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane) Compuși cu ținte Găsiți compuși care au informații și mecanism țintă Teste Căutări pe bază de structură similitudine compus tragere / pastă Structura compusului sau fragmentului 2D și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice Structura compusă Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.

Noi caracteristici în Obiectivele TDR 6

Am raportat recent un model de rețea integrat (14) în care toate seturile de date de scară genomice disponibile în țintele TDR (ținte proteice), informații chimice (compuși bioactivi) și relațiile lor (bioactivitatea compușilor din Analizele bazate pe țintă) au fost legate într-un grafic multistrat. În TDR6, acest model de rețea a fost actualizat prin integrarea noilor seturi de date (descrise mai jos). Acest model încorporează legături între obiective și compuși bioactivi derivați din manevrarea manuală a analizelor de bioactivitate publicate (adică legăturile directe între obiective și compușii chimici), precum și din relațiile calculate (legăturile țintă țintă și legăturile compuse) pe baza adnotărilor de proteine (Domeniile PFAM, Grupurile Ortholog) și similitudinea chimică. Un aspect cheie al acestor legături în modelul de rețea multistrat este că acestea permit explorarea rapidă și vizualizarea vecinătății în jurul țintelor selectate și / sau compușii bioactivi. Acest lucru permite utilizatorilor să exploreze compușii legați de ținte, să inspecteze vecinătatea asemănătorilor chimice în jurul compușilor bioactivi și să vizualizeze aceste date într-o manieră prietenoasă și cuprinzătoare (a se vedea figura 1).

Div>

Figura 1.

Model de rețea schematică în vizualizările TDR6 și sub-grafic: Paginile compuse sau țintă afișează acum o vizualizare subgraph care conține obiecte în vecinătatea rețelei entității selectate. Aceste grafice sunt construite dintr-un grafic de rețea complex cu trei straturi. O schemă a acestui grafic este prezentată în partea de sus. Ambele țintă și compusul subgrame sunt aranjate întotdeauna după cum urmează: nodurile compuse (verde) sunt conectate la ținte (portocaliu = agenți patogeni; gri = ne-patogeni) prin margini de bioactivitate. Aceste legături prezintă rezultate pozitive (verde), neutre (gri) sau negative (roșu). În cele din urmă, vizează harta unui set de afilități funcționale (adnotări, noduri albastre). În exemplu, graficul prezintă un set de inhibitori cunoscuți pentru o aciltransferază umană (15). Aceste bioactivități (toate pozitive) sunt trase ca legături verzi între compușii (noduri verzi) și țintă (noduri gri pentru agenții patogeni, noduri portocalii pentru agenții patogeni). Graficul evidențiază oportunitățile de reprogramare a helmintului aciltransferazelor (linii punctate, adăugate manual pentru această figură), pe baza adnotărilor partajate cu ținta umană cunoscută. Nodul roșu din stratul de medicament indică compusul selectat. Dimensiunile nodurilor sunt determinate de numărul de conexiuni din rețea (grad), în timp ce lățimile de legătură de bioactivitate (marginile) sunt legate de numărul cumulat de dovezi experimentale pentru o anumită pereche de țintă medicament (numărul de teste).

Figura 1.

Model de rețea schematică în vizualizările TDR6 și sub-grafic: Paginile compuse sau țintă afișează acum o vizualizare subgraph care conține obiecte în rețeaua de vecinătate a entității selectate. Aceste grafice sunt construite dintr-un grafic de rețea complex cu trei straturi. O schemă a acestui grafic este prezentată în partea de sus. Ambele țintă și compusul subgrame sunt aranjate întotdeauna după cum urmează: nodurile compuse (verde) sunt conectate la ținte (portocaliu = agenți patogeni; gri = ne-patogeni) prin margini de bioactivitate. Aceste legături prezintă rezultate pozitive (verde), neutre (gri) sau negative (roșu). În cele din urmă, vizează harta unui set de afilități funcționale (adnotări, noduri albastre). În exemplu, graficul prezintă un set de inhibitori cunoscuți pentru o aciltransferază umană (15). Aceste bioactivități (toate pozitive) sunt trase ca legături verzi între compușii (noduri verzi) și țintă (noduri gri pentru agenții patogeni, noduri portocalii pentru agenții patogeni). Graficul evidențiază oportunitățile de reprogramare a helmintului aciltransferazelor (linii punctate, adăugate manual pentru această figură), pe baza adnotărilor partajate cu ținta umană cunoscută. Nodul roșu din stratul de medicament indică compusul selectat. Dimensiunile nodurilor sunt determinate de numărul de conexiuni din rețea (grad), în timp ce lățimea legăturii de bioactivitate (marginile) sunt legate de numărul cumulat de dovezi experimentale pentru o anumită pereche de țintă medicament (număr de teste).

Cu aceste actualizări, TDR6 oferă utilizatorilor următoarele funcționalități: (i) prioritizări țintă integral bazate pe rețea, (ii) explorarea reproșării medicamentelor; și iii) explorarea țintelor candidate pentru compușii orfani. Aceste cazuri de utilizare sunt posibile printr-o serie de caracteristici bazate pe rețea precompute, cum ar fi un scor nou de droguri de rețea (ND). Prin asocierea unei metrici cantitative la țintele bazate pe îmbogățirea compușilor bioactivi pe nodurile de rețea strâns legate, acest scor facilitează clasificarea țintelor în grupuri de droguri (DGS), care sunt disponibile utilizatorilor în interogările bazei de date.

Modelul de rețea este, de asemenea, baza pentru prioritizările prioritare conduse de rețea (NDP) care pot fi interogate de utilizatori și sunt, de asemenea, utilizate pe plan intern de către TDR6 pentru a selecta țintele și compușii conectați pentru afișarea în vizualizările rețelei nou dezvoltate (a se vedea mai jos). La pornind de la un compus de interes, TDR6 utilizează prioritizările precompuse ale țintelor candidate pentru a ajuta utilizatorii din navigarea spațiului țintă din jurul compusului (și invers atunci când pornește de la o țintă de interes). Prin furnizarea acestor metrici de îmbogățire precompusă și clasamente, baza de date facilitează acum descoperirea de noi asociații țintă de droguri. În afară de aceste NDP-uri noi, utilizatorii pot prioritiza țintele care utilizează aceeași funcție ca și în versiunile anterioare ale TDR.

Această versiune include și mai multe actualizări de date, și anume includerea a 22 de genomi noi (20 noi agenți patogeni și 2 noi Modelul organismelor) și actualizări extinse la datele chimice și bioactivității printre altele. Interfața cu utilizatorul îmbunătățită și versatilă, împreună cu actualizările de date reînnoiască angajarea obiectivelor TDR de a furniza un instrument integrat și puternic pentru explorarea datelor genomice și chimice în contextul bolilor tropicale neglijate.

Utilizarea țintelor TDR 6

Prioritizări țintă cu genomul întreg

Modelul de rețea (14) este baza pentru noul scor de droguri, care este o metrică derivată în rețea care este legată de îmbogățirea în compușii bioactivi pentru a țintă țintă (NDS, „Scorul de droguri de rețea”). NDS sunt disponibile pentru toate organismele de rangul 1, care pot fi interogate și utilizate pentru a intra în greutăți pentru a filtra (în sau out) țintă în conductele de prioritizare personalizate definite de utilizator. După cum sa explicat în continuare în detaliile integrării în rețea, pentru fiecare organism, obiectivele au fost clasificate în cinci grupuri de droguri (DG), de la cel mai mic (DG1) la cele mai înalte punctare (DG5), în funcție de performanța lor în prioritizările rețelei.

Ca și în versiunile anterioare ale țintelor TDR, utilizatorii pot combina diferite seturi de date pur și simplu prin efectuarea interogărilor individuale pe diferite tipuri de date și combinarea acestora la pagina Istoric (9,10,12,13). Acest lucru este util atunci când, de exemplu, utilizatorii ar dori să includă tipuri de date suplimentare pentru prioritizările bazate pe droguri, cum ar fi cele care se bazează pe expresia genei în etapele ciclului de viață relevante sau cele care furnizează informații privind fitness / letalitate a țintelor (esențiale).

Ca exemplu, prezentăm aici un exemplu de prioritizare utilizând Toxoplasma Gondii ca agent patogen de interes. T. Gondii este un parazit apicomplexan folosit adesea ca model pentru a investiga biologia care stă la baza mai multor boli umane și animale (15). Strategia de căutare este rezumată în figura 2. Interogarea a fost inițiată prin căutarea tuturor obiectivelor T. Gondii și prin filtrarea acestor ținte cu omologi la om (pentru a selecta numai obiective specifice parazitului). Apoi, am selectat genele esențiale candidate bazate pe profile de fitness în timpul infecțiilor fibroblastelor umane (16); și, de asemenea, genele selectate exprimate în tahiozoti (etapa replicativă a T. gondii), interogând pentru gene în top 80-100 percentil de abundența transcripției Rnaseq (17). Aceste selecții au fost combinate cu clasamentele de droguri de rețea. Pentru aceasta am considerat gene în grupurile de droguri 3, 4 sau 5 (DG ≥ 3) (a se vedea figura 2). Figura prezintă toate interogările și rezultatele lor, așa cum se vede în pagina Istorie și operațiunile efectuate la combinarea interogărilor (Union, Intersecție). Lista finală a obiectivelor clasate pe baza acestor criterii a fost făcută publică și este disponibilă în obiectivele TDR din listele postate.

Figura 2.

țintă Strategia de prioritizare pentru T. Gondii. Imaginea compozită arată (a) termenii de interogare utilizați pentru a găsi țintele T. Gondii care nu au homeologi la om, care sunt foarte exprimați în stadiul tahifizoriu virulent al parazitului în timpul infecției cu celule umane, care sunt probabil esențiale și sunt probabil drogate la scorul de droguri de rețea. (B) Rezumatul interogărilor efectuate la pagina „Obiective”, arătând modul în care aceste interogări apar în pagina „Istoric”, unde pot fi revizuite și transformate. Butoanele de gestionare a interogării in-line permit acțiunilor selectate (eliminați, redenumiți, exportați) pe seturi de rezultate.(C) Combinațiile de interogare permit utilizatorilor să execute Uniuni, să intersecteze sau să scadă acțiunile cu privire la interogările cu și unul de celălalt. Sunt prezentate exemple de acțiuni de intersecție și de intersecție. (D) interogările pot fi salvate la un stash privat (seturile de interogare) de unde pot fi trimise înapoi la spațiul de lucru (pentru a efectua operațiuni suplimentare de interogare) sau partajate în mod public cu alte vizite TDR (seturile de interogare țintă publicate).

Figura 2.

Prioritizare țintă Strategia pentru T. Gondii. Imaginea compozită arată (a) termenii de interogare utilizați pentru a găsi țintele T. Gondii care nu au homeologi la om, care sunt foarte exprimați în stadiul tahifizoriu virulent al parazitului în timpul infecției cu celule umane, care sunt probabil esențiale și sunt probabil drogate la scorul de droguri de rețea. (B) Rezumatul interogărilor efectuate la pagina „Obiective”, arătând modul în care aceste interogări apar în pagina „Istoric”, unde pot fi revizuite și transformate. Butoanele de gestionare a interogării in-line permit acțiunilor selectate (eliminați, redenumiți, exportați) pe seturi de rezultate. (C) Combinațiile de interogare permit utilizatorilor să execute Uniuni, să intersecteze sau să scadă acțiunile cu privire la interogările cu și unul de celălalt. Sunt prezentate exemple de acțiuni de intersecție și de intersecție. (D) interogările pot fi salvate la un stash privat (seturile de interogare) de unde pot fi trimise înapoi la spațiul de lucru (pentru a efectua operațiuni suplimentare de interogare) sau partajate în mod public cu alte vizite TDR (seturile de interogare țintă publicate).

Informațiile privind țintele cu medicamente cunoscute provin din curația literaturii, în timp ce asociațiile prevăzute (indirecte) ale țintelor cu inhibitori / medicamente sunt obținute prin calcule de similitudine sau ortologie a secvenței (la țintele de droguri cunoscute) sau prin inferențe sprijinite în rețea (14). Toate aceste metode sunt implementate în TDR6. Prin urmare, când utilizatorii filtrează o genă setată pe baza drogurilor, ele limitează selecția la obiective foarte clasate, care ar trebui să ofere o bogată sursă de oportunități de reproșare a medicamentului.

Pentru a prezenta utilitatea TDR6 în această zonă pe care o arătăm Cum să căutați medicamente candidate pentru reproșarea pentru Echinococcus Multilocularis (agentul cauzal al echinococozei alveolare). Acest lucru este arătat în figura 3. Procesul este similar cu cel descris anterior pentru T. Gondii, dar în această strategie de interogare nu am exclus omologi umani și am folosit seturile de date C. Elegans RNAI lethality ca proxy pentru esențialitatea nematodelor. Ca rezultat, am obținut o prioritizare cu totul genom pentru E. Multilocularis. Apoi, aplicând un filtru bazat pe droguri la această interogare, am redus selecția genei într-o mână de gene. Utilizatorul poate inspecta manual obiectivele selectate pentru a afla care medicamente au fost listate prin asociații indirecte. Paginile țintă vor afișa toți compușii asociați în secțiunea de droguri, clasificați în funcție de sursa deducției. Pentru inferențele bazate pe rețea, scorul pentru fiecare compus propus va apărea atât ca o listă, cât și ca un complot de rang, pentru a identifica rapid candidații promițători. Alternativ, pentru a minimiza inspecția manuală, lista genelor (adică interogarea în sine) poate fi ușor convertită într-o listă de medicamente asociate făcând clic pe butoanele „Convertiți aceste interogare” din partea de sus a paginilor rezultatelor interogării. Această funcție oferă o modalitate rapidă de a începe să creeze o bibliotecă de screening pentru un set de obiective. Transformările de interogare se pot baza pe curate (medicamente cunoscute pentru o setare a țintelor), prezise (asociații calculate la droguri) sau ambele. În toate cele trei abordări, inhibitorii / medicamentele asociate cu țintele cunoscute sunt asociate cu genele din listă. Figura 3 rezumă strategia de prioritizare, conversia interogării listei de gene la compuși și un exemplu de vizualizare sub-grafic disponibilă din pagina compusă a unei lovituri de reproșare. În prezent, aceste conversii sunt rulate în fundal și rezultatele apar în secțiunea Istoric a site-ului când este efectuată (utilizatorii sunt, de asemenea, alertați prin e-mail).

Figura 3.

Oportunități de reproșare a medicamentelor pentru E. Multilocularis folosind transformări de interogare. O schemă de prioritizare țintă pentru Echinococcus Multilocularis bazându-se pe inferența bazată pe ortologie și droguri previzionate (DG ≥ 3). (A) interogări combinate; (B) lista inițială a obiectivelor prioritare. (C) Orice listă țintă poate fi „transformată” într-o listă a medicamentelor asociate, utilizând oricare dintre metodele de legare a compusului disponibile (a se vedea textul principal). (D) Lista rezultată a compușilor bioactivi. (E) Exemplu de vizualizare a sub-graficului de rețea dintr-un compus selectat, care prezintă legături de bioactivitate activă și inactivă. Compușii (noduri verzi) sunt conectate la țintele patogene (portocaliu) în funcție de înregistrările de bioactivitate (verde = activ; roșu = inactiv, vezi textul principal pentru pragurile de activitate).Obiectivele, la rândul lor, sunt conectate (legăturile gri) la afilieri funcționale (noduri albastre). Sub-graficul oferă sugestii vizuale privind modul în care obiectivul inițial E. Multilocularis este conectat cu compusul selectat din rețea.

Figura 3.

oportunități de reproșare a drogurilor pentru E. Multilocularis utilizând transformări de interogare. O schemă de prioritizare țintă pentru Echinococcus Multilocularis bazându-se pe inferența bazată pe ortologie și droguri previzionate (DG ≥ 3). (A) interogări combinate; (B) lista inițială a obiectivelor prioritare. (C) Orice listă țintă poate fi „transformată” într-o listă a medicamentelor asociate, utilizând oricare dintre metodele de legare a compusului disponibile (a se vedea textul principal). (D) Lista rezultată a compușilor bioactivi. (E) Exemplu de vizualizare a sub-graficului de rețea dintr-un compus selectat, care prezintă legături de bioactivitate activă și inactivă. Compușii (noduri verzi) sunt conectate la țintele patogene (portocaliu) în funcție de înregistrările de bioactivitate (verde = activ; roșu = inactiv, vezi textul principal pentru pragurile de activitate). Obiectivele, la rândul lor, sunt conectate (legăturile gri) la afilieri funcționale (noduri albastre). Sub-graficul oferă sugestii vizuale privind modul în care obiectivul inițial de E. Multilocularis este conectat cu compusul selectat din rețea.

Explorarea compușilor orfani

Activitățile compușilor extrași din literatura de specialitate apar sub formă de teste bazate pe țintă (legătura directă la țintă) sau sub formă de teste bazate pe celule sau întregi. În absența altor informații, aceste clase de teste nu oferă indicii la ținta sau mecanismul de acțiune al compușilor. În timpul procesului de actualizări de date chimice în TDR6, am identificat compușii cu efecte fenotipice raportate asupra testelor integrate sau pe bază de celule, pe baza clasificărilor lor Chembl. Aceste informații au fost utilizate pentru a identifica compușii „orfani” care sunt activi împotriva unui agent patogen particular în proiecții primare sau secundare pe bază de celule, dar pentru care nu există o analiză bazată pe țintă.

Compușii orfani în TDR6 pot fi Căutat pentru orice specie cu date de screening fenotipic disponibile, în pagina de căutare a compușilor. Acest lucru permite o modalitate rapidă de utilizare a datelor din teste de mare viteză, permițând utilizatorilor să își înceapă prioritate de la compuși cu activitate cunoscută împotriva unui patogen de interes.

Modelul de rețea integrat în TDR6 este, de asemenea, util pentru identificarea candidatului ținte pentru compușii orfani. Așa cum este descris în publicația inițială (14), vecinătatea similarului chimic calculat în jurul unui compus orfan selectat poate oferi legături indirecte la una sau mai multe ținte. Folosind această strategie am efectuat prioritizări țintă pentru toți compușii orfani din TDR6. Aceste prioritizări compuse de rețea precomputed sunt disponibile pentru toate organismele pentru care sunt disponibile datele de screening fenotipic. Rezumatele globale care prezintă toți compușii orfani pentru aceste organisme sunt legate de pagina „Rezumatul datelor” (a se vedea https://tdrtargets.org / datasummary și faceți clic pe speciile de interes). Un exemplu de prioritizare bazată pe compusul orfan pentru T. Cruzi este prezentată în figura 4. întrucât prioriocațiile pornite de la un singur compus sunt disponibile în fiecare pagină compusă.

div>

Figura 4.

Explorarea țintelor candidate pentru compușii orfani trypanosoma cruzi. Plot rezumă prioritizarea țintă acționată în rețea pentru compușii orfani activi împotriva T. Cruzi. Toate secvențele de codificare a proteinelor din genomul T. Cruzi (țintele candidate) sunt aranjate pe axa X. Punctele de date din parcelă corespund asociațiilor de medicament țintă marcate de algoritm (scorul reprezentat pe axa Y). De exemplu, am evidențiat două ținte presupuse pentru două medicamente diferite (așa cum este afișat în pagina Rezumatul datelor T. Cruzi). Părți similare sunt disponibile online pentru organismele de nivel 1 în TDR6 (legat de pagina Rezumatul datelor).

Figura 4.

Funcționalitate și actualizări de date

Noi date genomice în TZR vizează V6.1

De la publicarea anterioară a bazei de date TDR (13) au fost adăugate mai multe genomi patogeni. O listă detaliată este furnizată în tabelul 3, precum și online la pagina Rezumatul datelor TDR6 (https://tdrtargets.org / datasummary).

Tabelul 3 .

Rezumatul disponibilității datelor pentru agenții patogeni de top. Rezumatul datelor țintă disponibile pentru organismele de rangul 1 în țintele TDR. CD-uri: secvențe de codare; PFAM: Numărul de proteine cu Domeniul (domeniile) de PFAM cartografiat; Go: Numărul de proteine cu termeni de ontologie a genei mapate; CE: Numărul de proteine cu numere de comisioane enzimatice mapate (CE); Căi: numărul de proteine mapate la Hărți Kegg Pathway; Orthologii: Numărul de secvențe mapate la grupurile Orthomcl Ortholog. O masă mai completă a sumarului de date este disponibilă online la https://tdrtargets.org

1B01F6074E „>

specii.

CD-uri. pfam.

Du-te.

CE. căi. orologii. Plasmodiu falciparum 5349 3322 355 1083 Plasmodium Vivax 5344 3631 641 806 846 5207 TOXOPLASMA GONDII 7946 3795 7725 772 967 6764 chlamydia trachomatis 887 704 598 369 645 Mycobacterium Leprae 1630 929 628 611 1473 Mycobacterium Tuberculosis 4004 2934 1174 1174 1145 3287 Mycobacterium ulcerans 4232 3602 2578 873 3459 Trep Onema Palidum 1036 634 221 335 335 733 Wolbachia Endosymbiont de B. Malayi 805 577 577 308 688 brugia malayi 11316 7042 6368 1278 8424 Echinococus Granulosus 10249 6481 854 1965 7109 7109 Echinococcus Multilocularis 10474 6817 878 878 2079 7539 Loai (Worm) 16292 8071 6774 1539 2207 Onchocerca Volvulus 12224 3248 246 563 4054 Schistosoma Mansoni 12692 7818 7384 1218 1649 4641 4415 1067 8250 Trypanosoma Brucei 10270 5665 1019 1264 9259 Trypanosoma cruzi 18639 8908 8572 1495 1735 18140 Entamoeba Histolytica 8211 4920 4087 645 10692

7692 Giardia Lamblia 9665 2263 326 514 5977 Trichomonas Vaginalis 95600 35474 843 1366 87303

Specii.

Du-te.

5432

Entamoeba histolytica

CD-uri.	pfam.	CE.	căi.	orologii.
Plasmodiu falciparum	5349	3322	355	1083
Plasmodium Vivax	5344	3631	641	806	846	5207
TOXOPLASMA GONDII	7946	3795	7725	772	967	6764
chlamydia trachomatis	887	704	598	369	645
Mycobacterium Leprae	1630	929	628	611	1473
Mycobacterium Tuberculosis	4004	2934	1174	1174	1145	3287
Mycobacterium ulcerans	4232	3602	2578	873	3459
Trep Onema Palidum	1036	634	221	335	335	733
wolbachia endosymbiont de B.malayi	805	628	577	308	382	688
Brugia malayi 11316	7042	6368	1278	1787	8424
Echinococcus granulosus 10249	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	5768	878	2079	7539
Loa Loa (ochi vierme) 16292	8071	6774	1539 2207 10484
Onchocerca volvulus 12224	3248	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania majore	8280	4641	4415	1067	1162	8250
Trypanosoma brucei 10270	5665	5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia lamblia	9665	2726	2263	326	514	5977
Trichomonas vaginalis 95600 35474 18435	843	1366 87303

Tabelul 3.

Sumar Disponibilitatea datelor pentru agenții patogeni top tier. Rezumatul datelor vizate disponibile Tier 1 organisme în Ținte TDR. CD-uri: secvențe de codificare a mărfurilor; Pfam: număr de proteine cu Mapate Pfam Domain (e); GO: număr de proteine cu termeni Gene Ontologie mapate; CE: numărul de proteine cu numere mapate Enzyme (CE); Pathways: număr de proteine mapat hărți de cale KEGG; Ortologi: număr de secvențe mapate la grupări OrthoMCL ortolog. Un tabel mai complet Sumar de date sunt disponibile online la https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

388 388

779

16392 071 1509 071 071 1559 071

1539 071 //td>

Schistosoma Mansoni

12692

3c34827 ” ” 0B01674E „” DV Id = „0B01674E.

5344

04 87 04 87 87 04 87

a Tepne

673

374 MycobAacterium 6678 678 678

3459

5432

Entamoeba histolytica

Specii.	CD-uri.	Pfam.	GO.	CE.	Pathways.	ortologi.
Plasmodium falciparum	5349	3322	3551	750	1083	5166
5344	3264	2631	641	806	5207
Toxoplasma gondii	7946	4025	3795	772	967	6764
Chlamydia trachomatis	887	704	598	269	357	645
Mycobacterium leprae 1630	1236	929	628	611	1473
Mycobacterium tuberculosis	4004	2934	2001	1174	1145	3287
Mycobacterium ulcerans	4232	3602	2578	873	1002	3459
TREP onema pallidum	1036	791	634	221	335	733
Wolbachia endosymbiont B.Malayi	588
Brugia Malayi 11316	7042	1278	1278	1787	6481	854	1965	7109	7109
Echinococcus multilocularis 10474	758
loa loa (vierme ocular)	1539 071 071	15371	1537 071	1559 071	2207	2378	2178	2478	246	563
7818	7384	1218	leishmania major	8280	4641	4415	1067	1162	8250			5480 5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	8211	4920	4087	645	7692	2263	2735	363 3635 363	2235 363	5600 35600 35474	18435	CD-uri.	pfam.	du-te.	CE.	pathes.	ortoogs. v id = „29971A56991”	3322 551	7166	Plasmox Vivax	641	606 06 06 06 06 06 06 5207
TOXOPLASMA GONDII	7946	4025	3795	772	967	269	269	1630	1236
MycobAacterium ttuzis Page	1174	1174	1174	873	3459
Trep. 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
Wolbia Indusiabiant de bmalayi	805	628	577	308	382	688
Brugia malayi 11316	7042	6368	1278	1787	8424
Echinococcus granulosus 10249	6481	854	1965	7109
Echinococcus multilocularis 10474	6817	5768	878	2079	7539
Loa Loa (ochi vierme) 16292	8071	6774	1539 2207 10484
Onchocerca volvulus 12224	3248	2178	246	563	4054
Schistosoma mansoni 12692	7818	7384	1218	1649 10386
Leishmania majore	8280	4641	4415	1067	1162	8250
Trypanosoma brucei 10270	5665	5482	1019	1264	9259
Trypanosoma cruzi 18639	9908	8572	1495	1735 18140
8211	4920	4087	645	1094	7692
Giardia lamblia	9665	2726	2263	326	514	5977
Trichomonas vaginalis 95600 35474 18435	843	1366 87303

Având în vedere diversitatea organismelor integrată în Targets TDR și, în consecință, varietatea surselor de date necesare pentru a acoperi toate genomuri; efort substanțial a fost pus în standardizarea datelor parsare și regăsire a informațiilor din genomul Aceste organisme. Cele mai multe dintre genomuri complet EupathDB Au fost obținute de la (18), GenBank (19), GeneDB (20), Wormbase Parazit (21), GenoList (22) sau Mycobrowser (23). O descriere completă din sursele genomului și date în tabelul precedent suplimentar S1. Pentru a actualiza datele pentru organismele prezente în versiunea anterioară a Ținte TDR gene de codificare de proteine de la versiunea curentă a genomurilor au fost fie mapate gene existente în Targets TDR, sau altfel introduse noile înregistrări. Maparea Algoritmul folosește o combinație de condiții pentru a urmări Gene identificatorii peste presă și de a menține identitatea genelor: checksum secventa de potrivire (folosind valori de 128 biți Hash generate de MD5 Algorithm), nume de gene sau de identificare și sablare (24) IF sau meciuri perfecte sunt găsite. După actualizarea înregistrărilor, conducta calculează proprietățile fizico-chimice utilizând Pepstats (25), scanările domenii transmembranare cu TMHMM (26), peptide semnal cu SignalP (27), și glycosylphosphatidylinositol puncte de ancorare, folosind PredGPI (28). Algoritmul respinge toate secvențele necodificatoare, cele mai bine orice Pseudogenes, pentru a evita inducerea în eroare adnotări și minimizarea presupuneri false în timpul fluxurilor de lucru de prioritizare. Cele mai multe dintre TDR6, menționate mai sus au toate sarcinile pentru a genomului integrare și actualizare au fost Înfășurat în fluxul de lucru automatizat pentru a facilita mai rapid actualizări în versiunile viitoare. O schemă a actualizării și conductelor Algoritmul prezentat în figura anterioară suplimentar S1. Pipeline automatizează, de asemenea, modul de calcul al adnotări folosind strategii individuale ad-hoc pentru diferite adnotări, bazându-se pe serviciile web și API-uri (apărut în Kaas (29) serviciu pentru proteine maparea metabolice Caile și la numărul de clasificare CE, a enzimelor, sau OrthoMCL baze de date și instrument (30,31) pentru grupurile de cartografiere ortolog la proteinele. Conducta se bazează și pe calcul contra bazelor de date au apărut la nivel local instalate majoritatea InterPro (32), folosind InterProScan (33) pentru a identifica domenii de proteine (Pfam) si harta termeni pentru vocabulare controlate și clasificări (termeni GO). resurse suplimentare au apărut cele mai 3D structuri și modele structurale au fost recuperate de la Banca de date proteine (34) folosind servicii web și descărcate de pe site-ul Modbase FTP (35), respectiv.

de asemenea, numărul de seturi de date cheie funcționale au fost integrate în această versiune, incluzând: (i) seturi de date transcriptomic care prezintă dovada expresiei genelor în stadii ale ciclului de viață sau condiții experimentale care sunt relevant pentru droguri Discovery (36-47) și (ii) seturi de date neesențial derivate din doi agenți patogeni Apicomplexan (P. berghei și T. gondii) (16,48), care furnizează informații Strategies vitale ASSIST prioritizării.

Actualizări de date chimice

Pentru compușii bioactivi de asemenea, fluxurile de lucru de actualizare a datelor au fost automatizate pentru această versiune.Majoritatea compușilor bioactivi au fost recuperați din eliberarea de 24 de la Chembl (49), care conține unele seturi de date suplimentare, cum ar fi cele ale cutiilor chimice specifice patogene – cutii de kinetoplastid GSK (50), cutie patogenă MMV (51). Procesul de integrare începe de la descrierile moleculelor (2D) în format SDF, din care am calculat toate amprentele compuse necesare (necesare pentru căutările de similitudine compus / substructură) utilizând Checkmol (52). Conducta calculează, de asemenea, proprietăți chimice suplimentare, cum ar fi coeficientul de partiție Octanol / Apa de apă și alți descriptori structurali, utilizând XLOGP3 (53) și instrumentele deschise Babel Obprop și ObroTamer (54). Alte date relevante au fost obținute sau calculate direct din structura compusului, cum ar fi identificatorii INCHI și inchikey (55) utilizați pentru urmărirea compușilor; și alte reguli standard de degetul mare utilizat în chimia medicală și descoperirea medicamentelor, cum ar fi regula Lipinski de cinci (56) și regula conexă de trei (57).

După integrarea în țintele TDR, toți compușii au fost supuși La un calcul al comparației de similitudine de similitudine, utilizând chemfp (58) care produce măsurători de asemănare la perechi pe baza indicelui tanimoto / distanța (59). De asemenea, am calculat o hartă globală (toți versus toate) a relațiilor de substructură între compușii din baza de date (X este o substructură de Y; Y este o suprastructură de x). Știind că problema găsirii unor subgrafuri comune maxime între molecule este computațional greu, am aplicat o abordare euristică pentru a găsi substructuri. Algoritmul obține mai întâi un subset de posibile molecule candidate, utilizând amprentele digitale calculate anterior. Candidații trebuie să aibă amprente care se potrivesc cu molecula subiectului. Odată ce se obține o listă de candidați, determinarea substructurii atomi de atomi de atomi se face folosind Matchmol (52). Datele disponibile pentru compuși și interogările care pot fi executate pe fiecare tip de date sunt rezumate în tabelul 2. Greutatea moleculară (MW) și suprafața polară (PSA) Distribuția pentru toți compușii din baza de date este prezentată în figura suplimentară S2.

Curatarea și integrarea datelor de bioactivitate

Ca și în cazul compușilor chimici, majoritatea bioactivităților integrate în țintele TDR provin direct din surse de date în amonte (de exemplu, Chembl). La integrarea datelor de bioactivitate, am păstrat atât adnotarea testului (de exemplu, testul de reducere a motilității in vitro împotriva microfilarielor Brugia Malayi la 10 pM ‘), cât și valoarea numerică și unitățile asociate activităților compuse (de exemplu, inhibiția ‘80% ” μm IC50 ‘, ’10 nm mic’), care sunt toate câmpurile care pot fi căutate. În plus, și pentru a facilita interogările utilizatorilor, bioactivitățile raportate au fost utilizate pentru a grupa compușii testați în clase „active” sau „inactive”. Cu toate acestea, pentru a minimiza efectul utilizării limitelor dure în jurul pragurilor arbitrare și creșterea separării dintre clasificările active / inactive, am definit, de asemenea, o zonă gri nedeterminată. Prin urmare, compușii care marchează chiar sub un prag arbitrar nu sunt considerați inactivi pentru scopuri de interogare și vizualizare.

Nu toate tipurile de activități au fost supuse clasificării. În ciuda eforturilor de standardizare a acestor date de activitate, interpretarea activităților compușilor la această scală este dificilă, deoarece depind adesea de tipul de analiză particular, de unitățile raportate și de condițiile particulare în care au fost efectuate fiecare analiză. Cu toate acestea, un set semnificativ de tipuri de testare ar putea fi clasificat automat în categorii active / nedeterminate / inactive bazate pe praguri de activitate. Pentru aceasta, rapoartele de testare cu > 100 000 (a se vedea figura S3 suplimentară pentru o activitate pe tipul de testare / per compus de distribuție) au fost luate în considerare pentru auditarea activității, deși numai teste pe bază de concentrație (cum ar fi IC50, ki sau potență) au fost găsite suficient de robuste pentru o astfel de determinare, deoarece testele procentuale bazate (cum ar fi% activitate,% activitate reziduală sau inhibarea $) au fost ambigue în rapoartele de bioactivitate. Pragurile utilizate pentru clasificarea activităților pentru fiecare tip de testare pot fi găsite în tabelul 4, iar distribuția compușilor din aceste clase de activități este rezumată în Figura 5.

Tabelul 4.

Tipuri de testare și praguri de activitate utilizate pentru determinarea etichetei de activitate: Numai testele bazate pe concentrații au fost utilizate pentru a determina etichetele de activitate. Activitățile care raportează mai puțin decât valoarea maximă admisă pentru pozitive au fost considerate interacțiuni active (+), în timp ce cele mai mari decât cele minime admise pentru negative „au fost considerate inactive (-). Orice activitate raportată între aceste două valori a fost considerată ca fiind nedeterminată (0)

div id = „1B01F6074E”

testul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

div id = „1B01F6074E”

Tr>

Tipul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

Tabelul 4.

Tipuri de testare și praguri de activitate utilizate pentru determinarea etichetei de activitate: numai testele bazate pe concentrație au fost utilizate pentru a determina etichetele de activitate. Activitățile care raportează mai puțin decât valoarea maximă admisă pentru pozitive au fost considerate interacțiuni active (+), în timp ce cele mai mari decât cele minime admise pentru negative „au fost considerate inactive (-). Orice activitate raportată între aceste două valori a fost considerată ca fiind nedeterminată (0)

div id = „1B01F6074E”

testul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

div id = „1B01F6074E”

Tr>

Tipul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

Figura 5.

Etichete de activitate Distribuția și amestecurile de dovezi între date: (a) Diagrama Venn care prezintă distribuția valorilor de bioactivitate în clasele active, inactive și nedeterminate din TDR6 (vezi textul principal pentru detalii) . Intersecții Numărul cazurilor în care același medicament are rezultate diferite de activitate împotriva aceluiași țintă. Exemple de aceste cazuri sunt furnizate în panourile B prin f (ID-urile compușilor reprezintă identificatori TDR6). (B) Activitatea C329137 (o hidroxi-benzamidină) împotriva lui P. falciparum dihidrofolată dihidrofolată reductază-thymidyat sintetază. (C) Exemplu de înregistrări pozitive pentru inhibitorii de aciltransferază umană. (D) Exemplu de activități negative și neutre pentru compușii trifenilcarbinol și benzohidrolul, respectiv. În cele din urmă, dovezile pozitive (E) și negative (f) pot fi amestecate cu dovezi nedeterminate, așa cum se arată pentru C2164865 testate împotriva colinesterazei de cai și C306882 testate împotriva hidrolazei 5′-trifosfat deoxididină 5′-trifosfat deoxididină recombinantă, respectiv.

Figura 5.

Etichete de activitate Distribuția și amestecurile de dovezi între date: (a) Diagrama Venn care prezintă distribuția valorilor de bioactivitate în activ , clase inactive și nedeterminate în TDR6 (vezi textul principal pentru detalii).Intersecții Numărul cazurilor în care același medicament are rezultate diferite de activitate împotriva aceluiași țintă. Exemple de aceste cazuri sunt furnizate în panourile B prin f (ID-urile compușilor reprezintă identificatori TDR6). (B) Activitatea C329137 (o hidroxi-benzamidină) împotriva lui P. falciparum dihidrofolată dihidrofolată reductază-thymidyat sintetază. (C) Exemplu de înregistrări pozitive pentru inhibitorii de aciltransferază umană. (D) Exemplu de activități negative și neutre pentru compușii trifenilcarbinol și benzohidrolul, respectiv. În cele din urmă, dovezile pozitive (E) și negative (f) pot fi amestecate cu dovezi nedeterminate, așa cum se arată pentru C2164865 testate împotriva colinesterazei de cai și C306882 testate împotriva hidrolazei 5′-trifosfat deoxididină 5′-trifosfat deoxididină recombinantă, respectiv.

Chem Garanta Chembl se numără cu peste 15,2 milioane de bioactivități raportate, din care doar aproximativ 6 milioane corespund relațiilor care implică medicamente și ținte de proteine (fie proteine unice, familii de proteine și complexe de proteine, cu ~ 93% fiind proteine unice). Alte bioactivități rămase din baza de date au fost rapoarte pentru o mare varietate de ținte non-proteice, cum ar fi celule întregi (3,6 m), organisme integrale (2,2 m), țesuturi (83k) și macromolecule nepeptidice (85k) sau Molecule mici (< 100). Acestea nu au fost utilizate în construcția de rețea, deoarece rețeaua este proteină (adică țintă) centrică. Figura 5 prezintă, de asemenea, un exemplu de vizualizare a rețelei care descriu modul în care TDR6 afișează aceste bioactivități.

Integrarea caracteristicilor derivate din rețea: droguri și prioritizări

După cum sa menționat mai sus, datele genomice, adnotările genetice, Compușii chimici și interacțiunile gene-medicament au fost integrate într-o rețea complexă orientată spre reproșarea medicamentului, așa cum este descris în Berenstein și colab. (14). Rețeaua a fost utilizată pentru a calcula un scor de droguri de rețea (ND), pentru toate obiectivele din agenții patogeni de prioritate (tier 1). NDS este legată de șansa de a găsi compuși bioactivi în imediata apropiere a graficului de rețea a unui țintă dată (intervalul este de la 0 la 1). Algoritmul a fost descris anterior în detaliu (14), dar pe scurt, pe baza unui test de supraprezentare a proteinelor drogate cunoscute, calculează un scor de relevanță (RS) pentru fiecare categorie de domenii și grupuri de ortologie ale rețelei PFAM. Scorul NDS pentru o anumită țintă rezultă dintr-o sumă cumulativă ponderată față de RS a tuturor contribuțiilor de afiliere comune nodului țintă și proteine vecine legate de compușii activi.

Pentru a facilita interpretarea scorurilor NDS Am efectuat a Evaluare statistică pentru a identifica grupuri distincte de droguri (DG) pe baza a două tipuri de praguri care ajută la clasificarea predicțiilor de droguri în zonele de încredere. Acestea sunt ilustrate în figura 6. Pe de o parte, în timp ce toate țintele de notare non-zero au un anumit grad de conectivitate la țintele cunoscute, un NDS scăzut sugerează că aceste conexiuni nu sunt relevante pentru evaluarea drogurilor. Prin urmare, un zgomot de zgomot (o linie de bază calculată ca 5 ori mai mare decât valoarea de 0,25 percentilă din distribuția completă a NDS) este considerată a identifica obiective scăzute de notare. Al doilea prag este derivat din indicele maxim al Youden (60), care este calculat ca scorul la care specificitatea și sensibilitatea sunt optime (cea mai bună sensibilitate fără a compromite specificitatea și invers). Această valoare poate fi calculată numai pentru agenții patogeni cu pozitive adevărate (ținte cunoscute). Un minim arbitrar de 10 pozitive adevărate a fost considerat suficient pentru determinarea cutoff dvs. Pentru alți agenți patogeni lipsiți de astfel de informații, a fost utilizat o cutie globală Youden (calculată folosind toate adevărate pozitive în rețea). Grupurile de droguri corespunzătoare sunt astfel: DG1 pentru obiective cu valori NDS variind de la 0 la pragul de zgomot; DG2 pentru obiective cu valorile NDS variind de la pragul de zgomot la cutoff-ul Youden; și DGS 3, 4 și 5 cu valori NDS care sunt 1-, 10- și 100 de ori deasupra tăierii lui Youden. În consecință, aceste grupuri din urmă fac cele mai probabile obiective drogate. Figura 6 prezintă un exemplu static al unei prioritizări bazate pe rețea pentru ulcerans Mycobacterium (care nu are ținte cu compuși cunoscuți în eliberarea curentă). Toate prioritizările pentru obiectivele prioritare ale TDR pot fi văzute online la pagina Rezumatul datelor pentru fiecare specie (a se vedea https://tdrtargets.org / datasummary, făcând clic pe speciile de interes). În acest caz, parcelele online sunt interactive și pot fi mărite și exportate. În cazurile în care există ținte cu compuși bioactivi cunoscuți pentru specie, acestea sunt prezentate distinctiv în complot.

Figura 6.

întregi Genomul de prioritizare țintă pentru ulcerele Mycobacterium: țintele candidate în genomul M. Ulcerans au fost clasificate de ND (scorul de droguri de rețea, a se vedea textul principal).Plot prezintă toate țintele genomului (în axa X) împreună cu scorul lor NDS corespunzător (în axa Y). Punctele roșii corespund obiectivelor clasate în top-10, cu etichete care indică numele genei și produsul. Bornirea prioritizării întregului genom din Rezumatul datelor, utilizatorul poate accesa o pagină de gene făcând clic pe acesta în complotul de prioritizare. Un exemplu de subgraf din familia EMBA / EMBB / EMBC este arătat (așa cum se vede în paginile lor de gene corespunzătoare). Cifra afișează, de asemenea, zone de încredere, DG1 (roșu): delimitate de cutoff zero și zgomot; DG2 (galben): între zgomotul și cutoff-ul tău; și DG3-5: cu scoruri mai mari decât cutoff-ul tău.

Genomul întreg de rețea Prioritizarea țintă pentru Ulcerans Mycobacterium: țintele candidate în genomul M. Ulcenns au fost clasificate de NDS (scorul de droguri de rețea, a se vedea textul principal). Plot prezintă toate țintele genomului (în axa X) împreună cu scorul lor NDS corespunzător (în axa Y). Punctele roșii corespund obiectivelor clasate în top-10, cu etichete care indică numele genei și produsul. Bornirea prioritizării întregului genom din Rezumatul datelor, utilizatorul poate accesa o pagină de gene făcând clic pe acesta în complotul de prioritizare. Un exemplu de subgraf din familia EMBA / EMBB / EMBC este arătat (așa cum se vede în paginile lor de gene corespunzătoare). Cifra afișează, de asemenea, zone de încredere, DG1 (roșu): delimitate de cutoff zero și zgomot; DG2 (galben): între zgomotul și cutoff-ul tău; și DG3-5: cu scoruri mai mari decât cutoff-ul Youden.

Aceste prioritizări bazate pe rețea pot funcționa în ambele sensuri. La pornind de la un compus de interes, algoritmul poate prioritiza țintele, utilizând similitudinea ponderată a vecinilor chimici la obiectivele inițiale candidate. Și când pornește de la țintă de interes, poate prioritiza compușii, folosind țintele vecine conexe și apoi după legăturile ponderate cu inhibitorii / drogurile candidate. Scorurile precomputed pentru compuși și pentru ținte sunt utilizate intern de către TDR6 și sunt la miezul transformărilor de interogare bazate pe rețea.

Sub-graficul de rețea Vizualizări și upgrade de interfață utilizator

rețeaua sub -Graps pentru ambii compuși și ținte (și scorurile lor NDS respective) pot fi navigate de la aplicația web utilizând un medicament sau o țintă ca punct de plecare pentru a obține sugestii pentru medicamente netestate sau respectiv obiective drogate noi. Prin intermediul vizualizărilor nou dezvoltate, utilizatorii pot verifica cartierele de rețea în jurul drogurilor și țintelor în paginile corespunzătoare. Listele de interacțiuni puative derivate din rețea pot fi, de asemenea, explorate în format tabular sub „droguri” (pentru ținte) și „obiective cunoscute și predicte” (pentru droguri).

Aceste vizualizări sunt conduse de D3.Js (61) Implementarea layout-urilor forțate pentru vizualizările sub-grafice. În cadrul panoului D3 Subgraph, utilizatorii pot efectua căutări de nod în graficul (identificatorii țintă), precum și comutați vizibilitatea țintelor pe o specie de către speciile și personalizați opacitatea nodurilor. Luate împreună aceste noi caracteristici oferă o vizualizare clară și cuprinzătoare a vecinătății de sub-rețea a țintelor și compușilor, permițând utilizatorilor să manipuleze graficele în timp ce explorați datele.

Interfața utilizator (UI) și instrumentele disponibile Pentru reproșarea la droguri și prioritizarea țintă au trecut printr-un upgrade major. În primul rând, UI a fost reproiectat sub standardele W3C pentru a obține o aplicație mai sănătoasă și mai scalabilă. Am integrat bootstrap (https://getbootstrap.com/) și jquery (https://jquery.com) în dezvoltarea și proiectarea aplicației web TDR6 și în față- Funcționalitate finală. Pentru interogările structurii compuse, am licențiat și implementat aplicația de desenare chimică Marvin JS de la Chemaxon (https://chemaxon.com/products/marvin-js). Înregistrările tabele în paginile țintă și de droguri utilizați acum pluginul JavaScript JavaScript () pentru a crea cu ușurință pagini, filtrare și funcționare funcționalități. În cele din urmă, reprezentările compuse 2D sunt acum generate automat utilizând o implementare a modulului JavaScript Smilesdrawer (62).

Disponibilitatea comercială a compușilor

un aspect important la prioritizarea compușilor pentru testarea în laborator , este disponibilitatea lor. În TDR6 afișăm acum informații despre disponibilitatea comercială a compușilor. În prezent, am început această caracteristică prin legarea cu Molport (o piață chimică on-line care surore compușii de la furnizorii majori) și arată utilizatorilor un indiciu vizual asupra paginilor compuse care dau o indicație rapidă dacă compusul este fie în stoc, fie poate fi făcut la comandă . Deoarece disponibilitatea comercială a compușilor este implementată în prezent în TDR6 sub formă de interogări asincrone împotriva Molport, în acest moment această caracteristică este disponibilă numai în modul de navigare (nu în interogări).Cu toate acestea, utilizatorii pot prioritiza compușii utilizând oricare dintre strategiile de interogare disponibile în TDR6 și apoi finalizează selecțiile compuse prin inspectarea compușilor manual pentru disponibilitatea comercială.

Discuție și direcții viitoare

Noile date , interfața și funcționalitatea TDR6 furnizează utilizatorilor o navigare și vizualizare îmbunătățită a țintelor și a compușilor.

Modelul curent de rețea conectează obiectivele prin afilierea entităților (proteinelor) la conceptele de adnotare (domeniile PFAM, grupurile Ortholog). Acestea au fost selectate pe baza acoperirii lor largi și a unui calcul relativ de calcul. Completarea acestor concepte cu alte criterii importante pentru validarea țintă a drogurilor (esențialitatea, expresia în etapele ciclului de viață relevante) pot fi efectuate de către utilizatori cu instrumentele și funcționalitatea oferită de TDR6, dar în viitor pot fi construite în modelul de rețea subiacente, la cel puțin pentru unele organisme care pot fi evaluate experimentale la nivel de genom.

Mai multe îmbunătățiri-cheie sunt necesare pentru a păstra obiectivele TDR relevante pentru comunitatea oamenilor de știință care lucrează la boli tropicale. Integrarea metaboliților naturali și conectarea acestor molecule mici la alți compuși bioactivi prin substructuri partajate sau prin similitudine chimică va fi un accent major în viitor. Acest lucru va permite navigarea grafitelor de droguri folosind conceptele de reacții biochimice, care conectează în mod natural enzime non-ortologice prin substraturile / produsele și cofactorii lor partajați.

în cele din urmă, așa cum sa menționat deja înainte (13), Există încă un decalaj mare de curatare care trebuie umplut. Mulți compuși bioactivi au fost testați de către Comunitatea cercetătorilor care lucrează în boli tropicale neglijate. Cu toate acestea, multe dintre aceste analize și rezultate sunt raportate în reviste în afara revistelor de chimie medicamentoasă mainstream și, prin urmare, sunt ratate de eforturi mari de curatare, cum ar fi cea condusă de Chembl (49). Curatarea și integrarea acestor date lipsă (inclusiv date negative!) Ar trebui să fie o prioritate pentru comunitate, deoarece ar economisi timp și resurse valoroase.

Date suplimentare

Sunt disponibile date suplimentare la Nar online Obiective; și Ben Webb și Andrej Sali (Universitatea din California San Francisco) pentru calcularea modelelor 3D pentru genomul patogenului de nivel 1 în țintele TDR. L.U.L., A.B. și s.v. au fost sau sunt susținute de burse de la Consiliul Național de Cercetare (Coniceet, Argentina). A.C. și F.A. sunt membri ai carierei de cercetare a Consiliului Național de Cercetare (Conicet, Argentina). P.M. ar dori să recunoască o părtășie de la Comisia de granturi Universitară (UGC), India.

Finanțare

GlaxoSmithKline Argentina și Agenția Națională pentru Promovarea Științei și Tehnologiei, Argentina (ANPCYT); Proiect de cooperare bilaterală Indo-Argentina (finanțare comună de la Departamentul Indian de Știință și Tehnologie (DST) și Ministerul Argentinian al Științei și Tehnologiei (Mincyt). Finanțare pentru taxa de acces deschis: Fondo Para La Investigación Científica y Tecnológica.

Conflictul de interese Biología Molecular, División Patología, Spitalul de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

wotez

Molyneux

Fenwick

kumaresan

Sachs

Savioli

Controlul bolilor tropicale neglijate

n. engl. J. Med.

2007

;

357

1018

–

1027

Trouiller

Olliaro

torreele

orbinski

Ling

R. Div> Ford

Div> Div> Dezvoltarea drogurilor pentru boli neglijate: o piață deficitară și un public – Eșecul politicii pentru sănătate

lancet nord am. Ed.

2002

;

359

2188

–

2194

hughes

rees

kalindjian

philpott

Principiile Discovery-ului de droguri timpurii

Br. J. Farmacol.

2011

;

162

1239

–

1249

adams

brantner

Estimarea costului noii dezvoltări de droguri: Este într-adevăr 802 milioane dolari

Affațiuni de sănătate. (Millwood)

2006

;

420

–

428

wyatt

Gilbert

citite

div> DIV> DIV> Validarea țintă : Linking Proprietăți țintă și chimice la profilul de produs dorit

curr. Top. Med. Chem.

2011

;

1275

–

1283

Div> Farha

maro

Raportarea medicamentului pentru descoperirea antimicrobiană

Nat. Microbiol.

2019

;

565

–

577

div>

hernandez

div> hw

Soeung

zorn

Div>

div>

div> Mottin

Andrade

DIFFREY DIFFREY

div> ekins

de mare putere și reputație computațională pentru bolile neglijate

Pharm. Res.

2018

;

sk>

div> wooller

bensted- Hume

chen

Ali

perla

fmg

bioinformatică în descoperire de droguri translaționale

Biosci. Rep.

2017

;

DOI: 10.1042 / bsr20160180

Agüero

-Lazikani

aslett

berriman

Buckner

FS> Div> Campbell

carmona

Carruthers

chan

chen

și colab. .

Prioritizarea la scară genomică a țintelor de droguri: Baza de date TDR Obiective

Nat. Rev. Drug Discov.

2008

;

900

–

907

Crowther

shanmugam

CARMONA

Doyle

Hertz-Fowler

berriman

nwaka

Ralph

ROOS

van voorhis

div> wc

și colab. .

Identificarea țintelor de droguri atractive în agenții patogeni neglijați folosind o abordare silico

PLOS negl. Trop. Dis.

2010

;

E804

Lykins

Filippova

halavaty

Zhou

Dubrovska

Flores

SHUVALOVA

Ruan

d div> / div> și colab. .

CSGID rezolvă structurile și identifică fenotipurile pentru cinci enzime în Toxoplasma gondii

față. Celula. Infecta. Microbiol.

2018

;

352

shanmugam

ralph

CARMONA

brokther

ROOS

Agüero

Caffrey

Selzer

Integrarea și mineritul genomilor Helminth pentru a descoperi și a prioritiza obiectivele terapeutice noi

Helminții parazitare: ținte, ecrane, droguri și vaccinuri

2012

;

Wiley-Blackwell

–

mp> mp

carmona

Crowther

Ralph

Roos

shanmugam

van voorhis

Agüero

TDR Obiective: o resursă de chemogenomică pentru bolile neglijate

nucleic. Acizi. Res.

2012

;

D1118

–

d1127

div> berenstein

Magariños

chernomoretz

Agüero

O abordare a rețelei multistrat pentru ghidarea repoziționării medicamentelor în bolile neglijate

PLOS negl. Trop. Dis.

2016

;

E0004300

kim

weiss

Toxoplasma gondii: modelul apicomplexan

Int. J. Parazitol.

2004

;

423

–

432

Sidik

huet

ganesan

huynh

m.-h.

d div> ca

Thiru

Saeij

jpj

beruta

niles

și colab. .

Un ecran crizer genomic în Toxoplasma identifică genele esențiale apicomplexan

celulă

2016

;

166

1423

–

1435

bahl

brestelli

DIVMER

Fischer

gao

heiges

M. / Div>,

iod> j.

Div>

mac> mackey

și colab. .

toxodb: o resursă de bază de date integrată toxoplasma gondii

acizi nucleici res.

2007

;

d553

–

d556

Warrenfeltz

Bendernko

Crouch

div> k.

Div>

Kissinger

ROOS

shanmugasundram

Silva-Franco

kollmar

Baze de date genomice eucariote

2018

;

1757

diver

–

Sayers

Agarwala

bolton

Canese

Clark

connor

fiorini

d div>

Div>

și colab. .

Resursele bazei de date ale Centrului Național de Informații privind biotehnologia

acizi nucleici res.

2019

;

d23

–

d28

d div> c.

rhertz-fowler

Peacock

Introducerea Genenedb: o bază de date generică

Trends parazitol.

2002

;

465

–

467

bolt

Rodgers

shafie

kersey

d div> Berriman

Howe

Folosind worbser parazit: o platformă integrată pentru explorarea datelor genomice Helminth

METODE MOL. Biol.

2018

;

1757

471

–

491

dychat

hummel

Rousseau

mozzer

Genolist: un mediu integrat pentru analiza comparativă a genomilor microbieni

acizi nucleici res.

2007

;

d469

–

d474

kapopoulou

lew

Cole

MyCobrowser Portal: o resursă cuprinzătoare și adnotată manual pentru genomul micobacterian

tuberculoza

2011

;

–

Camacho

Div> Coulouri

Avagyan

Papadopoulos

bealer

div> div> div> div> tl

BLAST +: Arhitectură și aplicații

BMC bioinformatică

2009

;

421

bancock

bishop

/ Div>

Emboss (Suita europeană Molecular Biologie Open)

Dicționar de bioinformatică și biologie computațională

2004

;

Chichester

John Wiley & sons, ltd

DOB0206

krog

Larson

von heijne

div> sonnhammer

Previzionarea topologiei proteinei transmembrane cu un model ascuns Markov: Aplicație pentru a completa genomes

j. Moli. Biol.

2001

;

305

567

–

580

Div>

Almagro Armenteros

Sønderby

Petersen

WINTHER

Brunak

von heijne

Nielsen

H.0 Îmbunătățește predicțiile peptidelor semnal utilizând rețele neuronale profunde

Nat. Biotechnol.

2019

;

420

–

423

div>

martelli

Casadio

predictor de ancorare GPI

BMC bioinformatică

2008

;

392

moriya

Moriya

iToh

Okuda

Div> Div> Div>

div> kanehisa

kaas: o adnotare automată a genomului și un server de reconstrucție a căii

acizi nucleici res.

2007

;

w182

–

w185

chen

mackey

Stoeckert

RO,

ROOS

Orthomcl-dB: interogarea unei colecții cuprinzătoare multi-specii de grupuri Ortholog

acizi nucleici res.

2006

;

d363

–

d368

Fischer

brunk

chen

gao

DIV> Harb

iod>

shanmugam

Div> d.

Div> CJ

Folosind Orthomcl pentru a atribui proteine la grupurile orthomcl-db sau la Proteomi de cluster în noile grupuri Ortholog

curr protoc bioinforma.

2011

;

DOI: 10.1002 / 0471250953.Bi0612S35

mitchell

ATWOW

div> tk

b babbitt

blum

Bork

pod

maro

Chang

H.-Y.

El-Gebali

S. div> mi

et al. .

Interpro în 2019: Îmbunătățirea acoperire, clasificare și acces la adnotările secvenței de proteine

acizi nucleici res.

2019

;

d351

–

d360

jones

binns

chang

fraser

Mcanulla

Div>

Maslen

Mitchell

Nuka

și colab. .

Interprosculan 5: Clasificarea funcției de proteine la scară largă a genomului

bioinforma. Oxf. Engl.

2014

;

1236

–

1240

Div> burley

berman

bhikadiya

Chen

Costanzo

cr.

DUGE

Dutta

Feng

div> z. / div> și colab. .

Banca de date proteică: arhiva unică globală pentru datele de structură macromoleculare 3D

acizi nucleici res.

2019

;

d520

–

D528

Pieper

webb

dong

div> DIV> d.

Fan

kim

Div>,

DIV> YG

Weinkam

div>

m .

și colab. .

MODBASE, o bază de date a modelelor de structură proteică comparativă adnotată și a resurselor asociate

acizi nucleici res.

2014

;

d336

–

d346

zhu

imwong

jaidee

Russell

div> f.

div>,

alb

preiser

bozdech

div> z.

Noi perspective în transcriptomeul Plasmodium Vivax folosind ARN-SEQ

sci. Rep.

2016

;

20498

smircich

Eastman

bispo

DUHAGON

DIV> Guerra-Slompo

gat

Goldenberg

S. / div> muntroe

dallagiovanna

Div>

div> F.

și colab. .

Ribozomul Profiling dezvăluie controlul traducerilor ca mecanism cheie care generează expresia genei diferențiale în trypanosoma cruzi

Genomica BMC

2015

;

443

d divonder

Rijpma

van Schaijk

bcl

hoejmakers

wam

Kensche

GRESNIGT

Italiaander

DIV>

Div> r.

bousema

și colab. .

Analizele transcriptomice și proteomice integrate ale lui P. Falciparum Gametocytes: o perspectivă moleculară asupra proceselor specifice sexului și represiunii translaționale

Acid nucleic Res.

2016

;

6087

–

6101

wilinski

asfa

keane

Sarry

böhme

LEMIEUX

Barrell

DIV> A.

berriman

și colab. .

Noile perspective în transcriptomul de sânge al Plasmodium falciparum utilizând ARN-SEQ

mol. Microbiol.

2010

;

–

Otto

böhme

jackson

Div> m.

Franke-Fayard

hoejmakers

religana

Robertson

Sanders

ogun

și colab. .

O evaluare cuprinzătoare a genomului de paraziți de malarie de rozătoare și expresia genei

bmc biol.

2014

;

zanghì

Vambar

bauticgarten

ding

Div> Guizetti

Div>

div> Div>

mattei

d. >,

Div> l.

d div> / div> și colab. .

Un punct de vedere specific1 este exprimat în sporozotite de la P. falciparum și joacă un rol în infecția hepatocitelor

celulă rep.

2018

;

2951

–

2963

Fernandes

dillon

lal

belew

bravo

Mosser

El-Sayed

Profilarea dual transcriptomă a macrofagelor umane infectate cu leishmania dezvăluie semnături distincte de reprogramare

MBIO

2016

;

E00027-16

Fritz

/ Div>

chen

divin-johnson

Rocke

Div> Conrad

Boothroyd

Div> Div> Div>

Analiza transcriptomică a dezvoltării toxoplasmelor dezvăluie multe funcții noi și structuri specifice sporozoitelor și oilor

PLOS One

2012

;

E29998

hon

C.-c.

div> weber

sismeiro

proux

KOUTERO

Dispozitiv

Das

Agrahari

Div> M.-a.

jagla

et al. .

Cuantificarea zgomotului stochastic de splicing și poliadenilare în Enamoeba Histolytica

acizi nucleici res.

2013

;

1936

–

1952

siegel

hekstra

wang

Dewell

s. Două etape de ciclu de viață ale trypanosomului Brucei și identificarea siturilor de splicing și poliadenilare

acizi nucleici res.

2010

;

4946

–

4957

Yeoh

Goodman

mollard

v. DIV> McFadden

d div>,

Ralph

Transcrieri comparative ale gametocitelor de sex feminin și masculin în Plasmodium Berghei și evoluția sexului în alveolate

Genomica BMC

2017

;

734

div> basso

/ Div>

lippuner

ramakrishnan

Okoniewski

walker

Smith

aplazes

Div> Asexual Extinderea merozoitelor de toxoplasme Gondii este diferită de tahiozoți și implică expresia de familiile genei care nu se suprapun pentru a atașa, invada și replica în enterocitele feline

Genomica BMC

2015

;

bushell

gomes

Sanderson

ANAR

Div> Girling

turma

metcalf

MODRZYNSKA

div> Div> f.

martin

și colab. .

Profilarea funcțională a unui genom de plasmă prezintă o abundență de gene esențiale

celulă

2017

;

170

260

–

272

DIV>

Mendez

Gaulton

bento

shambers

De Veij

div>

Magariños

Div>,

Mosquera

Mutowo

Nowotka

m .

și colab. .

Chembl: spre depunerea directă a datelor biologice

acizi nucleici res.

2019

;

d930

–

d940

div> i.

Pilar MANZANO

cantizani

kessler

ALONSO-PADILLA

div> div> e

E .

Colmenarejo

d div> div> div> div> div>

și colab. .

Seturi de compuși noi identificate din screening fenotipic de mare viteză împotriva a trei paraziți kinetoplastid: o resursă deschisă

sci. Rep.

2015

;

8771

SPANGENBERG

Burrows

kowalczyk

mcdonald

Div> Wells

TNC> Willis

P. / div>.

PLOS One

2013

;

E62906

dig>

model de funcționalitate Se potrivesc ca un instrument eficient de căutare complementară / de reacție: o abordare open source

molecule

2010

;

5079

–

5092

div> cheng

zhao

Lin

div>

y. / Div>,

wang

div>

Div> Calculul coeficienților de partiții octanol-apă Ghidând un model de aditiv cu cunoștințe

j. Chem. Inf. Model.

2007

;

2140

–

2148

Div>

O’Boyle

Banck

James

Div>,

Morley

Vandermeersch

Hutchison

Deschis Babel: O cutie chimică deschisă

j. Cheminformatică

2011

;

Heller

mcnaught

Pletnev

Stein

div> tchekhovskoi

inchi, Identificator chimic internațional IUPAC

j. Cheminformatică

2015

;

Lipinski

Lombardo

Dominy

FEENEY

experimental și abordările computaționale pentru estimarea solubilității și permeabilității în setările de descoperire și dezvoltare a drogurilor

Adv. Delivul de droguri. Rev.

2001

;

–

congreve

carr

Murray

jhoti

o regulă de trei „pentru Discovery-ul de plumb fragmentat

Droguri Discov. Astăzi

2003

;

876

–

877

dalke

chemfp – Formate și instrumente de amprente rapide și portabile

j. Cheminformatică

2011

;

p12

rogers

Tanimoto

un program de calculator pentru clasificarea plantelor

știință

1960

;

132

1115

–

1118

Div> wj

index pentru rating Teste de diagnosticare

cancer

1950

;

–

bostock

ogievetsky

HEER

D3 DOCUMENTE DATE

IEEE trans. Vis. Comput. Grafic.

2011

;

2301

–

2309

Probst

reymond

J.-l.

Smilesdrawer: parsare și desen Smiles-codificate structuri moleculare utilizând JavaScript client

j. Chem. Inf. Model.

2018

;

–

Acesta este un articol de acces deschis distribuit în condițiile licenței necomerciale Creative Commons Attribution (http://creativecommons.org/licenses/by-nc/4.0/), ceea ce permite reutilizarea, distribuția și reproducerea necomercială În orice mediu, cu condiția ca lucrările originale să fie citate corect. Pentru reutilizarea comercială, vă rugăm să contactați [email protected]

Rezumat

Prezentare generală și organizarea țintelor TDR

Noi caracteristici în Obiectivele TDR 6

Utilizarea țintelor TDR 6

Prioritizări țintă cu genomul întreg

Explorarea compușilor orfani

Funcționalitate și actualizări de date

Noi date genomice în TZR vizează V6.1

Actualizări de date chimice

Curatarea și integrarea datelor de bioactivitate

Integrarea caracteristicilor derivate din rețea: droguri și prioritizări

Sub-graficul de rețea Vizualizări și upgrade de interfață utilizator

Disponibilitatea comercială a compușilor

Discuție și direcții viitoare

Date suplimentare

Finanțare

Lasă un răspuns Anulează răspunsul