Obiectivele TDR 6: Discovery de droguri pentru agenții patogeni umani prin integrarea intensivă a datelor

Rezumat

Volumul de date biologice, chimice și funcționale depuse în domeniul public crește rapid, datorită secvențării generațiilor următoare și tehnologiilor de screening foarte automatizate. Aceste seturi de date reprezintă resurse neprețuite pentru descoperirea de droguri, în special pentru agenții patogeni de boală neglijați mai puțin studiați. Pentru a mobiliza aceste seturi de date, integrarea inteligentă și cea intensă a datelor este necesară pentru a ghida inferențele computaționale în diferite organisme. Resursele TDR vizează resursele genomice integrează datele genomice de la agenții patogeni umani și organismele model, împreună cu informații despre compușii bioactivi și activitățile lor adnotate. Acest raport evidențiază cele mai recente actualizări privind datele și funcționalitățile disponibile în țintele TDR 6. Pe baza modelelor de rețea chimiogenomică care oferă legături între inhibitori și ținte, baza de date încorporează acum prioritizări țintă bazate pe rețea și noi vizualizări ale subprafilor de rețea care prezintă chimic- și țintă – cartierelor similare, împreună cu legăturile de bioactivitate țintă asociate. Datele disponibile pot fi navigate și interogate printr-o nouă interfață de utilizator, care permit utilizatorilor să efectueze prioritizări ale țintelor de proteine și de inhibitori chimici. Ca atare, obiectivele TDR facilitează acum investigația privind reproșarea medicamentelor împotriva țintelor patogene, care pot contribui la identificarea țintelor candidate pentru compușii bioactivi cu obiective necunoscute anterior. Obiectivele TDR sunt disponibile la IV id = „C0600C5841” .

Boli tropicale neglijate (NTD) afectează în mod disproporționat ~ 1,5 miliarde de persoane în venituri mici și în curs de dezvoltare Țări, unde sunt o cauză principală pentru viața de viață pierdută de handicap și moarte prematură (1). Din punct de vedere istoric, lipsa de implicare din industria farmaceutică, în combinație cu investiții limitate în programele de cercetare în domeniul sănătății publice din țările afectate, a dus la o deficiență a medicamentelor disponibile pentru a controla în mod eficient majoritatea acestor boli (2). În plus, medicamentele care figurează în prezent pentru a trata aceste boli sunt adesea compromise în ceea ce privește costurile, dificultățile în administrare, eficacitatea, rezistența la medicament sau profilele de siguranță.

Discovery-ul de droguri este un proces consumator de timp și costisitor (3 , 4). Pentru NTDS, în special, programele de descoperire a medicamentelor trebuie să supraviețuiască suficient de mult prin lipsuri de finanțare pervazivă pentru ao face în studiile clinice ulterioare (5). În acest context, o abordare strategică pentru descoperirea de droguri NTD este repoziționarea medicamentelor (6), care poate contribui la reducerea costurilor prin facilitarea aprobărilor de reglementare la studiile timpurii pentru medicamente care au suferit deja cercetări clinice pentru alte boli și / sau indicații și au eșuat din alte motive decât siguranța (6). În plus, în cazul în care domeniul de reproșare a medicamentelor este extins pentru a include medicamente și compuși bioactivi din cercetarea organismelor neumane, acesta poate duce, de asemenea, la identificarea cel puțin noi instrumente chimice pentru probarea funcției țintelor și căilor în agenții patogeni umani. Astfel, prin utilizarea cantităților vastă de date disponibile din programele de cercetare bine finanțate privind bolile umane și organismele modelului, peisajul de descoperire a medicamentului pe NTDS primește un impuls pozitiv (7).

Strategiile computaționale devin din ce în ce mai mult esențială în descoperirea de droguri translațională, atât în mediul academic, cât și în industria farmaceutică. Integrarea inteligentă, intensivă a volumelor crescânde de date generate în toate fazele descoperirii de droguri, permițând deja provocărilor cheie ale procesului care urmează să fie abordat (8). De la introducerea sa, baza de date TDR vizează o resursă fiabilă pentru cercetătorii de boli neglijate pentru a accesa datele de chemogenomice pentru prioritizarea țintă a drogurilor și reproșarea medicamentelor asupra bolilor neglijate. Introdus în 2008 (9), această resursă de acces deschis a permis cercetătorilor să găsească obiective noi de proteine și inhibitori chimici și să le prioritizeze pentru a ajuta la dezvoltarea de droguri pentru agenții patogeni NTD. Obiectivele TDR utilizează seturile de date funcționale la nivel de genom general disponibile pentru a permite utilizatorilor să găsească și să prioritizeze țintele pe baza cunoștințelor lor despre biologia patogenului lor de interes și natura bolii (10,11). Acest lucru este implementat de o selecție țintă flexibilă (utilizând criterii de filtrare) și clasament (utilizând ponderarea specifică a criteriilor) (12,13).

Aici, descriem actualizările la seturile de date subiacente și Funcționalitatea în obiectivele TDR, acumulate de la publicarea sa anterioară în 2012 (13). Noul obiectiv TDR eliberat (v6.1, abreviat TDR6 în această lucrare) integrează informațiile genomice specifice patogene cu date funcționale (de exemplu,Expresie, relații bazate pe ortologie, esențiale) dintr-o selecție de organisme, împreună cu datele compușilor bioactivi (structura chimică, proprietatea și bioactivitatea / informațiile țintă); Toate acestea pot fi interogate și navigate prin aplicația web. Toate interogările pot fi salvate către un stash personal de către utilizatorii înregistrați și publicați prin aplicația web pentru a maximiza oportunitățile de colaborare. Listele prioritare de obiective pot fi exportate pentru o analiză suplimentară în afara liniei. Detaliile complete ale tuturor caracteristicilor noi pot fi găsite în notele de lansare (https://tdrtargets.org / versiuni). Acest raport prezintă o plimbare completă a aplicației web, a caracteristicilor sale noi și exemplelor de ilustrare a cazurilor de utilizare.

Prezentare generală și organizarea țintelor TDR

Ca și în versiunile anterioare ale obiectivelor TDR, TDR6 este, de asemenea, organizată în două secțiuni principale: ținte și compuși. Secțiunea Obiective a bazei de date conține date genomice pentru 20 de agenți patogeni umani și permite utilizatorilor să ruleze interogări și prioritizări ale țintelor de proteine pe baza unui număr de caracteristici și date relevante pentru descoperirea medicamentului (a se vedea tabelul 1). Secțiunea compușilor din baza de date conține informații despre > 2 milioane de compuși bioactivi și permite interogări pe baza proprietăților chimice ale compușilor și a bioactivităților lor adnotate (vezi Tabelul 2).

Tabelul 1.

Interogările țintă disponibile în țintele TDR

interogare grup. patogeni pentru care sunt disponibile date. tipuri de date disponibile pentru interogare.
nume & Adnotări Toate Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică)
Caracteristicile proteinelor Toate MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI).
Informații structurale Toate Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase
Expresia genei PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului.
Informații filogenetice Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați.
esențial C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model.
Validarea țintă Date Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii)
drugglabil Toate Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal)
tezay Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE)
Referințe bibliografice Toate obiectivele de filtrare pe baza publicațiilor disponibile
div id = „
interogare grup. patogeni pentru care sunt disponibile date. tipuri de date disponibile pentru interogare.

iv id = „05d81063d3”

nume Adnotări Toate Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică) Caracteristicile proteinelor Toate MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI). Informații structurale Toate Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase Expresia genei PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului. Informații filogenetice Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați. esențial C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model. Validarea țintă Date Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii) drugglabil Toate Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal) tezay Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE) Referințe bibliografice Toate obiectivele de filtrare pe baza publicațiilor disponibile
Tabelul 1 .

Interogările țintă disponibile în țintele TDR

Grupul de interogare. patogeni pentru care sunt disponibile date. tipuri de date disponibile pentru interogare.
nume & Adnotări Toate Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică)
Caracteristicile proteinelor Toate MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI).
Informații structurale Toate Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase
Expresia genei PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului.
Informații filogenetice Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați.
esențial C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model.
Validarea țintă Date Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii)
drugglabil Toate Precedent pentru modularea chimică reușită a activității sau funcției țintă.Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal)
tezay Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE)
Referințe bibliografice Toate obiectivele de filtrare pe baza publicațiilor disponibile
div id = „
interogare grup. patogeni pentru care sunt disponibile date. tipuri de date disponibile pentru interogare. nume & Adnotări Toate Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică) Caracteristicile proteinelor Toate MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI). Informații structurale Toate Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase Expresia genei PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului. Informații filogenetice Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați. esențial C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model. Validarea țintă Date Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii) drugglabil Toate Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal) tezay Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE) Referințe bibliografice Toate obiectivele de filtrare pe baza publicațiilor disponibile

Tabelul 2 .

interogări compuse disponibile în țintele TDR

iv id = „05d81063d3”

Bioactivitate

Grupul de interogare. tipuri de date disponibile pentru interogare.
Căutări bazate pe text
nume & adnotări nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI
Proprietăți chimice Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski)
Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N) Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm)
Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane)
Compuși cu ținte Găsiți Compușii care au teste de informare și mecanism țintă
Căutări pe bază de structură
similitudine compus Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice
Structura compusă Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.
div id = „1B01F6074E”
interogare grup. tipuri de date disponibile pentru interogare.

iv id = „05d81063d3”

Căutări bazate pe text nume & adnotări nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI Proprietăți chimice Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski) Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N)

Bioactivitate

Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm) Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane) Compuși cu ținte Găsiți Compușii care au teste de informare și mecanism țintă Căutări pe bază de structură similitudine compus Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice Structura compusă Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.
Tabelul 2.

Interogările compuse disponibile în țintele TDR

Grupul de interogare.

iv id = „05d81063d3”

Bioactivitate

tipuri de date disponibile pentru interogare.
Căutări bazate pe text
nume & adnotări nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI
Proprietăți chimice Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski)
Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N) Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm)
Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane)
Compuși cu ținte Găsiți Compușii care au teste de informare și mecanism țintă
Căutări pe bază de structură
similitudine compus Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice
Structura compusă Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.
div id = „1B01F6074E”
interogare grup. tipuri de date disponibile pentru interogare.

iv id = „05d81063d3”

Căutări bazate pe text nume & adnotări nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI Proprietăți chimice Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski) Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N)

Bioactivitate

Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu,IC50 < 5 μm) Orfan Căutarea compușilor care au rapoarte de bioactivitate în întregul organism sau testele întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane) Compuși cu ținte Găsiți compuși care au informații și mecanism țintă Teste Căutări pe bază de structură similitudine compus tragere / pastă Structura compusului sau fragmentului 2D și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice Structura compusă Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment.

Noi caracteristici în Obiectivele TDR 6

Am raportat recent un model de rețea integrat (14) în care toate seturile de date de scară genomice disponibile în țintele TDR (ținte proteice), informații chimice (compuși bioactivi) și relațiile lor (bioactivitatea compușilor din Analizele bazate pe țintă) au fost legate într-un grafic multistrat. În TDR6, acest model de rețea a fost actualizat prin integrarea noilor seturi de date (descrise mai jos). Acest model încorporează legături între obiective și compuși bioactivi derivați din manevrarea manuală a analizelor de bioactivitate publicate (adică legăturile directe între obiective și compușii chimici), precum și din relațiile calculate (legăturile țintă țintă și legăturile compuse) pe baza adnotărilor de proteine (Domeniile PFAM, Grupurile Ortholog) și similitudinea chimică. Un aspect cheie al acestor legături în modelul de rețea multistrat este că acestea permit explorarea rapidă și vizualizarea vecinătății în jurul țintelor selectate și / sau compușii bioactivi. Acest lucru permite utilizatorilor să exploreze compușii legați de ținte, să inspecteze vecinătatea asemănătorilor chimice în jurul compușilor bioactivi și să vizualizeze aceste date într-o manieră prietenoasă și cuprinzătoare (a se vedea figura 1).

Div>

Figura 1.

Model de rețea schematică în vizualizările TDR6 și sub-grafic: Paginile compuse sau țintă afișează acum o vizualizare subgraph care conține obiecte în vecinătatea rețelei entității selectate. Aceste grafice sunt construite dintr-un grafic de rețea complex cu trei straturi. O schemă a acestui grafic este prezentată în partea de sus. Ambele țintă și compusul subgrame sunt aranjate întotdeauna după cum urmează: nodurile compuse (verde) sunt conectate la ținte (portocaliu = agenți patogeni; gri = ne-patogeni) prin margini de bioactivitate. Aceste legături prezintă rezultate pozitive (verde), neutre (gri) sau negative (roșu). În cele din urmă, vizează harta unui set de afilități funcționale (adnotări, noduri albastre). În exemplu, graficul prezintă un set de inhibitori cunoscuți pentru o aciltransferază umană (15). Aceste bioactivități (toate pozitive) sunt trase ca legături verzi între compușii (noduri verzi) și țintă (noduri gri pentru agenții patogeni, noduri portocalii pentru agenții patogeni). Graficul evidențiază oportunitățile de reprogramare a helmintului aciltransferazelor (linii punctate, adăugate manual pentru această figură), pe baza adnotărilor partajate cu ținta umană cunoscută. Nodul roșu din stratul de medicament indică compusul selectat. Dimensiunile nodurilor sunt determinate de numărul de conexiuni din rețea (grad), în timp ce lățimile de legătură de bioactivitate (marginile) sunt legate de numărul cumulat de dovezi experimentale pentru o anumită pereche de țintă medicament (numărul de teste).

Figura 1.

Model de rețea schematică în vizualizările TDR6 și sub-grafic: Paginile compuse sau țintă afișează acum o vizualizare subgraph care conține obiecte în rețeaua de vecinătate a entității selectate. Aceste grafice sunt construite dintr-un grafic de rețea complex cu trei straturi. O schemă a acestui grafic este prezentată în partea de sus. Ambele țintă și compusul subgrame sunt aranjate întotdeauna după cum urmează: nodurile compuse (verde) sunt conectate la ținte (portocaliu = agenți patogeni; gri = ne-patogeni) prin margini de bioactivitate. Aceste legături prezintă rezultate pozitive (verde), neutre (gri) sau negative (roșu). În cele din urmă, vizează harta unui set de afilități funcționale (adnotări, noduri albastre). În exemplu, graficul prezintă un set de inhibitori cunoscuți pentru o aciltransferază umană (15). Aceste bioactivități (toate pozitive) sunt trase ca legături verzi între compușii (noduri verzi) și țintă (noduri gri pentru agenții patogeni, noduri portocalii pentru agenții patogeni). Graficul evidențiază oportunitățile de reprogramare a helmintului aciltransferazelor (linii punctate, adăugate manual pentru această figură), pe baza adnotărilor partajate cu ținta umană cunoscută. Nodul roșu din stratul de medicament indică compusul selectat. Dimensiunile nodurilor sunt determinate de numărul de conexiuni din rețea (grad), în timp ce lățimea legăturii de bioactivitate (marginile) sunt legate de numărul cumulat de dovezi experimentale pentru o anumită pereche de țintă medicament (număr de teste).

Cu aceste actualizări, TDR6 oferă utilizatorilor următoarele funcționalități: (i) prioritizări țintă integral bazate pe rețea, (ii) explorarea reproșării medicamentelor; și iii) explorarea țintelor candidate pentru compușii orfani. Aceste cazuri de utilizare sunt posibile printr-o serie de caracteristici bazate pe rețea precompute, cum ar fi un scor nou de droguri de rețea (ND). Prin asocierea unei metrici cantitative la țintele bazate pe îmbogățirea compușilor bioactivi pe nodurile de rețea strâns legate, acest scor facilitează clasificarea țintelor în grupuri de droguri (DGS), care sunt disponibile utilizatorilor în interogările bazei de date.

Modelul de rețea este, de asemenea, baza pentru prioritizările prioritare conduse de rețea (NDP) care pot fi interogate de utilizatori și sunt, de asemenea, utilizate pe plan intern de către TDR6 pentru a selecta țintele și compușii conectați pentru afișarea în vizualizările rețelei nou dezvoltate (a se vedea mai jos). La pornind de la un compus de interes, TDR6 utilizează prioritizările precompuse ale țintelor candidate pentru a ajuta utilizatorii din navigarea spațiului țintă din jurul compusului (și invers atunci când pornește de la o țintă de interes). Prin furnizarea acestor metrici de îmbogățire precompusă și clasamente, baza de date facilitează acum descoperirea de noi asociații țintă de droguri. În afară de aceste NDP-uri noi, utilizatorii pot prioritiza țintele care utilizează aceeași funcție ca și în versiunile anterioare ale TDR.

Această versiune include și mai multe actualizări de date, și anume includerea a 22 de genomi noi (20 noi agenți patogeni și 2 noi Modelul organismelor) și actualizări extinse la datele chimice și bioactivității printre altele. Interfața cu utilizatorul îmbunătățită și versatilă, împreună cu actualizările de date reînnoiască angajarea obiectivelor TDR de a furniza un instrument integrat și puternic pentru explorarea datelor genomice și chimice în contextul bolilor tropicale neglijate.

Utilizarea țintelor TDR 6

Prioritizări țintă cu genomul întreg

Modelul de rețea (14) este baza pentru noul scor de droguri, care este o metrică derivată în rețea care este legată de îmbogățirea în compușii bioactivi pentru a țintă țintă (NDS, „Scorul de droguri de rețea”). NDS sunt disponibile pentru toate organismele de rangul 1, care pot fi interogate și utilizate pentru a intra în greutăți pentru a filtra (în sau out) țintă în conductele de prioritizare personalizate definite de utilizator. După cum sa explicat în continuare în detaliile integrării în rețea, pentru fiecare organism, obiectivele au fost clasificate în cinci grupuri de droguri (DG), de la cel mai mic (DG1) la cele mai înalte punctare (DG5), în funcție de performanța lor în prioritizările rețelei.

Ca și în versiunile anterioare ale țintelor TDR, utilizatorii pot combina diferite seturi de date pur și simplu prin efectuarea interogărilor individuale pe diferite tipuri de date și combinarea acestora la pagina Istoric (9,10,12,13). Acest lucru este util atunci când, de exemplu, utilizatorii ar dori să includă tipuri de date suplimentare pentru prioritizările bazate pe droguri, cum ar fi cele care se bazează pe expresia genei în etapele ciclului de viață relevante sau cele care furnizează informații privind fitness / letalitate a țintelor (esențiale).

Ca exemplu, prezentăm aici un exemplu de prioritizare utilizând Toxoplasma Gondii ca agent patogen de interes. T. Gondii este un parazit apicomplexan folosit adesea ca model pentru a investiga biologia care stă la baza mai multor boli umane și animale (15). Strategia de căutare este rezumată în figura 2. Interogarea a fost inițiată prin căutarea tuturor obiectivelor T. Gondii și prin filtrarea acestor ținte cu omologi la om (pentru a selecta numai obiective specifice parazitului). Apoi, am selectat genele esențiale candidate bazate pe profile de fitness în timpul infecțiilor fibroblastelor umane (16); și, de asemenea, genele selectate exprimate în tahiozoti (etapa replicativă a T. gondii), interogând pentru gene în top 80-100 percentil de abundența transcripției Rnaseq (17). Aceste selecții au fost combinate cu clasamentele de droguri de rețea. Pentru aceasta am considerat gene în grupurile de droguri 3, 4 sau 5 (DG ≥ 3) (a se vedea figura 2). Figura prezintă toate interogările și rezultatele lor, așa cum se vede în pagina Istorie și operațiunile efectuate la combinarea interogărilor (Union, Intersecție). Lista finală a obiectivelor clasate pe baza acestor criterii a fost făcută publică și este disponibilă în obiectivele TDR din listele postate.

Figura 2.

țintă Strategia de prioritizare pentru T. Gondii. Imaginea compozită arată (a) termenii de interogare utilizați pentru a găsi țintele T. Gondii care nu au homeologi la om, care sunt foarte exprimați în stadiul tahifizoriu virulent al parazitului în timpul infecției cu celule umane, care sunt probabil esențiale și sunt probabil drogate la scorul de droguri de rețea. (B) Rezumatul interogărilor efectuate la pagina „Obiective”, arătând modul în care aceste interogări apar în pagina „Istoric”, unde pot fi revizuite și transformate. Butoanele de gestionare a interogării in-line permit acțiunilor selectate (eliminați, redenumiți, exportați) pe seturi de rezultate.(C) Combinațiile de interogare permit utilizatorilor să execute Uniuni, să intersecteze sau să scadă acțiunile cu privire la interogările cu și unul de celălalt. Sunt prezentate exemple de acțiuni de intersecție și de intersecție. (D) interogările pot fi salvate la un stash privat (seturile de interogare) de unde pot fi trimise înapoi la spațiul de lucru (pentru a efectua operațiuni suplimentare de interogare) sau partajate în mod public cu alte vizite TDR (seturile de interogare țintă publicate).

Figura 2.

Prioritizare țintă Strategia pentru T. Gondii. Imaginea compozită arată (a) termenii de interogare utilizați pentru a găsi țintele T. Gondii care nu au homeologi la om, care sunt foarte exprimați în stadiul tahifizoriu virulent al parazitului în timpul infecției cu celule umane, care sunt probabil esențiale și sunt probabil drogate la scorul de droguri de rețea. (B) Rezumatul interogărilor efectuate la pagina „Obiective”, arătând modul în care aceste interogări apar în pagina „Istoric”, unde pot fi revizuite și transformate. Butoanele de gestionare a interogării in-line permit acțiunilor selectate (eliminați, redenumiți, exportați) pe seturi de rezultate. (C) Combinațiile de interogare permit utilizatorilor să execute Uniuni, să intersecteze sau să scadă acțiunile cu privire la interogările cu și unul de celălalt. Sunt prezentate exemple de acțiuni de intersecție și de intersecție. (D) interogările pot fi salvate la un stash privat (seturile de interogare) de unde pot fi trimise înapoi la spațiul de lucru (pentru a efectua operațiuni suplimentare de interogare) sau partajate în mod public cu alte vizite TDR (seturile de interogare țintă publicate).

Informațiile privind țintele cu medicamente cunoscute provin din curația literaturii, în timp ce asociațiile prevăzute (indirecte) ale țintelor cu inhibitori / medicamente sunt obținute prin calcule de similitudine sau ortologie a secvenței (la țintele de droguri cunoscute) sau prin inferențe sprijinite în rețea (14). Toate aceste metode sunt implementate în TDR6. Prin urmare, când utilizatorii filtrează o genă setată pe baza drogurilor, ele limitează selecția la obiective foarte clasate, care ar trebui să ofere o bogată sursă de oportunități de reproșare a medicamentului.

Pentru a prezenta utilitatea TDR6 în această zonă pe care o arătăm Cum să căutați medicamente candidate pentru reproșarea pentru Echinococcus Multilocularis (agentul cauzal al echinococozei alveolare). Acest lucru este arătat în figura 3. Procesul este similar cu cel descris anterior pentru T. Gondii, dar în această strategie de interogare nu am exclus omologi umani și am folosit seturile de date C. Elegans RNAI lethality ca proxy pentru esențialitatea nematodelor. Ca rezultat, am obținut o prioritizare cu totul genom pentru E. Multilocularis. Apoi, aplicând un filtru bazat pe droguri la această interogare, am redus selecția genei într-o mână de gene. Utilizatorul poate inspecta manual obiectivele selectate pentru a afla care medicamente au fost listate prin asociații indirecte. Paginile țintă vor afișa toți compușii asociați în secțiunea de droguri, clasificați în funcție de sursa deducției. Pentru inferențele bazate pe rețea, scorul pentru fiecare compus propus va apărea atât ca o listă, cât și ca un complot de rang, pentru a identifica rapid candidații promițători. Alternativ, pentru a minimiza inspecția manuală, lista genelor (adică interogarea în sine) poate fi ușor convertită într-o listă de medicamente asociate făcând clic pe butoanele „Convertiți aceste interogare” din partea de sus a paginilor rezultatelor interogării. Această funcție oferă o modalitate rapidă de a începe să creeze o bibliotecă de screening pentru un set de obiective. Transformările de interogare se pot baza pe curate (medicamente cunoscute pentru o setare a țintelor), prezise (asociații calculate la droguri) sau ambele. În toate cele trei abordări, inhibitorii / medicamentele asociate cu țintele cunoscute sunt asociate cu genele din listă. Figura 3 rezumă strategia de prioritizare, conversia interogării listei de gene la compuși și un exemplu de vizualizare sub-grafic disponibilă din pagina compusă a unei lovituri de reproșare. În prezent, aceste conversii sunt rulate în fundal și rezultatele apar în secțiunea Istoric a site-ului când este efectuată (utilizatorii sunt, de asemenea, alertați prin e-mail).

Figura 3.

Oportunități de reproșare a medicamentelor pentru E. Multilocularis folosind transformări de interogare. O schemă de prioritizare țintă pentru Echinococcus Multilocularis bazându-se pe inferența bazată pe ortologie și droguri previzionate (DG ≥ 3). (A) interogări combinate; (B) lista inițială a obiectivelor prioritare. (C) Orice listă țintă poate fi „transformată” într-o listă a medicamentelor asociate, utilizând oricare dintre metodele de legare a compusului disponibile (a se vedea textul principal). (D) Lista rezultată a compușilor bioactivi. (E) Exemplu de vizualizare a sub-graficului de rețea dintr-un compus selectat, care prezintă legături de bioactivitate activă și inactivă. Compușii (noduri verzi) sunt conectate la țintele patogene (portocaliu) în funcție de înregistrările de bioactivitate (verde = activ; roșu = inactiv, vezi textul principal pentru pragurile de activitate).Obiectivele, la rândul lor, sunt conectate (legăturile gri) la afilieri funcționale (noduri albastre). Sub-graficul oferă sugestii vizuale privind modul în care obiectivul inițial E. Multilocularis este conectat cu compusul selectat din rețea.

Figura 3.

oportunități de reproșare a drogurilor pentru E. Multilocularis utilizând transformări de interogare. O schemă de prioritizare țintă pentru Echinococcus Multilocularis bazându-se pe inferența bazată pe ortologie și droguri previzionate (DG ≥ 3). (A) interogări combinate; (B) lista inițială a obiectivelor prioritare. (C) Orice listă țintă poate fi „transformată” într-o listă a medicamentelor asociate, utilizând oricare dintre metodele de legare a compusului disponibile (a se vedea textul principal). (D) Lista rezultată a compușilor bioactivi. (E) Exemplu de vizualizare a sub-graficului de rețea dintr-un compus selectat, care prezintă legături de bioactivitate activă și inactivă. Compușii (noduri verzi) sunt conectate la țintele patogene (portocaliu) în funcție de înregistrările de bioactivitate (verde = activ; roșu = inactiv, vezi textul principal pentru pragurile de activitate). Obiectivele, la rândul lor, sunt conectate (legăturile gri) la afilieri funcționale (noduri albastre). Sub-graficul oferă sugestii vizuale privind modul în care obiectivul inițial de E. Multilocularis este conectat cu compusul selectat din rețea.

Explorarea compușilor orfani

Activitățile compușilor extrași din literatura de specialitate apar sub formă de teste bazate pe țintă (legătura directă la țintă) sau sub formă de teste bazate pe celule sau întregi. În absența altor informații, aceste clase de teste nu oferă indicii la ținta sau mecanismul de acțiune al compușilor. În timpul procesului de actualizări de date chimice în TDR6, am identificat compușii cu efecte fenotipice raportate asupra testelor integrate sau pe bază de celule, pe baza clasificărilor lor Chembl. Aceste informații au fost utilizate pentru a identifica compușii „orfani” care sunt activi împotriva unui agent patogen particular în proiecții primare sau secundare pe bază de celule, dar pentru care nu există o analiză bazată pe țintă.

Compușii orfani în TDR6 pot fi Căutat pentru orice specie cu date de screening fenotipic disponibile, în pagina de căutare a compușilor. Acest lucru permite o modalitate rapidă de utilizare a datelor din teste de mare viteză, permițând utilizatorilor să își înceapă prioritate de la compuși cu activitate cunoscută împotriva unui patogen de interes.

Modelul de rețea integrat în TDR6 este, de asemenea, util pentru identificarea candidatului ținte pentru compușii orfani. Așa cum este descris în publicația inițială (14), vecinătatea similarului chimic calculat în jurul unui compus orfan selectat poate oferi legături indirecte la una sau mai multe ținte. Folosind această strategie am efectuat prioritizări țintă pentru toți compușii orfani din TDR6. Aceste prioritizări compuse de rețea precomputed sunt disponibile pentru toate organismele pentru care sunt disponibile datele de screening fenotipic. Rezumatele globale care prezintă toți compușii orfani pentru aceste organisme sunt legate de pagina „Rezumatul datelor” (a se vedea https://tdrtargets.org / datasummary și faceți clic pe speciile de interes). Un exemplu de prioritizare bazată pe compusul orfan pentru T. Cruzi este prezentată în figura 4. întrucât prioriocațiile pornite de la un singur compus sunt disponibile în fiecare pagină compusă.

div>

Figura 4.

Explorarea țintelor candidate pentru compușii orfani trypanosoma cruzi. Plot rezumă prioritizarea țintă acționată în rețea pentru compușii orfani activi împotriva T. Cruzi. Toate secvențele de codificare a proteinelor din genomul T. Cruzi (țintele candidate) sunt aranjate pe axa X. Punctele de date din parcelă corespund asociațiilor de medicament țintă marcate de algoritm (scorul reprezentat pe axa Y). De exemplu, am evidențiat două ținte presupuse pentru două medicamente diferite (așa cum este afișat în pagina Rezumatul datelor T. Cruzi). Părți similare sunt disponibile online pentru organismele de nivel 1 în TDR6 (legat de pagina Rezumatul datelor).

Figura 4.

Explorarea țintelor candidate pentru compușii orfani trypanosoma cruzi. Plot rezumă prioritizarea țintă acționată în rețea pentru compușii orfani activi împotriva T. Cruzi. Toate secvențele de codificare a proteinelor din genomul T. Cruzi (țintele candidate) sunt aranjate pe axa X. Punctele de date din parcelă corespund asociațiilor de medicament țintă marcate de algoritm (scorul reprezentat pe axa Y). De exemplu, am evidențiat două ținte presupuse pentru două medicamente diferite (așa cum este afișat în pagina Rezumatul datelor T. Cruzi). Părți similare sunt disponibile online pentru organismele de nivel 1 din TDR6 (conectate din pagina Rezumatul datelor).

Funcționalitate și actualizări de date

Noi date genomice în TZR vizează V6.1

De la publicarea anterioară a bazei de date TDR (13) au fost adăugate mai multe genomi patogeni. O listă detaliată este furnizată în tabelul 3, precum și online la pagina Rezumatul datelor TDR6 (https://tdrtargets.org / datasummary).

Tabelul 3 .

Rezumatul disponibilității datelor pentru agenții patogeni de top. Rezumatul datelor țintă disponibile pentru organismele de rangul 1 în țintele TDR. CD-uri: secvențe de codare; PFAM: Numărul de proteine cu Domeniul (domeniile) de PFAM cartografiat; Go: Numărul de proteine cu termeni de ontologie a genei mapate; CE: Numărul de proteine cu numere de comisioane enzimatice mapate (CE); Căi: numărul de proteine mapate la Hărți Kegg Pathway; Orthologii: Numărul de secvențe mapate la grupurile Orthomcl Ortholog. O masă mai completă a sumarului de date este disponibilă online la https://tdrtargets.org

1B01F6074E „>

specii.

CD-uri. pfam.

Du-te.

CE. căi. orologii. Plasmodiu falciparum 5349 3322 355 1083 Plasmodium Vivax 5344 3631 641 806 846 5207 TOXOPLASMA GONDII 7946 3795 7725 772 967 6764 chlamydia trachomatis 887 704 598 369 645 Mycobacterium Leprae 1630 929 628 611 1473 Mycobacterium Tuberculosis 4004 2934 1174 1174 1145 3287 Mycobacterium ulcerans 4232 3602 2578 873 3459 Trep Onema Palidum 1036 634 221 335 335 733 Wolbachia Endosymbiont de B. Malayi 805 577 577 308 688 brugia malayi 11316 7042 6368 1278 8424 Echinococus Granulosus 10249 6481 854 1965 7109 7109 Echinococcus Multilocularis 10474 6817 878 878 2079 7539 Loai (Worm) 16292 8071 6774 1539 2207 Onchocerca Volvulus 12224 3248 246 563 4054 Schistosoma Mansoni 12692 7818 7384 1218 1649 4641 4415 1067 8250 Trypanosoma Brucei 10270 5665 1019 1264 9259 Trypanosoma cruzi 18639 8908 8572 1495 1735 18140 Entamoeba Histolytica 8211 4920 4087 645 10692

7692 Giardia Lamblia 9665 2263 326 514 5977 Trichomonas Vaginalis 95600 35474 843 1366 87303

Specii.

Du-te.

5432

Entamoeba histolytica

CD-uri. pfam. CE. căi. orologii.
Plasmodiu falciparum 5349 3322 355 1083
Plasmodium Vivax 5344 3631 641 806 846 5207
TOXOPLASMA GONDII 7946 3795 7725 772 967 6764
chlamydia trachomatis 887 704 598 369 645
Mycobacterium Leprae 1630 929 628 611 1473
Mycobacterium Tuberculosis 4004 2934 1174 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 3459
Trep Onema Palidum 1036 634 221 335 335 733
wolbachia endosymbiont de B.malayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (ochi vierme)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania majore 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Tabelul 3.

Sumar Disponibilitatea datelor pentru agenții patogeni top tier. Rezumatul datelor vizate disponibile Tier 1 organisme în Ținte TDR. CD-uri: secvențe de codificare a mărfurilor; Pfam: număr de proteine cu Mapate Pfam Domain (e); GO: număr de proteine cu termeni Gene Ontologie mapate; CE: numărul de proteine cu numere mapate Enzyme (CE); Pathways: număr de proteine mapat hărți de cale KEGG; Ortologi: număr de secvențe mapate la grupări OrthoMCL ortolog. Un tabel mai complet Sumar de date sunt disponibile online la https://tdrtargets.org / datasummary

Plasmodium vivax

-805 05

388 388

779

16392 071 1509 071 071 1559 071

1539 071 //td>



Schistosoma Mansoni

12692

3c34827 ” ” 0B01674E „” DV Id = „0B01674E.

5344

04 87 04 87 87 04 87

a Tepne

673

374 MycobAacterium 6678 678 678

3459

5432

Entamoeba histolytica

Specii. CD-uri. Pfam. GO. CE. Pathways. ortologi.
Plasmodium falciparum 5349 3322 3551 750 1083 5166
5344 3264 2631 641 806 5207
Toxoplasma gondii 7946 4025 3795 772 967 6764
Chlamydia trachomatis 887 704 598 269 357 645
Mycobacterium leprae

1630

1236 929 628 611 1473
Mycobacterium tuberculosis 4004 2934 2001 1174 1145 3287
Mycobacterium ulcerans 4232 3602 2578 873 1002 3459
TREP onema pallidum 1036 791 634 221 335 733
Wolbachia endosymbiont B.Malayi 588
Brugia Malayi

11316

7042 1278 1278 1787 6481 854 1965 7109 7109
Echinococcus multilocularis

10474

758
loa loa (vierme ocular) 1539 071 071 15371 1537 071 1559 071 2207 2378 2178 2478 246 563
7818 7384 1218 leishmania major 8280 4641 4415 1067 1162 8250 5480 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 8211 4920 4087 645 7692 2263 2735 363 3635 363 2235 363 5600

35600

35474

18435 CD-uri. pfam. du-te. CE. pathes. ortoogs. v id = „29971A56991” 3322 551 7166 Plasmox Vivax 641 606 06 06 06 06 06 06 5207
TOXOPLASMA GONDII 7946 4025 3795 772 967 269 269 1630 1236
MycobAacterium ttuzis Page 1174 1174 1174 873 3459
Trep. 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33
Wolbia Indusiabiant de bmalayi 805 628 577 308 382 688
Brugia malayi

11316

7042 6368 1278 1787 8424
Echinococcus granulosus

10249

6481 854 1965 7109
Echinococcus multilocularis

10474

6817 5768 878 2079 7539
Loa Loa (ochi vierme)

16292

8071 6774 1539

2207

10484

Onchocerca volvulus

12224

3248 2178 246 563 4054
Schistosoma mansoni

12692

7818 7384 1218 1649

10386

Leishmania majore 8280 4641 4415 1067 1162 8250
Trypanosoma brucei

10270

5665 5482 1019 1264 9259
Trypanosoma cruzi

18639

9908 8572 1495 1735

18140

8211 4920 4087 645 1094 7692
Giardia lamblia 9665 2726 2263 326 514 5977
Trichomonas vaginalis

95600

35474

18435

843 1366

87303

Având în vedere diversitatea organismelor integrată în Targets TDR și, în consecință, varietatea surselor de date necesare pentru a acoperi toate genomuri; efort substanțial a fost pus în standardizarea datelor parsare și regăsire a informațiilor din genomul Aceste organisme. Cele mai multe dintre genomuri complet EupathDB Au fost obținute de la (18), GenBank (19), GeneDB (20), Wormbase Parazit (21), GenoList (22) sau Mycobrowser (23). O descriere completă din sursele genomului și date în tabelul precedent suplimentar S1. Pentru a actualiza datele pentru organismele prezente în versiunea anterioară a Ținte TDR gene de codificare de proteine de la versiunea curentă a genomurilor au fost fie mapate gene existente în Targets TDR, sau altfel introduse noile înregistrări. Maparea Algoritmul folosește o combinație de condiții pentru a urmări Gene identificatorii peste presă și de a menține identitatea genelor: checksum secventa de potrivire (folosind valori de 128 biți Hash generate de MD5 Algorithm), nume de gene sau de identificare și sablare (24) IF sau meciuri perfecte sunt găsite. După actualizarea înregistrărilor, conducta calculează proprietățile fizico-chimice utilizând Pepstats (25), scanările domenii transmembranare cu TMHMM (26), peptide semnal cu SignalP (27), și glycosylphosphatidylinositol puncte de ancorare, folosind PredGPI (28). Algoritmul respinge toate secvențele necodificatoare, cele mai bine orice Pseudogenes, pentru a evita inducerea în eroare adnotări și minimizarea presupuneri false în timpul fluxurilor de lucru de prioritizare. Cele mai multe dintre TDR6, menționate mai sus au toate sarcinile pentru a genomului integrare și actualizare au fost Înfășurat în fluxul de lucru automatizat pentru a facilita mai rapid actualizări în versiunile viitoare. O schemă a actualizării și conductelor Algoritmul prezentat în figura anterioară suplimentar S1. Pipeline automatizează, de asemenea, modul de calcul al adnotări folosind strategii individuale ad-hoc pentru diferite adnotări, bazându-se pe serviciile web și API-uri (apărut în Kaas (29) serviciu pentru proteine maparea metabolice Caile și la numărul de clasificare CE, a enzimelor, sau OrthoMCL baze de date și instrument (30,31) pentru grupurile de cartografiere ortolog la proteinele. Conducta se bazează și pe calcul contra bazelor de date au apărut la nivel local instalate majoritatea InterPro (32), folosind InterProScan (33) pentru a identifica domenii de proteine (Pfam) si harta termeni pentru vocabulare controlate și clasificări (termeni GO). resurse suplimentare au apărut cele mai 3D structuri și modele structurale au fost recuperate de la Banca de date proteine (34) folosind servicii web și descărcate de pe site-ul Modbase FTP (35), respectiv.

de asemenea, numărul de seturi de date cheie funcționale au fost integrate în această versiune, incluzând: (i) seturi de date transcriptomic care prezintă dovada expresiei genelor în stadii ale ciclului de viață sau condiții experimentale care sunt relevant pentru droguri Discovery (36-47) și (ii) seturi de date neesențial derivate din doi agenți patogeni Apicomplexan (P. berghei și T. gondii) (16,48), care furnizează informații Strategies vitale ASSIST prioritizării.

Actualizări de date chimice

Pentru compușii bioactivi de asemenea, fluxurile de lucru de actualizare a datelor au fost automatizate pentru această versiune.Majoritatea compușilor bioactivi au fost recuperați din eliberarea de 24 de la Chembl (49), care conține unele seturi de date suplimentare, cum ar fi cele ale cutiilor chimice specifice patogene – cutii de kinetoplastid GSK (50), cutie patogenă MMV (51). Procesul de integrare începe de la descrierile moleculelor (2D) în format SDF, din care am calculat toate amprentele compuse necesare (necesare pentru căutările de similitudine compus / substructură) utilizând Checkmol (52). Conducta calculează, de asemenea, proprietăți chimice suplimentare, cum ar fi coeficientul de partiție Octanol / Apa de apă și alți descriptori structurali, utilizând XLOGP3 (53) și instrumentele deschise Babel Obprop și ObroTamer (54). Alte date relevante au fost obținute sau calculate direct din structura compusului, cum ar fi identificatorii INCHI și inchikey (55) utilizați pentru urmărirea compușilor; și alte reguli standard de degetul mare utilizat în chimia medicală și descoperirea medicamentelor, cum ar fi regula Lipinski de cinci (56) și regula conexă de trei (57).

După integrarea în țintele TDR, toți compușii au fost supuși La un calcul al comparației de similitudine de similitudine, utilizând chemfp (58) care produce măsurători de asemănare la perechi pe baza indicelui tanimoto / distanța (59). De asemenea, am calculat o hartă globală (toți versus toate) a relațiilor de substructură între compușii din baza de date (X este o substructură de Y; Y este o suprastructură de x). Știind că problema găsirii unor subgrafuri comune maxime între molecule este computațional greu, am aplicat o abordare euristică pentru a găsi substructuri. Algoritmul obține mai întâi un subset de posibile molecule candidate, utilizând amprentele digitale calculate anterior. Candidații trebuie să aibă amprente care se potrivesc cu molecula subiectului. Odată ce se obține o listă de candidați, determinarea substructurii atomi de atomi de atomi se face folosind Matchmol (52). Datele disponibile pentru compuși și interogările care pot fi executate pe fiecare tip de date sunt rezumate în tabelul 2. Greutatea moleculară (MW) și suprafața polară (PSA) Distribuția pentru toți compușii din baza de date este prezentată în figura suplimentară S2.

Curatarea și integrarea datelor de bioactivitate

Ca și în cazul compușilor chimici, majoritatea bioactivităților integrate în țintele TDR provin direct din surse de date în amonte (de exemplu, Chembl). La integrarea datelor de bioactivitate, am păstrat atât adnotarea testului (de exemplu, testul de reducere a motilității in vitro împotriva microfilarielor Brugia Malayi la 10 pM ‘), cât și valoarea numerică și unitățile asociate activităților compuse (de exemplu, inhibiția ‘80% ” μm IC50 ‘, ’10 nm mic’), care sunt toate câmpurile care pot fi căutate. În plus, și pentru a facilita interogările utilizatorilor, bioactivitățile raportate au fost utilizate pentru a grupa compușii testați în clase „active” sau „inactive”. Cu toate acestea, pentru a minimiza efectul utilizării limitelor dure în jurul pragurilor arbitrare și creșterea separării dintre clasificările active / inactive, am definit, de asemenea, o zonă gri nedeterminată. Prin urmare, compușii care marchează chiar sub un prag arbitrar nu sunt considerați inactivi pentru scopuri de interogare și vizualizare.

Nu toate tipurile de activități au fost supuse clasificării. În ciuda eforturilor de standardizare a acestor date de activitate, interpretarea activităților compușilor la această scală este dificilă, deoarece depind adesea de tipul de analiză particular, de unitățile raportate și de condițiile particulare în care au fost efectuate fiecare analiză. Cu toate acestea, un set semnificativ de tipuri de testare ar putea fi clasificat automat în categorii active / nedeterminate / inactive bazate pe praguri de activitate. Pentru aceasta, rapoartele de testare cu > 100 000 (a se vedea figura S3 suplimentară pentru o activitate pe tipul de testare / per compus de distribuție) au fost luate în considerare pentru auditarea activității, deși numai teste pe bază de concentrație (cum ar fi IC50, ki sau potență) au fost găsite suficient de robuste pentru o astfel de determinare, deoarece testele procentuale bazate (cum ar fi% activitate,% activitate reziduală sau inhibarea $) au fost ambigue în rapoartele de bioactivitate. Pragurile utilizate pentru clasificarea activităților pentru fiecare tip de testare pot fi găsite în tabelul 4, iar distribuția compușilor din aceste clase de activități este rezumată în Figura 5.

Tabelul 4.

Tipuri de testare și praguri de activitate utilizate pentru determinarea etichetei de activitate: Numai testele bazate pe concentrații au fost utilizate pentru a determina etichetele de activitate. Activitățile care raportează mai puțin decât valoarea maximă admisă pentru pozitive au fost considerate interacțiuni active (+), în timp ce cele mai mari decât cele minime admise pentru negative „au fost considerate inactive (-). Orice activitate raportată între aceste două valori a fost considerată ca fiind nedeterminată (0)

div id = „1B01F6074E”

testul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

div id = „1B01F6074E”
Tr>

Tipul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

Tabelul 4.

Tipuri de testare și praguri de activitate utilizate pentru determinarea etichetei de activitate: numai testele bazate pe concentrație au fost utilizate pentru a determina etichetele de activitate. Activitățile care raportează mai puțin decât valoarea maximă admisă pentru pozitive au fost considerate interacțiuni active (+), în timp ce cele mai mari decât cele minime admise pentru negative „au fost considerate inactive (-). Orice activitate raportată între aceste două valori a fost considerată ca fiind nedeterminată (0)

div id = „1B01F6074E”

testul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

div id = „1B01F6074E”
Tr>

Tipul de tip. unitate standard. Valoarea maximă admisă pentru active. Valoarea minimă admisă pentru inactivi. AC50 Nm 20000 100000 EC50 Nm 20000 100000

™ 20000 IC50 Ug ML-1 15 KD Nm 20000 Ki Nm 20000 100000 Nm 20000 100000

Figura 5.

Etichete de activitate Distribuția și amestecurile de dovezi între date: (a) Diagrama Venn care prezintă distribuția valorilor de bioactivitate în clasele active, inactive și nedeterminate din TDR6 (vezi textul principal pentru detalii) . Intersecții Numărul cazurilor în care același medicament are rezultate diferite de activitate împotriva aceluiași țintă. Exemple de aceste cazuri sunt furnizate în panourile B prin f (ID-urile compușilor reprezintă identificatori TDR6). (B) Activitatea C329137 (o hidroxi-benzamidină) împotriva lui P. falciparum dihidrofolată dihidrofolată reductază-thymidyat sintetază. (C) Exemplu de înregistrări pozitive pentru inhibitorii de aciltransferază umană. (D) Exemplu de activități negative și neutre pentru compușii trifenilcarbinol și benzohidrolul, respectiv. În cele din urmă, dovezile pozitive (E) și negative (f) pot fi amestecate cu dovezi nedeterminate, așa cum se arată pentru C2164865 testate împotriva colinesterazei de cai și C306882 testate împotriva hidrolazei 5′-trifosfat deoxididină 5′-trifosfat deoxididină recombinantă, respectiv.

Figura 5.

Etichete de activitate Distribuția și amestecurile de dovezi între date: (a) Diagrama Venn care prezintă distribuția valorilor de bioactivitate în activ , clase inactive și nedeterminate în TDR6 (vezi textul principal pentru detalii).Intersecții Numărul cazurilor în care același medicament are rezultate diferite de activitate împotriva aceluiași țintă. Exemple de aceste cazuri sunt furnizate în panourile B prin f (ID-urile compușilor reprezintă identificatori TDR6). (B) Activitatea C329137 (o hidroxi-benzamidină) împotriva lui P. falciparum dihidrofolată dihidrofolată reductază-thymidyat sintetază. (C) Exemplu de înregistrări pozitive pentru inhibitorii de aciltransferază umană. (D) Exemplu de activități negative și neutre pentru compușii trifenilcarbinol și benzohidrolul, respectiv. În cele din urmă, dovezile pozitive (E) și negative (f) pot fi amestecate cu dovezi nedeterminate, așa cum se arată pentru C2164865 testate împotriva colinesterazei de cai și C306882 testate împotriva hidrolazei 5′-trifosfat deoxididină 5′-trifosfat deoxididină recombinantă, respectiv.

Chem Garanta Chembl se numără cu peste 15,2 milioane de bioactivități raportate, din care doar aproximativ 6 milioane corespund relațiilor care implică medicamente și ținte de proteine (fie proteine unice, familii de proteine și complexe de proteine, cu ~ 93% fiind proteine unice). Alte bioactivități rămase din baza de date au fost rapoarte pentru o mare varietate de ținte non-proteice, cum ar fi celule întregi (3,6 m), organisme integrale (2,2 m), țesuturi (83k) și macromolecule nepeptidice (85k) sau Molecule mici (< 100). Acestea nu au fost utilizate în construcția de rețea, deoarece rețeaua este proteină (adică țintă) centrică. Figura 5 prezintă, de asemenea, un exemplu de vizualizare a rețelei care descriu modul în care TDR6 afișează aceste bioactivități.

Integrarea caracteristicilor derivate din rețea: droguri și prioritizări

După cum sa menționat mai sus, datele genomice, adnotările genetice, Compușii chimici și interacțiunile gene-medicament au fost integrate într-o rețea complexă orientată spre reproșarea medicamentului, așa cum este descris în Berenstein și colab. (14). Rețeaua a fost utilizată pentru a calcula un scor de droguri de rețea (ND), pentru toate obiectivele din agenții patogeni de prioritate (tier 1). NDS este legată de șansa de a găsi compuși bioactivi în imediata apropiere a graficului de rețea a unui țintă dată (intervalul este de la 0 la 1). Algoritmul a fost descris anterior în detaliu (14), dar pe scurt, pe baza unui test de supraprezentare a proteinelor drogate cunoscute, calculează un scor de relevanță (RS) pentru fiecare categorie de domenii și grupuri de ortologie ale rețelei PFAM. Scorul NDS pentru o anumită țintă rezultă dintr-o sumă cumulativă ponderată față de RS a tuturor contribuțiilor de afiliere comune nodului țintă și proteine vecine legate de compușii activi.

Pentru a facilita interpretarea scorurilor NDS Am efectuat a Evaluare statistică pentru a identifica grupuri distincte de droguri (DG) pe baza a două tipuri de praguri care ajută la clasificarea predicțiilor de droguri în zonele de încredere. Acestea sunt ilustrate în figura 6. Pe de o parte, în timp ce toate țintele de notare non-zero au un anumit grad de conectivitate la țintele cunoscute, un NDS scăzut sugerează că aceste conexiuni nu sunt relevante pentru evaluarea drogurilor. Prin urmare, un zgomot de zgomot (o linie de bază calculată ca 5 ori mai mare decât valoarea de 0,25 percentilă din distribuția completă a NDS) este considerată a identifica obiective scăzute de notare. Al doilea prag este derivat din indicele maxim al Youden (60), care este calculat ca scorul la care specificitatea și sensibilitatea sunt optime (cea mai bună sensibilitate fără a compromite specificitatea și invers). Această valoare poate fi calculată numai pentru agenții patogeni cu pozitive adevărate (ținte cunoscute). Un minim arbitrar de 10 pozitive adevărate a fost considerat suficient pentru determinarea cutoff dvs. Pentru alți agenți patogeni lipsiți de astfel de informații, a fost utilizat o cutie globală Youden (calculată folosind toate adevărate pozitive în rețea). Grupurile de droguri corespunzătoare sunt astfel: DG1 pentru obiective cu valori NDS variind de la 0 la pragul de zgomot; DG2 pentru obiective cu valorile NDS variind de la pragul de zgomot la cutoff-ul Youden; și DGS 3, 4 și 5 cu valori NDS care sunt 1-, 10- și 100 de ori deasupra tăierii lui Youden. În consecință, aceste grupuri din urmă fac cele mai probabile obiective drogate. Figura 6 prezintă un exemplu static al unei prioritizări bazate pe rețea pentru ulcerans Mycobacterium (care nu are ținte cu compuși cunoscuți în eliberarea curentă). Toate prioritizările pentru obiectivele prioritare ale TDR pot fi văzute online la pagina Rezumatul datelor pentru fiecare specie (a se vedea https://tdrtargets.org / datasummary, făcând clic pe speciile de interes). În acest caz, parcelele online sunt interactive și pot fi mărite și exportate. În cazurile în care există ținte cu compuși bioactivi cunoscuți pentru specie, acestea sunt prezentate distinctiv în complot.

Figura 6.

întregi Genomul de prioritizare țintă pentru ulcerele Mycobacterium: țintele candidate în genomul M. Ulcerans au fost clasificate de ND (scorul de droguri de rețea, a se vedea textul principal).Plot prezintă toate țintele genomului (în axa X) împreună cu scorul lor NDS corespunzător (în axa Y). Punctele roșii corespund obiectivelor clasate în top-10, cu etichete care indică numele genei și produsul. Bornirea prioritizării întregului genom din Rezumatul datelor, utilizatorul poate accesa o pagină de gene făcând clic pe acesta în complotul de prioritizare. Un exemplu de subgraf din familia EMBA / EMBB / EMBC este arătat (așa cum se vede în paginile lor de gene corespunzătoare). Cifra afișează, de asemenea, zone de încredere, DG1 (roșu): delimitate de cutoff zero și zgomot; DG2 (galben): între zgomotul și cutoff-ul tău; și DG3-5: cu scoruri mai mari decât cutoff-ul tău.

Genomul întreg de rețea Prioritizarea țintă pentru Ulcerans Mycobacterium: țintele candidate în genomul M. Ulcenns au fost clasificate de NDS (scorul de droguri de rețea, a se vedea textul principal). Plot prezintă toate țintele genomului (în axa X) împreună cu scorul lor NDS corespunzător (în axa Y). Punctele roșii corespund obiectivelor clasate în top-10, cu etichete care indică numele genei și produsul. Bornirea prioritizării întregului genom din Rezumatul datelor, utilizatorul poate accesa o pagină de gene făcând clic pe acesta în complotul de prioritizare. Un exemplu de subgraf din familia EMBA / EMBB / EMBC este arătat (așa cum se vede în paginile lor de gene corespunzătoare). Cifra afișează, de asemenea, zone de încredere, DG1 (roșu): delimitate de cutoff zero și zgomot; DG2 (galben): între zgomotul și cutoff-ul tău; și DG3-5: cu scoruri mai mari decât cutoff-ul Youden.

Aceste prioritizări bazate pe rețea pot funcționa în ambele sensuri. La pornind de la un compus de interes, algoritmul poate prioritiza țintele, utilizând similitudinea ponderată a vecinilor chimici la obiectivele inițiale candidate. Și când pornește de la țintă de interes, poate prioritiza compușii, folosind țintele vecine conexe și apoi după legăturile ponderate cu inhibitorii / drogurile candidate. Scorurile precomputed pentru compuși și pentru ținte sunt utilizate intern de către TDR6 și sunt la miezul transformărilor de interogare bazate pe rețea.

Sub-graficul de rețea Vizualizări și upgrade de interfață utilizator

rețeaua sub -Graps pentru ambii compuși și ținte (și scorurile lor NDS respective) pot fi navigate de la aplicația web utilizând un medicament sau o țintă ca punct de plecare pentru a obține sugestii pentru medicamente netestate sau respectiv obiective drogate noi. Prin intermediul vizualizărilor nou dezvoltate, utilizatorii pot verifica cartierele de rețea în jurul drogurilor și țintelor în paginile corespunzătoare. Listele de interacțiuni puative derivate din rețea pot fi, de asemenea, explorate în format tabular sub „droguri” (pentru ținte) și „obiective cunoscute și predicte” (pentru droguri).

Aceste vizualizări sunt conduse de D3.Js (61) Implementarea layout-urilor forțate pentru vizualizările sub-grafice. În cadrul panoului D3 Subgraph, utilizatorii pot efectua căutări de nod în graficul (identificatorii țintă), precum și comutați vizibilitatea țintelor pe o specie de către speciile și personalizați opacitatea nodurilor. Luate împreună aceste noi caracteristici oferă o vizualizare clară și cuprinzătoare a vecinătății de sub-rețea a țintelor și compușilor, permițând utilizatorilor să manipuleze graficele în timp ce explorați datele.

Interfața utilizator (UI) și instrumentele disponibile Pentru reproșarea la droguri și prioritizarea țintă au trecut printr-un upgrade major. În primul rând, UI a fost reproiectat sub standardele W3C pentru a obține o aplicație mai sănătoasă și mai scalabilă. Am integrat bootstrap (https://getbootstrap.com/) și jquery (https://jquery.com) în dezvoltarea și proiectarea aplicației web TDR6 și în față- Funcționalitate finală. Pentru interogările structurii compuse, am licențiat și implementat aplicația de desenare chimică Marvin JS de la Chemaxon (https://chemaxon.com/products/marvin-js). Înregistrările tabele în paginile țintă și de droguri utilizați acum pluginul JavaScript JavaScript () pentru a crea cu ușurință pagini, filtrare și funcționare funcționalități. În cele din urmă, reprezentările compuse 2D sunt acum generate automat utilizând o implementare a modulului JavaScript Smilesdrawer (62).

Disponibilitatea comercială a compușilor

un aspect important la prioritizarea compușilor pentru testarea în laborator , este disponibilitatea lor. În TDR6 afișăm acum informații despre disponibilitatea comercială a compușilor. În prezent, am început această caracteristică prin legarea cu Molport (o piață chimică on-line care surore compușii de la furnizorii majori) și arată utilizatorilor un indiciu vizual asupra paginilor compuse care dau o indicație rapidă dacă compusul este fie în stoc, fie poate fi făcut la comandă . Deoarece disponibilitatea comercială a compușilor este implementată în prezent în TDR6 sub formă de interogări asincrone împotriva Molport, în acest moment această caracteristică este disponibilă numai în modul de navigare (nu în interogări).Cu toate acestea, utilizatorii pot prioritiza compușii utilizând oricare dintre strategiile de interogare disponibile în TDR6 și apoi finalizează selecțiile compuse prin inspectarea compușilor manual pentru disponibilitatea comercială.

Discuție și direcții viitoare

Noile date , interfața și funcționalitatea TDR6 furnizează utilizatorilor o navigare și vizualizare îmbunătățită a țintelor și a compușilor.

Modelul curent de rețea conectează obiectivele prin afilierea entităților (proteinelor) la conceptele de adnotare (domeniile PFAM, grupurile Ortholog). Acestea au fost selectate pe baza acoperirii lor largi și a unui calcul relativ de calcul. Completarea acestor concepte cu alte criterii importante pentru validarea țintă a drogurilor (esențialitatea, expresia în etapele ciclului de viață relevante) pot fi efectuate de către utilizatori cu instrumentele și funcționalitatea oferită de TDR6, dar în viitor pot fi construite în modelul de rețea subiacente, la cel puțin pentru unele organisme care pot fi evaluate experimentale la nivel de genom.

Mai multe îmbunătățiri-cheie sunt necesare pentru a păstra obiectivele TDR relevante pentru comunitatea oamenilor de știință care lucrează la boli tropicale. Integrarea metaboliților naturali și conectarea acestor molecule mici la alți compuși bioactivi prin substructuri partajate sau prin similitudine chimică va fi un accent major în viitor. Acest lucru va permite navigarea grafitelor de droguri folosind conceptele de reacții biochimice, care conectează în mod natural enzime non-ortologice prin substraturile / produsele și cofactorii lor partajați.

în cele din urmă, așa cum sa menționat deja înainte (13), Există încă un decalaj mare de curatare care trebuie umplut. Mulți compuși bioactivi au fost testați de către Comunitatea cercetătorilor care lucrează în boli tropicale neglijate. Cu toate acestea, multe dintre aceste analize și rezultate sunt raportate în reviste în afara revistelor de chimie medicamentoasă mainstream și, prin urmare, sunt ratate de eforturi mari de curatare, cum ar fi cea condusă de Chembl (49). Curatarea și integrarea acestor date lipsă (inclusiv date negative!) Ar trebui să fie o prioritate pentru comunitate, deoarece ar economisi timp și resurse valoroase.

Date suplimentare

Sunt disponibile date suplimentare la Nar online Obiective; și Ben Webb și Andrej Sali (Universitatea din California San Francisco) pentru calcularea modelelor 3D pentru genomul patogenului de nivel 1 în țintele TDR. L.U.L., A.B. și s.v. au fost sau sunt susținute de burse de la Consiliul Național de Cercetare (Coniceet, Argentina). A.C. și F.A. sunt membri ai carierei de cercetare a Consiliului Național de Cercetare (Conicet, Argentina). P.M. ar dori să recunoască o părtășie de la Comisia de granturi Universitară (UGC), India.

Finanțare

GlaxoSmithKline Argentina și Agenția Națională pentru Promovarea Științei și Tehnologiei, Argentina (ANPCYT); Proiect de cooperare bilaterală Indo-Argentina (finanțare comună de la Departamentul Indian de Știință și Tehnologie (DST) și Ministerul Argentinian al Științei și Tehnologiei (Mincyt). Finanțare pentru taxa de acces deschis: Fondo Para La Investigación Científica y Tecnológica.

Conflictul de interese Biología Molecular, División Patología, Spitalul de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.

wotez
PJ

,

Molyneux
DH

,

Fenwick
a.

,

kumaresan
J.

,

Sachs
Sachs
Sachs

,

Savioli
L.
Controlul bolilor tropicale neglijate

.

n. engl. J. Med.
2007

;

357

:

1018

1027

.

Trouiller
p.

,

Olliaro
p.

,

torreele
e.

,

orbinski
j.

,

Ling
R. Div> Ford
Div> Div> Dezvoltarea drogurilor pentru boli neglijate: o piață deficitară și un public – Eșecul politicii pentru sănătate

.

lancet nord am. Ed.
2002

;

359

:

2188

2194

.

hughes
j.

,

rees
s.

,

kalindjian
s.

,

philpott
k.
Principiile Discovery-ului de droguri timpurii

.

Br. J. Farmacol.
2011

;

162

:

1239

1249

.

adams
cp
brantner
vv
Estimarea costului noii dezvoltări de droguri: Este într-adevăr 802 milioane dolari

.

Affațiuni de sănătate. (Millwood)

.

2006

;

25

:

420

428

.

wyatt
wyatt
pg

,

Gilbert
IH

,

citite
kd

,

div> DIV> DIV> Validarea țintă : Linking Proprietăți țintă și chimice la profilul de produs dorit

.

curr. Top. Med. Chem.
2011

;

11

:

1275

1283

.

Div> Farha
Ma

,

maro
ed
Raportarea medicamentului pentru descoperirea antimicrobiană

.

Nat. Microbiol.
2019

;

4

:

565

577

.

div>
hernandez
div> hw

,

Soeung
m.

,

zorn
Div>

div>

div> Mottin
m.

,

Andrade
DIFFREY DIFFREY
Cr
div> ekins
s.
s.
s.
de mare putere și reputație computațională pentru bolile neglijate

.

Pharm. Res.
2018

;

36

:

27

.

sk>

div> wooller
sk

,

bensted- Hume
g.

,

chen
x.

,

Ali
y.

,

perla
fmg
bioinformatică în descoperire de droguri translaționale

.

Biosci. Rep.
2017

;

37

:

DOI: 10.1042 / bsr20160180

.

Agüero
Agüero
f.

,

-Lazikani
b.

,

aslett
m.

,

berriman
m.

,

Buckner
FS> Div> Campbell
Rk

,

carmona
S.

,

Carruthers
im

,

chan
chen

.

și colab. .

Prioritizarea la scară genomică a țintelor de droguri: Baza de date TDR Obiective

.

Nat. Rev. Drug Discov.
2008

;

7

:

900

907

.

Crowther
gj

,

shanmugam
d.

,

CARMONA
sj

,

Doyle
ma

,

Hertz-Fowler
c.

,

berriman
m.

,

nwaka
s.

,

Ralph
ROOS
ds

,

van voorhis
div> wc

și colab. .

Identificarea țintelor de droguri atractive în agenții patogeni neglijați folosind o abordare silico

.

PLOS negl. Trop. Dis.
2010

;

4

:

E804

.

Lykins
JD
Filippova
eV

,

halavaty
g.
g.

,

Zhou
Y.

,

Dubrovska
i.

,

Flores
kJ

,

SHUVALOVA
La

Ruan

j.

,

d div> / div> și colab. .

CSGID rezolvă structurile și identifică fenotipurile pentru cinci enzime în Toxoplasma gondii

.

față. Celula. Infecta. Microbiol.
2018

;

8

:

352

.

shanmugam
d.

,

ralph
SA

,

CARMONA
brokther
ROOS
DS
Agüero
F.
Caffrey
Cr

,

Selzer
PM
Integrarea și mineritul genomilor Helminth pentru a descoperi și a prioritiza obiectivele terapeutice noi

.

Helminții parazitare: ținte, ecrane, droguri și vaccinuri

.

2012

;

Wiley-Blackwell
43

59

.

mp
mp> mp

,

carmona
SJ

,

Crowther
Ralph
SA

,

Roos
DS

,

shanmugam
d.

,

van voorhis

Agüero
F.
TDR Obiective: o resursă de chemogenomică pentru bolile neglijate

.

nucleic. Acizi. Res.
2012

;

40

:

D1118

d1127

.

div> berenstein
AJ
Magariños
mp

,

chernomoretz
a.

,

Agüero
f.
O abordare a rețelei multistrat pentru ghidarea repoziționării medicamentelor în bolile neglijate

.

PLOS negl. Trop. Dis.
2016

;

10

:

E0004300

.

kim
kim
kim
k.

,

weiss
LM
Toxoplasma gondii: modelul apicomplexan

.

Int. J. Parazitol.
2004

;

34

:

423

432

.

Sidik
sm

,

huet
d.

,

ganesan
huynh
m.-h.

,

d div> ca
p.
Thiru
P.

,

Saeij
jpj

,

beruta
vb

,

niles
jc

și colab. .

Un ecran crizer genomic în Toxoplasma identifică genele esențiale apicomplexan

.

celulă

.

2016

;

166

:

1423

1435

.

b.
b.

,

bahl
a.

,

brestelli
j.

,

DIVMER
j.

,

Fischer
s.

,

gao
x.

,

heiges
M. / Div>,

iod> j.

,

Div>

mac> mackey
AJ

și colab. .

toxodb: o resursă de bază de date integrată toxoplasma gondii

.

acizi nucleici res.
2007

;

36

:

d553

d556

.

Warrenfeltz
S.

,

Bendernko
Ey

,

Crouch
div> k.

,

Div>
OS

,

Kissinger
JC

,

ROOS
shanmugasundram
a.

,

Silva-Franco
F.
kollmar
m
M
M

.

Baze de date genomice eucariote

.

2018

;

1757

:

diver

.

Sayers
Ew

,

Agarwala
r.

,

bolton

,

Canese
K.

,

Clark
K.

,

connor
r.

,

fiorini
n.

,

d div>

k.

,

Div>

t.

și colab. .

Resursele bazei de date ale Centrului Național de Informații privind biotehnologia

.

acizi nucleici res.
2019

;

47

:

d23

d28

.

d div> c.

rhertz-fowler

Peacock

CS
Introducerea Genenedb: o bază de date generică

.

Trends parazitol.
2002

;

18

:

465

467

.

bolt
bj

,

Rodgers
fh

,

shafie
m.

,

kersey
d div> Berriman
M.

,

Howe
KL
Folosind worbser parazit: o platformă integrată pentru explorarea datelor genomice Helminth

.

METODE MOL. Biol.
2018

;

1757

:

471

491

.

dychat
p.

,

hummel
l.

,

Rousseau
s.

,

mozzer
i.
Genolist: un mediu integrat pentru analiza comparativă a genomilor microbieni

.

acizi nucleici res.
2007

;

36

:

d469

d474

.

kapopoulou
a.

,

lew
JM

,

Cole
ST
MyCobrowser Portal: o resursă cuprinzătoare și adnotată manual pentru genomul micobacterian

.

tuberculoza

.

2011

;

91

:

8

13

.

Camacho
c.

,

Div> Coulouri
g.

,

Avagyan
v.
m.
n.

,

Papadopoulos
j.

,

bealer
k.

,

div> div> div> div> tl
BLAST +: Arhitectură și aplicații

.

BMC bioinformatică

.

2009

;

10

:

421

.

bancock
bishop

/ Div>

MJ
Emboss (Suita europeană Molecular Biologie Open)

.

Dicționar de bioinformatică și biologie computațională

.

2004

;

Chichester
John Wiley & sons, ltd
DOB0206

.

krog
a.

,

Larson
b.

,

von heijne
g.

,

div> sonnhammer
el
Previzionarea topologiei proteinei transmembrane cu un model ascuns Markov: Aplicație pentru a completa genomes

.

j. Moli. Biol.
2001

;

305

:

567

580

.

Div>

Almagro Armenteros

KD

,

Sønderby
Ck

,

Petersen
Tn

,

WINTHER
O.

,

Brunak
s.

,

von heijne
g.

,

Nielsen
H.0 Îmbunătățește predicțiile peptidelor semnal utilizând rețele neuronale profunde

.

Nat. Biotechnol.
2019

;

37

:

420

423

.

div>
a.

,

martelli
p.

,

Casadio
r.
predictor de ancorare GPI

.

BMC bioinformatică

.

2008

;

9

:

392

.

moriya
Moriya
y.

,

iToh
M.

,

Okuda
Div> Div> Div>

AC

div> kanehisa

m.
kaas: o adnotare automată a genomului și un server de reconstrucție a căii

.

acizi nucleici res.
2007

;

35

:

w182

w185

.

chen
chen
f.

,

mackey
AJ

,

Stoeckert
CJ

RO,

ROOS
DS
Orthomcl-dB: interogarea unei colecții cuprinzătoare multi-specii de grupuri Ortholog

.

acizi nucleici res.
2006

;

34

:

d363

d368

.

Fischer
s.

,

brunk
bp

,

chen

,

gao
x.

DIV> Harb

OS

,

iod>

shanmugam

shanmugam
Div> d.

,

CJ
CJ
CJ
CJ
CJ

Div> CJ

JR

Folosind Orthomcl pentru a atribui proteine la grupurile orthomcl-db sau la Proteomi de cluster în noile grupuri Ortholog

.

curr protoc bioinforma.
2011

;

DOI: 10.1002 / 0471250953.Bi0612S35

.

mitchell
ATWOW

div> tk

,

b babbitt
blum
m.

,

Bork
p.

,

pod
a.

,

maro
sd

,

Chang
H.-Y.

,

El-Gebali
S. div> mi

et al. .

Interpro în 2019: Îmbunătățirea acoperire, clasificare și acces la adnotările secvenței de proteine

.

acizi nucleici res.
2019

;

47

:

d351

d360

.

jones
p.

,

binns
d.

,

chang

,

fraser
m.

,

Li
W.

,

Mcanulla
C.

,

Div>

H.

,

Maslen
J.

,

Mitchell
A.

,

Nuka
g.

și colab. .

Interprosculan 5: Clasificarea funcției de proteine la scară largă a genomului

.

bioinforma. Oxf. Engl.
2014

;

30

:

1236

1240

.

Div> burley
sk

,

berman
Hm

,

bhikadiya
c.

,

bi
c.

,

Chen
L.

,

Costanzo
cr.
c.

,

DUGE
Dutta
s.

,

Feng
div> z. / div> și colab. .

Banca de date proteică: arhiva unică globală pentru datele de structură macromoleculare 3D

.

acizi nucleici res.
2019

;

47

:

d520

D528

.

Pieper

u.

,

webb
bm

,

dong
div> DIV> d.

,

Fan
H.

,

kim
sj

Div>,

DIV> YG

,

Weinkam
p.

,

div>

div>

m .

și colab. .

MODBASE, o bază de date a modelelor de structură proteică comparativă adnotată și a resurselor asociate

.

acizi nucleici res.
2014

;

42

:

d336

d346

.

zhu
l.

,

mp
s.

,

imwong
m.

,

jaidee
a.

,

Russell
b.

,

div> f.

,

zi
np

div>,

alb
nj

,

preiser
pr

bozdech

div> z.
Noi perspective în transcriptomeul Plasmodium Vivax folosind ARN-SEQ

.

sci. Rep.
2016

;

6

:

20498

.

smircich
p.

,

Eastman
g.

,

bispo
s.

,

DUHAGON
m

DIV> Guerra-Slompo

Ep

,

gat
b.

,

Goldenberg
S. / div> muntroe
dj

,

dallagiovanna
dallagiovanna
Div>

div> F.

și colab. .

Ribozomul Profiling dezvăluie controlul traducerilor ca mecanism cheie care generează expresia genei diferențiale în trypanosoma cruzi

.

Genomica BMC

.

2015

;

16

:

443

.

d divonder
e.

,

Rijpma
Sr

,

van Schaijk
bcl
hoejmakers
wam

,

Kensche
PR

,

GRESNIGT
Italiaander
A.

,

DIV>

MW

,

Div> r.

,

bousema
t.

și colab. .

Analizele transcriptomice și proteomice integrate ale lui P. Falciparum Gametocytes: o perspectivă moleculară asupra proceselor specifice sexului și represiunii translaționale

.

Acid nucleic Res.
2016

;

44

:

6087

6101

.

td
td
wilinski
d.

,

asfa
s.

,

keane
tm

,

Sarry
LR

,

böhme
u.

,

LEMIEUX
j.

,

Barrell
B.

,

DIV> A.

,

berriman
m.

și colab. .

Noile perspective în transcriptomul de sânge al Plasmodium falciparum utilizând ARN-SEQ

.

mol. Microbiol.
2010

;

76

:

12

24

.

Otto
TD

,

böhme
u.

,

jackson
AP
Div> m.

,

Franke-Fayard
b.

,

hoejmakers
religana
Aa
Aa

,

Robertson
l.

,

Sanders
m.

,

ogun
SA

și colab. .

O evaluare cuprinzătoare a genomului de paraziți de malarie de rozătoare și expresia genei

.

bmc biol.
2014

;

12

:

86

.

zanghì
g.
g.

,

Vambar
SS

,

bauticgarten
s.

,

ding
s.

Div> Guizetti

J.

,

Div>

div> Div>

mattei
d. >,

Div> l.
d div> / div> și colab. .

Un punct de vedere specific1 este exprimat în sporozotite de la P. falciparum și joacă un rol în infecția hepatocitelor

.

celulă rep.
2018

;

22

:

2951

2963

.

Fernandes
mc

,

dillon
lal

,

belew
la

,

bravo
hc
Mosser
DM

,

El-Sayed
Nm
Profilarea dual transcriptomă a macrofagelor umane infectate cu leishmania dezvăluie semnături distincte de reprogramare

.

MBIO

.

2016

;

7

:

E00027-16

.

Fritz
Hm

,

/ Div>

kr

,

chen

divin-johnson

b.

,

Rocke
Div> Conrad
Boothroyd
Div> Div> Div>

Analiza transcriptomică a dezvoltării toxoplasmelor dezvăluie multe funcții noi și structuri specifice sporozoitelor și oilor

.

PLOS One

.

2012

;

7

:

E29998

.

hon
C.-c.

div> weber

c.

,

sismeiro
o.

,

proux
c.

,

KOUTERO
m.

,

Dispozitiv
m.

,

Das
S.

,

Agrahari
m.

,

Div> M.-a.

,

jagla
b.

et al. .

Cuantificarea zgomotului stochastic de splicing și poliadenilare în Enamoeba Histolytica

.

acizi nucleici res.
2013

;

41

:

1936

1952

.

siegel
tn
tn

,

hekstra
dr

,

wang
x.

,

Dewell
s. Două etape de ciclu de viață ale trypanosomului Brucei și identificarea siturilor de splicing și poliadenilare

.

acizi nucleici res.
2010

;

38

:

4946

4957

.

Yeoh
Lm

,

Goodman
CD

,

mollard
v. DIV> McFadden
d div>,

Ralph
SA
Transcrieri comparative ale gametocitelor de sex feminin și masculin în Plasmodium Berghei și evoluția sexului în alveolate

.

Genomica BMC

.

2017

;

18

:

734

.

div> basso

/ Div>

wu

,

lippuner
c.

,

ramakrishnan
c.

,

Okoniewski
m.

,

walker
Ra
Smith
NC

,

aplazes
p.

Div> Asexual Extinderea merozoitelor de toxoplasme Gondii este diferită de tahiozoți și implică expresia de familiile genei care nu se suprapun pentru a atașa, invada și replica în enterocitele feline

.

Genomica BMC

.

2015

;

16

:

66

.

bushell
e.

,

gomes
AR

,

Sanderson
t.

,

ANAR

Div> Girling

g.

,

turma
c.

,

metcalf
t.

,

MODRZYNSKA
k.

,

div> Div> f.

,

martin
Re

și colab. .

Profilarea funcțională a unui genom de plasmă prezintă o abundență de gene esențiale

.

celulă

.

2017

;

170

:

260

272

.

DIV>

Mendez
d.

,

Gaulton
a.

,

bento
shambers
j.

,

De Veij
m.

,

div>

e.

,

Magariños

Div>,

Mosquera
JF

,

Mutowo
p.

,

Nowotka
m .

și colab. .

Chembl: spre depunerea directă a datelor biologice

.

acizi nucleici res.
2019

;

47

:

d930

d940

.

div> i.
i.

,

Pilar MANZANO
m.

,

cantizani
j.

,

kessler
A.

,

ALONSO-PADILLA
j.

,

div> div> e
E .

,

Colmenarejo
g.

,

d div> div> div> div> div>

i.

și colab. .

Seturi de compuși noi identificate din screening fenotipic de mare viteză împotriva a trei paraziți kinetoplastid: o resursă deschisă

.

sci. Rep.
2015

;

5

:

8771

.

SPANGENBERG
t.

,

Burrows
jn

,

kowalczyk
p.

,

mcdonald
s.

Div> Wells

TNC> Willis
P. / div>.

PLOS One

.

2013

;

8

:

E62906

.

dig>
n.
model de funcționalitate Se potrivesc ca un instrument eficient de căutare complementară / de reacție: o abordare open source

.

molecule

.

2010

;

15

:

5079

5092

.

div> cheng
t.

,

zhao
y.

,

Li
x.

,

Lin
f.

,

Xu
Y.

,

div>
x.

,

Li
y. / Div>,

wang
r.

,

div>
Div> Calculul coeficienților de partiții octanol-apă Ghidând un model de aditiv cu cunoștințe

.

j. Chem. Inf. Model.
2007

;

47

:

2140

2148

.

Div>

O’Boyle
nm

,

Banck
m.

,

James
Div>,

Morley
c.

,

Vandermeersch
T.

,

Hutchison
Gr
Deschis Babel: O cutie chimică deschisă

.

j. Cheminformatică

.

2011

;

3

:

33

.

Heller
sr

,

mcnaught
A.

,

Pletnev
i.

,

Stein
s.

div> tchekhovskoi

d.
inchi, Identificator chimic internațional IUPAC

.

j. Cheminformatică

.

2015

;

7

:

23

.

Lipinski
ca

,

Lombardo
F.

,

Dominy
bw

,

FEENEY
experimental și abordările computaționale pentru estimarea solubilității și permeabilității în setările de descoperire și dezvoltare a drogurilor

.

Adv. Delivul de droguri. Rev.
2001

;

46

:

3

26

.

congreve
m.

,

carr
r.

,

Murray
c.

,

jhoti
h.
o regulă de trei „pentru Discovery-ul de plumb fragmentat

.

Droguri Discov. Astăzi

.

2003

;

8

:

876

877

.

dalke
a.
chemfp – Formate și instrumente de amprente rapide și portabile

.

j. Cheminformatică

.

2011

;

3

:

p12

.

rogers
rogers
dj

,

Tanimoto
tt
un program de calculator pentru clasificarea plantelor

.

știință

.

1960

;

132

:

1115

1118

.

Div> wj
index pentru rating Teste de diagnosticare

.

cancer

.

1950

;

3

:

32

35

.

bostock
bostock
m.

,

ogievetsky
v.

,

HEER
J.
D3 DOCUMENTE DATE

.

IEEE trans. Vis. Comput. Grafic.
2011

;

17

:

2301

2309

.

Probst
d.

,

reymond
J.-l.
Smilesdrawer: parsare și desen Smiles-codificate structuri moleculare utilizând JavaScript client

.

j. Chem. Inf. Model.
2018

;

58

:

1

7

.

Acesta este un articol de acces deschis distribuit în condițiile licenței necomerciale Creative Commons Attribution (http://creativecommons.org/licenses/by-nc/4.0/), ceea ce permite reutilizarea, distribuția și reproducerea necomercială În orice mediu, cu condiția ca lucrările originale să fie citate corect. Pentru reutilizarea comercială, vă rugăm să contactați [email protected]

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *