Rezumat
Volumul de date biologice, chimice și funcționale depuse în domeniul public crește rapid, datorită secvențării generațiilor următoare și tehnologiilor de screening foarte automatizate. Aceste seturi de date reprezintă resurse neprețuite pentru descoperirea de droguri, în special pentru agenții patogeni de boală neglijați mai puțin studiați. Pentru a mobiliza aceste seturi de date, integrarea inteligentă și cea intensă a datelor este necesară pentru a ghida inferențele computaționale în diferite organisme. Resursele TDR vizează resursele genomice integrează datele genomice de la agenții patogeni umani și organismele model, împreună cu informații despre compușii bioactivi și activitățile lor adnotate. Acest raport evidențiază cele mai recente actualizări privind datele și funcționalitățile disponibile în țintele TDR 6. Pe baza modelelor de rețea chimiogenomică care oferă legături între inhibitori și ținte, baza de date încorporează acum prioritizări țintă bazate pe rețea și noi vizualizări ale subprafilor de rețea care prezintă chimic- și țintă – cartierelor similare, împreună cu legăturile de bioactivitate țintă asociate. Datele disponibile pot fi navigate și interogate printr-o nouă interfață de utilizator, care permit utilizatorilor să efectueze prioritizări ale țintelor de proteine și de inhibitori chimici. Ca atare, obiectivele TDR facilitează acum investigația privind reproșarea medicamentelor împotriva țintelor patogene, care pot contribui la identificarea țintelor candidate pentru compușii bioactivi cu obiective necunoscute anterior. Obiectivele TDR sunt disponibile la IV id = „C0600C5841” .
Boli tropicale neglijate (NTD) afectează în mod disproporționat ~ 1,5 miliarde de persoane în venituri mici și în curs de dezvoltare Țări, unde sunt o cauză principală pentru viața de viață pierdută de handicap și moarte prematură (1). Din punct de vedere istoric, lipsa de implicare din industria farmaceutică, în combinație cu investiții limitate în programele de cercetare în domeniul sănătății publice din țările afectate, a dus la o deficiență a medicamentelor disponibile pentru a controla în mod eficient majoritatea acestor boli (2). În plus, medicamentele care figurează în prezent pentru a trata aceste boli sunt adesea compromise în ceea ce privește costurile, dificultățile în administrare, eficacitatea, rezistența la medicament sau profilele de siguranță.
Discovery-ul de droguri este un proces consumator de timp și costisitor (3 , 4). Pentru NTDS, în special, programele de descoperire a medicamentelor trebuie să supraviețuiască suficient de mult prin lipsuri de finanțare pervazivă pentru ao face în studiile clinice ulterioare (5). În acest context, o abordare strategică pentru descoperirea de droguri NTD este repoziționarea medicamentelor (6), care poate contribui la reducerea costurilor prin facilitarea aprobărilor de reglementare la studiile timpurii pentru medicamente care au suferit deja cercetări clinice pentru alte boli și / sau indicații și au eșuat din alte motive decât siguranța (6). În plus, în cazul în care domeniul de reproșare a medicamentelor este extins pentru a include medicamente și compuși bioactivi din cercetarea organismelor neumane, acesta poate duce, de asemenea, la identificarea cel puțin noi instrumente chimice pentru probarea funcției țintelor și căilor în agenții patogeni umani. Astfel, prin utilizarea cantităților vastă de date disponibile din programele de cercetare bine finanțate privind bolile umane și organismele modelului, peisajul de descoperire a medicamentului pe NTDS primește un impuls pozitiv (7).
Strategiile computaționale devin din ce în ce mai mult esențială în descoperirea de droguri translațională, atât în mediul academic, cât și în industria farmaceutică. Integrarea inteligentă, intensivă a volumelor crescânde de date generate în toate fazele descoperirii de droguri, permițând deja provocărilor cheie ale procesului care urmează să fie abordat (8). De la introducerea sa, baza de date TDR vizează o resursă fiabilă pentru cercetătorii de boli neglijate pentru a accesa datele de chemogenomice pentru prioritizarea țintă a drogurilor și reproșarea medicamentelor asupra bolilor neglijate. Introdus în 2008 (9), această resursă de acces deschis a permis cercetătorilor să găsească obiective noi de proteine și inhibitori chimici și să le prioritizeze pentru a ajuta la dezvoltarea de droguri pentru agenții patogeni NTD. Obiectivele TDR utilizează seturile de date funcționale la nivel de genom general disponibile pentru a permite utilizatorilor să găsească și să prioritizeze țintele pe baza cunoștințelor lor despre biologia patogenului lor de interes și natura bolii (10,11). Acest lucru este implementat de o selecție țintă flexibilă (utilizând criterii de filtrare) și clasament (utilizând ponderarea specifică a criteriilor) (12,13).
Aici, descriem actualizările la seturile de date subiacente și Funcționalitatea în obiectivele TDR, acumulate de la publicarea sa anterioară în 2012 (13). Noul obiectiv TDR eliberat (v6.1, abreviat TDR6 în această lucrare) integrează informațiile genomice specifice patogene cu date funcționale (de exemplu,Expresie, relații bazate pe ortologie, esențiale) dintr-o selecție de organisme, împreună cu datele compușilor bioactivi (structura chimică, proprietatea și bioactivitatea / informațiile țintă); Toate acestea pot fi interogate și navigate prin aplicația web. Toate interogările pot fi salvate către un stash personal de către utilizatorii înregistrați și publicați prin aplicația web pentru a maximiza oportunitățile de colaborare. Listele prioritare de obiective pot fi exportate pentru o analiză suplimentară în afara liniei. Detaliile complete ale tuturor caracteristicilor noi pot fi găsite în notele de lansare (https://tdrtargets.org / versiuni). Acest raport prezintă o plimbare completă a aplicației web, a caracteristicilor sale noi și exemplelor de ilustrare a cazurilor de utilizare.
Prezentare generală și organizarea țintelor TDR
Ca și în versiunile anterioare ale obiectivelor TDR, TDR6 este, de asemenea, organizată în două secțiuni principale: ținte și compuși. Secțiunea Obiective a bazei de date conține date genomice pentru 20 de agenți patogeni umani și permite utilizatorilor să ruleze interogări și prioritizări ale țintelor de proteine pe baza unui număr de caracteristici și date relevante pentru descoperirea medicamentului (a se vedea tabelul 1). Secțiunea compușilor din baza de date conține informații despre > 2 milioane de compuși bioactivi și permite interogări pe baza proprietăților chimice ale compușilor și a bioactivităților lor adnotate (vezi Tabelul 2).
Interogările țintă disponibile în țintele TDR
interogare grup. | patogeni pentru care sunt disponibile date. | tipuri de date disponibile pentru interogare. |
---|---|---|
nume & Adnotări | Toate | Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică) |
Caracteristicile proteinelor | Toate | MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI). |
Informații structurale | Toate | Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase |
Expresia genei | PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII | Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului. |
Informații filogenetice | Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați. | |
esențial | C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei | Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model. |
Validarea țintă Date | Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum | Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii) |
drugglabil | Toate | Precedent pentru modularea chimică reușită a activității sau funcției țintă. Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal) |
tezay | Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE) | |
Referințe bibliografice | Toate obiectivele de filtrare pe baza publicațiilor disponibile |
iv id = „05d81063d3”
Interogările țintă disponibile în țintele TDR
Grupul de interogare. | patogeni pentru care sunt disponibile date. | tipuri de date disponibile pentru interogare. |
---|---|---|
nume & Adnotări | Toate | Identificatori de genă și adnotări funcționale (numere CE, termeni, Domenii PFAM, Mapping-uri de cale metabolică) |
Caracteristicile proteinelor | Toate | MW, Punct izoelectric, prezența peptidei semnalului prezise, segmente trans-membrane și ancore glicozilfostidilinozitol (GPI). |
Informații structurale | Toate | Disponibilitatea structurilor 3D în PDB; Disponibilitatea modelelor structurale în modBase |
Expresia genei | PLASMODIUM SPP; Leishmania spp.; Trypanosoma spp.; Mycobacterium tuberculoza; Echinococcus multilocularis; Entamoeba Histolytica; TOXOPLASMA GONDII | Datele de expresie a genei din etapele ciclului de viață patogen și / sau condițiile experimentale relevante pentru descoperirea medicamentului. |
Informații filogenetice | Toate țintele de filtrare utilizând „Prezentați / absenți” simplificați în alte criterii de specii, pe baza informațiilor despre grupul Ortholog . Include organisme model (umane) și alți patogeni asociați. | |
esențial | C. elegans (model pentru helmințuri); E. coli (model pentru bacterii); S. cerevisiae (model pentru agenții patogeni eucariote); Trypanosom brucei; Mycobacterium tuberculoza; Toxoplasma gondii; Plasmodiu Berghei | Inferența bazată pe ortologuri a esenței genelor în etapele ciclului de viață și / sau condițiile experimentale relevante pentru descoperirea de droguri. Integrate din setul de date a genei genomului selectat (de exemplu, Transpozit, CRISPR / CAS) și knockdown (de exemplu, ARNi) în agenții patogeni și organisme model. |
Validarea țintă Date | Schistosoma Mansoni; Leishmania major; Trypanosoma cruzi; Trypanosom brucei; Mycobacterium leprae; Mycobacterium tuberculoza; Plasmodiu falciparum | Date curate manual despre acreditările de validare țintă (genetice, chimice și / sau farmacologice, observate fenotipii) |
drugglabil | Toate | Precedent pentru modularea chimică reușită a activității sau funcției țintă.Rezumat într-un scor de droguri calculat din modelul de rețea (a se vedea textul principal) |
tezay | Toate testele biochimice disponibile pentru proteine Obiective (cartografiere bazate pe numerele CE) | |
Referințe bibliografice | Toate obiectivele de filtrare pe baza publicațiilor disponibile |
interogări compuse disponibile în țintele TDR
Grupul de interogare. | tipuri de date disponibile pentru interogare. |
---|---|
Căutări bazate pe text | |
nume & adnotări | nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI |
Proprietăți chimice | Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski) |
Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N) | Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm) |
Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane) | |
Compuși cu ținte | Găsiți Compușii care au teste de informare și mecanism țintă |
Căutări pe bază de structură | |
similitudine compus | Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice |
Structura compusă | Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment. |
iv id = „05d81063d3”
Bioactivitate
Interogările compuse disponibile în țintele TDR
tipuri de date disponibile pentru interogare. | |
---|---|
Căutări bazate pe text | |
nume & adnotări | nume compuse sau sinonime; Identificatori de baze de date (de exemplu, chembl, pubhem); Identificatori cheie INCHI și INCHI |
Proprietăți chimice | Greutatea moleculară; Logp Octanol / Coeficient de partiție de apă; Numărul de donatori și acceptori ai H, numărul de obligațiuni flexibile și numărul de potrivire RO5 (Lipinski) |
Căutare după compuși care conțin un număr specific ( de exemplu 3) de atomi definiți (de exemplu, CL, F, Br, N) | Căutarea textului pe descrierile de testare; Căutarea numerică a valorilor în analize (de exemplu, IC50 < 5 μm) |
Orphan> Căutați compuși care au rapoarte de bioactivitate în ansamblul întregului organism sau celule întregi, dar lipsesc informații țintă și mecanism (inhibitor / droguri orfane) | |
Compuși cu ținte | Găsiți Compușii care au teste de informare și mecanism țintă |
Căutări pe bază de structură | |
similitudine compus | Trageți / lipiți compusul sau structura 2D a fragmentului și căutarea compușilor similari. Căutarea se bazează pe potrivirea amprentelor chimice |
Structura compusă | Structura de tragere / lipire sau fragmentul 2D și căutarea compușilor din baza de date care conțin interogarea fragment. |
iv id = „05d81063d3”
Bioactivitate
Noi caracteristici în Obiectivele TDR 6
Am raportat recent un model de rețea integrat (14) în care toate seturile de date de scară genomice disponibile în țintele TDR (ținte proteice), informații chimice (compuși bioactivi) și relațiile lor (bioactivitatea compușilor din Analizele bazate pe țintă) au fost legate într-un grafic multistrat. În TDR6, acest model de rețea a fost actualizat prin integrarea noilor seturi de date (descrise mai jos). Acest model încorporează legături între obiective și compuși bioactivi derivați din manevrarea manuală a analizelor de bioactivitate publicate (adică legăturile directe între obiective și compușii chimici), precum și din relațiile calculate (legăturile țintă țintă și legăturile compuse) pe baza adnotărilor de proteine (Domeniile PFAM, Grupurile Ortholog) și similitudinea chimică. Un aspect cheie al acestor legături în modelul de rețea multistrat este că acestea permit explorarea rapidă și vizualizarea vecinătății în jurul țintelor selectate și / sau compușii bioactivi. Acest lucru permite utilizatorilor să exploreze compușii legați de ținte, să inspecteze vecinătatea asemănătorilor chimice în jurul compușilor bioactivi și să vizualizeze aceste date într-o manieră prietenoasă și cuprinzătoare (a se vedea figura 1).
Div>
Model de rețea schematică în vizualizările TDR6 și sub-grafic: Paginile compuse sau țintă afișează acum o vizualizare subgraph care conține obiecte în vecinătatea rețelei entității selectate. Aceste grafice sunt construite dintr-un grafic de rețea complex cu trei straturi. O schemă a acestui grafic este prezentată în partea de sus. Ambele țintă și compusul subgrame sunt aranjate întotdeauna după cum urmează: nodurile compuse (verde) sunt conectate la ținte (portocaliu = agenți patogeni; gri = ne-patogeni) prin margini de bioactivitate. Aceste legături prezintă rezultate pozitive (verde), neutre (gri) sau negative (roșu). În cele din urmă, vizează harta unui set de afilități funcționale (adnotări, noduri albastre). În exemplu, graficul prezintă un set de inhibitori cunoscuți pentru o aciltransferază umană (15). Aceste bioactivități (toate pozitive) sunt trase ca legături verzi între compușii (noduri verzi) și țintă (noduri gri pentru agenții patogeni, noduri portocalii pentru agenții patogeni). Graficul evidențiază oportunitățile de reprogramare a helmintului aciltransferazelor (linii punctate, adăugate manual pentru această figură), pe baza adnotărilor partajate cu ținta umană cunoscută. Nodul roșu din stratul de medicament indică compusul selectat. Dimensiunile nodurilor sunt determinate de numărul de conexiuni din rețea (grad), în timp ce lățimile de legătură de bioactivitate (marginile) sunt legate de numărul cumulat de dovezi experimentale pentru o anumită pereche de țintă medicament (numărul de teste).
Figura 1.
Model de rețea schematică în vizualizările TDR6 și sub-grafic: Paginile compuse sau țintă afișează acum o vizualizare subgraph care conține obiecte în rețeaua de vecinătate a entității selectate. Aceste grafice sunt construite dintr-un grafic de rețea complex cu trei straturi. O schemă a acestui grafic este prezentată în partea de sus. Ambele țintă și compusul subgrame sunt aranjate întotdeauna după cum urmează: nodurile compuse (verde) sunt conectate la ținte (portocaliu = agenți patogeni; gri = ne-patogeni) prin margini de bioactivitate. Aceste legături prezintă rezultate pozitive (verde), neutre (gri) sau negative (roșu). În cele din urmă, vizează harta unui set de afilități funcționale (adnotări, noduri albastre). În exemplu, graficul prezintă un set de inhibitori cunoscuți pentru o aciltransferază umană (15). Aceste bioactivități (toate pozitive) sunt trase ca legături verzi între compușii (noduri verzi) și țintă (noduri gri pentru agenții patogeni, noduri portocalii pentru agenții patogeni). Graficul evidențiază oportunitățile de reprogramare a helmintului aciltransferazelor (linii punctate, adăugate manual pentru această figură), pe baza adnotărilor partajate cu ținta umană cunoscută. Nodul roșu din stratul de medicament indică compusul selectat. Dimensiunile nodurilor sunt determinate de numărul de conexiuni din rețea (grad), în timp ce lățimea legăturii de bioactivitate (marginile) sunt legate de numărul cumulat de dovezi experimentale pentru o anumită pereche de țintă medicament (număr de teste).
Cu aceste actualizări, TDR6 oferă utilizatorilor următoarele funcționalități: (i) prioritizări țintă integral bazate pe rețea, (ii) explorarea reproșării medicamentelor; și iii) explorarea țintelor candidate pentru compușii orfani. Aceste cazuri de utilizare sunt posibile printr-o serie de caracteristici bazate pe rețea precompute, cum ar fi un scor nou de droguri de rețea (ND). Prin asocierea unei metrici cantitative la țintele bazate pe îmbogățirea compușilor bioactivi pe nodurile de rețea strâns legate, acest scor facilitează clasificarea țintelor în grupuri de droguri (DGS), care sunt disponibile utilizatorilor în interogările bazei de date.
Modelul de rețea este, de asemenea, baza pentru prioritizările prioritare conduse de rețea (NDP) care pot fi interogate de utilizatori și sunt, de asemenea, utilizate pe plan intern de către TDR6 pentru a selecta țintele și compușii conectați pentru afișarea în vizualizările rețelei nou dezvoltate (a se vedea mai jos). La pornind de la un compus de interes, TDR6 utilizează prioritizările precompuse ale țintelor candidate pentru a ajuta utilizatorii din navigarea spațiului țintă din jurul compusului (și invers atunci când pornește de la o țintă de interes). Prin furnizarea acestor metrici de îmbogățire precompusă și clasamente, baza de date facilitează acum descoperirea de noi asociații țintă de droguri. În afară de aceste NDP-uri noi, utilizatorii pot prioritiza țintele care utilizează aceeași funcție ca și în versiunile anterioare ale TDR.
Această versiune include și mai multe actualizări de date, și anume includerea a 22 de genomi noi (20 noi agenți patogeni și 2 noi Modelul organismelor) și actualizări extinse la datele chimice și bioactivității printre altele. Interfața cu utilizatorul îmbunătățită și versatilă, împreună cu actualizările de date reînnoiască angajarea obiectivelor TDR de a furniza un instrument integrat și puternic pentru explorarea datelor genomice și chimice în contextul bolilor tropicale neglijate.
Utilizarea țintelor TDR 6
Prioritizări țintă cu genomul întreg
Modelul de rețea (14) este baza pentru noul scor de droguri, care este o metrică derivată în rețea care este legată de îmbogățirea în compușii bioactivi pentru a țintă țintă (NDS, „Scorul de droguri de rețea”). NDS sunt disponibile pentru toate organismele de rangul 1, care pot fi interogate și utilizate pentru a intra în greutăți pentru a filtra (în sau out) țintă în conductele de prioritizare personalizate definite de utilizator. După cum sa explicat în continuare în detaliile integrării în rețea, pentru fiecare organism, obiectivele au fost clasificate în cinci grupuri de droguri (DG), de la cel mai mic (DG1) la cele mai înalte punctare (DG5), în funcție de performanța lor în prioritizările rețelei.
Ca și în versiunile anterioare ale țintelor TDR, utilizatorii pot combina diferite seturi de date pur și simplu prin efectuarea interogărilor individuale pe diferite tipuri de date și combinarea acestora la pagina Istoric (9,10,12,13). Acest lucru este util atunci când, de exemplu, utilizatorii ar dori să includă tipuri de date suplimentare pentru prioritizările bazate pe droguri, cum ar fi cele care se bazează pe expresia genei în etapele ciclului de viață relevante sau cele care furnizează informații privind fitness / letalitate a țintelor (esențiale).
Ca exemplu, prezentăm aici un exemplu de prioritizare utilizând Toxoplasma Gondii ca agent patogen de interes. T. Gondii este un parazit apicomplexan folosit adesea ca model pentru a investiga biologia care stă la baza mai multor boli umane și animale (15). Strategia de căutare este rezumată în figura 2. Interogarea a fost inițiată prin căutarea tuturor obiectivelor T. Gondii și prin filtrarea acestor ținte cu omologi la om (pentru a selecta numai obiective specifice parazitului). Apoi, am selectat genele esențiale candidate bazate pe profile de fitness în timpul infecțiilor fibroblastelor umane (16); și, de asemenea, genele selectate exprimate în tahiozoti (etapa replicativă a T. gondii), interogând pentru gene în top 80-100 percentil de abundența transcripției Rnaseq (17). Aceste selecții au fost combinate cu clasamentele de droguri de rețea. Pentru aceasta am considerat gene în grupurile de droguri 3, 4 sau 5 (DG ≥ 3) (a se vedea figura 2). Figura prezintă toate interogările și rezultatele lor, așa cum se vede în pagina Istorie și operațiunile efectuate la combinarea interogărilor (Union, Intersecție). Lista finală a obiectivelor clasate pe baza acestor criterii a fost făcută publică și este disponibilă în obiectivele TDR din listele postate.
țintă Strategia de prioritizare pentru T. Gondii. Imaginea compozită arată (a) termenii de interogare utilizați pentru a găsi țintele T. Gondii care nu au homeologi la om, care sunt foarte exprimați în stadiul tahifizoriu virulent al parazitului în timpul infecției cu celule umane, care sunt probabil esențiale și sunt probabil drogate la scorul de droguri de rețea. (B) Rezumatul interogărilor efectuate la pagina „Obiective”, arătând modul în care aceste interogări apar în pagina „Istoric”, unde pot fi revizuite și transformate. Butoanele de gestionare a interogării in-line permit acțiunilor selectate (eliminați, redenumiți, exportați) pe seturi de rezultate.(C) Combinațiile de interogare permit utilizatorilor să execute Uniuni, să intersecteze sau să scadă acțiunile cu privire la interogările cu și unul de celălalt. Sunt prezentate exemple de acțiuni de intersecție și de intersecție. (D) interogările pot fi salvate la un stash privat (seturile de interogare) de unde pot fi trimise înapoi la spațiul de lucru (pentru a efectua operațiuni suplimentare de interogare) sau partajate în mod public cu alte vizite TDR (seturile de interogare țintă publicate).
Prioritizare țintă Strategia pentru T. Gondii. Imaginea compozită arată (a) termenii de interogare utilizați pentru a găsi țintele T. Gondii care nu au homeologi la om, care sunt foarte exprimați în stadiul tahifizoriu virulent al parazitului în timpul infecției cu celule umane, care sunt probabil esențiale și sunt probabil drogate la scorul de droguri de rețea. (B) Rezumatul interogărilor efectuate la pagina „Obiective”, arătând modul în care aceste interogări apar în pagina „Istoric”, unde pot fi revizuite și transformate. Butoanele de gestionare a interogării in-line permit acțiunilor selectate (eliminați, redenumiți, exportați) pe seturi de rezultate. (C) Combinațiile de interogare permit utilizatorilor să execute Uniuni, să intersecteze sau să scadă acțiunile cu privire la interogările cu și unul de celălalt. Sunt prezentate exemple de acțiuni de intersecție și de intersecție. (D) interogările pot fi salvate la un stash privat (seturile de interogare) de unde pot fi trimise înapoi la spațiul de lucru (pentru a efectua operațiuni suplimentare de interogare) sau partajate în mod public cu alte vizite TDR (seturile de interogare țintă publicate).
Informațiile privind țintele cu medicamente cunoscute provin din curația literaturii, în timp ce asociațiile prevăzute (indirecte) ale țintelor cu inhibitori / medicamente sunt obținute prin calcule de similitudine sau ortologie a secvenței (la țintele de droguri cunoscute) sau prin inferențe sprijinite în rețea (14). Toate aceste metode sunt implementate în TDR6. Prin urmare, când utilizatorii filtrează o genă setată pe baza drogurilor, ele limitează selecția la obiective foarte clasate, care ar trebui să ofere o bogată sursă de oportunități de reproșare a medicamentului.
Pentru a prezenta utilitatea TDR6 în această zonă pe care o arătăm Cum să căutați medicamente candidate pentru reproșarea pentru Echinococcus Multilocularis (agentul cauzal al echinococozei alveolare). Acest lucru este arătat în figura 3. Procesul este similar cu cel descris anterior pentru T. Gondii, dar în această strategie de interogare nu am exclus omologi umani și am folosit seturile de date C. Elegans RNAI lethality ca proxy pentru esențialitatea nematodelor. Ca rezultat, am obținut o prioritizare cu totul genom pentru E. Multilocularis. Apoi, aplicând un filtru bazat pe droguri la această interogare, am redus selecția genei într-o mână de gene. Utilizatorul poate inspecta manual obiectivele selectate pentru a afla care medicamente au fost listate prin asociații indirecte. Paginile țintă vor afișa toți compușii asociați în secțiunea de droguri, clasificați în funcție de sursa deducției. Pentru inferențele bazate pe rețea, scorul pentru fiecare compus propus va apărea atât ca o listă, cât și ca un complot de rang, pentru a identifica rapid candidații promițători. Alternativ, pentru a minimiza inspecția manuală, lista genelor (adică interogarea în sine) poate fi ușor convertită într-o listă de medicamente asociate făcând clic pe butoanele „Convertiți aceste interogare” din partea de sus a paginilor rezultatelor interogării. Această funcție oferă o modalitate rapidă de a începe să creeze o bibliotecă de screening pentru un set de obiective. Transformările de interogare se pot baza pe curate (medicamente cunoscute pentru o setare a țintelor), prezise (asociații calculate la droguri) sau ambele. În toate cele trei abordări, inhibitorii / medicamentele asociate cu țintele cunoscute sunt asociate cu genele din listă. Figura 3 rezumă strategia de prioritizare, conversia interogării listei de gene la compuși și un exemplu de vizualizare sub-grafic disponibilă din pagina compusă a unei lovituri de reproșare. În prezent, aceste conversii sunt rulate în fundal și rezultatele apar în secțiunea Istoric a site-ului când este efectuată (utilizatorii sunt, de asemenea, alertați prin e-mail).
Oportunități de reproșare a medicamentelor pentru E. Multilocularis folosind transformări de interogare. O schemă de prioritizare țintă pentru Echinococcus Multilocularis bazându-se pe inferența bazată pe ortologie și droguri previzionate (DG ≥ 3). (A) interogări combinate; (B) lista inițială a obiectivelor prioritare. (C) Orice listă țintă poate fi „transformată” într-o listă a medicamentelor asociate, utilizând oricare dintre metodele de legare a compusului disponibile (a se vedea textul principal). (D) Lista rezultată a compușilor bioactivi. (E) Exemplu de vizualizare a sub-graficului de rețea dintr-un compus selectat, care prezintă legături de bioactivitate activă și inactivă. Compușii (noduri verzi) sunt conectate la țintele patogene (portocaliu) în funcție de înregistrările de bioactivitate (verde = activ; roșu = inactiv, vezi textul principal pentru pragurile de activitate).Obiectivele, la rândul lor, sunt conectate (legăturile gri) la afilieri funcționale (noduri albastre). Sub-graficul oferă sugestii vizuale privind modul în care obiectivul inițial E. Multilocularis este conectat cu compusul selectat din rețea.
oportunități de reproșare a drogurilor pentru E. Multilocularis utilizând transformări de interogare. O schemă de prioritizare țintă pentru Echinococcus Multilocularis bazându-se pe inferența bazată pe ortologie și droguri previzionate (DG ≥ 3). (A) interogări combinate; (B) lista inițială a obiectivelor prioritare. (C) Orice listă țintă poate fi „transformată” într-o listă a medicamentelor asociate, utilizând oricare dintre metodele de legare a compusului disponibile (a se vedea textul principal). (D) Lista rezultată a compușilor bioactivi. (E) Exemplu de vizualizare a sub-graficului de rețea dintr-un compus selectat, care prezintă legături de bioactivitate activă și inactivă. Compușii (noduri verzi) sunt conectate la țintele patogene (portocaliu) în funcție de înregistrările de bioactivitate (verde = activ; roșu = inactiv, vezi textul principal pentru pragurile de activitate). Obiectivele, la rândul lor, sunt conectate (legăturile gri) la afilieri funcționale (noduri albastre). Sub-graficul oferă sugestii vizuale privind modul în care obiectivul inițial de E. Multilocularis este conectat cu compusul selectat din rețea.
Explorarea compușilor orfani
Activitățile compușilor extrași din literatura de specialitate apar sub formă de teste bazate pe țintă (legătura directă la țintă) sau sub formă de teste bazate pe celule sau întregi. În absența altor informații, aceste clase de teste nu oferă indicii la ținta sau mecanismul de acțiune al compușilor. În timpul procesului de actualizări de date chimice în TDR6, am identificat compușii cu efecte fenotipice raportate asupra testelor integrate sau pe bază de celule, pe baza clasificărilor lor Chembl. Aceste informații au fost utilizate pentru a identifica compușii „orfani” care sunt activi împotriva unui agent patogen particular în proiecții primare sau secundare pe bază de celule, dar pentru care nu există o analiză bazată pe țintă.
Compușii orfani în TDR6 pot fi Căutat pentru orice specie cu date de screening fenotipic disponibile, în pagina de căutare a compușilor. Acest lucru permite o modalitate rapidă de utilizare a datelor din teste de mare viteză, permițând utilizatorilor să își înceapă prioritate de la compuși cu activitate cunoscută împotriva unui patogen de interes.
Modelul de rețea integrat în TDR6 este, de asemenea, util pentru identificarea candidatului ținte pentru compușii orfani. Așa cum este descris în publicația inițială (14), vecinătatea similarului chimic calculat în jurul unui compus orfan selectat poate oferi legături indirecte la una sau mai multe ținte. Folosind această strategie am efectuat prioritizări țintă pentru toți compușii orfani din TDR6. Aceste prioritizări compuse de rețea precomputed sunt disponibile pentru toate organismele pentru care sunt disponibile datele de screening fenotipic. Rezumatele globale care prezintă toți compușii orfani pentru aceste organisme sunt legate de pagina „Rezumatul datelor” (a se vedea https://tdrtargets.org / datasummary și faceți clic pe speciile de interes). Un exemplu de prioritizare bazată pe compusul orfan pentru T. Cruzi este prezentată în figura 4. întrucât prioriocațiile pornite de la un singur compus sunt disponibile în fiecare pagină compusă.
div>
Explorarea țintelor candidate pentru compușii orfani trypanosoma cruzi. Plot rezumă prioritizarea țintă acționată în rețea pentru compușii orfani activi împotriva T. Cruzi. Toate secvențele de codificare a proteinelor din genomul T. Cruzi (țintele candidate) sunt aranjate pe axa X. Punctele de date din parcelă corespund asociațiilor de medicament țintă marcate de algoritm (scorul reprezentat pe axa Y). De exemplu, am evidențiat două ținte presupuse pentru două medicamente diferite (așa cum este afișat în pagina Rezumatul datelor T. Cruzi). Părți similare sunt disponibile online pentru organismele de nivel 1 în TDR6 (legat de pagina Rezumatul datelor).
Explorarea țintelor candidate pentru compușii orfani trypanosoma cruzi. Plot rezumă prioritizarea țintă acționată în rețea pentru compușii orfani activi împotriva T. Cruzi. Toate secvențele de codificare a proteinelor din genomul T. Cruzi (țintele candidate) sunt aranjate pe axa X. Punctele de date din parcelă corespund asociațiilor de medicament țintă marcate de algoritm (scorul reprezentat pe axa Y). De exemplu, am evidențiat două ținte presupuse pentru două medicamente diferite (așa cum este afișat în pagina Rezumatul datelor T. Cruzi). Părți similare sunt disponibile online pentru organismele de nivel 1 din TDR6 (conectate din pagina Rezumatul datelor).
Funcționalitate și actualizări de date
Noi date genomice în TZR vizează V6.1
De la publicarea anterioară a bazei de date TDR (13) au fost adăugate mai multe genomi patogeni. O listă detaliată este furnizată în tabelul 3, precum și online la pagina Rezumatul datelor TDR6 (https://tdrtargets.org / datasummary).
Rezumatul disponibilității datelor pentru agenții patogeni de top. Rezumatul datelor țintă disponibile pentru organismele de rangul 1 în țintele TDR. CD-uri: secvențe de codare; PFAM: Numărul de proteine cu Domeniul (domeniile) de PFAM cartografiat; Go: Numărul de proteine cu termeni de ontologie a genei mapate; CE: Numărul de proteine cu numere de comisioane enzimatice mapate (CE); Căi: numărul de proteine mapate la Hărți Kegg Pathway; Orthologii: Numărul de secvențe mapate la grupurile Orthomcl Ortholog. O masă mai completă a sumarului de date este disponibilă online la https://tdrtargets.org
1B01F6074E „>
Du-te.
7692
CD-uri. | pfam. | CE. | căi. | orologii. | ||
---|---|---|---|---|---|---|
Plasmodiu falciparum | 5349 | 3322 | 355 | 1083 | ||
Plasmodium Vivax | 5344 | 3631 | 641 | 806 | 846 | 5207 |
TOXOPLASMA GONDII | 7946 | 3795 | 7725 | 772 | 967 | 6764 |
chlamydia trachomatis | 887 | 704 | 598 | 369 | 645 | |
Mycobacterium Leprae | 1630 | 929 | 628 | 611 | 1473 | |
Mycobacterium Tuberculosis | 4004 | 2934 | 1174 | 1174 | 1145 | 3287 |
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 3459 | |
Trep Onema Palidum | 1036 | 634 | 221 | 335 | 335 | 733 |
wolbachia endosymbiont de B.malayi | 805 | 628 | 577 | 308 | 382 | 688 |
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | |
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | ||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | |
Loa Loa (ochi vierme)
16292 |
8071 | 6774 | 1539
2207 10484 |
|||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | |
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
||
Leishmania majore | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 |
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | |
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | |
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 |
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Sumar Disponibilitatea datelor pentru agenții patogeni top tier. Rezumatul datelor vizate disponibile Tier 1 organisme în Ținte TDR. CD-uri: secvențe de codificare a mărfurilor; Pfam: număr de proteine cu Mapate Pfam Domain (e); GO: număr de proteine cu termeni Gene Ontologie mapate; CE: numărul de proteine cu numere mapate Enzyme (CE); Pathways: număr de proteine mapat hărți de cale KEGG; Ortologi: număr de secvențe mapate la grupări OrthoMCL ortolog. Un tabel mai complet Sumar de date sunt disponibile online la https://tdrtargets.org / datasummary
Specii. | CD-uri. | Pfam. | GO. | CE. | Pathways. | ortologi. | ||||
---|---|---|---|---|---|---|---|---|---|---|
Plasmodium falciparum | 5349 | 3322 | 3551 | 750 | 1083 | 5166 | ||||
5344 | 3264 | 2631 | 641 | 806 | 5207 | |||||
Toxoplasma gondii | 7946 | 4025 | 3795 | 772 | 967 | 6764 | ||||
Chlamydia trachomatis | 887 | 704 | 598 | 269 | 357 | 645 | ||||
Mycobacterium leprae
1630 |
1236 | 929 | 628 | 611 | 1473 | |||||
Mycobacterium tuberculosis | 4004 | 2934 | 2001 | 1174 | 1145 | 3287 | ||||
Mycobacterium ulcerans | 4232 | 3602 | 2578 | 873 | 1002 | 3459 | ||||
TREP onema pallidum | 1036 | 791 | 634 | 221 | 335 | 733 | ||||
Wolbachia endosymbiont B.Malayi | 588 | Brugia Malayi
11316 |
7042 | 1278 | 1278 | 1787 | 6481 | 854 | 1965 | 7109 | 7109 |
Echinococcus multilocularis
10474 |
758 | |||||||||
loa loa (vierme ocular) | 1539 071 071 | 15371 | 1537 071 | 1559 071 | 2207 | 2378 | 2178 | 2478 | 246 | 563 | 7818 | 7384 | 1218 | leishmania major | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | 5480 |
1019 | 1264 | 9259 |
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
8211 | 8211 | 4920 | 4087 | 645 | 7692 | 2263 | 2735 | 363 3635 |
2235 |
5600
35600 35474 |
18435 | CD-uri. | pfam. | du-te. | CE. | pathes. | ortoogs. v id = „29971A56991” | 3322 551 | 7166 | Plasmox Vivax | 641 | 606 06 06 06 06 06 06 5207 |
TOXOPLASMA GONDII | 7946 | 4025 | 3795 | 772 | 967 | 269 | 269 | 1630 | 1236 | MycobAacterium ttuzis Page | 1174 | 1174 | 1174 | 873 | 3459 |
Trep. 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 33 | Wolbia Indusiabiant de bmalayi | 805 | 628 | 577 | 308 | 382 | 688 | |||
Brugia malayi
11316 |
7042 | 6368 | 1278 | 1787 | 8424 | |||||
Echinococcus granulosus
10249 |
6481 | 854 | 1965 | 7109 | ||||||
Echinococcus multilocularis
10474 |
6817 | 5768 | 878 | 2079 | 7539 | |||||
Loa Loa (ochi vierme)
16292 |
8071 | 6774 | 1539
2207 10484 |
|||||||
Onchocerca volvulus
12224 |
3248 | 2178 | 246 | 563 | 4054 | |||||
Schistosoma mansoni
12692 |
7818 | 7384 | 1218 | 1649
10386 |
||||||
Leishmania majore | 8280 | 4641 | 4415 | 1067 | 1162 | 8250 | ||||
Trypanosoma brucei
10270 |
5665 | 5482 | 1019 | 1264 | 9259 | |||||
Trypanosoma cruzi
18639 |
9908 | 8572 | 1495 | 1735
18140 |
||||||
8211 | 4920 | 4087 | 645 | 1094 | 7692 | |||||
Giardia lamblia | 9665 | 2726 | 2263 | 326 | 514 | 5977 | ||||
Trichomonas vaginalis
95600 35474 18435 |
843 | 1366
87303 |
Având în vedere diversitatea organismelor integrată în Targets TDR și, în consecință, varietatea surselor de date necesare pentru a acoperi toate genomuri; efort substanțial a fost pus în standardizarea datelor parsare și regăsire a informațiilor din genomul Aceste organisme. Cele mai multe dintre genomuri complet EupathDB Au fost obținute de la (18), GenBank (19), GeneDB (20), Wormbase Parazit (21), GenoList (22) sau Mycobrowser (23). O descriere completă din sursele genomului și date în tabelul precedent suplimentar S1. Pentru a actualiza datele pentru organismele prezente în versiunea anterioară a Ținte TDR gene de codificare de proteine de la versiunea curentă a genomurilor au fost fie mapate gene existente în Targets TDR, sau altfel introduse noile înregistrări. Maparea Algoritmul folosește o combinație de condiții pentru a urmări Gene identificatorii peste presă și de a menține identitatea genelor: checksum secventa de potrivire (folosind valori de 128 biți Hash generate de MD5 Algorithm), nume de gene sau de identificare și sablare (24) IF sau meciuri perfecte sunt găsite. După actualizarea înregistrărilor, conducta calculează proprietățile fizico-chimice utilizând Pepstats (25), scanările domenii transmembranare cu TMHMM (26), peptide semnal cu SignalP (27), și glycosylphosphatidylinositol puncte de ancorare, folosind PredGPI (28). Algoritmul respinge toate secvențele necodificatoare, cele mai bine orice Pseudogenes, pentru a evita inducerea în eroare adnotări și minimizarea presupuneri false în timpul fluxurilor de lucru de prioritizare. Cele mai multe dintre TDR6, menționate mai sus au toate sarcinile pentru a genomului integrare și actualizare au fost Înfășurat în fluxul de lucru automatizat pentru a facilita mai rapid actualizări în versiunile viitoare. O schemă a actualizării și conductelor Algoritmul prezentat în figura anterioară suplimentar S1. Pipeline automatizează, de asemenea, modul de calcul al adnotări folosind strategii individuale ad-hoc pentru diferite adnotări, bazându-se pe serviciile web și API-uri (apărut în Kaas (29) serviciu pentru proteine maparea metabolice Caile și la numărul de clasificare CE, a enzimelor, sau OrthoMCL baze de date și instrument (30,31) pentru grupurile de cartografiere ortolog la proteinele. Conducta se bazează și pe calcul contra bazelor de date au apărut la nivel local instalate majoritatea InterPro (32), folosind InterProScan (33) pentru a identifica domenii de proteine (Pfam) si harta termeni pentru vocabulare controlate și clasificări (termeni GO). resurse suplimentare au apărut cele mai 3D structuri și modele structurale au fost recuperate de la Banca de date proteine (34) folosind servicii web și descărcate de pe site-ul Modbase FTP (35), respectiv.
de asemenea, numărul de seturi de date cheie funcționale au fost integrate în această versiune, incluzând: (i) seturi de date transcriptomic care prezintă dovada expresiei genelor în stadii ale ciclului de viață sau condiții experimentale care sunt relevant pentru droguri Discovery (36-47) și (ii) seturi de date neesențial derivate din doi agenți patogeni Apicomplexan (P. berghei și T. gondii) (16,48), care furnizează informații Strategies vitale ASSIST prioritizării.
Actualizări de date chimice
Pentru compușii bioactivi de asemenea, fluxurile de lucru de actualizare a datelor au fost automatizate pentru această versiune.Majoritatea compușilor bioactivi au fost recuperați din eliberarea de 24 de la Chembl (49), care conține unele seturi de date suplimentare, cum ar fi cele ale cutiilor chimice specifice patogene – cutii de kinetoplastid GSK (50), cutie patogenă MMV (51). Procesul de integrare începe de la descrierile moleculelor (2D) în format SDF, din care am calculat toate amprentele compuse necesare (necesare pentru căutările de similitudine compus / substructură) utilizând Checkmol (52). Conducta calculează, de asemenea, proprietăți chimice suplimentare, cum ar fi coeficientul de partiție Octanol / Apa de apă și alți descriptori structurali, utilizând XLOGP3 (53) și instrumentele deschise Babel Obprop și ObroTamer (54). Alte date relevante au fost obținute sau calculate direct din structura compusului, cum ar fi identificatorii INCHI și inchikey (55) utilizați pentru urmărirea compușilor; și alte reguli standard de degetul mare utilizat în chimia medicală și descoperirea medicamentelor, cum ar fi regula Lipinski de cinci (56) și regula conexă de trei (57).
După integrarea în țintele TDR, toți compușii au fost supuși La un calcul al comparației de similitudine de similitudine, utilizând chemfp (58) care produce măsurători de asemănare la perechi pe baza indicelui tanimoto / distanța (59). De asemenea, am calculat o hartă globală (toți versus toate) a relațiilor de substructură între compușii din baza de date (X este o substructură de Y; Y este o suprastructură de x). Știind că problema găsirii unor subgrafuri comune maxime între molecule este computațional greu, am aplicat o abordare euristică pentru a găsi substructuri. Algoritmul obține mai întâi un subset de posibile molecule candidate, utilizând amprentele digitale calculate anterior. Candidații trebuie să aibă amprente care se potrivesc cu molecula subiectului. Odată ce se obține o listă de candidați, determinarea substructurii atomi de atomi de atomi se face folosind Matchmol (52). Datele disponibile pentru compuși și interogările care pot fi executate pe fiecare tip de date sunt rezumate în tabelul 2. Greutatea moleculară (MW) și suprafața polară (PSA) Distribuția pentru toți compușii din baza de date este prezentată în figura suplimentară S2.
Curatarea și integrarea datelor de bioactivitate
Ca și în cazul compușilor chimici, majoritatea bioactivităților integrate în țintele TDR provin direct din surse de date în amonte (de exemplu, Chembl). La integrarea datelor de bioactivitate, am păstrat atât adnotarea testului (de exemplu, testul de reducere a motilității in vitro împotriva microfilarielor Brugia Malayi la 10 pM ‘), cât și valoarea numerică și unitățile asociate activităților compuse (de exemplu, inhibiția ‘80% ” μm IC50 ‘, ’10 nm mic’), care sunt toate câmpurile care pot fi căutate. În plus, și pentru a facilita interogările utilizatorilor, bioactivitățile raportate au fost utilizate pentru a grupa compușii testați în clase „active” sau „inactive”. Cu toate acestea, pentru a minimiza efectul utilizării limitelor dure în jurul pragurilor arbitrare și creșterea separării dintre clasificările active / inactive, am definit, de asemenea, o zonă gri nedeterminată. Prin urmare, compușii care marchează chiar sub un prag arbitrar nu sunt considerați inactivi pentru scopuri de interogare și vizualizare.
Nu toate tipurile de activități au fost supuse clasificării. În ciuda eforturilor de standardizare a acestor date de activitate, interpretarea activităților compușilor la această scală este dificilă, deoarece depind adesea de tipul de analiză particular, de unitățile raportate și de condițiile particulare în care au fost efectuate fiecare analiză. Cu toate acestea, un set semnificativ de tipuri de testare ar putea fi clasificat automat în categorii active / nedeterminate / inactive bazate pe praguri de activitate. Pentru aceasta, rapoartele de testare cu > 100 000 (a se vedea figura S3 suplimentară pentru o activitate pe tipul de testare / per compus de distribuție) au fost luate în considerare pentru auditarea activității, deși numai teste pe bază de concentrație (cum ar fi IC50, ki sau potență) au fost găsite suficient de robuste pentru o astfel de determinare, deoarece testele procentuale bazate (cum ar fi% activitate,% activitate reziduală sau inhibarea $) au fost ambigue în rapoartele de bioactivitate. Pragurile utilizate pentru clasificarea activităților pentru fiecare tip de testare pot fi găsite în tabelul 4, iar distribuția compușilor din aceste clase de activități este rezumată în Figura 5.
Tipuri de testare și praguri de activitate utilizate pentru determinarea etichetei de activitate: Numai testele bazate pe concentrații au fost utilizate pentru a determina etichetele de activitate. Activitățile care raportează mai puțin decât valoarea maximă admisă pentru pozitive au fost considerate interacțiuni active (+), în timp ce cele mai mari decât cele minime admise pentru negative „au fost considerate inactive (-). Orice activitate raportată între aceste două valori a fost considerată ca fiind nedeterminată (0)
div id = „1B01F6074E”
™ 20000
™ 20000
Tipuri de testare și praguri de activitate utilizate pentru determinarea etichetei de activitate: numai testele bazate pe concentrație au fost utilizate pentru a determina etichetele de activitate. Activitățile care raportează mai puțin decât valoarea maximă admisă pentru pozitive au fost considerate interacțiuni active (+), în timp ce cele mai mari decât cele minime admise pentru negative „au fost considerate inactive (-). Orice activitate raportată între aceste două valori a fost considerată ca fiind nedeterminată (0)
div id = „1B01F6074E”
™ 20000
™ 20000
Figura 5.
Etichete de activitate Distribuția și amestecurile de dovezi între date: (a) Diagrama Venn care prezintă distribuția valorilor de bioactivitate în clasele active, inactive și nedeterminate din TDR6 (vezi textul principal pentru detalii) . Intersecții Numărul cazurilor în care același medicament are rezultate diferite de activitate împotriva aceluiași țintă. Exemple de aceste cazuri sunt furnizate în panourile B prin f (ID-urile compușilor reprezintă identificatori TDR6). (B) Activitatea C329137 (o hidroxi-benzamidină) împotriva lui P. falciparum dihidrofolată dihidrofolată reductază-thymidyat sintetază. (C) Exemplu de înregistrări pozitive pentru inhibitorii de aciltransferază umană. (D) Exemplu de activități negative și neutre pentru compușii trifenilcarbinol și benzohidrolul, respectiv. În cele din urmă, dovezile pozitive (E) și negative (f) pot fi amestecate cu dovezi nedeterminate, așa cum se arată pentru C2164865 testate împotriva colinesterazei de cai și C306882 testate împotriva hidrolazei 5′-trifosfat deoxididină 5′-trifosfat deoxididină recombinantă, respectiv.
Figura 5.
Etichete de activitate Distribuția și amestecurile de dovezi între date: (a) Diagrama Venn care prezintă distribuția valorilor de bioactivitate în activ , clase inactive și nedeterminate în TDR6 (vezi textul principal pentru detalii).Intersecții Numărul cazurilor în care același medicament are rezultate diferite de activitate împotriva aceluiași țintă. Exemple de aceste cazuri sunt furnizate în panourile B prin f (ID-urile compușilor reprezintă identificatori TDR6). (B) Activitatea C329137 (o hidroxi-benzamidină) împotriva lui P. falciparum dihidrofolată dihidrofolată reductază-thymidyat sintetază. (C) Exemplu de înregistrări pozitive pentru inhibitorii de aciltransferază umană. (D) Exemplu de activități negative și neutre pentru compușii trifenilcarbinol și benzohidrolul, respectiv. În cele din urmă, dovezile pozitive (E) și negative (f) pot fi amestecate cu dovezi nedeterminate, așa cum se arată pentru C2164865 testate împotriva colinesterazei de cai și C306882 testate împotriva hidrolazei 5′-trifosfat deoxididină 5′-trifosfat deoxididină recombinantă, respectiv.
Chem Garanta Chembl se numără cu peste 15,2 milioane de bioactivități raportate, din care doar aproximativ 6 milioane corespund relațiilor care implică medicamente și ținte de proteine (fie proteine unice, familii de proteine și complexe de proteine, cu ~ 93% fiind proteine unice). Alte bioactivități rămase din baza de date au fost rapoarte pentru o mare varietate de ținte non-proteice, cum ar fi celule întregi (3,6 m), organisme integrale (2,2 m), țesuturi (83k) și macromolecule nepeptidice (85k) sau Molecule mici (< 100). Acestea nu au fost utilizate în construcția de rețea, deoarece rețeaua este proteină (adică țintă) centrică. Figura 5 prezintă, de asemenea, un exemplu de vizualizare a rețelei care descriu modul în care TDR6 afișează aceste bioactivități.
Integrarea caracteristicilor derivate din rețea: droguri și prioritizări
După cum sa menționat mai sus, datele genomice, adnotările genetice, Compușii chimici și interacțiunile gene-medicament au fost integrate într-o rețea complexă orientată spre reproșarea medicamentului, așa cum este descris în Berenstein și colab. (14). Rețeaua a fost utilizată pentru a calcula un scor de droguri de rețea (ND), pentru toate obiectivele din agenții patogeni de prioritate (tier 1). NDS este legată de șansa de a găsi compuși bioactivi în imediata apropiere a graficului de rețea a unui țintă dată (intervalul este de la 0 la 1). Algoritmul a fost descris anterior în detaliu (14), dar pe scurt, pe baza unui test de supraprezentare a proteinelor drogate cunoscute, calculează un scor de relevanță (RS) pentru fiecare categorie de domenii și grupuri de ortologie ale rețelei PFAM. Scorul NDS pentru o anumită țintă rezultă dintr-o sumă cumulativă ponderată față de RS a tuturor contribuțiilor de afiliere comune nodului țintă și proteine vecine legate de compușii activi.
Pentru a facilita interpretarea scorurilor NDS Am efectuat a Evaluare statistică pentru a identifica grupuri distincte de droguri (DG) pe baza a două tipuri de praguri care ajută la clasificarea predicțiilor de droguri în zonele de încredere. Acestea sunt ilustrate în figura 6. Pe de o parte, în timp ce toate țintele de notare non-zero au un anumit grad de conectivitate la țintele cunoscute, un NDS scăzut sugerează că aceste conexiuni nu sunt relevante pentru evaluarea drogurilor. Prin urmare, un zgomot de zgomot (o linie de bază calculată ca 5 ori mai mare decât valoarea de 0,25 percentilă din distribuția completă a NDS) este considerată a identifica obiective scăzute de notare. Al doilea prag este derivat din indicele maxim al Youden (60), care este calculat ca scorul la care specificitatea și sensibilitatea sunt optime (cea mai bună sensibilitate fără a compromite specificitatea și invers). Această valoare poate fi calculată numai pentru agenții patogeni cu pozitive adevărate (ținte cunoscute). Un minim arbitrar de 10 pozitive adevărate a fost considerat suficient pentru determinarea cutoff dvs. Pentru alți agenți patogeni lipsiți de astfel de informații, a fost utilizat o cutie globală Youden (calculată folosind toate adevărate pozitive în rețea). Grupurile de droguri corespunzătoare sunt astfel: DG1 pentru obiective cu valori NDS variind de la 0 la pragul de zgomot; DG2 pentru obiective cu valorile NDS variind de la pragul de zgomot la cutoff-ul Youden; și DGS 3, 4 și 5 cu valori NDS care sunt 1-, 10- și 100 de ori deasupra tăierii lui Youden. În consecință, aceste grupuri din urmă fac cele mai probabile obiective drogate. Figura 6 prezintă un exemplu static al unei prioritizări bazate pe rețea pentru ulcerans Mycobacterium (care nu are ținte cu compuși cunoscuți în eliberarea curentă). Toate prioritizările pentru obiectivele prioritare ale TDR pot fi văzute online la pagina Rezumatul datelor pentru fiecare specie (a se vedea https://tdrtargets.org / datasummary, făcând clic pe speciile de interes). În acest caz, parcelele online sunt interactive și pot fi mărite și exportate. În cazurile în care există ținte cu compuși bioactivi cunoscuți pentru specie, acestea sunt prezentate distinctiv în complot.
întregi Genomul de prioritizare țintă pentru ulcerele Mycobacterium: țintele candidate în genomul M. Ulcerans au fost clasificate de ND (scorul de droguri de rețea, a se vedea textul principal).Plot prezintă toate țintele genomului (în axa X) împreună cu scorul lor NDS corespunzător (în axa Y). Punctele roșii corespund obiectivelor clasate în top-10, cu etichete care indică numele genei și produsul. Bornirea prioritizării întregului genom din Rezumatul datelor, utilizatorul poate accesa o pagină de gene făcând clic pe acesta în complotul de prioritizare. Un exemplu de subgraf din familia EMBA / EMBB / EMBC este arătat (așa cum se vede în paginile lor de gene corespunzătoare). Cifra afișează, de asemenea, zone de încredere, DG1 (roșu): delimitate de cutoff zero și zgomot; DG2 (galben): între zgomotul și cutoff-ul tău; și DG3-5: cu scoruri mai mari decât cutoff-ul tău.
Genomul întreg de rețea Prioritizarea țintă pentru Ulcerans Mycobacterium: țintele candidate în genomul M. Ulcenns au fost clasificate de NDS (scorul de droguri de rețea, a se vedea textul principal). Plot prezintă toate țintele genomului (în axa X) împreună cu scorul lor NDS corespunzător (în axa Y). Punctele roșii corespund obiectivelor clasate în top-10, cu etichete care indică numele genei și produsul. Bornirea prioritizării întregului genom din Rezumatul datelor, utilizatorul poate accesa o pagină de gene făcând clic pe acesta în complotul de prioritizare. Un exemplu de subgraf din familia EMBA / EMBB / EMBC este arătat (așa cum se vede în paginile lor de gene corespunzătoare). Cifra afișează, de asemenea, zone de încredere, DG1 (roșu): delimitate de cutoff zero și zgomot; DG2 (galben): între zgomotul și cutoff-ul tău; și DG3-5: cu scoruri mai mari decât cutoff-ul Youden.
Aceste prioritizări bazate pe rețea pot funcționa în ambele sensuri. La pornind de la un compus de interes, algoritmul poate prioritiza țintele, utilizând similitudinea ponderată a vecinilor chimici la obiectivele inițiale candidate. Și când pornește de la țintă de interes, poate prioritiza compușii, folosind țintele vecine conexe și apoi după legăturile ponderate cu inhibitorii / drogurile candidate. Scorurile precomputed pentru compuși și pentru ținte sunt utilizate intern de către TDR6 și sunt la miezul transformărilor de interogare bazate pe rețea.
Sub-graficul de rețea Vizualizări și upgrade de interfață utilizator
rețeaua sub -Graps pentru ambii compuși și ținte (și scorurile lor NDS respective) pot fi navigate de la aplicația web utilizând un medicament sau o țintă ca punct de plecare pentru a obține sugestii pentru medicamente netestate sau respectiv obiective drogate noi. Prin intermediul vizualizărilor nou dezvoltate, utilizatorii pot verifica cartierele de rețea în jurul drogurilor și țintelor în paginile corespunzătoare. Listele de interacțiuni puative derivate din rețea pot fi, de asemenea, explorate în format tabular sub „droguri” (pentru ținte) și „obiective cunoscute și predicte” (pentru droguri).
Aceste vizualizări sunt conduse de D3.Js (61) Implementarea layout-urilor forțate pentru vizualizările sub-grafice. În cadrul panoului D3 Subgraph, utilizatorii pot efectua căutări de nod în graficul (identificatorii țintă), precum și comutați vizibilitatea țintelor pe o specie de către speciile și personalizați opacitatea nodurilor. Luate împreună aceste noi caracteristici oferă o vizualizare clară și cuprinzătoare a vecinătății de sub-rețea a țintelor și compușilor, permițând utilizatorilor să manipuleze graficele în timp ce explorați datele.
Interfața utilizator (UI) și instrumentele disponibile Pentru reproșarea la droguri și prioritizarea țintă au trecut printr-un upgrade major. În primul rând, UI a fost reproiectat sub standardele W3C pentru a obține o aplicație mai sănătoasă și mai scalabilă. Am integrat bootstrap (https://getbootstrap.com/) și jquery (https://jquery.com) în dezvoltarea și proiectarea aplicației web TDR6 și în față- Funcționalitate finală. Pentru interogările structurii compuse, am licențiat și implementat aplicația de desenare chimică Marvin JS de la Chemaxon (https://chemaxon.com/products/marvin-js). Înregistrările tabele în paginile țintă și de droguri utilizați acum pluginul JavaScript JavaScript () pentru a crea cu ușurință pagini, filtrare și funcționare funcționalități. În cele din urmă, reprezentările compuse 2D sunt acum generate automat utilizând o implementare a modulului JavaScript Smilesdrawer (62).
Disponibilitatea comercială a compușilor
un aspect important la prioritizarea compușilor pentru testarea în laborator , este disponibilitatea lor. În TDR6 afișăm acum informații despre disponibilitatea comercială a compușilor. În prezent, am început această caracteristică prin legarea cu Molport (o piață chimică on-line care surore compușii de la furnizorii majori) și arată utilizatorilor un indiciu vizual asupra paginilor compuse care dau o indicație rapidă dacă compusul este fie în stoc, fie poate fi făcut la comandă . Deoarece disponibilitatea comercială a compușilor este implementată în prezent în TDR6 sub formă de interogări asincrone împotriva Molport, în acest moment această caracteristică este disponibilă numai în modul de navigare (nu în interogări).Cu toate acestea, utilizatorii pot prioritiza compușii utilizând oricare dintre strategiile de interogare disponibile în TDR6 și apoi finalizează selecțiile compuse prin inspectarea compușilor manual pentru disponibilitatea comercială.
Discuție și direcții viitoare
Noile date , interfața și funcționalitatea TDR6 furnizează utilizatorilor o navigare și vizualizare îmbunătățită a țintelor și a compușilor.
Modelul curent de rețea conectează obiectivele prin afilierea entităților (proteinelor) la conceptele de adnotare (domeniile PFAM, grupurile Ortholog). Acestea au fost selectate pe baza acoperirii lor largi și a unui calcul relativ de calcul. Completarea acestor concepte cu alte criterii importante pentru validarea țintă a drogurilor (esențialitatea, expresia în etapele ciclului de viață relevante) pot fi efectuate de către utilizatori cu instrumentele și funcționalitatea oferită de TDR6, dar în viitor pot fi construite în modelul de rețea subiacente, la cel puțin pentru unele organisme care pot fi evaluate experimentale la nivel de genom.
Mai multe îmbunătățiri-cheie sunt necesare pentru a păstra obiectivele TDR relevante pentru comunitatea oamenilor de știință care lucrează la boli tropicale. Integrarea metaboliților naturali și conectarea acestor molecule mici la alți compuși bioactivi prin substructuri partajate sau prin similitudine chimică va fi un accent major în viitor. Acest lucru va permite navigarea grafitelor de droguri folosind conceptele de reacții biochimice, care conectează în mod natural enzime non-ortologice prin substraturile / produsele și cofactorii lor partajați.
în cele din urmă, așa cum sa menționat deja înainte (13), Există încă un decalaj mare de curatare care trebuie umplut. Mulți compuși bioactivi au fost testați de către Comunitatea cercetătorilor care lucrează în boli tropicale neglijate. Cu toate acestea, multe dintre aceste analize și rezultate sunt raportate în reviste în afara revistelor de chimie medicamentoasă mainstream și, prin urmare, sunt ratate de eforturi mari de curatare, cum ar fi cea condusă de Chembl (49). Curatarea și integrarea acestor date lipsă (inclusiv date negative!) Ar trebui să fie o prioritate pentru comunitate, deoarece ar economisi timp și resurse valoroase.
Date suplimentare
Sunt disponibile date suplimentare la Nar online Obiective; și Ben Webb și Andrej Sali (Universitatea din California San Francisco) pentru calcularea modelelor 3D pentru genomul patogenului de nivel 1 în țintele TDR. L.U.L., A.B. și s.v. au fost sau sunt susținute de burse de la Consiliul Național de Cercetare (Coniceet, Argentina). A.C. și F.A. sunt membri ai carierei de cercetare a Consiliului Național de Cercetare (Conicet, Argentina). P.M. ar dori să recunoască o părtășie de la Comisia de granturi Universitară (UGC), India.
Finanțare
GlaxoSmithKline Argentina și Agenția Națională pentru Promovarea Științei și Tehnologiei, Argentina (ANPCYT); Proiect de cooperare bilaterală Indo-Argentina (finanțare comună de la Departamentul Indian de Știință și Tehnologie (DST) și Ministerul Argentinian al Științei și Tehnologiei (Mincyt). Finanțare pentru taxa de acces deschis: Fondo Para La Investigación Científica y Tecnológica.
Conflictul de interese Biología Molecular, División Patología, Spitalul de Niños Ricardo Gutiérrez, Ciudad Autónoma de Buenos Aires, Argentina.
,
,
,
,
,
.
;
:
–
.
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
.
.
;
:
–
.
,
,
,
.
;
:
–
.
,
.
;
:
–
.
,
,
,
.
;
:
.
,
,
,
,
.
;
:
.
,
,
,
,
,
,
,
.
și colab. .
.
;
:
–
.
,
,
,
,
,
,
,
,
și colab. .
.
;
:
.
,
,
,
,
,
Ruan
,
.
;
:
.
,
,
,
.
.
;
–
.
,
,
,
,
,
.
;
:
–
.
,
,
.
;
:
.
,
.
;
:
–
.
,
,
,
,
,
,
și colab. .
.
.
;
:
–
.
,
,
,
,
,
,
,
și colab. .
.
;
:
–
.
,
,
,
,
,
,
.
.
;
:
–
,
,
,
,
,
,
,
,
și colab. .
.
;
:
–
.
rhertz-fowler
Peacock
.
;
:
–
.
,
,
,
,
.
;
:
–
.
,
,
,
.
;
:
–
.
,
,
.
.
;
:
–
.
,
,
,
,
,
.
.
;
:
.
/ Div>
.
.
;
.
,
,
,
.
;
:
–
.
Almagro Armenteros
,
,
,
,
,
,
.
;
:
–
.
,
,
.
.
;
:
.
,
,
div> kanehisa
.
;
:
–
.
,
,
RO,
.
;
:
–
.
,
,
,
DIV> Harb
,
shanmugam
,
Div> CJ
JR
.
;
.
div> tk
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
și colab. .
.
;
:
–
.
,
,
,
,
,
,
,
.
;
:
–
.
Pieper
,
,
,
,
Div>,
,
,
și colab. .
.
;
:
–
.
,
,
,
,
,
,
div>,
,
bozdech
.
;
:
.
,
,
,
DIV> Guerra-Slompo
,
,
,
și colab. .
.
.
;
:
.
,
,
,
,
,
,
,
și colab. .
.
;
:
–
.
,
,
,
,
,
,
,
,
și colab. .
.
;
:
–
.
,
,
,
,
,
,
,
și colab. .
.
;
:
.
,
,
,
Div> Guizetti
,
.
;
:
–
.
,
,
,
,
.
.
;
:
.
,
,
divin-johnson
,
.
.
;
:
.
div> weber
,
,
,
,
,
,
,
,
et al. .
.
;
:
–
.
,
,
,
.
;
:
–
.
,
,
.
.
;
:
.
/ Div>
,
,
,
,
,
Div> Asexual Extinderea merozoitelor de toxoplasme Gondii este diferită de tahiozoți și implică expresia de familiile genei care nu se suprapun pentru a atașa, invada și replica în enterocitele feline
.
.
;
:
.
,
,
,
Div> Girling
,
,
,
,
,
și colab. .
.
.
;
:
–
.
,
,
,
,
,
Div>,
,
,
și colab. .
.
;
:
–
.
,
,
,
,
,
,
,
și colab. .
.
;
:
.
,
,
,
Div> Wells
.
;
:
.
.
.
;
:
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
.
.
;
:
.
,
,
,
div> tchekhovskoi
.
.
;
:
.
,
,
,
.
;
:
–
.
,
,
,
.
.
;
:
–
.
.
.
;
:
.
,
.
.
;
:
–
.
.
.
;
:
–
.
,
,
.
;
:
–
.
,
.
;
:
–
.
Acesta este un articol de acces deschis distribuit în condițiile licenței necomerciale Creative Commons Attribution (http://creativecommons.org/licenses/by-nc/4.0/), ceea ce permite reutilizarea, distribuția și reproducerea necomercială În orice mediu, cu condiția ca lucrările originale să fie citate corect. Pentru reutilizarea comercială, vă rugăm să contactați [email protected]