Sunset Binding MOAD com sua última atualização de dados e a adição de 3D

Notícias

LarLar / Notícias / Sunset Binding MOAD com sua última atualização de dados e a adição de 3D

May 06, 2023

Sunset Binding MOAD com sua última atualização de dados e a adição de 3D

Relatórios Científicos volume 13,

Scientific Reports volume 13, Número do artigo: 3008 (2023) Citar este artigo

664 acessos

1 Altmétrica

Detalhes das métricas

Binding MOAD é um banco de dados de complexos proteína-ligante e suas afinidades com muitos relacionamentos estruturados em todo o conjunto de dados. O projeto está em desenvolvimento há mais de 20 anos, mas agora chegou a hora de encerrá-lo. Atualmente, o banco de dados contém 41.409 estruturas com cobertura de afinidade para 15.223 (37%) complexos. O site BindingMOAD.org fornece inúmeras ferramentas para exploração de polifarmacologia. As relações atuais incluem links para estruturas com similaridade de sequência, similaridade de ligante 2D e similaridade de sítio de ligação. Nesta última atualização, adicionamos similaridade de ligante 3D usando ROCS para identificar ligantes que podem não ser necessariamente semelhantes em duas dimensões, mas podem ocupar o mesmo espaço tridimensional. Para os 20.387 ligantes diferentes presentes no banco de dados, foi adicionado um total de 1.320.511 correspondências de forma 3D entre os ligantes. São apresentados exemplos da utilidade da correspondência de formas 3D em polifarmacologia. Finalmente, são delineados planos para acesso futuro aos dados do projeto.

Bancos de dados de complexos proteína-ligante são centrais para vários projetos de descoberta e design de drogas. Eles são particularmente úteis em projetos de polifarmacologia, como prever atividades fora do alvo de drogas (toxicologia) ou encontrar novas aplicações de drogas conhecidas (reaproveitamento de drogas). Existem vários bancos de dados que fornecem dados sobre complexos proteína-ligante, incluindo Binding MOAD (www.BindingMOAD.org)1,2,3, PDBbind (www.PDBbind.org.cn)4, BindingDB (www.bindingdb.org)5 ,6,7,8,9, sc-PDB (http://bioinfo-pharma.u-strasbg.fr/scPDB/)10,11 e muitos mais. Esses bancos de dados destinam-se a diferentes aplicações, e seu conteúdo e tamanho variam por causa de seus diferentes critérios de seleção para incluir qualquer complexo proteína-ligante em particular.

O MOAD foi iniciado em 2001, publicado pela primeira vez em 20051 e atualizado anualmente no início de janeiro de cada ano. Quando iniciamos o MOAD, os maiores conjuntos de dados para ancoragem e pontuação tinham aproximadamente 200 complexos12,13. Estes foram reunidos em uma abordagem "de baixo para cima" de leitura da literatura de química medicinal para identificar estruturas. Decidimos usar uma abordagem "top down" que começou com todo o Protein Data Bank (PDB) contendo todos os complexos possíveis e aumentar esse conjunto máximo com dados de afinidade por meio de pesquisa na literatura. Um complexo proteína-ligante deve ter uma resolução de pelo menos 2,5 Å e conter pelo menos um ligante biologicamente relevante em sua estrutura PDB para ser incluído no banco de dados. Em nosso subconjunto HiQ de complexos proteína-ligante puros de MOAD14, critérios de seleção adicionais requerem métricas mais exatas de Rfree − Rwork ≤ 5%, Real Space R ≤ 0,2 e RSCC ≥ 0,9.

Em 2014, o site e o banco de dados foram reestruturados para o formato LAMP (Linux, Apache, MySQL e PHP)3; a interface de usuário aprimorada incorporou plug-ins de terceiros, como Jmol, MarvinView e JChemBase com MarvinSketch para melhor visualização de proteínas e ligantes. Na mesma atualização, recursos úteis como downloads filtrados e pesquisa baseada em campo também foram incorporados. Em 2019, o visualizador NGL foi adicionado para uma visualização aprimorada dos complexos proteína-ligante, e o MarvinView foi substituído pelo MarvinJS para pesquisa de moléculas pequenas no banco de dados15. O site também foi equipado com ferramentas de polifarmacologia, como similaridade de sítios de ligação 3D e similaridades 2D de ligantes.

Nossa mais recente adição ao MOAD são as semelhanças 3D entre os ligantes. Moléculas semelhantes tendem a ter propriedades químicas e biológicas semelhantes16. A avaliação de semelhanças estruturais entre moléculas pequenas pode ser um ponto de partida altamente eficaz para a descoberta e otimização de várias moléculas principais. Isso é útil na previsão de propriedades toxicológicas de ligação fora do alvo e reaproveitamento de drogas como potenciais inibidores de outras proteínas de interesse. Abordagens bidimensionais de similaridade molecular têm sido bastante populares devido à sua simplicidade e precisão17,18,19,20,21,22. No entanto, os cálculos de similaridade 2D são baseados principalmente em descritores de impressão digital molecular e não contêm nenhuma informação sobre a estrutura 3D de uma molécula. Optamos por adicionar similaridade 3D molecular por causa de sua importância na triagem virtual de bibliotecas moleculares, bem como abordagens de salto de andaime23,24,25.

 Ki > IC50 (dissociation (or association Ka) constants over inhibition constants over half-maximal inhibitory concentrations)./p> 0.85. From the similarity calculations performed on the ~ 950,000 ligand conformations (PDB-reported and those generated by Omega), more than 26 million individual similarities across all the conformations were identified and a total of 1,320,511 new 3D-shape matches between the individual ligands were added to the MOAD database. These have been added to a new 3D similarity section for ligands on our BindingMOAD.org pages for each complex, see Fig. 1./p>

3.0.CO;2-N" data-track-action="article reference" href="https://doi.org/10.1002%2F1097-0282%282002%2961%3A2%3C127%3A%3AAID-BIP10076%3E3.0.CO%3B2-N" aria-label="Article reference 5" data-doi="10.1002/1097-0282(2002)61:23.0.CO;2-N"Article CAS PubMed Google Scholar /p>

3.0.CO;2-3" data-track-action="article reference" href="https://doi.org/10.1002%2F1096-987X%28200103%2922%3A4%3C418%3A%3AAID-JCC1012%3E3.0.CO%3B2-3" aria-label="Article reference 13" data-doi="10.1002/1096-987X(200103)22:43.0.CO;2-3"Article CAS Google Scholar /p>