Um código de barras molecular e web

Notícias

LarLar / Notícias / Um código de barras molecular e web

Nov 10, 2023

Um código de barras molecular e web

Volume de Biologia da Comunicação

Biologia das Comunicações volume 5, Número do artigo: 1411 (2022) Cite este artigo

1834 Acessos

1 Citações

18 Altmétrica

Detalhes das métricas

Tradicionalmente, o histórico de viagens do paciente tem sido usado para distinguir os casos de malária importados dos autóctones, mas os estágios hepáticos dormentes do Plasmodium vivax confundem essa abordagem. As ferramentas moleculares oferecem um método alternativo para identificar e mapear casos importados. Usando abordagens de aprendizado de máquina incorporando índice de fixação hierárquica e análises de árvore de decisão aplicadas a 799 genomas de P. vivax de 21 países, identificamos códigos de barras 33-SNP, 50-SNP e 55-SNP (GEO33, GEO50 e GEO55), com alta capacidade de prever o país de origem da infecção. O coeficiente de correlação de Matthews (MCC) para um código de barras 38-SNP existente e comumente aplicado (BR38) excedeu 0,80 em 62% dos países. Os painéis GEO superaram o BR38, com MCCs medianos > 0,80 em 90% dos países no GEO33 e 95% no GEO50 e GEO55. Uma estrutura classificadora on-line, de acesso aberto e baseada em probabilidade foi estabelecida para dar suporte à análise de dados (vivaxGEN-geo). Os métodos de classificação e seleção de SNP podem ser prontamente alterados para outros casos de uso para apoiar programas de controle da malária.

Os últimos três Relatórios Mundiais sobre a Malária revelaram um aumento preocupante nos casos de malária e, fora da África Subsaariana, uma proporção crescente de malária devido ao Plasmodium vivax, minando os esforços conjuntos para reduzir a transmissão na última década1. Essas tendências destacam a necessidade urgente de novas ferramentas de vigilância e a necessidade de maior atenção às espécies de Plasmodium não falciparum. Um desafio particular para o controle da malária são as populações humanas altamente móveis, levando à importação de isolados de Plasmodium de um país para outro (casos importados), o que pode dificultar os esforços de controle local e aumentar os riscos de surtos e a disseminação da resistência a medicamentos antimaláricos. Para neutralizar esse desafio, há uma necessidade crítica de desenvolver ferramentas que possam ajudar a determinar onde os pacientes adquiriram a infecção.

A distinção entre infecção local e importada é particularmente desafiadora para P. vivax, tendo em vista a capacidade do parasita de formar estágios hepáticos dormentes (hipnozoítos) que podem ser reativados semanas a meses após a infecção inicial, bem como sua capacidade de causar infecções esplênicas altamente persistentes e infecções de estágio sanguíneo circulante de baixa densidade que podem escapar do diagnóstico de rotina2,3,4. O ressurgimento do P. vivax em várias regiões onde já foi quase eliminado destaca a importância da vigilância diligente5,6. Em locais de baixa endemia, a proporção relativa de casos importados geralmente aumenta à medida que a incidência cai, enfatizando a importância de ferramentas de vigilância que possam identificar casos importados de P. vivax nessas regiões em particular5. Tradicionalmente, os casos importados têm sido identificados e mapeados usando informações sobre o histórico de viagens do paciente, mas as infecções esplênicas e sanguíneas persistentes e as recidivas tardias limitam a precisão dessa abordagem para P. vivax. Ferramentas moleculares para identificar e mapear casos importados de P. vivax oferecem um complemento atraente para ferramentas epidemiológicas tradicionais.

O sequenciamento baseado em amplicon tornou-se uma abordagem preferida para a genotipagem direcionada de parasitas da malária7,8. Usando plataformas de sequenciamento altamente paralelas, como a última geração de sequenciadores Illumina, o sequenciamento baseado em amplicon pode ser aplicado em rendimento moderado a alto, com alta precisão e sensibilidade. Essas plataformas são flexíveis, permitindo aprimoramento iterativo dos códigos de barras de polimorfismo de nucleotídeo único (SNP), que podem fornecer uma abordagem de genotipagem acessível, passível de vigilância molecular baseada na população.

Estudos anteriores usaram marcadores mitocondriais e apicoplastos para distinguir isolados de P. vivax importados de locais, mas a resolução desses genomas organelares é limitada9,10,11. Em 2015, um painel de 42 SNPs, comumente referido como código de barras amplo, foi identificado para facilitar a impressão digital do parasita e a atribuição geográfica12. O código de barras 42-SNP Broad foi derivado de dados genômicos disponíveis de 13 isolados de 7 países e foi aplicado a vários estudos usando ensaios de genotipagem direcionados12,13,14. Um estudo mais recente identificou outro código de barras SNP de P. vivax usando dados de 433 isolados de 17 países15. Esse código de barras também visa facilitar a impressão digital e a atribuição geográfica, mas não há ensaios experimentais para esse código de barras e ele continua sendo apenas uma ferramenta in silico15. Além disso, todos os estudos geográficos de código de barras da malária até o momento se basearam em métodos visuais, como a Análise de Componentes Principais, para avaliar o país de origem. Embora essa abordagem tenha alguma utilidade, ela é moderadamente subjetiva e não atende às necessidades de usuários finais translacionais, como os Programas Nacionais de Controle da Malária (NMCPs), que podem não ter a epidemiologia genética ou as habilidades bioinformáticas necessárias para gerar e interpretar esses gráficos.

 0, minimum depth of 1 and minimum Minor Allele Count (MAC) of 2 to produce Dataset 0. The restriction to bi-allelic SNPs is a standard approach undertaken in malaria population genomics to simplify downstream computations and does not impose constraints on the analysis of polyclonal infections, which are still detectable through the composite of allelic variants across the respective SNPs (see27,28,29). Individual genotype calls were defined as heterozygotes based on an arbitrary threshold of a minor allele ratio > 0.1 and a minimum of 2 reads for each allele; all other genotype calls were defined as homozygous for the major allele. Dataset 0 was further filtered to exclude non-independent samples, defined arbitrarily as isolate pairs with genetic distance less than 0.001, resulting in 1,227 samples with 662,641 SNPs, denoted as Dataset 1. Dataset 1 was then subjected to iterative data quality filtering to derive the best representative number of samples and informative SNPs without any genotype missingness by iteratively removing samples with higher missingness and calculating the number of informative SNPs (defined as SNPs with MAC > = 2), from the remaining samples. Based on the plot of the result of this data quality filtering (Supplementary Fig. 1), we identified 826 samples and 229,317 SNPs to be included in Dataset 2. The isolates in Dataset 2 were initially assigned to country based on the available metadata, which was further evaluated using 1) country-level prediction using the BALK classifier against all 229,317 SNPs and 2) manual confirmation by constructing a neighbor-joining tree based on genetic distance. Isolates whose country assignment differed from the prediction result and that were not in the same country cluster as observed manually from the neighbor-joining tree were considered suspected imported infections and removed from the dataset to produce Dataset 3, comprising 799 samples and 229,317 SNPs. For comparative assessment of candidate SNP panels, a new dataset (Dataset 4) was produced which comprised the samples in Dataset 3, but only the SNPs selected by the consecutive SNP selection process (we refer to these SNP panels as GEO barcodes) and 38 assayable SNPs from a commonly used 42-SNP P. vivax barcode developed by the Broad institute12. The SNP panel comprising the 38 assayable Broad Institute barcode SNPs is referred to as BR38. The BR38 SNP panel was integrated in the study for evaluation on its own as well as in combination with the newly selected GEO SNP panels as it has been implemented in several countries./p>