Boletim N°5 Março 2023
Vigilância genómica da malária em Moçambique Análise bioinformática dos dados genómicos As amostras colhidas dos participantes são processadas para extrair o ADN do parasita da malária e obter suas sequências por meio de sequenciação de amplicon de nova geração no laboratório. Os dados "brutos" que saem do sequenciador precisam ser armazenados, processados para obter informações relevantes sobre o genoma dos parasitas e integrados com informações epidemiológicas para informar as políticas de controlo ou eliminação da malária.
GTCGATCGACACG GTCGATCGACACG GTCGATCGACACG GTCGATCGACACG GTCGATCGACACG GTCGATCGACACG
< colheita de amostras > (veja boletim 3)
< sequenciação > (veja boletim 4)
reads
A sequenciação de uma amostra resulta em arquivos que contêm reads (leituras) para cada molécula de ADN do parasita que foi amplificada (ou copiada várias vezes) e sequenciada. Um read é como uma palavra longa, onde as letras são os nucleotídeos que compõem o ADN (A, T, C e G). Cada amostra de um participante gera centenas de milhares de reads.
locus
CCGATCGAATGAGACAGAGTCGATCGACACGAC GTCGATCGACACG GTCGATCGACACG GTCGATCGACACG
Genoma de referência
GTCGATCGACACG GTCGATTGACACG GTCGATCGCCACG
variantes
Base de dados genómica
Esses reads vêm de diferentes localizações no genoma do parasita (locus). Por exemplo, alguns reads podem vir do marcador de resistência à artemisinina k13, outros reads dos marcadores de resistência à sulfadoxina-pirimetamina dhps e dhfr. Com a bioinformática, podemos descobrir de onde veio cada um dos reads e identificar as variantes que existem nas nossas amostras. Fazemos isso alinhando cada read a uma referência (uma sequência conhecida do parasita). O alinhamento é um processo que encontra a sequência mais semelhante na referência e identifica as diferenças. Variantes em sequências alinhadas observadas em cada amostra são armazenadas em bancos de dados.
+ Base de dados genómica
Dados epidemiológicos
Análise de dados
Relatórios
Depois que as informações são colhidas de vários indivíduos, as variantes no banco de dados são usadas com informações epidemiológicas para calcular indicadores de relevância em saúde pública e visualizar os dados.