Nos últimos vinte anos, a pesquisa genética ou por transformações significativas. O advento de dados genômicos em larga escala revolucionou a compreensão do ado humano. Cientistas coletaram material genético de centenas de milhares de pessoas, abrangendo tanto grupos modernos quanto restos antigos. Com esse vasto acervo de informações, a exploração da diversidade genética humana alcançou um novo patamar.
Os pesquisadores estão construindo o que pode se tornar o primeiro mapa completo da ancestralidade humana compartilhada. No entanto, o caminho para esse objetivo não tem sido fácil. Um dos principais desafios é a combinação de dados genéticos armazenados em inúmeros bancos de dados. Além disso, é necessário desenvolver algoritmos capazes de lidar com o tamanho impressionante desses conjuntos de dados.
Como a nova metodologia revoluciona a análise genética?
Uma equipe de cientistas do Big Data Institute da Universidade de Oxford desenvolveu um método inovador que aborda esses desafios. Essa técnica permite a fusão de dados genômicos de múltiplas fontes e é escalável para processar milhões de sequências individuais. Dr. Yan Wong, geneticista evolucionário e autor principal, descreveu o avanço como a construção de uma imensa árvore genealógica para toda a humanidade.
O conceito baseia-se na transmissão de genes. Cada região do nosso genoma é herdada de nossa mãe ou pai, o que significa que a ancestralidade de cada posição genética pode ser traçada como uma árvore, retrocedendo no tempo. Essas árvores individuais formam uma estrutura maior conhecida como “sequência de árvores” ou, tecnicamente, um “gráfico de recombinação ancestral”.

Qual é o impacto dos ancestrais comuns na diversidade genética?
O estudo liderado por Dr. Anthony Wilder Wohns, durante seu doutorado em Oxford, buscou reconstruir os genomas de nossos ancestrais para criar uma rede extensa de relações. Essa rede permite estimar o tempo e o local de existência desses ancestrais. A metodologia é especialmente poderosa por sua flexibilidade, podendo incorporar DNA antigo e moderno sem perder precisão.
Os pesquisadores utilizaram dados de oito bancos de dados distintos, abrangendo genomas humanos modernos e antigos, totalizando 3.609 sequências genômicas de 215 populações. Esses genomas antigos cobriam várias regiões do mundo e datavam de milhares a mais de cem mil anos atrás.
Quais são as implicações futuras para a pesquisa genética?
Apesar da riqueza do mapa genealógico como recurso, a equipe de pesquisa pretende aprimorar ainda mais sua abrangência, integrando continuamente novos dados genéticos. A eficiência com que as sequências de árvores armazenam dados implica que o conjunto de dados pode acomodar facilmente milhões de genomas adicionais.
Dr. Wong destacou que este estudo estabelece as bases para a próxima fase do sequenciamento de DNA. À medida que a qualidade das sequências genômicas de amostras modernas e antigas melhora, a precisão das árvores também aumentará. Eventualmente, será possível construir um mapa unificado que elucide a linhagem de toda a diversidade genética humana observável hoje.
Além dos humanos, a metodologia tem aplicação potencial em outros organismos, desde orangotangos até bactérias, e promete avanços na genética médica, ajudando a distinguir associações genuínas entre regiões genéticas e doenças de conexões espúrias decorrentes de nossa história ancestral compartilhada.