Grande parte do genoma humano é feito de regiões reguladoras que controlam quais genes são expressos em um determinado momento dentro de uma célula. Esses elementos reguladores podem estar localizados perto de um gene alvo ou até 2 milhões de pares de bases distantes do alvo.
Para permitir essas interações, o genoma faz um loop em uma estrutura 3D que aproxima regiões distantes. Usando uma nova técnica, os pesquisadores do MIT mostraram que podem mapear essas interações com resolução 100 vezes maior do que era possível anteriormente.
“Usando este método, geramos os mapas de maior resolução do genoma 3D que já foram gerados, e o que vemos são muitas interações entre intensificadores e promotores que não foram vistos anteriormente”, diz Anders Sejr Hansen, o Underwood-Prescott Career Development Assistant Professor de Engenharia Biológica no MIT e autor sênior do estudo. “Estamos entusiasmados por poder revelar uma nova camada de estrutura 3D com nossa alta resolução.”
As descobertas dos pesquisadores sugerem que muitos genes interagem com dezenas de diferentes elementos regulatórios, embora mais estudos sejam necessários para determinar quais dessas interações são as mais importantes para a regulação de um determinado gene.
“Os pesquisadores agora podem estudar as interações entre genes e seus reguladores de forma acessível, abrindo um mundo de possibilidades não apenas para nós, mas também para dezenas de laboratórios que já manifestaram interesse em nosso método”, diz Viraat Goel, aluno de pós-graduação do MIT e um dos os principais autores do artigo. “Estamos entusiasmados em trazer à comunidade de pesquisa uma ferramenta que os ajude a desvendar os mecanismos que conduzem à regulação genética”.
O pós-doutorando do MIT, Miles Huseyin, também é o principal autor do artigo, que aparece hoje na Genética da Natureza.
Mapeamento de alta resolução
Os cientistas estimam que mais da metade do genoma consiste em elementos reguladores que controlam os genes, que representam apenas cerca de 2% do genoma. Estudos de associação em todo o genoma, que ligam variantes genéticas a doenças específicas, identificaram muitas variantes que aparecem nessas regiões reguladoras. Determinar com quais genes esses elementos reguladores interagem pode ajudar os pesquisadores a entender como essas doenças surgem e, potencialmente, como tratá-las.
Descobrir essas interações requer o mapeamento de quais partes do genoma interagem umas com as outras quando os cromossomos são colocados no núcleo. Os cromossomos são organizados em unidades estruturais chamadas nucleossomos – filamentos de DNA firmemente enrolados em torno de proteínas – ajudando os cromossomos a se encaixarem nos pequenos limites do núcleo.
Há mais de uma década, uma equipe que incluía pesquisadores do MIT desenvolveu um método chamado Hi-C, que revelou que o genoma é organizado como um “glóbulo fractal”, que permite que a célula empacote firmemente seu DNA, evitando nós. Essa arquitetura também permite que o DNA se desdobre e redobre facilmente quando necessário.
Para realizar o Hi-C, os pesquisadores usam enzimas de restrição para cortar o genoma em muitos pedaços pequenos e ligar bioquimicamente os pedaços que estão próximos uns dos outros no espaço 3D dentro do núcleo da célula. Eles então determinam as identidades das peças que interagem, amplificando-as e sequenciando-as.
Embora o Hi-C revele muito sobre a organização 3D geral do genoma, ele tem resolução limitada para selecionar interações específicas entre genes e elementos reguladores, como intensificadores. Os intensificadores são sequências curtas de DNA que podem ajudar a ativar a transcrição de um gene ligando-se ao promotor do gene – o local onde a transcrição começa.
Para alcançar a resolução necessária para encontrar essas interações, a equipe do MIT se baseou em uma tecnologia mais recente chamada Micro-C, inventada por pesquisadores da Escola de Medicina da Universidade de Massachusetts, liderados por Stanley Hsieh e Oliver Rando. O Micro-C foi aplicado pela primeira vez em leveduras em brotamento em 2015 e posteriormente aplicado a células de mamíferos em três artigos em 2019 e 2020 por pesquisadores como Hansen, Hsieh, Rando e outros na Universidade da Califórnia em Berkeley e na UMass Medical School.
O Micro-C atinge uma resolução mais alta do que o Hi-C usando uma enzima conhecida como nuclease microcócica para cortar o genoma. As enzimas de restrição do Hi-C cortam o genoma apenas em sequências de DNA específicas que são distribuídas aleatoriamente, resultando em fragmentos de DNA de tamanhos variados e maiores. Em contraste, a nuclease microcócica corta uniformemente o genoma em fragmentos do tamanho de nucleossomos, cada um contendo de 150 a 200 pares de bases de DNA. Essa uniformidade de pequenos fragmentos concede ao Micro-C sua resolução superior ao Hi-C.
No entanto, como o Micro-C examina todo o genoma, essa abordagem ainda não atinge resolução alta o suficiente para identificar os tipos de interações que os pesquisadores desejam ver. Por exemplo, se você quiser ver como 100 sítios de genoma diferentes interagem entre si, você precisa sequenciar pelo menos 100 multiplicado por 100 vezes, ou 10.000. O genoma humano é muito grande e contém cerca de 22 milhões de sítios na resolução do nucleossomo. Portanto, o mapeamento Micro-C de todo o genoma humano exigiria pelo menos 22 milhões multiplicados por 22 milhões de leituras de sequenciamento, custando mais de US$ 1 bilhão.
Para reduzir esse custo, a equipe desenvolveu uma maneira de realizar um sequenciamento mais direcionado das interações do genoma, permitindo que eles se concentrassem em segmentos do genoma que contêm genes de interesse. Ao focar em regiões abrangendo alguns milhões de pares de bases, o número de possíveis sítios genômicos diminui mil vezes e os custos de sequenciamento diminuem um milhão de vezes, para cerca de US$ 1.000. O novo método, chamado Region Capture Micro-C (RCMC), é, portanto, capaz de gerar mapas baratos 100 vezes mais ricos em informações do que outras técnicas publicadas por uma fração do custo.
“Agora temos um método para obter mapas de estrutura do genoma 3D de resolução ultra-alta de uma maneira muito acessível. Anteriormente, era tão inacessível financeiramente porque você precisaria de milhões, senão bilhões de dólares, para obter alta resolução”, diz Hansen . “A única limitação é que você não pode obter todo o genoma, então você precisa saber aproximadamente em qual região está interessado, mas você pode obter uma resolução muito alta, muito acessível.”
Muitas interações
Neste estudo, os pesquisadores se concentraram em cinco regiões que variam em tamanho de centenas de milhares a cerca de 2 milhões de pares de bases, que eles escolheram devido a características interessantes reveladas por estudos anteriores. Isso inclui um gene bem caracterizado chamado Sox2, que desempenha um papel fundamental na formação de tecidos durante o desenvolvimento embrionário.
Depois de capturar e sequenciar os segmentos de DNA de interesse, os pesquisadores encontraram muitos intensificadores que interagem com Sox2, bem como interações entre genes próximos e intensificadores que não eram vistos anteriormente. Em outras regiões, especialmente aquelas cheias de genes e intensificadores, alguns genes interagiram com até 50 outros segmentos de DNA e, em média, cada local de interação contatou cerca de 25 outros.
“As pessoas já viram múltiplas interações de um pedaço de DNA antes, mas geralmente é da ordem de duas ou três, então ver tantas delas foi bastante significativo em termos de diferença”, diz Huseyin.
No entanto, a técnica dos pesquisadores não revela se todas essas interações ocorrem simultaneamente ou em momentos diferentes, ou quais dessas interações são as mais importantes.
Os pesquisadores também descobriram que o DNA parece se enrolar em “microcompartimentos” aninhados que facilitam essas interações, mas não foram capazes de determinar como os microcompartimentos se formam. Os pesquisadores esperam que um estudo mais aprofundado dos mecanismos subjacentes possa esclarecer a questão fundamental de como os genes são regulados.
“Embora não estejamos cientes do que pode estar causando esses microcompartimentos e tenhamos todas essas questões em aberto diante de nós, pelo menos temos uma ferramenta para fazer essas perguntas com rigor”, diz Goel.
Além de buscar essas questões, a equipe do MIT também planeja trabalhar com pesquisadores do Boston Children’s Hospital para aplicar esse tipo de análise a regiões genômicas que foram associadas a distúrbios sanguíneos em estudos de associação genômica. Eles também estão colaborando com pesquisadores da Harvard Medical School para estudar variantes ligadas a distúrbios metabólicos.
A pesquisa foi financiada pelo Koch Institute Support (core) Grant do National Cancer Institute, National Institutes of Health, National Science Foundation, um Solomon Buchsbaum Research Support Committee Award, Koch Institute Frontier Research Fund, um NIH Fellowship e um Bolsa EMBO.