Redireciona para:

Genómica

INTRODUÇÃO À GENÔMICA

O termo genoma vem da junção de “gene” e “oma”, que significa “todos os genes”. Ele representa a quantidade de material genético de uma espécie e, consequentemente, todas as características e informações codificadas no DNA (ácido desoxirribonucleico) daquele indivíduo ou no RNA (ácido ribonucleico), no caso dos vírus. A fim de obterem-se mais informações acerca desse ramo da genética, a Genômica dedica-se a compreender a interação entre os genes e o meio. Para isso, em 1970, as atividades desenvolvidas nos laboratórios já se dedicavam a clonagem e sequenciamento de um gene de cada vez. Visto que a leitura de um gene por vez demandava de muito tempo e esforço dos pesquisadores, em 1980, eles perceberam que conseguiriam realizar o sequenciamento de um genoma completo de um determinado ser. Entre os anos de 1980 e 1990, a tecnologia passou a ter relevância e pôde, então, contribuir positivamente para o desenvolvimento da Genômica, que a partir de novas técnicas e processos mais detalhados e velozes, conseguiu, atualmente, permitir a obtenção de mais de 100 bilhões de sequências de bases em um único dia de trabalho.

SEQUENCIAMENTO DE UM GENOMA

Geneticistas, com auxílio de diversos tipos de mapas genômicos e técnicas de extração e preservação do material genético, possibilitaram o estudo e avanço no estudo do genoma (DE SOUZA et. al., 2022; CARVALHO & SILVA, 2010). Os primeiros métodos de sequenciamento se baseavam na clivagem química (Maxam-Gilbert) ou na terminação de cadeias (Sanger), que com o advento da tecnologia em meados dos anos 2000, tornou-se menos dificultoso e dispendioso (SILVA et. al., 2022). Contudo, de nada adiantam dados melhores e mais rapidamente coletados se não há como interpretá-los em plataformas que não estão preparadas para lê-los em sua magnitude, e para haver uma maior uniformidade quanto à interpretação e amostragem das informações, foram criados os mapas genômicos (SILVA et. al., 2022). Mapas de ligação com base nos padrões de herança de alelos e os mapas citogenéticos com base na localização de características microscópicas são exemplos de mapas genômicos utilizados. Tecnologias para extração de amostras para sequenciamento têm sido boas aliadas a tecnologias de leitura, principalmente quando estas estão relacionadas à tecnologia de Sanger, ocasionando baixo custo e otimizando análises (CARVALHO & SILVA, 2010; MARAN et al., 2020).

Contudo há outros mapas, como o de alta resolução, que evidenciam a sequência completa dos nucleotídeos — adenina (A), timina (T), citosina (C) e guanina (G) — que formam a estrutura física desse conjunto de genomas. Este tipo de amostragem demonstra a posição de um gene no cromossomo, assim como suas regiões vizinhas, de modo que se torna possível o entendimento acerca da correlação entre genes e espécies.

Os mapas físicos utilizam o número de pares de bases a fim de compreender a distância entre os genes e consequentemente, o número de genes, suas posições, orientações, nomenclatura e função.

Para a ciência sequenciar automaticamente um DNA, há uma tecnologia de ponta, que expandiu essa área e tornou diferencial sua leitura em menos tempo, aumentando a performance dos resultados e possíveis diagnósticos quando se trata de saúde. Essa é uma técnica que se baseia no estudo de Sanger de cadeia didesóxi, ou seja a partir de detecção químicas, portanto, podendo variar seu sequenciamento pelo tamanho de comprimento do DNA em questão, além das bases determinadas e da precisão bruta. A leitura do DNA é a partir das reações de sequenciamento individual, por nucleotídeos, que dependendo da técnica aplicada pode haver uma variação entre 100 a 5.000 bases.

Contudo, para os estudiosos existe uma grande barreira a ser enfrentada, a montagem de bases únicas e autênticas, como consenso dos ingressados na área, e para certificar a acurácia durante a réplica do sequenciamento, há diversas leituras independentes para certificar a exatidão do código genético dos diferentes pares de bases dos genomas, ou seja, dessa forma há uma confiabilidade de não haver erros na construção de um novo material genético.

O sequenciamento de um genoma, quando direcionado ao estudo dos seres humanos, tem como objetivo colher informações e construir conhecimento, a fim de compreender a origem genética de diversas doenças. Além disso possibilita tanto a observação quanto a descoberta de etapas evolutivas, onde para que ocorram, são dependentes de uma base genética, também pode-se citar diversas outras possibilidades de semelhanças e diferenças existentes entre os seres vivos que decorrem do genoma.

De forma geral, tal objetivo pode ser alcançado a partir da produção de uma sequência consenso, servindo como base para determinada espécie, cujo genoma foi sequenciado, mesmo podendo haver diferenças entre os genomas de indivíduos pertencentes à mesma espécie, proporcionando a futura comparação com outros diferentes genomas de diferentes indivíduos. Um genoma sequenciado, abre um leque de possibilidades para várias áreas do conhecimento, como biologia, medicina, nutrição e biotecnologia, como também podemos citar algumas aplicações que utilizam um genoma sequenciado, sendo elas: monitoramento ambiental, validação de matérias-primas e insumos, análise de fezes, fraude de alimentos, validação de higienização, descobrimento de bactérias no espaço e análise de microbiota de plantas.

O sequenciamento Shoutgun de genoma inteiro é a atual estratégia utilizada para determinar o sequenciamento do genoma. Para tal, quebrasse os longos cromossomos do DNA em pequenos segmentos de DNA genômico, e a partir disso constrói-se uma nova sequência dos fragmentos. Embora seja o método mais utilizado atualmente ele não é perfeito e partes do genoma podem acabar sendo perdidos no processo da quebra, porém foi com o sequenciamento de Shoutgun que a equipe do Projeto Genoma Humano conseguiu sequenciar certa de 90% do DNA humano.

GENES CODIFICADORES DE PROTEÍNAS - IDENTIFICAÇÃO

Os RNAs mensageiros (mRNA) processados alternadamente são codificantes de polipeptídios que possuem sequências de aminoácidos em comum, entretanto as sequências não passíveis de tradução, os íntrons, ou as sequência que podem ser traduzidas, éxons, não são diferenciadas, o que gera preocupação com relação ao que poderá ser traduzido ou não em todo o processo de leitura e reconfiguração dessa mensagem molecular (ZLOTORYNSKI, 2019).

A bioinformática tem sido utilizada em análises computadorizadas de sequências de genomas, ocasionando na previsão com maior acurácia na busca de sequências de mRNA e polipeptídios que estejam semelhantes no tocante a sequências codificantes, isto é, lê e indica com rapidez e exatidão a busca de sequências que evidenciem características de genes, indicando também aplicações para zootecnia na área da produção animal (RODRÍGUEZ-OSORIO, 2019).

A detecção de ORF (Open Reading Frame) é a principal abordagem para a produção de uma lista de polipeptídios, se concentrando na detecção de códons de início e término de tradução em íntrons, o que aplicado foi utilizado por Tsai et al. (2020) para estudar a variação genômica associada a proteína spike do vírus SARS-CoV-2, indicando a formulação molecular com base na genética, que não ocorrem dissociadas em bases experimentais atuais (PAULINO & BEZERRA, 2019) Os métodos sugerem a elaboração de bibliotecas de moléculas de DNA complementares (cDNA) a sequências de mRNA, para tanto, ainda com relação a bioinformática aplicada à genômica, existem programas estatísticos específicos para a busca de genes previamente catalogados em bibliotecas de cDNA. O programa varre a biblioteca procurando sequências previstas dos diversos sítios de ligação utilizados como promotores, por sítios de início de transcrição, sítios de splicing 3′ e 5′ e por códons de início de tradução no DNA genômico.

Isto é, os genes candidatos à técnica podem ser verificados por meio da sua comparação com todas as outras sequências de genes que já foram encontradas e catalogadas, formando uma sequência candidata que atua como modelo para consulta às bases de dados públicas que contêm um registro de todas as sequências gênicas conhecidas, podendo ser feitas comparações.

GENOMA HUMANO

Cerca de 45% do genoma nuclear humano se traduz em sequências de repetição, onde uma fração desse conteúdo repetido é composto por elementos de transposição. Além disso, este genoma conta com pequenas partes que se repetem igualmente ao longo de seu comprimento, e que são conhecidas como microssatélites. Apenas cerca de 3% do genoma humano é responsável pela ação codificante de proteínas e de RNAs. Os genes que podem ser aproveitados neste processo são compostos por uma média de 10 éxons, embora não seja regra. Com base nos atuais dados de cDNA e marcadores de sequência expressas (EST), estima-se que haja um mínimo de 60% dos genes humanos que sejam codificadores de proteínas e que estes apresentam duas ou mais variantes de corte, que por sua vez caracterizam diferenças fenotípicas, isto é, sabe-se que há mais proteínas do que genes conhecidos que são responsáveis por sua formulação. Há também os pseudogenes, que são cópias não funcionais de genes, isto é, que possuem formulação muito semelhante a genes funcionais, mas que destoam em pares de base em algum local da sequência polinucleotídica.

Para além da academia, a genômica tem sido muito valorizada, à grande exemplo de aplicações à medicina, como terapia gênica, previsão e tratamento de doenças multifatoriais e até mesmo outros setores ainda mais ramificados e quase escusos, como os seguros (MORAIS et al., 2007; DOS SANTOS et al., 2020; GOULART et al., 2010). O mapeamento genético se mostrou extremamente funcional com relação à manutenção da dignidade humana, que é intrinsecamente ligada à saúde. A inclinação terapêutica do conhecimento genético tem auxiliado no descobrimento de doenças antecipadamente ao surgimento de sintomas.

Ainda, segundo Morais et al. (2007), o mapeamento genético tem se mostrado aliado às seguradoras, contudo tem gerado preocupações com relação à ética dessas empresas, com casos de discirminação genética já relatados. O Projeto Genoma Humano (PGH) já havia previsto a possibilidade de ocorrências de discriminação, e para tal firmou um órgão específico para firmar pesquisas acerca das consequências do projeto no tocantes éticos, sociais e legais (SILVA & DIAS, 2021; DE ALMEIDA MIRANDA, 2013).

Os seres humanos diferem não somente em uma base nitrogenada dentre um milhão, como também no número de cópias de segmentos de genes próprios, conjuntos de genes ou até genomas inteiros, isto é, ainda que pertencentes a uma mesma espécie com um determinado conjunto de genes, cada indivíduo possui sua própria versão desse enorme código. Ao comparar duas pessoas não relacionadas, isto é, sem parentesco, pode haver mais de 1.000 segmentos de DNA de comprimento superior a 500 pb que diferem no número de cópias.

O número de cópias de segmentos de genes pode desempenhar um importante papel na evolução, como doenças, o que é de alto interesse mundial e que se alia ao que já foi introduzido sobre a importância da genômica e dos mapas genômicos para a sociedade. Não obstante, existem transtornos que podem estar relacionados à condição genética do indivíduo, como o Transtorno do Espectro Autista (TEA) e o Transtorno Obsessivo-Compulsivo (TOC). Estudos acerca do TEA e do TOC têm observado que existe relações entre os fatores genéticos dos indivíduos e os devidos transtornos, contudo estes não agem isoladamente, isto é, para além do fator genético há também o fator ambiental, onde no TOC ambos fatores contribuem igualmente (CROWLEY, 2022). Consonante a Trost et. al (2022) e Crowley (2022) , tanto o TEA quanto o TOC são hereditários, com taxas mais elevadas para gêmeos no TEA (entre 64% a 91%).

Segundo Galileu (2022), estudos recentes, através da análise completa de sequenciamento do genoma, encontraram mais de 134 genes ligados ao TEA, além de observarem que essas variações, em sua maioria, estavam ligadas ao número de cópias dos genes. Considerando a arquitetura genômica, 52% eram variantes em nível de sequência nuclear, 46% variantes estruturais nucleares (incluindo os número de cópias, inversões, grandes inserções, isodismos uniparentais e expansões de repetição em tandem), e 2% eram mitocondriais, havendo também a identificação de algumas variantes raras (TROST et. al., 2022).

Ainda sobre a aplicação médica da genômica, têm-se diversos estudos acerca do vírus do HIV, onde através de diversas técnicas são exploradas a influência de outras conformações de nucleotídeos sob a ótica da sequência de RNA do vírus (HUANG et al., 2019; OBAYASHI et al., 2021), bem como o HIV afeta determinados grupos de pessoas, causando-lhes instabilidade genômica, o que pode ser grave (GUTIÉRREZ-SEVILLA, 2021). Contudo, como já relatado por Silva & Dias (2021), questões éticas e sociais acerca do PGH se aplicam a estes casos de mapeamento genético (LYNCH et al., 2023), isto é, a liberação de dados coletados têm gerado preocupações, principalmente se há a possibilidade de submetê-los a terceiros, gerando insegurança aos participantes.

ELEMENTOS FUNCIONAIS NÃO CODIFICADORES NO GENOMA

Os genomas de grandes eucariotos multicelulares são compostos principalmente de DNA não codificador de proteínas. Embora haja muito consenso de que uma pequena fração desses genomas tem funções biológicas importantes, tem havido muito debate sobre se o restante contribui para o desenvolvimento e/ou homeostase. Grande parte da especulação centrou-se nas regiões genômicas que são transcritas em RNA em algum nível baixo (PALAZZO, 2015). RNAs receberam arbitrariamente vários nomes, como “RNA intergênico”, “RNAs não codificantes longos” etc., o que levou a alguma confusão no campo. Muitos pesquisadores acreditam que esses transcritos representam um mundo vasto e desconhecido de RNAs não codificantes funcionais (ncRNAs), simplesmente porque eles existem.

No entanto, há razões para questionar essa visão porque ela ignora nossa compreensão atual de como a evolução molda os genomas eucarióticos e como a maquinaria de expressão gênica funciona nas células eucarióticas. Embora existam, sem dúvida, muitos outros ncRNAs funcionais ainda a serem descobertos e caracterizados, também é provável que muitos desses transcritos sejam simplesmente lixo (PALAZZO, 2015). A maioria dos RNAs não codificantes (ncRNAs) conhecidos cumpriam funções relativamente genéricas nas células, como os rRNAs e tRNAs envolvidos na tradução do mRNA, pequenos RNAs nucleares (snRNAs) envolvidos no splicing e pequenos RNAs nucleolares (snoRNAs) envolvidos na modificação de rRNAs. A maioria das informações genéticas que especificam a forma biológica e o fenótipo são expressas como proteínas, que não apenas cumprem diversas funções catalíticas e estruturais, mas também regulam a atividade do sistema de várias maneiras. Isso é amplamente verdadeiro em procariotos e presumivelmente também em eucariotos.

Reciprocamente, as extensas sequências nos eucariotos superiores que não codificam proteínas ou elementos reguladores de ação cis (ou seja, a maioria dos vastos trechos de sequências intrônicas e intergênicas) foram consideradas como simplesmente detritos evolutivos acumulados decorrentes da montagem inicial de genes e /ou a inserção de elementos genéticos móveis (MATTICK & MAKUNIN, 2006)As sequências de íntrons 5' e 3', quando não codificadas, são anotadas por meio da análise de transcritos gênicos, enquanto os promotores dos genes são identificados, esse processo ocorre por meio de sua proximidade das unidades de transcrição de sequências sinalizadoras no DNA. Quando isso ocorre outras sequências reguladoras que também são indicadoras, não são identificáveis por meio de inspeção de sequências de DNA. Diversas técnicas para detectar sequências envolvidas no controle da transcrição gênica podem ser usadas de forma cooperativa.

EXOMA

Avanços tecnológicos diminuíram consideravelmente o custo do sequenciamento do genoma individual. Essa técnica atua na identificação de mutações ocorridas em um indivíduo e de células normais e cancerosas, além das diferenças genéticas entre indivíduos. Essas mutações, algumas vezes, são responsáveis por diversas doenças genéticas, como câncer, autismo e várias síndromes. A origem dessas doenças muitas vezes não é apontada em estudos tradicionais, tornando assim, o sequenciamento do exoma inteiro uma ferramenta eficaz para tais diagnósticos, pois ele analisa todas as regiões codificadoras do genoma humano com o objetivo de identificar variantes que possam contribuir para o diagnóstico preciso de doenças genéticas. Seu processo se baseia na análise de todos os éxons, sendo eles, as partes codificantes do DNA, onde ocorrem aproximadamente 85% das alterações genéticas.

Esse método se inicia em uma fita de DNA, onde possui íntrons que são partes não codificantes do DNA e éxons, sendo as partes codificantes. Essa fita se fragmenta, isolando as partes que possuem éxons, podendo ainda ter trechos de íntrons. Esses fragmentos se ligam a sondas imobilizadas de purificação, onde são purificados, ou seja, tirando os trechos de ítrons restantes, em seguida ocorre a eluição e amplificação desse DNA exônico , e mais tarde, como resultado, esse DNA é sequenciado.

GENÔMICA FUNCIONAL

A genômica funcional é o estudo que busca explicar a função, expressão de cada gene e como eles interagem entre si. Esse estudo utiliza as omas (transcriptoma, proteoma e interatoma), como metodologia para descoberta de diversas doenças, variações e aprimoramento genético, de humanos, plantas e animais. Dentre essas omas, temos o transcriptoma, que é utilizado para o mapeamento do RNA e suas funções, se refere ao conjunto de todos os transcritos (RNAs) da célula de um dado organismo, órgão ou tecido. Seu estudo se dá através de uma análise de grande escala SAGE, microarranjos de cDNA, oligos e DNA-chips ou “deep sequencing”, que apesar de ser um método de sequenciamento em grande escala, possui desvantagens como, alto custo e dificuldade de análise. O proteoma, sendo o conjunto de todas as proteínas expressas em uma célula, tecido, ou sistema biológico em dado momento ou situação fisiológica, é utilizado para o entendimento dos processos fisiológicos e estudos das relações entre genótipo e fenótipo. Seu estudo dá-se por meio da separação das proteínas por eletroforese em gel bidimensional ou cromatografia líquida multidimensional. E por último, o interatoma, que diz respeito ao conjunto completo de interações físicas de proteínas e segmentos de DNA, de proteínas e segmentos de RNA e entre proteínas. O seu principal método de análise é o bioinformático, nele os cientistas tentam explicar as propriedades dos sistemas. Sendo utilizado para comparar redes de interações entre e dentro da espécie e descobrir sobre variações ou preservação de características.

= GENÉTICA REVERSA =

Genética reversa é a utilização de diversos métodos a partir de sequências gênicas, para romper a função de um gene específico, a fim de analisar e compreender os fenótipos em suas condições nativas. Para tal área de conhecimento, existem diferentes tipos de abordagens. Dentre elas, podemos citar a introdução de mutações aleatórias no genoma a partir da exposição à radiação, onde o gene que sofreu a mutação é enfocado. A partir disso, pode-se ter duas abordagens, sendo elas: o enfoque da localização do gene no mapa genético, onde apenas as mutações, que se encontram na área serão retiradas para uma análise detalhada adicional (neste método é necessário o mapeamento das mutações). Ou pode-se identificar um gene de interesse na parte onde ocorreu a mutação do genoma, como também verificar presença de alterações nele. A segunda abordagem é a mutagênese direcionada, em que seu propósito é direcionar mutações para um gene de interesse. Seu processo se dá através da substituição de uma cópia do gene tipo selvagem para um mutante, e então ele é inserido no cromossomo, desta forma, transformando-se em uma sequência mutante. Uma terceira abordagem é por meio de fenocópias, método esse que permite pesquisas a longo prazo já que a criação de fenocópias, garante a inibição mutagênica pelas próximas gerações. Tal abordagem é possível graças ao RNAI( RNA de interferência) que podem ser utilizados para a inibição de determinado gene-alvo.

REFERÊNCIAS

CARVALHO, Mayra Costa da Cruz Gallo de; SILVA, Danielle Cristina Gregorio da. Sequenciamento de DNA de nova geração e suas aplicações na genômica de plantas. Ciência Rural, v. 40, p. 735-744, 2010.

DE ALMEIDA MIRANDA, Camila. A utilização de dados genéticos do trabalhador como fator de discriminação nas relações de emprego. Direito UNIFACS–Debate Virtual, n. 162, 2013.

DE SOUZA, Caio Santos et al. Sequenciamento do genoma completo do vírus da dengue sorotipo 1 circulantes em Araraquara- SP. The Brazilian Journal of Infectious Diseases, v. 26, p. 102418, 2022.

DOS SANTOS, Thauane Grace Rocha et al. Terapias gênicas: revisão da literatura. AHS, p. 32, 2020.

Em sequenciamento inédito, cientistas encontram 134 genes ligados ao autismo. Disponível em: <https://revistagalileu.globo.com/saude/noticia/2022/11/em-sequenciamento-inedito-cientistas-encontram-134-genes-ligados-ao-autismo.ghtml>.

FARIA, Á. Você sabe o que é sequenciamento do exoma? Disponível em: <https://blog.mendelics.com.br/voce-sabe-o-que-e-sequenciamento-do-exoma/>. Acesso em: 17 jan. 2023.

GOULART, Maria Carolina Vaz et al. Manipulação do genoma humano: ética e direito. Ciência & Saúde Coletiva , v. 15, 2010.

GUTIÉRREZ-SEVILLA, Juan Ernesto et al. Instabilidade genômica em pessoas vivendo com HIV. Mutation Research/Genetic Toxicology and Environmental Mutagenesis , v. 865, p. 503336, 2021. See More

HUANG, Yu-Lun et al. Impacto das modificações de nucleotídeos na extremidade 5' do RNA genômico do HIV-1 na transcrição reversa. Comunicações de Pesquisa Bioquímica e Biofísica, v. 516, n. 4, pág. 1145-1151, 2019.

LYNCH, Fiona et al. Australian public perspectives on genomic data storage and sharing: Benefits, concerns and access preferences. European Journal of Medical Genetics, v. 66, n. 1, p. 104676, 2023.

MARAN, Bruna Marchesan et al. Identificação e quantificação de bactérias usando as regiões V3-V4 do gene 16S rRNA em salame artesanal através de análise metagenômica. Repositório Institucional UFSC, 2020.

MATTICK, John S.; MAKUNIN, Igor V. Non-coding RNA. Human molecular genetics, 2006, 15.suppl_1: R17-R29.

MORAIS, Juliana F. et al. A genética e os seguros: correlação e analogia ao estudo do genoma humano:. Arq. ciênc. saúde, p. 216-219, 2007.

OBAYASHI, Camille Michiko et al. Influência das sequências 5'-terminal na estrutura 5'-UTR do RNA genômico do HIV-1. Relatórios científicos, v. 11, n. 1, pág. 1-9, 2021.

PALAZZO, Alexander F.; LEE, Eliza S. Non-coding RNA: what is functional and what is junk?. Frontiers in genetics, 2015, 6: 2.

PAULINO, Pedro Augusto Tibúrcio; BEZERRA, Jorge Portella. Relato de experiência da monitoria acadêmica na disciplina de genética e biologia molecular: caminhos para complementação da formação discente. Brazilian Journal of Development, v. 5, n. 7, p. 8169-8178, 2019.

RODRÍGUEZ-OSORIO, Nélida. Genómica y bioinformática: sus aplicaciones en salud y producción animal. Revista Colombiana de Ciencias Pecuarias, v. 32, p. 14-21, 2019.

SILVA, Ariadna Fernandes; DIAS, Eduardo Rocha. Discriminação genética nas relações de trabalho: violação aos direitos da personalidade do trabalhador. Revista Jurídica Luso-Brasileira, p. 155-198, 2021.

SILVA, Rowersan Cabral; LIMA, Airton; DA SILVA SOUZA, Liliane Cristina. Principais métodos de sequenciamento de DNA. Scientific Electronic Archives, v. 15, n. 10, 2022.

TROST, Brett et al. Genomic architecture of autism from comprehensive whole-genome sequence annotation. Cell, v. 185, n. 23, p. 4409-4427. e18, 2022

TSAI, Ping-Hsing et al. Genomic variance of Open Reading Frames (ORFs) and Spike protein in severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2). Journal of the Chinese Medical Association, v. 83, n. 8, p. 725, 2020.

ZLOTORYNSKI, Eytan. Intron definition, exon definition and back-splicing revisited. Nature Reviews Molecular Cell Biology, v. 20, n. 11, p. 661-661, 2019.

Genômica

INTRODUÇÃO À GENÔMICA

SEQUENCIAMENTO DE UM GENOMA

GENES CODIFICADORES DE PROTEÍNAS - IDENTIFICAÇÃO

GENOMA HUMANO

ELEMENTOS FUNCIONAIS NÃO CODIFICADORES NO GENOMA

EXOMA

GENÔMICA FUNCIONAL

REFERÊNCIAS

Enciclo

Wikious

Sapientia

Scientia

Boobota

Anandapedia

Sagapedia

Wikithot