If you're seeing this message, it means we're having trouble loading external resources on our website.

Se estiveres protegido por um filtro da Web, certifica-te de que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

O código genético

Como é a informação contida numa cadeia de mRNA descodificada para gerar um polipéptido? Aprende como grupos de três nucleótidos, chamados codões, especificam aminoácidos (bem como os sinais de início e fim de tradução).

Introdução

Já alguma vez escreveste uma mensagem secreta a um amigo? Se já, talvez tenhas usado algum tipo de código para manteres a mensagem escondida. Por exemplo, podes ter substituído as letras das palavras por números ou símbolos, seguindo um conjunto de regras específicas. O teu amigo, de forma a conseguir entender a mensagem, precisa de conhecer o código e aplicar o mesmo conjunto de regras, de forma inversa, para descobrir o que tu escreveste.
Acontece que descodificar mensagens é também um passo importante na expressão genética, o processo em que a informação de um gene é usada para construir uma proteína (ou outro produto funcional). Como é que as instruções para a construção de uma proteína estão codificadas no DNA, e como é que as mesmas são decifradas pela célula? Neste artigo, vamos olhar de forma mais profunda para o código genético, que permite às sequências de nucleótidos de DNA e RNA serem traduzidas nos aminoácidos que representam.

Visão Geral: Expressão genética e o código genético

Os genes que possuem as instruções para as proteínas são expressos em duas etapas.
  • Na transcrição, a sequência de DNA de um gene é "reescrita" usando nucleótidos de RNA. Nos eucariotas, o RNA passa por um processamento adicional para se tornar em RNA mensageiro, ou mRNA.
  • Na tradução, a sequência de nucleótidos do mRNA é "traduzida" na sequência de aminoácidos de um polipéptido (proteína ou subunidade proteica).
As células descodificam mRNAs lendo os seus nucleótidos em grupos de três, chamados codões. Cada codão representa um aminoácido especifico, ou, em alguns casos, fornece um sinal "stop" para a tradução terminar. Além disso, o codão AUG tem um papel especial, servindo de codão de iniciação onde a tradução começa. O conjunto completo de correspondências entre codões e aminoácidos (ou sinais stop) é conhecida como o código genético.
A sequência de mRNA é:
5'-AUGAUCUCGUAA-5'
A tradução envolve a leitura dos nucleótidos de mRNA em grupos de três, cada um dos quais especifica um aminoácido (ou um codão stop que indica que a tradução está concluída).
3'-AUG AUC UCG UAA-5'
AUG Metionina AUC Isoleucina UCG Serina UAA "Stop"
Sequência de polipéptidos: (N-terminal) Metionina-Isoleucina-Serina (C-terminal)
No resto deste artigo, examinaremos mais detalhadamente o código genético. Primeiro, iremos ver como é que ele foi descoberto. Depois, iremos olhar mais profundamente para as suas propriedades, vendo como é que este pode ser usado para prever o polipéptido codificado pelo mRNA.

Decifrando o código: Como é que o código genético foi descoberto

Para decifrar o código genético, os investigadores precisavam de descobrir como é que as sequências de nucleótidos numa molécula de DNA ou RNA iriam codificar a sequência dos aminoácidos de um polipéptido.
Porque é que isto era um problema complicado? Num dos códigos hipotéticos mais simples, cada nucleótido numa molécula de DNA ou RNA corresponderia a um aminoácido num polipéptido. No entanto, este código não poderia funcionar porque existem 20 aminoácidos comummente encontrados em proteínas e apenas 4 bases de nucleótidos no DNA ou RNA. Assim, os investigadores sabiam que o código teria de envolver algo mais complexo do que uma combinação de um-para-um entre nucleótidos e aminoácidos.

A hipótese do tripleto

Em meados da década de 50, o físico George Gamow aprofundou esta linha de pensamento para deduzir que o código genético era provavelmente composto por tripletos de nucleótidos. Ou seja, ele propôs que um grupo de 3 nucleótidos sucessivos num gene iriam codificar um aminoácido num polipéptido.
O raciocínio de Gamow era que até um código de dupletos (2 nucleótidos por aminoácido) não iria funcionar, pois permitiria apenas 16 grupos ordenados de nucleótidos (42), poucos para os 20 aminoácidos padrão utilizados para a formação de proteínas. Um código baseado em tripletos de nucleótidos, no entanto, parecia promissor: iria fornecer 64 sequências únicas de nucleótidos (43), mais do que suficiente para cobrir os 20 aminoácidos.

Nirenberg, Khorana e a identificação dos codões

A hipótese dos tripletos de Gamow parecia lógica e foi amplamente aceite. No entanto, não tinha sido experimentalmente provada e os investigadores ainda não sabiam que tripletos de nucleótidos correspondiam a que aminoácidos.
A descoberta do código genético começou em 1961, com o trabalho do bioquímico americano Marshall Nirenberg. Pela primeira vez, Nirenberg e os seus colegas foram capazes de identificar tripletos de nucleótidos específicos que correspondiam a aminoácidos em particular. O sucesso deles dependeu de duas inovações experimentais:
  • Uma forma de gerar moléculas artificiais de mRNA com sequências específicas e conhecidas.
  • Um sistema para traduzir mRNAs em polipéptidos fora de uma célula (um sistema "sem células"). O sistema de Nirenberg consistia num citoplasma obtido a partir de células de E. coli destruídas, que contém todos os materiais necessários para a tradução.
Primeiro, Nirenberg sintetizou uma molécula de mRNA composta unicamente pelo nucleótido uracilo (chamada poli-U). Quando adicionou o mRNA poli-U ao sistema sem células descobriu que os polipéptidos formados consistiam exclusivamente no aminoácido de fenilalanina. Como o único tripleto no mRNA poli-U é UUU, Nirenberg concluiu que UUU poderia codificar a fenilalanina. Utilizando a mesma abordagem, ele foi capaz de mostrar que o mRNA poli-C foi traduzido para polipétidos formados exclusivamente pelo aminácido prolina, sugerindo que o tripleto CCC iria codificar a prolina.
Outros investigadores, tal como o bioquímico Har Gobind Khorana na Universidade de Wisconsin, continuaram as experiências de Nerinberg ao sintetizar mRNAs artificiais com sequências mais complexas. Por exemplo, numa experiência, Khorana gerou um mRNA poli-UC (UCUCUCUCUC...) e adicionou-o a um sistema sem células semelhante ao de Nirenberg. O mRNA poli-UC que foi traduzido em polipéptidos apresentava um padrão alternado de aminoácidos serinas e leucinas. Este e outros resultados confirmaram inequivocamente que o código genético era baseado em tripletos ou codões. Hoje, sabemos que a serina é codificada pelo codão UCU, enquanto que a leucina é codificada pelo CUC.
Em 1965, utilizando o sistema sem células e outras técnicas, Nirenberg, Khorana e os seus colegas tinham decifrado todo o código genético. Ou seja, eles identificaram o aminoácido ou sinal de "stop" correspondente a cada um dos 64 codões de nucleótidos. Pelas suas contribuições, Nirenberg e Khorana (juntamente com outro investigador do código genético, Robert Holley) receberam o Prémio Nobel em 1968.
_Esquerda: Imagem modificada de "Marshall Nirenberg and Heinrich Matthaei," por N. MacVicar (domínio público). Direita: "Har Gobind Khorana" (domínio público)._

Propriedades do código genético

Como vimos acima, o código genético é baseado em tripletos de nucleótidos chamados codões, que especificam aminoácidos individuais num polipéptido (ou sinais de "stop" no seu final). Os codões de mRNA são "lidos" um por um dentro de estruturas de proteínas e RNA chamadas ribossomas, começando no terminal 5' do gene e avançando em direção ao terminal 3'. Vamos olhar mais atentamente para o código genético no contexto da tradução.

Tipos de codões (de iniciação, stop e "normal")

Tabela do código genético. Cada sequência de três letras de nucleótidos de mRNA corresponde a um aminoácido específico, ou a um codão stop. UGA, UAA e UAG são codões stop. AUG é o codão para a metionina, e é também o codão de iniciação.
_Crédito da imagem: "The genetic code," por OpenStax College, Biology (CC BY 3.0)._
A tradução começa sempre com um codão de iniciação, que tem a sequência AUG e codifica o aminoácido metionina (Met) na maioria dos organismos. Assim, cada polipéptido começa tipicamente com a metionina, embora a metionina inicial possa ser cortada em etapas posteriores do processamento. Um codão de iniciação é necessário para começar a tradução, mas o codão AUG pode também aparecer mais tarde na sequência de codificação de um mRNA, onde especifica simplesmente o aminoácido metionina.
Uma vez iniciada a tradução no codão de iniciação, os codões seguintes do mRNA irão ser lidos um a um, na direção 5' a 3'. À medida que cada codão é lido, o aminoácido correspondente é adicionado ao C-terminal do polipéptido. A maioria dos codões no código genético codificam aminoácidos específicos e são lidos durante esta fase da tradução.
A tradução continua até que um codão stop é alcançado. Há três codões stop no código genético, UAA, UAG e UGA. Ao contrário dos codões de iniciação, os codões stop não correspondem a um aminoácido. Em vez disso, eles agem como sinais de "stop", indicando que o polipéptido está completo e fazendo com que este seja libertado do ribossoma. Podem aparecer mais nucleótidos depois do codão stop no mRNA mas não irão ser traduzidos como parte do polipéptido.

Quadro de leitura

O codão de iniciação é fulcral porque determina onde é que a tradução irá começar no mRNA. Acima de tudo, a posição do codão de iniciação determina o quadro de leitura ou como é que a sequência de mRNA é dividida em grupos de três nucleótidos dentro do ribossoma. Como mostra o diagrama abaixo, a mesma sequência de nucleótidos pode codificar polipéptidos completamente diferentes dependendo do quadro de leitura utilizado. O codão de iniciação determina que quadro de leitura é escolhido e assim assegura que o polipéptido correto é produzido.
Para perceber o que é um quadro de leitura é útil considerar uma analogia usando palavras e letras. A seguinte mensagem faz sentido para nós porque a lemos no quadro de leitura correto (divide-a corretamente em grupos de três letras): ELA TEM UMA BOA AVÓ. Se mudarmos o quadro de leitura de forma a começar uma posição à frente, agrupando as palavras em grupos de três letras, obtemos: LAT EMU MAB OAA VÓ. Esta mudança resulta numa mensagem que já não faz sentido.
Um aspeto importante a ter em conta é que os nucleótidos num gene não estão fisicamente organizados em grupos de três. Em vez disso, o que compõe um codão é simplesmente o local onde o ribossoma começa a leitura e que sequência de nucleótidos vem a seguir ao codão de iniciação. As mutações que inserem ou eliminam um único nucleótido podem alterar o quadro de leitura, resultando na produção de uma proteína "incompreensível" à semelhança da frase no exemplo acima.

Um aminoácido, vários codões

Como já foi mencionado, o código genético é composto por 64 codões diferentes. Mas se existem apenas 20 aminoácidos, o que é que fazem os outros 44 codões? Como vimos, alguns são codões stop, mas a maior parte não. Na realidade, o código genético é um código redundante, o que significa que alguns aminoácidos são codificados por mais do que um codão. Por exemplo, a prolina é representada por quatro codões diferentes (CCU, CCC, CCA e CCG). Se algum destes codões aparecer no mRNA, uma prolina é adicionada à cadeia polipeptídica.
A maior parte dos aminoácidos no código genético são codificados por pelo menos dois codões. Na verdade, a metionina e o triptofano são os únicos aminoácidos codificados por um único codão. É importante notar que o inverso não é verdade: cada codão codifica apenas um aminoácido ou um sinal de stop. Assim, não existe ambiguidade (incerteza) no código genético. Um codão específico num mRNA irá ser sempre previsivelmente traduzido num determinado aminoácido ou sinal de stop.

O código genético é (quase) universal

Salvo algumas exceções, todos os organismos vivos na Terra usam o mesmo código genético. Isto significa que os codões que codificam os 20 aminoácidos nas tuas células são os mesmos que são utilizados pelas bactérias que habitam as fontes hidrotermais no fundo do Oceano Pacífico. Até mesmo nos organismos que não utilizam o código "padrão" as diferenças são relativamente pequenas, como uma mudança no aminoácido codificado por um determinado codão.
Um código genético partilhado por diversos organismos fornece provas importantes da origem comum da vida na Terra. Assim sendo, as diversas espécies hoje em dia na Terra provavelmente evoluíram de um organismo ancestral em que o código genético já estaria presente. Como o código é essencial à função das células, tenderia a permanecer inalterado nas espécies através das gerações, já que os indivíduos com alterações significativas poderiam não sobreviver. Este tipo de processo evolutivo pode explicar a semelhança notável do código genético, de forma transversal, nos organismos de hoje em dia.

Queres participar na conversa?

Ainda não há comentários.
Sabes inglês? Clica aqui para veres mais debates na versão inglesa do site da Khan Academy.