Encontrados os genes responsáveis pela produção de açúcar na cana



Estratégia inovadora de geneticistas brasileiros identifica os genes responsáveis pela produção de açúcar na cana-de-açúcar


Passados 18 anos da publicação do genoma humano, o primeiro DNA completo a ser sequenciado (em 2000), foram mapeados até o momento os genomas de 250 animais e 265 plantas (sem contar fungos e bactérias). Da família das gramíneas, à qual pertence a cana-de-açúcar, foram sequenciadas 33 espécies. Entre elas estão culturas fundamentais para o esteio da humanidade como arroz, cevada, milho, sorgo e trigo. E a cana-de-açúcar? Onde está o seu genoma? Ninguém conseguiu sequenciar. Quando isto acontecer, imagine quais não serão os dividendos econômicos advindos de melhoramentos genéticos na planta?

O que falta para sequenciar o DNA da cana-de-açúcar? Dezenas de laboratórios em todo o mundo vêm tentando há anos sequenciar o genoma da cana, mas a tarefa é por demais intrincada. Existem duas estratégias para o sequenciamento. A do elefante e a da formiguinha. O método paquidérmico busca sequenciar o DNA da cana a partir do uso maciço de máquinas de sequenciamento, de onde saem sequências indecifráveis com trilhões de bases. Estas, por sua vez, são moídas e mastigadas pelas mais avançadas técnicas de bioinformática, consumindo ao longo do processo dezenas de milhares de horas de poder computacional. É uma estratégia cara, demanda grande quantidade de mão de obra e, até o momento, ainda não deu os resultados esperados. Mas há um outro método, mais econômico, para sequenciar o genoma da cana. Tal estratégia não busca sequenciar o genoma completo da cana, mas identificar aqueles genes específicos cuja função está ligada aos aspectos do desenvolvimento da planta que se deseja selecionar. "Eu não preciso conhecer o genoma completo da cana-de-açúcar para, por exemplo, tentar identificar os genes responsáveis pela produção de açúcar na planta," afirma a geneticista de plantas Anete Pereira de Souza, líder do Laboratório de Análise Genética Molecular no Centro de Biologia Molecular e Engenharia Genética, do Instituto de Biologia da Universidade Estadual de Campinas (Unicamp).

Foi este o feito conquistado no início de 2018 por Souza e seus alunos Melina Mancini, Danilo Augusto Sforça e Claudio Cardoso-Silva. Trata-se do grupo pesquisadores a localizar - no meio do enorme palheiro genômica da cana - alguns dos prováveis genes relacionados a produção de açúcar no genoma de cana-de-açúcar. A descoberta, se confirmada, pode em tese levar a futuros saltos estupendos na produção de etanol e açúcar por hectare de cana plantado. Ou ainda elevar o poder calorífico do bagaço de cana produzido pela indústria sucroalcooleira, e que é queimado em usinas termoelétricas. Bagaço com maior poder calorífico significa maior produção de energia com menor quantidade de bagaço.

A cana-de-açúcar (Saccharum hybridum) é uma espécie híbrida cultivada em todo o mundo

Um genoma (muito) complicado

O fato de até hoje nenhum laboratório ter conseguido mapear o genoma da cana-de-açúcar se deve à extrema complexidade de seu DNA. O genoma das plantas é reconhecidamente complexo - e o genoma da cana-de-açúcar é um dos mais complexos que existe. O genoma das plantas é maior e mais complexo do que o genoma de mamíferos, aves ou répteis e anfíbios (os peixes são uma exceção). O DNA humano, por exemplo, é composto por 3,2 bilhões de pares de bases espalhadas por 23 pares de cromossomos, num total de 46 cromossomos. O genoma do trigo, por outro lado, possui 17 bilhões de bases divididos em 21 pares de cromossomos (total de 42). Já o genoma da cana-de-açúcar é composto por 10 bilhões de pares de bases, distribuídos entre 100 a 130 cromossomos. Como assim? São 100 ou são 130? Depende. Pode ser uma coisa ou outra, e qualquer uma no intervalo entre ambas. 

A cana-de-açúcar cultivada hoje é uma espécie híbrida (Saccharum hybridum) criada a partir de cruzamentos de duas espécies do gênero Saccharum: Saccharum officinarum e Saccharum spontaneum. A primeira delas, S. officinarum, é a cana-de-açúcar que foi originalmente domesticada na ilha da Nova Guiné há cerca de 8 mil anos e passou a ser cultivada na Índia há 3 mil anos. Foi esta a espécie cultivada nos engenhos de cana-de-açúcar do Brasil colonial e no resto do mundo. Mais de três séculos de cruzamentos consanguíneos levaram à perda de diversidade genética da planta. Isto fez com que, em meados do século 19, a produção das lavouras de cana ao redor do mundo começassem a declinar. Ao mesmo tempo, a perda de vigor da planta abriu as portas para o ataque de doenças e pragas contra as quais a cana perdera resistência. 

Para recuperar a produção mundial, era premente fazer a cana recuperar defesas contra os agentes bióticos que a atacavam. A planta precisava recuperar o vigor perdido. A solução foi cruzar a cana Saccharum officinarum com outra planta do mesmo gênero, o capim Saccharum spontaneum. 
"S. spontaneum não é cana. É um capim. Não tem açúcar, mas é resistente a doenças e pragas, além de rico em fibras," explica Souza. "Deu um bom casamento. O híbrido resultante, Saccharum hybridum, produz muito açúcar e tem resistência às doenças e pragas do capim."

Para chegar em S. hybridum, primeiramente cruzou-se a cana S. officinarum com o capim S. spontaneum. Daí se obteve um primeiro híbrido, que era resistente a doenças e pragas, porém produzia pouco açúcar. Para elevar o teor de açúcar na planta, foram feitas diversos cruzamentos sucessivos dos híbridos com a cana S. officinarum. "Foi o homem quem criou a cana híbrida que plantamos hoje em dia: ela é forte e tem bastante açúcar," diz Souza.

Se, por um lado, os cruzamentos sucessivos resultaram num híbrido de qualidade, por outro criou-se uma planta cujo genoma é uma salada genômica quase indecifrável. A complexidade genômica de Saccharum é a tendência da cana para a poliploidia, ou seja, a multiplicação de cromossomos. A maioria dos organismos, incluindo humanos, tem um genoma diplóide, carregando dois conjuntos completos de cromossomos, um herdado do pai e o outro da mãe. No entanto, o gênero Saccharum é poliplóide, ou seja, carrega mais de duas cópias de cada cromossomo. No caso específico de S. officinarum, a espécie é octaplóide. Durante o cruzamento, os 10 cromossomos da planta são multiplicados por oito, ou seja, a planta recebe de cada um dos pais não uma mas quatro cópias de cada cromossomo, totalizando um genoma com 80 cromossomos.

Para complicar ainda mais, na cana-de-açúcar híbrida o número de cromossomos não só é ainda maior que 80 (devido à inserção do DNA do capim S. spontaneum) como - e aí talvez resida o maior complicador de todos - o total de cópias de cada cromossomo recebido do pai e da mãe não é fixo, mas varia de oito até 14 cópias. Daí que o número de cromossomos não é o mesmo para as diversas variedades da cana híbrida. Existem indivíduos que podem ter 100 cromossomos, enquanto outros têm 112, 120, ou até mesmo 130 cromossomos. Nem por isto eles deixam de pertencer à mesma espécie.

A espécie de capim Saccharum spontaneum é irmã da cana-de-açúcar, pois pertence ao gênero Saccharum

Embaralhamento genômico

Para se ter ideia da complexidade do genoma da cana-de-açúcar - e o tamanho do abacaxi que os geneticistas precisam descascar - imagine dois baralhos hipotéticos. Um deles se chama CANA (S. officinarum) e o outro CAPIM (S. spontaneum). Eles possuem cerca de 1 bilhão de cartas cada um. Há quatro tipos de cartas: A, G, C e T. As cartas A e G estão sempre associadas, não importa qual seja a posição delas no baralho. O mesmo acontece com as cartas C e T.

Agora pegue os baralhos CANA e CAPIM os embaralhe uma vez. O resultado é o baralho HÍBRIDO, com 2 bilhões de cartas. Pegue em seguida o baralho HÍBRIDO e o embaralhe novamente com um baralho CANA. O resultado será um novo HÍBRIDO com 3 bilhões de cartas, certo? Repita a operação outras sete vezes, misturando sempre o baralho HÍBRIDO resultante da operação anterior com um baralho CANA. 

Pronto. O resultado final é um baralho HÍBRIDO descomunal com 10 bilhões de cartas, no qual as combinações de cartas A+G e C+T dos baralhos originais CANA e CAPIM estão misturadas numa proporção de 80% para 20%. Ou seja, 80% das cartas vieram dos diversos baralhos CANA utilizados de forma consecutiva, e 20% vieram do baralho CAPIM.

Esta bagunça monumental corresponde, de maneira muito simplificada, ao genoma da cana-de-açúcar plantada hoje em dia. Na vida real, no entanto, o genoma da cana é ainda mais complexo. Isto porque, durante os cruzamentos sucessivos feitos entre o primeiro híbrido S. spontaneum e S. officinarum e diversas gerações de S. officinarum, além do acúmulo de pares de bases de S. officinarum repetidas, ocorrem duplicações aleatórias genes. 

O desafio dos pesquisadores que tentam sequenciar e mapear o genoma da cana-de-açúcar é decifrar, em meio a bilhões de repetições e duplicações desse genoma, quais são as sequências de bases (as cartas do nosso baralho hipotético) A, T, C e G que estavam originalmente em S. spontaneum e S. officinarum, assim como identificar quais são as suas posições no gigantesco genoma atual. Dá pra compreender o tamanho do problema?

O sorgo (Sorghum bicolor) é parente próximo da cana-de-açúcar

Trabalho de formiguinha

"Para fazer o melhoramento da cana-de-açúcar é preciso entender a genética da planta. Esta compreensão passa pelo sequenciamento," diz Souza. "A complexidade do genoma da cana têm impedido seu sequenciamento. A gente até consegue obter as sequências de genes. Têm máquinas que fazem isso. O problema está na hora de juntar as peças do quebra-cabeças. A gente não consegue juntar as sequências na ordem correta. Não sabe em qual cromossomo elas ficam. Nem consegue identificar genes específicos, pois há 12 tipos para cada gene."

Mas para tudo sempre há um jeito. Em vez de tentar sequenciar milhões de bases ao mesmo tempo, Anete Pereira de Souza e seus alunos optaram por tentar identificar genes ou conjuntos de genes cujas funções específicas interessam ao melhoramento da cana. Como identificá-los se há múltiplos tipos de cada gene? A resposta é, por similaridade, comparando genes da cana com genes similares - cujas funções são conhecidas - no genoma sequenciado do sorgo (Sorghum bicolor).

"O mundo todo quer sequenciar a cana-de-açúcar. Desenvolvemos uma estratégia para o sequenciamento de regiões específicas do genoma da cana por similaridades com o genoma do sorgo," revela Souza. O estudo acaba de ser publicado na revista Frontiers in Plant Science.

Entre as gramíneas, o sorgo é o parente mais próximo do gênero Saccharum. Eles compartilham um ancestral comum que viveu há cerca de 3,5 milhões de anos. Diferentemente da confusão genômica octoplóide da cana-de-açúcar, o sorgo é diplóide, ou seja, possui apenas duas cópias de cada um de seus 10 cromossomos, totalizando 730 milhões bases, uma fração das 10 bilhões de pares da cana.

Conhece-se uma região no genoma do sorgo que é responsável pela acumulação de açúcar. "Dado as espécies serem tão aparentadas, partimos do pressuposto que os genes para produção de açúcar no sorgo sacarino deveriam conservar a mesma função na cana-de-açúcar," revela Souza. "Assim, nosso trabalho visou identificar esta mesma sequência genética dentro do genoma da cana."

O ponto de partida do projeto foi dado em 2011, quando o então aluno de doutorado de Souza, Danilo Augusto Sforça, partiu para o Instituto Nacional de Pesquisas Agronômicas em Toulouse, na França, para montar bibliotecas BAC do genoma da cana-de-açúcar com a ajuda e colaboração da Dra. Hélenè Bérges. 


Os geneticistas Danilo Sforça e Anete Pereira de Souza, no laboratório da Unicamp

Bibliotecas BAC, ou bibliotecas de cromossomos artificiais bacterianos, serviram como ponto de partida para o sequenciamento de vários organismos com grandes genomas, incluindo o humano e o do trigo. As bibliotecas BAC foram desenvolvidas para permitir a clonagem e o armazenamento de pedaços de DNA no interior de bactérias Escherichia coli. Tais bactérias têm a capacidade de absorver trechos de DNA de outros organismos para dentro da célula bacteriana na forma de DNA circular (plasmídeos). Uma vez que o trecho de DNA que se quer preservar está dentro das bactéria, estas são congeladas e armazenadas. Quando chega a hora de manipular o DNA inserido na bactéria na forma de plasmídeo, basta descongelar a bactéria e deixá-la multiplicar. Rapidamente ter-se-á trilhões de clones, cada qual contendo uma cópia do trecho de DNA alienígena que se deseja estudar.

Desta forma, a partir do DNA de duas variedades de cana diferentes, Sforça construiu duas bibliotecas BAC. Cada biblioteca possui aproximadamente 200 mil pedaços do genoma da cana. Estes foram inseridos em bactérias e armazenados em 576 placas, cada uma contendo 384 pedaços do DNA da cana, congelados a 80oC negativos.

"É como se você pegasse um pedaço de um cromossomo da cana e o coloca-se dentro de uma bactéria. Bactérias são muito fáceis para manipular, extrair, multiplicar e sequenciar," explica Sforça. "Se a gente quiser acessar um gene de um cromossomo da cana de açúcar, a gente consegue."

De acordo com Souza, "num banco de clones eu posso buscar os pedacinhos específicos de um determinado genoma que me interessam. As possibilidades são infinitas. Conhecendo o gene do sorgo para acúmulo de açúcar, basta achar uma sequência similar na biblioteca BAC de cana."

Terminado o trabalho na França, Sforça trouxe suas bibliotecas para Campinas. Aí começou o trabalho da pós-doutoranda, Melina Mancini. Foi ela quem decidiu vasculhar as bibliotecas BAC em busca das sequências similares entre sorgo e cana. "Escolhi trabalhar com uma característica ligada à produção e o acúmulo de açúcar. Uma vez que a gente identificou no genoma do sorgo a região responsável pelo acúmulo de açúcar, ficou fácil localizar nas bibliotecas BAC as sequências similares na cana."


Uma das 576 placas (cada qual com 384 pedaços de DNA) que preservam o genoma da cana na biblioteca BAC

Mancini desenvolveu alguns marcadores genéticos para efetuar a busca por sequências similares ao sorgo nas bibliotecas BAC. A região específica do DNA do sorgo que contém os genes para acúmulo de açúcar tem 500 mil pares de bases. A geneticista conseguiu identificar genes com sequência similar na cana. Os pedaços do DNA de cana selecionados pelos marcadores moleculares nas bibliotecas de BACs foram sequenciados e organizados na ordem correta que se encontram no genoma da cana. Obteve-se assim uma sequência contínua de 1,2 milhão de bases, que correspondem na cana à região do genoma do sorgo contendo as 500 mil bases. 

"A gente identificou e montou 68 sequências contínuas da cana (num total de 1,2 milhão de bases) que supostamente estariam ligados à produção de açúcar," revela Mancini. O passo seguinte foi arranjar as 68 sequências correspondendo à 1,2 milhão de bases em uma sequência contínua. Mancini conseguiu montar uma sequência de bases com nove lacunas. Um trabalho de sintonia fina fez com que seis lacunas fossem preenchidas. Restaram três lacunas para que os 1,2 milhões de bases formem um único fragmento.

Usando o genoma de sorgo como referência, foram identificados 253 genes codificadores de acúmulo de açúcar no genoma da cana-de-açúcar. Deste total, 74 genes de sorgo foram encontrados nos 500 mil pares de bases estudados, enquanto que somente 59 deles foram encontrados nos 1,2 milhões de pares de bases da cana-de-açúcar.

 "As regiões que controlam características economicamente importantes são frequentemente influenciadas por diversos genes. Do total de 253 genes identificados para a cana, 245 genes são compartilhados com arroz e 243 com o milho."

Os próximos passos da pesquisa incluem fechar as três lacunas para obter uma sequência completa. Segundo Mancini, "vamos tentar descobrir quais partes dos genes desta região do genoma da cana híbrida (S. hybridum) vieram dos genomas da cana S. officinarum e quais vieram do capim S. spontaneum."

Outro aspecto importantíssimo que falta confirmar é se a função dos 253 genes encontrados na cana é, de fato, produzir e acumular açúcar. Não basta saber que eles desempenham esta função no sorgo, no arroz e no milho. Faz todo o sentido pensar que, na cana, também seja este o caso. Mas ciência não funciona assim. Ciência exige comprovação. Logo, é preciso demonstrar acima de qualquer dúvida que a ação específica daqueles 253 genes identificados na cana é fazer açúcar.

Uma questão de interesse nacional

"Meu interesse nesta pesquisa não é sequenciar o genoma inteiro da cana," diz Souza. "O que me interessa é sequenciar regiões importantes que codificam genes para a produção de açúcar, ou que possam conferir tolerância a pragas, resistência a doenças, ou que permitam plantar cana em diversos tipo de solo, com maior ou menor insolação, água, adubo, etc. O meu trabalho é voltado para os melhoristas da cana usarem nos seus programas de melhoramento."

O Brasil é o maior interessado. Os números do setor sucroalcooleiro no país são muito impressionantes. Somos o maior produtor mundial de cana-de-açúcar. Na safra 2016/2017, foram colhidas 657,2 milhões de toneladas, quase o dobro da produção do segundo produtor, a índia. Na mesma safra foram produzidos 11 bilhões de litros de etanol, suficientes para abastecer 25 milhões de veículos flex, ou 60% da frota nacional.

As consequências da descoberta dos genes para acúmulo de açúcar feita por Souza e sua equipe pode, num futuro não tão distante, aumentar estes números. Bastante.


O projeto de sequenciamento da cana-de-açúcar no laboratório de Anete Pereira de Souza tem contado com o apoio das agências de fomento FAPESP, CNPq e CAPES.


CONTATO DOS AUTORES:
Profa. Dra. Anete Pereira de Souza
Laboratório de Análise Genética Molecular 
Instituto de Biologia (IB)
Universidade Estadual de Campinas (UNICAMP)
Campinas-SP
Telefone: (19) 3521-1132
Celular: (19) 99111-6547

REFERÊNCIAS CIENTÍFICAS:
Mancini MC, Cardoso-Silva CB, Sforça DA and Pereira de Souza A (2018) Targeted Sequencing by Gene Synteny,” a New Strategy for Polyploid Species: Sequencing and Physical Structure of a Complex Sugarcane Region. Front. Plant Sci. 9:397. 
doi: 10.3389/fpls.2018.00397 

As imagens usadas nesta reportagem estão licenciadas com uma Licença Creative Commons Atribuição 4.0 International
Esta obra está licenciada com uma Licença Creative Commons Atribuição 4.0 International

This is an open access article distributed under the Creative Commons Attribution License which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited. (CC BY 4.0).


Comentários