Inteligência artificial permite prever performance de cana-de-açúcar.

Foi publicado na revista Scientific Reports, estudo brasileiro que demonstra o uso de técnicas de inteligência artificial para criar modelos eficientes de seleção genômica de cana-de-açúcar e de forrageiras, capazes de predizer, a partir do DNA, a performance em campo dessas gramíneas.

Em termos de acurácia, na comparação com as técnicas tradicionais de melhoramento, a metodologia desenvolvida com apoio da FAPESP apresenta ganho de 50% na capacidade produtiva. Pela primeira vez, o método baseado em aprendizado de máquinas foi proposto para plantas poliploides (nas quais as células possuem mais de dois pares de cromossomos), no caso as gramíneas estudadas, viabilizando sua seleção genômica com alta eficiência.

Aprendizado de máquina é uma subárea da ciência da computação que envolve métodos de estatística e otimização. Com inúmeras aplicações, seu objetivo é criar algoritmos que consigam extrair de maneira automática padrões de um conjunto de dados.

Pode ser útil para predizer a performance de uma planta, por exemplo, se ela é resistente ou tolerante a algum tipo de estresse biótico (pragas e doenças causadas por insetos, nematoides, fungos ou bactérias) ou abiótico (frio, déficit hídrico, alta salinidade ou deficiência nutricional do solo).

Os cruzamentos são realizados tradicionalmente nos programas de melhoramento.

“Você estabelece populações por meio de cruzamentos de plantas que sejam interessantes. No caso da cana, uma que produza muito açúcar com outra que seja mais resistente, por exemplo. Você cruza e avalia a performance dos genótipos oriundos desses cruzamentos em campo”, explica Alexandre Hild Aono, cientista da computação formado pela Universidade Federal de São Paulo (Unifesp) e autor principal do artigo.

O melhoramento tradicional da cana é demorado - leva entre 9 e 12 anos - e custa caro. O método proposto possibilita predizer qual será a performance dessas plantas antes mesmo delas crescerem, por meio de uma estimativa de rendimento.

O “melhoramento de plantas 4.0”, é altamente dependente da análise de dados e ferramentas computacionais e estatísticas de alta eficiência. Cada genotipagem por sequenciamento pode envolver 1 bilhão de sequências.

A complexidade genômica é o grande desafio que os cientistas enfrentam com as plantas poliploides, no caso da cana-de-açúcar e das gramíneas forrageiras.

“Neste caso, nem se sabia se a seleção genômica seria possível, em virtude da escassez de recursos e da dificuldade de se trabalhar com essa complexidade” explica Aono.

Alta complexidade

Pesquisadores contam que a seleção genômica começou com plantas diploides (células com dois conjuntos de cromossomos), que têm uma genética mais simples. “Só que as nossas plantas tropicais, de grande valor, não são diploides, são poliploides, e aí é complicado”, explica Anete Pereira de Souza, professora titular do departamento de Biologia Vegetal da Unicamp.

A cana tem uma complexidade bem maior, uma vez que um dado gene pode teoricamente possuir muitas variantes. “A genética fica tão complicada que o melhorista trabalha com a cana como se fosse diploide”.

Em 2001, Theo Meuwissen, cientista da Norwegian University of Life Sciences, fez a associação do genoma com o fenótipo (as características visíveis) e foi aí que surgiu o que se chama hoje de seleção genômica.

Isso representou uma vantagem imensa para o melhoramento de plantas, pois passou a associar as características fenotípicas que interessavam – seja volume de produção, quantidade de açúcar ou precocidade da planta – às bases do genoma chamadas SNPs (sigla para single nucleotide polymorphism ou polimorfismo de nucleotídeo simples), explica Souza.

Com o avanço proposto por Aono e colegas, não é mais necessário plantar e fenotipar ao longo de todo o ciclo de melhoramento.

“Fazemos experimentos no campo nos primeiros ciclos do programa para obtermos o fenótipo de interesse de cada clone”.

Paralelamente, sequenciamos todos os clones da população de melhoramento de uma forma bastante simples, não sendo necessário termos o genoma completo de cada clone. É o que chamamos de genotipagem por sequenciamento, sendo um sequenciamento parcial para buscar as diferenças e semelhanças de bases entre os diferentes clones. Estas se associarão às produções de cada clone.

A associação entre o fenótipo e o genoma permite identificar quem produz mais e quais são os SNPs associados à maior produção. Dessa forma, é possível identificar um clone que tem grande parte dos SNPs que contribuem para a maior produção observada nos experimentos iniciais. Assim, obtemos a variedade mais produtiva de modo mais rápido e com menor custo”, detalha Souza.